Text
                    ?. И. ТЫШКЕВИЧ, А. С. ФЕДЕНКО
ЛИНЕЙНАЯ АЛГЕБРА
И АНАЛИТИЧЕСКАЯ
ГЕОМЕТРИЯ
Издание второе, переработанное
Допущено Министерством высшего и среднего
специального образования БССР
в качестве учебного пособия
для математических специальностей университетов
и педагогических институтов
МИНСК
ИЗДАТЕЛЬСТВО «ВЫШЭИШАЯ ШКОЛА»
1976


517 Т93 УДК [512.8+516] (0 75.8) Рецензенты: кафедра алгебры и теории чисел Ленинградского государственного университета (зав. кафедрой докт. физ.-мат. наук, проф. 3. И. Боревич); кафедра алгебры и геометрии Уральского государственного университета (зав. кафедрой докт. физ.-мат. наук, проф. Л. Н. Шеврин) Научный редактор акад. АН БССР Д. А. Супруненко Тышкевич Р. И., Феденко А. С. Т93 Линейная алгебра и аналитическая геометрия. Под ред. Д. А, Супруненко. Изд. 2-е, перераб. Минск, «Вышэйш. школа», 1976. 544 с. с ил. В книге излагается объединенный курс линейной алгебры и аналитической геометрии. Настоящее, второе издание книги значительно отличается от первого издания, вышедшего в 1968 г. Добавлено значи* тельное количество нового материала и совершенно перестроена структура всей книги. Пособие предназначается для студентов физико-математических факультетов университетов и пединститутов. „ 20203-198 ' „в Т М304(05)-76 3°-75 517 С) Издательство «Вышэйшая школа», 1976 г.
ПРЕДИСЛОВИЕ Настоящая книга написана на основе лекций, читавшихся авторами на механико-математическом факультете Белорусского государственного университета имени В. И. Ленина. В этих лекциях курс «Аналитическая геометрия» объединялся с теми разделами курса «Высшая алгебра», которые относятся к линейной алгебре. Такое объединение, по нашему мнению, взаимно обогащает оба указанных предмета и облегчает их усвоение. Книга разбита на четыре части. Первая часть носит вводный характер, здесь приводятся необходимые сведения из теории множеств и общей алгебры. Во второй части излагается элементарная аналитическая геометрия трехмерного евклидова пространства примерно в трм объеме, в ка-, ком она дается во втузах. При этом изложение ведется таким образом, чтобы облегчить последующий переход к n-мерным " пространствам. Третья часть книги содержит основы теории векторных (линейных), евклидовых и унитарных пространств. Заключительная, четвертая, часть посвящена изложению высших разделов аналитической геометрии, здесь существенно используются результаты третьей части. Настоящее, второе издание книги значительно отличается от первого издания, вышедшего в свет в 1968 г. Книга предназначена главным образом для математических и физических специальностей университетов. Ее вторая часть может быть использована при изучении аналитической геометрии во втузах.
4 Предисловие В заключение считаем приятным долгом поблагодарить всех лиц, высказавших замечания по первому изданию книги. Мы благодарны также сотрудникам кафедры алгебры Белорусского государственного университета им. В. И. Ленина, которые прочитали рукопись второго издания и сделали много полезных замечаний. Особую признательность мы выражаем коллективу кафедры алгебры и геометрии Уральского государственного университета и лично заведующему кафедрой профессору Л. Н. Шеврину за многие ценные замечания и пожелания, высказанные по рукописи настоящей книги, а также заведующему кафедрой алгебры и теории чисел Ленинградского государственного университета профессору 3. И. Боре&ичу. Авторы
ОГЛАВЛЕНИЕ Обозначения 10 ЧАСТЬ I. НЕКОТОРЫЕ ВОПРОСЫ ОБЩЕЙ АЛГЕБРЫ Глава 1. Отображения § 1. Декартово произведение 11 § 2. Отношение эквивалентности 12 § 3. Отображение ' 14 § 4. Умножение (композиция) отображений 18 § 5. Обратное отображение 21 § 6. Каноническое разложение 22 § 7. Сужение и продолжение отображения 24 § 8. Перестановки 25 § 9. Преобразования конечного множества 28 Глава 2. Группа, кольцо, поле. Гомоморфизмы § 10. Алгебраическая операция 31 §11. Кратные (степени) элемента 35 § 12. Одно свойство суммы 36 § 13. Группа 38 § 14. Кольцо - 40 § 15. Поле г- 43 § 16. Подгруппа 44 § 17. Смежные классы по подгруппе 45 § 18. Нормальный делитель 48 § 19. Фактор-группа 49 § 20. Гомоморфизмы и изоморфизмы групп 50 § 21. Ядро гомоморфизма групп 53 § 22. Теорема о гомоморфизмах групп 55 § 23. Подкольцо. Идеал. Фактор-кольцо 56 § 24. Гомоморфизмы и изоморфизмы колец 57 § 25. Теорема о гомоморфизмах колец 59 Глава 3. Матрицы и определители § 26. Матрица 60 § 27. Сложение матриц 63 § 28. Умножение матриц 64 § 29. Умножение матрицы на элемент основного кольца 68 § 30. Полином от матрицы 69 § 31. Транспонирование матрицы 70 § 32. Определитель 71 § 33. Миноры и их алгебраические дополнения 77 § 34. Некоторые методы вычисления определителей 80 § 35. Определитель произведения квадратных матриц 86 § 36. Обратная матрица 87 § 37. Крамеровские .системы линейных уравнений 90 § 38. Элементарные преобразования матрицы 94
6 Оглавление § 39. Элементарные преобразования матриц над полем 96 § 40. Решение системы линейных уравнений способом исключения неизвестных 99 ЧАСТЬ II. ЭЛЕМЕНТАРНАЯ АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Глава 4. Векторы и координаты § 41. Понятие вектора 107- § 42. Сложение векторов 109 § 43. Умножение вектора на число 112 § 44. Проекции 115 § 45. Линейная зависимость векторов 119 § 46. Координаты на прямой 124 § 47. Координаты на плоскости 125 § 48. Координаты в пространстве 129 § 49. Преобразование координат ГЗЗ § 50. Уравнения фигуры 139 § 51. Скалярное произведение векторов 142 § 52. Векторное произведение векторов 145 § 53. Смешанное произведение векторов 150 Глава 5. Прямая на плоскости § 54. Уравнение прямой с угловым коэффициентом 154 § 55. Общее уравнение прямой. Уравнение прямой в отрезках 156 § 56. Векторная и параметрическая формы уравнения прямой. Уравнение прямой, проходящей через две заданные точки 153 § 57. Совместное исследование уравнений двух прямых 159 § 58. Пучок прямых 162 § 59. Расстояние от точки до прямой 163 § 60. Угол между двумя прямыми 168 Глава 6. Плоскости и прямые § 61. Общее уравнение плоскости 169 § 62. Совместное исследование уравнений двух плоскостей 172 § 63. Пучок и связка плоскостей 173 § 64. Расстояние от точки до плоскости 176 § 65. Различные виды уравнений прямой 178 § 66. Некоторые задачи J80 Глава 7. Плоские фигуры второго порядка § 67. Эллипс 187 § 68. Гипербола 193 § 69. Директрисы эллипса и гиперболы 199 § 70. Парабола 203 § 71. Полярное уравнение эллипса, гиперболы и параболы 207 § 72. Плоские фигуры второго порядка 208 Глава 8. Фигуры второго порядка § 73. Понятие фигуры второго порядка 213 § 74. Эллипсоид 216 § 75. Конус второго порядка 218 § 76. Однополостный гиперболоид 221 § 77. Двуполостный гиперболоид 224 § 78. Эллиптический параболоид 226 § 79. Гиперболический параболоид 228 § 80. Цилиндрические фигуры 230
Оглавление 7 § 81. Цилиндрические фигуры второго порядка 231 § 82. Прямолинейные образующие фигур второго порядка 234 § 83. Прямолинейные образующие однополостного гиперболоида 235 § 84. Прямолинейные образующие гиперболического параболоида 239 ЧАСТЬ III. ВЕКТОРНЫЕ ПРОСТРАНСТВА Глава 9. Векторные пространства §85. Определение и простейшие свойства 243 § 86. Линейная зависимость 247 § 87. Эквивалентные системы векторов 249 § 88. Максимальная линейно независимая подсистема 252 § 89. Ранг матрицы 254 § 90. Размерность 259 § 91. Произведение [й\ йг йъ\А 262 § 92. Координаты 264 § 93. Некоторые задачи 266 § 94. Преобразование координат 268 § 95. Еще раз об определении определителя 270 § 96. Подпространство 273 § 97. Сумма и пересечение подпространств 275 § 98. Прямая сумма подпространств, 280 § 99. Фактор-пространство 284 Глава 10. Эндоморфизмы векторных пространств § 100. Определение и простейшие свойства гомоморфизмов 285 § 101. Изоморфизмы 289 § 102. Теорема о гомоморфизмах 291 § 103. Операции над эндоморфизмами 294 § 104. Инвариантное подпространство 295 § 105. Матрица эндоморфизма 297 § 106. Полином от Эндоморфизма 300 § 107. Некоторые задачи 301 § 108. Изменение матрицы эндоморфизма при замене базиса ЗОЙ § 109. Эндоморфизм с квазидиагональной матрицей 303 § ПО. Характеристический полином 306 § 111. Собственные векторы эндоморфизма 308 Глава 11. Системы линейных уравнений § 112. Критерий совместности. Многообразие решений 311 § 113. Общее решение системы линейных уравнений 316 Глава 12. Подобие матриц над полем. Нормальные формы матрицы § 114. Каноническая форма полиномиальной матрицы 320 § 115. Наибольшие общие делители миноров полиномиальной матрицы 324 § 116. Элементарные делители полиномиальной матрицы 329 § 117. Матричные полиномы • 333 § 118. Критерий подобия матриц над полем 335 § 119. Построение трансформирующей матрицы 339 § 120. Сопровождающая матрица 342 § 121. Первая нормальная форма матрицы над полем 343 § 122. Минимальный полином 344 § 123/ Инвариантные подпространства, связанные с каноническим разложением минимального полинома 35 § 124. Вторая нормальная форма матрицы над полем 351
8- Оглавление § 125. Критерий диагонализируемости матрицы над полем 357 § 126. Жорданова нормальная форма матрицы 357 § 127. Обобщенная жорданова нормальная форма матрицы над полем вещественных чисел 360 Глава 13. Билинейные и квадратичные формы § 128. Линейные преобразования переменных 366 § 129. Билинейные формы 368 § 130. Квадратичные формы 371 § 131. Диагональные билинейные и квадратичные формы 372 § 132. Нормальный вид квадратичной и симметрической билинейной форм над полем комплексных чисел 375 § 133. Нормальный вид квадратичной и симметрической билинейной форм над полем вещественных чисел 376 § 134. Знакоопределенные вещественные квадратичные и билинейные формы 379 § 135. Условия разложимости вещественной и комплексной квадратичных форм 384 § 136. Эрмитово-сопряженная матрица 387 § 137. Эрмитовы билинейные и квадратичные формы 388 Глава 14. Евклидовы и унитарные пространства § 138. Билинейные функции 392 § 139. Симметрические билинейные функции 395 § 140. Скалярное произведение 396 § 141. Длина вектора 400* § 142. Ортогональные векторы 403 § 143. Связь между ортонормированными базисами 407 § 144. Определитель Грама 408 § 145. Ортогональное дополнение подпространства 410 Глава 15. Линейные преобразования евклидовых и унитарных пространств § 146. Изоморфизм 412 § 147. Сопряженное преобразование 416 § 148. Изометрии 418 § 149. Самосопряженное преобразование 424 § 150. Приведение вещественной квадратичной формы к диагональному виду ортогональным преобразованием переменных 426 § 151. Разложение линейного преобразования в произведение изометрического и самосопряженного 427 ЧАСТЬ IV. ТОЧЕЧНЫЕ ПРОСТРАНСТВА Глава 16. Аффинные пространства § 152. Определение и простейшие свойства 431 § 153. Координаты 434 § 154. Плоскости 437 § 155. Геометрическое истолкование систем линейных уравнений 441 § 156. Взаимное расположение двух плоскостей 444 § 157. Аффинное отображение 446 § 158. Изоморфизмы 448 § 159. Аффинные преобразования 450 § 160. Автоморфизмы 454 § 161. Геометрия аффинной группы 456
Оглавление 9 Глава 17. Точечные евклидовы и унитарные пространства § 162. Определение и простейшие свойства 461 § 163. Плоскости 462 § 164. Объем параллелепипеда 466 § 165. Движения . 468 § 166. Движения точечной евклидовой плоскости 471 § 167. Движения трехмерного точечного евклидова пространства 473 § 168. Аффинные преобразования пространства Еп 475 Глава 18. Квадрики § 169. Вещественно-комплексное пространство 477 § 170. Определение квадрики 479 § 171. Пересечение квадрики с прямой 484 § 172. Асимптотические направления 486 § 173. Линии эллиптического, гиперболического и параболического типов 489 § 174. Центр квадрики 491 § 175. Диаметральные плоскости 494 § 176. Диаметры линий второго порядка 495 § 177. Упрощение уравнения квадрики с помощью преобразования координат. 498 § 178. Аффинная классификация квадрик 501 § 179. Упрощение уравнения квадрики, заданного в ортонормирован- ном репере 505 § 180. Исследование поверхности второго порядка в пространстве E3(i) по общему уравнению 508 § 181. Метрические инварианты полинома второй степени 512 § 182. Исследование линии второго порядка с помощью инвариантов 515 Глава 19. Проективные пространства § 183. Определение 518 § 184. Координаты 520 § 185. Плоскости 522 § 186. Проективная группа * 527 § 187. Сложное отношение четырех точек 533 § 188. Квадрики в проективном пространстве 535 § 189. Проективная классификация линий второго порядка 538 Предметный указатель 541
ОБОЗНАЧЕНИЯ {а, b, ...} — множество, элементами которого служат а, Ь, ... г в частности {а} — множество, содержащее точно один элемент а; е — знак принадлежности, например х^Х—х — элемент множества X, хфХ — х не принадлежит множеству Х\ cz, ^ — включение: ХёУ— множество А" есть подмножество множества У; X<=Y — множество X есть подмножество множества У, не совпадающее с У; U — объединение: X (J У — объединение множеств X и У; U Ха — объединение множеств Ха\ X \Y — разность множеств X и У; 0 ■-*- пустое множество; {x^X\f(x)=y} —множество всех таких элементов х множества X, что f(x) =у\ R— множество всех вещественных чисел; N— множество всех натуральных чисел; А =>- В — из Л следует В\ ф — начало доказательства; ф — конец доказательства. Все другие обозначения объясняются в тексте.
Часть I НЕКОТОРЫЕ ВОПРОСЫ ОБЩЕЙ АЛГЕБРЫ Эту часть книги (исключая третью главу) нельзя отнести собственно к линейной алгебре или к аналитической геометрии; в ней вводятся некоторые основные понятия современной алгебры, используемые далее. Глава 1 ОТОБРАЖЕНИЯ § 1. Декартово произведение Пусть X — непустое множество. Множество всех упорядоченных пар (хих2)9 (1) где Xi и х2 — произвольные элементы множества Ху называется декартовым квадратом множества X и обозначается символом X2. Важно иметь в виду, что если задана упорядоченная пара (1), то известны не только два элемента Xi и x2f составляющие эту пару, но также указано, что Xi -=- первый элемент пары, а х2 — второй. Если Х={0, 1}, то X2 — четырехэлементное множество, составленное из пар (0,0), (0,1), (1,0), (1,1). , Аналогично определяется декартов куб X3 множества X: множество всех упорядоченных троек (*и х2, *з), где хи х2у Хз — произвольные элементы множества X. Вообще для любого натурального числа п п-я декартова степень Хп есть множество всех упорядоченных я-ок (энок) - (хи х2, ... , Хп), (2) т. е. последовательностей длины /г, составленных из произвольных элементов j Хи х2у ... , хп (3) .множества X. Так же, как и при п=2, если задана последовательность (2), то известны не только составляющие ее элементы (3),
12 Глава 1. Отображения но и их порядок, т. е. указано, что Xi — первый элемент последовательности, Хг — второй и т. д. R2={(x, у)\х, y^R)— множество всех упорядоченных пар вещественных чисел, /?3 =={(*, у, z)\x, yy z^R} — множество всех упорядоченных троек вещественных чисел, Rn = {(хи Х2, ... , хп) |*i, х2, ... , xn^R} — множество всех последовательностей длины п, составленных из вещественных чисел. При п=\ множества Хп и X обычно отождествляют. Рассматривают также декартово произведение различных множеств. Если X и У — любые непустые множества, то множество всех упорядоченных пар (х, у), где х и у — соответственно произвольные элементы множеств X и Y, называется декартовым произведением множеств X и У и обозначается символом XX У (при Y=X XXY=X2). Если *={0, 1}, У={0, 2, 3}, то XXY={{Ot-0), (О, 2), (0, 3), (1, 0), (1, 2), (1,3)}. Аналогично определяется декартово произведение п множеств § 2. Отношение эквивалентности Пусть X — непустое множество/ a R^X2. Говорят, что элемент х множества X находится в отношении R к элементу у этого множества и пишут xRy, если пара (х, у) принадлежит множеству R. Таким образом, всякое подмножество R множества X2 определяет некоторое отношение между элементами множества X. Отношение R можно определить заданием какого-либо свойства, которым должны обладать все пары из множества R и только они. 1. Равенство чисел является отношением в множестве N всех натуральных чисел (вместо N можно взять, например, множество всех целых чисел). Оно определяется подмножеством множества Л2, состоящим из всех пар вида (я, /г), n^N. 2. В том же множестве N отношение порядка п^.пг определяется множеством всех пар (/г, т), где число п не больше числа га, а отношение делимости (п делит пг) —множеством всех пар (я, га), где число п является делителем числа га. 3. Пусть X — произвольное непустое множество, a R = X2. Тогда xRy для любых элементов х и у множества X. Отношение R, заданное в множестве X, называют рефлексивным, если для любого элемента х этого множества xRx. Другими словами, отношение R рефлексивно, если множество R2 содержит каждую пару (х, х), х^Х. Отношение R называют транзитивным, если для любых элементов х, у, z множества X из xRy и yRz следует xRz. Иными
§ 2. Отношение эквивалентности 13 словами, отношение R транзитивно, если из того, что (х, y)^R и (у, z) <=R следует, что (х, г) е/?. Отношение R называют симметричным, если для любых элементов х и у множества X из xRy следует yRx. Множество R й этом случае должно вместе с парой (х, у) содержать пару И, наконец, отношение R называют отношением эквивалентности (эквивалентностью), если оно рефлексивно, транзитивно и симметрично. Эквивалентность часто обозначают символом ~. Если х~уу то и у~х, так что можно в равной мере говорить . «х и у эквивалентны», «элемент х эквивалентен элементу у», «элемент у эквивалентен элементу х». Равенство чисел, подобие треугольников, параллельность прямых являются ^примерами эквивалентности (если считать, что каждая прямая параллельна себе и каждый треугольник подобен себе). Отношение порядка чисел ^ хотя и рефлексивно и транзитивно, но не симметрично, и потому не есть отношение эквивалентности. То же можно сказать и об отношении делимости. Важным примером эквивалентности является отношение равенства. Пусть X — непустое множество. Положим Е={(х,у)еХ*\у=х). Очевидно, Е — отношение эквивалентности. Это отношение на~- зывается отношением равенства. Мы не исключаем множеств, элементами которых являются другие множества. Ниже рассматриваются отношения эквивалентности и на таких множествах. Пусть множество X представлено в виде объединения конечной или бесконечной системы своих непустых попарно непересекающихся подмножеств. Такое представление множества X называют его разбиением, а входящие в это разбиение подмножества — классйми разбиения. Множество N всех натуральных чисел разбивается на два класса: класс всех четных и класс всех нечетных чисел. То же множество N разбивается на три класса: первый составляют все числа, делящиеся на 3, второй — все числа, остаток при делении на 3 которых равен 1, третий — все числа, остаток при делении на 3 которых равен 2. Множество всех треугольников разбивается на классы треугольников, подобных друг другу. Не исключаются и оба тривиальных разбиения. Одно из них — представление множества X в виде объединения всех его одноэлементных подмножеств, второе — разбиение, содержащее лишь один класс — само множество X. Пусть на множестве X задана эквивалентность ~. Для произвольного элемента а множества X обозначим символом Ха
14 Глава 1. Отображения подмножество множества X, составленное из всех элементов, эквивалентных а. Покажем, что либо Ха(}Хь=0, (I) либо Ха=Хъ. (2) В самом деле, пусть Ха()ХъФ0, с<=Ха[\Хь. Тогда с~а. Если d^XC9 io„d~c и, значит, d~a9 т. е. d^Xa. Таким образом, Хс^Ха. Аналогично доказывается, что Ха^Хе и, следовательно, Ха=Хс. Точно так же Хъ=ХСу и потому верно равенство (2). Далее ХлФ0, так как а&Хй. (3) Рассмотрим теперь систему всех подмножеств множества X вида Ха, предварительно устранив повторения. В силу (3) объединение этих подмножеств даст множество X. В силу. (1) и (2) эти подмножества попарно не пересекаются. Так что мы получили разбиение множества X. Говорят, что это разбиение определяется заданной эквивалентностью. Все элементы, входящие в один класс этого -разбиения, эквивалентны друг другу, а элементы из разных классов не эквивалентны. Если X — непустое множество, ~ —эквивалентность, заданная на X, то множество классов разбиения, определяемого эквивалентностью ~, называется фактор-множеством множества X по эквивалентности ~ и обозначается символом X/— § 3. Отображение Пусть X и У-—произвольные непустые множества. Если каждому элементу множества X поставлен в соответствие некоторый вполне определенный элемент множества У, то говорят, что определено отображение множества X в множество У (или, иначе, на множестве X определена функция со значениями в множестве У). , Отображение можно рассматривать как действие, которое применяется к каждому элементу х множества X и переводит его в некоторый (определенный) элемент у множества /. Этот элемент у называется образом элемента х при данном отображении. Отображение множества X в множество У часто обозначается символом X^~Y. Если у — образ элемента х при этом отображении, то пишут х *->у. Мы часто обозначаем отображение одной буквой (например, /), и тогда символ /: X->Y заменяет фразу «отображение f>
§ 3. Отображение 15 переводящее множество X в множество У», или «/ — отображение множества X в множество У» («функция на множестве X со значениями в множестве У»), или какую-либо другую, близкую по смыслу. Из контекста всегда ясно, что имеется в виду. Пусть /: X-+Y. Образ элемента х при этом отображении обозначается символом f(x). Множество {/ (х) \ х^Х} образов всех элементов множества X обозначается символом Im f, или f(X), и называется образом* отображения /, или образом множества X при отображении /, или множеством значений функции f. Аналогично для любого подмножества А множества X определяется его образ ЦА) = {f(a) \a^A}. : Пусть у — фиксированный элемент множества У. Множество {x^X\f(x) =y} всех тех элементов из X, для которых у является образом при отображении /, будем обозначать символом /""Чу) и называть полным прообразом элемента у при отображении, f. Каждый элемент множества f~l{y) назовем прообразом элемента у при отображении f. Может случиться, что /-1(у)=0 для какого-либо элемента у множества У. Аналогично для каждого подмножества В множества У определяется его полный прообраз f-4fl) = {*e*|f(*)€=B}. Два отображения f: X-*~Y и g: U-+V называются равными, если X=U, Y=V и для каждого элемента х множества X f(x) = =g(x). Теорема. Если X и Y — конечные множества, причем X составлено из т, -a Y — из п элементов, то число различных отображений вида Х-^У равно пт. ф ПуСТЬ Х= {Хи Хъ, . . . , Хтп]. Каждое /: X-+Y определяется двустрочной таблицей (Xi Хг ... xm \ /(х.) цх2) ... f(Xm)): () где ниже элемента х множества Я" записан образ этого элемента f(x). Поэтому число рассматриваемых отображений равно числу таких таблиц. При т=1 имеем п таблиц, так как в качестве /(*i) может быть взят любой из п элементов множества Y. Далее воспользуемся индукцией по т. Пусть т=р>1 и для т<р теорема верна. Рассмотрим все таблицы вида (1), где f(xm) — фиксированный элемент множества Y. Их число равно числу отображений вида {*!, Х2, • • • , Xm-l}-+Yy т. е. nm_1. Так как для f(xm) имеется п возможностей, то число всех таблиц вида (1) есть сумма п слагаемых, каждое из которых равно я™-1, т. е. пт. # * image (англ.) —образ.
16 Глава 1. Отображения Отображение /: X-*Y называют инъективным или инъекцией, если для любых элементов хи х2 множества X Xi=£X2=>f(Xt)=£f(x2). Другими словами, отображение / инъективно, если каждый элемент множества У имеет не более одного прообраза. М' м 'Рис. 1 Рис. 2 Отображение f: X-+Y называют сюръективным или сюръек- цией (отображением на), если каждый элемент множества У HivfeeT хотя бы один прообраз, т. е. Im f=Y. Для нас особенно важны отображения, которые инъективны и сюръективны одновременно. Отображение /: X-+Y называют биективным или биекцией (наложением), если оно инъективно и сюръективно, т. е. если каждый элемент множества У имеет точно один прообраз. 1. Отображение множества всех живущих людей в множество N всех натуральных чисел получим, если каждому человеку поставим в соответствие год его рождения. Вместо N можно взять, разумеется, множество всех натуральных чисел, больших, чем 1700. Оба эти отображения не инъективны и не сюръективны. 2. Отображение множества букв русского алфавита в себя, которое каждую букву переводит в следующую за ней, а последнюю — в первую, является биекцией. 3. Пусть X — множество всех точек некоторой плоскости П, а — фиксированное неотрицательное число. Выберем в плоскости П какую-либо точку О и для каждой точки М этой плоскости построим отрезок Ом. Повернув этот отрезок в плоскости П вокруг точки О на угол а, получим отрезок ОМ'. Отображение, переводящее каждую точку М в построенную описанным способом точку ЛГ, называют поворотом плоскости вокруг точки О на угол а. Обозначим этот поворот символом'ga (рис. 1). ga — биекция. Если а—Р — целое кратное числа 2я, то, очевидно, £а=£р- 4. Поставив в соответствие каждому положительному вещественному числу его десятичный логарифм, получим биекцию множества всех вещественных положительных чисел на множество всех вещественных чисел. 5. Пусть X — множество всех точек- окружности с центром в точке О, У —множество всех точек прямой А, проходящей через точку О. Поставив в соответствие каждой точке множества X ее ортогональную проекцию на прямую А, получим отображение множества X в множество У, которое не инъективно и не сюръективно (рис. 2).
§ 3. Отображение 17 6. Поставив в соответствие каждому отрезку прямой А его длину, получим сюръективное (не инъективное) отображение множества всех отрезков прямой Л на множество всех положительных вещественных чисел. В предыдущем предложении слово «положительных» следует заменить словом «неотрицатель- - ных», если в множество отрезков включать и отрезки нулевой длины. Обратим внимание на следующее отображение. Пусть X^Y, i: X-+Y — такое отображение, при котором для любого элемента х множества X i(x)=x. Отображение i будем называть вложением множества X в множество У. Важно понятие функции п переменных. Пусть п — натуральное число, X и У—непустые множества. Любое отображение множества Хп в множество У называется функцией п переменных, определенной в множестве X, со значениями в множестве У. В частности, любое отображение множества/? в R называется вещественной функцией одной переменной, всякое отображение множества R2 в R — вещественной функцией двух переменньсх, а всякое отображение вида/?3-*/?^- вещественной функцией трех переменных. В этой книге мы будем иметь дело преимущественно не с отображениями одного множества в другое, а с отображениями множества в себя. Отображение множества в себя называют преобразованием этого множества.* Биективное преобразование называют подстановкой. Преобразование множества X, при котором образ каждого элемента совпадает с этим элементом, называется тождественным и обозначается буквой е. Для любого элемента х множества X е(х) =х. Ясно, что е — подстановка. Иногда, чтобы отметить, что е действует именно на множестве X, а не на другом множестве, будем писать ех вместо е. Пусть X — множество, в котором не менее двух элементов, а и Ь — несовпадающие элементы множества X. Преобразование множества X, переводящее а и Ь друг в друга и оставляющее неподвижными все другие элементы множества X, если они есть, называется транспозицией элементов а и Ь и обозначается символом (а, Ъ). (а, Ь) (a) =bt (a9b)(b)=a9 (а, *>(*)=*, если х=£а и хфЪ. Очевидно, (а, Ь) = (Ь, а) (здесь (а, Ь) и (6, а) означают не элементы множества Х29 как это было выше, а транспозиции). * У многих авторов слово «преобразование» означает «биекция». Мы же, говоря о преобразованиях, не подразумеваем, что они биективны.
18 Глава 1. Отображения § 4. Умножение (композиция) отображений Пусть A", Y и Z — непустые множества, /: Х->У, g: Y-+Z. К каждому элементу х множества X применим отображение f» Под действием / элемент х перейдет в элемент y=f(x) множества У. К элементу у применим отображение g. Оно переведет у в элемент z=g(y) множества Z. Таким образом, последовательное применение отображений fug позволяет каждому элементу х множества X поставить в соответствие вполне определенный элемент z=g(f(x)) множества Z. Возникающее при этом отображение X-+Z называется произведением (или композицией) отображений g.n f. Произведение отображений g и f часто обозначают символом g of или просто gf. По определению gf(x)=g(f(x)) для любого элемента х множества X. Произведение gf отображений g uf определено тогда и только тогда, когда первое множество (Y) отображения g совпадает со вторым множеством (Y) отображения f. Очевидно, если fug являются преобразованиями множества X, то определены оба произведения fg и gf. Они также суть преобразования множества X. Пусть даны три отображения: /: X-*Y, g: Y-+Z и h: X-*Z* Если h=gf, то говорят, что диаграмма \г 1 коммутативна. Это означает, другими словами, что результат действия сквозного отображения X * * Y -£-*-Z такой же, как и результат действия отображения h. Часто употребляется более общее определение умножения отображении. Приведем это определение. Пусть даны два отображения: /: X-+Y и g: Z-+U. Если Y^Z, то определено произведение gf: X-+U. Для любого элемента х множества X; как и выше, gf(x)=g(f(x)). Для наших целей более удобно первое определение. Отметим важнейшие свойства умножения отображений* Основное свойство умножения отображений — его ассоциативность. А именно, верна
§ 4. Умножение (композиция) отображений 19 Теорема 1. Пусть f, g, h — три таких отображения, что одно из произведений (hg)f, h(gf) « (1) определено. Тогда определены оба произведения (1) и верно равенство (hg)f=h(gf). + Пусть, например, определено h(gf) и /: X-*Y. Тогда g: Y-+Z, gf: X-+Z, h: Z->U9h(gf): X-*U. Поэтому hg определено и hg: У->(/. Следовательно, (hg)f определено и (hg)f: X-+U. Итак, оба произведения (1.) определены, их первые, а также вторые множества совпадают. Осталось показать только, что для каждого элемента х множества X (hg)f(x)=h(gf)(x). (2) -Имеем (hg)f(x) = (hg)(f(x))=h(g(f(x))), (3) h(gf)U)=h(gf(x))=h(g(f(x))). (4). Сравнивая выражения (3) и (4), получаем равенство (2). # Распространим теперь определение произведения отображе* ний на любое конечное число сомножителей. Если f±: Xr+X2, /г: Х2-+Х3, ... , f*: Xk-*Xh+u то произведение fк ... hh определим индуктивно: Ufi уже определено, Uhfi=h(hfi) и вообще, если i<k и fit... /г/i уже опреде*_ Лено, то положим • fmfi...f2fi=h+i(fi...f2h). В силу ассоциативности умножения отображений для любого натурального числа i, удовлетворяющего неравенствам 1^:*<А, /* ... Mi... /i= (/*... 1ш) (П ... ft). (5) ф Докажем равенство (5) с помощью индукции по числу сомножителей в первой паре скобок. Если A=i+1, то равенство (5) верно по определению. Пусть теперь s>t+l и формула (5) верна лри £<s. Тогда (/.... fi+tXf*... fi)-(f.(f-t.-. fw))(f<...W- =/s ( (f^ . . . fi+i) </,... /О ) =/. (/s_t . . . h) =fsfs-i . . . h Следовательно, равенство (5) верно при любом £, удовлетворяющем неравенствам l^i<k. ф
20 Глава 1. Отображения Тождественное отображение играет при умножении отображений роль, аналогичную роли числа 1 при умножении чисел. Точнее, если f: X-+Y, то, fex=f (б)] erf=f- (7) ф В самом деле, для любого элемента х множества X fex(x)=f(ex(x))=f(x). Отсюда следует равенство (6). Равенство (7) столь же очевидно. # Если множества X и Y совпадают, то равенства (6) и (7) можно записать так: fe=ef=f. Теорема 2. Пусть f: X-+Y, g: Y-+Z, h=gf. Тогда: 1) если f и g сюръективны, то и h сюръективно; 2) если f и g инъективны, то и h инъективно. ф Пусть f и g — сюръекции. Тогда для любого элемента z множества Z g-*(z)=^0. Пусть y^g-i(z). Из сюръективности отображения / следует, что \~~1(у)ф0. Пусть ^е/_1(!/). Тогда h(x)=gf(x)=g(f(x))=g(y)=z, ^Н(2),. Ьг1(т>)Ф0у т. е. h — сюръекция. Пусть теперь fug инъекции. Инъективность отображения h означает, что для любых несовпадающих элементов Xi и х2 множества X к(х^фк{х2). (8) Но h(Xi) =g(f (xi)). Так как / — инъекция, то f (х{)Ф1{х2). Из инъективности отображения g теперь следует Неравенство (8) доказано, ф Следствие. Произведение биекций — биекция. Заметим, что умножение отображений некоммутативно, т. е. равенство fg=gf не всегда верно. Если даже/ и g — преобразования одного множества, то и тогда может оказаться, что gf^fg, хотя и fg и gf определены. Пусть Х={\, 2}, /=(1, 2), g(l) = l, g(2) = l. Тогда fe(l)=f(l) =2, но gf(\)=g(2) = \;fg¥=gf.
§ 5. Обратное отображение 21 § 5. Обратное отображение Пусть /: Х->У. Если существует такое отображение g: Y-+Xy что fg=eYy gf=ex, то отображение g называется обратным отображению f. Очевидно, если g— отображение, обратное отображению f, то f — отображение, обратное отображению gf так что tug взаимно обратны. Теорема. Пусть f: X-+Y. Отображение-, обратное отображению f, существует тогда и только тогда, когда f биективно. ф Пусть f — биекция, а у — произвольный элемент множества У. По определению биекции множество /_1(^) содержит только один элемент, который мы обозначим буквой х. Определим отображение g: Y-*X для любого у из У формулой g(y) =xr где x^f~i(y)i и покажем, что g — отображение, обратное отобра1 жению /. Для любого элемента у множества У fg(y)=f(x)=yy значит, fg=eY. Для любого элемента х множества X gf(x) = =g(y)=x, т. е. gf=ex. Итак, fug друг другу обратны. Пусть теперь /: X-+Y — такое отображение, для которого существует обратное отображение g. Для любого элемента у множества У y=eY(y)=fg(y)=f(g(y))=f(x), где x=g(y), т. е. f сюръективно. Пусть f(xi)=f(x2), хи х2<=Х. (1) Применяя к обеим частям равенства (1) отображение gf получим gf(xi)=gf(x2), ex(xt)=ex(x2), xi=x2. Следовательно, из равенства (1) вытекает Xi=x2f т. е. / инъек- тивно. ф Очевидно, если f — биекция, то обратное f отображение g также биективно, ибо / — отображение, обратное отображению g. 1. ее=е, так что тождественное отображение совпадает с обратным себе отображением. Для любой транспозиции (а, Ь) также (a, Ь)-*—(а, b). 2. Для поворота плоскости вокруг неподвижной точки на угол а обратным отображением является поворот вокруг этой же точки на угол, дополняющий а до целого кратного числа 2я. Для биективного отображения f: X-+Y обратное ему отображение обозначим символом /_1. Тогда образом элемента у из У при отображении /_1 будет элемент /_1(у) из X. Прежде мы этим же символом обозначили полный прообраз элемента у при ото-
22 Глава 1. Отображения бражении f. Однако никакой путаницы по этой причине не произойдет, если всегда помнить, что если отображение / не биективно,. символ /~* отдельно, без последующего. (у), не употребляется, если же / — биекция, то символ f-1 имеет самостоятельное значение— обратное / отображение. Множество !~1(у) содержит в этом случае лишь один элемент, который мы обозначаем тем же символом /-1 (у). Если f: X-+Y и g: Y-*Z — биекции, то верно равенство te/)-t=f-|«r1. (2) ф В самом деле, gf: X-+Z. Далее g-i; z~*Y, f-t: Y-+X, так что f"1^"1: Z-+X и определены произведения (gf) (f-1^1): Z+Z, (f-ig-i) (gf):. X-+X; (gf) (f-'g-1) =g(ff-i)g~1= (ger)g-i=gg-i=ez, аналогично (tlg-l)(gf)=ex. Равенство (2) доказано. # § 6. Каноническое разложение В этом параграфе излагается очень важная для многих разделов математики теорема. Она является исходной для различного рода теорем «о гомоморфизмах». С некоторыми из этих теорем читатель встретится в нашей книге. Пусть X — непустое множество, a R — произвольная эквивалентность, определенная в X. Вспомним о фактор-множестве X/R, определяемом этой эквивалентностью, и рассмотрим отображение k: X-+X/R, ставящее в соответствие каждому элементу х множества X класс эквивалентных ему элементов (в смысле эквивалентности R). Назовем k каноническим отображением, определяемым эквивалентностью R. Пусть /: X-+Y — произвольное отображение. В множестве X определим отношение /С/, положив для элементов Хх и х2 этого .множества (хи х2) е/С/ тогда и лишь тогда, когда Лемма 1. Kf — отношение эквивалентности.
§ 6. Каноническое разложение 23 ф Нужно доказать рефлексивность, симметричность и транзитивность отношения /С/. 1. Рефлексивность. Для любого элемента х множества X f(x)=f(x)9 поэтому (ху x)^Kf. 2. Симметричность. поэтому (хи х2) е/С/ =^ (*2, xi) ^Kf. 3. Транзитивность. Пусть (хи х2) е/С/, (*2, x3)^Kf. Тогда f(Xi)=f(x2), f(x2)=f(x3). Следовательно, / (*i) =f (*з), (хи xs)j&Kf.. • Отношение /С/ называется ядерной эквивалентностью отображения f. Класс элемейтов, эквивалентных элементу х (в смысле эквивалентности /С/), будем обозначать символом [х]. Положим 6(M)=f(*). (О- Так как, по определению отношения /С/, равенства [Xi] = [x2] ' (2> И f(*i)=f(**) (3> равносильны, то формулой (1) определяется отображение b: X/Kr+lmf. Лемма 2. b — биекция. ф Ь инъективно, так как равенства (2) и (3) равносильны.. Пусть теперь у — произвольный элемент множества Im f. Тогда существует такое х в X, что y=f(x). Согласно'(1), Ь([х])=у. Сюръективность отображения Ъ доказана, ф Рассмотрим произведение отображений ibk, где i: Im f-*Y — вложение, k — каноническое отображение, определенное выше- Очевидно, ibk: Х->У. Кроме того, для любого элемента х множества X ibk(x)=ib([x])=i(f(x))=f(x)9 поэтому ibk=f. Итак, доказана
24 Глава 1. Отображения Теорема. Произвольное отображение f: X-+Y представляется в виде произведения f=ibk, • (4) где k: X-+X/Kf — каноническое отображение, определяемое ядерной эквивалентностью Kf, Ь: X/Kr+lmf, b([x])=f(x) — биек- ция; i: Im f-*Y — вложение. Представление отображения / в виде (4) называется каноническим разложением. Вместо фразы «верно равенство (4)» часто говорят «диаграмма -XV в Imf коммутативна». Замечания. 1. Если f — сюръекция, то 1т/=У, i=e и равенство (4) упрощается: f=bk. 2. Если f(x)==y, то }~1(у) = [х]. Следовательно, f инъективно тогда и лишь тогда, когда для любого элемента х множества X [х]={х}> т. е. ядерная эквивалентность Kf совпадает с отношением равенства. 3. Для любого отношения эквивалентности R в множестве X каноническое отображение k: X^-X/R сюръективно. Ядерная эквивалентность отображения k совпадает с R. ♦ Действительно, для любого элемента х множества X k(x) есть класс элементов, эквивалентных х, поэтому k(xi) =&(x2) тогда и только тогда, когда Х\. и ^эквивалентны (в смысле отношения R). ф § 7. Сужение и продолжение отображения Пусть /: X-+Y и U — непустое подмножество множества X. Определим /: £/->У условием: f(u)=f(u) для любого и из U. Отображение / называется сужением отображения f, а / — продолжением отображения f. Отображение / и его сужение / различаются лишь первыми множествами: область действия отображения / шире, если только ИфХ. Если же U=Xy то f=f. Очевидно, сужение / вполне определяется отображением /и множеством U. Напротив, продолжение / отображения /: U-*Y не определяется отображением / и множеством X^U\ при разных отображениях множества X в множество Y образы элементов множества U могут совпадать.
§ 8. Перестановки 25 Пусть П — плоскость, А4 и Аг — две прямые, не параллельные этой плоскости и друг другу, /i и /2 — проектирования пространства на плоскость П параллельно Ai и Аг соответственно. Очевидно, /i#b» но сужения их на плоскости П совпадают, ибо для каждой точки Р этой плоскости fi(P)=P=f2(P). Можно определить продолжение и сужение отображения в терминах умножения отображений или коммутативных диаграмм. Пусть U — подмножество множества X, i: U-+X — вложение, f: X-+Y — произвольное отображение. Если g: £/->К — такое отображение, что диаграмма U С -*~Х \[ коммутативна (т. е. fi=g), то f — продолжение отображения g. Пусть /: Х-+Х, а М — такое непустое подмножество множества X, что f (М) ^М. Подмножество М называется инвариантным^ относительно преобразования f. Если М инвариантно относительно преобразования f, то наряду с сужением f: M-+X рассматривают ограничение преобразования f на множестве М. Это такое преобразование множества М, при котором для любого элемента m множества М m-+f(m). * Ограничение преобразования / на инвариантном подмножестве М обозначим символом f | м- От сужения f ограничение }\м отличается вторым множеством: f: M-+Xy f\M: M-+M, f (m) =/|M(m) =f (m) для любого m из М. § 8. Перестановки Пусть X — конечное множество, п — число его элементов. Строка вида аи а2у ... , ап, (1) в которой записан каждый элемент множества X один раз, причем указано, какой из этих элементов первый, какой второй и т. д.г называется перестановкой элементов множества X, Перестановки одних и тех же элементов считаются равными, если порядки в них одинаковы. Так, 1, 2, 3; 1, 3, 2; 2, 1, 3; 2, 3, 1; 3, 1, 2; 3, 2, 1 —все различные перестановки элементов множества Х={1, 2, 3}.
26 Глада 1. Отображения Теорема 1. Количество различных перестановок заданных п элементов равно 1 -2-.. :-п=п\. ф Докажем эту теорему индукцией по числу п. При п=1 имеется одна перестановка, т. е. 1!. Пусть л>1 и число различных перестановок, которые можно составить из заданных я—1 элементов, равно (я—1)!. Всякая перестановка данных элементов с фиксированным первым членом а имеет вид я, 02, ... , An, где а2, ... , ал — произвольная перестановка оставшихся п— 1 элементов. По индуктивному предположению число таких перестановок равно (я—1)!. В качестве а можно взять любой из данных п элементов, поэтому число различных перестановок заданных п элементов равно сумме п слагаемых, каждое из которых есть (я— 1)!, т. е. я!, ф Пусть (1) —произвольная перестановка элементов множества X, а / — подстановка множества X. Будем говорить, что подстановка f переводит перестановку (1) в перестановку Ьи Ь2; ,.. , Ьп, (2) если f(ai)=bu *=1, 2, ...,/г. (3) Таким образом, фраза «применить к перестановке XI) подстановку /» будет означать «заменить перестановку (1) перестановкой (2), где Ъх определяются равенствами (3)». Транспозиция (1, 2) переводит перестановку 3, 2, 1 в перестановку 3, 1, 2. Если к перестановке применить дважды одну и ту же транспозицию, то данная перестановка не изменится. Теорема 2. Пусть X — конечное множество, п — число его элементов, я>1. От любой перестановки элементов множества X можно перейти к любой другой перестановке этих элементов, последовательно применив несколько подходящих транспозиций элементов множества X.- ф Воспользуемся индукцией по я. При п=2 пусть Х= {а, Ь). Есть две перестановки: а, Ъ и 6, а. Транспозиция (а, Ь) переводит их друг в друга. Пусть теперь я>2 и пусть для перестановок я—1 элементов теорема верна. Возьмем две произвольные перестановки (1) и (2) элементов множества X. Если ai = bit то 02, ... , ап и &2, ... , Ьп — перестановки одних и тех же я— 1 элементов. По индуктивному предположению существует последова-
§ 8. Перестановки 27 тельность транспозиций, переводящая первую перестановку ва вторую и не затрагивающая а4. Указанная последовательность переводит перестановку (1) в перестановку (2). Если же-с^ФЬ^ то, применив к перестановке (1) транспозицию {aiy 6i), мы придем к уже рассмотренной ситуации, ф Пример. Найти последовательность транспозиций, переводящую перестановку 1, 2, 3, 4 (4> в перестановку 4, 1, 2, 3. ^ (5> Решение. Транспозиция (1, 4) переведет перестановку (4) в перестановку 4, 2, 3, 1, применив к которой транспозицию (1, 2), получим 4, 1, 3, 2. (6> Транспозиция (2, 3) переведет перестановку (6) в перестановку (5). Таким образом, (1, 4), (1, 2), (2, 3) —искомая последовательность транспозиций. Пусть снова X — произвольное n-элементное множество. Пронумеруем элементы множества X с помощью чисел 1, 2, ... , п. Теперь мы будем говорить о множестве Х={19 2, ... , п) п чисел. Если в перестановке число i расположено левее числа / и i>]\ то говорят, что эти числа находятся в инверсии. В перестановке 1, 2, 3 нет инверсий; в перестановке 3, 2, 1 число 3 находится в инверсии с 2 и с 1, а число 2 находится в инверсии еще и с 1. Таким образом, перестановка 3, 2, 1 содержит три инверсии. - Если перестановка содержит четное число инверсий, то. ее называют четной, в противном случае — нечетной. Перестановки 2, 1, 3 и 3, 2, 1 — нечетные, 1, 2, 3 и 3, 1, 2 —четные. Теорема 3. Однократное применение транспозиции меняет характер четности перестановки на противоположный. ф Применим транспозицию (t, /) сначала к такой перестановке, где эти числа стоят рядом. Очевидно, количество инверсий бт этого изменится точно на единицу: появится инверсия между i и /, если'ее не было до применения транспозиции, и, наоборот, исчезнет эта инверсия, если она прежде была. Теперь применим транспозицию (i,'/) к перестановке ... , U аи ... , as, у, ... (7) После применения этой транспозиции получим перестановку ... , /, ai} .., , a8f U • • • (8)
28 Глава 1. Отображения Этого же результата мы достигнем, если к перестановке (7) применим последовательно транспозиции (/, ai), (i, a2), ..., (*, аё), (it /), (/, а8)9 (/, 0s-i),... , (/, ai). На каждом шаге мы потеряем или приобретем точно одну инверсию, т. е. изменим характер четности перестановки на противоположный. Всего нам придется применить 5+1+5== 25+1 транспозиций соседних чисел, поэтому характеры четности перестановок (7) и (8) различны, ф Следствие. Если я>1, то количество всех различных четных перестановок заданных п чисел равно количеству всех различных п\ нечетных перестановок этих чисел и равно —. ф Обозначим буквой а количество всех четных перестановок п чисел, а буквой b — количество всех нечетных перестановок этих чисел. К каждой из четных перестановок применим одну и ту же транспозицию. Все полученные в результате этого перестановки нечетны и различны, их число равно а. Так как Ь — число всех нечетных перестановок, то а^Ь. (9) Аналогично Ь<а, ' (10) из неравенств (9) и (10) вытекает равенство а=Ь. % § 9. Преобразования конечного множества В этом параграфе X — произвольное /г-элементное множество. Природа элементов множества X для нас не важна, важно лишь то, что мы их можем различать. Будем считать поэтому, что Х={1,2,...,/г}. В силу теоремы из § 3 число всех преобразований множества X равно пп. Всякое преобразование / множества X запишем в виде двустрочной таблицы ' VK> f(<h) ... f(an)r { } где 0i, 02, ... , 0п (2) есть произвольная перестановка чисел 1, 2, ,.. , п.
§ 9. Преобразования конечного множества 29 Для Х= {1,2,3} /12 3 4 \ 2 3 1 7 является преобразованием, переводящим 1 в 2, 2 в 3, 3 в 1. Выбор перестановки (2) при этом не существен, важно только следить за тем, чтобы f(a) было записано непосредственно под а. Так, /123\/3 12\ \ 2 3 1 / \ 1 2 3 / Пример. Найти произведение /1234\/1234\ \ 4 3 2 1 / \ 3 4 1 2 /" Решение. Первая справа подстановка переводит 1 в 3, вторая — 3 в 2, значит, произведение подстановок переводит 1 в 2. Далее, первая подстановка переводит 2 в 4, вторая — 4 в 1, поэтому произведение переводит 2 в 1. Аналогично, 3 это произведение переводит в 4, а 4 — в 3. Итак, /1234\/1234\_/1234\ \432 1/\34 12/\2 143/ Если преобразование (1) сюръективно, то в строке /(С), /Ы, .... f(an) (3) должны быть представлены все числа 1, 2,..., п. Если f — инъекция, то строка (3) не должна содержать повторений. Так как множество X конечно, то каждое из этих двух свойств влечет второе. Итак, преобразование f вида (1) — подстановка тогда и лишь тогда, когда строка (3) является перестановкой. Выберем для записи всех преобразований множества X в виде (1) какую-либо одну из перестановок (2). Например, запишем каждое из преобразований / в виде f=V(l) f(2) '.'.'. f(n))" (4) Мы уже знаем, что преобразование / вида (4)—подстановка тогда и только тогда, когда строка /(в0. /Ы> ... , f(an) является перестановкой. Поэтому число всех подстановок мно-
30 Глава 1. Отображения жества X равно числу всех перестановок элементов этого множества и равно, следовательно, п\. - Рассмотрим некоторые свойства подстановок конечного множества. Теорема 1. Всякую подстановку конечного множества, содержащего не менее двух элементов, можно представить в виде произведения транспозиций элементов этого множества. ф Пусть а и Ь — два несовпадающих элемента множества Х={1, 2, ... , п}. (а, Ь) (а, Ь)=е, так что тождественная подстановка есть произведение транспозиций. Возьмем произвольную нетождественную подстановку (1). Она переводит перестановку (2) в перестановку (3). В предыдущем параграфе показано, что существует последовательность транспозиций tif /2, ... , 4, переводящая перестановку (2) в перестановку (3). Положим g=th ... hU. Очевидно, подстановка g переводит перестановку (2) в (3). Следовательно, g=/. # ( Пример. Разложить в произведение транспозиций подстановку (123"Ч (5) \ 4 1 2 3/ ' Решение. Нужно подобрать последовательность транспозиций, переводящую перестановку 1, 2, 3, 4 в перестановку 4, 1, 2, 3. Это сделано в предыдущем параграфе: (1, 4), (1, 2), (2, 3). Следовательно, /12 3 4 4 (4 1 2 з-).-№8)(1'2)(М)- Представление подстановки в виде произведения транспозиций неоднозначно. Читатель легко проверит, перемножив транспозиции, что та же подстановка (5) разлагается в произведение транспозиций и иначе: (! ? ! 1 ) = (1, 2) (1,3)(1,4) = (1, 2) (2,4) (1, 3)(2, 4] (1,4), \ 4 1 2 о / так что не только сами транспозиции, но и число их в разложениях подстановки в произведение транспозиций могут не совпадать. Однако верна следующая
§ 10. Алгебраическая операция 31 Теорема 2. В различных разложениях подстановки в произведение транспозиций характеры четности числа сомножителей совпадают. Число сомножителей четное тогда и лишь тогда, когда первая и вторая строки подстановки одного характера четности. ф Пусть подстановка вида (1) разлагается в произведение А транспозиций. Это значит, что существует последовательность k транспозиций, переводящая перестановку (2) в перестановку (3). Однократное применение транспозиции меняет характер четности перестановки, поэтому k — четное число тогда и только тогда, когда перестановки (2) и (3) одного характера четности, ф Назовем подстановку четной, если она paзлaгaefcя в произведение четного числа транспозиций, и нечетной в противном случае. Согласно теореме 2, подстановка / четная тогда и только тогда, когда характеры четности ее первой и второй строк совпадают. В частности, записав / в виде (4), заметим, что / четная тогда и лишь тогда, когда /(1), /(2), ... , f(n) — четная перестановка. Поэтому во множестве всех подстановок заданных п чисел четных подстановок столько же, сколько есть четных перестановок этих чисел. Итак, количество четных подстановок п чисел п\ Теорема 3. 1. Произведение нескольких четных подстановок —- четная подстановка. 2. Если f — четная подстановка, то и /-1 — четная подстановка. Глава 2 ГРУППА, КОЛЬЦО, ПОЛЕ. ГОМОМОРФИЗМЫ § 10. Алгебраическая операция Пусть X — непустое множество. Произвольное отображение множества X2 в X называется (бинарной) алгебраической операцией, заданной на множестве Xi Иными словами, на множестве X задана алгебраическая операция, если каждой упорядоченной паре (#, у) элементов этого множества поставлен в соответствие определенный элемент z множества X. Этот элемент z называют композицией элементов хиу. Сложение и умножение чисел — алгебраические операции, заданные на множестве всех комплексных чисел. Деление—алгебраическая операция
32 Глава 2. Группа, кольцо, поле. Гомоморфизмы на множестве всех отличных от нуля комплексных чисел. Умножение преобразований — алгебраическая операция на множестве всех преобразований произвольного непустого множества. Если Х= {аи а2, ... , ап} есть конечное множество, то алгебраическую операцию на нем можно записать с помощью квадратной таблицы «1 а2 • ап ai а2 а п В этой таблице в клетке, расположенной на пересечении строки, проходящей через элемент aky и столбца, проходящего через элемент аи следует записать композицию элементов аи и аи Для иллюстрации перечислим все алгебраические операции на множестве Х= {0, 1}. Так как в множестве X2 четыре элемента и в X два, то число различных отображений вида Хг^Х равно 16. Запишем каждую алгебраическую операцию с помощью таблицы: 0 1 0 0 0 1 0 0 0 1 0 1 0 1 1 1 0 1 0 1 1 1 1 1 0 1 0 0 1 1 1 1 0 1 0 0 0 1 0 1 0 1 0 0 0 1 1 1 0 1 0 0 0 1 1 0 0 1 0 0 1 1 1 0 0 1 0 0 1 1 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 1 1 1 1 0 0 1 0 1 0 1 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 1 0 1 0 1 0 0 1 1 0 1 Например, алгебраическая операция, которая задается последней таблицей, такова: (0,0) ~0, (0,1) «-+1, (1,0) <-»0, (1,1)^1. Обозначим символом о алгебраическую операцию, заданную на множестве X, и символом x°j/ — композицию элементов х и у. Пусть п — такой элемент множества X, что для любого х из X п о х=х о п=х. Тогда п называют нейтральным относительно операции ° элементом. Так, 0 -г- нейтральный элемент относительно, сложения чисел, 1 — относительно умножения, е — относительно умножения преобразований. Есть алгебраические операции без нейтральных элементов, например деление отличных
§ 10. Алгебраическая операция 33 от нуля чисел. Относительно алгебраической операции 0 1 0 0 0 1 0 1, определенной на множестве Х={0, 1}, нейтральным элементом служит 1, для операции 0 1 0 0 1 1 1 О нейтральным элементом является 0, относительно операции о'о 1 1 0 1 нет нейтральных элементов. Теорема 1. Относительно любой алгебраической операции существует не более одного нейтрального элемента. ф Пусть шип — нейтральные относительно операции • элементы. Тогда m о п=п, ибо m — нейтральный элемент, m о n=m, ибо п — нейтральный элемент. Поэтому т=п. % Алгебраическую операцию о называют ассоциативной, если для любых элементов ху yt z множества X (х о у) о z=x о (у *z). Сложение чисел, их умножение, умножение преобразований — ассоциативные алгебраические операции. Деление отличных от нуля чисел — неассоциативная алгебраическая операция. Пусть о — алгебраическая операция, заданная на множестве Х\ *и Х2, ... , хп — конечная последовательность элементов этого множества. Индуктивно определяется композиция хп •... ° *г ° *ь Хг • Xi уже определена; если i<.n и композиция Х{ о , . . о Хч о Х\ уже определена, то положим Xi+t ° Xi о . . . о X<i о #i = Xi+l ° \Хг ° • • • ° #2 © Х\). Если операция ° ассоциативна, то для любого натурального числа i, удовлетворяющего неравенствам 1^*<Аг, \Хп о ... о Xi+i) о [Xi ° . . . ° Х{) =Хп о ... о #г+1 • #г ° • • • e %i- Читатель сам докажет это утверждение подобно тому, как доказан аналогичный факт для отображений в § 4.
34 Глава 2. Группа, кольцо, поле. Гомоморфизмы Пусть о — алгебраическая операция, заданная на множестве X, 71 — нейтральный относительно этой операции элемент, х^Х. Если в множестве X есть такой элемент у> что Хо у=у ox=nt то у называют симметричным элементу х. Если элемент у симметричен элементу х, то, очевидно, и х симметричен у, т. е. х и у симметрична друг другу. Теорема 2. Пусть на множестве X задана ассоциативная алгебраическая операция ° с нейтральным элементом п. Тогда для каждого элемента множества X в этом множестве существует не более одного симметричного. ф Пусть х> у, z — элементы множества Ху причем у и z сим*- метричны х. Тогда уox<>z=(yox) oz=n<>z=z. G другой стороны, y0xoz=yo (xоz) =yоп=у. Следовательно, z=y. ф Операцию о называют коммутативной, если для любых элементов х и у множества X х о у=у о х. Операция О 1 О О (Г 101, определенная на множестве Х={0, 1}, ассоциативна, коммутативна. 1 является нейтральным элементом, который симметричен себе. О не имеет симметричного элемента. Сложение и умножение чисел — коммутативные алгебраические операция. Умножение преобразований не коммутативно. Если операция ° ассоциативна и коммутативна, то в композиции Х\ о Хч о . . . о Хп можно произвольным образом группировать элементы и менять их порядок. Например, Доказательство оставлено читателю. Если на множестве X определена алгебраическая операция о, то можно следующим образом задать алгебраическую операцию на множестве непустых подмножеств множества X. Пусть Л и В— непустые подмножества множества X. Композицией А о В назовем множество всех композиций а ° Ь, где аеЛ, Ь^В. Эта операция ассоциативна (коммутативна), если ассоциативна (коммутативна) исходная иперация °*
§11. Кратные (степени) элемента 35 ф В самом деле, пусть, например, исходная операция о ассоциативна, Л, В, С — непустые подмножества множества X. (А о В) о С есть множество всех композиций (а ° Ь)о с, а А о (В о С) — множество всех композиций а о (Ь ° с), где аеЛ, Ь^В, с^С. Так как (ао Ь) о с=а<> (Ь о с), то (Л о В) о С=Л о (В о С). Аналогично рассматривается случай коммутативной операции, ф Часто бывает удобно и естественно называть алгебраическую операцию умножением или сложением (умножение и сложение чисел, умножение преобразований). Если операцию называют умножением, то композицию элементов (подмножеств) х и у называют произведением и записывают в виде ху. Нейтральный элемент при этом называют единицей, а симметричный — обрат- ным. Если же алгебраическую операцию называют сложением, то композицию элементов х и у (подмножеств Л и В) называют суммой и обозначают символом х-\-у (Л+5). Нейтральный элемент при этом называют нулем, а симметричный — противоположным. §11. Кратные (степени) элемента Пусть на множестве X задана ассоциативная алгебраическая операция, которую мы будем называть сложением. Для любого элемента х множества X определим натуральные кратные пх. Положим 1-х=х, и, если м>1, пх=х-\-.. .+дс, где элемент х повторяется в качестве слагаемого п раз. Очевидно, для любых натуральных чисел тип (т-\-п)х=тх-{-пх; (1) (тп)х=т(пх). (2) Пусть теперь в множестве X существует нейтральный элемент 0. Положим тогда 0-#=0 (в левой части этого равенства 0 — число). Очевидно, равенства (1) и (2) верны и в том случае, когда одно из чисел тип или оба эти числа равны нулю. Пусть х —такой элемент множества X, для которого существует противоположный элемент —х, а п — неотрицательное целое число. Тогда элемент п(—х) противоположен элементу пх;. п(-х)=-(пх). (3) В самом деле, п(—х)+пх±=(—х)+...+ (—х)+х+.. .+*=0. Положим теперь (-П)х=п(-х). (4);
36 Глава 2. Группа, кольцо, поле. Гомоморфизмы Учитывая равенства (3) и (4), читатель сам докажет, что равенства (1) и (2) верны для любых целых тип. Цели рассматриваемая алгебраическая операция называется не сложением, а умножением, то аналогично вводятся степени элемента х. xi=x. Для натурального числа я, большего, чем 1, хп=х :.. х, где х взят в качестве сомножителя п раз. Если в X есть единица е, то лс°=е. Если для элемента х существует обратный элемент, то x-n={x-i)n. Верны равенства xm+n=xmxn, xmn=(xm)ny (xn)-i=(x-i)n. § 12. Одно свойство суммы Пусть на множестве X задана ассоциативная и коммутативная алгебраическая операция, которую мы назовем сложением. Если п — натуральное число и аи #2, ... , ап — п произвольных элементов множества Ху то их сумма обозначается символом <§ ** (1) (Сумма может содержать и лишь одно слагаемое, тогда она ему равна.) Так, 1 2 Jg a{ = au J)? ai = ai+a2. i = i i = i В выражении (1) i называется индексом, по которому производится суммирование. Пусть тип — натуральные числа. Возьмем тп любых элементов множества X и обозначим их сумму символом 5. Расположим эти элементы в виде прямоугольной таблицы, содержащей т строк, каждая из которых составлена из п элементов. Снабдим каждый из элементов двумя индексами (номерами): первый индекс— номер строки, в которой расположен этот элемент, второй — номер места, которое он занимает в строке: Яц #12 . . . #1п ] #21 #22 ... #2п I /п\ #77li #7712, • • • #77171 /
/ § 12. Одно свойство суммы 37 Таким образом, элемент ац расположен в таблице (2) в i'-й.строке и /-м столбце, поэтому ai2, например, следует читать «а один два», а не «а двенадцать». Учитывая, что при сложении в X можно произвольным образом группировать слагаемые и изменять их порядок (сложение ассоциативно и коммутативно), вычислим сумму 5 двумя способами. Во-первых, найдем вначале сумму элементов каждой строки таблицы- (2) и затем сложим полученные результаты. Для i=l9 2, ... , т сумма всех элементов t-й строки равна > п j=l Далее п п . п m J n \ s= 2 aij+ 2 a2j+...+ 2 amj= 2 I 2 ац) . (3) Сумма 2 [2an) , i=i \ j=l / фигурирующая в (З), называется двойной. В ней вначале суммирование ведется по индексу / при постоянном I (т. е. вычисляется "сумма, заключенная в скобки), а затем — по индексу i (складываются результаты, полученные в скобках). Во-вторых, для получения суммы s найдем суммы всех элементов каждого столбца таблицы (2) и затем сложим полученные результаты: т. т ж 71 / т \ 5= 2 ац+ 2 ^2+.. •+ 2 ain= 2 ( 2 ацУ . (4) г=1 г=1 г=1 j=l 4=1 ' Сравнивая равенства (3) и (4), находим 2 (2<*ц) = 2 (2^) . (б) г==1 N j=l ' j=l * г=1 ' Равенство (5) означает, что двойная сумма не зависит от порядка суммирования (безразлично, ведется ли суммирование вначале по первому индексу, а затем по второму, или наоборот). Поэтому в записи суммы (5) обычно опускают скобки: - 771 71 2 2 ац. При т=п эту сумму изображают так: п 2 <*г> i. j=i '■■':■■-
38 Глава 2. Группа, кольцо, поле. Гомоморфизмы § 13. Группа Пусть X — непустое множество. Будем рассматривать множество всех подстановок, действующих на X. На этом множестве определена алгебраическая операция —- умножение подстановок, обладающая следующими свойствами: 1) она ассоциативна, 2) существует единица (тождественная подстановка), 3) для каждой подстановки существует обратная подстановка. Аналогичными свойствами обладают, например, множество всех отличных от нуля чисел, множество всех положительных чисел (операция — умножение чисел). Такие множества называют группами. Приведем определение группы. Непустое множество G называется группой, если на нем определена алгебраическая операция, удовлетворяющая следующим трем аксиомам (условиям): 1) эта операция ассоциативна, 2) в G существует нейтральный относительно данной операции элемент, 3) Для каждого элемента множества G в этом множестве существует симметричный элемент. Когда говорят, что G — группа, то всегда имеют в виду определенную алгебраическую операцию, относительно которой множество G является группой. На том же множестве G могут быть заданы и другие алгебраические операции, и относительно каждой из них G может быть, а может и не быть группой. Например, множество всех целых чисел является группой относительно сложения, но не является группой относительно умножения. Алгебраическая операция, относительно которой множество G — группа, называется групповой операцией. Естественно называть групповую операцию умножением или сложением, ибо ей присущи многие формальные свойства умножения и сложения чисел. Группу, в которой операция — умножение, называют мультипликативной. Если же групповая операция — сложение, то группу называют аддитивной. 1. Группу всех подстановок множества X обозначают символом Sym Я и называют симметрической группой множества X. Если X — конечное множество п элементов, то для Sym X употребляют, еще обозначение Sym п. 2. В силу теоремы 3 из § 9 множество всех четных подстановок п чисел также является группой относительно умножения подстановок. Ее обозначают символом Altм и называют знакопеременной группой. 3. Множество всех отличных от нуля вещественных чисел — группа относительно умножения. Это мультипликативная группа вещественных чисел. 4. Множество всех вещественных чисел является группой и относительно сложения. Это аддитивная группа вещественных чисел. 5. Множество всех вращений плоскости вокруг неподвижной точки — группа относительно умножения преобразований. Произведение поворотов
§13. Группа 39 на угол а и на угол р есть поворот на угол а+р. Единицей служит поворот на нулевой угол. Для поворота на угол а обратным является поворот на yrojp, дополняющий а до целого кратного числа 2я. 6. Множество Х={0> 1}—группа относительно операции с таблицей О 1 0 0Л . 1 1 0. Нейтральным элементом этой группы является 0. Каждый из ее элементов симметричен себе. То же множество оказывается группой и относительно другой операции: 0 1 0 10 10 1. Отметим простые свойства групп. Когда мы говорим «свойства группы G», то имеем в виду свойства групповой операции. Само название этой операции (сложение, умножение и пр.), как и соответствующие обозначения, являются просто кодом, языком, на котором мы эти свойства излагаем. И, конечно, утверждение, полученное на одном языке, имеет аналог на любом другом. Мы рекомендуем читателю поупражняться в переходе от одних обозначений к другим. Ниже мы считаем, что G — мультипликативная группа, 1. В группе^лишь одна единица и для каждого элемента есть лишь один обратный элемент. Это свойство непосредственно следует из определения группы и теорем 1 и 2 предыдущего параграфа. Будем обозначать единицу группы буквой е> а элемент, обратный элементу g,— символом g-1. 2. Для.любых элементов g и h группы G каждое из уравнений gx=h (1) и yg=h (2) имеет в G единственное решение: x=g~% y=hg-K (3) ф Если х определяется равенством (3),то Sx=g(g"ih) = (gg-i)h=eh=h, поэтому х — решение уравнения (1). Если, с другой стороны, элемент / группы G является решением уравнения (1), то gf=h^ ir* (*f) = g-*h =* f=g~%
40 Глава 2. Группа, кольцо, поле. Гомоморфизмы поэтому / — единственное решение этог'о уравнения. Доказательство существования и единственности решения уравнения (2) оставлено читателю. Q 3. Для любых элементов g и h группы (gh)-\=h-ig-i. ♦ (gh) (h-ig-i)=g(hh-i)g-i=(ge)g-i=gg-i=e. Аналогично Если групповая операция коммутативна, то группу называют коммутативной или абелевой. § 14. Кольцо В алгебре часто изучают множества с несколькими, например с двумя, алгебраическими операциями. Обычно между этими операциями существуют определенные связи. В этом параграфе мы вводим одно важное понятие алгебры — понятие кольца. Непустое множество К называют кольцом, если на нем определены две алгебраические операции, называемые сложением и умножением, и удовлетворяющие следующим аксиомам. Аксиома сложения: относительно сложения К является абелевой группой. Аксиомы дистрибутивности: умножение дистрибутивно относительно сложения, т. е. для любых элементов k, l и m множества К 1) k(l+m)=kl+km, 2) (l+m)k=lk+mk. По определению кольца относительно сложения множество всех его элементов является группой. Эта группа называется аддитивной группой кольца. 1. Множества всех целых, всех рациональных, всех вещественных чисел (относительно обычных сложения и умножения чисел) являются кольцами. 2. Множество всех полиномов (многочленов) от одной переменной с вещественными коэффициентами — кольцо. 3. Обозначим буквой F множество всех вещественных функций одной переменной. Сумму и произведение функций f n g определим для каждого вещественного числа х формулами (f+g) (х) =f(x)+g(x), fg(x) =f(x)g(x)t т. е. так, как это делается обычно в математическом анализе (здесь вводится новое умножение функций, fg отлично от произведения отображений f и g!). Читатель сам легко убедится в том, что множество F относительно так определенных сложения и умножения является кольцом. Нулем этого кольца служит функция 0(х) =0.
§ 14. Кольцо 41 Кольцо называется коммутативным, если в нем умножение коммутативно, и ассоциативным, если в нем умножение ассоциативно. Все упомянутые выше кольца ассоциативны и коммутативны, примеры некоммутативных и неассоциативных колец возникнут ниже. Рассмотрим простейшие свойства колец. 1. Так как элементы кольца составляют абелеву группу относительно сложения, то 1) в кольце лишь один нуль О, 2) для любого элемента k кольца К в К есть единственный противоположный элемент —k, 3) для любых элементов k и I кольца К уравнение k+x=l (1)' имеет в К единственное решение x=—k-\-l. Решение уравнения (1) называется разностью l—k. Таким образом в кольце определяется вычитание. Непосредственно из определения разности следует, что для любого элемента k кольца k—k=0. * 2. Умножение дистрибутивно относительно вычитания, т. е. для любых элементов k, l и m кольца k(l—m)=kl—km, (l—m)k=lk—mk. ♦ /= (/—m) +m =>- kl=k (I — m) +km =>- kl—km=k (I — m). Первое из нужных равенств доказано, второе получается аналогично, ф 3. Для любого элемента k кольца &0=0&=0. ♦ Так как k—k=0, то kO=k(k—k)=k2—k2=0. Второе равенство доказывается аналогично, ф Утверждение, обратное свойству 3, неверно. В кольце произведение отличных от нуля элементов может быть равным нулю. В кольце F всех вещественных функций одной переменной рассмотрим две функции / и g, определенные условиями: Очевидно, /=И=0, £#0, но fg = 0 (для любого x f(x)g(x)=0). Если в кольце kl=0y a k и / отличны от нуля, то k и / называют делителями нуля. В кольце F функции (2) —делители нуля. В кольце целых чисел нет делителей нуля.
42 Глава 2. Труппа, кольцо, поле. Гомоморфизмы 4. Пусть k — отличный от нуля элемент кольца, не являющий- ся делителем нуля. Если kl=km (3) или lk=mkt (4) то t=m. _ ♦ Из (3) следует kl-7-km=09 k(l—m)=0, /—m=0, l=m. Аналогично для равенства (4). ф 5. Для любых элементов k и I кольца {—k) l=k(—l)= -(*/). ф.kl+(-k)l=*(k+ {—k))Z=0./=D. Поэтому (-k)l=-(kl). Второе равенство получается аналогично. # Существуют кольца с единицей и без нее. Например, в кольце всех целых чисел есть единица/ а в кольце всех целых чисел, делящихся на 2, единицы нет. Однако кольцо не может иметь более одной единицы (см. теорему 1 § 10). Ясно, что существует такое кольцо, в котором содержится лишь один элемент. Например, множество {0}, содержащее лишь число 0, является кольцом относительно сложения и умножения чисел. Если К — произвольное одноэлементное кольцо, а — его элемент, то а является нулем этого кольца. 6. Если кольцо содержит более одного элемента, то в нем нуль не является единицей. Ф Пусть а — произвольный'элемент, 1—единица кольца К и 0=1. Тогда 0-а=1-а, 0=а. Последнее невозможно для любого а, так как в К более одного элемента, ф Единственное исключение, когда нуль и единица кольца совпадают, имеет место, если & этом кольце только один элемент. Пусть К — кольцо с единицей 1. Если для элемента k кольца К в К существует обратный элемент, то k называется обратимым элементом кольца К. 1 сама себе обратна, поэтому 1 — обратимый элемент; 0 необратим, если только 0 не есть 1. Если элемент k обратим, то обратим и элемент kr1 — обратном для него является k. 7. В ассоциативном кольце К с единицей 1 множество К* всех обратимых элементов является группой относительно умножения. ф 1е/С*. Если Ле/С*, то и kr1 обратим, поэтому Наконец, если k^K* и 1^К*9 то рассмотрим произведение Н/г1.
§ 15. Поле 43 Точно так же (/-»£-») (kl) = 1, поэтому . Группу К* называют мультипликативной группой: кольца /С. Для кольца Z всех целых чисел Z*= {1, —1}. § 15. Поле Множество Ру содержащее не менее двух элементов, называют полем, если на нем определены две алгебраические операции, называемые сложением и умножением и удовлетворяющие следующим аксиомам. Аксиома сложения: относительно сложения Р является абелевой группой. Аксиомы умножения: 1) умножение ассоциативно,- 2) в Р есть единица, 3) для каждого отличного от нуля элемента из Р в Р есть . обратный элемент, 4) умножение коммутативно. Аксиома дистрибутивности: умножение дистрибутивно относительно сложения, т. е. для любых элементов р, q и г множества Р p(q+r) =pq-\-pr. Всякое поле является кольцом. Кратко определение поля •можно сформулировать так: поле — это коммутативное и ассоциативное кольцо, в котором все н*енулевые элементы составляют группу относительно умножения. Полями являются множество всех вещественных чисел, множество всех рациональных чисел. Читатель, знакомый с началами теории сравнений, заметят, что множество классов целых чисел, сравнимых по простому модулю, является полем. В поле нет делителей нуля, ф В самом деле, пусть Р — поле, р и q — элементы поля Р, рфО, pq=0. Умножая обе части последнего равенства на элемент рт\ получаем p^{pq)=P'u9> 9=р-1-о. Учитывая соответствующее свойство колец, имеем <7=0. • Так как все не равные нулю элементы поля составляют группу относительно умножения, то 1) в поле лишь одна единица,
44 Глава 2. Группа, кольцо, поле. Гомоморфизмы 2) для любого отличного от нуля элемента поля в этом поле есть единственный обратный элемент, 3) для любого элемента а поля Р и отличного от нуля элемента b из Р уравнение Ьх=а * (1) имеет в этом поле единственное решение x=b~ia. (При афО это свойство группы, при а=0 это следует из соответствующего свойства кольца.) а Решение уравнения (1) обозначается символом — и называется частным элементов а и Ь. Таким образом, в поле определено деление на любой не равный нулю элемент. Отмеченные выше свойства полей и аксиомы, входящие в определение поля, указывают на то, что в поле можно производить следующие четыре операции: сложение, умножение, вычитание и деление — по обычным для арифметики формальным законам (приведение подобных членов, раскрытие.скобок и пр.). § 16. Подгруппа Всюду ниже, если не оговорено иное, мы называем групповую операцию умножением. Пусть G — группа. Непустое подмножество Я множества G называется подгруппой группы G, если оно замкнуто относительно умножения и обращения (взятия обратного элемента}, т. е. удовлетворяет следующим двум условиям: 1) для любых элементов а и Ъ множества Я ab^H, 2) для любого элемента а множества Я а-*^Н. Из этих условий вытекает, очевидно, что ееЯ, где е — единица группы G. Поэтому можно сказать, что непустое подмножество группы G называется подгруппой группы G, если оно является группой относительно групповой операции, определенной в G. Всюду в этой книге запись H^G означает, что Я — подгруппа группы G. Теорема. Пусть Я— непустое подмножество группы G. H^G тогда и только тогда, когда выполняется следующее условие: для любых элементов g и h множества Я gh-i^H. ф Необходимость условия теоремы очевидна. Докажем достаточность. Итак, пусть Я удовлетворяет условию теоремы и ЛеЯ. Тогда e=hh-i(=H, к-*=ек-1<=Н.
§ 17. Смежные классы по подгруппе 45 Если еще ^еЯ, то Доказано, что Я^С ф 1. Для любой группы G сама она и множество {е}, содержащее лишь единицу е этой группы, являются подгруппами. 2. Мультипликативная группа положительных чисел — подгруппа мультипликативной группы всех отличных от нуля чисел. 3. Пусть X — непустое множество, a Sym X — симметрическая группа множества X. Пусть, далее, а — фиксированный элемент множества X. Рассмотрим множество Sa всех подстановок множества X, оставляющих элемент а неподвижным: S(X={ftESymX\f(a)=a}. 5a^Sym X. ♦ В самом деле, eeSa. Далее, если /&Sa, то /(a) = a и потому a=/"_1(a), т. е. Если еще ge=Sa, то fg{a) =f (a) =a, fge=Sa. ф Группу 5a называют стабилизатором элемента а в Sym X. Так же определяется стабилизатор в любой подгруппе симметрической группы. Если G^.SymX, то стабилизатор Ga элемента а в G есть множество Ga=tee=G|g(a)=a}; Ga^G. 4. В § 9 доказано, что множество Alt n всех четных подстановок п элементов— группа относительно умножения подстановок. Следовательно, Altrc^ ^Sym/г. § 17. Смежные классы по подгруппе Пусть G —группа, H^G. На множестве G зададим отношение ~, положив для элементов fug этого множества f~g тогда и лишь тогда, когда g~lf^H. Лемма 1. ~ — отношение эквивалентности. ф Нужно доказать рефлексивность, симметричность и транзитивность рассматриваемого отношения. Рефлексивность. Пусть g — произвольный элемент группы G. Тогда g~ig=e^H, g~g. Симметричность. Пусть fug — элементы группы G uf~g. Тогда g-tf^H и, так как Н — группа, то Транзитивность. Пусть f, g, h — элементы группы G, f~g и g~h. Тогда
46 Глава 2. Группа, кольцо, поле. Гомоморфизмы Следовательно, ,hr*f=?(h-+g)(r*f)i=H, f~h. • Построенное выше отношение эквивалентности ~ определяет разбиение множества G на непересекающиеся классы: в один класс объединяются все элементы, эквивалентные друг другу. Эти классы называют левыми смежными классами группы G по подгруппе Я. Как и всегда, когда мы имеем дело с разбиением множества, два левых смежных класса группы G по подгруппе Я либо не пересекаются, либо совпадают. Группа G представляется в виде объединения попарно непересекающихся левых смежных классов по подгруппе Я. ' Теорема 1. Любой левый смежный класс группы G по подгруппе Я есть множество gH={gh\h^H}, где g— произвольный, но фиксированный элемент этого класса. В частности, для любого элемента h группы Я hH=H, так что подгруппа Я совпадает с одним из классов gH. ф Пусть А -г- левый смежный класс группы G по подгруппе Я, g^A. В А собраны, по определению, все элементы f группы G, эквивалентные элементу g, т. е. такие, что g^f^H. Если g^f= =АеЯ, то f=gh^gH, так что A^gH. С другой стороны, если b^H, c=gb, то g-1*: —6еЯ, с<=Л, поэтому gH^A. Итак, A=gH. Одно утверждение теоремы доказано. Пусть теперь ЛеЯ. Ясно, что hH^H. С другой стороны, для любого элемента а группы Я уравнение a=hx имеет в Я решение, поэтому a&hH, H^hH. Итак, hH=H. • Аналогично левым определяются правые смежные классы группы по подгруппе. Пусть G — группа, Я^С На множестве G зададим отношение ~, положив для элементов fug этого множества f~g тогда и лишь тогда, когда fg-^'H. Лемма 2. ~ — отношение эквивалентности. Доказательство аналогично доказательству леммы 1. Это отношение эквивалентности определяет разбиение множества G на непересекающиеся классы, которые называются правыми смежными классами группы G по подгруппе Я. Два правых смежных класса группы G по подгруппе Я либо не пересекаются, либо совпадают. Группа G представляется в виде объединения попарно непересекающихся правых смежных классов по подгруппе Я.
§ 17. Смежные классы по подгруппе 47 Теорема 2. Любой правый смежный класс группы G по подгруппе Н есть множество Hg={hg\h^H}, где g— произвольный, но фиксированный элемент этого класса. В частности, одним из классов Hg является Н: для любого элемента h группы Н Hh=H. Доказательство аналогично доказательству теоремы 1. .. Если группа G абелева, то, очевидно, всегда gH=Hg. Для произвольных групп аналогичное равенство, вообще говоря, неверно. 1. Пусть Z—аддитивная группа целых чисел, п — фиксированное натуральное число, Н — множество всех целых чисел, делящихся на п. Ясно, что ' H^Z. Два числа а и &'входят в один смежный класс группыZno подгруппе Н тогда и лишьтогда, когда а==6 (mod я). Каждый класс имеет вид а+Н= = {a+h\h^H}. Итак, аддитивная группа Z представляется в виде объединения попарно непересекающихся смежных классов: Z=H{J (1+Я) U (2+Я) у ... U.((*-!)+#). 2. Рассмотрим левые смежные классы группы Sym X по стабилизатору элемента а. Две подстановки а и b входят в один левый смежный класс тогда и только тогда, когда b~l a^Sa> т. е. b~i a(a) = a. Последнее равносильно -4 а(а)=Ь(а). (1) Следовательно, условие (1) необходимо и достаточно для того, чтобы а и b входили в один левый смежный класс группы Sym X по Sa. В частности, Symn=5i(J (1, 2)5i[J ... J (1, 'n)Si есть разбиение на левые смежные классы'группы Sym n по стабилизатору элемента 1. Рассмотрим еще правые смежные классы группы SymX no Sa. Подстановки а и b входят в один правый смежный класс тогда и лишь тогда, когда т. е. a&-i(a)=a, ^(a) =a-1(a). Последнее равенство означает, что подстановки а и b один и тот же элемент переводят в а. Итак, пусть aeSymX, a(P)=a. Тогда класс Saa есть множество таких подстановок 6, что Ь($)=а. Ясно, что, вообще говоря, Saa*aSa. 3. Пусть п>1. Рассмотрим смежные классы группы Sym n по Alt п. Для любой подстановки a a (Alt n) = (Alt n) а. (2) В самом деле, если /eAlt я, то обе части равенства (2) совпадают с Alt п. 5сли же / — нечетная подстановка, то и класс /(Alt n] и класс (Altfi)f-topna-
48 Глава 2. Группа, кольцо, поле. Гомоморфизмы дают с множеством всех нечетных подстановок. Равенство (2) доказано. Вместе с тем доказано, что ' Symn=Alt/i|J(l, 2) (Alt л) есть разбиение на смежные классы по знакопеременной группе. Сделаем еще два замечания о смежных классах, которые используются лозже. Замечание 1. Если F и Н — подгруппы, а а и Ь — элементы группы G, тф ршшшнетше aF = bH (3) равносильно совокупности двух условий: 1) F=H, 2) a-ib<=F. Аналогичное утверждение верно и в случае правых смежных классов (условие 2 принимает вид ba^^F). ♦ Рассмотрим лишь левые смежные классы, для случая правых рассуждения те же. Очевидно, из совокупности условий 1—2 вытекает равенство (3). Обратно, пусть верно равенство (3). Тогда а = ае^ЬН. Следовательно, b~ia^H и, так как Н — группа, a~ib^H. Пусть / — произвольный элемент группы F. В силу равенства (3) в Н есть такой элемент К что af=bh, /=(а-16)/1еЯ. Итак, F^.H. Аналогично доказывается, что H^.F. Следовательно, F=H. Доказано условие 1. Теперь очевидно,* что и условие 2 выполняется, ф Замечание 2. Пусть Н — подгруппа, а — элемент группы G. Если смежный класс аН является подгруппой группы G, то аН=Н. ♦ Пусть aH^G. Тогда е(=аН, а-ь = а-1е<=Н, ае=Н, аН=Н. ф § 18. Нормальный делитель Пусть G — группа, H^ZG. Если для любого элемента g группы G левый смежный класс gH совпадает с правым смежным классом Hgy то Я называется нормальным делителем или нормальной подгруппой группы G. Всюду ниже запись H^G означает, что Я — нормальный делитель группы G. Очевидно, в абелевой группе всякая подгруппа нормальна; для неабелевых групп это, вообще говоря, не так. Теорема. Пусть G — группа, Я — ее подгруппа. Для того чтобы группа Я была нормальной в G, необходимо и достаточно выполнение следующего условия: для любых элементов h из Н и g из G ghr*eH. (1) ♦ Пусть условие (1) выполняется для всех g из G и h из Я.
§ 19. Фактор-группа 49 Тогда ghg~i=hi^H9 gh=hlg<=Hg, gH^Hg. (2) С другой стороны, g-ihg=g-ih(g-i)-i=h2s=H, hg=gh2e=gH, Hg^gH. (3) Сравнивая (2) и (3), получаем gH=Hg (4) для любого g из G. Следовательно, Н< G. (5) Обратно, пусть верно (5). Тогда для любого g из G верно (4). Возьмем в Н произвольный элемент А. Из (4) следует, что в Н есть элемент А4, удовлетворяющий равенству gh=hig. Далее имеем ghtri=hieH. • 1. Для любой группы G сама G и единичная подгруппа нормальны в G. 2. Alt л < Symn (см. равенство (2) из предыдущего параграфа). 3. Если* я >2, то стабилизатор элемента не является нормальной подгруппой в Sym/г. В самом деле, пусть fi=(2, 3), g=(l, 2), Si— стабилизатор элемента 1 в Sym п. Тогда /ieSi, но ghg-*=(\, 3J*S|. Согласно предыдущей теореме, Si не есть нормальная подгруппа. § 19. Фактор-группа Пусть G — группа, Я —- ее нормальный делитель. Рассмотрим произведение смежных классов группы G по Н. По определению произведения подмножеств в группе (^Я)(/Я) = {(^1)(//12)|Л1>Л2еЯ}. Теорема. Множество всех смежных классов группы G по нормальному делителю Н относительно умножения классов является группой. Класс Н служит единицей этой группы. Для класса gH обратным является класс g^H.
50 Глава 2. Группа, кольцо, поле. Гомоморфизмы ф Вначале докажем, что для любых элементов а и Ь группы G (аН)(ЬН) = (аЬ)Н. (I) Пусть {а} — одноэлементное множество, содержащее элемент а. Тогда аН={а}Н. Поэтому (аН) (ЬН) = ({а}Н)({Ь}Н). Далее, учитывая ассоциативность нашего умножения и равенство Hb = bHf имеем: (аН) (ЬН) = {а} {НЬ)Н= {а}(ЬН)Н= {а}{Ь)НН={аЪ)НН. Ясно, что НН=Н. Итак, равенство (1) доказано. Из этого равенства вытекает, в частности, что произведение двух смежных классов группы G по нормальному делителю Я также является смежным классом группы G по Я. Благодаря ассоциативности групповой операции умножение этих классов ассоциативно. Далее, так как Н=еНу то Н(аН) = (еН)(аН) = = (еа)Н=аН. Аналогично (аН)Н=аН. Доказано, "что класс Я— единица относительно умножения классов. (аН) (сг*Н) = (aa-i)Н=еН=Н9 (аг*Н) (аН) =Я, так что аг*Н=(аН)-*. • Группа, о которой идет речь в предыдущей теореме, называется фактор-группой группы G по нормальному делителю Я и обозначается символом G/H. При л> 1 Sym n/Alt n = {Alt n, (1,2) (Alt n)}, причем ((1, 2) (Alt я))2=Alt л. § 20. Гомоморфизмы и изоморфизмы групп Пусть G и Я—группы, а /: G-ДЯ —такое отображение, при котором для любых элементов а и Ь группы G f(ab)=f(a)f(b). (1) Тогда / называется гомоморфным отображением или гомоморфизмом группы G в группу Я. Если гомоморфизм / биективен, то он называется изоморфизмом групп G и Я. Гомоморфизм группы в себя называется ее эндоморфизмом. Изоморфизм группы на себя называется ее автоморфизмом. Если существует изоморфизм групп G и Я, то пишут G^H ц говорят, что группа G изоморфна группе Я.
§ 20. Гомоморфизмы и изоморфизмы групп 51 1. Отображение произвольной группы G в себя, ставящее в соответствие каждому элементу этой группы ее единицу, является, очевидно, эндоморфизмом группы G. 2. Симметрическая группа Symn гомоморфно отображается на мультипликативную группу Z*, если каждой четной подстановке поставить в соответствие число 1, а нечетной — 1. 3. Если G — группа, а Я—ее подгруппа, то вложение i: G-+H — гомоморфизм групп. Отметим простейшие свойства гомоморфизмов групп. 1. G^G для любой группы G, так как тождественное отображение eG — изоморфизм. 2. Если f: G^H — изоморфизм, то и /-*: H^G (2) является изомбрфизмом. ф Для биективного отображения / существует обратное биек* тивное отображение (2). Покажем, что (2) —изоморфизм групп. Нужно доказать, что для любых а и Ь из Н f-i(a6)=f-i(a)f-i(6). (3) Так как / — биекция; то равенство (3) равносильно равенству f(f-i(a6))=f(f-4a)/-46)). . ' (4) Левая часть равенства (4) равна ab. Правая его часть также равна аб, так как / — изоморфизм. Следовательно, равенство (4) верно. Вместе с ним верно и равенство (3). # Таким образом, если G^H9 то и H^Gf так что можно просто говорить, что группы G и Н изоморфны. 3. Если f: F-+G и g: G-+H — гомоморфизмы групп, то и gf: F-+H — гомоморфизм. Если при этом fug являются изоморфизмами, то и gf — изоморфизм. -"' ♦ Для любых элементов а и Ь группы F .gf(ab) =g(f(ab)) = =g(f(a)f(b))=gf(a)gf(b). Доказано, что gf — гомоморфизм групп. Кроме того, произведение биекцйй также биективно, ф 4. Если f: G-*H — гомоморфизм, е — единица группы G, то f(e) — единица группы Н. ф Пусть a^G. Тогда f(a)f(e)=f(ae)=f(a). (5) Так как в группе Н решением уравнения f(a)x=f(a) является только единица, то из (5) следует, .что /(e)—единица группы Н. •
52 Глава 2. Группа, кольцо, поле. Гомоморфизмы 5. Если f: G-+H — гомоморфизм групп и a^G, то f(a-4=f(a)-K + f(a-i)f(a)=f(a-ia)=f(e), (6) f(a)f(a-i)=f(e). (7) Согласно свойству 4, f(e) —единица группы Я, поэтому равенства (6) и (7) указывают на то, что /(а-1) —элемент, обратный элементу f(a). 0 Из свойств 1—3 вытекает, очевидно, Теорема 1. Отношение изоморфизма есть эквивалентность в множестве всех групп. Из этой теоремы следует, что множество всех трупп разбивается на непересекающиеся классы изоморфных групп. Две изоморфные группы могут различаться лишь природой своих элементов, а не алгебраическими свойствами. Грубо говоря, в этих группах «одинаковы операции», нужно только каждый элемент одной из групп заменить его образом при изоморфизме на другую группу. Те свойства, которые могут быть 'выражены в терминах групповой операции, у изоморфных групп одинаковы и, если нас интересуют именно эти свойства, мы можем изоморфные fpynnbi не различать. Легко доказать, что гомоморфный образ группы является группой. Более точно, верна следующая Теорема 2. Пусть G — группа, а Н — непустое множество, на котором определена алгебраическая операция. Назовем эту one-' рацию, так же, как и операцию в группе G, умножением и произведение элементов а' и Ьг множества Н обозначим символом а'Ь'. Если существует такое сюръективное f: G-+H, что для любых элементов а и Ь группы G верно равенство (1), то множество Н относительно указанной операции является группой, a f — гомоморфизмом групп. ф Вначале покажем, что умножение в множестве Я ассоциативно, т. е. для любых элементов а'у Ь', с' этого множества {а'Ь')с'=а'\Ь'с'). (8) Пусть а, Ь, с — такие элементы группы G, что a'=f(a), b'=f(b), c'=f(c).
§ 21. Ядро гомоморфизма групп 53 Тогда (ab)c=a(bc) => f((ab)c)=f(a(bc)) =>f(ab)f(c) = =f(a)f(bc) =► (f(a)f(b))f(c)=f(a)(f(b)f(c)), т. е. верно равенство (8). Далее, если е — единица группы G, то f (e) — единица в Я. Пусть a'<=tf, V=/(a), a^Gt b'=f(cr+). Тогда Ь'=(а')-+. • § 21. Ядро гомоморфизма групп Пусть G и Н — группы, f: G-+H — гомоморфизм, е и е' — единицы групп G и # соответственно. Множество f-4e') = {g^G\f(g)=e'} называется ядром гомоморфизма f и обозначается символом Kerf.* Теорема 1. Ядро гомоморфизма f: G-*H является нормальным делителем группы G. Смежные классы по этому нормальному делителю есть классы элементов, эквивалентных в смысле ядерной эквивалентности Kf (см. § 6). ♦ f(e)=e'> поэтому Kerf=^=0. Далее пусть а и b принадлежат Кег /. Рассмотрим ab-1: f(ab-i)=f(a)f(b-i)=f(a)f(b)-i=e'e'=e', ab-*eK&f. Доказано, что Kerf^G. Пусть теперь а^Кег/, ceG. Тогда f(cac-i)=f(c)f(a)f(c)-i=f(c)e'f(c)-i=e', сас-»е Кег/, Kerf<G. Равенство f(a)=f(b), т. е. условие эквивалентности элементов а и Ь, равносильно равенству f(a)f(b)-i=e', т.е. f(ab-*)=e', a6-»e=Kerf. * Kernel (англ.) — ядро.
54 Глава 2. Группа, кольцо, поле. Гомоморфизмы Последнее означает, по определению, что а и b входят в один смежный класс по Кег f. ф Следствие 1. Пусть f: G-+H — гомоморфизм групп, а и Ь — элементы группы G. Тогда равенство f(a)=f(b) равносильно тому, что а и b входят в один смежный класс группы G по Кег /. Следствие 2. Пусть f: G-+H — гомоморфизм групп, f инъек- тивно тогда и только тогда, когда Кег/={е>. (1) / является изоморфизмом тогда и только тогда, когда верно (1) ulmf=H. ф Для того чтобы каждый класс а Кег f содержал лишь один элемент, необходимо и достаточно выполнение равенства (1). ф Следствие 3. Пусть f: G-+H — гомоморфизм групп, a^G, b=f(a). Тогда f-*(b)=a Kerf. Пусть G — произвольная группа, af — ее нормальный делитель. Рассмотрим отношение R={(a, b)<=G2\b-iat=F}. Мы уже знаем, что R — отношение эквивалентности в множестве G и классы эквивалентных элементов имеют-вид gF (см. § 17). Поэтому множество G/F есть фактор-множество G/R и отображение k: G^G/F, k(g)=gF, ge=G (2) совпадает с каноническим отображением, определяемым эквивалентностью R. Теорема 2. Каноническое отображение (2) является сюръек- тивным гомоморфизмом групп, ядро которого совпадает с F. ф Если а и 6 — элементы группы G, то k{ab)=abF= = (aF)(bF)=k(a)k\b). Сюръективность отображения k очевидна. Остается рассмотреть Кег k. В Кег k собраны все такие элементы с группы G, что k(c) =F. Так как, по определению отображения k, k(c) =cFf то сеКег k тогда и лишь тогда, когда F=cF. Последнее равенство равносильно тому, что с е F. Итак, Kevk=F. ф
§ 22. Теорема о гомоморфизмах групп 55 Гомоморфизм (2) называется каноническим гомоморфизмом групп, определяемым нормальным делителем F. Из двух предыдущих теорем вытекает, в частности, что нормальные делители группы суть ядра ее гомоморфизмов и только они. § 22. Теорема о гомоморфизмах групп Здесь излагается теорема, которая играет большую роль в алгебре. Ее обычно называют «теоремой о гомоморфизмахг групп». Теорема. Пусть f: G->H— гомоморфизм групп. Тогда Imf^G/Kerf, причем существует такой изоморфизм Ь: G/Kerf-Hm/, что диаграмма к •6\ / v где k — канонический гомоморфизм, i — вложение, коммутативна. ф Пусть g Кег/ — произвольный класс, b(gKevf)=f(g). (2) Согласно теореме 1 из предыдущего параграфа, g Кег / есть класс элементов, эквивалентных в смысле ядерной эквивалентности /С/. Поэтому в силу теоремы о каноническом разложении отображения (§6) равенство (2) определяет биекцию b: G/Ker/-Hta/ и диаграмма (1), где Ь — эта биекция, коммутативна. Остается доказать, что Ь — гомоморфизм групп. Пусть g и h — элементы группы G. Так как (g Kerf) (h Кег f) = (gh)Кег/, то ft((ffKerf)(AKerf))=ft((gft)Kerf)=f(^A). s/кег f (1)
56 Глава 2. Группа, кольцо, поле. Гомоморфизмы Далее, так как / — гомоморфизм, f(gh)=f(g)№ И b((gKerf)(hKerf))=f(g)f(h)=b(gKerf)b(hKerf). ф Следствие. Если гомоморфизм f: G-+H сюръективен, то f=bk. ф В этом случае i=e. ф Из теоремы о гомоморфизмах следует, что всякий сюръектив- ный гомоморфизм группы определяется с точностью до изоморфизма своим ядром. , 1. Пусть* G={1, —1}—мультипликативная группа, п — натуральное число, большее 1, f: Symn-vG, при котором каждой четной подстановке соответствует число 1, а каждой нечетной — число —1. Тогда / — сюръективный гомоморфизм групп, Кег f=Alt я и {1, — l}^Sym/z/Alt п. 2. Пусть G и Н — мультипликативные группы соответственно всех* отличных от нуля комплексных и всех положительных вещественных чисел. Поставив в соответствие каждому комплексному .числу его модуль, получим сюръективный гомоморфизм f этих групп. Кег/ есть группа всех комплексных чисел, модули которых равны 1, Я^О/Кег/. § 23. Подкольцо. Идеал. Фактор-кольцо Пусть К — кольцо. Непустое подмножество L множества.К называется подкольцом кольца /С, если оно является подгруппой аддитивной группы К и замкнуто относительно умножения. Иными словами, непустое подмножество L кольца К называется подколь* цом кольца Ку если оно является кольцом относительно операций кольца К. Теорема 1, Непустое подмножество L кольца К является подкольцом в К тогда и только тогда, когда выполняется следующее условие: для любых элементов а и b множества L a—b^L, ab^L. ♦ См. аналогичную теорему о подгруппах (§ 16). # Особую роль в кольце играют подкольца, называемые идеалами. Их роль аналогична роли нормальных делителей в группе. Подкольцо / кольца К называется (двусторонним) идеалом кольца /С, если //fe/ и /С/^/. Теорема 2. Непустое подмножество I кольца К является в К идеалом тогда и только тогда, когда выполняются следующие условия: 1) для любых элементов а и b множества I a—b^l\ 2) для любых элементов а множества I и с кольца К ас^.1 и сае/. Доказательство оставлено читателю. Введем определение фактор-кольца. Пусть К — кольцо, / — его идеал. Относительно сложения множество / является нормальным делителем аддитивной группы К, поэтому можно перейти к фактор-группе К/1. Элементы этой фактор-группы, т. е. смежные классы а+/, называются смежными классами кольца А по идеалу I.
§ 24. Гомоморфизмы и изоморфизмы колец 57 Лемма. Для любых классов а+I и b+I верно включение (a+I)(b+I)<=ab+I. (1) ♦ Пусть c^a+I, d^b+I. Тогда c = a+ii, d=b+i2i it, i2^I; cd=ab+(ai2+iib+iii2). Так как заключенная в скобки сумма является элементом идеала /, то cd^ab+I. # Эта лемма позволяет определить произведение классов а+I и b+I. Произведением классов а+I и b+I называется класс ab+I: (a+I)(b+I)=ab+I. (2) Заметим, что равенство (2) не следует из включения (1). Речь идет просто о новой операции — умножении смежных классов по идеалу /, которая отлична от умножения подмножеств в кольце, даже если эти подмножества являются смежными классами. Из леммы следует, что произведение смежных классов a+I и b+I не зависит от выбора элементов а и b в них, а определяется самими классами. Теорема 3. Множество всех смежных классов кольца К по идеалу I относительно сложения и умножения классов является кольцом. ♦ Относительно сложения рассматриваемое множество является группой — фактор-группой /С//. Согласно равенству (2), произведение .любых двух смежных классов по / есть смежный класс по /. Докажем дистрибутивность умножения классов относительно сложения: (a+I)[(b+I) + (c+I)]=(a+I)[(b+c)+I] = a(b+c)+I= = (ab+ac)+I= (ab+I) (ac+I) = (a+I) (b+I) + (a+I) (c+I). Равенство [(b+I) + (c+I)](a+I) = (b+I) (a+I) + (c+I) (a+I) получается аналогично. # Кольцо, построенное в теореме 3, называется фактор-кольцом кольца К по идеалу I и обозначается символом К/1. § 24. Гомоморфизмы и изоморфизмы колец Пусть К и L — кольца, /: K-+L — такое отображение, при котором для любых элементов а и Ь кольца К f(a+6)=f(a)+/(6), f(ab)=f(a)f(b). (1) Тогда f называется гомоморфным отображением или гомоморфизмом кольца К в кольцо L. Если гомоморфизм f биективен, то он называется изоморфизмом колец К и L. Гомоморфизм кольца в себя называется его эндоморфизмом. Изоморфизм кольца на себя называется его автоморфизмом.
58 Глава 2. Группа, кольцо, поле. Гомоморфизмы Если существует изоморфизм колец К и L, то пишут K^L и говорят, что кольцо К изоморфно кольцу L. Согласно определению, гомоморфизм кольца К в кольцо L — это такой гомоморфизм аддитивных групп этих колец, который сохраняет умножение (образ произведения элементов равен произведению их образов). Поэтому гомоморфизмы колец обладают свойствами, аналогичными изложенным в § 20 свойствам гомоморфизмов групп. Перечислим без доказательств простейшие свойства гомоморфизмов колец. Доказательства (те, которые действительно необходимы) оставляются читателю. 1. Для любого кольца К К=К. 2. Если f: K-+L— изоморфизм колец, то /_1: L-*K—также изоморфизм. Следовательно, если K=L, то Ь^К. 3. Если f: K-+L, g: L-+M — гомоморфизмы колец, то и gf: К~->М — также гомоморфизм колец. Если при этом fug являются изоморфизмами, то и gf — изоморфизм. Из этих трех свойств вытекает Теорема 1. Отношение ^ является эквивалентностью во множестве всех колец. 4. Пусть f: K-*L — гомоморфизм. Если 0 — нуль кольца К, то /(0)—нуль кольца L. Для любого элемента а кольца К /(-а)=-/(а). 5. Пусть К — кольцо с единицей 1, a f: K-+L — изоморфизм колец. Тогда: 1) /(1) — единица кольца L; 2) если а — обратимый элемент кольца К, то f(a) — обратимый элемент кольца L и /(а-») = (Да))-1; 3) если К — ассоциативно (коммутативно), то L также ассоциативно (коммутативно); 4) если К*—мультипликативная группа кольца К, то f(K*) — мультипликативная группа кольца L. Гомоморфный образ кольца есть кольцо. Точнее, верна Теорема 2. Пусть К — кольцо, щ L — множество, на котором определены две алгебраические операции, называемые сложением и умножением. Если f: K-+L — такая сюръекция, что для любых элементов а и Ь кольца К верны равенства (1), то и L — кольцо, af — гомоморфизм колец.
§ 25. Теорема о гомоморфизмах колец .59 § 25. Теорема о гомоморфизмах колец Пусть К и L — кольца, {: K-+L — гомоморфизм колец, 0' — нуль кольца L. Множество /-Ч0') = {аеК|/(а)=0'} называется ядром гомоморфизма f и обозначается символом Кег /. Теорема 1. Ядро гомоморфизма f кольца К в кольцо L является идеалом кольца К. ♦ Kerfт— ядро гомоморфизма аддитивных групп. Поэтому Кег/^/С, и нужно доказать лишь, что Пусть аеКег/, бе К. (Ker/)tfsKer/, ./C(Ker/)sRer/. f(ab)=f(a)f(b)=0'f(b)=(y, (1) поэтому а&еКег/С Первое из включений (1) доказано, второе получается аналогично. # Теорема 2. Пусть К —кольцо, 1 — его идеал. Тогда отображение k: K-+K/I, Ставящее в соответствие каждому элементу а кольца К класс а-\-1, является гомоморфизмом колец и Кег*=/. - (2) ♦ Согласно теореме 2 из § 21, & является гомоморфизмом аддитивных групп К и К/1. Кег k — ядро этого гомоморфизма, поэтому верно равенство (2). Остается доказать, что k сохраняет умножение. Пусть а и b — произвольные элементы кольца К. k(ab) = ab+I= (a+I) (b+I) = k(a)k(b). ф Гомоморфизм, построенный в теореме 2, называется каноническим гомоморфизмом колец, определяемым идеалом I. Из теорем 1 и 2 вытекает, что идеалы кольца — это ядра всех его гомо- \ морфизмов и только они, ч Теорема 3 (теорема о гомоморфизмах колец). Пусть f: K-+L — гомоморфизм колец. Тогда Im/^t/Ker/, причем существует такой изоморфизм b кольца /(/Кег/ на кольцо Imf, что ^диаграмма к К | — *\K/Keif (3) 7/77/ где k — канонический гомоморфизм, i — вложение, коммутативна.
60 Глава 3. Матрицы и определители ♦ Пусть Ь: Я/КегМт/, &(а+Кег/)==/(а). Мы видели в доказательстве теоремы о гомоморфизмах групп (§ 22), что Ь — изоморфизм аддитивных групп /C/Kerf и Imf и диаграмма (3) коммутативна. Остается доказать, что b сохраняет произведение. Так как (fli+Кег /) (a2+Ker /) =aia2+Ker /, то *((fli+Ker/)(a2+Kerf)I=f(flifl2)=/(fli)/(fl2)=. = b(ai+Kerf)b(a2+Kerf). ф Глава 3 МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ § 26. Матрица Пусть К — непустое множество, а m и п — натуральные . числа. Будем рассматривать набор гпп элементов множества К, расположенных в виде прямоугольной таблицы: Гац ai2 ... am a2i агг .. • агп |_aml атп2 • • • йтп Таблица (1) называется матрицей над множеством К или просто матрицей, если из контекста ясно, в каком исходном множестве выбираются составляющие ее элементы. Элемент ац матрицы (1) расположен в ее i-й строке и /-м столбце (занимает позицию i, /). Если матрица (1) имеет m строк и п столбцов, то ее называют mXtt-матрицей (эм на эн-матрицей). В частности, 1X1 -матрица [а] отождествляется с ее элементом а. Для обозначения матрицы (1) употребляется также запись [ctij]. При этом нужно еще дополнительно указать размеры матрицы, т. е. число ее строк и столбцов: [a«j], i=l,2, ...,m, /=1,2,..., л. Если число строк матрицы равно числу ее столбцов и равно /г, то матрица называется квадратной порядка /г. Две матрицы А = [««].■ '=1> 2,..., т, /=1, 2,..... л, (1)
§ 26. Матрица 61 И Я=[Р«], *=1,2, ....ft, /=1,2, ...,/, называются равными, если m=ft, я=/, aij=pt> Другими словами, равенство матриц А и В означает, что размеры их одинаковы и элементы этих матриц, занимающие одну и ту же позицию, равны. Множество К, которому принадлежат элементы матриц, обычно не является произвольным, на него налагаются некоторые условия. Всюду в этой главе (если не оговорено иное) рассматриваются матрицы над некоторым фиксированным коммутативным и ассоциативным кольцом К с единицей 1У которое называется основным кольцом. Множество всех mX^-матриц над кольцом К обозначается символом Km, п. При т=п мы пишем вместо Km, n просто Кп. Например, Г 1 3 21 L -1 0 4 J есть 2ХЗ-матрица над кольцом целых чисел; ее же можно считать матрицей над полем рациональных, или над полем вещественных, или над полем комплексных чисел; m является 2X1 -матрицей над полем вещественных или над полем комплексных чисел; [*2+1 2х+\ 1/2] есть 1ХЗ-матрица над кольцом полиномов с рациональными коэффициентами. Элементы ац, СХ22, • .* > &пп квадратной матрицы Г ОЬц СС12 O&in И I 0C2i OC22 • • • &2n I /0ч |_0&nl &п2 • • • &nn J составляют ее диагональ. Если все недиагональные элементы матрицы (2) равны нулю: <Xij=0 при гф],
62 Глава 3. Матрицы и определители то эта матрица называется диагональной. Для нее употребляется обозначение diag [an, a22, ... , ann]. (3)' Если сверх того все диагональные элементы равны друг другу, то (3) — скалярная матрица. В частности, скалярная матрица diag [!,...,!] = 1 О О 1 О О О О О О О 1 называется единичной и обозначается буквой Е. При желании отметить, что она порядка п, пишут Еп. Треугольной называется тХ^-матрица, все элементы которой, расположенные ниже (выше) диагонали, равны нулю: ОСИ 0&12 О 0С22 Общ 0С2п о о &пп J an a2i О &22 LOCni «n2 О О ССпп J Первую из этих матриц называют верхней треугольной, а вторую — нижней треугольной. Квадратная матрица А вида А = «11 • • Ctfei . . 0 .. 0 .. 0 .. . CCih • OCftft . 0 0 0 0. • 0 . Pu • Рн ;• 0 .. о .. о .. .. p« .. Ри .. 0 . 0 . 0 0 0 . Yu • .. 0 0 0 0 • • Tim 0 0 0 Ymi У mm I называется квазидиагональной. Все ее элементы, кроме, возможно, тех, что расположены на «диагонали», равны нулю. Обозначив [an .. alft 1 рн ... Рн! Гун ... vir, • H- •"• =c ■ ■ • «fti ... afth J |_Pii ... P« J LYml • • • Ym .=Д
§ 27. Сложение матриц 63 запишем матрицу А в виде 7l=diag[S, С, ... , Я]. (4) На диагонали матрицы (4) расположены квадратные клетки B,C,...,D. Например, 1 2 0 1 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 0 11 0 12 = diag п 2 3 1 1 1 2 § 27. Сложение матриц Пусть А=[ац], £=М, t=l, 2, ...,т, /=1, 2, ... , п. (1) Суцмой Л+5 называется такая mX^-матрица [уц], что a*j+pij=Yij, t=l,2, ...,m, /=1, 2 /i. Если Л = [1 2 3], В = [1 0 0], то А+В = [2 2 3]. Отметим очевидные свойства сложения матриц. 1. Сложение матриц ассоциативно и коммутативно, так как оно сводится к сложению элементов основного кольца. 2. тХя-матрица "0 ... 0 Lo ... oj каждый элемент которой равен нулю, называется нулевой и обозначается символом О. Если хотят указать ее размеры, то пишут От, п, или Оп при пг=п. Очевидно, От, п является нулем при сложении матриц в Kmt n> т. е. для любой матрицы А из Kmt n A-\-Umt n = (Jmt п-|-Л=/1. 3. Если А и В — матрицы вида (1) и pij=—а*,, t=l, 2, ... , т, /=1, 2, .... , п,
64 Глава 3. Матрицы и определители то А+В = О, т. е. В=—А—матрица, противоположная матрице А. Таким образом,верна Теорема. Множество Km, n является относительно сложения матриц абелевой группой. 4. Пусть 4 = diag [Аи ..., Am]t *5=diag [Bu ... , Bm] есть квазидиагональные матрицы, причем для i=\> 2, ... , m матрицы А г и В г имеют одинаковые размеры. Тогда, очевидно, i4+B=diag [Ai+Bt, ... , Am+Bml Замечание. В этом параграфе не упоминается об умножении в кольце /С, использовано лишь то, что К—абелева группа относительно сложения. Поэтому все, написанное здесь, останется верным, если вместо кольца взять в качестве К произвольную; аддитивную абелеву группу. § 28. Умножение матриц Пусть Л=[а^] —тХя-матрица, В=[^ц] —■ гсХр-матрица. Произведением АВ называется такая mXP-матрица [yij], что Yij = #ilPlj + ai2P2j + - . . + ainPnj, (1) i=l,2, ... ,m, /=1,2,... ,/?. Таким образом, произведение АВ двух матриц А и В определено тогда и только тогда, когда длина строк матрицы А (т. е. число ее столбцов) равна длине столбцов матрицы В (т. е. числу ее строк). В результате умножения получается матрица АВ, число строк которой равно числу строк матрицы А, а число столбцов — числу столбцов матрицы В. Элемент yij произведения АВ, занимающий позицию I, \, равен в соответствии с формулой (1) сумме всех произведений элементов a,ik i-й строки матрицы А на соответствующие элементы $hj (с тем же k) j-го столбца матрицы В. Говорят, что «при умножении матриц строка первого сомножителя множится на столбец второго». В частности, для квадратных матриц А и В одного и того же порядка п определены оба произведения АВ и ВА. Они также являются матрицами порядка п, но не обязательно АВ^=ВА.
§ 28. Умножение матриц 65 Пример 1. Пусть Тогда Пример 2. -В Я- '-С 3- "-*■ М-С о]- Пример 3. ВЛ не определено. Пример 4. Г1 3 Г 0 2 1 |_1 0 1_ , в= Г 3" -1 2_ , ЛВ = Г2] 0 _d Л==[1 2 3], В = п 2 1 ЛЯ = 8, БЛ = 1 2 3 2 4 6 12 3 Отметим некоторые свойства умножения матриц. 1. Умножение матриц ассоциативно, если только взятые матрицы таковы, что возможно умножение. Более точно, верна Теорема 1. Пусть А, В, С — матрицы. Если одно из произведений (АВ)С9 А (ВС) (2) определено, то второе также определено и верно равенство (АВ)С=А(ВС). (3) ф Пусть, для определенности, существует первое из произведений (2). Тогда существует АВ и А9 В9 АВ9 С и (АВ)С являются соответственно тХ^-, пХр-> "*ХР-> РХ<7- и mXtf-матри- цами. Следовательно, ВС и А (ВС) также существуют и являются соответственно гсХ?- и ^Х?-матрицами. Итак, второе из произведений (2) определено, обе части равенства (3) существуют и являются матрицами одинаковых размеров. Остается доказать, что элементы этих матриц, занимающие одинаковые позиции, равны. Пусть А=[ац]9 B=[fa]9 АВ=[уц], С=[гц]9 (AB)C=[[iij]9 BC=[Vij]9 А(ВС) = \рц].
66 Глйва 3. Матрицы и определители Нужно показать, что \iij=?ih t=U 2, ... , m, /=1, 2, ... , q. (4) Имеем р п \Xij= J£f yikGhj, Tift= JS °b«P/fc, fe=l 1=1 или, так как двойная сумма не меняется при изменении порядка суммирования (см. § 12), Аналогично №= JS an \ 1Z frkbhj) . (5) п п I р \ Ptj= JS OLnyij= 2 OLil I j£ filhZhj I . 1=1 1=1 4=1 ' Сравнивая последнее равенство с равенством (5), получаем (4).'# Индуктивно определяется произведение AtAz ...Ah конечной последовательности Аи Л2, ... , Ak (6) матриц. Если (6) — такая последовательность матриц, что существуют произведения AiA2, А2А3,... , Ak-iAh, то для f«—3,..., k положим ЛИ2... Лг— (AtA2... Ai~i)А{. С помощью индукции и теоремы 1 легко получить равенство (Ai ... Ai) (Л*+1 ...Ah) =Ai... AiAi+i. ..Ак для любого натурального числа t, меньшего k. Теорема 2. Если А — myji-матрица, то
§ 28. Умножение матриц 67 В частности, для квадратной матрицы А порядка п ♦ Пусть А = [ац], АЕп=[^]. Тогда P*j = «ii 0+. • . + aij-l O+aij l + OCfj 0 + . . . + «tn 0 = «ij, т. •. АЕп=А. Второе из доказываемых равенств получается аналогично, ф 2. Умножение матриц дистрибутивно относительно сложения, т. е. верна Теорема 3. Пусть А и В — матрицы одинаковых размеров. Тогда: 1) если С — такая матрица, что определено произведение АС, то определены ВС и (А+В)С и верно равенство (А+В)С=АС+ЪС; (7), 2) если С — такая матрица, что определено произведение С А, то определены С В и С(А+В) и верно равенство С(А+В)=СА+СВ. (8) ф Пусть определено произведение АС. Тогда Л, В и А-\-В являются тХя-, а С — nXp-матрицами. Следовательно, АС, ВС и (А+В)С — mXp-матрицы. Пусть Л=[аъ], B=[P<j], А+В=[уц]9 С=[вч], (Л+Я)С=[^], ЛС=|>г;], SC=[Pij], ЛС+ЯС=[т«]. Для доказательства равенства (7) нужно показать, что |**i=Tii, t=l, 2, ... , m, /=1, 2, ... , p. (9) Имеем m m m m ft=2 ft=l Равенство (9) (и с ним (7)) доказано. Доказательство равенства (8) оставляется читателю. #
68 Глава 3. Матрицы и определители Теорема 4. Множество Кп относительно сложения и умножения матриц является ассоциативным кольцом с единицей Еп. ф Сумма двух матриц из Кп и их произведение принадлежат Кп. Относительно сложения Кп — абелева группа. Умноже-, ние матриц ассоциативно и дистрибутивно относительно сложения. (Далее см. теорему 2.) ф Пусть A = diag[Au ... , Am], B=diag[Bb ... , Bm], причем для i= 1, ... , m клетки Ai и Bi имеют равные порядки. Тогда AB=diag[AlBu,.. , AmBm]. Доказательство оставлено читателю. § 29. Умножение матрицы на элемент основного кольца Пусть А = [ац]^Кт, n, ta=/(. Произведением КА называется такая /пХ^-матрица [Pij], что, ръ=Яа^, i=l, 2, ... , т, /=1, 2, ... , п. Очевидны следующие свойства определенного выше умножения. 1. Если X и \i — элементы кольца К, а А —матрица, то (K\i)A=K(iiA)y Ck+\i)A=XA+\iA. 2. Если А — матрица, то 1 -А =А. 3. Если X — элемент кольца К, а А и В — матрицы одинаковых размеров, то \(А+В)=ХА+ХВ. 4. Если К — элемент кольца К, а А и В — такие матрицы, что определено произведение АВ, то Х(АВ) = (ХА)В=А(Щ. 5. Если i4=diag[a, ... , a] — скалярная матрица порядка п, то, очевидно, А = аЕп. Пусть В^Кп. В силу свойства 4 АВ=(аЕп)В=Еп(аВ)=аВ, ВА=В(аЕп) = (аВ)Еп=аВ.
§ 30. Полином от матрицы 69 Таким образом, скалярная матрица порядка п перестановочна с любой квадратной матрицей того же порядка: (аЕп)В = В(аЕп). 6. Если A = diag[Au ..., Am], X^K, то, очевидно, M = diag[Mi, ... , Um]. § 30. Полином от матрицы Пусть f(x) =a0+aiA:+.. .+amxm есть полином с коэффициентами из кольца /С, А^Кп. Значением полинома f(x) при х=А, или просто полиномом f(A), называют матрицу . a0£n+aH+.. .+атЛ™. Если ТО f(A) ^Л2+^2 = -^2+£2=02. Из свойств сложения и умножения матриц и умножения матрицы на элемент основного кольца следует, что сложение и умно* жение полиномов от матриц одного и того же порядка производится по_ тем же правилам, что и сложение и умножение полиномов от х (приведение подобных членов, вынесение за скобки общего множителя и др.). Нужно только при этом помнить, что нельзя менять порядок сомножителей, ибо умножение матриц некоммутативно. Прямыми вычислениями проверяется, что если f(x) и g(x) — полиномы над кольцом К h(x)=f(x)g(x), r(x)=f(x)+g(x), s(x)='kf(x), X&K, А —квадратная матрица над кольцом К, то верны следующие равенства: 1) h(A)=f(A)g(A)y 2)r(A)=f(A)+g(A), 3) *(А)=ЩА). ф Докажем первое из этих равенств, а доказательства двух ^других оставим читателю. Пусть ; " f(x) =a0+ai^-f• • :+amX™, g(x) =Po+M+- • -+PM Тогда h (х) =yo+Yi^+. • -+Ym+^m+z,
70 Глава 3. Матрицы и определители где для k=0, 1, ..., m+l yh= £ a^Pi (правая часть последней формулы означает сумму.всех таких произведений a*Pj, что i+j=k). Далее f(A)=a0E+aiA+.. .+amA™, g(A) =p0£+Pi/l+.. .+р,Л', /(Л)^(Л)=а0Ро£+(аоР1+а1ро)Л+.. .+am$iAm+l= =Yofi+Tii4+...+Ym+^w+/=A(A). • В частности, полиномы от одной матрицы перестановочны, T.e.f(A)g(A)=g(A)f(A). Если f(x) — полином, a A = diag[Au ..., Лш], то f(A)=*iag[f(Ai),...,f(Am)). Доказательство очевидно. Рассмотрим множество К [А] всех полиномов от квадратной матрицы А с коэффициентами из кольца /С. Из равенств 1) и 2) следует, что отображение /: К[х\-+К[А\ переводящее каждый полином f(x) в f(A), является сюръек- тивным кольцевым гомоморфизмом. Следовательно, К [А] относительно сложения и умножения матриц является кольцом. По теореме о гомоморфизмах К[А]&КМ/КегЛ Кег/ есть идеал кольца К[х], совпадающий с множеством всех таких полиномов /(*)> что /(Л)=0 (аннулирующий матрицу А идеал). § 31. Транспонирование матрицы Назовем транспонированием матрицы такое ее преобразование, при котором строки этой матрицы делаются ее столбцами с теми же номерами. Операцию транспонирования обозначим символом т. Так, если А = [an 0С21 ОС12 0&22 0&2п (i) _0&тп1 0^m2 • • • &mn_j то транспонированная матрица Ат имеет вид [an ai2. CCin a2i агг «2n ami am2 amn J
§ 32. Определитель 71 Верны следующие утверждения. 1. Если А и В — такие матрицы, что произведение АВ определено, то определено также произведение ВТАТ и верно равенство ВТАТ=(АВ)Т. (2) 2. Если А и В — матрицы одинаковых размеров, то ЛТ+5Т=(Л+5)Т. 3. Если А — матрица, a % — элемент основного кольца, то Я(ЛТ) = (Ы)Т. + 1. Пусть А имеет вид (1). Тогда В, АВ, (ЛВ)Т, Лт и 5Т являются соответственно /гХ/?-, mXp-, pXm-> riYjn- и рХ^-мат- рицами. Следовательно, ВТАТ определено и является /?Хт-матри- цей. Пусть В=[Ь,], AB=[yii], (ABy=[y'i}], Л*=[а'..], В^Щ], BMT=[8jj]. Нужно доказать, что eij=vV *=1>2, ...,р, /=1, 2, ...,m. (3) Имеем Равенство (3) (и (2)) доказано. Доказательства утверждений 2 и 3 оставляются читателю, ф Матрица А называется симметрической, если АТ=А. § 32. Определитель В этом параграфе вводится понятие определителя квадратной матрицы. Каждой квадратной матрице А над кольцом К описанным ниже способом ставится в соответствие элемент кольца /С/ который называется определителем матрицы А. Пусть А=[ац], ij=l9 2, ... , п, (1) есть квадратная матрица над кольцом /С. Рассмотрим все произведения элементов этой матрицы, взятых по одному из каждой строки и каждого столбца. Всякое такое произведение содержит п
72 Глава 3. Матрицы ii определители сомножителей и может быть записано в виде aiji a,2j2 • • • anjn, (2) где /ь Ы • • • у in (3) является перестановкой чисел 1> 2/... , п. Произведение (—l)'-aiji-a2j, ... anjn, (4) где t — число инверсий в перестановке (3), назовем членом определителя матрицы А. Каждый член (4) определителя матрицы А зависит- от выбора соответствующей перестановки (3) и определяется этой перестановкой. Член (4) совпадает с (2), если перестановка (3) четная, и имеет противоположный знак, если (3) — нечетная перестановка. Характер четности числа инверсий в перестановке (3) совпадает с характером четности подстановки (,' ? ■•■ ,")■■ <5> поэтому можно считать в формуле (4) /=0, если (5) —четная подстановка, и t=l9 если эта подстановка нечетная. Два члена (4) определителя матрицы А считаются различными, если соответствующие им перестановки (3) не совпадают. (Таким образом, различные члены определителя могут оказаться равными элементами кольца К.) В качестве (3) может быть взята произвольная перестановка чисел 1, 2, ... , я, поэтому число различных членов определителя матрицы А равно п\ Так как количество четных перестановок заданных чисел равно количеству нечетных перестановок этих чисел, то одной половине членов определителя приписывается знак «плюс», а другой — «минус». Элемент кольца /С, равный сумме JS .(— 1)' «ijiOtew ... a>njn (6) ib fat •••. in всех членов определителя матрицы Л, назовем определителем матрицы А. То, что перестановка (3) стоит под знаком суммы, означает, что суммирование распространяется на все перестановки (3), т. е. на все члены (4) определителя, t в (6) — переменная величина, равная числу инверсий в соответствующей перестановке (3). Таким образом, (6) есть сокращенная запись суммы всех п\ чле- яо'в определителя матрицы Л.
§ 32. Определитель 73 Определитель матрицы А будем обозначать символом | А |, или deti4,* или detfaij], или an ai2 СХ21 0&22 am 0S2n Для я=1 Если я=2, то Для п=3 det[aii]=a,ii. оси ai2 0С21 агг = an a22— oci2a2i. осц ai2 ai3 0C21 CX22 CX23 OC31 G&32 CC33 = аца22азз+ai2a230&3i+ai3*X2i 0&32— cXi30C220C3i— — ai2a2l0&33—aH 0^23^32- ' Для некоторых матриц специального вида можно вычислить их определители, исходя непосредственно из определения. Ниже указаны два таких примера. 1. Определитель диагональной матрицы равен произведению всех ее диагональных элементов. 2. Определитель треугольной матрицы равен произведению всех ее диагональных элементов. В общем случае вычислять определители, пользуясь только их определением, трудно и нецелесообразно. Уже при вычислении определителя матрицы пятого порядка пришлось бы искать 120 его членов. Поэтому для вычисления определителей используют приемы, основанные на их свойствах. Условимся вначале о терминологии. Определитель матрицы гг-го порядка будем называть определителем п-го порядка. Будем говорить о строках и столбцах определителя, имея в виду строки и столбцы соответствующей матрицы. ' Будем говорить, что мы 1) умножаем строку определителя на Я, если каждый элемент этой строки мы умножаем на Х\ .* determinare (лат.) — определять.
74 Глава 3. Матрицы и определители 2) складываем две строки определителя, если мы складываем соответствующие (т. е. стоящие в одном столбце) элементы этих строк; 3) прибавляем к i-й строке определителя его k-ю строку, если мы заменяем i-ю строку суммой i-й и k-ik строк; 4) составляем линейную комбинацию строк определителя, если каждую i-ю строку умножаем на элемент А,г- кольца К и складываем полученные строки; при этом некоторые Хг могут быть равными нулю и в линейную комбинацию войдут не все строки. Наконец, будем говорить, что i-я и k-я строки определителя пропорциональны, если одна из них получается из другой умно* жением на некоторый.элемент X кольца К. Рассмотрим теперь простейшие свойства определителей. Нас будут интересовать два вопроса: условия равенства определителя нулю, с одной стороны, и, с другой, некоторые преобразования матрицы, которые не меняют ее определителя или же подвергают его легко обозримым изменениям. 1. Определитель матрицы не меняется при ее транспонировании. ф Пусть Л— матрица вида (1). det Л есть сумма всех членов (4), где /=0, если подстановка (5) четная, и t=\, если эта подстановка нечетная. Рассмотрим det Лт. Элементы оыу,, о^, ... , anjn расположены в разных строках и в разных столбцах матрицы Лт, поэтому любой член det Л является с точностью до знака и членом det Л*", й, обратно, любой член deMT с точностью до знака является яленом det Л. Таким образом, det Л и deMT — суммы, соответствующие слагаемые которых различаются, возможно, лишь знаками. Если и знаки этих слагаемых совпадают, то det Л = det Лт. , (7) Возьмем произвольный член (4). Знак соответствующего члена в det Лт определяется характером четности подстановки ll 2 ... J" (8) Но (5) и (8) — подстановки одного характера четности. Равенство (7) доказано, ф В силу свойства 1 все утверждения, которые мы сейчас докЬ- жем для строк определителя, верны и для его столбцов. 2. Если все элементы какой-либо строки определителя — нули, то определитель равен нулю. ф Пусть i-я строка определителя состоит из нулей. Так как в каждый член определителя должен войти множителем некото-
§ 32. Определитель 75 рый элемент i'-й строки, то все члены определителя равны нулю и, следовательно, сам определитель равен нулю. # 3. Если матрица В получается из матрицы А после перестановки двух каких-либо ее строк, то det B =—det Л. (9) ♦ Пусть матрица В получена из матрицы Л в результате перестановки k-и и 1-й строк. Произвольный член det Л имеет вид (4), где t — число инверсий в перестановке (3), а произвольный член det В имеет вид (—1)* aiji a2j2 ... ccnjn, (10) где 5 — число инверсий в той перестановке, в которую транспозиция (kt I) переводит перестановку (3). Числа s и t разных характеров четности, поэтому члены (4) и (10) различаются знаками: (—IJ'ttij! ... anjn= — (— l^aijt .... anjn- (И) Отсюда вытекает равенство (9). ф 4. Определитель, содержащий две одинаковые строки, равен нулю.* ♦ Пусть k-я и 1-я строки матрицы Л совпадают, det Л есть сумма всех членов (4). Наряду с каждым из членов (4) соответствующий член (10) также является членом det Л, причем в силу равенства (11) сумма этих двух членов равна нулю. Таким образом, все п\ членов нашего определителя разбиваются на пары и сумма членов, входящих в одну пару, равна нулю. Следовательно, det А=0, # 5. Общий множитель всех элементов произвольной строки определителя можно вынести за знак определителя. ♦ Пусть Л — матрица вида (1), а В — та матрица, которая получается после умножения какой-либо строки матрицы Л, например первой, на элемент X кольца К Сравним определители матриц Л и 5. Каждый член det В содержит элемент Xaijt первой строки и отличается от соответствующего члена det Л лишь множителем К. Вынеся этот множитель из det В за скобки, получим detfi=^deM. • 6. Определитель, содержащий две пропорциональные строки, равен нулю. * Это свойство есть очевидное следствие предыдущего, если рассматриваются определители, элементами которых являются'числа. Однако мы имеем дело с определителями над произвольным коммутативным й ассоциативным кольцом с единицей. В этой ситуации свойство 3 не очевидно.
76 Глава 3. Матрицы и определители + Вынеся за знак определителя общий множитель элементов соответствующей строки, получим определитель, у которого две строки одинаковы. Он равен нулю согласно свойству 4. ф 7. Пусть А — матрица вида (1), k — фиксированное натуральное число, l^k^.n, В, С и D — матрицы, которые получаются из А после замены ее k-й строки соответственно строкой Pi, Й, • • . , Pn; Ti, V2, . . . , Уп\ Pi+Yb P2+Y2, . . . , Pn+Yn. Тогда detD=det 5+det С. ф Для простоты обозначений будем считать k=l. Произвольный член det D имеет вид (— 0 * (Pit+Vii) a2i2 • • • «njn-и есть сумма (—1)* pjt a2j2 ... anjn-b(— 1)' Yii «г,-, .... <tnjn (12) соответствующих членов det В и det С. Сумма всех первых слагаемых из (12) есть определитель матрицы Ву вторых — определитель матрицы С, ф 8. Определитель не меняется от прибавления к какой-либо его строке другой строки, умноженцой на произвольный элемент кольца К. + Новый определитель di есть сумма двух слагаемых — исходного определителя d и определителя с пропорциональными строками. Последний равен нулю, поэтому di=d. ф Повторно применяя свойство 8, можно получить следующее свойство. 9. Определитель не меняется от прибавления к какой-либо его строке линейной комбинации других его строк. 10. Если какая-либо строка определителя есть линейная комбинация других его строк, то определитель равен нулю. ♦ Если i-я строка определителя d есть линейная комбинация других его строк, то, вычитая из i-й строки подходящую линейную комбинацию других строк, мы обратим все элементы i-й строки в нуль. Полученный определитель равен нулю. Но он равен d в силу предыдущего свойства, ф Свойства 4 и 6 являются частными проявлениями свойства 10. Применение указанных простейших свойств определителей облегчает их вычисление. Б следующих примерах будем считать К кольцом целых чисел. Пример 1. Вычислить 11111 1 2 3. I 1 3 6 | Решение. Вычитая из третьей строки определителя вторую, а затем из второй — первую, получим 11111 0 12. 0 13
§ 33. Миноры и их алгебраические дополнения 77 В этом определителе из третьей строки вычтем вторую: Следовательно, данный определитель равен единице. Пример 2. 1 1 0 о 1 1 0 1 1 2 1 13547 13647 28423 28523 13547 100 28423 100 = 100 13547 1 2S423 1 = 100(13547-28423) = -1 487 600. § 33. Миноры и их алгебраические дополнения Пусть В — матрица порядка /г, k — натуральное число, не превосходящее п. Выберем в матрице В k произвольных строк и столько же произвольных столбцов. Из всех тех элементов матрицы В, которые входят одновременно в выбранные строки и в выбранные столбцы, сохраняя их взаимное расположение относительно -друг друга, составим матрицу порядка k. Определитель этой матрицы называется минором порядка k матрицы В. Обозначим этот минор буквой М. Если k<n, то из элементов матрицы В, не попавших ни в выбранные строки, ни в выбранные столбцы, также сохраняя их взаимное расположение, составим матрицу порядка п—k. Ее определитель обозначим символом Mi и назовем дополнительным минором к минору М. Минор М является, в свою очередь, дополнительным к Mi. • Минорами первого порядка матрицы В являются ее элементы. Дополнительными к ним служат миноры порядка л—1. Единственным минором порядка п является detB, к нему нет дополнительного минора. Часто, допуская вольность речи, говорят «минор определителя». Всегда при этом имеется в виду минор соответствующей матрицы. Говорят также «минор М расположен в матрице В (или в det В) в строках с номерами t'i, fe, ... , ik 0) ив столбцах с номерами Ну /2, (2) вместо слов «матрица, определителем которой является по определению минор М, расположена в матрице В в строках с номерами (1) и в столбцах с номерами (2)».
78 Глава 3. Матрицы и определители Итак, пусть минор М расположен в матрице В в строках с номерами (1) и в столбцах с номерами (2). Сумму всех чисел (1) и (2) обозначим буквой 5. Произведение (-l)-Aft обозначим буквой А и назовем алгебраическим дополнением минора М в матрице В (или в det В). Пример 1. й=\ац\, i, /=•!, 2, 3, 4; М = <*21 «23 аз! азз ,М1 = ai2 au CU2 044 Пример 2. d= 12 3 4 0 12 3 1111 12 3 4 ; М= 12 3 1 0 1 2 1 1 1 | A = -Mi. Mi = 4, A = Mi. Пример З. В определителе предыдущего примера М= Mi = A = Mi. Членом алгебраического дополнения А назовем член минора Mi, умноженный на (—I)5. Лемма. Пусть d — определитель порядка п, М — его минор порядка k, k<n, A—алгебраическое дополнение минора М в определителе d. Произведение любого члена минора М на любой член алгебраического дополнения А есть член определителя d. ф Рассмотрим сначала тот случай, когда минор М расположен в левом верхнем углу определителя d\ т. е. в строках с номерами 1, 2, ... , k (3) и в столбцах с теми же номерами. Тогда дополнительный к нему минор Mi занимает правый нижний угол, т. е. строки и столбцы с номерами • ft+1, ... , п. (4) В этом случае s=2(l+2+.. .+&)—четное число и, значит, алгебраическое дополнение Л минора М совпадает с дополнительным минором М^ Произвольный член минора М имеет вид (—1)* aijta2i2 ... <XkjK, где /i, /2, ... , jh — некоторая перестановка чисел (3), а t — число инверсий в ней. Произвольный член алге-
§ 33. Миноры и их алгебраические дополнения 79 браического дополнения А имеет вид (—1)г аь+i j ... anjn, где jk+u • • • , in (5) есть некоторая перестановка чисел (4), а г — число инверсий в перестановке ih+i—k, ... , in—k, (6) ибо элемент, расположенный в определителе d в /-й строке и т-ы столбце, при l>k и m>k входит в минор Mt и занимает в нем (/—к)-ю строку и (m—k)-u столбец. Очевидно, перестановки (5) и (6) содержат одно и то же число инверсий (если правильным расположением при подсчете количества инверсий в (5) считать (4)). Рассмотрим произведение этих членов: (—1)<+г спи ... aftikaft+i ih+i ... an*n. (7) Так как все элементы ami, входящие, в произведение (7), расположены в определителе d в разных строках и разных столбцах, то это произведение совпадает с одним из членов d с точностью до знака. Соответствующий член определителя d имеет знак (—1)9, где q — число инверсий в перестановке /i, ... , /'*, ik+u ... , tn. В этой перестановке jm<ii, поэтому q=t+f- Значит, произведение (7) — член определителя d. В рассматриваемом частном случае лемма доказана. Перейдем к общему случаю. Предположим, что минор М расположен в строках с номерами (1) и в столбцах с номерами (2). Будем считать ii<f2<.. .<*"*, /i</2<.. .</V Передвинем минор М в левый верхний угол определителя d следующим образом." Переставим t'i-ю строку определителя с (ti— 1) -й, затем с (ti—2)-й и т. д., пока она не займет место первой строки. При этом.мы произведем £±—1 транспозиций строк определителя. Точно так же будем поднимать fc-ю строку до тех пор, пока она не займет место второй, для этого мы произведем йг-2 транспозиций строк. Аналогичным образом поднимем вверх все строки, входящие в минор ЛГ, и передвинем влево все входящие в него столбцы. В результате мы придем к новому определителю du который получается из определителя d после /транспозиций строк и столбцов, t=(h-l) + (k-2)+...+ (ih-k) + + (h-1) + (/2-2) +...+ (ik-k) = ,=5—2(1+2+.. •+£), s=h+.. .+И-/1+. • •+/*. Поэтому di=(—\)s d.
80 Глава 3. Матрицы и определители Минор М расположен в левом верхнем углу определителя du а минор Mi — в правом нижнем. Выше уже доказано, что произведение MMi есть сумма нескольких членов определителя rfi. Следовательно, произведение (—-1)3ЛШ! есть сумма нескольких членов определителя d. Но ■(—l)'MMi=MA9 где А—алгебраическое дополнение минора М в определителе d.% . Теорема Лапласа. Выделим в определителе d порядка п k произвольных строк, k<.n. Определитель d равен сумме произведений всех миноров порядка k, содержащихся в выделенных строках, на их алгебраические дополнения. ф Пусть Ми •.. , Mt — все миноры порядка kt содержащиеся в отмеченных строках, а Аи ... , At — их алгебраические дополнения в определителе d. Рассмотрим сумму АМ4+.. .+MtAt. (8) Каждый ее член, являющийся произведением члена минора М{ на член алгебраического дополнения Л*, есть, в силу предыдущей леммы, член определителя d. Легко видеть, что любые два члена суммы (8) различны, т. е. существует элемент а# определителя d, входящий в один из них и не входящий в другой. С другой стороны, каждый член Ъ определителя d с точностью до знака есть произведение cf некоторого члена с одного из миноров-Af*-и члена / алгебраического дополнения А\. Согласно предыдущей лемме, и знаки члена Ь и произведения cf совпадают. Отсюда следует, что (8) есть сумма всех членов определителя d, т. е. равна d. ф Так как определитель не меняется при транспонировании, то теорема Лапласа верна и в применении к столбцам. § 34. Некоторые методы вычисления определителей 1. Разложение определителя по элементам строкц или столбца Положим в теореме Лапласа k=\ и применим ее к первой строке определителя d=det[a<j], t,/=1,2, ... , п. (1) Обозначив символом Ац алгебраическое дополнение элемента ctij,
§ 34. Некоторые методы вычисления определителей 81 получим d=aiiAii+ai2Ai2+.. .+атАт — разложение определителя d no элементам первой строки. Аналогично, применяя теорему Лапласа к строке определителя d с номером t, получим разложение определителя d no элементам i-й строки. Применив теорему Лапласа к /-му столбцу определителя d, разложим его по элементам j-го столбца: d=aij4ij+a2ji42j+-. .-f-anji4 nj. (2) Разложение определителя порядка п по элементам строки (столбца) позволяет свести его вычисление к вычислению п определителей порядка п— 1. Пример 1. d= 12 3 0 1112 2112 2 2 2 5 +3 1 1 2 2 1 1 2 2 2 5 2 2 5 1 1 2 1 2 1 2 2 5 1 1 2 1 2 2 2 2 5 -2 1 1 2 | 2 1 2 2 2 5 :-1. + Особенно удобно разлагать определитель по элементам строки, если в ней много нулей. - Поэтому полезно предварительно преобразовать определитель, используя свойство 9, так, чтобы в какой-либо его строке стало как можно больше нулей. Однако этот метод не всегда целесообразен — вычисления часто оказываются весьма громоздкими. Пример 2. Определитель примера 1 можно вычислить так. Вычитая из третьей строки вторую, получим d= Вычтем теперь из третьей строки удвоенную вторую: 12 3 0 1112 10 0 0 2 2 2 5 = 2 3 0 1 112 2 2 5| d= 12 3 0 1 1 2 0 0 1 =
82 Глава 3. Матрицы и определители Пример 3. Вычислить определитель d= 2 2-11 4 3-12 8 5-34 3 3-22 Решение. Из второй строки определителя d вычтем удвоенную первую строку: ' 2 2-1 1 0-1 10 8 5-3 4 3 3-2 2 d= Прибавим ко второму столбцу последнего определителя третий столбец и затем разложим полученный определитель по элементам второй строки: d= Из третьего столбца последнего определителя вычтем удвоенный второй и затем разложим полученный определитель по элементам третьего столбца: 2 1 0 0 8 2 3 1 -1 1 1 0 -3 4 -2 2 = — 2 111 8 2 4 3 1 2 | d=- 2 1 8 Й 3 1 -1 (,) 0 — 8 2 1 3 1 1 =2. Пользуясь разложением определителя по элементам столбца, выведем одно соотношение, которое используется далее. Заменив /-й столбец определителя (1) столбцом Pi, p2, ... , Рп (3) произвольных элементов кольца /С, получим определитель СХц ... O&ij-i Pi O&ij+i . . . O&in dj= OCnl • • • OCnj—1 Pn G&nj+i • Разложим его по элементам /-го столбца: ОСпп dj— ^j piAij. г=1 (4) Применим теперь разложение (4) к тому случаю, когда в качестве столбца (3) берется k-и столбец определителя d, кф\. В этом случае определитель dj содержит равные столбцы, и из
§ 34. Некоторые методы вычисления определителей 83 разложения (4) следует г=1 (5) Для Л=1, 2, ..., /г, /=1, 2, ... , п введем символ 6^-, положив: 6^=1, если k=j, 6fcj=0, если кф]. 8kj называют символом Кронекера. Используя символ Кронекера, соотношения (2) и (5) объединим в одно: *£ aikAij=8kjd. Аналогично для строк J£J a,jiAki=Sjkd. г=1 (6) 2. Вычисление определителей по теореме Лапласа Иногда бывает удобно применить для вычисления определителя теорему Лапласа в общем виде. Пример 4. an au OLhl •.. dhh 0 ... О Clfc+l 1 • • • Oft+i h Ctft + i л + i . . . dh+l n ani an a*i CLnh . aiA CLhh an h+i OLk + i k + l • • • OLh + l n an h+i a nn 3. Приведение определителя к треугольному виду Мы уже отмечали, что треугольный определитель равен произведению всех его диагональных элементов. Иногда бывает удобно преобразовать определитель к треугольному виду.
84 Глава & Матрицы и определители Пример 5. d= 1 -г -1 -1 -1 2 0 -2 -2 -2 3 .. 3 .. 0 .. -з .-. -3 .. п-1 п-1 п-1 0 . -(п-1) п п п п 0 Прибавляя первую строку к каждой из других, получим d= 1 0 0 0 2 3 . 2 6 . 0 3 . 0 0 . п . 2л . 2п п \ =п!. 4. Вычисление определителей с помощью рекуррентных формул Пример 6. Обозначим символом dn определитель порядка п вида 2 1 0 0 0 1 2 1 0 0 0 1 2 0 0 0 . 0 . 1 . 0 . 0 . .. 0 . 0 . 0 . 2 . 1 0 0 0 1 2 (7) Пусть вначале п>2. Разложив dn по элементам первой строки, получим dn=2dn-i- 1 0 0 0 0 1 2 1 0 0 0 . 1 . 2 . 0 . 0 . . 0 . 0 . 0 . 2 . 1 0 0 0 1 2 (8) где символом dn-i обозначен определитель вида (7) порядка п— 1. Второй определитель порядка п— 1, входящий в формулу (8), разложим по элементам первого столбца. Тогда получим dn = 2dn -dn- (9) В формуле (9) определитель dn порядка п выражается через имеющие такой же вид (т. е. вид (7)) определители dn-i и dn-2 соответственно порядков п-Ч и л—2. Такого рода формулы, т. е. формулы, в которых определитель порядка п выражается через один или несколько определителей такого же вида меньших порядков, называют рекуррентными. Пользуясь рекуррентной формулой, легко вычислить определитель по индукции. Вычислим сначала определители, входящие в правую часть формулы (9): di = det[2]=2, d2= 2 1 1 2 = 3.
§ 34. Некоторые методы вычисления определителей 85 Из формулы (9) тогда получим: d3=2d2—di=4. Предположим теперь, что равенство di=i+\ (10) верно для всех натуральных is^n— 1, и вставим в формулу (9) вместо dn-i и dn-2 их выражения из (10): .dn=2/i— (п—1)=п+1. Так как при п^2 равенство (10) действительно имеет место и так как из справедливости этого равенства для i^n—l следует его справедливость для i=n, то равенство (10) верно для всех натуральных п. Пример 7. Рассмотрим определитель порядка я, я ^2, вида 1 а4 at2 di*-1 1 a2 . a22 . а2п-* . 1 On an2 . an71"1 (11) Его первая строка есть 1, ... , 1, ва второй строке расположёны произвольные элементы ai, a2, ... , an основного кольца, в третьей — их квадраты, в четвертой— кубы и т. д. Определитель. (11) называется определителем Вандер- монда. Обозначим его символом V(ait a2, ... , an). Вычтя поочередно из каждой строки этого определителя, начиная с последней, предыдущую строку, умноженную на at, получим V(ait a2, ... , an) = 1 1 0 a2—at 0 ► a22—ata2 ctn—cti ;n2—aictn 0 а2" -aiajj7' -aianr Последний определитель разложим по элементам первого столбца: V(at, a2, ... , an) = a2—ai a22—aia2 an—ai a 2 aia2 а2л -ai^7" a»T -aianT Вынося за знак определителя из первого столбца a2—ai, из второго as—ai,..., из последнего an—at, получим 1 ... 1 V(alt а2, ... , an) = (a2—ai) ... (an—ai) а2 а22 а2п- ая аЛ2 ann- (12) Определитель порядка л—1, входящий в равенство (12), есть определитель Вандермонда V(a2, ... , an)/так что формулу (12) можно переписать в виде следующей рекуррентной формулы: V(ait a2, ..., an) = (a2—at) ... (an—at) V(a2, ... ,-On).
86 Глава 3. Матрицы и определители Пользуясь этой формулой и индукцией, легко показать, что V(au a2, ... , ап) = = (а2—ai) (а3—ai).. .(ап—аА) (а3—а2).. .(аЛ—а2).. .(ал—an-i). Итак, определитель Вандермонди равен произведению всех разностей a,—aj, i>/. Если основное кольцо К является полем, то из равенства нулю произведения следует равенство нулю какого-либо из сомножителей. Поэтому верно следующее необходимое и достаточное условие равенства нулю определителя Вандермонда. Пусть ab a2, ... , an (13) есть элементы поля. Определитель V(ai, a2, ... , an) равен нулю тогда и лишь тогда, когда среди элементов (13) есть равные. Из приведенных примеров видно, что в отдельных случаях определитель порядка п просто выражается через определители меньших порядков того же вида. Если есть простая рекуррентная формула, то определитель можно вычислить с помощью этой формулы и индукции. § 35. Определитель произведения квадратных матриц Здесь мы докажем важную для нас. теорему об умножении определителей. Теорема. Определитель произведения двух квадратных матриц одного и того же порядка равен произведению определителей этих матриц. + Пусть * А=[ац]9 Д=[Мэ U 1=1 2, .. ссмотрим определитель d= оси ... ащ 0 ... 0 G&nl • • • &пп 0 ... 0 — 1 ... 0 Ри ... Рт О -1 р ni Рпп порядка 2/г. По теореме Лапласа 'd=deMdetB.' п. (1) (2) С другой стороны, преобразуем определитель (1) так, что на местах, занимаемых элементами а^, получатся нули. С этой целью к его первой строке прибавим (/г+1)-ю," умноженную на an, (/г+2)-ю, умноженную на ai2, .. .\ (2га)-ю, умноженную на am.
§ 36. Обратная матрица 87 В полученном определителе первые п элементов первой строки будут нулями, а п других элементов этой строки станут такими: п п п 2 aljPib JS «liPi2, . . . , JS aijPjn. Аналогично для каждого i=2, ... , и к i-й строке определителя d прибавим (п+1)-ю, умноженную на ац9 (я+2)-ю, умноженную на осгг, ... , (2/г)-ю, умноженную на а*п. Тогда i-я строка примет вид . п п п О, ... , О, J£ aijPji, 2 aZjPj2, ... , 2 aijPjn- i—i j=i j—i После этих преобразований получим 0 . -1 . 0 . . 0 . ' 0 . 0 . -1 Vii •• Vnl •• Pll .. Pnl • . • Tin 1 . Упп • Pin Pnn где [уц]=С=АВ. Вычислим определитель (3) по теореме Лапласа: d=det С(—1)я(—1)и*ь..+2п= (— l)2n(n+i) det C=det С. Сравнивая последнее равенство и (2), получим det Л det 5=det Л 5. # § 36. Обратная матрица В этом параграфе изучается мультипликативная группа кольца /Сп. Теорема 1. Матраца А из кольца Кп обратима в Кп тогда и лишь тогда, когда det А — обратимый элемент кольца К. ф Пусть А=[ац]е=Кп и det A=d — обратимый элемент кольца К. Обозначим символом Aij алгебраическое дополнение элемента аг;- в определителе мат-
88 Глава 3. Матрицы и определители рицы Л и покажем, что матрица ГЛи Л2А ... Am о л_1 I ^12 ^22 "•• ^™2 обратна матрице А. Для этого нужно доказать, что АВ=ЕУ ВА=Е. (2) Пусть ЛВ=[р^]. Тогда п Учитывая формулу (6) § 34, получим $ij=d-i(8ijd) =8ц. Таким образом, Рн=1, р^=0 при 1Ф]\ АВ=Е. Второе равенство (2) доказывается аналогично. Итак, ■B=A~-i. Доказано, что если det Ле/С*, то в Кп существует Л-1. Обратно, пусть А — обратимая в кольце Кп матрица, т. е. существует обратная ей матрица Л-1: А-+А =Е, det (ЛИЛ) =det E=\. Так как определитель произведения матриц равен произведению их определителей, то из последнего равенства получаем det Л det(i4-1) = l. Это равенство означает, что det Л — обратимый элемент кольца К и (det-Л) -*..== det (Л-*). Таким образом, если матрица Л обратима в кольце Кп, то ее определитель обратим в кольце К. # Из этой теоремы вытекает, очевидно, Следствие. Мультипликативная группа кольца Кп есть множество всех матриц из Кп> определители которых входят в мультипликативную группу кольца К. Для наших целей особенно важны два частных случая, когда кольцо К является полем и когда К — кольцо полиномов над
§ 36. Обратная матрица 89 полем. Сформулируем теорему 1 лрименительно к этим специальным случаям. ■ v Квадратная матрица над полем называется невырожденной, если ее определитель не равен нулю. Так как мультипликативная группа поля совпадает с множеством всех его ненулевых элементов, то верна Теорема 2. Для квадратной матрицы А над полем существует. над этим полем обратная0 матрица тогда и лишь тогда, когда матрица А невырождена. Если А — невырожденная матрица, то матрица А-^ задается формулой (1), Пусть теперь К=Р[х] — кольцо полиномов, от одной переменной х над полем Р. При умножении полиномов их степени складываются, поэтому в кольце К обратимы лишь отличные от нуля элементы поля Р, Следовательно, верна Теорема 3. Пусть А — квадратная матрица над кольцом по- линомов Р[х], где Р — поле. Для матрицы А существует над кольцом Р[х] обратная матрица тогда и только тогда, когда del А — отличный от нуля элемент поля Р, Если матрица А-1 существует, то она задается формулой (1), Пример. Г2 5 7-1 6 3 4 1. |_5 -2 -3J Найти Л-1 над кольцом целых чисел. Решение. 2 5 71 , deU = 3 4 -2 -3 = —18—84+100—105+16+90= — 1. —1 -^— обратимый элемент кольца целых чисел, так что существует над этим кольцом матрица А~К Вычислим алгебраические дополнения элементов в А: Ац=* 3 -2 Azi = - /hi = 4 -3 5 -2 5 7 3 4 = -1, Л12 = - 7 -3 = 1, А22 = = —1, Аз2 = — 4 -3 7 -3 7 I 4 =38, = -41, А2 = 34, Л33 = 3 -2 ш 2 5 5 -2 = -27, =29, = -24. Согласно формуле (1), г х -1 ч 1= -38 41 -34 . L 27 -29 24 J
90 Глава 3. Матрицы и определители § 37. Крамеровские системы линейных уравнений Понятие определителя возникло в связи с решением системы ликейных уравнений и используется при решении и исследовании таких систем. Пусть Р — произвольное поле, а тп и п — натуральные числа. Рассмотрим совокупность m уравнений -г aii*i+ai2*2+.. .+ain *n=Pi, 1 0&21 *i + a22 *2+- . .+*<X2n #n = P2> I /« ч 0tmi^i-b0Cm2-^2"t~' • --{"СХтп^л = Рт, } где a,ij9 Pi — элементы поля Р, а Xi, X2, ... , #п (2) есть неизвестные. Эта совокупность называется системой линей- ных уравнений над полем Р с неизвестными (2). ац называются коэффициентами системы (1), рг— свободными членами. Матрица А=[,ац], t=l,2, ...,m; /=1,2, ... , я, называется основной матрицей системы (1) (или просто матрицей системы (1)). Последовательность (Ки Яг, ... , %п) (3) п элементов поля Р называется решением системы (1), если после подстановки в каждое из уравнений (1) вместо неизвестных (2) соответствующих элементов Ки i=l, 2, ... , /г, это уравнение превращается в верное равенство. Система (1) называется совместной, если она имеет хотя бы одно решение, и несовместной — в противном случае. Если Р — поле вещественных чисел, то решением системы 2*i+*2=0 является каждая пара (а, —2а), где а — произвольное число, система же 2xi+2x2=l несовмесхна. Система линейных уравнений над полем называется краме- ровской, если в ней число уравнений совпадает с числом неизвестных и определитель ее матрицы не равен нулю.
§ 37. Крамеровскир системы линейных уравнений" . 91 Пусть (1)—крамеровская система. Тогда т=п. Определитель det A=d называется определителем системы (1). Введем обозначения Х= Г Xi " хг \—Хп __ \ в== Г Pil Р2 L-РП j и рассмотрим уравнение АХ=В с неизвестной матрицей-столбцом X. Матрицу |_Лп J над полем Р назовем решением уравнения (4), если АС=В есть верное равенство. Вычислим произведение АХ: АХ= ац ai2 ... ain J 0&21 0С22 • • • 0&2n 1 _аЛ1 CXn2 • • • &nn J *i *2 L«^n ац #i+ai2 *2+- • .+&in #n a2i *i+a22 *2+. . .+cx2n *n (4) (5) |_ani^iH-an2^2+. • .+ocnn#n J Отсюда и из определения равенства матриц вытекает, что С — решение уравнения (4) тогда и лишь тогда, когда (3) — решение системы (1). Так что вместо системы (1) можно решать уравнение (4). Пусть верно равенство (5). Поскольку det Л =7^=0, то над полем Р существует матрица Л-1. Умножив обе части равенства (5) слева на матрицу Л-1, получим С=А-*В. (6)
92 Глава 3. Матрицы и определители Следовательно, если уравнение (4) имеет решение С, то С определяется равенством (6), так что уравнение (4) имеет не более чем одно решение. С другой стороны, А (А-*В) = (AA-i)B=EB=B, так что матрица А~*В является решением уравнения (4). Доказано, следовательно, что уравнение (4) имеет единственное решение W C=A-iB= Так как Л-*=бН ' An Л21 А\2 Am L^in *2п где Ац — алгебраическое дополнение элемента otij в определителе d9 то. h=d-i(Aii$i+A2ifc+. .:+Апфп). (7) В равенстве (7) в скобках написано разложение по элементам i-го столбца определителя du который получается из определителя d после замены в нем t-ro столбца столбцом свободных членов. Поэтому Хг=-у, 1=1,. 2, ... , П. (8) Таким образом, доказана Теорема Крамера. Крамеровская система (1) имеет единственное решение. Это решение можно вычислить по формуле (8). Пример 1. Пользуясь теоремой Крамера, решить системы 2*— t/+3z=9, 3*—Ъу+ г=—4, 4х—7у+ z—5 2*1+2*2— *з+ *4=4, 4*1+3*2— *з+2*4=6, 8*1+5*2—3*з+4*4 = 12, 3*1+3*2—2*3+2*4=6. Основное поле — поле вещественных чисел.
§ 37. Крамеровские системы линейных уравнений 93 Решение. Рассмотрим определитель первой системыГ 2 3 4 -1 3 -5 1 -7 1 = -7 -1 4 14 0 2 0 - 7 1 =0. Следовательно, первую систему нельзя решить, пользуясь теоремой Крамера. Рассмотрим определитель d= 2 2 -1 1 4 3—12 8 5-34 3 3-22 ■торой,системы. Этот определитель вычислен в § 34, d=2, система является крамеровской. Вычислим определители rfi = 4 6 2 6 2 3 5 3 -1 1 -1 2 -3 4 -2 2 ,. d2 = 2 4 8 3 4 6 12 6 -1 -1 -3 -2 1 2 4 2 ♦ d3 di= -1 1 -1 2 -3 4 -2 2 =2 = -2 -1 -1 -1 1 -1 2 -2 2 =2 — 2 3 -1 2 2 4 1 4 3 6 2 8 5 12 4 3 3 6 2 -1 1 -1 2 0 0 = d2= d*= 2 4.-11 4 6-12 0 0-10 3 6-22 == — 2 4 11 4 6 2 3 6 2| —2(-l)=2, 2 4 1 0-2 0 3 6 2 = 2 2 1 3 2 =2, 2 2 0 1 4 3 0 2 8 51 2 4 3 3 0 2 = 2 2 2 1 4 3 2 1 3 3 2 = 2 2 2 1 1 0 0 3 3 2 = -2 2 * 3 2 = -2. Неизвестные *i, *2 и х3 найдем по теореме Крамера: di dz -d% d d d Для вычисления неизвестной Хк нет необходимости рассматривать определитель, можно найти *4 из первого уравнения: *4 = 4—2*i—2*2+*з==4—2—2—1 = — 1. Итак, вторая система имеет единственное решение (1, 1, —1, —1). Замечание. Теорема Крамера останется в силе, если вместо основного поля взять ассоциативное и коммутативное кольцо К с единицей. В этом случае ^ определении крамеровской системы вместо неравенства определителя нулю рледует требовать, чтобы определитель был обратимым элементом кольца К.
94 Глава 3. Матрицы и определители § 38. Элементарные преобразования матрицы Пусть Л — матрица над ассоциативным и коммутативным кольцом К с единицей. Элементарными преобразованиями строк матрицы А называют следующие операции: 1) умножение строки матрицы А на обратимый элемент кольца /С; 2) прибавление к одной строке матрицы другой ее строки, умноженной на произвольный элемент кольца К. Аналогично определяются, элементарные преобразования столбцов матрицы. Отметим некоторые свойства элементарных преобразований. 1. Если матрица В получается из матрицы А в результате применения к А одного элементарного преобразования, то и А получается из В в результате применения к В одного элементарного преобразования. ф Рассмотрим элементарные преобразования строк, для столбцов рассуждения аналогичны. Если матрица В получается в результате умножения какой-либо, например первой, строки матрицы А на обратимый элемент А, кольца /С, то, очевидно, умножив первую строку матрицы В на Аг1, мы получим матрицу А. Далее, пусть матрица В получается в результате прибавления к первой строке матрицы А второй ее строки, умноженной на элемент р, кольца /С. Тогда, прибавив к первой строке матрицы В ее вторую строку, умноженную на — р, мы получим матрицу Л. # Если матрица В получается из матрицы А в результате применения к А одного или нескольких элементарных преобразований строк или (и) столбцов, то говорят, что матрица А эквивалентна матрице В и пишут А ~ В. Очевидны следующие свойства. 2. Если матрица А эквивалентна матрице В, то и В эквивалентна Л. 3. Каждая матрица эквивалентна себе. 4. Если А~В иВ~С,тоА~С. Из свойств 2—4 следует, что эквивалентность матриц удовлетворяет определению отношения эквивалентности. 5. Если матрица В получается из матрицы А в результате перестановки ее строк или (и) столбцов, то А~В. ♦ Рассмотрим лишь перестановку строк матрицы, для столбцов рассуждения аналогичны. Так как любую перестановку строк можно осуществить, последовательно применив несколько подходящих транспозиций, то достаточно лишь доказать, что с помощью цепочки элементарных преобразований можно поменять местами любые две строки матрицы. Но переставить строки
§ 38. Элементарные преобразования матрицы 95 с номерами i и / можно, например, следующей цепочкой элементарных преобразований: 1) к i-й строке прибавим /-ю, 2) из /-й строки вычтем t'-ю, 3) к 1-й строке прибавим /-ю, .4) /-ю строку умножим на —1. # Квадратная матрица Q над кольцом К называется элементарной, если она одного из следующих двух видов: 1') Q=diag[l,..., а, ... , 1] —диагональная матрица, одним из диагональных элементов которой является произвольный обратимый элемент а кольца /С, все другие диагональные .элементы равны 1; ^) все диагональные элементы матрицы Q равны 1, все ее недиагональные элементы равны 0, кроме одного, который равен произвольному элементу кольца /С. Теорема. Применение к строкам (столбцам) матрицы элементарного преобразования равносильно умножению ее слева (справа) на подходящую элементарную- матрицу. ф Пусть, для определенности, Г1 р 0 . 0 1 0. . 0 0 1. |_0 0 0 . . 0 . 0 . 0 . 1 является квадратной матрицей порядка m, A=[aij]—myji- матрица. Тогда Госи+Ра21 ai2+Pa22 •.. ain+P^2n~] Г> а I #21 а22 • ♦ • 0&2п I L O&mi CXm2 • • • G>mn J Таким образом, умножение матрицы А слева на матрицу Q равносильно прибавлению к первой строке матрицы А второй ее строки, умноженной на элемент р. Продолжение доказательства очевидно и оставляется читателю. # Следствие. Если пСуСп-матрицы А и В эквивалентны, то существуют такие матрицы С в Km и D в Кп, что B=CAD. (1)
96 s Глава 3. Матрицы и определители + В силу предыдущей теоремы B=PS... PiAQi... Qu где Pi и Qj — подходящие элементарные матрицы. Положив 'p8...Pi=C, Qi...Qt=D, получим равенство (1). Определитель каждой элементарной матрицы является обратимым элементом основного кольца, поэтому и det С и det D — обратимые элементы кольца /С. Следовательно, для матриц С и D существуют обратные. # § 39. Элементарные преобразования матриц над полем В этом параграфе рассматриваются матрицы над произвольным полем Р. В соответствии с определением из предыдущего параграфа, элементарными преобразованиями строк (столбцов) матрицы А называют следующие операции: 1) умножение строки (столбца) матрицы Л на отличный от нуля элемент поля Р\ 2) прибавление к строке (столбцу) матрицы А другой ее строки (столбца), умноженной на произвольный элемент поля Р. Матрица вида 0 . 0 . 0 . . 0 . 0 . 0 [ «lit • 0 . 0 .. ajj2 .. • • | «2j2 • .. 0 . . CtijH • ■ ■ • 0C2jh " • • • | OCftj* • • • an» . CC2n • CCftn где .0 ... 0 0 0 0 0 Otiji» CX2J2, ••• , О>кэкФ0> а все элементы, расположенные левее нарисованных вертикальных или ниже нарисованных горизонтальных линий, равны нулю, называется ступенчатой. Так, [~1 2 З] Г'1 2 О] ro , j 2, П 2] Hi 1 . чл_1. Iо '-от J.. ;ц I 0 0| _1_ I I 0 0 0J L I—' I 0 0[. есть ступенчатые матрицы.
§ 39. Элементарные преобразования матриц над полем 97 Нулевая матрица также называется ступенчатой. Теорема 1. Всякая матрица с помощью элементарных преобразований строк может быть, приведена к ступенчатому виду. ф Пусть А — тХ^-матрица. Воспользуемся индукцией по т. При т=1 А является ступенчатой. Пусть т>1. Если Л = 0, то она ступенчатая. Пусть Л=[а^]—ненулевая матрица и j\ — номер ее первого из содержащих ненулевые'элементы столбцов. Изменив, если нужно, посредством элементарных преобразований строк порядок строк матрицы Л, поставим отличный от нуля элемент ее /-го столбца в первую строку. Итак, можно считать, что aiji^O. Прибавляя теперь к i-й строке матрицы ее первую строку, умноженную на — а^и <Xijiy i=2, ... , m, приведем эту матрицу к виду ГО ... О I 0 ... О 0 p2ji+i • •. Ргп I / * v L 0 ... О 0 Pmji+l . . • $mn J или при ш=2 к виду ГО ... О otij! ... ащ] [О ... О 0 ... Ргп J" Матрица (2) ступенчатая. Рассмотрим матрицу (1). Матрица |P2ji+i • • • Ргп 1 LPwji+l • • • Pmn J либо уже имеет ступенчатый вид, и тогда (1) — ступенчатая матрица, либо, согласно индуктивному предположению, может быть приведена с помощью элементарных преобразований строк к ступенчатому виду. Применив такие же элементарные преобразования к строкам матрицы (1), не затрагивая ее первой строки, приведем к ступенчатому виду матрицу (1). ф Следствие. Пусть А — невырожденная квадратная'матрица порядка п. Тогда с помощью элементарных преобразований строк матрицу А можно превратить в матрицу Е.п. Применяя те же элементарные преобразования в том же порядке к строкам матрицы Еп, получим матрицу А-*. ■■ . ♦ Элементарными преобразованиями строк приведем матрицу А к ступенчатому виду. Так как при этом det-4 может лишь умножаться на отличные от нуля элементы поля Я, то полученная матрица В невырожденная и, следо-
Глава 3. Матрицы и определители ' вательно, не содержит нулей на диагонали. Поэтому Г Pll Pi2 • • • Pin ~] В=\ ° Р22 •;• Р2* , рг^о, /=1,2, ... [_ о о ... pnn J Умножая 1-ю строку матрицы В на Рй1, *= 1,2 л, получим матрицу "1 Yi2 О 1 Yin Y2n О О 1 Теперь, прибавив к каждой строке этой матрицы (исключая первую) каждую из последующих строк, умноженную на подходящий элемент основного поля, получим единичную матрицу. Первое утверждение теоремы доказано. Согласно теореме из § 38, Еп=Ра .../М, где Ри *=1, ••• , 5,— элементарные матрицы. Из этого равенства следует, что A-*=Ps ...PiEn, т. е. Л-1 Получается из матрицы Еп после тех же элементарных преобразовании строк, что и Еп из матрицы А. # Пример. Найти описанным выше способом матрицу Л-1, если [2 7 31 3 9 4 1 5 3J над полем вещественных чисел. Решение. Запишем рядом строки матриц Л и Es: [2 7 3 1 0 01 3 9 4 0 10, 1 5 3 0 0 lj Строки полученной матрицы подвергнем элементарным преобразованиям. Изменим порядок строк: 5 3 0 2 7 3 1 3 9 4 0 [1 5 3 0 О 1"| 2 7 3 10 0 1. 3 9 4 0 1 0 J Из второй строки вычтем удвоенную первую, а из третьей — утроенную первую: [1 5 3 0 0 11 0-3-310-2 I. 0 -6 -5 0 1 -3 J
§ 40. Решение системы линейных уравнений исключением неизвестных 99 Из третьей строки вычтем удвоенную вторую, затем вторую строку разделим на —3: 15 3 0 0 11 0 1 1 -1/3 0 2/3 . 0 0 1-2 1 1 J Из первой строки вычтем вторую, умноженную на 5, и прибавим удвоенную третью: П 0 -2 5/3 0 -7/ЗП Г1 0 0 -7/3 2 -1/3] 0 1 1 -1/3 0 2/3 — 10 1 1 -1/3 0 2/3 . LOO 1-2 1 lj LO 01-2 1 lj Из второй строки вычтем третью: Г1 0 0 -7/3 2 -1/3"] 0 10 5/3-1 -1/3 . Lo 0 1 — 2 1 1 J Итак, [-7/3 2 -1/3 I 5/3 -1 -1/3 . - 2 1 1 J § 40. Решение системы линейных уравнений способом исключения неизвестных Теорема Крамера дает формулы для выражения решения системы линейных уравнений через ее коэффициенты и свободные члены. Однако фактически вычислять значения неизвестных по этим формулам неудобно, так как для этого пришлось бы вычислить п+1 (или хотя бы п) определителей порядка п. Кроме того, теорема Крамера применима только к крамеровским системам. В этом параграфе рассматривается другой способ решения систем линейных уравнений — способ последовательного исключения неизвестных, (способ Гаусса). Этот способ применим к произвольной системе линейных уравнений. Две системы линейных уравнений с п неизвестными называются эквивалентными, если множества их решений совпадают. Это значит, что либо обе эти системы совместны и решение каждой из них служит и для другой решением, либо они несовместны. Теорема. Пусть ОЬИ #l-f-0&12 *2+- • - + ОС1п *n = Pi, | Ctmi-Ki-f-am2#24~' . . -f- (Xmn^m = Pm J
100 Глава 3. Матрицы и определители есть произвольная система линейных уравнений над полем Р. Если к одному из уравнений этой системы прибавить другое, умноженное на. некоторый элемент поля Р, или если обе части какого-либо из уравнений этой системы умножить на один и тот же отличный от нуля элемент поля Р, то получится система, эквивалентная системе (1). ф Прибавим, для определенности, к первому уравнению системы (1) второе, умноженное на элемент ц поля Р: (aii+|ia2i)Xi+.. .+(ain+[xa2n)*n = Pi+fiP2, ) 021*1+... +<X2n*n=p2, I /Qv «ml#l + . • . +amn#n =pmr ) Пусть (*i, ** ■. ■ , K) (3) есть решение системы (1). Тогда Otll ^1+« • « + CXin ХЛ = Рь «21 A»'i+. . . + «2n Xn = p2» 0tmlA»i + . . +0tmnAn — Pm являются верными равенствами. Прибавив к первому из них второе, умноженное на \х, получим (aii+|i«2i)^i+.. .+ (ain+|ia2n)A,n=Pi+|xP2, | 0&21 ^1 + . • • + 0&2n ^n = P2, I /Ач Otml^l+. • • +0Cmn^n = Pm- J Так как (4) —верные равенства, то (3) —решение системы (2). Таким образом, если система (1) совместна, то всякое ее решение есть решение системы (2). Система (1) также получается из системы (2) прибавлением к первому уравнению второго, умноженного на элемент поля Р, поэтому всякое решение системы (2), если оно есть, является решением системы (1). Доказана эквивалентность систем (1) и (2). Продолжение доказательства оставлено читателю. #
§ 40. Решение системы линейных уравнений исключением неизвестных 101 Матрица Гац «21 Lami ai2 .. ОС22 . . 0&m2 • • O&in . a2n (X>mn Pi "1 p2 Pm J составленная из коэффициентов и свободных членов системы (1), называется расширенной матрицей системы (1). Из предыдущей теоремы вытекает, очевидно, Следствие. Пусть матрица В получена из расширенной матрицы Л системы линейных уравнений (1) в результате применения элементарных преобразований строк. Тогда система линейных уравнений, для которой Б является расширенной матрицей, эквивалентна системе (1). Если 1-я строка расширенной матрицы системы линейных уравнений (1) является линейной комбинацией других ее строк, то говорят, что i-e уравнение системы (1) является линейной комбинацией других уравнений этой системы. Лемма. Если из системы линейных уравнений (1) устранить уравнение, являющееся линейной кбмбинацией других ее уравнений, то полученная система будет эквивалентна системе (1). ф Пусть, например, последнее уравнение системы (1) есть линейная комбинация предыдущих уравнений. Прибавляя к нему подходящую линейную комбинацию предыдущих уравнений, приведем последнее уравнение к виду 0;*i+0-a:2+. . .+0.Xn=0. (5) Полученная система уравнений эквивалентна системе (1). С.другой стороны, уравнение (5) можно устранить, ибо оно не накладывает каких-либо ограничений на решения системы, ф Рассмотрим способ решения систем линейных уравнений, который называется способом исключения неизвестных (способ Гаусса). При определении системы линейных уравнений не накладывается никаких ограничений на ее коэффициенты. В частности, все коэффициенты могут оказаться равными нулю. Если при этом и свободные члены„равны нулю, то, очевидно, решением Системы является любая последовательность п элементов поля Р. Если же хотя бы один из свободных членов отличен от нуля, то система
102 Глава 3. Матрицы и определители несовместна. Всюду далее рассматриваются только такие системы, среди коэффициентов которых есть отличные от нуля. Обратимся снова к системе уравнений (1). Подвергнув строки ее расширенной матрицы подходящим элементарным преобразованиям, приведем эту матрицу к ступенчатому виду. Если при этом обнаружится, что какая-либо строка является линейной комбинацией остальных, то опустим ее. Таким способом устраним все лишние строки. Полученную в результате матрицу обозначим символом В и рассмотрим систему линейных уравнений, для которой В является расширенной матрицей. Мы уже знаем, что эта система эквивалентна системе (1). Если матрица В содержит строку вида 0, ... , 0, б, где 6=^0, то соответствующая система линейных уравнений несовместна, так как в нее входит уравнение O-Xi-f 0'*2+. . .+0-хп=б, и, следовательно, несовместна система (1). Ниже мы исключаем этот случай. Поэтому либо В имеет вид Я= Tit Yi2 0 V22 Yin 6i. Угп бг Упп On Л , УиФО, *=1,2, ... , Д, , либо В содержит меньше, чем я, строк. В последнем случае без ограничения общности можно считать, что В= (мы могли бы, если нужно, перенумеровать неизвестные). Рассмотрим соответствующие системы линейных уравнений: Til Yl2 ... Ylm ... 0 Y22 ... Y2m ... 0 0 ... ymm ... i^=0, t=l,2, ... ,m, Ym 6i "1 Y2n 62 Ymn 6m J m<n Yli*i+Yl2*2+. . .+Yln*n=6i, 722*2+'. . .+Y2n*n = 62, УппХп — On» ) Yll*ii+Yl2*2+. . .+Yim*m+. • -+Yin *n=^6i, Y22*2+. • ,+У2тпХт+. • -+Y2n *n = 62, УпътХт-\-* • .-f-Ymn#n = 6m. / (6) (7)
§ 40. Решение системы линейных уравнений исключением неизвестных 103 Легко видеть, что система (6) имеет единственное решение. Мы найдем его, если из последнего уравнения вычислим хПу далее, из предпоследнего, уже зная лсп, найдем xn-i и т. д. Рассмотрим систему (7). Перепишем ее так: YH*i+Yl2*2+. • .+Yim#m —61—Yim+l#m+i—• • •—Yin#n, Y22*2+. • .+Y2m*m=62—y2m+lXm+l—• • •—Y2n#n, (8) УттХт — От Утт+iXm+t • • • УтпХп • Если теперь неизвестным Хт+Ь • • • > %п (9) придать произвольные значения из поля Р, то относительно оставшихся неизвестных систему (8) мржно будет решить так же, как и систему (6). Легко проверить, что описанным путем получаются все решения системы (8), так как при заданных значениях неизвестных (9) оставшиеся неизвестные определяются однозначно. Будем считать, что Р — поле вещественных чисел. Пример 1. Решить систему Xi-2x2+x3- *4=-l, | (10) Решение. Преобразуем матрицу системы: [1-21 1 11 Г1 -2 1 1 11 1-2 1 -1 -1 ~ 0 0 0 -2 -2 1. 1-2 1 5 5 J L0 0 0 4 4 J Мы пришли к системе: *1 —2*2+*3 + *4=1, -2х4=-2. Слагаемые с х2 и xs перенесем в правую часть и положим *2 = а, *з = Р; где аир — произвольные числа: ,1+А = 1+2«-Р.1 *4=1 J Таким образом, система (10) имеет бесконечное множество решений вида (2а—р, а, р, 1), где а и р — произвольные числа. Других решений система не имеет.
104 Глава 3. Матрицы и определители Пример 2.. Решить систему *i~f~ х%—3*з==— 1, 2xi+ x2—2x3 = \, xi+ x2+ x3 = 3, Xi+2X2—3X3=\. Решение. Преобразуем матрицу: ~ 11-3-1 2 1-2 1 1113 12-3 1 _ fl 1 -3 - 0-1 4 0 0 4 L0 0 4- Система несовместна. Пример 3. Р ешить систему ~ -1 1 3 4 5 J 1 0 0 L° ~ 1 -3 -1 -14 3 0 4 4 1 0 2 Л 1 -3 - 0-1 4 1 0 0 4 0 0 0 1} Xi+ *2+5*3 = —7, 2*i+ x2+ *з = 2, *i+3*2'+ *з = 5, 2*i+3*2—3*з=14. Решение. Подвергнем преобразованиям матрицу: 11 5-7 2 112 13 15 2 3-3 14 Мы пришли к системе 1 1 5-7 0-1-9 16 0 2-4 12 0 1 -13 28 Х\+х2+ 5*з = — 7, —х2—'9*з=16, -22*з=44, 1 1 5-7 0-1-9 16 0 0 —22 44 0 0 -22 44 которая имеет единственное решение (1, 2, —2). Способ Гаусса можно применить к вычислению обратной матрицы. Пусть А =*[&$], *. /=1. 2, ... , л, есть невырожденная матрица над полем Р. Напишем систему уравнений где Ctu*l +CCi2*2 +• • .+Ctm*n =pl, a2i*i+a22*2+...+a2n*n = Рг, Ctni*l + Ctn2*2+- • .+Ctnn*n = Pn, • рь t=l, 2, ... , n, (11) (12)
§ 40. Решение системы линейных уравнений исключением неизвестных 105 есть некоторые элементы поля Р, которые мы определим позже. При любых значениях элементов (12) система (11) является крамеровской и потому имеет единственное решение % (Яь А*, ... , *п). (13) Ки 1=1, 2, ... , п,— это буквы, которые принимают определённые значения в зависимости от значений элементов (12). Вычислим решение (13) способом Гаусса. Затем придадим последовательно элементам (12) следующие значения: 1, 0, ... ,0, 0, 0, 1, ... , 0, 0, 0, 0, ... , 0, 1. Полученные при этом п решений (13) обозначим соответственно (Ян, Лгг, . . . , Япг), *'= 1, 2, . . . , П. Если B = [Xij], i, / = 1, 2, ... , /г, то ЛВ=£, ВА = Е. (14) В самом деле, пусть AB = [yij]. Тогда Yij = (XiAij-f-Gi2A,2j+.. .-\-ainXnj= \ 1 при !=/,_ 0 при 1ф\. Одно из равенств (14) доказано, второе доказывается аналогично. Итак, В=А-К Пример 4. Найти Л-1, если А [2 7 3 "1 3 9 4. 1 5 3 J Решение. Рассмотрим систему уравнений 2х+7 у+3z=$u 3*+9r/+4z=p2, } (15) x+5y+3z=$3. Преобразуем матрицу: Г2 7 3 Pi "1 Г1 5 3 р3 1 Г1 5 3 . рз 1 3 9 4 р2 ~ 0 -3 -3 р!-2рз \~ \0 -3 -3 Pi-2p, . Ll 5 3 p3J LO -3 -2p2-Pi-p3J LO 0 1 p2-2Pi+p3J Мы пришли к системе *+5r/+3z = p3, —3r/-32=Pi—2р3, z=p2-2pi+p3. Находим у и х: 5pi—ЗРг—Рз —7Pi+6p2—рз У=
106 Глава 3. Матрицы и определители Итак, / —7Pi«+6P2—Рз 5Pi—Зр2—рз , p2-2Pi+p3) (16) \ 3 ' 3 является решением системы (15). Полагая в (16) последовательно Pi = l, Рг=Рз=0, Pi=0, р2=1, рз=0, р1а=р2=о, p«=i, найдем первый, второй и третий столбцы искомой матрицы; (—7/3, 5/3, —2), (2,-1,1), (—1/3, —1/3, 1): Л-1 [-7/3 2 -1/ЗП 5/3 -1 -1/3 . - 2 1 1 J
Часть II ЭЛЕМЕНТАРНАЯ АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ В этой части книги под «числами» всегда подразумеваются вещественные числа. Словам «прямая», «плоскость», «пространство» придается тот же смысл, что и в курсе элементарной геометрии, изучаемом в средней школе. Фигурой называется произвольное множество точек. Глава 4 ВЕКТОРЫ И КООРДИНАТЫ § 41. Понятие вектора Отрезок прямой, для которого указано, какая из двух ограничивающих его точек является началом и какая — концом, называется направленным отрезком. Направленный отрезок, началом которого является точка Л, а концом — точка В, обозна-, чается символом АВ. На рисунке направленный отрезок изображается стрелкой, идущей от начала к концу. Для задания направленного отрезка* достаточно указать его начальную и конечную точки, т. е. упорядоченную пару точек. Не исключается из рассмотрения и тот случай, когда точки упорядоченной пары совпадают (А=В). Таким образом возникает понятие нулевого отрезка АА. В дальнейшем, рассматривая направленные отрезки, слово «направленный» мы часто опускаем. Два отрезка АВ и CD будем называть равными и писать AB=CD в том и только в том случае, когда А=С и B=D. Выберем масштабную единицу для измерения длин. Длину отрезка АВ, измеренную этой единицей, обозначим символом \АВ\. Длина нулевого отрезка равна нулю, длина ненулевого отрезка — положительное число. Пусть заданы два ненулевых направленных отрезка АВ и CD, лежащих на двух различных параллельных прямых. Проведем, через точки Аи С плоскость П, не проходящую через точки В и D. Плоскость П разделит множество всех точек пространства, не принадлежащих этой плоскости, на два полупространства. Если
108 Глава 4. Векторы и координаты точки В и D лежат в одном и том же полупространстве, то будем говорить, что отрезки АВ и CD одинаково направлены, В противном случае будем называть отрезки АВ и CD противоположно направленными. Пусть теперь отрезки АВ и EF лежат на одной прямой. Будем говорить, что эти отрезки одинаково направлены, если существует третий отрезок CD, который одинаково направлен с каждым из отрезков АВ и EF. В противном случае будем называть отрезки АВ и EF противоположно направленными. Наконец будем считать, что нулевой отрезок одинаково направлен и противоположно направлен с любым отрезком. Два отрезка АВ и CD будем называть эквивалентными и писать АВ ~ CD, если они имеют одну и ту же длину и одинаково направлены. Легко видеть, что эквивалентность направленных отрезков обладает свойствами рефлексивности, симметричности и транзитивности и поэтому является отношением эквивалентности на множестве всех направленных отрезков (см. § 2). Множество всех направленных отрезков разбивается на непересекающиеся классы эквивалентных друг другу отрезков, которые называются векторами. Итак, вектор — это класс эквивалентных друг другу направленных отрезков. Для задания такого класса, т. е. вектора, достаточно указать какой-либо один отрезок из этого класса. С другой стороны, любой отрезок АВ задает вполне определенный вектор, а именно класс отрезков, эквивалентных отрезку АВ. Вектор, определяемый отрезком АВ, будем обозначать символом АВ. Тот же самый вектор определяется любым отрезком CD~AB. Равенство векторов AB = CD, по определению, равносильно условию AB~CD, т. е. векторы АВ и CD называются равными, если они составлены из одних и тех же направленных отрезков. Для обозначения векторов*мы будем пользоваться_ также малыми латинскими буквами с чертой над буквой — а, Ь. Нулевой вектор, т. е. класс всех нулевых отрезков будем обозначать символом 0. Для изображения вектора а на рисунке будем использовать какой-либо из направленных отрезков, представляющих этот вектор (рис. 3). Пусть заданы вектор а и точка А. Очевидно, существует единственная точка В такая, что отрезок АВ принадлежит вектору а, т. е. АВ=а. (1) /Операцию построения направленного отрезка АВ, для которого имеет место равенство (1), будем называть откладыванием вектора а от точки А.
§ 42. Сложение векторов 10$ N Длиной вектора а называется длина любого из направленных отрезков, образующих вектор а. Длина вектора а будет обозначаться символом \а\. Пусть заданы два вектора а и Б. Отложим оба этих вектора от какой-либо одной точки О, т. е. построим такие отрезки О А и ОВ, что ОА=а и ОВ=Б. Тогда углом между векторами а и Б назовем величину угла между отрезками ОА и OS. Очевидно, угол между векторами а и b не зависит от выбора точки О. Векторы я -щ- аи а2, ... , ah (2) Рис. 3. называются коллинеарными, если образующие их направленные отрезки параллельны одной и той же прямой, в противном случае векторы называются неколлинеарными. Векторы (2) называются компланарными, если образующие их направленные отрезки параллельны некоторой плоскости, в противном случае векторы называются некомпланарными. Дадим векторам еще одно истолкование. Пусть задан вектор АВ, т. е. класс отрезков, эквивалентных направленному отрез,- ку АВ. Рассмотрим преобразование пространства, переводящее произвольную его точку С в такую точку D, что CD~AB. Такое преобразование называется параллельным переносом. Таким образом устанавливается взаимно однозначное соответствие (биек- ция) между множеством всех векторов и множеством всех параллельных переносов. В силу этого параллельные переносы также называют векторами. Если в пространстве фиксирована некоторая плоскость П и рассматриваются только те точки, которые принадлежат этой плоскости, то под вектором будем понимать класс эквивалентных отрезков, принадлежащих плоскости П. Замечание. Во многих книгах направленные отрезки называют связанными векторами или просто векторами. В этом случае вектор в нашем смысле называется свободным вектором. § 42. Сложение векторов Пусть заданы два вектора а и Б. Возьмем какую-либо точку О и отложим от нее вектор а, т. е. построим такой отрезок О А, что ОА==а. Далее от точки А отложим вектор 5, т. е. построим такой отрезок АВ, что АВ = Б. Вектор, определяемый отрезком ОВ, очевидно, не зависит от выбора точки О (рис. 4). Этот вектор
ПО Глава 4. Векторы и координаты называется суммой векторов а и Ь и обозначается а-\-Б. Указанный способ построения вектора а+5 называется правилом замыкающей. * . о, а А{ <Г * А Рис. 4 Рис. 5 Пусть а и Б — неколлинеарные векторы. Отложим оба этих вектора от одной точки О (рис. 5), т. е. найдем такие точки Лий, что ОА=а и ОВ=5. В плоскости, определяемой точками О, А и В\ построим параллелограмм О АС В на сторонах О А и ОВ. Так как АС=Б и ВС=а, то ОС=а+5=5+а. (1) Итак, мы получили новое правило построения суммы двух неколлинеарных векторов — правило параллелограмма: чтобы найти сумму двух неколлинеарных векторов а и Б, надо отложить эти векторы от одной точки О и построить на полученных направленных отрезках, как на сторонах, параллелограмм; направленный отрезок, совпадающий с диагональю этого параллелограмма и выходящий из точки О, определит сумму а+Б. Равенство (1) показывает, что сумма двух неколлинеарных векторов не зависит от порядка слагаемых. Справедливость этого свойства для коллинеарных векторов легко получается из правила замыкающей (рис. 6). Таким образом, операция сложения векторов, подобно операции сложения чисел, коммутативна.
§ 42. Сложение векторов 111 Пусть даны три вектора а, Б и с. Отложим от произвольной точки О (рис. 7) вектор а, т. е. построим такую точку А, что ОА—а. Далее построим точку 5, такую, что АВ = Б. По определению суммы векторов, ОВ=а+Б. Прибавим теперь к этому Рис. 6 вектору вектор с. Для этого построим точку С такую, что ВС=с. Имеем ОС=(а+Б)+с. (2) С другой стороны, А С=5+с и, следовательно, ОС=а+(Б+с). - (3) Сопоставляя равенства (2) и (3), получаем (а+Б)+с=а+(Б+с). Итак, сложение векторов ассоциативно. Отметим, что нулевой вектор 0, т. е. класс всех нулевых отрезков, играет роль нейтрального элемента для операции сложения векторов, т. е. для любого вектора а имеем а+0=0+а=а. . Пусть а — произвольный вектор. Построим какой-либо направленный отрезок АВУ определяющий вектор а. Вектор, опре- . деляемый направленным отрезком В А, называется противоположным вектору а и обозначается —а. Очевидно, вектор —а является противоположным элементом для а относительно операции сложения векторов, т. е. а+ (—а) =0. Таким образом, множество всех векторов есть абелева группа дтнорительно операции сложения.
112 Глава 4. Векторы и координаты Как и во всякой абелевой группе, можно определить разность а—5=а+(—Б) векторов а и Б. Если отложить векторы а и Б от одной точки О, т. е. найти точки А и В такие, что ОА=а и ОВ=Б (рис. 8), то а—Б=ВА. § 43. Умножение вектора на число Произведением вектора а на число а называется вектор, который обозначается аа и определяется следующими условиями: а) длина вектора <ха равна |а| |а[, т. е. произведению модуля числа а и длины вектора а; б) векторы а и аа имеют одно и то же направление, если а>0, и противоположные направления, если а<0. Отметим основные свойства произведения вектора на число. 1) 1а=а, 2) (—1)5=;—а. Эти два свойства произведения непосредственно вытекают из его определения. 3) а(ра) = (сср)а. ф Длина вектора, стоящего в левой части равенства 3, равна |а||рй| = |а||р||а|. Этому же числу равна и длина вектора, стоящего в правой части равенства 3. Если |а| |р| |а|=^=0, то направления векторов, стоящих в обеих частях рассматриваемого равенства, также одинаковы: эти векторы имеют направление, одинаковое с направлением вектора а, если числа аир одного знака, и противоположное направлению вектора а, если ар<0.ф 4) а(а-\-Б)=аа-\-аБ. ф Равенство очевидно в следующих случаях: а) а = 0> б) а=—Б, в) по крайней мере один из векторов аи Б — нулевой. Исключим эти случаи из дальнейшего рассмотрения.
§ 43. Умножение вектора на число 113 Пусть а>0 и векторы а и Б не коллинеарны. Возьмем произ-' вольную точку О и построим точки А и В так, чтобы ОА = а> АВ=6 и, следовательно, (рис. 9) ОВ=а-\-Б. Далее найдем точки А' и В' такие, что ОЛ'=сса, ОВ'=а(а+5). (1) Треугольники ОАВ и ОА'В' подобны, так как они имеют общий угол, и стороны, заключающие этот угол, пропорциональны. Отсюда следует, что |-Д,-вг | == | об | \АВ\. Но так как векторы АВ и А В' имеют, кроме того, одно и то же направление, то А'В'=*Ь. (2) Доказываемое равенство вытекает из сопоставления (1) и (2). Пусть а>0, а векторы а и Б коллинеарны. Возьмем произвольную точку О (рис. 10) и построим точки А и В так, чтобы ОА=а, АВ=Б. Выделим какую-либо точку S, не лежащую на прямой ОАВ, и построим лучи SO, SA и SB. Найдем на луче SO точку О' такую, что |SO'|=a|SO| и проведем через нее прямую Д, параллельную прямой ОВ. Пусть прямая А пересекает луч SA в точке А\ а луч SB в точке В'. Мы получили три пары подобных треугольников: Д OAS со Д O'A'S, A ABS со Д A'B'S, Д OBS со Д O'B'S.
114 Глава 4. 'Векторы и координаты Отсюда следует: <УЛ'=аа, A7B/=aBt aB'=a(a+6). Теперь равенство 4 очевидно. При а<0 доказательство проводится аналогично и предоставляется читателю. # 5) (<х+р)а=а£+ра. ф Равенство очевидно, если а) а=0, б) а+р=0, в) по крайней мере одно из чисел а, р равно нулю. Мы исключим эти случаи из дальнейшего рассмотрения. Пусть аир имеют одинаковые знаки. Очевидно, что векторы, стоящие в левой и правой частях равенства 5, имеют одно и то же направление. Покажем, что длины этих векторов также одинаковы: "- |аа+ра| = |аа| + |ра| = |а||а| + |р||а| = = (|сс| + |Р|)|а| = |а+р||а| = |(а+Р)а|. Если аир имеют разные знаки и, например, |а|>|Р|, то числа а+Р и —р одного знака, и на основании уже доказанного (а+р)а+(-р)а=(а+р-р)а=-аа, что равносильно равенству 5. # С помощью метода математической индукции можно распространить свойства 4 и 5 на любое конечное число слагаемых, т. е. доказать равенства: 4') a(ai+a2+. .\+а&)=аа4+аа2+.. .+аал, 5') (ai+a2+.. .+aft)a=aia+a2a+.. .+ала. ф Докажем, например, первое из этих равенств. Оно уже доказано для k=2. Предположим, что оно справедливо для k— 1 слагаемых (&>1) и докажем его для k слагаемых: a(ai+a2+.. .+ah-i+ah) =a[(3t+.. .+ak-i)+ah] = = a(at+a2+.. .+ak-i)+<xah= = aai+aa2+.. .+аа&_1+аал. Равенство 5' доказывается аналогично. Щ
§ 44. Проекции 115 § 44. Проекции 1. Ось Возьмем произвольную прямую. Назовем одно из двух направлений этой прямой положительным и отметим его на рисунке стрелкой, противоположное направление назовем отрицательным. Прямая, на которой выбрано положительное направление, называется осью. В '■ " 9 С А С В В А • С В А С '»■ ■ ■ В в А С А *- ^~< ^-i *^ Рис. 11 Выберем на оси А какой-либо ненулевой отрезок в качестве масштабной единицы для измерения длин. Назовем величиной направленного отрезка АВ оси Л и обозначим символом (АВ) число/равное \АВ\, т. е. длине отрезка АВ, если отрезок АВ и ось А имеют одно и то же направление, и равное — |ЛВ|, если отрезок АВ и ось А имеют противоположные направления. Очевидно, что величина нулевого отрезка равна нулю и (ВА) = =-{АВ). Теорема. Для любых трех точек А, В, С оси, на которой выбрана масштабная единица, имеет место следующее соотношение (АВ) + (ВС) = (АС). (1) ф Если Bice три точки Л, 5, С различны, то их взаимное расположение может быть таким, как указано на рис. 11. Кроме того, возможны случаи, когда две из точек Л, В, С или все три совпадают. В первом случае (см. рис. 11) равенство (1) утверждает, что длина отрезка равна сумме длин его частей и, следовательно, оно справедливо. Во втором случае (СА) + (АВ) = (СВ) =ф- (ЛЯ)-(СЯ) = = -(СЛ) =>- (АВ) + (ВС) = (АС).
116 Глава 4. Векторы и координаты Пусть теперь точки А и В совпадают. Тогда (АВ) + (ВС) = (АА) + (АС)=0+(АС) = (АС), т. е. равенство (1) верно. Проверка остальных случаев предоставляется читателю, ф 2. Проекция на ось в пространстве Пусть Д — некоторая ось и П — плоскость, не параллельная Д (рис. 12). Через произвольную точку А проведем плоскость Ш, ^Лп ^Лп1 а £3-£^ 11 Рис. 12 Рис. 13 параллельную плоскости П. Плоскость П± пересечет ось Д в некоторой точке А'. Точка А' называется проекцией точки А на ось Д параллельно плоскости П. Если плоскость П перпендикулярна к оси Д, то проекция называется прямоугольной или ортогональной, в этом случае точка А' является основанием перпендикуляра, опущенного из точки А на ось Д. Возьмем произвольный направленный отрезок АВ. Проектируя точки А и В на ось Д параллельно плоскости П, получим на этой оси направленный отрезок А'В\ который назовем проекцией отрезка АВ на ось Д параллельно плоскости П. Пусть на оси Д выбран масштабный отрезок. Тогда наряду с проекцией А'В' отрезка АВ на ось Д параллельно плоскости П мы будем рассматривать также величину этой проекции, которую будем обозначать прдЛВ (ЦП). Очевидно, проекции эквивалентных отрезков эквивалентны, а величины этих проекций равны. Пусть теперь задан вектор а, т. е. класс эквивалентных друг другу направленных отрезков. Проекции этих отрезков на ось Д (ЦП) образуют на оси класс эквивалентных друг другу направленных отрезков, т. е. вектор на оси Д. Этот вектор назовем проекцией вектора а на ось Д (ЦП), а величину этой проекции обозначим прд а (ЦП).
§ 44. Проекции 117 3. Проекции фигур, расположенных в плоскости Если все точки фигуры, проектируемой на ось А, находятся в плоскости П, в которой лежит ось А, то сформулированное выше определение проекции можно заменить следующим. Пусть Ai — некоторая прямая плоскости П, не параллельная оси А. Проведем через произвольную точку А плоскости П прямую, параллельную прямой Ai, и найдем точку А' ее пересечения с осью А (рис. 13). Точка А' называется проекцией точки А на ось А параллельно прямой Ai. Понятия проекции и величины проекции вектора вводятся как и выше. 4. Проекция на плоскость Пусть П — некоторая плоскость и А — прямая, не параллельная ей. Проведем через произвольную точку А пространства прямую Ai, параллельную прямой А, и найдем точку А' пересечения прямой At с плоскостью П (рис. 14). Точка А' называется проекцией точки А на плоскость П параллельно прямой А. Если прямая А перпендикулярна плоскости П, то проекция называется прямоугольной или ортогональной. 5. Проекция суммы векторов Пусть на ось А проектируются два вектора а и Ь\ проектирование производится параллельно некоторой плоскости П или некоторой прямой Ai, если векторы а и b и ось А находятся в одной плоскости. Рис. 14 Рис 15 Возьмем произвольную точку О (рис. 15) и построим точки А и В так, чтобы ОА=а, АВ = Б и, следовательно, ОВ=а+Б. Если О', А\ В' — проекции точек О, Л, В на ось А, то векторы 0'А\ А'В' и О'В' являются проекциями векторов а, В и а+5
118 Глава 4. Векторы и координаты соответственно. Отсюда получаем: проекция суммы вектора равна сумме проекций слагаемых векторов. Доказательство этого утверждения, проведенное нами для двух слагаемых, очевидным образом распространяется на произвольное конечное число слагаемых. В силу равенства (1) (О'В') = (О'А') + (А'В') или иначе прд(а+5) =прд а+прд 5, (2) т. е. величина проекции суммы векторов на ось равна сумме величин проекций слагаемых. 6. Проекция произведения вектора на число Покажем, что при умножении вектора а на число X проекция этого вектора на какую-либо ось А и величина этой проекции умножаются на то же число. Рис. 17 Пусть афО и ХФО (в противном случае утверждение очевидно). Отложим от некоторой точки О оси А векторы а и Яа, т. е. найдем такие точки А и В, что ОА=а, ОВ=Ка (рис. 16, 17). Спроектировав точки А и В на ось А в точки А' и В\ получим два подобных треугольника ОААг и ОВВ'. Теперь сформулированное выше утверждение очевидно. Итак, прд (Ка) =Я лрд а. (3) 7. Проекция линейной комбинации векторов Пусть fli, Д2, • • • » аь (4) есть произвольная конечная система векторов (среди этих векторов могут быть и равные), а A/i, Ag, ... , %а (5)
§ 45. Линейная зависимость векторов 119 есть произвольная система чисел. Вектор А<1Й1+А,2Й2+-. .+A,fcafe называется линейной комбинацией векторов (4), а числа (5) называются коэффициентами этой линейной комбинации. Из равенств (2) и (3) вытекает следующее равенство: Прд(Х1Й1-|-JC202+. • .+taaft) = =Xi прд ai+ta прд й2+. • -+ta прд uky т. е. величина проекции линейной комбинации векторов на ось равна такой же (с теми же коэффициентами) линейной комбинации величин проекций этих векторов. § 45. Линейная зависимость векторов Векторы йи а2, ... , uk (1) называются линейно зависимыми, если существуют числа ta, %2> ... , fa, (2) не равные одновременно нулю, такие, что Я1Й1+М2+.. .+Шк=0. (3) В противном случае векторы (1) называются линейно независимыми. Линейно независимые векторы характеризуются тем, что из равенства (3) следуют равенства Л/1=А*2=-. .=А,й=0. Говорят также, что векторы (1) образуют линейно зависимую или линейно независимую систему. Если какой-либо вектор а можно представить в виде a=iiiai+\i2ci2+.. .+\ihah> (4) то говорят, что вектор а линейно выражается через векторы (1). Теорема 1. Для того чтобы векторы (1) (k>l) были линейно зависимы, необходимо и достаточно, чтобы по крайней мере один из них линейно выражался через остальные. ф Пусть векторы (1) удовлетворяют равенству (3), причем среди чисел (2) есть отличные от нуля, например Kh¥=0. Тогда из
120 Глава 4. Векторы и координаты равенства (3) следует" ah= —-а4 —- a2—... г—ak> Aft Aft Aft т. е. вектор йь. линейно выражается через векторы 5i, a2, ... , бл-ь Обратно, пусть один из векторов (1) линейно выражается через остальные, например, aft=Piai+p2a2+.. .+Pfc-i^ft-i. Перенеся все слагаемые в левую часть равенства, получим —piai—p2a2—...—Pft-i+1 aft=0, т. е. равенство вида (3). # Следствие. Если векторы (1) линейно независимы, то ни один из них нельзя выразить линейно через остальные; в частности, ни один из этих векторов не может быть нулевым. Выясним геометрический смысл линейной зависимости и независимости векторов (1) при ^=1, 2, 3. Система, состоящая из одного вектора а, очевидно, линейно зависима тогда и только тогда, когда этот вектор нулевой. Теорема 2. Для того чтобы два вектора были линейно зависимы, необходимо и достаточно, чтобы они были коллинеарны. ф Пусть векторы аА и а2 линейно зависимы. В силу теоремы 1 по крайней мере один из них, например а2, линейно выражается через второй, т. е. a2=^ai, поэтому векторы а4 и а2 коллинеарны. Обратно, пусть векторы ai и й2 коллинеарны. Если по крайней мере один из них нулевой, например а2=0, то Oai+1 а2=0, г. е. векторы ai и а2 линейно зависимы. Предположим теперь, что векторы cii и а2 ненулевые. Отложим оба этих вектора от одной точки О, т. е. построим такие направленные отрезки QAi и ОЛ2, что OAi=au OA2=a2. В силу коллинеарности векторов аА и а2 точки О, Ai и Л2 будут принадлежать одной прямой Л. Если точки А\ и Л2 совпадают, то ОАг=ОА\ => аг=й\.
§ 45. Линейная зависимость векторов -121 Пусть теперь точки Ai и А2 не совпадают. Обозначим буквой % длину отрезка ОЛ2, измеренного масштабной единицей OAi. Если отрезки OAi и ОА2 одинаково направлены, то a2=Kai. Если же отрезки OAi и ОА2 противоположно направлены, то a2= — Jtai. # Следствие. Два вектора линейно независимы тогда и только тогда, когда они неколлинеарны. Докажем еще одну теорему, которая будет играть в дальнейшем важную роль. Теорема 3. Если в некоторой плоскости Л заданы два некол- линеарных вектора ei и ё2> то любой вектор а этой плоскости можно разложить по векторам ё\, ё2у т. е. представить в виде а=хёх+уё2. (5) Коэффициенты разложения х, у определяются однозначно. ф Будем считать, что плоскость П совпадает с плоскостью рис. 18. Отложим векторы ёи ё2 и а от одной точки О, т. е. построим точки Ей Е2, Му такие, что 0£Y=ei, ОЕ2=ё2, ОМ = а. Спроектировав точку М на прямую OEi параллельно прямой ОЕ2, получим точку МА. Пусть, далее, точка М2 является проекцией точки М на прямую ОЕ2 параллельно прямой OEi. Так как векторы OEi и ОМ2 коллинеарны и OEi — ненулевой вектор, то OMi=xOEi. Аналогично ОМ2=уОЕ2. Так как OM=OMi+OM2y то равенство (5) верно. Докажем единственность разложения (5). Пусть наряду с (5) имеется еще разложение a=x'ei+y'e2- (6) Вычитая из равенства (5) равенство (6), получаем (х-х')ё1+(у-у')ё2=0. (7) Так как векторы ei и ё2 неколлинеарны, то они линейно независимы и из равенства (7) следует: *—х'=0, у—у'=0=>х=х'у у=у'. • Рассмотрим вопрос о линейной зависимости трех векторов.
122 Глава 4. Векторы и координаты Напомним, что компланарными называются такие векторы, которые параллельны одной плоскости. Если компланарные векторы' отложить от одной точки, т. е. построить соответствующие направленные отрезки, то эти отрезки будут лежать в одной плоскости. Рис. 18 Рис. 19 Теорема 4. Для того чтобы три вектора были линейно зависимы, необходимо и достаточно, чтобы они были компланарны. ф Пусть векторы flit 02, а3 (8) линейно зависимы. Тогда по крайней мере один из них линейно выражается через остальные, например #3=^iai-f-A,2#2- (9) Отложим векторы (8) от одной точки О, т. е. построим такие направленные отрезки ОМи ЮМ2 и ОМ3, что OMi=ai, OM2=a2f ОМ3=а3. Если векторы OMi и ОМ2 неколлинеарны, то точки О, Afi, М2 определяют плоскость П. В силу равенства (9) отрезок ОМ3 также лежит в плоскости П и, следовательно, векторы (8) компланарны. Если векторы OMi и ОМ2 коллинеарны, т. е. отрезки OMi и ОМ2 лежат на одной прямой, то в силу равенства (9) отрезок ОМ3 также лежит на этой прямой. Следовательно7 в этом случае векторы (8) не только компланарны, но даже и коллинеарны. Обратно, пусть векторы (8) компланарны. Предположим сначала, что два из заданных векторов, например at и а2у неколлинеарны. Тогда по теореме 3 вектор а3 можно представить в виде a3=kiai+k2a2 и, следовательно, векторы (8) линейно зависимы. Пусть теперь все три вектора (8) коллинеарны, т. е. параллельны одной прямой. Из теоремы 2 следует, например, ai=A,a2.
§ 45. Линейная зависимость векторов 123 Переписывая это равенство в виде ai=Xa2+0a3, получим, что векторы (8) линейно зависимы. # Таким образом, в пространстве существуют тройки линейно независимых векторов. Теорема 5. Если векторы К ё2, ё3 (10) линейно независимы/ то любой вектор а может быть разложен по этим векторам, т. е. может быть представлен в виде а=хё1+уёг+гёз. (11) Это разложение единственно. + Отложим векторы (10) на от одной точки О, т. е. построим такие направленные отрезки ОЕи OEz, OEz и (Ж, что OEi=eu OE2=e2f ОЕ3=ёз, ОМ=а (рис. 19). Пусть Ми М2, М3 — проекции точки М на прямые ОЕи ОЕ2, ОЕз параллельно плоскости ОЕ2Е3у OEiE3, OE^E2 соответственно. На отрезках ОМи ОМ2, ОМ3, как на ребрах, построим параллелепипед. Тогда OM=OMi+OM2+OM3. (12) Так как векторы OEi и ОМ\ коллинеарны и 0£i=^=t), то ОМ= —xOEi. Аналогично ОМ2=уОЕ2> ОМг=гОЕз. Теперь равенство (11) следует из (12). Единственность разложения (11) доказывается так же, как и в теореме 3. # Теорема 6. Любые четыре вектора линейно зависимы. ф Пусть среди векторов аи а2у аз, а (13) %стъ тройка линейно независимых, например Г аи а2у аз. (14) ^Гогда, па теореме 5, имеет место разложение а=Xi a i-f-Х2а2 -f- Х363
124 Глава 4. Векторы и координаты и, следовательно, векторы (13) линейно зависимы. Теперь рассмотрим случай, когда векторы (14) линейно зависимы, т. е. имеет место равенство А,1а1+^2а2+Мз=(), (15) причем среди чисел A,i, ta, Хз есть отличные от нуля. Переписывая равенство (15) в виде ^1^1+^2^2+^3+0 а=0, получаем, что векторы (13) линейно зависимы, ф § 46. Координаты на прямой Пусть Д — некоторая прямая. Возьмем на ней какой-либо ненулевой вектор ё, который будем называть единичным вектором или ортом. Пусть теперь а — произвольный вектор на прямой Д. Очевидно, существует единственное число х такое, что а=хё. Число х называется координатой вектора а на прямой Д, снабженной ортом ё. Выберем на прямой Д, снабженной ортом в, какую-либо точку О, которую назовем началом координат. Прямую Д будем называть теперь координатной осью. Вектор ОМ, где М — любая точка прямой Д, называется радиус-вектором этой точки. Координатой точки М на координатной оси Д называется координата ее радиус-вектора ОМ. Отложим вектор ё от точки О, т. е. возьмем на прямой Д такую точку £, что ОЕ=ё. Выберем охрезок ОЕ за масштабный отрезок. Очевидно, координата точки М есть вели- чина направленного отрезка ОМ. Чтобы отметить, что х есть координата точки М, пишут: М (х). В результате введения координат каждой точке М координатной оси Д поставлено в соответствие вполне определенное вещественное число — ее координата х. Обратно, для каждого вещественного числа х найдется единственная точка М оси Д, координата которой равна х. Таким образом, положение любой точки координатной оси вполне определяется заданием координаты этой точки. С другой стороны, научившись изображать вещественные числа точками координатной оси, мы получаем возможность формулировать в геометрических терминах арифметические соотношения. Например, все числа, удовлетворяющие неравенствам — 1^л:^2, изображаются точками отрезка Л В, где А (— 1) и 5(2) (рис. 20). Обозначим символом p(Afi, M2) расстояние между точками Mi и Mzy т. е. длину отрезка MiM*
§ 47. Координаты на плоскости 125 Теорема. Для любых точек Mi(Xi) и М2(х2) координатной оси имеют место равенства (MiM2)=x2-Xu (1) p(Afb Af2) = |*2-*i|. (2) ah/ а в® Jt*}_ о Aff) рм ., ■ » ' f ■ » >~ тшшштщ. щ § § i n]pi Рис. 20 ' Рис. 21 ф На основании равенства (1) из § 44 {ОМ,) + (MtM2) = (OAf2) =Ф- (AfiAf2) = (ОМ2) - (OAfi). Используя определение координаты, получаем равенство (1). Формула (2) очевидным образом следует из равенства (1). ф Пример. Истолковать геометрически неравенство |*-1|>3. (3) Решение. Левая часть неравенства выражает расстояние между точками М(х) и Л(1) координатной оси. Поэтому неравенству (3) удовлетворяют координаты всех точек оси, лежащих вне отрезка [—2, 4], и только этих точек (рис.21). ■%' § 47. Координаты на плоскости 1. Аффинные координаты На протяжении всего этого параграфа будут рассматриваться точки и векторы, принадлежащие некоторой фиксированной плоскости П. Пусть О — некоторая точка и ёи ё2 — два линейно независимых (неколлинеарных) вектора плоскости П. Тройка (О, ei, ё2) называется аффинным репером или аффинной системой координат на плоскости П. Отложим векторы ёи ё2 от точки О, т. е. построим такие направленные отрезки ОЕ, и ОЕ2у что 0£i= =ёи ОЕ2=ё2. Эти отрезки определят две координатные оси — Ох и Оу (рис. 22). Точка О называется началом координат, а векторы ёи ё2 — базисными векторами. Пусть а — произвольный вектор плоскости П. По теореме 3 из § 45 вектор а можно единственным образом представить в виде a=Xei+Yez. (1)
126 Глава 4. Векторы и координаты Коэффициенты X, Y в разложений (1) называются координатами вектора а в системе координат (О, ёи ё2). Как показано в § 45, X, Y являются величинами проекций вектора а на координатные оси Ох, Оу параллельно осям Оу и Ох соответственно. Желая отметить, что Л" и Y есть координаты вектора а, пишут а(Ху Y). Рис. 22 * Пусть теперь М — произвольная точка плоскости П, на которой выбрана аффинная система координат (О, ё±, ё2). Вектор ОМ называется радиус-вектором точки М. Координаты х, у вектора ОМ называются аффинными координатами точки ЛГ, причем х называется абсциссой, а у — ординатой. Аффинная система координат (О, ёи ё2) обозначается также Оху. Если х> у — координаты точки М, то пишут М (jc, у).. Введение координат для векторов позволяет сводить различные соотношения между векторами к числовым соотношениям между их координатами. Имеет место Теорема. Координаты линейной комбинации векторов равны таким же линейным комбинациям соответствующих координат этих векторов. . ♦ Так как координаты векторов являются величинами проекций этих векторов на соответствующие координатные оси, то теорема непосредственно следует из утверждения, доказанного в конце § 44. # Пример. Рассмотрим соотношение а3 = иа^+К2а2, (2) где й\(Хи Yx)t а2(Хгг Y2), a3(X3t Уз). Согласно приведенной выше теореме, векторное равенство (2) равносильно следующим двум числовым равенствам: As=A-iA'i-f-A»2^2i Yi = kiY i+A.2^2'
§ 47. Координаты на плоскости 127 Следствие 1. Если А (хи yt) и В(х2, у2) — две точки, то АВ(х2—хи y2—yi), т. е. чтобы получить координаты вектора, определяемого направ- ленным отрезком АВ, надо из координат конечной точки вычесть координаты начальной точки. Доказательство следует из предыдущей теоремы и равенства А8=0Б-О4. Следствие 2. Для того чтобы два вектора а(Хи Yi) и 6(Х2, Y2) были коллинеарны, необходимо w достаточно, чтобы *их координаты были пропорциональны. ф Как показано в § 45, коллинеарность векторов а и В равносильна тому, что по крайней мере один из них выражается линейно через второй, например Б=Ы. (3) По предыдущей теореме, векторное равенство (3) равносильно двум числовым равенствам: X2=Uit Y2=XYU (4) что и доказывает наше утверждение. Равенства (4) можно представить также в виде Х2 Y2 ~x7~~yT' если ни один из знаменателей не равен нулю, ф Следствие 3. Координаты середины А прямолинейного отрезка, соединяющего точки Ai(xiy yi) u*A2(x2, y2) задаются формулами Xj+X2 j/l+f/2 Х~ 2 ' У~ 2 •" Доказательство следует из соотношения ОА= — (OAi-\-OA2) (рис.23).
128 Глава 4. Векторы и координаты 2. Прямоугольные координаты Пусть на плоскости П выбрана единица масштаба для измерения длин. Рассмотрим некоторую точку О и два взаимно перпендикулярных вектора I, /, каждый из которых имеет длину 1. В этом случае аффинная система координат (О, 7, /) называется (декартовой) прямоугольной системой координат. В прямоуголь- S* / У, My 0 \ f/ /v м 4 :»- мх л Рис. 23 Рис. 24 ной системе координат, конечно, справедливы все формулы, имеющие место в произвольной аффинной системе координат. Часто эти формулы в прямоугольной системе координат имеют более простой вид, чем в общем случае аффинной системы координат. 3. Полярные координаты Выделим на плоскости какую-либо точку О, которую назовем полюсом, и луч О А, который назовем полярной осью. Выберем масштаб для измерения длин. Наконец, условимся, какие повороты вокруг точки О считать положительными. Обычно положительными считают повороты против часовой стрелки. Величины углов будем выражать в радианной мере. Пусть теперь М — произвольная точка плоскости. Обозначим буквой р расстояние точки М от полюса О и буквой ф — величину угла, на который надо повернуть луч ОА вокруг точки О в данной плоскости, чтобы совместить его с лучом ОМ. Величины р и ф называются полярными координатами точки М, р — полярным радиусом, а ф — полярным углом. Каждой точке плоскости соответствует вполне определенное значение р^О. Значение ф для точек, отличных от полюса, определено с точностью до слагаемого 2kn, где k — любое целое число; в полюсе значение ф не определено. Для того чтобы каждая точка плоскости получила вполне определенные значения полярных координат, достаточно
§ 48. Координаты в пространстве 129 Считать, что — я<Ф^я, а в полюсе ф=0. Эти значения ф назовем главными. Теперь мы будем говорить, что на плоскости введена полярная система координат. Рассмотрим одновременно прямоугольную и полярную системы координат, причем полюс полярной системы совместим с началом координат прямоугольной системы, а полярную ось направим в положительном направлении оси Ох. Наконец, положительным будем считать то направление полярного угла, в котором надо вращать положительную полуось Ох, чтобы кратчайшим путем совместить ее с положительной полуосью Оу. - Пусть М — произвольная точка плоскости, х, у — ее прямоугольные, а р, ф — полярные координаты (рис. 24). Очевидно, #=pcos(p, y=psinq). (5) Формулы (5) выражают прямоугольные координаты точки М через ее полярные координаты. Для выражения полярных координат точки М, отличной от начала координат, через ее прямоугольные координаты можно воспользоваться формулами Р = У*2+{/2, cosq)=-— , sin Ф=—=-, (6) fx*+y* У*2+У2 которые легко получить из формул (5). Пример. Пользуясь формулами (6), найти главные значения полярных ^координат точки М, если известны ее прямоугольные координаты: *= —1, Ответ: р = 2, ф=—. § 48. Координаты в пространстве 1. Аффинные и прямоугольные координаты Пусть О — некоторая точка и ё\, ёг, ёг — три линейно независимых (некомпланарных) вектора. Четверка (О, ёи ёг, ёг) называется аффинным репером или аффинной системой координат в пространстве, причем точка О называется началом координат, а векторы ёи ёг, ёз — базисными векторами. Как и в случае плоскости, координатами вектора а называются коэффициенты X, Y, Z в разложении a=Xei-\-Ye2-\-Ze3.
130 Глава 4. Векторы и координаты Аффинными координатами точки М в системе координат (О, ё±, ё2у ёз) называются координаты ху уу z ее радиус-вектора ОМу причем х называется абсциссой, у — ординатой и z — апли- катой. Аффинную систему координат (О, ёи е2у ёз) обозначают Рис. 25 Рис. 26 также Oxyz. Отложим векторы ёи ё2у ё3 от точки О (рис. 25), т. е. построим такие направленные отрезки ОЕи ОЕ2у ОЕ3у что .OEi=eu ОЕ2=ё2у ОЕ3=ё3. (1) Эти отрезки определят три координатные оси — Оху Оуу Oz. Три плоскости, определяемые попарно координатными осями, называются координатными плоскостями. Эти плоскости делят пространство на восемь частей, которые называются координатными октантами. Различают правые и левые аффинные системы координат. Рассмотрим упорядоченную тройку некомпланарных векторов (ёи ёг, ёз). Отложим эти векторы от некоторой точки О, т. е. построим такие направленные отрезки OEiy OE2y ОЕ3у что имеют место равенства (1). Будем вращать отрезок OEi в плоскости ОЕ{Е2 вокруг точки О по кратчайшему пути до совмещения его направления с направлением отрезка ОЕ2 и будем наблюдать за этим вращением с конца отрезка ОЕ3. Если это вращение будет совершаться против часовой стрелки, то упорядоченную тройку векторов (ёи ё2у ё3) назовем правой (рис. 26, а), в противном случае эту тройку назовем левой (рис. 26,6). Аффинная система координат (О, ёи ё2у ёз) называется правой или левой в вависи- мости от того, какую тройку образуют базисные векторы (ёи ё2у ёз) — правую или левую. В дальнейшем, если не оговорено противное, используются правые системы координат.
§ 48. Координаты в пространстве 131 Простейшей из аффинных систем координат в пространстве является (декартова) прямоугольная система координат. Пусть выбрана единица масштаба для измерения длин. Тогда прямоугольная система координат определяется выбором некоторой точки О и трех взаимно перпендикулярных векторов t, ], k, каждый из которых имеет длину 1. Теорема и следствия из нее, полученные в § 47 для случая плоскости, имеют силу и для пространства: к формулам, записанным для первых двух координат, добавляется аналогичная формула для третьей координаты. 2. Цилиндрические координаты Выберем единицу масштаба для измерения длин отрезков. Возьмем далее какую-либо плоскость П, на которой зафиксируем некоторую точку О и выходящий из нее луч Ох. Условимся, какие повороты луча Ох вокруг точки О в плоскости П будем считать положительными. Тогда в плоскости П определится полярная система координат с полюсом О и полярной осью Ох. Наконец, возьмем ось Oz, перпендикулярную к плоскости Пи направленную так, чтобы положительное вращение в плоскости П, наблюдаемое с положительной полуоси Oz, происходило против часовой стрелки (рис. 27). Пусть теперь М — произвольная точка пространства, Mi — ее ортогональная проекция на плоскость Л и Mz — ортогональная проекция точки М на ось Oz. Цилиндрическими координатами точки М называются три числа р, ф и г, где р, ф — полярные координаты точки Mi в плоскости П, а г=(0Л!2). Название «цилиндрические координаты» связано с тем, что поверхность, все точки которой имеют одно и то же значение координаты р, является цилиндром, изображенным на рис. 27. Каждой точке пространства соответствуют вполне определенные значения риг, причем р^О. Значение ф для точек, не лежащих на оси Oz, определено с точностью до слагаемого 2&я, где k — любое целое число; в точках оси Oz значение ф не определено. Для того чтобы каждая точка пространства имела вполне определенные значения цилиндрических координат, достаточно считать, что —я<Ф^я, а в точках оси Oz ф=0. Пусть теперь наряду с цилиндрической системой координат взята прямоугольная система координат Oxyz так, как указано на рис. 27. Тогда прямоугольные координаты xt у, z точки М связаны с.ее цилиндрическими координатами р, ф, z соотношениями х=р cos ф, у—р sin ф, z=z
132 Глава 4. Векторы и координаты 2. Сферические координаты Для введения сферических координат необходимо так же, как и в случае цилиндрических координат выбрать единицу масштаба, плоскость П с точкой О и полуосью Ох и ось Oz (рис. 28). Пусть М — произвольная точка пространства, а Л1А — ее ортогональная проекция на плоскость П. Пусть, далее, р — расстояние точки М Рис. 27 Рис. 28 от О, 0 — угол между осью Oz и направленным отрезком ОМ и, наконец, ф — угол, на который нужно повернуть ось Ох до совмещения с лучом OMi. Числа р, ф, 0 называются сферическими координатами точки Af, причем ф называется долготой, а 0 — широтой. Название «сферические координаты» связано с тем, что поверхность, все точки которой имеют одно и то же значение координаты р, является сферой, изображенной на рис. 28. Каждой точке пространства, отличной от О, соответствуют вполне определенные значения р и 0, причем р>0, О^О^зт; в точке О значение 0 не определено. Значение ф для точек, не лежащих на оси Oz, определено с точностью до слагаемого 2/ит; в точках оси Oz значение ф не определено. Для того чтобы каждая точка пространства имела вполне определенные значения сферических координат, достаточно считать, что — л<Ф^я, в точках оси Oz ф=0, а в точке О 0=0. Пусть наряду со сферической системой координат взята прямоугольная система координат Oxyz так, как указано на рис. 28. Тогда легко видеть, что прямоугольные координаты х, уу z точки М связаны с ее сферическими координатами р, ф, 0 соотношениями х=р sin 0 cos ф, y=psin0sir^, z==pcos0.
, § 49. Преобразование координат 133 § 49. Преобразование координат 1. Аффинные координаты • Рассмотрим на плоскости две аффинные системы координат (О, ёи ё2) и (О', ei', ё2) (рис. 29). Первую из них будем называть старой, а вторую — новой. Пусть заданы координаты точки О' и векторов ё\ и ёг в старой системе координат: 0'(аи а2), *i'(aii» a2i), e2'(ai2, «22)» Пусть, далее, М — произвольная точка плоскости, х, у — ее старые, а х\ у' — новые координаты. Тогда ei'=aiiei+a2ie2, e2f=ai2ei-\-a22e2, 00'=aiei+a2*2, OM=xei+yh> d7M=x'ei'+y'e2'. Имеем OM^OO'+OW. Из этого равенства, используя формулы (1), получаем xei+ye2=aiei+a2e2+x' (aiiei+a2ie2) +y'(ai2ei+a22e2) = = (oLiix'+ai2y'+at) ei+ (a2ixf+a22yf+a2) ёг. (2) В силу теоремы 3 § 45 x=an*'+ai2l//+ai, (1) y=a2ix'-\-a22y'+<x2. (3) Это и есть искомые формулы преобразования аффинных координат, выражающие старые координаты х, у точки М через ее новые координаты х', у'. Если в приведенном рассуждении поменять ролями старую и новую системы координат, то получатся формулы :} (4)
134 Глава 4. Векторы и координаты выражающие новые координаты точки М через старые. Коэффициенты этих формул имеют следующее геометрическое истолкование: *i(Pn, fa), &(р12, Р22), 0(р1эр2), где координаты берутся в новой системе координат. Рассмотрим наряду с точкой М еще одну точку N. Обозначив через Хи yi и х\у у/ соответственно старые и новые координаты точки N, запишем для них формулы (3): Xi = anXi/+ai2#i'+(Xb ) У1=аыХ1+а22У1+аъ I Как.известно из предыдущего параграфа, старые и новые координаты вектора MN выражаются следующим образом: v X=Xi—xy Y=yi—y, X'=Xi'-x\ Y'=yi'-y'. Вычитая из равенств (5) соответствующие равенства (3), получаем формулы преобразования координат вектора Х=ацХ*'+^12 У, Y=cc2iXf -f- 0C22 Yf. Аналогично можно найти формулы преобразования аффинных координат в пространстве. Пусть (О, ёи h, ёз) и (О', ё/, ё<£, ёг) — две аффинные системы координат, из которых первую будем называть старой, а вторую — новой. Пусть, далее, заданы старые координаты точки О' и векторов ё\', ё2' и ёъ'\ 0'(аи «2, a3), ё/(ац, a2i, a3i), &7(ai2, #22, азг), ё$ (aw, 0&23, азз). Тогда старые координаты х, у> z произвольной точки выражаются через ее новые координаты х', у\ z' по формулам x=aiiX,+ai2y/+ai32,+ai, у=а2\х'+а22У'+а2з2'+a2, г=а31ДС/+аз2г/'+азз2/+аз. (6)
§ 49. Преобразование координат 135 Аналогичными формулами выражаются и новые координаты через старые. Как и выше, легко получить формулы преобразования координат вектора: X=anX'-{-ai2Y'-\-ai3Z', Y=a2iX'+a22Y'+a23Z', Z=a3iX'+a32Y'+a33Z'. 2. Прямоугольные координаты на плоскости Рассмотрим тот частный случай преобразования координат на плоскости, когда обе системы координат — старая и новая — & Рис. 30 прямоугольные. Будем обозначать старую систему координат (О, lt']}, а новую систему — (О', V\ У). Следует различать два случая, когда кратчайшие повороты от i к / и от V к У совершаются: а) в одном направлении (либо оба по часовой стрелке, либо оба против часовой стрелки); б) в противоположных направлениях. В обоих случаях будем обозначать буквой ф угол между базисными векторами I и V\ отсчитываемый в направлении, отвечающем кратчайшему повороту от Т к /. Если обозначить буквой \f> угол между векторами Т и Уf то в первом случае я|)=ф+я/2+2Ля (рис. 30, а) и во втором случае — ч|)=ф—jr/2+2/wt (рис. 30, б). В обоих случаях, очевидно, имеем следующие выражения для координат векторов V и /': ait=cos9, а21=81Пф, ai2=cosi|), a22=sinif). В первом из рассматриваемых случаев формулы (3) принимают вид х=х' cos ф—у' sin ф+ai, у=х' sin ф+уг cos ф+схг, 2, J (7)
136 Глава 4. Векторы и координаты а во втором случае — х=х' cos y+y' sin ф+ai, у=х' sin ф—у' cos Ф+0&2. Рассмотрим следующие два частных случая формул (7). 1. Пусть 7'=7 и J'=/ (рис. 31). y'l Тогда формулы (7) принимают вид x=xf+au у=у'+а2 и называются формулами преобразования координат при параллельном сдвиге координатных осей на вектор * ^ a(ai, a2). X' Если 0'=0 (рис. 32), то формулы . (7) принимают вид ** 0Г Рис. 31 х=х' cos ф—*/' sin ф, 1 у=х' smy-\-y' cosy J W и называются формулами преобразования координат при повороте системы вокруг начала на угол ф. 3. Прямоугольные координаты в пространстве Рассмотрим теперь тот частный случай преобразования координат в пространстве, когда рбе системы координат — старая (О, 7, /, k) и новая (О', 7', 7', £')* — прямоугольные. Рис. 32 Рис. 33 Предположим, что обе системы координат являются правыми и имеют общее начало (О' совпадает с О). Введем в рассмотре-
§ 49. Преобразование координат 137 ние три угла, полностью характеризующих расположение новой системы координат относительно старой. Пусть А — прямая пересечения координатных плоскостей Оху и Ох'у' (рис. 33). Превратим прямую А в ось, задавая направление на ней с помощью такого орта ё, что тройка векторов (£, k'y ё) является правой. Пусть \|э — угол между векторами 7 и ё, отсчитываемый в плоскости Оху в направлении кратчайшего поворота от 7 к J, 0 — угол между k и £', причем О^Э^я, и ф— угол между ё и 7', отсчитываемый в плоскости Ох'у' в направлении от V к ]'. Три угла ф, aJ>, 8 называются углами Эйлера. Найдем выражение коэффициентов <ц$ из формул (6) через углы Эйлера ф, if, 0. Для этого заметим, что новая система Ox'y'z' может быть получена из старой Охуг следующим образом. Поворачивая систему Охуг вокруг оси Oz на угол \|э, мы получаем систему OxiyiZi, у которой ось Oxi совпадает с А, а ось Ог4 с Oz (рис. 34). Повернув затем систему OxiyiZi вокруг оси Oxt на угол 0, мы получим систему ОхгУггг, у которой ось Охг совпадает с осью Охи а ось Oz2 с осью Oz' (рис. 35). Наконец, повернув систему Ох2у2^2 вокруг оси Oz' на угол Ф, мы получим систему Ox'y'z' (рис. 36). Запишем формулы преобразования координат при переходе от системы Oxyz.K системе OxtftZi. Так как в плоскости Оху происходит поворот системы координат вокруг начала на угол -ф, то применимы формулы (8): Рис. зе x=Xi cos -ф—1/± sin «ф, у=Х\ sin ф+t/i cos if>. Эти формулы, очевидно, имеют силу и для произвольной точки
138 Глава 4. Векторы и координаты пространства, причем z=Zi. Итак, x=Xi cos \|э—Hi sin л|), ] y=Xi sin of+f/i cos \|>, Z = Zi. (9) Аналогично получаются формулы и для двух остальных поворотов: Xi=X2t yi—y2cosQ—z2smQy I (10) Zi=y2 sin 0+z2 cos 8, x2=x' cos ф—yf sin ф, yz=x' sin ф+f/' cos ф, z2=z'. (11) Подставляя выражения #2, 1/2, £г из формул (11) в (10), а затем полученные выражения для х±9 уи Zi в формулы (9), получаем х= (х! cos ф—у' sin ф) cos г|э— — [ {х! sin ф+у' cos ф) cos 9—z' sin 0] sin \f>, y= (x! cos ф—f/' sin ф) sin if-j- + [ (xf sin ф+у' cos ф) cos 0—z' sin 0] cos -ф, 2= (л:7 sin q>+y' cos ф) sin 0+z' cos 0. (12) Сравнивая формулы (12) с формулами (6) при ai=a2=a3=0, получаем следующие выражения для a*j через углы Эйлера ф, Ф, 0: an=cos ф cos ф—sin yjp cos 0 sin ф, ai2=sin \|э cos ф+cos г|э cos 0 sin ф, ai3=sin 0 sirKp, a2i=—cos if sin ф—sin i|) cos 0 cos ф, a22= —sin -ф sin ф+cos -ф cos 0 cos ф, a23=sin 0 созф, a3i = sini{3 sin 0, аз2=—cosif sin 0, С*зз=сО§ 9,
§ 50. Уравнения фигуры 139 § 50. Уравнения фигуры Пусть А — некоторое подмножество множества R3 троек чисел и /: A-+R есть отображение, ставящее в соответствие каждой упорядоченной тройке вещественных чисел (х, у, г), принадлежащей А, вещественное число f(x, у, г). Соотношение Пх,у9г)=0 (1) называется уравнением с тремя неизвестными х, у, z. Упорядоченная тройка вещественных чисел (а, р, у) называется решением уравнения (1), если f(a,.p, v)=0 есть верное числовое равенство. Аналогично можно рассматривать уравнение с двумя неизвестными g(*,y)=0 (2) и уравнение с одним неизвестным ед=0. (3) Напомним, что фигурой мы называем произвольное множество точек. Фигура называется плоской, если все ее точки лежат в некоторой плоскости. В настоящем параграфе будет показано, что любые фигуры можно задавать с помощью уравнений. Пусть задано уравнение (1). Фиксируем некоторую аффинную систему координат Oxyz. Будем говорить, что точка М(х, у, z) удовлетворяет уравнению (1), если упорядоченная тройка чисел (х, у, z) есть решение этого уравнения. Рассмотрим фигуру Ф, состоящую из всех точек, удовлетворяющих уравнению (1). Будем говорить, что (1) есть уравнение фигуры Ф или, что уравнение (1) задает фигуру Ф. Итак, при фиксированной системе координат каждое уравнение (1) задает вполне определенную фигуру Ф. Пусть теперь задана произвольная фигура Ф и фиксирована некоторая аффинная система координат Oxyz. Мы покажем сейчас, что существует уравнение вида (1), задающее фигуру Ф. В самом деле, определим функцию трех переменных f:R9-+R следующим образом. Пусть (х, у, z) — произвольная упорядоченная тройка вещественных чисел. Если точка М(#, у, z) принадлежит фигуре Ф, то положим f (x, yy z) =0. Если же точка М(х, у, z) не принадлежит фигуре Ф, то положим f(xt yy z) = 1. Итак, [ 0, если М (х, уу z) еФ; f(x,y,z)= \ ^ если м^ ^ г^ф (4) Очевидно, уравнение (1), в котором слева стоит функция (4), задает фигуру Ф. Из построения видно, что каждой фигуре можно
140 Глава 4. Векторы и координаты сопоставить много уравнений, задающих эту фигуру. В самом деле, в формуле (4), определяющей функцию /, вместо 1 можно поставить любое число, отличное от нуля, причем это число может меняться при переходе от одной точки к другой. Пусть фиксирована аффинная система координат Oxyz и задано уравнение (2) .Будем говорить, что точка М(ху у, z) удовлетворяет этому уравнению, если пара чисел (ху у) есть решение уравнения (2). Тогда мы получаем возможность рассматривать фигуры, которые задаются с помощью уравнений вида (2). Аналогично можно рассматривать фигуры, которые задаются уравнениями вида (3)/ В некоторых случаях фигуру удобно задавать не одним уравнением, а с помощью системы уравнений. * > Пусть в пространстве выбрана прямоугольная система координат Oxyz. 1. z=0. Это есть уравнение плоскости Оху. 2. х2+у*=0. Это есть уравнение- оси Oz\ его можно заменить равносильной ему системой уравнений: У=0. J 3. *2-Н/2+г2=0. Это есть уравнение точки О(0, 0, 0). 4. x2+y2+z*+l=Q. Фигура, выражаемая этим уравнением, является пустым множеством. 5. Рассмотрим сферу S радиуса г с центром в точке С (а, Ь, с). Выражая в координатах тот факт, что произвольная точка М(х> у, z) сферы «S удалена от ее центра на расстояние г, получаем уравнение сферы: (х-а) 2+ (у-Ь) Ч- (z-c) 2=г\ Пусть (1) есть уравнение фигуры Ф в аффинной системе координат Oxyz, и мы хотим найти уравнение этой фигуры в новой аффинной системе координат O'x'y'z'. Как известно из § 49, старые координаты х9 у> z произвольной точки М пространства выражаются через новые координаты х\ у', z' этой точки по формулам: х=ацх/+а121//+а1з2/+а1, ) y=azix'+a22y'+a23z'+a2y \ г=аз1*/+а32У/+азз2/+аз. J
§ 50. Уравнения фигуры 141 Подставляя эти выражения для х, у, z в левую часть уравнения (1), получаем F(xt у, zy=F(alix'+ai2y'+ai3z'+au a2i*'+a22{/'+о2з2/+a2, a3i*'+a32y'+asaZ'-\- аз). Это равенство имеет место для любой точки пространства, т. е., оно удовлетворяется, если в нем в качестве х, у, z взять коорди- ч *, 0 , 1 3 Рис. 37 Рис. 38 Рис. 39 наты какой-либо точки, а в качестве х\ y\zf — новые координаты этой точки. Отсюда следует, что уравнению F (au*'+ai2y'+<Xizz'+cxi, ацх?+a^y'-f агз2/+a2, asix'+affiy'+assz'+as) =0 (5) удовлетворяют все точки фигуры Ф и только они, т. е. (5) есть уравнение фигуры Ф в системе координат O'x'y'z'. ■ Пусть в пространстве фиксирована некоторая плоскость П, и мы хотим рассматривать только точки, принадлежащие этой плоскости. Если в плоскости П выбрана какая-либо аффинная система координат Оху> то любое уравнение вида (2) или (3) задает некоторую фигуру* принадлежащую этой плоскости. Обратно, любая фигура плоскости П может быть задана уравнением (2)." 1. х2+у2—1 = 0. Уравнение задает окружность радиуса 1 с центром в начале координат. •2. х2—у2=\. Фигура, определяемая этим уравнением, состоит из двух взаимно перпендикулярных прямых, содержащих биссектрисы координатных углов (рис. 37). х у 3. =0. Точки, удовлетворяющие этому уравнению, заполняют 1*1' 1^1 первую и третью координатные четверти (рис, 38). 4. х2—1=0. Уравнение задает фигуру,*состоящую из двух прямых, параллельных оси О у (рис. 39). ж
142 Глава 4. Векторы и координаты § 51. Скалярное произведение векторов 1. Определение и основные свойства Скалярным произведением векторов а и б называется число, которое обозначается аЬ и равно произведению длин*этих векторов и косинуса угла между ними, т. е. ab = \a\ |&|coscp, где ф — угол между векторами а к Б. (и Рис. 40 Возьмем в пространстве какую-либо точку О и построим а такой отрезок О А, что ОА = \а\- Обозначим буквой Д ось, определяемую отрезком ОА. Тогда (рис. 40, а, б) |5|cosq)=npA by где проекция — ортогональная. Формулу (1) можно переписать теперь в виде а5=|а|прдб. (2) Название «скалярное произведение» употребляется потому, что эта величина является скаляром (числом) и обладает некоторыми алгебраическими свойствами произведения чисел. Рассмотрим эти свойства. 1. Коммутативность: аВ=Ба (3) непосредственно следует из определения скалярного произведения. 2. (Ха)5=Х(а5), (4) a(Xb)=K(ab). (5)
§ 51. Скалярное произведение векторов 143 ф Докажем сначала равенство (5), используя формулу (2), а также формулу (3) § 44: а (Кб) = \а\ прд (КБ) =Х \ а | прд Б=Х (аБ). Равенство (4) следует из равенств (3) и (5). ф 3. Дистрибутивность: &(Б~\-с)**=аБ-{-асу (6) (Б-\-с)а=Ба-\-са. (7) + а(Б+с) — |а|прд(5+с) = |а|прА Б+\а\прА с— =аБ+ас. Равенство (6) доказано, равенство (7) следует из (3) и (6). ф Из этих трех свойств следует, что скалярное умножение двух линейных комбинаций векторов можно производить почленно. Например, (2а+ЗБ) (с—Ъй) =2ас—Ша+ЗБс—\5Ба. Далее мы отметим некоторые геометрические свойства скалярного произведения. — 4. Необходимым и достаточным условием перпендикулярности (ортогональности) двух векторов а и Б является равенство нулю их скалярного произведения: аБ=0. (8) ф Перепишем равенство (8) в виде |а| |5|cosф=0. (9)- Если векторы а и Б перпендикулярны, то ф= — и равенство (9) справедливо. Обратно, пусть векторы а и Б удовлетворяют равенству (9). Если хотя бы один из них нулевой, он не имеет определенного направления, и его можно считать перпендикулярным ко второму вектору. Если же оба вектора а и Б ненулевые и, следовательно, |а|=й=0, |5|=^0, то из равенства (9) следует, ч*Го cos ф=0 и, значит, ф= —. # Доказанное сейчас свойство скалярного произведения резко отличает его от произведения чисел: если произведение двух чисел равно нулю, то равен нулю по крайней мере один из сомножителей.
144 Глава 4. Векторы и координаты 5. Скалярное произведение вектора а на себя, которое обозначается а2, равно квадрату длины этого вектора: аа=о2=|а|2. (10) ф Доказательство непосредственно следует из формулы (1), так как в этом случае ф=0. ф 2. Выражение через координаты перемножаемых векторов Пусть в пространстве выбрана прямоугольная система координат с началом координат в точке О. Составим таблицу скалярных произведений базисных векторов 7, /, k: /7=0, /2=1, ]k = 0, 1 (П) £7=0, £/=0, кг=\. J Пусть теперь заданы координаты двух векторов а и Бу т. е. известны разложения: d=XT+Yj+Zk, B=X'l+Yfj+Z'k. С помощью таблицы (1) найдем скалярное произведение векторов а и Ь: аВ= (Xl+Yj+Zk) (X'i+Y'J+Z'k) = =XX'P+XY'il+XZ'Tk+ YX'jt+ YY'j*+ + YZ']k+ZX'kl+ZY' Oj+ZZ'P= XX'+YY'+ZZ'. Таким образом, скалярное произведение двух векторов равно сумме произведений соответствующих координат этих векторов: aB=XX'+YY'+ZZ'. (12) Равенство (8), выражающее необходимое^ достаточное условие перпендикулярности, двух векторов, теперь может быть записано в виде XX'+YY'+ZZ'=0. (13) Пользуясь формулами (10) и (12), получаем формулу для вычисления длины вектора \a\=i *2+ УЧ-Z2. (14) Пусть заданы координаты двух точек М(х, у, z) и M'(x't y\ z').
§ 52. Векторное произведение векторов 145 Так как расстояние р(Л1, М') между ними равно длине вектора MM'tf—x, у'—у, z'—z)y то имеет место формула р(М, аг) =у(х'-*)ч- G/'-*/)2+ (z'-z)2. Пользуясь формулами (1), (12) и (14), получаем следующее выражение для косинуса угла ф между векторами а(Х, К, Z) и5(Г, r,Z'): XX'+YY'+ZZ' С05ф= (15) у Х2+ P+Z2 У Х*+ Y'*+Z'* § 52. Векторное произведение векторов Будем предполагать, что в пространстве выбрана правая система прямоугольных координат (О, 7, /, k). 1. Определение и основные ci о й с т в а Векторным произведением вектора а на вектор Б называется вектор, который обозначается символом [аБ] и определяется следующими тремя условиями: 1) длина вектора [аБ] равна \а\ |5|sinq>, где ф —угол между векторами а и Б; 2) вектор [аБ] перпендикулярен к каждому из векторов а и 5; ЗУ тройка векторов (а, 5, [аБ]} — правая. Рассмотрим основные свойства векторного произведения. 1. Равенство ^ [аВ)=0 (1) является необходимым и достаточным условием линейной зависимости (коллинеарности) векторов а и Б. ф Равенство (1) равносильно равенству |[a5]| = |a||5|sinq>=0. (2) Если векторы а и Б коллинеарны, то ф=0 или ф=я, и равенство (2), а следовательно, и (1) верны. Обратно, пусть векторы а и Б удовлетворяют равенству (1) и, следовательно, равенству (2). Если хотя бы один из этих векторов нулевой, его можно считать коллинеарным со вторым вектором. Если же оба вектора а и Б ненулевые, то из равенства (2) следует 51Пф=0, а значит, векторы а и Б коллинеарны. ф * 2. Если векторы а и Б нёколлинеарны, то длина вектора [аБ]
146 Глава 4. Векторы и координаты равна площади параллелограмма, построенного на отрезках ОА и ОВ, где О — произвольная точка и ОА=а, ОВ = Б. Доказательство следует из условия 1 в определении векторного произведения и известной теоремы элементарной геометрии. 3. Антикоммутативность: [аб]=-[ба]. (3) Доказательство следует из определения векторного произведения. 4. [(Ы)Б]=Х[аБ], (4) [а(ХБ)]=Х[а5]. (5) ф Докажем равенство (4). Если А,=0 или векторы а и Б коллинеарны, то, очевидно, это равенство имеет место. Пусть КФО и векторы а и Б неколлинеарны. Длина вектора Х[аБ] равна |Я| \а\ |5|sinq), где ф — угол между векторами а и Б. Если А,>0, то \[(Xa)B]\ = \M\№\sin<p=\K\\a\\B\sin<p. Если Я<0, то \[(Ка)Б] \ = \Щ |&| sin(jt—ф)= |Х| \а\ |5|sin ф. Итак, векторы, стоящие в обеих частях равенства (4), имеют одинаковые длины. Эти векторы коллинеарны, так как каждый из них перпендикулярен векторам а и Ь. Осталось показать, что векторы [(Ха)Б] и ЦаБ] (6) имеют одно и то же направление. Если Я>0, то векторы (6) направлены так же, как и вектор [аБ]. Если же К<.0, то каждый из векторов (6) направлен противоположно вектору [ab] и, следовательно, векторы (6) имеют одно и то же направление. Равенство (4) доказано. Равенство (5) легко выводится из равенств (3) и (4), что предоставляется проверить читателю, ф 5. Дистрибутивность: [(а+Б)с] = [ас] + [Бс], (7) [с(а+Б)] = [са] + [сБ]. (8) ф Докажем равенство (7). Когда среди векторов а, Б, с есть нулевой, равенство очевидно. Будем считать эти векторы ненуле-
§ 52. Векторное произведение векторов 14? выми и докажем сначала равенство [(а+Б)со] = [ас0] + [Бсо]9 '(9) с где с0= -TZT — вектор единичной длины. И Укажем один способ построения векторного произведения какого-либо вектора а на вектор единичной длины до. Отложим векторы а и Со от некоторой точки О, т. е. построим направленные Рис. 41 Рис. 42 отрезки ОА и ОС такие, что ОА=а, ОС=до (рис. 41). Проведем теперь через точку О плоскость П, перпендикулярную к отрезку ОС, и спроектируем на нее ортогонально отрезок ОА. Отрезок ОА'у являющийся проекцией отрезка ОА, повернем в плоскости П вокруг точки и на угол — по часовой стрелке^ если смотреть из точки С. Полученный в результате поворота отрезок О А" будет определять векторной произведение векторов а и до. В самом деле, если обозначить буквой ср угол между векторами а и до, то |ОЛ^| = |ОЛ^| = |ОЛ |.cos (-^—Ф) =|a||co|sinq>. Кроме того, направления вектбров О А" и [адо], очевидно, совпадают. Докажем теперь равенство (9). Для этого фиксируем произвольную точку О (ри£. 42) и построим векторы: ОС=до, ОА = а, АВ=Б и ОВ=а-\-Ъ. (Построим далее плоскость П, проходящую через точку О и перпендикулярную к отрезку ОС. Пусть А' и В'— ортогональные проекции точек Л и В на плоскость П. Повернем
148 Глава 4. Векторы и координаты я треугольник ОА'В' в плоскости П вокруг точки О на угол — по часовой стрелке, если смотреть с конца отрезка ОС, в результате получим треугольник ОА"В". Имеем ОЯ"=ОЛ'Ч-Л%'. (10) ОВ''=[(а+Б)со], ОА"=[адо], Л"В''=[5с0]. Следовательно, (10) => (9). Умножая обе части равенства (9) на | с |, получим равенство (7). Докажем равенство (8): [с(а+5)]=-[(а+5)с]=-[ас]-[5с] = [са] + [с5]. • Из доказанных "свойств векторного произведения вытекает следующее правило: для получения векторного произведения двух линейных комбинаций векторов достаточно каждый член первой комбинации умножить векторно на каждый член ёторой комби-, нации и результаты сложить. Пример. 1(2а+Щ (5с-3а)] = 10 [ас]+Л5 [6с\+9 [аБ]. 2. Выражение через "координаты перемножаемых векторов Составим вначале таблицу векторных произведений базисных векторов 7, /, k_правой декартовой прямоугольной системы координат (О, I,/, k): [77] =0, [77] =К [Щ =—и [77] = -£, [77]= 0, [Щ=1, \ [£7]=7, [Щ=— I [Щ=0. Найдем теперь векторное произведение двух произвольных векторов a=Xi+Y]+Zkt b=X'i+Y']+Z'k. Имеем ~~ [аБ] = [ (Х1+ Yj+Zk) (X'i+ Y'l+Z'k) ] = = (YZ'-ZY') 7+ (ZX'+XZ')]+ (XY'-YX') k. Легко заметить, что координаты векторного произведения равны
§ 52. Векторное произведение векторов 149 определителям второго порядка: Y Z I Y' Z'\ Итак, т (\Yr \, \z X \Z' X' Г ' Z X 1 Z' Х'\ \х Y 1 \Х' Y'\ t X 1 X' У (И) 3. Двойное векторное произведение Пусть заданы три произвольных вектора а, 5, с. Векторное произведение векторов [аБ] и с, т. е. вектор [[а&]с], называется двойным векторным произведением. Покажем, что.справедлива следующая формула: [ [аБ] с] = (ас) 5— (Б с) а, (12) имеющаяважные приложения в механике. Выберем прямоугольную систему координат (О, Г, /, k) следующим образом. Точку О возьмем произвольно, вектор I возьмем коллинеарным с вектором а, и, наконец, вектор / выберем так, чтобы векторы 7, /, Б были компланарны. Тогда векторы а, 5, с будут иметь следующие координаты: а(Х, 0, 0), Б(Х\ Г, 0), ЦХ", Y'\ Z"). Применяя дважды формулу (11), получаем [аБ] (0, 0, XY') и [[аБ]с] (-XY'Y",.XY'X"f 0). (13) С другой стороны, используя формулу (12) из § 51, получаем ас=ХХ", Бс=Х'Х"+ГУ". Поэтому (ХХ'Х", XY'X", 0) есть координаты вектора (ас) Б и (XX'X"+XY'Y"y О, 0) (14) (15) есть координаты вектора (Бс)а. Теперь формула (12) вытекает из сопоставления (13) — (15). 4. Тождество Якоби Векторное умножение не обладает свойством ассоциативности. В самом деле, например,
150 Глава 4. Векторы и координаты [[Й7ЖШЯ]. Векторное умножение удовлетворяет следующему условию: k [[аБ]с] + [[Бс]а] + [[са]Б]=0, (16) которое называется тождеством Якоби. Покажем справедливость тождества Якоби для любых трех векторов. Применяя формулу (12), находим [[Бс]а] = (Ба)с-(са)Б, (17) [[са]Б] = (сБ)а— (аБ)с. (18) Складывая равенства (12), (17) и (18), получаем тождество Якоби ^16). Результаты этого параграфа вместе с'результатами § 42 приводят к следующему выводу: множество всех векторов с операциями сложения и векторного умножения образует неассоциативное кольцо. Кольца, удовлетворяющие тождеству Якоби, называют кольцами Ли. Таким образом, векторы образуют кольцо Ли. Очевидно, это кольцо не имеет нейтрального элемента относительно умножения (единицы). § 53. Смешанное произведение векторов Пусть заданы какие-либо три вектора а, Б, с. Найдем векторное произведение^ [ab] и затем перемножим скалярно векторы [ab] и с. Число [ab]c называется смешанным произведением векторов а, Б и с. Следующие две теоремы выясняют геометрический смысл смешанного произведения трех векторов. Теорема 1. Пусть а, Б, с — три некомпланарных вектора. Отложим их от одной точки О, т. е. построим такие отрезки ОА, ОВ и ОС, что ОА = а, ОВ=Б, ЪЬ=с. Смешанное произведение [аБ]с равно объему параллелепипеда, построенного на отрезках О А, ОВ, ОС, взятому со знаком плюс, если тройка (а, Б, с) правая, и со знаком минус, если эта тройка левая. ф Обозначим буквой V объем параллелепипеда, построенного на отрезках ОА, ОВ, ОС, буквой S — площадь параллело- , грамма, построенного на отрезках ОА, ОВ, и буквой h — соответ-
§ 53. Смешанное произведение векторов 151 ствующую высоту параллелепипеда (рис. 43). Тогда V=Sh. Отложим теперь от точки О единичный отрезок ОЕ, перпендикулярный к отрезкам ОА и ОВ и направленный так, чтобы тройка векторов ОА, ОВ, ё=ОЕ была, правой. Очевидно, [аВ] =Se. Далее, [аВ]c=*S(ed) =S пр _с= = ±Sh=±Vf причем знак плюс ставится' здесь ^ в том случае, когда тройка а, Ь, с правая, и знак минус, если эта тройка левая, ф Рис 43 Теорема 2. Для того чтобы три вектора а, Б, с были компланарны (линейно зависимы), необходимо и достаточно, чтобы их смешанное произведение было равно нулю: [аВ]с=0. (1) ф Если векторы а, Б, с компланарны, то вектор [ab] или равен нулю или перпендикулярен к вектору с и, следовательно, [aB]c=0j т. е. равенство (1) имеет место. Обратно, пусть векторы а, Ьу с удовлетворяют равенству (1). Если бы эти векторы были некомпланарны, их можно было бы отложить от одной точки и построить параллелепипед с объемом У=±[аБ]сфО, что противоречит равенству (1). ф Из доказанных теорем легко вывести равенство [ab]c=a[bc]. (2) В самом деле, пусть тройка (а, Б, с) правая. Тогда левая часть равенства (2) выражает объем параллелепипеда, построенного на отрезках ОА, ОВ, ОС, таких, что ОА=а, ОВ = Б, ОС=с. Правую часть равенства (2) можно представить в виде [Бс]а. (3)
152 Глава 4. Векторы и координаты Так как тройка (Ь, с> а) вместе с тройкой (а, 5, с) является правой, то величина (3), а вместе с ней и правая часть равенства (2) равна I/, и (2) верно. Если тройка (а, 6, с) левая, то левой будет также и тройка (5, с, а), и обе части равенства (2) равны — V. Наконец, если векторы а, Б, с компланарны, обе части равенства (2) равны нулю. # В дальнейшем смешанные произведения [аБ]с и а [Б с] обозначаются символом аБс. Смешанное произведение меняет лишь знак при перестановке двух сомножителей, т. е. аБс=—Бас=—асБ=—сБа. (4) В самом деле, если векторы а, 5, с компланарны, то все произведения, выписанные в равенствах (4), равны нулю. Если векторы а, 5, с некомпланарны и образуют правую (левую) тройку, то тройки (5, а, с) у (а, с, Б) и (с, Б> а) являются левыми (правыми) и равенства (4) следуют из теоремы 1. Найдем теперь выражение смешанного произведения через координаты перемножаемых векторов. Пусть в некоторой правой прямоугольной системе координат Oxyz заданы координаты трех векторов: ад, yu Zi), ад, у2, z2), ад, у3, z3). (5) По формулам (И) § 51 и (12) § 52 получаем [аБ] {YiZi-ZJb Z^-Xfa, ХЛ-ВД, аБс= [аБ] с= (YiZ2-ZiY2)X3+ (Z^-X^) У3+ + (^i Y2— YfX2) Zz=Xi Y2Z3-\-Z\X2Yz-\m Y1Z2XZ— —Zi Y2Xs—X\Z2 Уз— YtX2Zs. Используя понятие определителя, приходим к формуле аБс= Xi х2 х3 Yi Z, Y2 Z2 Yz Z3 (6) Необходимое и достаточное условие (1) (линейной зависимости) трех векторов (5)- в виде *i Yt Х2 Х3 Y2 Yz Z2 Zz =0. компланарности можно записать (7) Условие (7) получено нами в прямоугольной системе координат. Покажем, что оно имеет место и э аффинной системе координат,
§53. Смешанное произведение векторов 153 ф Пусть наряду с указанной выше прямоугольной системой координат Oxyz задана некоторая аффинная система координат (О', ё/, ё2', ё/)9 причем векторы й, Б и с имеют в новой системе координат следующие координаты: а (ЛУ, У/, Zi'), б(Х2', У2', Z2'), c{Xz\ Уз', Zz). Как известно из § 49, старые и новые координаты произвольного вектора связаны формулами: Х^аиХ'+апУ'+апР, Y=C&2tX ~|~0^22У -\-OL2zZ 9 Z = (X$iX' -f- 0&32 У ~t" OLzzZ'. Заметим, что имеет место неравенство rf= <хц ai2 ai3 C&21 CX22 0&23 0&31 азг схзз #0, (8) так как в силу теоремы 1 и формулы (6) d есть объем параллелепипеда, определяемого тремя некомпланарными векторами ё/, h' и ёз'> отложенными от одной точки. Используя теорему из § 35, получаем XS Хг' Хг' 17 17 К/ - =d Xi Л2 *3 z/ 22' Z/ |*i' X/ *з' К I Zy У2 Zz Уз Zz an 0C2i «31 Cfcl2 OC22 0&32 ai3 0C23 OC33 Ух' Z,' У г Z% \ Y 2 3 . Отсюда в силу неравенства (8) вытекает, что (7) равносильно равенству = 0. XS Хг' Х3' Yi' 17 Уз' Zif z2' z3'
154 Глава 5. Прямая на плоскости Глава 5 ПРЯМАЯ НА ПЛОСКОСТИ В настоящей главе мы будем предполагать, что в пространстве фиксирована некоторая плоскость и все наши утверждения относятся только к точкам этой плоскости. § 54. Уравнение прямой с угловым коэффициентом Пусть А — некоторая прямая. Направляющим вектором прямой А называется любой ненулевой вектор, который состоит из отрезков, параллельных этой прямой. Очевидно, для данной прямой существует бесконечное множество направляющих векторов, коллинеарных друг другу. Предположим, что выбрана некоторая аффинная система координат Оху. Составим уравнение прямой А. Пусть сначала прямая А параллельна оси Оу и пересекает ось Ох в точке Р(ау 0) (рис. 44). Очевидно, для любой точки М(ху у) прямой А и только для точек этой прямой имеем х=а. (1) Итак, (1) есть уравнение прямой, параллельной оси Оу и пересекающей ось Ох в точке Р(а, 0). Заметим, что любой направляющий вектор такой прямой имеет координаты (0, т). Пусть теперь прямая А не параллельна оси Оу, Тогда для всех направляющих векторов а(/, т) этой прямой отношение т:1 имеет одно и то же постоянное значение k> называемое угловым коэффициентом прямой А относительно выбранной системы координат (см. следствие 2 § 47). Если, в частности, рассматривается прямоугольная система координат (О, Т, ]), то для углового коэффициента прямой А, очевидно, имеем где а — угол между вектором I и любым направляющим вектором прямой А (рис. 45). Угол а называется углом наклона прямой А к оси Ох. Пусть заданы угловой коэффициент k прямой А и точка Р(ау Ь), через которую эта прямая проходит. Составим уравнение прямой Д. Пусть М(х, у) —произвольная точка этой прямой, отличная от точки Р. Тогда вектор РМ(х—а, у—Ь) есть направ-
§ 54. Уравнение прямой с угловым коэффициентом 155 ляющий вектор прямой Д, поэтому у-ь х—а k. Отсюда y—b=k(x—a). (2) (3) Этому уравнению удовлетворяет любая точка прямой Д (в том числе и точка Р). Предположим теперь, что некоторая точка \РШ,о) *t Рис. 44 Рис. 45 Mt(xu j/i), отличная от точки Р, удовлетворяет уравнению (3), т. е. yi—b=k(x<r-a). (4) Так как М^ФР, то jci—афО. Поэтому из (2) и (4) получаем У—Ь _ yj—b х—а Xi—a Итак, направляющие векторы прямых Д и PMi коллинеарны. Так как обе эти прямые проходят через точку Я, то они совпадают и, следовательно, точка Mi лежит на прямой Д. Таким образом, (3) есть уравнение прямой, имеющей угловой коэффициент k и проходящей через точку Р(а, Ь). Если, в частности, точка Р лежит на оси Оу, т. е. Р(0, Ь) (рис. 45), то уравнение (3) принимает вид y=kx-\-b. Если прямая параллельна оси Ох и проходит через точку Р(0, 6), то ее уравнение есть у=Ь.
156 Глава 5. Прямая на плоскости § 55. Общее уравнение прямой. Уравнение прямой в отрезках Уравнением первой степени или, иначе, линейным уравнением относительно неизвестных х и у называется уравнение вида Ах+Ву+С=0, (1) где коэффициенты Л и В не равны нулю одновременно. Теорема. Пусть на плоскости фиксирована некоторая аффинная система координат Оху. Тогда любая прямая может быть задана линейным уравнением (1). Обратно, любое уравнение вида (1) задает прямую. ф Пусть задана прямая Д, не параллельная оси Оу. Как показано в § 54, прямая А может быть задана линейным уравнением y—kx—b=0. (2) Если прямая Л параллельна оси Оу, она снова задается линейным уравнением х—а=0. (3) Рассмотрим теперь произвольное линейное уравнение (1). Если ВфО, то, разделив обе части этого уравнения на В и введя обозначения А г мы придем к уравнению (2). Но уравнение (2) задает прямую, имеющую угловой коэффициент k и проходящую через точку Я(0, Ь). Если в уравнении (1) В=0, то это уравнение приводится к виду (3) и, следовательно, задает прямую, параллельную оси Оу. % Замечания. 1. В доказанной теореме существенно то, что под хну понимаются аффинные, в частности прямоугольные, координаты. Так, уравнение р—1 =0, линейное относительно полярных координат р.и ср, выражает^ окружность, а не прямую. 2. Прямая может быть задана в аффинных координатах и нелинейным уравнением. Например, у(х*+\)=0 есть уравнение оси Ох. Уравнение (1) называется общим уравнением прямой. Отметим некоторые частные случаи этого уравнения, а именно выясним, к чему приводит равенство нулю некоторых его коэффициентов.
§ 55. Общее уравнение прямой. Уравнение прямой в отрезках 157 1. С=0, т. е. уравение (1) имеет вид Ах+Ву=0., (4) Прямая проходит через начало координат, так как уравнение (4) удовлетворяется значениями *=0, у=0. Обратно, пусть прямая (1) проходит через начало координат. Тогда, вставляя в уравнение (1) значения х=0, у=0, получаем С=0. Итак,.для того чтобы прямая (1) проходила через начало координат, необходимо и достаточно, чтобы свободный член С уравнения (1) был равен нулю. 2. 5=0, СФО, т. е. уравнение (1) имеет вид Ах+С=0. (5) Это, очевидно, уравнение прямой, параллельной оси Оу и не совпадающей с этой осью. Обратно, любая такая прямая задается уравнением вида (5). 3. 5=0, С=0, т. е. уравнение (1) имеет вид х=0 и задает ось Оу. Аналогично истолковываются случаи: 4. Л=0, СфО. 5. Л=0, С=0. Пусть прямая Д задана уравнением (1) относительно прямо- угольной системы координат. Тогда вектор п(А, В) перпендикулярен прямой Д, а вектор а(—В, А) является ее направляющим вектором. В самом деле, возьмем на прямой Д две различные точки Mi(хи У\) и М2(х2, f/2). Имеем Л*!+5У1+С=0, Ах2+Ву2+С=0. * Отсюда 'A(xt-x2)+B(yi-y2)=0. Это равенство означает, что вектор n(Af В) перпендикулярен вектору М2Мt (xi—x2y у\—у2), а значит, перпендикулярен и прямой Д. Так как векторы Я(Л, 5) и а(—Ву Л), очевидно, перпендикулярны, то а есть направляющий вектор прямой Д. Пусть в уравнении (1) всче три коэффициента Л, 5 и С отличны от нуля. Разделив обе части этого уравнения на —С и введя
158 Глава 5. Прямая на плоскости обозначения а= — А ' Ъ = - В ' представим его в виде а о Очевидно, а и Ь являются величинами отрезков, которые прямая отсекает на координатных осях Ох и Оу, считая от начала координат. Уравнение (6) называется уравнением прямой в отрезках. § 56. Векторная и параметрическая формы уравнения прямой. Уравнение прямой, проходящей через две заданные точки Пусть на плоскости фиксирована некоторая точка О. Тогда произвольная точка М плоскости определяется заданием своего радиус-вектора ОМ. - Предположим, что Д — некоторая прямая на плоскости, го — радиус-вектор какой-то фиксированной точки этой прямой и а — направляющий вектор прямой. Обозначим буквой г радиус-вектор произвольной точки М плоскости. Если точка М принадлежит прямой Д, то, очевидно (рис. 46), f—?o=ta, (1) где t — некоторое вещественное число. Обратно, если t — произвольное вещественное число, то точка М с радиус-вектором г, определяемым из равенства (1), принадлежит прямой Д. Равенство (1) или равносильное ему равенство r=r0+ta (2) называется векторным параметрическим уравнением прямой Д. Предположим теперь, что на плоскости выбрана аффинная система координат с началом в точке О. Пусть а(/, m), fo(*o, f/o), г(ху у). Тогда в силу теоре*мы из § 47 равенство (2) равносильно следующей системе равенств: Рис. 46 x=x0-\-ltf y=y0+mt. (3)
§ 57. Совместное исследование уравнений двух прямых 159 Система уравнений (3) называется системой параметрических уравнений прямой Д. Если прямая Д не параллельна ни одной из координатных осей, то 1ф0, шфО и система уравнений (3) равносильна одному уравнению х—хр у—уо I ~ m ' которое называется каноническим уравнением прямой на плоскости. Пусть заданы две точки М0(х0, у0) и Mi(xu y{) прямой Д, не параллельной ни одной из координатных осей. Тогда M0Mi(xi—Xo,yi—yo) —направляющий вектор этой прямой и х—Хо у—уо Xi—XQ ~ yi—yo есть уравнение прямой Д. § 57. Совместное исследование уравнений двух прямых Рассмотрим систему двух линейных уравнений с двумя неизвестными х и у: Aix'+Biy+Ci=09 1 А2х+В2у+С2=0. }• (1) Исследуем вопрос о существовании и количестве вещественных решений системы '(1). Возьмем на плоскости аффинную систему координат Оху. Тогда каждое из уравнений системы (1) будет определять некоторую прямую. Любое вещественное решение системы (1), т. е. два вещественных числа х и у, удовлетворяющие обоим уравнениям этой системы, будет давать координаты точки М(ху у), принадлежащей обеим прямым (1). Обратно, координаты любой точки М(х, у), принадлежащей обеим прямым (1),— решение системы (1). Таким образом, вопрос о существовании и количестве вещественных решений системы (1) равносилен вопросу о существовании и количестве общих точек у прямых (1). Очевидно, возможны три случая: 1) прямые (1) пересекаются, т. е. имеют единственную общую точку; система (1) имеет единственное решение; 2) прямые (1) совпадают, т. е. оба уравнения системы (1) определяют одну и ту же прямую; система (1) имеет бесконечное множество решений;
160 • Глава 5. Прямая на плоскости 3) прямые (1) различны и параллельны; система (1) не имеет решений. Теорема. Необходимыми и достаточными условиями того, чтобы имел место один из трех указанных случаев, являются соответственно следующие условия: 1) не существует такого вещественного числа I, что А{±=1А2у .Bi=lB2t 2) существует такое вещественное число I, что Ai=lA2, Bi=lB2y Ci=lC2, 3) существует такое вещественное число I, что АХ=1А2, Bi=lB2i С^Ф1С2. Для доказательства потребуется следующая Лемма. Для того чтобы коэффициенты уравнений (1) удовле-, творяли равенствам Ai=lA2l Bi=lB2y (2) необходимо и достаточно, чтобы угловые коэффициенты прямых (1) либо были равны, либо оба не существовали. (3) ф Пусть у прямых (1) угловые коэффициенты равны, т. е. At = А2 Bi В2 ' ь Если А2Ф0, то равенство (3) можно переписать в виде Ai= В, А2 В2' Обозначив общую величину этих дробей буквой /, получим равенства (2). Если же А2=0 и, следовательно, At=0, то равенства (2) снова верны. Пусть теперь у прямых (1) угловые коэффициенты не существуют. Это означает, что Bi=B2=0t и равенства (2) снова имеют место. Обратно, пусть равенства (2) справедливы. Если Bi=^=0, то и 52=7^=0. Тогда, разделив первое из равенств (2) на второе, получим Aj = А2 Bt В2 '
§ 57. Совместное исследование уравнений двух прямых 161 что приводит к равенству угловых коэффициентов прямых (1). Если же Bi=0, и, следовательно, В2=0, то угловые коэффициенты прямых (1) не существуют. Лемма доказана. На основании леммы первое условие теоремы необходимо и достаточно для того, чтобы угловые коэффициенты прямых (1) не были равны или один из них не существовал, а другой существовал. Но это в свою очередь равносильно тому, что прямые (1) пересекаются в одной точке. Предположим теперь, что имеет место второе условие теоремы. Тогда первое уравнение системы (1). можно представить в виде 1(А2х+В2у+С2)=0 и, следовательно, оно определяет ту л^е прямую, что и второе уравнение этой системы. Обратно, пусть оба уравнения системы (1) задают одну и ту же прямую. Тогда на основании леммы имеют место равенства (2). Если в системе (1) под х> и у понимать координаты какой-либо- фиксированной точки, лежащей на прямой, задаваемой каждым из уравнений системы, то эти уравнения станут верными равенствами. Первое из них в силу равенств (2) можно представить в виде l(A2x+B2y)+Ci=0. (4) Умножая обе части второго равен'ства системы (1) на / и вычитая из равенства (4), получим d=/C2. Следовательно, второе условие теоремы имеет место, если оба уравнения системы (1) выражают одну и ту же прямую. Необходимость и достаточность третьего условия теоремы для параллельности и несовпадения прямых (1) легко выводится рассуждением от противного, ф Замечание. Условия теоремы можно переписать в виде: • Ai Bi 1)-А~Ф^' Ai Bi ^_ d Аг Вг Сг Аг Вг Сг если ни один из знаменателей выписанных дробей не равен нулю.
162 Глава 5. Прямая на плоскости § 58. Пучок прямых Пучком прямых будем называть совокупность всех прямых плоскости, проходящих через некоторую точку S — центр пучка. Для задания пучка достаточно задать его центр или любые две его прямые. Пусть на плоскости выбрана аффинная система координат и заданы уравнения двух различных прямых AiX+Bty+d^O, (1) А2х+В2у+С2=0, (2) пересекающихся в точке S(xo, уо). Рассмотрим уравнение a(Aix+Biy+Ci)+^(A2x+B2y+C2)=^09 (З) где аир — произвольные числа, не равные одновременно нулю. Покажем, что это уравнение определяет прямую,, проходящую через точку 5. Перепишем его в виде (аЛ1+рЛ2)д:+(аВ1+рВ2)у+аС1+рС2=0. (4) Здесь коэффициенты при неизвестных не могут одновременно равняться нулю. В самом деле, пусть аЛ!+рЛ2=0, afii+pB2=0 (5) и, например, а=^=0. Тогда и А2Ф0, так как из А2=0 следует 7li=0, что противоречит условию пересечения прямых (1) и (2). Аналогично B2=fc0, и равенства (5) можно представить в виде: j!l=__P_ Bj = p At = £i А2 а* В2 а А2 В2* . Это снова противоречит условию пересечения прямых (1) и (2). Итак, коэффициенты при неизвестных в уравнении (4) не могут одновременно равняться нулю, и это уравнение при любых a и р, не равных одновременно нулю, задает прямую. Утверждение о том, что прямая (3) проходит через точку S(x0, Уо) пересечения прямых (1) и (2), очевидно, так как: 4iJto+Biyo+Ci=0 и А2х0+В2у0+С2=0=> =^ a (AiXo+Biyo+Ci) +P (А2Хо+В2у0+С2) =0. Покажем теперь, что числа аир можно подобрать так, чтобы уравнение (3) выражало любую наперед заданную прямую пучка с центром в точке S. Пусть Mi(xu y{) —произвольная точка
§ 59. Расстояние от точки до прямой 163 плоскости, отличная от S. Достаточно показать, что аир можно подобрать так, чтобы прямая (3) проходила через точку Мь Это условие записывается в виде a (AiXi+Biyi+Ci) +p (A2xt+B2yi+C2) =0. (6) Так как точка Af4 отлична от точки S, то по крайней мере одна .изскобок в равенстве (6) отлична от нуля. Если Ам+Вы+С^О, то равенство (6) можно переписать в виде _ А2Х1+В2у1+С2 g. а Aixi+Biyi+Ci P' Придавая р произвольное отличное от нуля значение, получим соответствующее значение а. Итак, уравнение (3) при любых а и р, не равных одновременно нулю, выражает прямую пучка, определяемого прямыми (1) и (2), и, обратно, любая прямая этого пучка может быть задана уравнением (3). Уравнение (3) называется уравнением пучка прямых, определяемого прямыми (1) и (2). Отметим, что уравнение прямой (1) получается из уравнения (3) при р=0 и произвольном а=^=0, а уравнение (2)—при а=0 и любом Разделив обе части уравнения (3) на а и введя обозначение 0 -J— =Х, перепишем полученное уравнение в виде Aix+Biy+Ci+X(A2X+B2y+C2) =0. (7) Это уравнение при любом X выражает некоторую прямую пучка, определяемого прямыми (1) и (2). Обратно, любая прямая этого пучка, отличная от прямой (2), может быть задана уравнением (7) при некотором^. Если заданы координаты центра пучка S(x0, y0)9 то уравнение пучка, очевидно, имеет вид а(*—*о)+Р(у—Уо)=0. § 59. Расстояние от точки до прямой Пусть А — некоторая прямая на плоскости. Под расстоянием от точки Мо до прямой Д понимается длина перпендикуляра, опущенного из точки М0 на прямую А. Возьмем некоторую прямоугольную систему координат (0,7, J) (рис. 47). Рассмотрим орт ё, перпендикулярный к прямой Д. Если прямая Д проходит через
164 Глава 5. Прямая на плоскости начало координат, то в качестве ё выберем любой из двух взаимно'противоположных ортов, перпендикулярных к этой прямой. Если же прямая А не проходит через начало координат, то в качестве ё возьмем тот орт, который направлен от начала координат к прямой. Обозначим буквой а угол между векторами I и ё. Тогда e(cosa, sin a). Обозначим буквой N точку пересечения прямой Д с перпендикуляром Дь проведенным из начала координат к этой прямой, и буквой р расстояние от начала координат до прямой Д, т. е. длину отрезка ON. Точка М(ху у) принадлежит прямой Д тогда и только тогда, когда ортогональная проекция точки М на прямую Ai совпадает с точкой N. Это условие равносильно следующему: ОМ ё=р. Выражая скалярное произведение через координаты перемножаемых векторов, получаем х cos a+y sin a—p=0. (1) Это уравнение называется .нормальным уравнением прямой Д. Прямая Л разбивает множество всех точек плоскости, не принадлежащих этой прямой, на два подмножества, называемых полуплоскостями. Ту полуплоскость, в которую направлен орт ё, отложенный от точки N9 назовем положительной, а вторую полуплоскость—отрицательной. Заметим, что начало координат всегда находится в отрицательной полуплоскости или лежит на прямой Д. * Отклонение б точки М0 от прямой Д определяется следующим образом: б равно расстоянию d от точки Af0 до прямой Д, если точка М0 лежит в положительной полуплоскости; б=— d, если точка М0 лежит в отрицательной полуплоскости; 6=d=0, если точка М0 принадлежит прямой Д. Теорема 1. Пусть в плоскости, снабженной прямоугольной системой координат, задана прямая Д своим нормальным уравнением (1). Тогда отклонение б произвольной точки М0(хо, уо) от прямой Д и расстояние d от точки М0 до прямой Д задаются формулами: 6=x0cos a+yosin a—p, (2) d= |xo cos a+t/osin a—p\. (3)
§ 59. Расстояние от точки до прямой 165 ф Пусть No — основание перпендикуляра, опущенного из точки М0 на прямую Ai (см. рис. 47). Используя формулу 1 § 44, получаем 6= (NN0) = (ONo) - (ON) = ОМ0 ё-р= =Хо cos а+уо sin a-—p. Формула (3) следует из (2), так как d=|6|. ф Формула (2) приводит к следующему правилу. Чтобы найти отклонение какой-либо точки М0 от прямой, достаточно в левую часть нормального уравнения этой прямой вместо х и у подставить координаты точки М0. Полученное число и есть искомое отклонение. Пусть теперь дано общее уравнение прямой Ах+Ву+С=0, (4) и мы хотим найти нормальное уравнение (1) этой прямой. Так как уравнения (1) и (4) задают одну и ту же прямую, то их коэффициенты пропорциональны: cosa=L4, sin а=1В, —р=КС. -■ (5) Из первых двух соотношений (5) получаем Согласно третьему равенству (5), знак X надо брать противоположным знаку свободного члена С в уравнении (4), если СфО. При С=0 для К можно брать любой знак: изменение знака А, приводит к тому, что положительная и отрицательная полуплоскости меняются местами. Число А, называется нормирующим множителем для уравнения (4), так как после умножения на % это уравнение становится нормальным. На основании изложенного можно записать формулы для отклонения и расстояния от точки M0(xq9 y0) до прямой (4): б= Ахр+Вуо+С d= \Axo+Byo+C\ • ±1/А2+В2 ' -]/.А2+В* Пусть задано уравнение (4). Обозначим величину Ахо+Вуо+С буквой 6'.
166 Глава 5. Прямая на плоскости Теорема 2. Для всех точек одной и той же полуплоскости, определяемой прямой (4), б' принимает численные значения, одинаковые по знаку, для всех точек второй полуплоскости б' имеет противоположный знак. ф Утверждение этой теоремы для нормального уравнения 1 (Ах+Ву+С)=0 или, другими словами, для величины ± у А 2+52 следует из теоремы 1. Но так как б и б' отличаются только постоянным множителем, не зависящим от точки М0(хо, t/o), то это утверждение справедливо и для б', ф Теорема 2 позволяет выяснить геометрический смысл неравенств Ах+Ву+ОО, (7) Ах+Ву+С<0, (8) связывающих две переменные х и у. Выберем на плоскости прямоугольную систему координат Оху и будем считать величины х и у координатами точки. Тогда неравенству (7) удовлетворяют координаты тех и только тех точек, которые лежат в одной из двух полуплоскостей, определяемых прямой Ах+Ву+С=0; неравенству (8) удовлетворяют точки второй полуплоскости и только они. Далее, каждое из неравенств Ах+Ву+С^О и Ах+Ву+С^О задает полуплоскость вместе с ограничивающей' ее прямой. * Пусть теперь х и у обозначают координаты произвольной точки плоскости в некоторой аффинной системе координат Оху. Рассмотрим прямую Д, которая задается в системе координат Оху уравнением Ах+Ву+С=0. (9) Возьмем какую-либо прямоугольную систему координат Ох'у'.
§ 59. Расстояние от точки до прямой * 167 Как известно из § 49, формулы преобразования координат имеют вид х=ацх'+а,12У'+а>и ) y=a2ix'+ci22y'+a2' J Подставляя эти выражения для х и у в левую часть уравнения (9), получаем Ax+By+C=(aitA+a2iB)x'-\- + (a2iA+a22B)y'+aiA+a2B+C. (41) Поэтому (aiiA+a2iB)x'+(a2iA+a22B)y'-\-atA+(X2B+C=0 есть уравнение прямой Д в системе координат Ох'у'. Из равенствами) вытекает, что указанный выше геометрический смысл неравенств (7) и (8) имеет силу и в аффинной системе координат., Пример. Относительно прямоугольной системы координат Оху заданы уравнения двух прямых: /ле—2^+1=0, 4х+2у-7=0. (12) Составить уравнение прямой, которая проходит через точку пересечения прямых (12) и делит пополам угол между этими прямыми, содержащий точку Мо(1, 3). Решение. Пусть М(х, у) —произвольная точка искомой прямой, лежащая внутри того угла между данными прямыми, в котором находится точка Мо. Так как расстояния от точки М до данных прямых равны, то, согласно второй формуле (6), ' |*-2у+1| _ \4х+2у-7\ -■ —- . (1J) 1/5 У 20 Так как точки М и Мо лежат по одну сторону от первой из данных прямых, ' то результаты подстановок координат этих точек в левую часть первого уравнения (12), т. е. числа х>—2у+\ и —4 имеют одинаковые знаки, следовательно, \ х-2у+\<0. \ Аналогично, имеют одинаковые знаки числа 4х+2у—7 и 3, следовательно, \ 4х+2у—7>0. Теперь равенство (13) можно переписать в виде \ х—2у+\ 4х+2у—7 У5 /20 'или 6х—2г/—5=0.
168 Глава 5. Прямая на плоскости Этому уравнению удовлетворяют координаты всех точек искомой прямой, которые лежат внутри того же угла, что и точка М0. Очевидно, ему удовлетворяют координаты и остальных точек этой прямой. Итак, (14)—уравнение искомой прямой. § 60. Угол между двумя прямыми Пусть на плоскости заданы две прямые Ai и Д2 своими уравнениями относительно прямоугольной системы координат: AiX+Biy+Ci=09 (1) А2х+В2у+С2=0, (2) Как указывалось в § 55, в качестве направляющих векторов этих прямых можно взять векторы /zi(—fii, At), nz{—B2y A2). Используя формулу (15) § 51, получаем AiA2+BiB2 /оч cos ф= t (3) У\ О Л*1 1 h/ 1у<г Л Рис. 48 w +Sl2 № + #22 Здесь буквой ф обозначен один из двух углов, образуемых прямыми Ai и Д2 при их пересечении. Если эти прямые не пересекаются, т. е, параллельны, то угол между ними, по определению, считается равным нулю. Из формулы (3) следует необходимое и достаточное условие перпендикулярности прямых (1) и (2): AiA2+BiB2=0. (4) Пусть теперь прямые А4 и Д2 заданы в прямоугольной системе координат уравнениями y=klx+bu (5) y=k2x+b2. (6) Обозначим буквой ф угол, на который надо повернуть прямую Ai вокруг точки пересечения этих прямых, чтобы совместить ее с прямой Д2. Если прямые Ai и Д2 параллельны, то считаем ф=0. Пусть ai и а2— углы наклона прямых Ai и Д2 к оси Оху т. е. ^i===tg at, &2=tg a2 (рис. 48). Тогда ф=а2—at и tg9=tg(a2—ai) = tga2—tgai l+tgaitga2 k2—ki \+hk2
§ 61. Общее уравнение плоскости 169 Итак, k2—ki ^=1Щ- (7) Из этой формулы легко получить условие перпендикулярности прямых (5) и (6). Оно отвечает случаю, когда тангенс угла ф не существует, т. е. случаю обращения в нуль знаменателя в формуле (7): l-f-&i&2=0. Итак, необходимое и достаточное условие перпендикулярности прямых (5) и (6) имеет вид Глава 6 плоскости и прямые § 61. Общее уравнение плоскости Линейным уравнением относительно неизвестных х, у, z называется уравнение вида Ax+By+Cz+D=0, (1) где хотя бы один из коэффициентов Л, В, .С отличен от нуля. Мы докажем, что всякое линейное уравнение есть уравнение некоторой плоскости и всякая плоскость может быть задана в аффинной системе координат линейным уравнением. Лемма. Пусть фигура П в некоторой аффинной системе координат задается уравнением (1). Тогда в произвольной аффинной системе координат П может быть задана линейным уравнением. ф Пусть 0/x/y/z/ — новая аффинная система координат. Чтобы получить уравнение, задающее фигуру П в новых координатах, подставим в левую часть уравнения (1) выражения х, у, z через новые координаты х\ у', z' по формулам .(6) из § 49 и приведем подобные члены. В результате получим Aix'+Biy'+CiZ'+D^O. (2) Легко видеть, что среди чисел Аи Ви Ci есть отличные от нуля. В самом деле, если Л1=В1 = С1=0, (3) то при Z>i=7^0 соотношению (2) не удовлетворяет ни одна из точек пространства, а при Di=0 это соотношение не накладывает ни-
170 Глава 6. Плоскости и прямые каких ограничений на координаты точек. С другой стороны, уравнению (1) удовлетворяет, очевидно, хотя бы одна из точек, но не каждая точка пространства. Следовательно, равенства (3) невозможны одновременно, ф Теорема. Если в пространстве выбрана некоторая аффинная система координат Oxyz, то всякая плоскость может "быть заГг If дана линейным уравнением (1) и, обратно, всякое уравнение вида (1) есть уравне- • ние плоскости. г М(х,у,2] ф Пусть сначала Oxyz— прямоугольная система координат, а П — некоторая плоскость (рис. 49). Отметим в этой плоскости какую- либо точку Мо(х0у у0, 20) и отложим от нее вектор Рис 49 M0N(A, В, С), перпендикулярный плоскости П. Для того чтобы точка М(х, у, z) лежала на плоскости П, необходимо и достаточно, чтобы вектор М0М был перпендикулярен к вектору M0N. Записывая условие перпендикулярности этих векторов по формуле (13) § 51, получаем уравнение плоскости П: A (x-x0)+B(y-y0)+C(z-Zo) = 0. (4) Полагая —Ах0—Ву0—Cz0=D9 приводим уравнение (4) к виду (1). Таким образом, (1) —уравнение плоскости {I. Пусть теперь, обратно, (1) —произвольное линейное уравнение. Рассмотрим множество всех точек, координаты которых удовлетворяют этому уравнению. Пусть М0(хо, у0, z0) —одна из этих точек. Тогда Ax0+By0+Czo+D = Q — верное равенство. Вычитая его почленно из уравнения (1), получаем уравнение (4), эквивалентное уравнению (1). Но мы уже знаем, что (4) — уравнение плоскости, проходящей через точку М0 и перпендикулярной вектору MoN(A, В, С). Значит, и (1) — уравнение этой плоскости. Теорема доказана для случая прямо-
§61. Общее уравнение плоскости 171 угольной системы координат. Справедливость теоремы в случае общих аффинных координат вытекает из предыдущей леммы, ф Замечания. 1. В доказанной теореме существенно то, что под х, у и г понимаются аффинные, в частности прямоугольные, координаты. Так, уравнение р—1=0, линейное относительно сферических координат р, ф и 6, выражает сферу, а не плоскость. ' ' 2. Плоскость можно задать в аффинной системе координат не только * линейным уравнением. Так, уравнение третьей степени z(x*+\)=0 €сть уравнение плоскости Оху. Уравнение (1) называется общим уравнением плоскости. Подчеркнем еще раз, что в случае прямоугольной системы координат вектор п(А, В, С) перпендикулярен к плоскости (1). Отметим некоторые частные случаи уравнения (1). 1. Ax+By+Cz=0 — л/равнение плоскости, проходящей через начало координат. 2. By+Cz+D=0 (йфО) — (5) уравнение плоскости, параллельной оси Ох. При этом плоскость не имеет с осью Ох общих точек, если £)=?*= 0, и проходит через эту ось, если D=0. Заметим, что мы называем плоскость параллельной прямой, если эта плоскость не имеет с прямой общих точек или проходит через нее. В самом деле, пусть йфО. Предположим, что плоскость (5) имеет с осью Ох общую точку Мо(х0, 0, 0). Подставляя координаты этой точки в уравнение (5), получаем D=0, что противоречит условию. Пусть теперь D=0. Тогда любая точка М (#, 0,0) оси Ох удовлетворяет уравнению (5) и, следовательно, плоскость (5) проходит через ось Ох. 3. Cz+D=0— . (6) уравнение плоскости, параллельной плоскости Оху. При этом плоскости (6) и Оху не имеют общих точек, если ИФ0у и совпадают, если D=0. Доказательство оставляется читателю. Заметим, что мы называем две плоскости.параллельными, если они не имеют общих точек или совпадают. 4. 2=0 — уравнение плоскости Оху. Аналогично рассматриваются и другие случаи равенства нулю некоторых коэффициентов уравнения (1).
172 Глава 6. Плоскости и прямые Пусть теперь в уравнении (1) все коэффициенты отличны от нуля. Тогда, введя обозначения D t D D "=--j-> ь=-~вГ> С=--^^ можно представить уравнение (1) в виде - + i + - = l- (7) а Ь с v ' Нетрудно показать, что а, Ь и с есть величины отрезков, которые плоскость (7) отсекает на осях Ох, Оу и Ozr считая от точки О. Уравнение (7) называется уравнением плоскости в отрезках. § 62. Совместное исследование уравнений двух плоскостей Пусть выбрана аффинная система координат Oxyz и заданы уравнения двух плоскостей AtX+Biy+CiZ+D^O, (1) A2x+B2y+C2z+D2=0. (2) Будем различать следующие случаи взаимного расположения двух плоскостей: 1) пересекаются по прямой; 2) параллельны, но не совпадают; 3) совпадают. Найдем условия, которым удовлетворяют коэффициенты уравнений (1) и (2) в каждом из перечисленных случаев. Следом плоскости (1) на плоскости Оху называется прямая пересечения этих плоскостей. Очевидно, этот след в системе координат Оху имеет уравнение AiX+B^j+D^O. Аналогично определяются следы какой-либо плоскости на координатных плоскостях Oxz и Oyz. Плоскости (1) и (2) совпадают тогда и только тогда, когда их следы на координатных плоскостях совпадают. Используя1 условие совпадения двух прямых на плоскости, найденное в § 57, получаем: для того чтобы плоскости, выражаемые уравнениями (1) и (2), совпадали, необходимо и достаточно, чтобы коэффициенты этих уравнений были пропорциональны, т. е. чтобы существовало такое число %ф$у что Ai = KA2y Bt=lB2y d = XC2f Di=XD2. (3)
§ 63. Пучок плоскостей 173 Если ни одно из чисел Л2, В2у С2у D2 не равно нулю, то соотношения (3) можно переписать в виде Ах _ BY _ _Cj_ _ Di ,А2 В2 С2 D2 Аналогично получаются необходимые и достаточные условия параллельности плоскостей (1) и (2) в случае их несовпадения: Ai=kA2, Bi=XB2y С1=ХС2, D^lDz (4) или At =Bt = d _^ Dt ! A2 B2 C2 D2 Теперь очевидно следующее утверждение: для того чтобы плоскости (1) и (2) пересекались, необходимо и достаточно, что- бы коэффициенты Aiy В\] Ci не были пропорциональны коэффициентам Л2, В2, С2. " г § 63. Пучок и связка плоскостей Пучком плоскостей называется множество всех плоскостей, проходящих через некоторую прямую, называемую осью пучка. Пусть выбрана аффинная система координат Oxyz и заданы уравнения двух пересекающихся плоскостей: AiX+Biy+CiZ+D^O, (1) A2x+B2y+C2z+D2=0. (2) Теорема 1. Если а и |5 — два числа, не равные одновременно нулю, то уравнение a(Aix+Biy+Ciz+Di)+^(A2x+B2y+C2z+D2)=0 (З) задает некоторую плоскость пучка, определяемого плоскостями (1) и (2). Обратно, любая плоскость этого пучка может быть задана уравнением (3) при некоторых а и р. Доказательство этой теоремы проводится так же, как и в случае пучка прямых на плоскости (§ 58), и предоставляется читателю. Связкой плоскостей называется множество всех плоскостей, проходящих через некоторую точку, называемую центром связки. Если выбрана аффинная система координат Oxyz и задан центр :вязки S(x0y уоУ г0), то, очевидно, любая плоскость связки может
174 Глава 6. Плоскости и прямые быть задана уравнением A(x-x0)+B(y-yo)+C(z-Zo)=0, (4) где Л, В, С — числа, не равные одновременно нулю. Обратно, при любых Л, 5, С, не равных одновременно нулю, уравнение (4) задает плоскость связки с центром в точке S(xo, t/o, Zo). Можно дать также уравнение связки плоскостей в форме, аналогичной уравнению (3), а именно, имеет место Теорема 2. Пусть x+Bly+Clz+Di=Ot ) (5) Alx+Bly+Ciz+Di=Ot ) A2x+B2y+C2z+D2=0, A3x+B3y+C3z+D3=0 уравнения трех плоскостей, проходящих через точку S (х0, t/o, г$\ и таких, что выполняется условие Ai Bt d Л 2 В2 С2 А3 В3 С3 ¥=0. (6) Тогда для любых чисел а, р, у, не равных одновременно нулю, уравнение а (AtX+Biy+dz+Di) +p (A2x+B2y+C2z+D2) + +Т(Лз*+£3у+Сз2+£>з) =0 (7) задает некоторую плоскость связки с центром в точке S. Обратно, любая плоскость этой связки может быть задана уравнением (7) при подходящем выборе а, р, V- ф Перепишем уравнение (7) в виде (Aia+A2$+A3y)x+(Bia+B2$+B3y)y+ + (Cia+C2^+C3y)z+Dia+D2^+D3y=0. (8) Предположим, что коэффициенты при х, у, z в этом уравнении равны нулю, т. е. Aia+A2$+A3y=0; ) Я1а+Я2р+Яз7=0, (9) Cia+C2p+C3v=^0. J В силу условия (6) система уравнений (9) относительно неизвестных а, р, у имеет единственное решение: a=p=v=0, что про*
§ 63. Пучок плоскостей 175 тивор.ечит выбору а, р, у. Итак, (8), а поэтому и (7) есть уравнение первой степени относительно х, у, z и, следовательно, задает плоскость. Так как точка S удовлетворяет каждому из уравнений-(5), то она удовлетворяет и уравнению (7), т. е. плоскость -(7) принадлежит связке. Пусть теперь задано уравнение произвольной плоскости связки Ax+By+Cz+D=0. (10) Рассмотрим систему уравнений Aia+A2$+A3y=A, ] В&+В$+В3у=В, (11) С&+С$+С3у=С ] относительно неизвестных a, p, у. В силу условия (6) система (11) имеет единственное решение. Так как каждая из плоскостей (5), а также плоскость (10) проходят через точку S(*o, Уо> г0), то £i=— А 1*о—Biyo—CiZo, D2=— А2х0—В2у0—C2z0,> D3=—A3Xo—B3yo—CsZot D =— Axq—fif/o—CzQ. Отсюда в силу равенств (11) получаем Dia+D$+D3y=D. Таким образом, при выбранных нами a, P, у уравнения (7) и (10) совпадают. # Пример. Требуется составить уравнение плоскости П, проходящей через прямую пересечения плоскостей 2x-y+z-3=0, (12) x+y+z+\=0 (13) и параллельной оси Ох. Решение. Плоскость П принадлежит пучку, определяемому плоскостями (12) и (13), и, следовательно, задается уравнением a(2x-y+z-3)+${x+y+z+\) =0. (14) Так как плоскость П параллельна оси Ох, то после приведения подобных членов коэффициент при х в уравнении (14) должен быть равен нулю: 2а+Р = 0, т. е. р = —2а. Подставляя это значение р в уравнение (14) и сокращая уравнение на —а, получаем
176 Глава 6. Плоскости и прямые § 64. Расстояние от точки до плоскости Пусть Oxyz — прямоугольная система координат и П — некоторая плоскость (рис. 50). Проведем через точку О прямую Д, перпендикулярную к плоскости П, и пусть N— точка пересече-, лия А и.П. Введем на прямой А положительное направление, '^/\ совпадающее с направлением вектора ON, и пусть п— единичный вектор, направление которого совпадает с направлением вектора ON. Если плоскость П проходит через начало координат, то в качестве положительного направления на 'прямой А можно выбрать любое из двух возможных направлений. Обозначим буквами а, р и у углы, обра- Рис. 50 зуемые вектором п соответственно с осями Ох, Оу и Ог. Величины cos a, cos p и cos v Базываются направляющими косинусами вектора п. Так как вектор п единичный и n(cos a, cos р, cos у), то cos2 а+cos2 p+cos2 y=1. (1) Наконец, обозначим буквой р длину вектора ON, т. е. расстояние ют начала координат О до плоскости П. Пусть теперь М(х, у, г) —произвольная точка плоскости П. Тогда (ON) =р=пр _ОМ = ОМ п=х cos a+y cos $+z cos y9 следовательно, х cos a+f/ cos р+г cos y—p = 0. (2) Этому равенству удовлетворяет любая точка М(х, у, г) плоскости П и не удовлетворяет никакая точка, не лежащая на этой плоскости. Равенство (2) называется нормальным уравнением плоскости П. Введем еще некоторые понятия. Плоскость П разбивает множество всех точек пространства, не принадлежащих плоскости П, на два подмножества, называемых полупространствами. Назовем положительным то полупространство, в которое направлен вектор Я;, второе полупространство назовем отрицательном. Заметим, что начало координат всегда расположено, в отрицательном полупространстве или в плоскости П. Пусть Afo(*o, уо, 2о) — произвольная точка пространства и d — расстояние'от точки М0 до плоскости П. Отклонением б точки Afa от плоскости П назовем расстояние d, взятое со знаком плюс,
§ 64. Расстояние от. точки до плоскости 177 если Мо лежит в положительном полупространстве, и со знаком минус, если М0 лежит в отрицательном полупространстве. Теорема 1. Имеют место формулы: 8=Хо cos cc+#o cos P+20 cos у—р. (3) d— | Хо cos а-\-уо cos Р+^о cos у—р |. (4) ф Пусть No — ортогональная проекция точки М0 на прямую ON. Тогда 6= (NN0) = (ON0) - (ON) =п 6М0-Р= =Хо cos а+#о cos Р+«г0 cos у—р. Формула (3) доказана. Формула (4) непосредственно следует из формулы (3), так как, по определению, d= | б |. ф Пусть теперь задано общее уравнение плоскости Ax+By+Cz+D = 0, (5) и мы хотим привести его к нормальному виду (2). Так как уравнение (5) и искомое уравнение (2) задают одну и ту же плоскость, то их коэффициенты пропорциональны: M=cosa, XB = cosp, XC=cosy, XD = —p. (6) Из первых трех соотношений (6), используя формулу (1), получим Ь=± 1 (7) уЛ2+£2+С2 Согласно последней формуле (6), знак в формуле (7) надо выбирать противоположным знаку свободного члена D уравнения (5) (если £) = 0, знак в формуле (7) можно выбирать любой). Величина К называется нормирующим множителем уравнения (5) в соответствии с тем, что после умножения на X это уравнение становится нормальным. Теперь легко получить формулы для отклонения б и расстояния d от точки Мо(х0, уоУ г0) до плоскости (5): Л Axo+Byo+Czo+D о= =—, \Ахо+Вуо+Сгр+Р\ УЛ2+Я2+С2 ' - :.
178 Глава 6. Плоскости и прямые Теорема 2. Результаты подстановок координат двух точек в левую часть уравнения (5) являются числами одного знака, если эти точки лежат по одну сторону от плоскости; эти числа имеют разные знаки, если точки лежат по разные стороны от плоскости. Доказательство этой теоремы аналогично доказательству соответствующей теоремы для прямой на плоскости, приведенному в § 59, и предоставляется читателю. Используя теорему 2, можно дать геометрическое истолкование неравенствам: Ax+By+Cz+D>69 (8) Ax+By+Cz+D<0. (9) Выберем некоторую аффинную систему координат и будем понимать под ху у, z координаты точки в этой системе координат. Тогда неравенству (8) удовлетворяют координаты тех и только тех точек, которые лежат в одном из двух полупространств, определяемых плоскостью Ax+By+Cz+D=0; неравенству (9) удовлетворяют точки второго полупространства и только они. Далее, каждое из неравенств Ax+By+Cz+D^O и Ax+By+Cz+D^O задает полупространство вместе с ограничивающей его плоскостью. § 65. Различные виды уравнений прямой 1. Прямая .как пересечение двух плоскостей Прямую в пространстве можно представить как пересечение любых двух различных плоскостей, проходящих через эту прямую. Следовательно, в аффинной системе координат ее можно задать системой двух линейных уравнений AiX+Biy+dz+D^O, J A2X+B2y+C2z+D2=0. J W Так как плоскости, определяющие прямую, не параллельны, то коэффициенты при неизвестных в уравнениях (1) не пропорциональны.
f _ § 65. Различные виды уравнений прямой 179 Уравнения системы (1), выражающей заданную прямую, ^определяются неоднозначно: каждое из них может быть заменено уравнением вида . a(A{x+Biy+Ciz+Di)+$(A2x+B2y+C2z+D2)=0, где а и р — произвольные числа, «е равные одновременно нулю. Очевидно, любая система вида (1) с непропорциональными коэффициентами при неизвестных определяет в пространстве некоторую прямую. Замечание. Прямая в аффинных координатах может задаваться и системой нелинейных уравнений. Например, система задает ось Oz. 2. П а р а м етр и ч е ск и е уравнения прямой Пусть А — прямая. Ненулевой вектор а назовем направляющим вектором прямой Д, если любой направленный отрезок из класса а параллелен Д или принадлежит ей. Фиксируем аффинную систему координат. Если а(/, т, п) —направляющий вектор прямой Д, а Мо(х0, t/ь, Zo) — некоторая точка этой прямой, то произвольная точка М(х, у, г) пространства принадлежит прямой Д тогда и лишь тогда, когда вектор М<М{х—лг0, #—Уо, z—Zo) коллинеарен вектору а. -Записав условие коллинеарности этих векторов, получим параметрические уравнения прямой, проходящей через точку Mo(xof уо, Zq) параллельно вектору а: x—Xo=ltt y-~yo=mt1 z—z0=nt или x=x0+ltf y=yo+mt9 z=z0+nt. (2) Обозначим через г и fo векторы ОМ и ОМ0 (рис. 51). Тогда система (2) равносильна одному векторному уравнению г=г0+4а, (3) (3) — векторное параметрическое уравнение прямой, проходящей через точку М0(го) параллельно вектору а.
180 Глава 6. Плоскости и прямые 3. Канонические уравнения прямой Если /, т, пФО, то соотношения (2) равносильны трем уравнениям: * х—Хо у—Уо у—Уо z—Zo х—Хо z—z0 I m ' m которые мы запишем в виде х—Хо у—уо I m I Z—Zp п (4) (5); (6): (6) — канонические уравнения прямой, проходящей через точку Мо(хо, (/о, Zo) параллельно вектору а(/, /я, п). Каждое из уравнений (5) есть следствие двух остальных. Поэтому вместо (5) можно написать, например, систему уравнений х—Хр у—Уо I ~ m У Х—Хо Z—Zq I п Тем самым мы представим прямую как пересечение двух плоскостей, одна из которых параллельна оси Ог, другая — оси Оу. § 66. Некоторые задачи В этом параграфе будут рассмотрены некоторые часто встречающиеся задачи, связанные с прямыми и плоскостями. Будем предполагать, что фиксирована аффинная система координат Oxyz. 1. Уравнения прямой, проходящей через две данные точки Пусть заданы две различные точки Mi(xu yu Zi) и М2(Х2, у2, z2) прямой Д. Тогда вектор MiM2(x2—Xiy у2—уи z2—Zi) является направляющим вектором этой прямой, и мы можем записать параметрические уравнения прямой Д, пользуясь формулами (2) из § 65: X^Xi~\- уХ2—Xi) t, y=yi+(y2—yi)t, \ (i> Z = Zi-\-(z2—Zi)t.
§ 66. Некоторые задачи 181 Если прямая Д не Параллельна ни одной из координатных плоскостей, то х2¥=хи УгФуи *гфг\ и вместо (1) можно записать канонические уравнения прямой Д: X—Х\ Хг—Xi У—У1 У2—У1 Z—Zi z2—zi 2. Уравнение плоскости, проходящей через данную точку и параллельной двум данным векторам Пусть заданы точка Mi(xu Уи Zi), (2) принадлежащая плоскости П, и два неколлинеарных вектора а(/, т, п) и b(ky mu ni), (3) параллельных этой плоскости. Пусть далее М(х, уу z) —.произвольная точка пространства и г=ОМу Го=ОМ0 (рис 52). Для того чтобы точка М принадлежала плоскости П, необходимо и достаточно, чтобы векторы а, Б и г—г0 были компланарны. Как. известно из § 53, это равносильно равенству нулю смешанного произведения указанных векторов: Рие. 52 или X—Xi I /1 {f—r0)ab=0 у—Hi z—zt m n mi tii =0. (4) (5) По теореме 3 § 45 вектор r—r0 можно-разложить по некол- линеарным векторам а и Ь, т. е. представить в Виде Отсюда г—Го=аа+р&. г=го+аа+рб. (б> Когда аир принимают все вещественные значения, точка М пробегает всю плоскость П. Равенство (6) называется векторным параметрическим уравнением плоскости П.
182 Глава 6. Плоскости и прямые В силу теоремы из § 47 всякое векторное равенство можно заменить тремя равенствами, в которых участвуют координаты этих векторов. Сделав такую замену для уравнения (6), получим параметрические уравнения плоскости П в координатах: x=Xt+al+$lu z=Zi+an+pni. (7) Итак, плоскость П, проходящую через точку (2)' параллельно векторам (3), можно задать уравнениями одного из видов (4)-(7). 3. Уравнение плоскости, проходящей через три данные точки «. Если заданы три точки Mt (лг±, уи Zi), М 2 (*2,1/2, z2), Мг(х3, Уз, 23), не лежащие на одной прямой, то уравнение плоскости, проходящей через эти точки, легко получить из уравнения (5): х —Xt у —yi z —zt Xi—Xi Уг—yi z2—Zi Xz—Xi У3—У1 z3—Zi =0. (8) 4. Взаимное расположение прямой и плоскости Пусть заданы уравнения плоскости П Ax+By+Cz+D=0 и прямой x=xo+lt9 y=yo+rnt, z=z0+nt (9) (10) и требуется определить взаимное расположение П и Д. При этом мы будем различать следующие случаи взаимного расположения прямой и плоскости: 1) прямая пересекает плоскость в одной точке; 2) прямая параллельна плоскости и не лежит в ней; 3) прямая принадлежит плоскости. Найдем для каждого из этих случаев условия, которым должны^удовлетворять коэффициенты уравнений (9) и (10). Подставляя выражения для х9 у и z из уравнений (10) в (9), получаем (Al+Bm+Cn)t+Ax0+ByQ+Czo+D=0. Значения параметра t, удовлетворяющие Этому равенству, соот«
§ 66. Некоторые задачи 183 ^ветствуют тем точйам прямой Д, которые лежат в плоскости П. .Теперь легко получить необходимые и достаточные условия для : каждого из перечисленных выше случаев взаимного расположения прямой (10) и плоскости (9): А1+Вт+Спф0 — условие того, что прямая пересекает плоскость в одной точке; Al+Bm+Cn=0, Axo+Byo+Czo+D^O— условия того, что прямая параллельна плоскости и не лежит в ней; Al+Bm+Cn=0, Axo+Byo+Cz0+D=0 — условия того, что прямая принадлежит плоскости. 5. Взаимное расположение двух прямых в пространстве Пусть заданы уравнения двух прямых: x=x0+lt, y=y0+mt, z=Zo+nt, (11) x=Xi+liT, y=yi+mix, z=Zi+nix (12) и требуется определить их взаимное расположение. При этом мы будем различать следующие случаи взаимного расположения двух прямых в пространстве: 1) пересекаются в одной точке; 3) совпадают; 3) параллельны, но не совпадают;. 4) являются скрещивающимися. Найдем для каждого из этих случаев условия, которым должны удовлетворять коэффициенты уравнений (11)ч и (12). Рассмотрим направляющие векторы прямых (11) и (12): а(/, m, я), ai(lu rnu щ). Пусть эти векторы коллинеарны, т. е. l=%lu m=Xmu п=Ыи (13) Тогда прямые параллельны, т. е. совпадают или лежат в одной плоскости и не имеют общих точек. При этом прямые совпадают тогда и только тогда, когда вектор М0Мц где М0(х0, у0, z0)r Mt(xiy у и Zi), коллинеарен векторам а и аА и, следовательно, Xi—Xo=[ily yi—yo=\im, zi—zQ=\in. (14)
184 Глава 6. Плоскости и прямые Итак, равенства (13) и (14) дают необходимые и достаточные условия для совпадения прямых (11) и (12). Для того чтобы прямые (11) и (12) были параллельны и не совпадали, необходимо и достаточно, чтобы условия (13) выполнялись, а условия (14) — нет. Рис. 53 Пусть теперь векторы а и а4 неколлинеарны, т. е. условия (13) не выполняются. Тогда прямые (11) и (12) пересекаются в одной точке или являются скрещивающимися. Если они пересекаются и, следовательно, лежат в одной плоскости П, то* векторы a, at и MqMi компланарны, поэтому *1—*0 J/l—Уо Zi — 2о" I m n к mi tti = 0. (15) Обратно, пусть векторы а и at неколлинеарны и имеет jviecro равенство (15). Найдем точки А и At такие, что МоА = а, MlAi = ui (рис. 53). Тогда отрезки М0Ми М0А и MiAt определят плоскость, в которой лежат прямые (И) и (12). Так как векторы а и d\_ неколлинеарны, то прямые пересекаются. Итак, прямые (11) и (12) пересекаются в одной точке тогда и только тогда, когда их направляющие векторы неколлинеарны и имеет место равенство (15). Заметим, что равенство (15) имеет место не только при пересечении прямых (11) и (12) в одной точке, но и при их параллельности, так как в этом случае вторая и третья строки определителя пропорциональны. Отсюда получаем необходимое и достаточное условие того, что прямые (11) и (12) являются скрещивающимися: Ху—Хо У1 — Уо Zi — Zo I m n k mt щ
§ 66. Некоторые задачи 185 Будем теперь предполагать, что фиксирована прямоугольная система координат Oxyz. 6. Расстояние от точки до прямой в пространстве Найдем формулу, ^выражающую расстояние d от точки Mt с радиус-вектором гЛ до прямой Д, заданной уравнением f=r0+ta. (16) Отложим вектор а от точки Мо, т. е. найдем такую точку М3 на прямой Д, что М0М3=а (рис. 54). Построим параллелограмм на отрезках MQM3 и MoMi как на сторонах. Тогда искомое расстояние d равно длине перпендикуляра MiN, проведенного из вершины Aft к противоположной сто- роне параллелограмма. Так как площадь параллелограмма равна | [го—ru a] \ = \a\d, то формула | [го—ги а] | d= \а\ задает расстояние от точки Mi с радиус-вектором г\ до прямой (16). 7. Угол между двумя плоскостями Пусть требуется найти величину угла ф, который образуют две плоскости: 4i*+fio/+Ci2+Di=0, (17) A2x+B2y+C2z+D2=0. (18) Очевидно, величина угла между плоскостями (17) и (18) равна углу между векторами ni(Aiy Bu Ci) и я2(Л2, В2, С2), перпендикулярными к этим плоскостям. По формуле (15) из § 51 получаем А,А2+В,В2+С,С2 ,10. СОБф= — — . (19) У Л 12 + 6l2+C12 У А#+В#+С# Из формулы (19) следует необходимое и достаточное условие перпендикулярности плоскостей (17) и (18): AiA2+BiB2+CiC2=X).
186 Глава 6. Плоскости и прямые 8. Угол между двумя прямыми* Так как величина угла между двумя прямыми равна углу между направляющими векторами этих прямых, то для величины Ма а/ \П ш: Рис. 54 Рис. 55 угла ф между прямыми (11) и (12) имеем следующую формулу: cos ф= y/2+m2+n2 V l?+m?+n? (20) Из формулы (20) вытекает необходимое и достаточное условие перпендикулярности прямых (И) и (12): . //i+mmi+nn1=0. 9. Угол между прямой и плоскостью Пусть заданы прямая x=x0+lt, y=yQ-\-mtf z=z0-\-nt (21) Ax+By+Cz+D=0. (22) и плоскость Обозначим' буквой ф величину угла, образованного прямой (21) с. ортогональной проекцией этой прямой на плоскость (22) (рис. 55). Если прямая перпендикулярна плоскости, то положим Ф= —. Будем считать, что О^ф^ —. Так как вектор п(А, Я, С) перпендикулярен плоскости (22), то направляющий вектор п а(/, т, п) прямой.(21) -образует с вектором п угол \|)= — ф я или -ф= ■ —- +ф. Поэтому 5Шф = |C0S \|)| = \Al+Bm+Cn\ уА2+В2+С* У Р+т2+п?
§ 67. Эллипс 187 Глава 7 ПЛОСКИЕ ФИГУРЫ ВТОРОГО ПОРЯДКА § 67. Эллипс 1. Определение и вывод канонического уравнения Пусть на плоскости заданы две точки Ft и F2i расстояние между которыми равно 2с, и дано число а, удовлетворяющее неравенству с<а. (1) Множество всех точек плоскости, для каждой из которых сумма расстояний от точек Л и F2 равна 2а, называется эллипсом, Z точки F\ и F2 называются фокусами эллипса. Если условие (1) не выполнено, то рассматриваемое множество либо является отрезком прямой, заключенным между фокусами, либо не содержит ни одной точки. . v Из. определения эллипса вытекает следующий способ его построения: если концы нерастяжимой нити длины 2а закрепить р точках Ft и F2 и натянуть нить острием карандаша, то при движении острия будет вычерчиваться эллипс с фокусами Ft, F2 и с суммой расстояний произвольной точки эллипса от фокусов,, равной 2а (рис. 56). Рис. 56 Составим уравнение эллипса. Для этого выберем декартову прямоугольную систему координат так, чтобы ось Ох проходила йерез фокусы /V и F2 и имела положительное направление от fi к F2y начало координат возьмем в середине отрезка FiF2. £огда/ч(—<?, 0),F2(c, 0). г Пусть М(ху у) — произвольная точка эллипса. Тогда | FiM| = У (*+*)2+*/2, | F2M | =у(*_с)2+<Д (2)
188 Глава 7. Плоские фигуры второго порядка По определению эллипса |ЛМ| + |^2М|=2а. (3) Подставляя сюда значения |/УИ| и \F2M\ из формул (2), получаем 1/(х+с)2+У2 + Цх-с)2+у2=2а. (4) Это и есть уравнение эллипса, так как ему удовлетворяют координаты всех точек эллипса и только этих точек. Преобразуем уравнение (4). Перенесем второй радикал левой части уравнения в правую часть и возведем обе части полученного уравнения в квадрат; после приведения подобных членов лолучим а у (х—с)2-\-у2=а2—сх. Возводя обе части этого равенства в квадрат и приводя подобные члены, найдем: (а2—с2) х2+а2у2=а2 (а2—с2), 4 + —г^г=1- (5) а2 а2—с2 Введем в рассмотрение новую величину Ь=у а2— с2; в силу неравенства (1) она вещественна. Тогда Ъ2=а2—с2, (6) ;и уравнение (5) примет вид - + ^=1. (7) а2 ^ Ь2 к ' Мы показали, что любая точка эллипса удовлетворяет уравнению (7). Покажем теперь обратное: любая точка М(х, у), удовлетворяющая уравнению (7), принадлежит эллипсу, т. ё. удовлетворяет соотношению (3). Из уравнения (7) получаем *=*(1-£)'-
§ 67. Эллипс 189 Используя это соотношение и равенство (6), находим \FiM | =У (х+с)*+у2 = "J/ х2+2сх+с2+Ь2-х* ^ = Так как в силу равенства (7) \х\ ^а и, кроме того, а>с, то , с аА л: ... а I \FiM\=a+ — x. (8) Аналогично можно получить формулу \F2M\=a- — х. (9) а Складывая последние два равенства, получаем равенство (3). Итак, соотношение (7) является уравнением эллипса. Оно называется каноническим уравнением эллипса. 2. Исследование формы Исходя из уравнения (7), исследуем форму эллипса. Координаты точек эллипса ограничены неравенствами \х\ ^йу \у\ ^.Ь. Это означает, что эллипс есть ограниченная фигура, не выходящая за пределы прямоугольника, изображенного на рис. 57. Далее заметим, что в уравнение (7) входят только четные степени координат. Поэтому эллипс наряду с каждой точкой (х, у) содержит также точки (—ху у), (х, —у), (—х, —у). А это означает, что эллипс есть фигура, симметричная относительно осей Ох и Оу и начала координат. Поэтому для исследования формы эллипса достаточно рассмотреть его в первой координатной четверти, в остальных четвертях его строение определяется по симметрии. Для первой четверти из уравнения (7) получаем у= — Уа*-х*. (10) При увеличении х от нуля до а у монотонно убывает от Ь до 0. График функции (10) изображен на рис. 58. Достроив остальные три четверти- эллипса по симметрии, получим весь эллипс (рис.59). Оси симметрии эллипса (оси Ох и Оу) называют просто его реями, а центр его симметрии (точку (?)—центром эллипса.
190 Глава 7. Плоские фигуры второго порядка Точки Аи Аг, Bi и Въ пересечения эллипса с его осями называют вершинами эллипса. Полуосями эллипса называют отрезки OAt и ОВи а также их длины а и Ь. При наших предположениях, когда фокусы эллипса расположены на оси Ох, из соотношения (6) следует а>Ь. В этом случае а называется большой полуосью, ■ff О { 2а _ i i Л г. Рис. 57 Рис. 58 а Ъ — малой. Однако уравнение (7) можно рассматривать и при условии а<6, это будет уравнение эллипса, фокусы которого расположены на оси Оу и большая полуось равна Ь. Наконец, рассмотрим уравнение (7) при а=Ь. Тогда его можно переписать в виде х2+у2=а2. Это уравнение окружности радиуса а с центром в начале координат. Впредь йы будем рассматривать окружность как эллипс с равными полуосями, фокусы в этом случае совпадают с центром окружности. 3. Эксцентриситет Эксцентриситетом эллипса называется число 8 = а сю Так как с<а, то е<1. У окружности оба фокуса совпадают, поэтому с=0 и е=0. Перепишем равенство (11) в виде >=УЧ¥ Отсюда видно, что эксцентриситет е характеризует форму эллипса: чем ближе е к нулю, тем больше эллипс похож на окружность; при увеличении е эллипс становится более вытянутым. На рис. 60 изображены эллипсы с различными значениями е.
§ 67. Эллипс 191 4. Фокальные радиусы Фокальными радиусами точки М эллипса называются отрезки прямых, соединяющих эту точку с фокусами F± и F2. Их длины б--о Рис. 59 Рис. 60 Л и г2 задаются формулами (8) и (9), которые мы перепишем в виде ri=a+ex, г2==а—е#. 5. Фокальный параметр Восставим в одном из фокусов F эллипса перпендикуляр к большой оси до пересечения в точке М с эллипсом. Фокальным параметром эллипса называется длина отрезка FM. Обозначим его буквой р. Если -эллипс задан уравнением (7) и изображен на рис. 59 вместе с перпендикуляром F2M, то р — ордината точки М. Так как абсцисса этой точки равна с, то из уравнения эллипса (7) получим с2 . р2 т*+ 1. Отсюда, используя равенство (6), найдем 62 Р= а 6. Параметрические уравнения Пусть задан эллипс (7), причем а>Ь (рис> 61). Опишем вокруг центра эллипса две окружности, одну радиуса а, другую радиуса Ъ. Проведем из центра эллипса произвольный луч
192 Глава 7. Плоские фигуры второго порядка и обозначим буквой / угол, который образует этот луч с осью Ох. Пусть проведенный луч" пересекает меньшую окружность в точке Р, а большую —в точке Q. Проведем через точку Р прямую, параллельную оси Ох, и через точку Q — прямую, параллельную оси Оу. Покажем, что точка М(х, у) пересечения этих прямых принадлежит данному эллипсу. Обозначив буквами Pi и Qi проекции точек Р и Q на ось Ох, получим: х= (OQi) = \OQ\cos t=acos ty y=(QiM) = (PlP) = = \OP\smt=bsmt. Итак, *=acos/,| y=bsmt. J (I2) Подставив выражения (12) в уравнение (7), убедимся, что оно удовлетворяется при любом значении /. Следовательно, (12) являются параметрическими уравнениями эллипса (7). Вместе с тем мы получили способ построения эллипса по заданным полуосям. А именно, проведя указанное выше построение для ряда лучей, исходящих из начала координат и образующих между собой достаточно малые углы, мы найдем ряд точек эллипса. Соединив эти точки плавной линией, получим рисунок эллипса. 7. Пересечение с прямой Выясним вопрос о количестве точек пересечения эллипса (7) с какой-либо прямой. Рассмотрим вначале прямую, не параллельную оси Оу. Ее уравнение y=kx+m. (13)- Чтобы найти точки пересечения этой прямой с эллипсом (7), подставим выражение у из формулы (13) в уравнение (7). Получим х2 (kx+m)2 а2+ б* — или (a2k2+bz)x2+2a*kmx+az(m2-bz)=0. Это уравнение дает абсциссы искомых точек пересечения.
§ 68. Гипербола 193 Поскольку оно квадратное, то в зависимости от характера его корней возможны следующие случаи: 1) прямая пересекает эллипс в двух различных точках, 2) прямая имеет с эллипсом одну общую точку и называется касательной к эллипсу, 3) прямая не имеет с эллипсом общих точек. ^ Легко показать, что для прямой, параллельной оси Оу, имеют место те же случаи. § 68. Гипербола 1. Определение и вывод канонического уравнения Пусть на плоскости заданы две точки Fi и F2, расстояние между которыми равно 2с. Пусть, далее, выбрано число а, удовлетворяющее неравенствам 0<а<с. (1) Множество всех точек плоскости, для каждой из которых абсолютная величина разности расстояний от точек Ft и F2 равна 2а, называется гиперболой. Точки Ft и F2 называются фокусами гиперболы. Указанное множество при а=0 есть прямая, при а=с — два луча, а при а>с не содержит ни одной точки. Составим уравнение гиперболы. Для этого выберем декартову прямоугольную систему координат так, чтобы ось Ох проходила через фокусы Fit F2 и имела положительное направление от Ft к F2\ начало координат О возьмем в середине отрезка FiF2. Тогда Л (—с, 0), F2(ct 0). Пусть М(ху у) —произвольная точка гиперболы.- По определению гиперболы \\FiM\-\F2M\\=2a или \FiM\-\F2M\=±2a. (2) Вставляя в (2) выражения -\FtM\=y(x+c)*+y* и \F2M\=i(x-c)*+y\. получим Цх+с)2+У2 - У(*-с)2+г/2= ±2а. (3) Это и есть уравнение гиперболы. Упростим его. Перенесем второй радикал левой части равенства (3) вправо и возведем обе
194 Глава 7. Плоские фигуры второго порядка части полученного равенства в квадрат. Приведя подобные члены, получим сх—а2=±а Цх—с) 2+у2. Возводя обе части этого равенства в квадрат и приводя подобные члены, придем к равенству или (с2—а2)*2—а2#2=а2(с2—а2) *2 У2 =1 а2 с2—а2 Введем в рассмотрение новую величину 6=]/ с2— а2. В силу неравенств (1) она вещественна. Тогда 62=с2—а2 и уравнение (4) принимает вид а2 б2 (4) (5) (6) Мы. показали, что из равенства (3) следует равенство (6), т. е. что любая точка гиперболы удовлетворяет уравнению (6). Покажем обратное. Пусть точка М(х, у) удовлетворяет уравнению (6). Тогда Используя это соотношение и равенство (5), найдем |/yW|=V(x+c)4-^ *г* 2+2сх+с*+ — х2—62= а1 = У^х2+2сх+а2 = Аналогично можно получить - |/УИ| = с — х+а а х—а\ . (7). (8)
§ 68. Гипербола 196 Так как из равенства (6) следует, что \х\^а, а в силу неравенств (1) с>ау то для х^а формулы (7) и (8) дают: \FiM\ = — х+а, | F2M | = — х-а. (9) Следовательно, \FiM\-\F2M\=2a. Для х*^—а \Р,М\=-^х-а, \F2M\=--^x+a. (10) Следовательно, ■\FiM\-\F2M\=-2a. Итак, любая точка, удовлетворяющая уравнению (6), удовлетворяет также уравнению (2) и, значит, (3). Мы показали, что уравнения (3) и (6) равносильны и, следовательно, (6) является уравнением гиперболы. Оно называется каноническим уравнением гиперболы. 2. Исследование формы гиперболы. Асимптоты Из уравнения (6) видно, что \х\^а. Это означает, что вся гипербола располагается вне полосы, ограниченной прямыми х=—а и х=а. Так как в уравнение (6) входят. только четные степени координат, то гипербола симметрична относительно каждой из координатных осей и начала координат. Поэтому достаточно узнать форму гиперболы в одной из координатных четвертей, например в первой, в остальных четвертях гипербола строится по симметрии. Из уравнения (6) для первой четверти получаем у=—l/x2—a29 x^za. (11) График этой функции, начиная от точки А (а, 0), уходит неограниченно вправо и вверх (рис. 62). Покажем, что при этом он как угодно близко подходит к прямой У=— х. (12) a v ' Проведем из произвольной точки М графика (11) прямую, параллельную оси О у и пересекающую прямую (12) в точке N. Кроме того, опустим из точки М перпендикуляр MP на прямую (12). *
196 Глава 7. Плоские фигуры второго порядка Тогда | MN | = Y-y = — (x-r- ilP^cF) = ab *lim | AM |=0. x+ 1 хг—Ф x-+°° Так как \MP\ < \MN\\ то lim |AfP|=0. 4 Итак, когда переменная точка М уходит в бесконечность по той части гиперболы (&), которая расположена в первой четверти, расстояние этой точки от прямой (12) стремится к нулю. В соответствии с этим говорят, что гипербола асимптотически приближается к прямой (12), и эту прямую называют асимптотой гиперболы. Очевидно, у гиперболы (6) две асимптоты: Ь Ь у=—х и у= х. * а а Сделаем рисунок гиперболы (6). Сначала строим так называемый основной прямоугольник гиперболы, центр которого совпадает с началом координат, а стороны равны 2а и 26 и парал- Рис. 62 Рис. 63 лельны осям Ох и Оу, Прямые, на которых расположены диагонали этого прямоугольника, являются асимптотами гиперболы. После этого делается рисунок самой гиперболы (рис. 63). Подчеркнем, что гипербола — это фигура, состоящая из двух отдельных ветвей; знак плюс в правой части равенства (2) соответствует правой ветви, а знакминус — левой ветви. Центр симметрии гиперболы называется ее центром. Оси симметрии назы-
л ваются осями гиперболы, причем ось, пересекающая гиперболу в двух точках, называется вещественной, а вторая — мнимой. Точки Ai и А2 пересечения гиперболы с вещественной осью называются вершинами гиперболы. Величины а и Ь называются полу- г%8 Рис. 64 Рис. 65 осями гиперболы. Если а=Ь, то гипербола называется равносторонней. Наряду с уравнением (6) рассмотрим уравнение а2-г 62 — *• (13) Очевидно, оно также задает гиперболу, фокусы которой располагаются на оси Оуу а основной прямоугольник и асимптоты те же, чт.о и у гиперболы (6) (рис. 64). Гиперболы (6) и (13) называются сопряженными друг с другом. 3. Эксцентриситет Эксцентриситетом гиперболы называется число -т=УМ?Г- Для любой гиперболы е>1. Эксцентриситет характеризует форму основного прямоугольника и, следовательно, форму самой гиперболы: чем меньше е, тем больше вытягивается основной прямоугольник, а вслед за ним и сама гипербола вдоль вещественной оси. На рис 65 изображены гиперболы с различными значениями е.
198 Глава 7. Плоские фигуры второго порядка 4. Фокальные радиусы Фокальными радиусами точки М гиперболы называются отрезки прямых, соединяющие эту точку с фокусами Fi и F2. Их длины г± и г2 задаются формулами (9) и (10), которые мы перепишем еще раз. Для правой ветви: П=ех+а, (14) г2=ех—а. (15) Для левой ветви: П= — (гх+а), (16) г2=—(е*—а). (17) 5. Фокалькый параметр Фокальным параметром гиперболы называется длина отрезка перпендикуляра к вещественной оси, восставленного в одном из фокусов до пересечения с гиперболой. На рис. 65 указанный перпендикуляр изображен в виде отрезка /УМ. Пусть его длина равна р. Тогда М (с, р) и а2 & Используя формулу (5), получаем = -*! ■ а" 6. Пересечение с прямой Рассмотрим вопрос о пересечении гиперболы (6) с различными прямыми. Пусть прямая не параллельна оси Оу и имеет уравнение y=kx+m. (18) Подставляя выражение у из формулы (18) в уравнение (6), получаем уравнение для абсцисс искомых то^ек пересечения: (b*—a2k2)x2-2a*kmx-a2(b*+m2) =0. (19) Если
§ 69. Директрисы эллипса и гиперболы 199 то уравнение (19) квадратное и в зависимости от характера его корней возможны следующие случаи (рис. 66): 1) прямая пересекает гиперболу в двух различных точках (прямая Ai), 2) прямая имеет с гиперболой одну общую точку и называется касательной к гиперболе (прямая Дг), Рис. 66 3) прямая не имеет с гипербо'лой общих точек (прямая Дз). Пусть теперь б2—a2k2=0, т. е. k=±— и /я=б. х Прямая совпадает с одной из асимптот и не имеет с гиперболой (6) общих точек, так как равенство (19) в этом случае неверно. Пусть, наконец, б2—a2k2=0, тфО. В этом случае прямая параллельна одной из асимптот и имеет с гиперболой одну общую точку. Легко проверить, что для прямой, параллельной оси Оу, также могут иметь место только указанные выше три случая. § 69. Директрисы эллипса и гиперболы Директрисами эллипса 72 а2^ Ь2 называются две прямые и х= (1) \где е — эксцентриситет эллипса. Так как е<1, то директрисы,
200 Глава 7. Плоские фигуры второго порядка будучи параллельными малой оси эллипса, не имеют с ним общих точек (рис. 67). Директрисами гиперболы а2 б2 называются, две прямые (1). Так как для гиперболы е>1, то директрисы параллельны мнимой оси и не имеют с гиперболой общих точек (рис. 68). Рис. 67 Рис. 68 Основное свойство директрис эллипса и гиперболы выражают теоремы 1 и 2. Теорема 1. Отношение расстояния г любой точки эллипса (гиперболы) от фокуса к ее расстоянию d от соответствующей директрисы есть постоянная величина, равная эксцентриситету эллипса (гиперболы), т. е. = е. (2) (Фокус и директриса считаются соответствующими, если они расположены с одной стороны от центра.) ф Рассмотрим, например, правый фокус и правую директрису гиперболы. Уравнение х- — =0 е (3) правой директрисы имеет нормальный вид (см. § 59). Пусть М(х, у) —произвольная точка правой ветви гиперболы. Так как
§ 69. Директрисы эллипса и гиперболы 201 вся правая ветвь гиперболы лежит в положительной полуплоскости относительно прямой (3), то d=x- —. (4) е По формуле (15) § 68 г=гх—а. (5) Используя формулы (4) и (5), получим г гх—а d a ' 8 т. е. равенство (2) верно. Если точка М(х, у) лежит на левой ветви гиперболы, которая находится в отрицательной полуплоскости относительно прямой (3), то rf=—JC+—. (6) е В этом случае воспользуемся формулой (17) § 68: г=а—гх. (7) Из формул (6) и (7) снова следует (2). Проверка соотношения (2) для левого фокуса и левой директрисы гиперболы, а также для эллипса предоставляется читателю, ф Теорема 2. Пусть в плоскости заданы точка F и прямая Д, не проходящая через F. Множество Л всех точек плоскости, отношение расстояний которых от точки F и от прямой Д есть отличная от 1 постоянная величина е, является эллипсом, если г<1, и гиперболой, если г>1. Точка F является фокусом этого эллипса (гиперболы), прямая Д — его (ее) соответствующей директрисой, а е — эксцентриситетом. ф Выберем прямоугольную систему координат следующим образом. В качестве оси Оу возьмем прямую Д, выбрав на ней положительное направление, а ось Ох проведем через точку F. Тогда F(kf 0), где \k\ — расстояние точки F от прямой Д. Произвольная точка М(х, у) множества Л характеризуется равенством У(*-&)Ч-1/2 =
202 Глава 7. Плоские фигуры второго порядка Возведя обе части этого равенства в квадрат, получим х2—2kx+k2+y2=г2х2 и далее (1 — е2) х2—2kx+y2+k2=0, Х 1-е2 + 1-е2 + 1-е» ' '^-J-L-Vh-JL-^ ** (9) \ 1-е2 / + 1-е2 (1-е2)2" w Очевидно, уравнения (8) и (9) равносильны. Введем обозначение а2= 6Д (10) (1-е2)2 1 ' и совершим параллельный сдвиг координатных осей согласно формулам: *'=*- {_eif У'=У- (П) Тогда уравнение (9) примет вид у'2 у'2 + ■ „ .^ "1. (12) а2 ' (1-е2) а2 Это уравнение при е<1 задает эллипс, а при е>1 —гиперболу. Так как уравнению (8), а следовательно, и уравнению (12) удовлетворяют координаты тех и только тех точек плоскости, которые принадлежат множеству Л, то первое утверждение теоремы доказано. Согласно определению, эксцентриситет эллипса (гиперболы) (12) равен с _ У а2— (1—е2)а2 _ а ~ а ~ Одна из директрис эллипса (гиперболы) (12) имеет уравнение *Ч- — =0 6
§ 70. Парабола 203 или, согласно формулам (10) и (11), х=0 и, следовательно, совпадает с прямой А. Согласно формуле (10), расстояние точки F от директрисы равно ... \_^__а I _ \± I 11 I е I I е I " Отсюда следует, что F есть фокус эллипса (гиперболы) (12), соответствующий директрисе А. ф Теоремы 1 и 2 позволяют дать новое определение отличного от окружности эллипса и гиперболы, равносильное определениям, приведенным в § 67, 68. Эллипсом (гиперболой) называется множество всех точек плоскости, для которых отношение расстояния от заданной точки, называемой фокусом, к расстоянию от заданной прямой, называемой директрисой, есть постоянная величина е<1 (е>1), § 70. Парабола 1. Определение и вывод канонического* уравнения Пусть на плоскости заданы точка F и прямая А, не проходящая через эту точку. Параболой называется множество всех тех точек плоскости, каждая из которых равноудалена от точки F и прямой Д. Точка F называется фокусом параболы, а прямая Д — директрисой параболы. Парабола, так же как эллипс и гипербола, определяется соотношением (2) § 69 при е= 1, т. е. r=d, (1> где г и d — расстояния произвольной точки параболы соответственно от фокуса и директрисы. Составим уравнение параболы. Систему прямоугольных координат выберем следующим образом (рис. 69). Проведем ось Ох через фокус F перпендикулярно директрисе Д в направлении от директрисы к фокусу; начало координат возьмем в середине отрезка между фокусом F и точкой К пересечения оси Ох с директрисой Д. Если обозначить буквой р расстояние фокуса от директрисы, то ^(-тг. 0J и уравнение директрисы будет иметь вид
204 Глава 7. Плоские фигуры второго порядка Пусть М(х, у)—произвольная точка параболы. Проведем через эту точку прямую, параллельную оси Ох и обозначим буквами L и N точки пересечения этой прямой с осью Оу и директрисой А. Имеем '=]/(* §-)+Л d=(NM) = (NL) + (LM) = £-+x. А У.1 N ТГо 1 L ' -ГЦЛ)Э/ Fl§,0) X А У, My М2 F. X Рис. 69 Рис. 70 Вставляя эти значения г и d в равенство (1), получаем V(*-t)V=*+it- (2) Это и есть уравнение параболы. Чтобы упростить его, возведем обе его части в квадрат: (*-£)+«■-(*+-?-)■. Отсюда у2=2рх. (3) Легко видеть, что уравнения (2) и (3) равносильны. Уравнение (3) называется каноническим уравнением параболы. 2. Исследование формы Из уравнения (3) видно, что х может принимать только неотрицательные значения. Следовательно, на рисунке вся парабола располагается по одну сторону от оси Оу (справа, если положительное направление оси Ох идет слева направо). Так как
§ 70. Парабола 205 уравнение (3) содержит координату у только в четной степени, то парабола симметрична относительно оси Ох, и для выяснения ее формы достаточно рассмотреть только первую координатную четверть. В этой четверти y=f2px. При неограниченном возрастании х неограниченно растет и у. Парабола, выходя из начала координат, уходит неограниченно Н Рис. 71 Рис. 72 вправо и вверх. В четвертой четверти парабола строится по симметрии с первой четвертью. Парабола (3) изображена на рис. 70. Ось симметрии параболы называется ее осью. Точка пересечения параболы с ее осью называется вершиной параболы. 3. Фокальный параметр Величина р, фигурирующая в каноническом уравнении (3), называется фокальным параметром или просто параметром параболы. Кроме вышеуказанного, фокальный параметр р имеет еще следующее геометрическое истолкование. Через фокус проведем прямую, перпендикулярную оси параболы (см. рис. 70). Ее уравнение — х= 2 (4) Найдем точки Mi и М2 пересечения этой прямой с параболой. Решая для этого совместно уравнения (3) и (4), получим у=±р. Следовательно, P=\FMt\.
206 Глава 7. Плоские фигуры второго порядка Итак, параметр р параболы (3) равен длине перпендикуляра к оси параболы, восстановленного из фокуса до точки пересечения с параболой. Параметр характеризует форму и. размеры параболы. На рис. 71 изображены параболы, соответствующие различным значениям параметра р. И рис. 73 Рис. 74 Наряду с уравнением (3) часто приходится рассматривать следующие уравнения: у2=—2рх, х2=2ру, х2=—2ру. Они также задают параболы, которые изображены на рис. 72—74 соответственно. 4. Пересечение с прямой ' В заключение исследуем вопрос о количестве точек пересечения параболы с различными прямыми. Пусть парабола и прямая имеют соответственно уравнения: х2=2ру9 y=kx-\-b. (5) (6) Подставив значение у из формулы (6) в уравнение (5), получим уравнение для абсцисс искомых точек пересечения х2—2kpx—2bp=0. В зависимости от характера корней этого квадратного уравнения возможны три случая (рис. 73):
§ 71. Полярное уравнение эллипса, гиперболы и параболы 207 Ж М 1) прямая пересекает параболу в двух различных точках ; (прямая MN), 2) прямая имеет с параболой одну общую точку (например, ось Ох), и называется касательной к параболе, 3) прямая не имеет с параболой общих точек (прямая А). Если прямая параллельна*оси Оу или совпадает с ней, она задается уравнением х=а и, очевидно, имеет с параболой одну общую точку (прямая Ai). § 71. Полярное уравнение эллипса, гиперболы и параболы Мы выведем сейчас уравнение эллипса, параболы и гиперболы (точнее, одной ее ветви) в полярных координатах. Пусть Л — любая из этих фигур, F — ее фокус, А — односторонняя с ним директриса (рис. 75) .Пусть, далее, е — эксцентриситет, р — фокальный параметр и б — расстояние фокуса от директрисы. В силу \ р I <F F основного свойства директрисы -т-=е или в== Р_ Рис. 76 Введем теперь полярную систему координат. За полюс примем точку Fy а полярную ось FA направим перпендикулярно к директрисе в сторону от директрисы, к F. Пусть теперь М — произвольная точка плоскости, лежащая от директрисы по ту же сторону, что и фокус F (в правой полуплоскости), р и <р — ее полярные координаты, ad — ее расстояние от директрисы. Если L — точка пересечения прямой FA с директрисой А и N — ортогональная проекция точки М на прямую FAf то имеем d= (LN) = (LF) + (FN) =б+р cos cp= — +Р cos ф, (1) с Л есть множество всех точек правой полуплоскости, для каж-. дой из которых отношение ее расстояния от фокуса F к ^расстоянию от директрисы А равно е, т. е. удовлетворяющих соотно- р шению -^-=8. а Подставляя сюда d из формулы (1), получаем р (1—е coscp)=/7
208 Глава 7. Плоские фигуры второго порядка ИЛИ Р= . р , . 1-е соэф Это уравнение называется полярным уравнением эллипса, параболы или одной ветви гиперболы, § 72, Плоские фигуры второго порядка Рассмотрим уравнение Ax2+2Bxy+Cy*+2Dx+2Ey+F=0, (1) где среди коэффициентов Л, Ву С есть отличные от нуля, т. е. (1) есть уравнение второй степени относительно х и у. Возьмем на плоскости П прямоугольную систему координат Оху. Фигуры плоскости П, которые могут задаваться уравнениями вида (1), будем называть плоскими фигурами второго порядка. К числу таких фигур относятся эллипс, гипербола и парабола. Например, уравнение (1) задает эллипс, если А=^' в=0' с=^ D=E=°> F"1- В этом параграфе мы найдем все плоские фигуры второго порядка. Наряду с системой координат Оху, которую мы будем называть старой, введем еще одну (новую) прямоугольную систему координат О'х'у'. Из двух возможных вариантов формул преобразования координат, полученных в § 49, выберем первый, т. е. х=х' cos а—у' sin а+а, 1 у=х' sin а+у' cos a+b. J (*) Подставляя эти выражения для х и у в левую часть уравнения (1), мы получим уравнение вида A'x'*+2B'x'y'+C'y'*+2D'x'+2E'y'+F'=0. (3) Это уравнение задает в системе О'х'у' ту же фигуру, что и уравнение (1) в системе Оху (см. § 50). Постараемся теперь за счет подходящего выбора новой системы координат упростить уравнение (1). Пусть в этом уравнении ВФО. Покажем, что преобразование (2) можно подо* брать таким образом, чтобы в уравнении (3) было Б'=0.
§ 72. Плоские фигуры второго порядка 209 В самом деле, полагая в формулах (2) а=Ь=0, получаем: А'=А cos2 а+25 sin a cos a+C sin2 а, В'=— A sin а cos а+5 cos 2а+С sin а cos а, С"=Л sin2 а—2В sin а cos а+Ccos2 а. Условие В'=0 запишется в виде — (С—Л) sin 2a+B cos 2a=0 или ctg2a==-^^. (4) Достаточно повернуть координатные оси на угол а, удовлетворяющий условию (4), и в уравнении (3) будет отсутствовать произведение координат. Итак, нам предстоит далее исследовать уравнение A'x'2+C'y'2+2D'x'+2E'y'+F=0. (5) Пусть А'ФО и С'ФО. Преобразуем уравнение (5): А' (уЧ-2-J-*') +С (у*+2-^гУ') +F=0, *(*+■£)'+<? [*+■%■)'+'-%■-%--& (6) Введем обозначение D'2 £'2 ^ Ar ^ С и совершим параллельный сдвиг координатных осей согласно формулам: D' £' В координатах X, Y уравнение (6) примет вид A'X*+C'Y*=F'. (7) Пусть Л'>0, С'>0, F'X). Тогда можно ввести обозначения
210 Глава 7. Плоские фигуры второго порядка и записать уравнение (7) в виде X2 У2 _ "Г ич ~ А • Д2 ■■ Ь2 Как мы уже знаем, это есть уравнение эллипса. Если в уравнении (7) Л'>0, С>0, F'<.0y то, обозначив F' ж F 7 — =а2 =62 А' а мы придем к уравнению X2 У2 _ аг + ь2 ~ Этому уравнению не удовлетворяет ни одна пара вещественных чисел, следовательно, уравнение (1) в рассматриваемом случае задает пустое множество. Пусть в уравнении (7) Л'>0, С'<;0, F'X). Вводя обозначения F' F' -1 =а2 —- =Ь2 -приведем его к виду X2 Y2 а2 Ь2 Это уравнение, как известно, задает гиперболу. Случаи Л'<0, С'<0, ±F'>0; А'<0, С>0У- ±F'>0; Л'>0, С'<0, F'<0 новых результатов не дадут. Пусть теперь в уравнении (7) Л'>0, С'<0, Ff—0. Тогда это уравнение можно привести к виду X2 Y2 -*"-5Г=°- (8) Уравнение (8) задает пару прямых X Y X . У a b a пересекающихся в начале координат, =0 и _- + _-=0,
§ 72. Плоские фигуры второго порядка 211 г . .1 .. —■—— . Если в уравнении (7) Л'>0, С'>0, F'=0, то оно принимает вид Этому уравнению удовлетворяют координаты только одной точки плоскости — О(0, 0). Случай Л'<0, С'=#=0, F'=0 приводит к тем же результатам. Возвратимся к уравнению (5) и предположим, что А'ФО, С=0, £/=7^0. Представим это уравнение в виде Л' (у*+2-51*') +2Е' (у'+^г) =0 А' (*'+ 4Г+2£' ('+ 4ш ~ -щг) =°- w Совершим параллельный сдвиг координатных осей согласно формулам: D' F D'2 Х=х/+'АГ9 ¥=У'+~2Ё7~~2А7ЁГ' Уравнение (9) примет вид А'Х*+2Е'У=0. (10) Е' Если A'E'<Sbi то, полагая -р- =p, получаем X*=2pY, т. е. уравнение параболы. Если же Л'£'>0, то уравнение (10) принимает вид X2=-2pY и снова задает параболу. Пусть теперь в уравнении (5) Л'^О, С'=0, £'=0. Тогда его можно переписать в виде / D' \2 D'2 Л'(д'+^)+Л-_=0. (И) Совершая параллельный сдвиг координатных осей согласно формулам .*=*+-?г, У=У'>
212 Глава 7. Плоские фигуры второго порядка приведем уравнение (11) к виду X2+F/=0) F D'* (12) где F'= А' Л'2' Если f <0, уравнение (12) принимает вид Х2-а2=0 и задает фигуру, состоящую из пары параллельнцх прямых. Если в уравнении (12) F'>0, то этому уравнению не удовлетворяют координаты никакой точки плоскости, и мы получаем снова пустое множество. Пусть теперь в уравнении (12) F/=0, т. е. уравнение имеет вид Х2=0. Это уравнение задает прямую — ось O'Y. Осталось рассмотреть случай, когда в уравнении (5) А'= = С'=0. Однако этот случай невозможен. В самом деле, предположим, что в уравнении (3) А'=В'=С'=0'9 т. е. A cos2 а+25 sin a cos а+С sin2 а=0, —Л sin а cos а+5 cos 2а+С sin а cos а=0, Л sin2 а—25 sin а cos а+С CDs2 а=0. Рассмотрим эту систему трех линейных уравнений относительно неизвестных Ау В, С. Легко подсчитать, что определитель этой системы равен 1. Поэтому система имеет единственное решение: Л=В = С=0, что невозможно. Сформулируем результаты, полученные в этом параграфе, в виде следующей теоремы. Теорема. Любая плоская фигура второго порядка является эллипсом, гиперболой, параболой, парой пересекающихся прямых, парой параллельных прямых, прямой, точкой или пустым множеством. Рис. 76 Метод доказательства этой теоремы, указанный выше, может быть использован и для практического решения вопроса о виде плоской фигуры второго порядка, заданной уравнением (1) с конкретными числовыми коэффициентами.
§ 73. Понятие фигуры второго порядка 213 Пример. Выяснить, какую фигуру задает уравнение х*+ху+у*+х-у=0 (13) в прямоугольной системе координат Оху, и сделать рисунок. Решение. Повернем координатные оси на угол, определяемый форму- я лой (4). Мы получим а= —, и формулы (2) примут вид х'-уг ' х'+у' х=—-—, У= _ • (14) У2 У2 Подставляя эти выражения для х и у в уравнение (13) и приводя подобные члены, получаем 3*'2+г/'2-2-|Г2|/'=0, 3*'2+(*/'-/2)2=2. (15) Совершая параллельный сдвиг координатных осей согласно формулам Х=х', Y=y'- у2, приводим уравнение (15) к виду. -т- + -^=1. (16) а=]/Ти, = 1 Таким образом, уравнение (13) задает эллипс с полуосями а= I/— и Ь = щ\/2. Для того чтобы сделать рисунок этого эллипса, необходимо последовательно построить координатные системы Оху, Ох'у\ O'XY и затем нарисовать эллипс, выражаемый в системе O'XY уравнением (16) (рис. 76). Глава 8 ФИГУРЫ ВТОРОГО ПОРЯДКА § 73. Понятие фигуры второго порядка Рассмотрим уравнение второй степени "относительно х, у, z: ацХ2+а22У2+аззг2+2а12ху+2а1зХ2+2а2зуг-{- +2а{х+2а2у+2а3г+а=0. (1) Предполагаем, что среди коэффициентов Яи, агг, Язз, ai2, 0i3, Ягз есть отличные от нуля. Возьмем какую-либо прямоугольную систему координат Oxyz. Фигурой второго порядка будем называть фигуру, которая может быть задана уравнением вида (1).
214 Глава 8. Фигуры второго порядка В этом параграфе мы рассмотрим некоторые общие свойству фигур второго порядка, а в следующих параграфах изучим наи-j более часто встречающиеся из этих фигур. .] Теорема. Если Ф — произвольная фигура второго порядка и П — произвольная плоскость, то Пс:ф или Ф1=Ф f| П есть плос* кая фигура второго порядка. \ ♦ Пусть фигура Ф задается в прямоугольной системе координат Oxyz уравнением (1)- Выберем новую прямоугольную систему координат O'x'y'z' так, чтобы координатная плоскость О'х'у' совпала с плоскостью П. Плоскость П имеет в этой системе координат уравнение z'=0. (2) Чтобы получить уравнение фигуры Ф в системе координат O'x'y'z', подставим в левую часть уравнения (1) выражения старых координат ху у, z через новые координаты х', у', z' (см. формулы (6) §49): x=aiiX'+ai2*/'4-ai3z'+ai,. У = <Х2\Х'-\- <X22f/'+a23Z'+ 0&2, z=a3iX'+азгУ'Н- а3з2'+а3. В результате подстановки получаем б11^+622У/2+6зз2,2+2612^,+2б1з^2/+2&2зУ,2,+ +2bix'+2b2y'+2b3z'+b=0. (3) Мы получим уравнение фигуры Ф1=ФПП в системе координат О'х'у'у если подставим (2) в (3): biix'z+b22y'2+2bl2x'y'+2bix'+2b2y'+b=0. (4) Если bii=b22=bi2=bi=b2=b=0y то Ф1=П. Если же среди коэффициентов уравнения (4) есть хотя бы один отличный от нуля, то это уравнение задает плоскую фигуру второго порядка. # Обозначим для краткости левую часть уравнения (1) символом F(x, у, z) и запишем это уравнение в виде F(x,y9z)=0. (5) Пусть плоскость П задается уравнением Ax+By+Cz+D=Q. (6)
§ 73. Понятие фигуры второго порядка 215 Так как плоскость П не может быть параллельной сразу всем -1рем координатным плоскостям, то можно предположить, например, что СФО. Тогда уравнение (6) можно записать в виде z=Px+Qy+R. (7) Фигура Ф1=Ф П П задается системой уравнений F(x9y9z)=09 z=Px+Qy+R. (8) родставляя выражение z из второго уравнения в первое, полу- |аем F(x9y9Px+Qy+R)=0. (9) Рассмотрим в плоскости Оху фигуру Ф2, которая в системе {координат Оху задается уравнением (9). Если числа *0, уо, z0 Удовлетворяют уравнениям (8), то x0f уц удовлетворяют уравнению (9). Обратно, если Хо9 Уо удовлетворяют уравнению (9), то $йь Уо, Zo=Pxo+Qy0-\-R удовлетворяют уравнениям (8). Но точка ^Hi (jco, уо) плоскости Оху есть ортогональная проекция точки Щ(хь Уоу 2о) на плоскость Оху. Отсюда следует, что уравнению |9) удовлетворяют координаты тех и только тех точек плоскости Щху9 которые являются ортогональными проекциями на эту плос- |сость точек фигуры Фи т. е. фигура Ф2 есть ортогональная проекция фигуры ФА на плоскость Оху. V Рассмотрим, в частности, тот случай, когда уравнение (7) Зшеет вид z=h9 т. е. плоскость П параллельна плоскости Оху. % этом случае фигуры Ф1 и Ф2 конгруэнтны, т. е. отличаются друг <Ш друга лишь положением в пространстве. Фигура Ф2 может $>ыть получена из фигуры Ф4 параллельным переносом вдоль UcvlOz. I Рассматривая вид фигуры Ф2 при различных значениях А, |южно получить некоторое представление о форме и.размерах ^исходной фигуры Ф. Обычно поступают следующим образом. Йридают параметру h ряд значений: hu Л2, Л3, . I. , следующих |руг за другом через одинаковые достаточно малые промежутки, $ рассматривают сечения фигуры (5) плоскостями 5; z=hu z=h2t z=h3, ... •с. Ортогональные проекции сечений на плоскость Оху задаются р этой плоскости уравнениями: F(xt y9 h) =0, F(x9 у9 кг) = 0, F(x9 у, h3) =0, ... Строя эти проекции, получают в плоскости Оху так называемую Карту фигуры (5) в горизонталях или, иначе, карту сечений.
216 Глава 8. Фигуры второго порядка Эта карта дает некоторое представление о форме и размерах фигуры (5). Например, сгущение проекций на карте указывает на возрастание крутизны фигуры Ф на соответствующем участке. На рис. 77 изображена карта сечений сферы х2+у2+г2=1 на плоскости Оху. Аналогично можно построить карты сечений фигуры (5) на двух других координатных плоскостях. Если мы хотим построить карту сечений фигуры (5) плоскостями, параллельными произвольно заданной плоскости П, можно перейти к новой системе прямоугольных координат O'x'y'z' так, чтобы плоскость О'х'у' стала параллельной плоскости П. В новой системе координат задача сведется к рассмотренному выше случаю. Рис. 77 § 74. Эллипсоид Эллипсоидом называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением х2 У* z2 а2 + Ь2 + с2 Ху (1) где а, Ъ и с — произвольные отличные от нуля постоянные. Будем считать, что а>0, 6>0, с>0. Исследуем форму эллипсоида. Так как х, у, z входят в уравнение (1) только в четных степенях, то этому уравнению наряду с точкой М(х, у, z) удовлетворяют также точки: Af4(—х, у, z), М2(х, —у, г), М3(х9 yt —z), Mk(x9 —у, -г), Мъ (—X, у, —z), М6 (—х, —у, z), М7(—х, —у, — э). Это означает, что эллипсоид симметричен относительно каждой из трех координатных плоскостей, каждой из координатных осей и начала координат. Из уравнения (1) следуют неравенства: |*|^я, \У\<Ь, \г\^с. Рис. 78 Это означает, что эллипсоид — ограниченное множество, не выходящее за пределы прямоугольного параллелепипеда, изображенного на рис. 78,
§ 74. Эллипсоид 217 Рассмотрим сечение эллипсоида плоскостью Оху или параллельной ей плоскостью. Уравнение такой плоскости имеет вид z=h. (2) Ортогональная проекция на плоскость Оху фигуры Фь получающейся в сечении эллипсоида (1) плоскостью (2), задается в системе координат Оху уравнением Пусть Л = 0, т. е. рассматривается сечение эллипсоида (1) плоскостью Оху. Это сечение есть эллипс с полуосями а и Ь\ если а=Ь, он является окружностью. Рассмотрим теперь произвольное значение Л, удовлетворяющее неравенству |Л|<с. Уравнение (3) перепишем в виде v2 y2 а\ ^ Ь\ где «-«та; ».-»ira С2* Таким образом, фигура Oi есть эллипс с полуосями а{ и bi. Если А возрастает.от нуля до с, полуоси #i и 6i убывают, эллипс уменьшается и приth=c сжимается в точку С(0, 0, с), расположенную на оси Oz. Плоскость z=c, имеющая с эллипсоидом лишь одну общую точку С, называется касательной плоскостью эллипсоида в точке С. Симметричная картина получается при убывании Л-от нуля до —с; плоскость z=—c касается эллипсоида в точке Ci(0, 0, —с), расположенной на оси Oz. Плоскость (2) при |А|>с не имеет с эллипсоидом общих точек. Карта сечений эллипсоида (1) плоскостями (2) изображена на рис. 79. Аналогичные результаты получаются при пересечении эллипсоида (1) с плоскостями х=1 или у=пг. Нетрудно показать, что любая плоскость, имеющая с эллипсоидом более "одной общей точки, пересекает его по эллипсу. Это следует из теоремы предыдущего параграфа и из того, что эллипсоид есть ограниченная фигура. Теперь можно сделать рисунок 'эллипсоида (рис.80). Величины а, Ьу с называются полуосями эллипсоида (1). Если все они различны, эллипсоид называется трехосным. Если какие- либо две из полуосей равны, например а=Ьфс, эллипсы (3)
218 - Глава 8. Фигуры второго порядка являются окружностям^, а сам эллипсоид может быть получен вращением эллипса х2 z2 — 4- —=1 а2 ^ с2 ' расположенного в плоскости Oxz, вокруг оси Oz. В этом случае Рис. 79 Рис. 80 эллипсоид (1) называется эллипсоидом вращения. Наконец, при а=Ь = с эллипсоид является сферой радиуса а. § 75. Конус второго порядка Конусом второго порядка называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением У z2 а2 + Ь2 с2 °' 0) где с, Ь, с — произвольные отличные от нуля числа. Будем считать, что а>0, Ь>0, с>0. Покажем, что конус (1) состоит из прямых, проходящих через начало координат. Пусть М0(хо, уо, Zo) —произвольная точка конуса (1), отличная от начала координат. Тогда х<? Уо* Zoz а2 Ь2 =0. Точка M(tXo, tyo, tz0), где / — любое число, также удовлетворяет уравнению (1): *о2 , Уо2 2°2Л=( t2 \ а2 Ь2 с2 =0. Но точки M(txo, ty0, tz0) заполняют прямую OMq, что и требовалось доказать.
§ 75. Конус второго порядка 219 £' Конус симметричен относительно каждой из координатных Шоскостей, каждой координатной оси и начала координат. t Плоскость z=h (2) пресекает конус (1) по фигуре Фь ортогональная проекция которой Фг на плоскость Оху задается в системе координат Оху /равнением Xй У' W + & (3) "|ри А=0 уравнению (3) удовлетворяет лишь одна точка плос- срсти Оху — начало координат О(0, 0, 0). В этой точке плоскость Зху пересекается с конусом. При кфО уравнение (3) задает эллипс с полуосями: a\h\ u_b\h\ а!= 6i= В этом случае и фигура Ф1 является эллипсом. Конус (1) можно рассматривать как множество всех прямых (образующих конуса), которые проходят через вершину конуса 3(0, 0, 0) и точки эллипса Фь Конус (1) изображен на рис. 81. Рис. 81 Рис. 82 Конус состоит из двух полостей, расположенных по обе стороны от вершины и простирающихся неограниченно. Если а=Ьу конус называется конусом вращения. Рассмотрим произвольную плоскость П, проходящую через вершину конуса (1) и не параллельную плоскости эллипса Фь Пусть А —прямая, по которой пересекаются плоскости П и (2) (рис. 82). Как известно из § 67, прямая Д может иметь с эллипсом две, одну или ни одной общей точки. В соответствии
220 Глава 8. Фигуры второго порядка с этим мы разделим все плоскости, проходящие через вершину конуса, на три категории: 1) плоскости, пересекающие эллипс (Di в'двух различных точках. Каждая из этих плоскостей пересекает конус по двум прямым (образующим); Рис. 83 2) плоскости, не пересекающие эллипс Фь Каждая из них имеет с конусом только одну общую точку (вершину). К этой же категории относится и плоскость, параллельная плоскости эллипса Фй 3) плоскости, имеющие с эллипсом Ф* только одну общую точку. Каждая из них имеет с конусом одну общую прямую. Рассмотрим теперь пересечение конуса (1) с плоскостями, не проходящими через вершину. Пусть П — одна из таких плоскостей, IIi — плоскость, проходящая через вершину конуса и параллельная плоскости П, и Ф1=ФП П. Если плоскость IIi принадлежит ко второй категории, то плоскость П пересекает только одну полость конуса и имеет общую точку с каждой из образующих. ФА является ограниченной плоской фигурой второго порядка, т. е. эллипсом. Если плоскость IIi принадлежит к третьей категории, то плоскость П, встречаясь лишь с одной полостью конуса, пересекает все образующие, кроме одной, лежащей в плоскости Ш. Следовательно, <Di является неограниченной плоской фигурой второго порядка, состоящей из одной ветви, очевидно, отличной от прямой, т. е. параболой. Наконец, если плоскость Ш принадлежит к первой категории, Ф1 является плоской фигурой второго порядка, состоящей из двух ветвей, причем каждая из этих ветвей, очевидно, не является прямой. Следовательно, в рассматриваемом случае Ф1 — гипербола. Таким образом, эллипс, гипербола и парабола могут рассматриваться как сечения конуса второго порядка плоскостями. Поэтому эллипс, гиперболу и параболу часто называют коническими сечениями (см. рис. 83).
§ 76. Однополостный гиперболоид 221 § 76. Однополостный гиперболоид Однополостным гиперболоидом называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением х2 и2 z2 а2 о2 с2 • Как и в предыдущих параграфах, будем считать, что а>0, 6>0, О а. Однополостный гиперболоид (1) симметричен относительно каждой из координатных плоскостей, каждой из координатных осей и начала координат. Рассмотрим пересечение гиперболоида (1) с плоскостью z=h. (2) Ортогональная проекция на плоскость Оху множества Ф1 точек, принадлежащих одновременно*гиперболоиду (1) и плоскости (2), задается в системе координат Оху уравнением — + уг -1 (3) где ai=a]/l+|-, ^=6]/l+|-. с2' При любом h (3) есть уравнение эллипса. При h=0, т. е. в пересечении гиперболоида (1) с плоскостью Оху, получается эллипс который называется горловым эллипсом гиперболоида (1). При возрастании \h\ полуоси ai и bi неограниченно увеличиваются вместе с эллипсом (3). Карта сечений гиперболоида (1) плоскостями (2) изображена на рис. 84. Чтобк получить ясное представление о форме гиперболоида (1) в удаленных точках, рассмотрим одновременно с ним конус ^! + ^_il=0 (4) аг "Г Ь2 сг и- W
222 Глава 8. Фигуры второго порядка Как мы видели в § 75, конус (4) пересекается с плоскостью (2) по эллипсу с полуосями: а2= a\h\ b2= b\h\ Так как a2<ait b2<.bit то этот эллипс целиком находится внутри эллипса, получающегося в пересечении плоскости (2) Рис. 84 Рис. 85 с гиперболоидом (1). Значит, конус (4) целиком заключен внутри гиперболоида (1). Покажем теперь, что при неограниченном Бозрастании |Л| разности ai—а2 и &i—b2 стремятся к нулю. В самом деле, fli—а2= ( аУ 1 + А2 а •щу'У.!^ a\h\ У^?+'"А| У Л2 с2 ' с =^ lim (at—a2)=0. |/lKoo Аналогично показывается, что lim (bi—b2)=0. \h\-+°o Из сказанного следует, что эллипсы пересечения плоскости (2) с гиперболоидом (1) и конусом (4) при неограниченном возрастании |А| стремятся слиться. При этом гиперболоид сколь угодно близко подходит к конусу. Конус (4) называется асимптотическим конусом гиперболоида (1).
§ 76. Однополостный гиперболоид 223 Рассмотрим теперь пересечение гиперболоида (1) с плоскостью *=/. (5) проекция на плоскость Oyz множества <X>i точек, получающихся '$р. пересечении гиперболоида (1) с плоскостью (5), задается р системе координат Oyz уравнением Ь2 с2 а2' к ' JlpH различных |/|<а в плоскости Oyz получается семейство ^асимптотических (имеющих одни и те же асимптоты) гипербол, вещественной осью которых является ось Оу. При 1=а получается асимптоты этих гипербол. Если же |/|>а, уравнение (6) Задает в плоскости Oyz семейство соасимптотических гипербол, у которых вещественная ось совпадает с осью Ог. Карта сечений гиперболоида (1) плоскостями (5) изображена на рис. 85. Аналогичная картина получается при пересечении гиперболоида (1) с плоскостями у=т. Мы видели, что при пересечении гиперболоида (1) с различными плоскостями могут получиться следующие фигуры: эллипс, гипербола, пара пересекающихся прямых. Покажем теперь, что ^существуют плоскости, пересекающие гиперболоид по параболе млн по паре параллельных прямых. Для этого преобразуем систему координат Oxyz, повернув ее вокруг оси Оу на угол а, пока еще неопределенный. Формулы преобразования координат имеют вид х=х' cos a—z' sin а, У=У', z=xf sin а+z' cos а, (7) где х9 у, z — координаты точки М в системе координат Oxyz, a x'yy\ z' — координаты той же точки в повернутой системе координат Oxft/zf. Вставляя выражения для х, у, z из формул (7) § уравнение (1) и приводя подобные члены, получим уравнение Гиперболоида (1) в системе координат Ox'yrz'\ t- с2 cos2 a—a2 sin2 а /0 , с2 sin2 а—а2 cos2 а /0 • * 2+ -^ z 2~ а2с2 ^ а2с2 -(4- + 4-)»»W+£-1- W
224 Глава 8. Фигуры второго порядка Выберем а так, чтобы имело место равенство с2 cos2 a—a2 sin2 a=0, что, очевидно, возможно. Уравнение (8) примет вид у'2 с2 sin2 a—a2 cos2 a ~b2"^ ate2 ?'2_- ""(^"+4-)sin2a-^,=L (9) Пересекая гиперболоид (9) плоскостью Ох'у\ уравнение которой z'=0, получим в этой плоскости фигуру, выражаемую* уравнением f/'2=62, т. е. пару параллельных прямых. Пересечем теперь гиперболоид (9) плоскостью z'=h, НФО. В сечении получится фигура, проекция которой на плоскость Ох'у' в системе координат Ох'у' имеет уравнение Ь2 J-^sin2a(-l- + 4-)=p' <10> где р — постоянная. Это уравнение, очевидно, задает параболу. Однополостный гиперболоид изображен на рис. 86. Величины a, b, с называются полуосями гиперболоида (1). Если а=6, фигура (1) называется однополостным гиперболоидом вращения; она может быть получена вращением гиперболы а2 ^ с2 ' расположенной в плоскости Oxz, вокруг оси Ог. § 77. Двуполостный гиперболоид Двуполостным гиперболоидом называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением a«. ^ б2 с2 1' ^ч Будем считать, что а>0, 6>0, с>0.
§ 77. Двуполостным гиперболоид 225 f> " Гиперболоид (1) симметричен относительно каждой из коор- ршатных плоскостей, каждой из координатных осей и начала рюрдинат. Рассмотрим пересечение гиперболоида (1) с плоскостью z=h. (2) Эртогональная проекция множества Ф1 точек, получающихся з пересечении гиперболоида (1) с плоскостью (2), задается в системе координат Оху уравнением *. + il-A2_j /3) При Л=0 плоскость (2), т. е. плоскость Оху, не имеет с гиперболоидом (1) общих точек. То же будет для любой плоскости (2), если |Л|<с. При |Л|=с уравнение (3) принимает вид *2 . У2 L — =0. а2^ Ь2 Ему удовлетворяют только нулевые значения х и у, т. е. плоскость z=c (4) имеет с гиперболоидом (1) лишь одну общую точку Л(0, 0, с). Плоскость (4) называется касательной плоскостью к двуполостному гиперболоиду (1) в точке Л. Аналогично плоскость z=—c касается гиперболоида (1) в точке j4i(0, 0, —с). При -|Л|>с уравнение (3) задает эллипс с полуосями «-.yi-i. *.-»V?^i С2 Г С2 Если h растет, полуоси at и 6А увеличиваются и сам эллипс неограниченно расширяется. Как и в предыдущем параграфе, мож- нб показать, что при этом гиперболоид (1) неограниченно приближается к конусу х*_ , _^_il=n <■ . а2"1" Ь2 с2 1 Находясь внутри одной из полостей этого конуса. Симметричная укартина получится при h<.—c. Таким образом, гиперболоид (1) Достоит из двух полостей, чем и объясняется название — двуполо- &тный гиперболоид. Если а=Ь, фигура (1) называется двуполостным гиперболоидом вращения; она может быть получена вра-
226 Глава 8. Фигуры второго порядка щением гиперболы а2 с2 1у расположенной в плоскости Oxz, вокруг оси Oz. Двуполостный гиперболоид (1) изображен на рис. 87. Рис. 86 Рис. 87 Аналогично тому, как это делалось в предыдущем параграфе, можно показать, что существуют плоскости, пересекающие двуполостный гиперболоид по гиперболам и параболам. § 78. Эллиптический параболоид Эллиптическим параболоидом называется фигура, которая в прямоугольной системе координат задается уравнением х2 . у2 (1) — + — =2*, р q где р,>0, q>0. Параболоид (1) симметричен относительно координатных плоскостей Oxzy Oyz и оси Oz. Так как из уравнения (1) следует, что 2^0, то весь параболоид расположен по одну сторону от плоскости Оху. . Рассмотрим пересечение параболоида (1) с плоскостью' z=h. (2)
§ 78. Эллиптический параболоид 227 Проекция на плоскость Оху множества <Di точек, получающихся в пересечении параболоида (1) с плоскостью (2), задается уравнением *. + j£.=2h. (3) Р Я Если Л=0, уравнение (3) удовлетворяет лишь одна точка О(0, 0, 0); множество (Di в этом случае содержит лишь эту точку. При Л>0 множество Ф\ есть эллипс с полуосями a=~j[2hp, b=-]/2hq. Если h растет, то полуоси а и Ь увеличивается и эллипс, получающийся в сечении, неограниченно расширяется. Исследуем множество ФА точек, получающихся в пересечении параболоида (1) с плоскостью *=/. (4) Проекция этого множества на плоскость Oyz задается в системе координат Oyz уравнением y2=2qz- -О- Р. (5) При любом I уравнение (5) задает параболу с параметром q. Карта сечений параболоида (1) плоскостями (4) изображена на рис. 88. Аналогичная картина получается при пересечении параболоида (1) с плоскостью у=т. (6) *\ Проекция соответствующего сечения на плоскость Oxz имеет в системе координат Oxz уравнение \x2=2pz— — т2. Q При различных т сечения являются параболами одинаковых размеров (с параметром р). Карта сечений параболоида (1) плоскостями (6) изображена на рис. 89. Из сказанного можно получить следующий способ образования эллиптического параболоида: если взять две параболы, плоскости которых взаимно перпендикулярны, а оси имеют одинаковое направление, и одну из этих парабол (образующую) -передвигать поступательно так, чтобы ее вершина скользила по
228 Глава 8. Фигуры второго порядка другой параболе (направляющей), то образующая парабола опишет эллиптический параболоид. Если поменять ролями образующую и направляющую параболы, то получится тот же параболоид. Эллиптический параболоид (1) изображен на рис. 90. Величины р и q называются параметрами параболоида, а начало ко- 2 к ^ Z-* 2. ^ NX/, $& :Z Рис. 88 Рис. В9 Рис. 90 ординат —его вершиной. Если p=q, фигура (1) называется па- раболоидом вращения; она может быть получена вращением параболы х2=2рг, расположенной в плоскости Oxz, вокруг оси Oz. § 79. Гиперболический параболоид Гиперболическим параболоидом называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением *2 У2 с — =2г, Р Я 0) где р>0, q>0. Параболоид (1) симметричен относительно координатных плоскостей Oxz, Oyz и оси Oz. Исследуем множество Ф1 точек, получающихся в пересечении параболоида (1) с плоскостью z=h. (2) Проекция этого множества на плоскость Оху задается в системе
§ 79. Гиперболический параболоид 229 "координат Оху уравнением *2 Уъ 2_ =2Л. ; Р Я Если Л=0, уравнение (3) распадается на два уравнения: I * У п „ х . У 1р Уя =0 и fp Тя =0, (3) (4) которые задают две прямые. Итак, плоскость Оху пересекает )|араболоид (1) по двум прямым (4). При Л>0 уравнение (3) |адает семейство соасимптотических гипербол, имеющих верши- Ъы на оси Ох. При Л<0 получается семейство гипербол, им Сопряженных. Карта сечений параболоида (1) плоскостями (2) Изображена на рис. 91. Ь В пересечении параболоида (1) с плоскостями х=1 (5) получаются параболы, проекции которых на плоскость Oyz задаются в системе координат Oyz уравнением t/2=-2?z+-^/2. Все эти параболы имеют одинаковые размеры. Карта сечений параболоида (1) плоскостями (5) изображена на рис. 92. sr/., Рис. 91 Рис. 92 Рис. 93 Аналогично получается и карта сечений параболоида (1) плоскостями у=т (рис. 93), она состоит из конгруэнтных парабол x2=2pz+ — m2. Q
230 Глава 8. Фигуры второго порядка Гиперболический параболоид можно образовать аналогично эллиптическому параболоиду (см. § 78) с той лишь разницей, что оси направляющей и образующей парабол в случае гиперболического параболоида имеют противоположные направления. Гиперболический параболоид (1) изображен на рис. 94. § 80. Цилиндрические фигуры Цилиндрической фигурой будем называть фигуру, состоящую из произвольного множества прямых, параллельных друг другу. Рис. 94 Рис. 95 Рис. 96 Сами эти прямые называются (прямолинейными) образующими цилиндрической фигуры. Примеры цилиндрических фигур: 1) прямая, 2) плоскость (рис. 95); 3) круглая цилиндрическая поверхность (рис. 96); 4) круглое цилиндрическое тело (рис. 96). Плоская фигура, получающаяся в пересечении цилиндрической фигуры с плоскостью, перпендикулярной к образующим, называется направляющей цилиндрической фигуры. Так, для указанных выше цилиндрических фигур направляющими являются точка, прямая, окружность и круг. Теорема. Уравнение F(x, y)=0 задает в прямоугольной системе координат Oxyz цилиндрическую фигуру Ф, образующие которой параллельны оси Oz, Направляющая Oi фигуры Ф, лежащая в плоскости Оху, задается в системе координат Оху уравнением (1). + Пусть ЛГо(*о, Уо, Zo) — произвольная точка фигуры Ф. Тогда е F(x0> Уо)=0.
§ 81. Цилиндрические фигуры второго порядка 231 Очевидно, любая точка Л1(лг0, уо, z), где z— произвольное вещественное число, удовлетворяет уравнению (1). Но указанные точки М заполняют прямую, проходящую через точку М0 параллельно оси Oz. Итак, первая часть теоремы доказана. Пусть теперь Mi (хи уи 0) — произвольная точка плоскости Оху. Ее координаты в системе координат Оху есть лч и yie Точка Mi(xu yu 0) принадлежит фигуре <Pi тогда и только тогда, когда она принадлежит фигуре Ф. Отсюда вытекает вторая часть теоремы, ф § 81. Цилиндрические фигуры второго порядка Используя теорему § 80, мы можем перечислить все цилиндрические фигуры второго порядка. В качестве направляющих этих фигур надо взять всевозможные плоские фигуры второго порядка, найденные в § 72. 1. Эллиптический цилиндр Эллиптическим цилиндром называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением х2 V —+ —=1. О) а2^ Ь2 у } За направляющую эллиптического цилиндра (1) может быть принят эллипс, лежащий в плоскости Оху и имеющий в системе координат Оху уравнение (1). Эллиптический цилиндр (1) изображен на рис. 97. Цилиндр (1) симметричен относительно: 1) каждой из координатных плоскостей, 2) каждой плоскости, параллельной плоскости Оху, 3) каждой координатной оси, 4) каждой прямой, параллельной оси Ох или оси Оу и пересекающей ось Oz, 5) каждой точки, лежащей на оси Oz. Ось Oz называется осью цилиндра. Если а=6, цилиндр (1) называется цилиндром вращения. Исследуем пересечения цилиндра (1) с различными плоскостями. Пусть плоскость П параллельна оси Oz. Обозначим буквой А прямую, по которой Рис, 97 плоскость П пересекается с плоскостью Оху. Как известно из § 67, прямая Д по отношению к эллипсу, заданному в системе координат Оху уравнением (1), может за-
232 Глава 8. Фигуры второго порядка нимать следующие положения: 1) пересекать эллипс в дву* различных точках, 2) касаться в одной точке, 3) не иметь с шЫ общих точек. В соответствии Ъ этим плоскость П, параллельная оси Ог, может пересекать цилиндр (1) по двум прямолинейны»! образующим, касаться цилиндра вдоль одной прямолинейной образующей и, наконец, не иметь с цилиндром общих точек. Любая плоскость, не параллельная оси Ог, пересекает цилиндр (1) по эллипсу. В самом деле, такая плоскость пересекает все прямолинейные образующие цилиндра, в результате получается ограниченная плоская фигура второго порядка, т. е, эллипс. • 2. Параболический цилиндр Параболическим цилиндром называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением Рис.98 х2=2ру (р>0). (2) За направляющую параболического цилиндра (2) может быть принята парабола, лежащая, в плоскости Оху и выражаемая в системе координат Оху уравнением (2). Из уравнения (2) видно, что координата у точек параболического цилиндра принимает только неотрицательные значения. Поэтому весь цилиндр (2) располагается по одну сторону от плоскости Oxz, а именно по ту сторону, в которую идет положительная полуось Оу. Цилиндр (2) симметричен относительно: 1) плоскости Oyz\ 2) плоскости Оху и любой плоскости, ей параллельной; 3) оси Ох и любой прямой, ей параллельной и пересекающей ось Oz. Параболический цилиндр изображен на рис. 98. Исследуем пересечение параболического цилиндра (2) с различными плоскостями. Рассмотрим вначале плоскость П, параллельную оси Ог. Пусть она пересекается с плоскостью Оху по прямой Д. Как известно из § 70, прямая Д по отношению к параболе (2) может занимать следующие положения: 1) пересекать в двух различных точках, 2) пересекать в одной точке (если Д параллельна оси Оу)у 3) касаться в одной точке, 4) не иметь общих точек. В соответствии с этим плоскость П, параллельная оси Ог, может пересекать параболический цилиндр (2) по двум прямолинейным образующим, по одной образующей (если она параллельна плоскости Oyz), может касаться цилиндра вдоль
§ 81. Цилиндрические фигуры второго порядка 233 одной прямолинейной образующей и, наконец, может не иметь с цилиндром общих точек. Любая плоскость, не параллельная оси Ог, пересекает параболический цилиндр (2) по параболе. В самом деле, такая плоскость пересекает все прямолинейные образующие цилиндра. В результате получается неограниченная плоская фигура второго порядка, состоящая из одной ветви и отличная от прямой, т. е. парабола. 3. Гиперболический цилиндр Гиперболическим цилиндром называется фигура, которая в прямоугольной системе координат Oxyz задается уравнением а2 Ь2 (3) За направляющую гиперболического цилиндра (3) может быть принята гипербола, лежащая в плоскости Оху и выражаемая в системе координат Оху уравнением (3). Гиперболический цилиндр (3) изображен на рис. 99. Отметим, что гиперболический цилиндр состоит из двух полостей. Цилиндр (3) симметричен относительно: 1) каждой из координатных плоскостей; 2) каждой плоскости, параллельной плоскости Оху\ 3) каждой из коор- Рис. 99 динатных осей; 4) каждой прямой, параллельной оси Ох или оси Оу и пересекающей ось Oz\ 5) каждой точки, лежащей на оси Ог. Ось Oz называется осью гиперболического цилиндра (3). Исследуем пересечение гиперболического цилиндра (3) с различными плоскостями. Пусть плоскость П параллельна оси Oz.
234 Глава 8. Фигуры второго порядка Обозначим буквой А прямую, по которой плоскость П пересекается с плоскостью Оху. Как известно из § 68, прямая Д по отношению к гиперболе (3) может занимать следующие положения: 1) пересекать в двух различных точках; 2) пересекать в одной точке (если она параллельна одной из асимптот гиперболы, но не совпадает с этой асимптотой); 3) касаться в одной точке; 4) не иметь общих точек. В соответствии с этим плоскость П, параллельная оси Oz, может пересекать гиперболический цилиндр (3) по двум прямолинейным образующим, по одной образующей, может касаться цилиндра вдоль прямолинейной образующей и, наконец, может не иметь с цилиндром общих точек. Рассмотрим теперь пересечение гиперболического цилиндра (3) с плоскостью, не параллельной оси Oz. Такая плоскрсть пересекает все прямолинейные образующие цилиндра (3). В результате получается плоская фигура второго порядка, состоящая из двух ветвей, отличных от прямых, т. е. гипербола. Итак, любая плоскость, не параллельная оси гиперболического цилиндра, пересекает его по гиперболе. § 82. Прямолинейные образующие фигур второго порядка Займемся разысканием прямых, целиком лежащих на данной фигуре второго порядка. Эллипсоид является ограниченной фигурой и поэтому прямых не содержит. Нет прямых также на эллиптическом параболоиде — + -^-=22 (1) р q и двуполостном гиперболоиде £+£--?--'• да В самом деле, в предыдущих параграфах было показано, что плоскость z=h может пересекать какую-либо из этих фигур по эллипсу, иметь с ней одну общую точку и, наконец, не иметь общих точек. Следовательно, прямых, параллельных плоскости Оху, на фигурах (1) и (2) нет. Если же прямая не параллельна плоскости Оху, то координата z точек этой прямой может принимать все вещественные значения. Но для точек фигур (1) и (2) координата z ограничена соответственно неравенствами z^O и \z\^c, откуда и следует наше утверждение. На конусе, эллиптическом, параболическом и гиперболическом цилиндрах прямые имеются. Более того, каждая из этих фигур может быть образована движением прямой, которая называется прямолинейной образующей,
§ 83. Прямолинейные образующие однополостного гиперболоида 235 Выше было показано, что прямые имеются также на одно- полостном гиперболоиде и гиперболическом параболоиде. Мы покажем, что каждая из этих фигур может быть образована перемещением любой из прямых, лежащих на ней, в силу чего эти прямые называются прямолинейными образующими. § 83. Прямолинейные образующие однополостного гиперболоида Теорема 1. Через каждую точку однополостного гиперболоида проходят две и только две его прямолинейные образующие. ф Пусть Мо'(хо9 1/о, 2о) —произвольная точка однополостного гиперболоида а2^ Ь2 С2 W и x=x0-{-lt9 y=yo+mtf ■ z=z0+nt — (2) параметрические уравнения проходящей через нее прямой. Чтобы найти общие точки прямой (2) и гиперболоида (1), надо подставить выражения х, у, z из формул (2) в равенство (1). Учитывая то, что точка М0 лежит на гиперболоиде (1), т. е., что *02 , УО2 ,2о2 1 /оч "Г "Та 1Г — [> W а2 ' Ь2 мы получим в результате подстановки равенство / /2 . /гс2 + ^-4)<*+2(^- + ^-^)<=°- <«> \ а' Для того чтобы прямая (2) целиком лежала на гиперболоиде (1), необходимо и достаточно, чтобы равенство (4) было верным при любом значении t, но это возможно тогда и только тогда, когда оба коэффициента при t и t2 равны нулю: I2 ■ /гс2 п2 + -ТГ :зг=0, (5) а2 ' Ъ2 с2 х01 уоШ z0n -Ж + -&—^--°- (в) Направляющий вектор й(1, /гс, гс) прямолинейной образующей гиперболоида (1) должен удовлетворять уравнениям (5) и (6). Из уравнения (5) видно, что гс^=0, так как при гс=0 из (5) сле-
236 Глава 8. Фигуры второго порядка дует /=0, т=0, а направляющий вектор должен быть ненулевым. Так как направляющий вектор интересует нас лишь с точностью до числового множителя, то можно положить п=с, и уравнения (5) и (6) примут вид: -^Г + -йГ=1> (7) х01 уопг ' z0 , . + -&- = —-• \Р). а2 ' Ьг с Мы получили систему двух уравнений с двумя неизвестными I и т. Решим ее. Так как из уравнения (7) следует, что \т\ ^6, то можно ввести обозначение m=b sin ф. (9) Тогда из формулы (7) получим ±/=acos<p. (10) Уравнение (8) принимает вид , Хо у о Zq t ч ± cos фН—г— sin ф= -—. (11) Перенося второе слагаемое из левой части равенства в правую и возводя обе части равенства в квадрат, получим после простых преобразований l^H-^)sm2?-2^sin?- Отсюда, используя равенство (3), найдем Хо2 , *02 =() а2 ' с2 i/oZo Хо Ьс а /т\ Sln<p= * +.^ • (12) а2 ' б2 По формулам (9) — (11) получим_теперь лее.пары значений / и т\ присоединяя к ним п=с, найдем: ХъХъ Уо yoZo Хо ас Ь , Ьс а /<лч -а xt_,yt ' т=Ь # , У? ' П1=С; (13) b2 a2. ' b*
§ 83. Прямолинейные образующие однопол остного гиперболоида 237 •Уо2р _ Хр XqZq ас xol ■■+ • 4- Уо Ь Л1_' к=а—ъ гт-, т=Ь Xq2 ^ , п2=с. (14). Ь2 а2 -1 Ь2 Непосредственной проверкой можно убедиться в том, что значения /, т, /г, выражаемые формулами (13) и (14), действительно удовлетворяют уравнениям (5) и (6). Так как третья координата направляющего вектора прямолинейной образующей отлична от нуля, то каждая прямолинейная образующая гиперболоида (1) пересекает плоскость Оху, а следовательно, и горловой эллипс: *.+ *.+ *. = х' а2^ Ъ2^ с2 ' \ (15) 2 = 0. Таким образом, в качестве точки М0(хо9 у0, z0) прямолинейной образующей всегда можно взять точку горлового эллипса и поэтому Хо2 , Уо2 а2 ■■ б2 = 1, г0=0. Теперь формулы (13) и (14), задающие координаты направляющих векторов прямолинейных образующих однополостного гиперболоида (1) принимают вид /t= f-, mi= , tii = c; (16) о а 1 йУ° ЬХ<> /1-74 к=—т—у т2= , п2=с. (17) о а Итак, через каждую точку М0(х0> у0, 0) горлового эллипса проходят две прямолинейные образующие гиперболоида (1), выражаемые уравнениями: аУо j , bxo . ■ ± ,__. х=.хр ^— U у=у0-\ —t, z=ct (18) и I аУ° 4. Ьх0 x=x0+—j—t, y=y0 /, z=ct, (19) о а
238 Глава 8. Фигуры второго порядка и любая прямолинейная образующая может быть задана такими уравнениями, ф Разобьем множество всех прямолинейных образующих гиперболоида (1) на два семейства: к первому семейству отнесем образующие с направляющими векторами (16), а ко второму — образующие с направляющими векторами (17). Тогда теорему 1 можно сформулировать следующим образом. Теорема Г. Через каждую точку однополостного гиперболоида проходит одна прямолинейная образующая из первого семейства и одна из второго. Теперь ясно, что однополостный гиперболоид может быть получен перемещением прямой, пробегающей всевозможные положения прямолинейных образующих одного из двух семейств. Этим и объясняется название «прямолинейная образующая». Однополостный гиперболоид вращения образуется вращением любой из его прямолинейных образующих вокруг оси гиперболоида. Отметим еще некоторые свойства прямолинейных образующих однополостного гиперболоида. Теорема 2. Две прямолинейные образующие однополостного гиперболоида, принадлежащие к разным семействам, всегда лежат в одной плоскости и параллельны тогда и только тогда, когда они проходят через точки горлового эллипса; симметричные относительно центра. ♦ Пусть (18) и x=Xi+-W^t, y=yo b-^-tt z=ct- (20) о а рассматриваемые образующие. Чтобы показать, что они лежат в одной плоскости, используем условие, полученное в § 66. Имеем = с [^ (*o2-*i2) + -£ (</o2-*/i2) ] = -•**№+£)-№+%■)]-«<«-*-■ Хо—Х\ ау0 Ь ayi Ь Уо—Ух bxo а bxi 0 с с
§ 84. Прямолинейные образующие гиперболического параболоида 239 .Итак, прямые (18) и (20) лежат в одной плоскости. При этом они параллельны в том и только в том случае, если их направляющие векторы _ / ау0 Ьхо \ / аух bxi \ коллинеарны, что равносильно условиям Xi=— x0, yt=—y0. Но в этом случае точки Мо(х0, */о, 0) и Mi(xi, yu 0) горлового эллипса действительно симметричны относительно центра. # Теорема 3. Две прямолинейные образующие однополостного гиперболоида, принадлежащие одному семейству, являются скре- '■ щивающимися прямыми. ф Пусть (19) и (20) —две прямолинейные образующие из второго семейства. Имеем I xo—Xi yo—yi 0 ш/о Ьхо ш/1 bxj I Ь а Используя результаты § 66, получаем, что прямые (19) и (20) являются скрещивающимися. Для прямолинейных образующих первого семейства доказательство проводится аналогично, ф § 84. Прямолинейные образующие гиперболического параболоида Теорема 1. Через каждую точку гиперболического параболоида у ~-^=2г (р>0, <7>0) (1) проходят две и только две его прямолинейные образующие. ф Пусть Мо(х0> у0> го) — произвольная точка гиперболического параболоида (1), а x=Xo+it, y=y0+mty z=z0+nt— (2) параметрические уравнения прямой, проходящей через эту точку и имеющей направляющий вектор а(/, т, п). Подставляя выра- =~с [4 (*°-*о2+ т (у°-у1)2] фо-
240 Глава 8. Фигуры второго порядка жения х, у и z из формул (2) в уравнение (1), получаем \ р q I г \ р q ! Для того чтобы прямая (2) целиком лежала на гиперболоиде (1), необходимо и достаточно, чтобы в равенстве (3) коэффициенты при t и t2 были равны нулю: — —з-=о. (*) pz <t Х01 УоГП p Из равенства (4) находим -п=0. (5) т=±]/Л-1 и, подставляя это в равенство (5), получаем V P ypq ' Итак, для координат направляющего вектора прямолинейной образующей получаем две системы значений: k=ip, m2=—yq, пг= i~P fq Хо y0 fp H' так что через каждую точку M0(xof y0, Zo) гиперболического параболоида (1) проходят две его прямолинейные образующие: x=Xo+fp~t, y=y0+llt, z=z0+ (A=- -t=) t (6) vip fq' и x=Xo+T/'pt, У^Уо-Ht, z=Zo+ (-^= + "^) *■ (7), XIP V<T
§ 84. Прямолинейные образующие гиперболического параболоида 241 Заметим, что все прямолинейные образующие (6) параллельны ^плоскости * У г, fp 1/Q а образующие (7) параллельны плоскости 1р fq Разобьем множество всех прямолинейных образующих гиперболического параболоида (1) на два семейства: к первому отнесем образующие (6), а ко второму — образующие (7). По доказанному, через каждую точку гиперболического параболоида (1) проходит по одной образующей из каждого семейства. Гиперболический параболоид может быть образован перемещением его ^прямолинейной образующей, пробегающей положения всех образующих одного из двух семейств. Теореца 2. Две прямолинейные образующие гиперболического параболоида, принадлежащие к разным семействам, пересекаются. ; ♦ Как видно из уравнений (6) и (7), первая координата направляющего вектора каждой из прямолинейных образующих гиперболического параболоида (1) отлична от нуля. Следовательно, каждая образующая пересекает плоскость Oyz, и можно считать/что #0=0. Рассмотрим уравнения двух прямолинейных образующих из разных семейств: *=fpU y=yi+Yqt9 z=zi--^t (8) fq и — — t/2 *=У PU У=У2-У qt, z=z2+ -==г t (9) 1q Прямые (8) и (9) не параллельны, так как их направляющие векторы не коллинеарны. Покажем, что эти прямые лежат в одной плоскости. 0 \}г—Hi Z2—Zi Гр V7 —*= у7 -VT Уг Гя =_^[(^+222)_(i+22l)]
242 Глава 8. Фигуры второго порядка Но так как точки Atf2(0, у2, z2), M4 (0, у и Zi) лежат на гиперболическом параболоиде. Итак, прямые (8) и (9) пересекаются, ф Теорема 3. Любые две прямолинейные образующие гиперболического параболоида, принадлежащие одному семейству, являются скрещивающимися. ф Две прямолинейные образующие П± и П2 гиперболического параболоида, принадлежащие одному семейству, не могут пересекаться, так как это противоречило бы теореме 1. Прямые IIi и Пг не могут быть и параллельными. В самом деле, если бы они были параллельны, то прямолинейная образующая другого семейства, описывающая гиперболический параболоид, пересекала бы их и находилась бы с ними в одной плоскости, т. е. гиперболический параболоид помещался бы в плоскости, что невозможно. #
Часть III ВЕКТОРНЫЕ ПРОСТРАНСТВА В результате обобщения некоторых свойств векторов и игнорирования других их свойств возникает понятие многомерного векторного пространства, являющееся основным понятием линейной алгебры и одним из важнейших в математике. В этой части книги излагается теория векторных пространств. Глава 9 ВЕКТОРНЫЕ ПРОСТРАНСТВА, § 85. Определение и простейшие свойства Рассмотрим множество V всех векторов. На V определена алгебраическая операция — сложение векторов. Определено также умножение векторов на вещественные числа, причем произведение вектора на число — вектор. Эти операции обладают следующими свойствами: 1. Относительно сложения V является абелевой группой. 2. Если аир — числа, а — вектор, то (оф) а=а (ра), (а+р) а=аа+ра. 3. Если а — вектор, то 1а=а. 4. Если а — число, а и Б — векторы, то ' а(а+5)-=аа+а5. Аналогичными свойствами обладают и многие другие математические объекты, например множество Р[х] всех полиномов над полем Р (относительно сложения полиномов и умножения полиномов на элементы поля Р). Мы хотим изучить свойства, общие для всех этих объектов, т. е. не связанные с природой элементов, составляющих эти объекты (например, с тем, что это именно- векторы или полиномы), а вытекающие из наличия свойств 1—4. С этой целью введем понятие векторного пространства.
244 Глава 9. Векторные пространства Пусть Р — произвольное поле, элементы которого будем называть числами, a V — непустое множество, элементы которого назовем векторами. Пусть на V задана алгебраическая операция, которая называется сложением и обозначается символом +• Пусть еще определено отображение декартова произведения Py^V в F, которое называется умножением векторов на числа; образ пары (а, а) при этом отображении называется произведением числа а и вектора а и обозначается символом аа. V называется векторным (или.линейным) пространством над полем Р, если выполняются следующие условия: 1) относительно сложения V — абелева группа; 2) умножение на числа ассоциативно, т. е. для любых чисел а и р из Р и любого вектора а из V (ар)а'=а(ра); 3) если 1 — единица поля Р и а — произвольный вектор из V, то 1а=а; 4) умножение векторов на числа дистрибутивно относительно сложения векторов, т. е. для любого числа аизРи любых век- ^ торов а и Б из V а(а+5)=аа+а&; 5) умножение векторов на числа дистрибутивно относительно сложения ^исел, т. е. для любых чисел а и р из Р и любого вектора а из У (а+р) а=аа+ра. Согласно определению векторного пространства, относительно сложения множество V является группой. Эта группа называется аддитивной группой пространства V. Векторы пространства V будем обозначать малыми латинскими буквами, напечатанными с линией сверху, элементы поля Р — малыми греческими или латинскими буквами, исключая нуль и единицу этого поля, для обозначения которых будем употреблять соответственно символы 0 и 1. Поле Р будем называть основным полем. 1. Множество всех векторов (классов направленных отрезков) является векторным пространством над полем вещественных чисел. Аналогично множество всех векторов какой-либо плоскости и множество всех векторов какой-либо прямой являются векторными пространствами над полем вещественных чисел. 2. Множество Рт, п всех тХм-матриц над полем Р относительно сложения матриц и умножения матриц на элементы поля Р является векторным пространством над этим полем. В частности, множество Рп, i всех /г-членных
§ 85. Определение и простейшие свойства 245 столбцов [!]• доставленных из элементов аг, i= 1, 2, ... , п, поля Р, является векторным пространством над этим полем, если столбцы складываются и умножаются на элементы поля Р так, как матрицы: ГаГ L«n_ + №1 • LPJ а2+р2 Lctn+Pn _ . Y а2 = ГУ«1 1 Ytt2 _Yan J Аналогично для множества Pi, n всех я-членных строк [ai a2 ... an]. 3. Пусть Р — произвольное поле. Рассмотрим множество V всех бесконечных последовательностей (at, аг, ... , ап, ...), члены ал которых принадлежат полю Р. Сложение последовательностей и умножение последовательностей на числа из Р зададим формулами: (аь а2, ... , ая, ...)'+(Pi, рг, ... , рп, ...) = = (ai+Pi, a2+p2, ... , ап+рп, ...), Y(ai, а2, ... , an, ...) = (yai, уаг, ... , Y«n, ...). Тогда F станет векторным пространством над полем Р. 4. Произвольное поле Р есть векторное пространство над Р. Здесь мы рассматриваем сложение в поле как сложение векторов, а умножение — как умножение вектора на число. 5. Поле С комплексных чисел есть векторное пространство над полем R вещественных чисел. Здесь комплексные числа играют роль векторов, а вещественные >— еще и роль чисел. 6. Множество Р [х] всех полиномов над полем Р, рассматриваемое вместе со сложением полиномов и умножением полиномов на числа из Р., является векторным пространством над полем Р. 7. Пусть п — фиксированное натуральное число. В пространстве Р [х] рассмотрим множество всех тех полиномов, степени которых не превосходят числа п (0 мы считаем полиномом нулевой степени). Очевидно, это множество также является векторным пространством над полем Р. 8. Множество всех вещественных функций одной переменной является векторным пространством над полем вещественных чисел. Сложение функций и умножение функций на вещественные числа определяются формулами: (f+g) (*) =№+№. W) <*) =VW. (i) 9. Пусть [a, p] — фиксированный сегмент вещественной оси. Множество всех вещественных функций одной переменной, непрерывных на сегменте [а, р],
246 Глава 9. Векторные пространства относительно сложения функций и умножения функции на вещественное число а, определенных равенствами (1), также является векторным пространством над полем вещественных чисел. Будем обозначать это пространство символом С [а, 0]. Пусть Р — произвольное поле, a V — одноэлементное множество. Обозначим элемент множества V символом 0. Зададим сложение в V и умножение элемента множества V на числа из Р формулами 0+0=0, М)=0, К^Р. Мы превратили множество V в векторное пространство над полем Р. Это пространство называется нулевым. Получим простейшие следствия из аксиом векторного пространства. 1. Так как относительно сложения векторов пространство V является абелевой группой, то в У лишь один нулевой вектор, который мы будем обозначать символом 0. Для каждого а из V в V есть единственный противоположный вектор —а, такой, что а+(—а)=0. Определено вычитание, т. е. для любых векторов а и Б пространства V уравнение а-{-х=Б имеет в V единственное решение х=Б+(—а). Это решение называется разностью 5—а. Для любого вектора а а—а=0. Можно говорить о сумме нескольких векторов, причем порядок слагаемых в этой сумме значения не имеет. 2. Умножение векторов на числа дистрибутивно относительно вычитания векторов и относительно вычитания чисел, т. е. если а и Б — векторы, а и (5 — числа, то а(а—Б)=аа—аБ, (2) (а—р)а=аа—ра. (3) ф а(а—Б)+аБ=а[(а—5)+5]=аа. Отсюда и из определения разности следует-(2). Равенство (3) доказывается аналогично, ф 3. Если аеР, aGF, то аа=0 тогда и только тогда, когда а=0 или а=0. ф 0а=(а—а)а=аа—аа, где аеР. Так как, с другой стороны, aa—aa=0, то 0а=0. Далее a0=a(a—a)=aa—aa=0. Пусть, обратно, верно равенство aa=0 и аФ§. Умножив обе части этого равенства на а-1, получим а-1(аа)=а-Ю=^ 1а=0=^а=0. •
§ 86. Линейная зависимость 247 4. Для любого вектора а пространства V {-\)а=-а. (4) 4 a+(-l)d=[l + (-lj]a=Oa=0=> (4). ф § 86. Линейная зависимость Пусть V — векторное пространство над полем Р, аи а2, ... , аш (1) есть система векторов пространства V. Мы употребляем слово «система» вместо «подмножество», когда хотим сказать, что среди взятых векторов не исключены повторения, т. е. элемент множества V может входить в систему несколько раз (например, в (1) векторы ui и а2 могут быть равны). Пусть, далее, ai, о&2, ... , am (2) есть элементы поля Р. Вектор aiai+a2a2+.. .+amam (3) называется линейной комбинацией векторов (1), а элементы (2) — коэффициентами этой линейной комбинации. Линейная комбинация (3) называется нетривиальной, если хотя бы один из ее коэффициентов (2) не равен нулю. Если аг=0, i=l, 2, ... , m, то линейная комбинация (3) называется тривиальной. Конечная система векторов (1) называется линейно зависимой, если какая- либо нетривиальная линейная комбинация этих векторов равна нулевому вектору. Это значит, что в поле Р существуют такие элементы (2), хотя бы один из которых не равен нулю, что aiai+a2a2+- • .+amam=0. e(4) Конечная система векторов (1) называется линейно независимой, если всякая нетривиальная линейная комбинация этих векторов отлична от нулевого вектора, т. е. из равенства (4) всегда следуют равенства аг=0, *"=1, 2, ... , т. Так как для а из Р и а из V равенство aa=0 имеет место лишь при а=0 или а=0, то при т=1 эти определения приводят к следующему утверждению: система, содержащая лишь один вектор а, линейно зависима тогда и только тогда, когда а=0,
248 Глава 9. Векторные пространства Теорема. При гп>\ система векторов (1) линейно зависима тогда и только тогда, когда хотя бы один из векторов этой системы есть линейная комбинация остальных. Для пространства классов направленных отрезков эта теорема, доказана в § 45. Приведенное там доказательство дословно сохраняется и в общем случае. Если в системе (1) есть равные векторы, то, очевидно, она линейно зависима. Отметим простейшие свойства линейной зависимости. 1. Система, содержащая нулевой вектор, линейно зависима, так как для любых векторов а2, ... , аш Ь0+0-а2+. ..+0-ат=0. 2. Если часть системы (1) линейно зависима, то линейно зависима и вся система (1). ♦ В самом деле, пусть, например, #1, U2, . > . , Щ есть линейно зависимая часть системы (1). Тогда существует нетривиальная линейная комбинация aiai+a2a2+.. .+<*№, равная нулевому вектору. Эту комбинацию можно рассматривать как нетривиальную линейную комбинацию векторов (1): aiai+a2a2+.. .+овд+0 й+1+'... .+0 am=0. Поэтому (1) —линейно зависимая система. # Иначе это свойство можно сформулировать так: всякая часть линейно независимой системы линейно независима. Можно говорить и о линейной независимости и зависимости бесконечной системы векторов. Бесконечная система векторов называется линейно независимой, если линейно независима каждая ее конечная часть, и линейно зависимой, если какая-либо ее конечная часть линейно зависима. 1. Как показано в § 45, в пространстве классов направленных отрезков два вектора линейно зависимы, если они коллинеарны, три — если они компланарны, четыре вектора всегда линейно зависимы. 2. В пространстве Рп, i я-членных столбцов столбцы П 1 0 , *2 = 1 0 6 , ... , ёп = ~°1 _1 J
§ 87. Эквивалентные системы векторов 249 линейно независимы. В самом деле, пусть aiei+a2e2+. ..+апёп= | ; |- (6) Подсчитаем левую часть этого равенства: aiei+a2e2+.. .+апёп = Очевидно, из (6) следует равенство нулю всех коэффициентов а,, т. е. векторы (5) линейно независимы. Аналогично в пространстве всех бесконечных последовательностей линейно независимы последовательности et = (l, 0, ...), ё2= (0, 1, 0, ...), ... 3. В пространстве Рт, п всех mX^-матриц над полем Р рассмотрим матрицы Ец, t=l, 2, ...,m, /=1, 2, ... , /i, (7) где Ец — матрица, элемент которой, занимающий позицию i, /, равен 1, а остальные элементы равны 0. Так же, как и в предыдущем примере, легко показать, что матрицы (7) линейно независимы. 4. Произвольное поле Р является векторным пространством над Р. Любая пара а, р его элементов линейно зависима, так как при афО p = a_1 Pa. 5. Поле комплексных чисел — векторное пространство над полем вещественных чисел. Рассмотрим два вектора этого пространства — числа 1 и L Так как ни один из этих векторов не равен другому, умноженному на вещественное число, то они линейно независимы. - 6. В пространстве Р [х] полиномы 1, х, х\ ... , хп, ... (8) составляют линейно независимую систему. Для доказательства этого факта достаточно ycYaHOBHTb, что любая конечная часть системы (8) линейно независима. Пусть *ni, Хп2, . . . , Хпт (9) есть произвольная конечная часть системы (8). Рассмотрим какую-либо линейную комбинацию векторов (9), равную нулю: ai*ni+a2Jtn2+.. .+am*nm=0.. (10) Так как полином равен нулю только тогда, когда равны нулю все его коэффициенты, то из равенства (10) вытекают равенства at==0, i = l, 2, ... , т. Последнее означает линейную независимость системы (9). § 87. Эквивалентные системы векторов Пусть А и В — две системы векторов векторного пространства V над полем Р. Если каждый вектор из А есть линейная комбинация каких-либо векторов из В с коэффициентами из поля Ру то говорят, что система А линейно выражается через систему В.
250 Глава 9. Векторные пространства Очевидно, это свойство транзитивно, т. е. если, в свою очередь, система В линейно выражается через некоторую систему С, то А линейно выражается через С. Очевидно, если вектор а содержится в системе Л, то система, состоящая только из этого вектора а, линейно выражается через А. Точно так же, если система векторов В содержится в системе А^то В линейно выражается через А. Если система А линейно выражается через В и, обратно, В линейно выражается через Л, то Л и В разывают эквивалентными системами векторов. Например, в пространстве столбцов длины 2 три системы [?]■ № И- И' [!]• М- [!] - эквивалентны. Очевидна транзитивность эквивалентности систем векторов: если А, В и С — три такие системы векторов, что А и В эквивалентны и В и С эквивалентны, то А и С также эквивалентны. Если какой-либо вектор а системы А линейно выражается через другие векторы этой системы, то, очевидно, устранив из системы А вектор а, мы получим систему, эквивалентную системе А. Основная теорема о линейной зависимости. Пусть V — векторное пространство над полем Р, а аи а2, ... , as, (1) Би Б2, ... , bt (2) есть две системы векторов пространства V. Если система (1) линейно независима и линейно выражается через систему (2), то s^.t. При этом, если s=t, то системы (1) и (2) эквивалентны, если же s<t, то систему (1) можно дополнить подходящими векторами из (2) до системы, содержащей точно t векторов и эквивалентной системе (2). ф Пусть сначала 5=1. Тогда, очевидно, t^s. Если и /=1, то ai = a5i, aeP. a=7^=0, так как ai^=0 (система (1) линейно независима). Значит, 5i=a~1ai и (1) и (2) — эквивалентные системы. Если же />1, то ai=ai5i+a252+.. ,+а*5*, сц^Р, i=l, 2, ... , t.
§ 87. Эквивалентные системы векторов 251 Здесь хотя бы один из коэффициентов сы не равен нулю, так как й{ФО. Пусть, для определенности, ai=^=0. Тогда Bi = aricii—аг^аг&г—• •.—ai-1a^, т. е. вектор bi линейно выражается через систему аи Ь2, ... , bt. (3) Так как каждый вектор системы (2), кроме Ви содержится в системе (3), то, значит, первая из них линейно выражается через вторую. В свою очередь (3) по таким же причинам линейно выражается через (2), т. е. (2) и (3) —эквивалентные системы векторов. Для 5=1 теорема доказана. Далее воспользуемся индукцией по 5. Пусть т>1 и для s=m— 1 теорема верна. Возьмем s = m. Часть йи а2, ... , ат-1 (4) линейно независимой системы (1) линейно независима и линейно выражается через систему (2). По индуктивному предположению m— l^t и при m-\ = t (5) системы (4) и (2) эквивалентны, а при т—1<* (6) систему (4) можно дополнить подходящими векторами из (2) до системы, эквивалентной (2) и содержащей точно t векторов. Покажем сейчас, что случай (5) невозможен. В самом деле, в этой ситуации (2) и (4)—эквивалентные системы ив силу транзитивности линейной выражаемоети система (1) линейно выражается через (4), что противоречит-линейной независимости системы (1). Таким образом, всегда верно неравенство (6) и, значит, m^Lt. Дополним (4) подходящими векторами из (2) до системы, эквивалентной (2) и содержащей точно t векторов. Пусть это будет, для определенности, йи й2, ... , am-i, Бт, ... , Bt. (7) Из транзитивности линейной выражаемоети следует, что вектор йт линейно выражается через систему (7): am=Piai+p2a2+. • •+Pm-iam-i+Ym&w+.. .+ytBt, Pi, Ti^P. (8)
252 Глава 9. Векторные пространства Среди коэффициентов yi есть не равные нулю, иначе система (1) была бы линейно зависимой. Будем, для определенности, считать, что ym¥=0. Тогда, разделив обе части равенства (8) на уту можно вектор Бт представить как линейную комбинацию векторов (1), если t=m, и векторов #ь #2, ... , ат-и 5m+i, ... , Ъи (9) если. t>m. Таким образом, при t=m каждый вектор системы (7) линейно выражается через систему (1) и в силу равенства (8) (1) линейно выражается через (7). Значит, (1) эквивалентна (7) и по транзитивности эквивалентности (1) эквивалентна (2). При t>m в силу тех же причин (9) и (2)—эквивалентные системы, ф Следствие. Две конечные эквивалентные линейно независимые системы векторов содержат равные количества векторов. ♦ В самом деле, если (1) и (2) —такие системы, то, по основной теореме, s^. Но ничто не мешает взять в качестве первой систему (2) и (1) —в качестве второй. Тогда получим f^s. Следовательно, s=t ф § 88. Максимальная линейно независимая подсистема Пусть ' Si, Й2, . . . , От (1) есть т векторов векторного пространства V над полем Я. Возьмем некоторую часть системы (1), которая может совпадать и со всей системой (1). Пусть, например, это векторы Qit, #г*2> ...» #гп« \£) Система векторов (2) называется максимальной линейно независимой подсистемой системы (1), если она удовлетворяет следующим двум условиям: 1) система (2) линейно независима; 2) если к системе (2) присоединить какой-либо один вектор системы (1), то полученная система будет линейно зависима. Теорема 1. Подсистема (2) системы векторов (1) является максимальной линейно независимой подсистемой тогда и лишь тогда, когда выполняются два условия: 1) система (2) линейно независима; 2) система (1) линейно выражается через систему (2).
§ 88. Максимальная линейно независимая подсистема 253 "-■ ♦ Пусть (2)—максимальная линейно независимая подсистема системы (1), а—г произвольный вектор системы (1), Система йцу йг2, ... , йгд, а (3) линейно зависима, следовательно, существует равная нулю нетривиальная линейная комбинация векторов (3): а1аг1+а2аг2+.. \+апаы+аа=0. (4) В равенстве (4) аФО, иное противоречило бы линейной независимости системы (2). Следовательно, с помощью равенства (4) можно вектор а представить как линейную комбинацию векторов (2). Итак, любой вектор системы' (1) есть линейная комбинация векторов (2). Обратно, пусть система векторов (2) удовлетворяет условиям теоремы, а — произвольный вектор системы (1). Так как вектор а линейно выражается через систему (2), то система векторов (3) линейно зависима, ф Теорема 2. Если в системе (1) хотя бы^один вектор не равен нулевому вектору, то в ней есть максимальная линейно независимая подсистема. ф Очевидно, линейно независимая система векторов является своей максимальной линейно независимой подсистемой. Далее воспользуемся индукцией по /л. При т=1 система (1) линейно независима и является, следовательно, своей максимальной линейно независимой подсистемой. Пусть т>1, система (1) линейно зависима, и пусть для систем, содержащих меньше, чем /л, векторов, теорема верна. Какой-либо вектор системы (1) есть линейная комбинация остальных векторов этой системы. Устранив его, получим систему /л— 1 векторов, эквивалентную системе (1). В ней содержится максимальная линейно независимая подсистема, которая, очевидно, является и максимальной линейно независимой подсистемой системы (1). ф Теорема 3. Все максимальные линейно независимые подсистемы системы (1) содержат равные количества векторов. ф Каждая из этих подсистем эквивалентна в силу теоремы 1 системе (1), поэтому все они эквивалентны друг другу. В предыдущем параграфе доказано, что конечные линейно независимые эквивалентные системы векторов содержат одинаковое число Векторов, ф Число векторов, входящих в максимальную линейно независимую подсистему системы (1), называется рангом системы (1).
254 Глава 9. Векторные пространства Если каждый вектор системы (1) равен нулевому, то она называется системой нулевого ранга. Теорема 4. Эквивалентные конечные системы векторов имеют равные ранги. ф Пусть Л и В — конечные эквивалентные системы векторов. Если в Л нет ненулевых векторов, то, очевидно, и в В их "нет, и обе эти системы нулевого ранга. Если же в Л и в В есть ненулевые векторы, то максимальные линейно независимые подсистемы из Л и из В эквивалентны соответственно Л и В и, значит, эквивалентны друг другу. Но эквивалентные линейно независимые системы содержат равные количества векторов, ф § 89. Ранг матрицы В этом параграфе рассматриваются матрицы над произвольным полем Р. Пусть 4=[aij], t=l,2, ...,m, /=1, 2, ... , п. (1) Столбцы матрицы Л будем рассматривать как векторы пространства m-членных столбцов. Ранг системы столбцов матрицы А называется рангом матрицы Л. 1. Ранг нулевой матрицы равен нулю. 2. Ранги матриц , П 2 31 Г1 2 31 [1 2 3]' I 4 в]' [о 0 0.1 равны 1. 3. Ранги матриц к я- к: :]• [ffl равны 2. 4. Ранг матрицы Еп равен п. В § 33 для квадратной матрицы введено понятие минора. Будем употреблять это понятие и в том случае, когда матрица не квадратная. Нас будут интересовать порядки отличных от нуля миноров матрицы, а именно наивысший среди этих порядков. Теорема 1 (теорема о ранге матрицы). Ранг матрицы равен наивысшему порядку отличных от нуля ее миноров. ♦ Для нулевых матриц утверждение теоремы тривиально.
§ 89. Ранг матрицы 255 Пусть Л — ненулевая матрица вида (1), наивысший порядок отличных от нуля миноров которой равен г. Последнее означает, что А имеет отличный от нуля минор порядка г, но не имеет не равных нулю миноров более высоких порядков. Ради сокращения обозначений будем считать, что минор М порядка г матрицы Л, занимающий левый верхний угол, т. е. строки и столбцы с номерами 1, 2,..., г, отличен от нуля: М = an а21 0&12 «22 air 0&2r Ctrl 0&r2 (ХГг ФО. Покажем, что первые г столбцов матрицы А составляют максимальную линейно независимую подсистему системы всех ее столбцов. Обозначим символом pj столбец матрицы А с номером /: ^aij a2; Легко понять, что столбцы pU р2, • • • , Рг линейно независимы. В самом деле, пусть (2) 0&2j Cbrj J =qh /=1, 2, ... , г. Ясно, что столбцы Ци'Цг* • • • , Цт линейно независимы (определитель, столбцами которого они являются, не равен нулю). Пусть теперь О Plpi + p2p2+. . . + PrPr = Тогда, очевидно, Pl?l + P2?2+. . . + $гЯг = о о , pi=o, /=1, у Г. Сейчас мы хотим показать, что (2) — максимальная линейно независимая подсистема системы всех столбцов матрицы А. Если А содержит лишь г столбцов, то это очевидно. Если же м>г, то
256 Глава 9. Векторные пространства пусть 5 — фиксированное натуральное число, удовлетворяющее неравенствам r<s<n, a i принимает по очереди все значения 1, 2, ... , пг. Рассмотрим определитель «и ... air ais CCri • • • O&rr &rs J ССц . . . CLir CLis | порядка r+1, который получится, если приписать к минору М строку 0&г1 • • • Q*ir &is и столбец ais ars Otis • Если i>rt то dls — минор матрицы А порядка г+1 и потому di8=0. (3) Если же i^r, то du содержит равные строки и также верно равенство (3). С другой стороны, напишем разложение определителя du по элементам последней строки: 0=dis=aiiAu+.. .-\-a,irAir-\-ai8M (4) (символом Aij обозначено алгебраическое дополнение элемента a,ij в определителе,^). Очевидно, Ац не зависит от выбора числа /, т. е. для всех определителей du при фиксированном 5 и разных i А^ одно и то же. Обозначим Aij=Aj. Так как МФО, то из равенства (4) следует aiS=^-M-i(Aiaii+A2ai2+.. .+Arair)9 t=l, 2, ... , m. (5) Система равенств (5) равносильна равенству Ps= — M-i(Aipi+A2p2+-. .+Arpr). Таким образом, столбец матрицы А с произвольным номером 5 линейно выражается через г первых столбцов, (2) — максимальная линейно независимая система столбцов, г — ранг матрицы А.
§ 89. Ранг матрицы 257 Из приведенных рассуждений видно, что расположение минора М в левом верхнем углу не существенно, оно лишь приводит к упрощению обозначений. Если минор М расположён-в столбцах матрицы А с номерами /ь /г, ... , /г, (6) то, очевидно, упомянутые столбцы линейно независимы. Далее при построении определителя dSi мы к минору М припишем столбец с любым номером, отличным от (6). Так что как раз те г столбцов, в которых расположен минор М, составляют максимальную линейно независимую систему столбцов матрицы А, ф Заметим, что в доказательстве предыдущей теоремы мы не пользовались равенством нулю всех миноров матрицы, порядки которых больше г. Использовано только равенство нулю тех миноров порядка г+1, которые окаймляют, т. е. содержат целиком внутри себя, выбранный отличный от нуля минор М порядка г. Уже из равенства нулю только этих миноров следует, что г — ранг матрицы, и, значит, все миноры матрицы А более высокого, чем г, порядка, равны нулю. Отсюда вытекает следующее Правило вычисления ранга матрицы. При вычислении ранга матрицы следует переходить от мщоров меньших порядков к минорам больших порядков. Если уже найден минор М порядка г, отличный от нуля, то вычислять нужно лишь те миноры порядка г-\-1, которые окаймляют минор М. Если все они равны нулю, то ранг матрицы равен г. В этом случае минор М называется базисным минором матрицы. ' Базисный минор не обязательно один. Любой отличный от нуля минор М порядка г является базисным, если равны нулю все миноры порядка г+1 этой матрицы, его окаймляющие, или если нет таких миноров. Получим следствия из теоремы о ранге матрицы. Следствие 1. Ранг матрицы не меняется при транспонировании. Следствие 2. Ранг матрицы равен максимальному числу ее линейно независимых строк. Доказательства очевидны. Следствие 3. Пусть матрица Гаи С&12 • • • CLin Pi ~| jr I «21 С&22 • • • а2п 02 I O&ml 0&m2 • • • &mn pm
258 Глава 9. Векторные пространства получена из матрицы Л=[ац]9 1=1,2, ...,тп; /=1, 2, ... 9п, присоединением к столбцам матрицы А одного столбца Рь Рг, ... , Рт. (7) Ранги матриц А и В равны тогда и лишь тогда, когда столбец (7) является линейной комбинацией столбцов матрицы А. В частности, ранг матрицы не изменится, если устранить столбец (строку) этой матрицы, являющийся линейной комбинацией других ее столбцов (строк). ♦ Столбец (7) есть линейная комбинация столбцов матрицы А тогда и только тогда, когда максимальная линейно независимая система столбцов матрицы А является максимальной линейно независимой системой столбцов матрицы А. ф Следствие 4. Для равенства нулю определителя матрицы над полем необходимо и 'достаточно, чтобы столбцы (строки) этой матрицы были линейно зависимы. ♦ Пусть А — лХ^-матрица. Обозначим буквой г наивысший порядок отличных от нуля ее миноров. deti4=0 тогда и только тогда, когда г<п, т. е. когда столбцы матрицы А линейно зависимы, ф Заметим, что достаточность условия предыдущего следствия доказана ранее в § 32 и использована в доказательстве теоремы о ранге матрицы. Теорема 2. Ранг матрицы не меняется при элементарных преобразованиях. ф Так как ранг матрицы не меняется при транспонировании, то достаточно рассмотреть лишь элементарные преобразования столбцов. Пусть pU р2у • • • , Рп (8) есть система столбцов матрицы Л, р — не равное нулю число из поля Р. Какой-либо столбец, например первый, умножим на р: Ррь р2, ... , рп. (9) Очевидно, системы (8) и (9) эквивалентны и, следовательно, их ранги равны. Пусть у^Р. Рассмотрим Систему столбцов Pi+yp2> р2, ... , рп. (Ю)
§ 90. Размерность 259 Она линейно выражается через систему (8). Но и (8), в свою очередь, линейно выражается через (10), так как Pt=(pi+yp2)—y-P2. Таким образом, системы векторов (8) и (10) эквивалентны, и поэтому их ранги равны, ф I На этой теореме основан еще один способ вычисления ранга матрицы. Элементарными преобразованиями матрица приводится к настолько простому виду, что уже ясно, чему равен ее ранг (например, к ступенчатому виду). Этот способ часто не требует таких больших вычислений, как спрсоб окаймления миноров, ;однако он не дает возможности установить, какие именно столбцы (строки) матрицы линейно независимы. .Пример. Вычислить ранг матрицы А = 25 31 17 43 75 94 54 134 75 94 53 132 25 32 20 48 Решение. Применим к матрице А элементарные преобразования: 25 31 17 75 94 54 75 94 53 25 32 20 43 134 132 48 25 31 0 1 0 1 0 1 17 43 3 5 25 31 0 1 0 0 0 0 Последняя матрица содержит отличный от нуля минор 25 0 о 31 17 1 3 0 - 1 17 43 3 5 -1-2 0 '0 третьего порядка, а определитель ее равен нулю, следовательно, ранг этой матрицы равен 3. § 90. Размерность Если U — такая система векторов векторного пространства V, что V линейно выражается через U, то U называется системой образующих пространства Р. В каждом векторном пространстве V есть система образую- щих< например само V. Очевидно, все системы образующих пространства V эквивалентны, так как каждая из них эквивалентна системе Р. Векторное пространство называется конечномерным, если в нем есть конечная система образующих.
260 Глава 9. Векторные пространства В этой книге изучаются в основном конечномерные векторные пространства. Линейно независимая система образующих называется базисом пространства. Итак, базис пространства — это система U векторов пространства V, удовлетворяющая следующим условиям: 1) U линейно независима; 2) V линейно выражается через U. 1. В пространстве классов направленных отрезков каждая тройка некомпланарных векторов составляет базис. 2. В пространстве столбцов Рп, i столбцы ГП 0 Г°1 1 0 _6_ ».•••» е-п — "01 г 1 0 _1 J линейно независимы (см. § 86). С другой стороны, для произвольного столбца ГаП верно равенство £=(Zi£?i+a2e2+.. .+ап'ёП' Следовательно, (1) —базис пространства всех столбцов. 3. Аналогично матрицы Ецу t=l, ... , m, /==1, ... , п, (см. § 86) составляют базис пространства Pm, n всех mX^-матриц над полем Р. 4. Мы видели уже, что числа 1 и Г линейно независимы над полем вещественных чисел. Любое комплексное число a+pi с вещественными аир линейно выражается через 1 и i, поэтому 1, i — базис пространства комплексных чисел над полем вещественных чисел. 5. Множество всех полиномов f(x) над полем Р, степени которых не превосходят числа я, является векторным пространством. Базис этого пространства составляют, например, полиномы 1, х, х2, ... , хп. 6. Базисом пространства Р [х] является, например, система 1, х, хгу ... , хпу ... Теорема 1. В любом ненулевом конечномерном векторном пространстве существует конечный базис* * Теорема о существовании базиса векторного пространства верна для всех без исключения ненулевых пространств. Однако методы ее доказательства выходят за рамки этой книги.
§ 90. Размерность 261 ф Пусть 7Ф {0} — конечномерное векторное пространство над полем Р, а «1, Й2> . . . , йт (2) является его конечной системой образующих. Ясно, что в системе (2) есть ненулевой вектор. Следовательно, по теореме 2 § 88, в системе (2) есть максимальная линейно независимая подсистема. Эта подсистема эквивалентна системе (2) и, следовательно, является базисом пространства V. ф Теорема 2. Все базисы конечномерного векторного пространства содержат равные количества векторов. ф Пусть V — конечномерное пространство, один из базисов которого содержит п векторов. Очевидно^ в пространстве V нет бесконечного базиса, так как в силу основной теоремы о линейной зависимости всякая система векторов пространства V, содержащая больше, чем /г, векторов, линейно зависима. Таким образом, всякий базис пространства V конечен. Любые два базиса эквивалентны. Две конечные эквивалентные линейно независимые системы содержат равные количества векторов, ф Число векторов, входящих в какой-либо базис конечномерного векторного пространства F, называется размерностью пространства V и обозначается символом dim Р.* Если dim P=n, то пространство V называется n-мерным. Нулевое векторное пространство называется нульмерным. Теорема 3. Пусть V — n-мерное векторное пространство над полем Р, /г>0. Тогда любая линейно независимая система векторов пространства V содержит не больше, чем п, векторов. Эта система является базисом пространства V, если она содержит п векторов, и может быть дополнена до базиса, если она содержит меньше, чем п, векторов. ф Пусть йи й2, ... , йп (3) есть базис пространства V, а Vl, V2, ... , Vm (4) является произвольной линейно независимой системой. Тогда, по основной теореме о линейной зависимости, m^Zn и при т=п система (4) эквивалентна системе (3) и в силу транзитивности * dimension (франц.) — размерность.
262 Глава 9. Векторные пространства линейной выражаемое™ также является базисом. При т<п систему (4) можно дополнить подходящими векторами из (3) до системы, эквивалентной . (3) и содержащей точно п векторов. Пусть это будет, для определенности, vu • • • , vm, йт+1, ... , йп. (5) Если бы система (5) была линейно зависимой, то один из ее векторов был бы линейной комбинацией остальных. Отбросив его, мы получили бы эквивалентную (5) систему, содержащую п-~\ векторов, через которую линейно выражался бы (в силу транзитивности линейной выражаемости) базис (3). Так как я>/г-—1, то это противоречило бы основной .теореме о линейной зависимости. Значит, система (5) линейно независима и является, следовательно, базисом, ф § 91. Произведение [щ и% ... йь\А Пусть V—векторное пространство над полем Я, йи Й2,..., йн— векторы из Р, A=[a,ij] — £></-матрица над Р. Определим произведение [Si U2 ... йь]А формулой [Й1 Й2 ... Uk]As=[vi V2 ... Vl]t где Vj=aijut+a2jU2+.. .+ahjuk. .(Здесь, как и при умножении матриц над кольцом, строка первого сомножителя множится на столбец второго.) Например, [ui й2 из] — 1 =£i—иг. Зададим еще произведение X[ut й2 ... й*], А,еР, формулой X[ui й2 ... uh] = ['kui kU2 ... кйъ]. Определенное выше умножение матриц, как и умножение матриц над коммутативным кольцом, ассоциативно и дистрибутивно относительно сложения матриц, т. е. верна следующая Теорема 1. Пусть йи й2, ... , йи, vtf £>2, ... , vh — произвольные векторы пространства V над полем Р. Тогда: 1) если А — ky^l- и В — ly^m-матрицы над полем Р, то [Si йг ,.. uk](AB) = ([ui й2 ...йъ]А)В;
§91. Произведение [й\ иг . .„. йк]Л 263 2) если А — ky^l-матрица над Р, то ([Й1 йг ... uk]r\~[vi v2 ... vk])A = = [wt й2 .... uh]A+[vi г>2 ... Vk]A; 3) если А и В — ky^l-матрицы над Р, то [ui йг ... йк] (А+В) = [Hi йг ... йк]А + + [ui йг ... йк]В\ 4) если К^Р, А — ky^l-матрица над Р, то X([ui й2 ... uk]A) = [ui йг ... йк\{ЬА). Доказательство аналогично доказательству соответствующих свойств матриц над кольцом и предоставляется читателю. Теорема 2. Если векторы йи йг, ... , йк (1) линейно независимы, то из равенства [Й1 йг ... uk]A=[ut й2 ... йк]В (2) следует равенство А=В. ф. Пусть верно равенство (2). Тогда размеры матриц А и В одинаковы. Если А=[ац]9 Д=[Р«], t=l,2, ...,£,^/=1,2, ...,/, то из равенства (2) следует a>ijui+a2ju2+.. .+afej5fr=pij5i+P2j22+.. .+$hjuk. Перенеся все слагаемые в одну часть равенства, получим (ai— Pii)2i+(a2j—P2j)^2+.. .+ (<Xftj—$kj)uk—0. Так как векторы (1) линейно независимы, то из последнего равенства вытекает cdj—Pij=0, aij=Pij, A=B. ф
2Ы Глава 9. Векторные пространства § 92. Координаты Здесь мы рассматриваем только конечномерные пространства. Пусть в векторном пространстве V над полем Р задан некоторый базис йи Й2, . . • , йп. (1) Задавая базис, мы будем, как правило, указывать не только множество тех векторов, из которых он составлен, но и последовательность, в которой эти векторы записаны. Например, базисы U2, U\> ... , Un, составленные из одних и тех же векторов, мы будем считать различными. _ Произвольный вектор а пространства V линейно выражается через базис (1): a=xiut+X2U2-\-. .'.-\-хпйп. (2) Представление вектора а в виде (2) называют разложением его по базисным векторам (1), а коэффициенты хи х2, ... , хп в разложении (2) называют координатами вектора а в базисе (1). Столбец ГXi 1 х? L %n J называется координатным столбцом вектора а в базисе (1). Очевидно, равенство (2) равносильно следующему матричному равенству: а= [ui U2 ... йп] Ради сокращения записи введем следующие обозначения. Там, где это не должно привести к недоразумению, будем писать символ [ui] вместо строки [Hi U2 . . . йп] и букву X вместо столбца ГXi 1 х? |. L ^п А Xi х2 Хп
§ 92. Координаты 265 Предыдущее равенство в этих обозначениях примет вид a=[ui]X. (3) Теорема 1. Координатный столбец вектора в заданном базисе определен однозначно. ф Пусть для вектора а наряду с разложением (3) есть еще разложение а— [й{] Y. Тогда [ui]X=[ui\Y. (4) В предыдущем параграфе показано, что из равенства (4) следует равенство Х= Y. ф Запись а(хи*х2, ... , хп) впредь будет означать, что в отмеченном базисе вектор а имеет координаты ATi, л:2, ... , хп. Теорема 2. Если в векторном пространстве V над полем Р фиксирован какой-либо базис (1), то каждый столбец а2 (5) п элементов поля Р является столбцом координат некоторого вектора. ф (5) есть координатный столбец в базисе (1) вектора aiui.+a2U2+.. .+апйп. • Поскольку из совпадения координатных столбцов векторов следует, очевидно, равенство этих векторов, то из предыдущих двух теорем вытекает / Следствие. Пусть п>0. Если в n-мерном векторном пространстве V над полем Р фиксировать какой-либо базис и затем каждому вектору этого пространства поставить в соответствие столбец его координат в отмеченном базисе, то будет установлена биекция множества V на множество Рп, i всех п-членных столбцов, составленных из элементов поля Р. ^ Теорема 3. Координатный столбец линейной комбинации Piai+p2a2+- • <-\-Pmam
266 Глава 9. Векторные пространства векторов uj, /= 1, 2,... , /л, равен такой же линейной комбинации (с теми же коэффициентами) координатных столбцов этих векторов. ф Пусть (1)—базис пространства F, Aj — координатный столбец вектора uj в этом базисе. Тогда dj=[ui]AJ9 /=1, 2, ... , m. (6) Умножая обе части каждого из равенств (6) на Р/ и складывая полученные равенства почленно, получим Piai+p2a2+.. .+Pmam= = Р^([^г]Л1)+р2([^]Л2)+. . . + pm([ui]4m).= = [fi<]<Pii4i+P2A2+...+ Mm). • Введением в /г-мерном пространстве над полем Р координат векторов достигается «арифметизация» этого пространства, т. е. каждый вектор пространства вполне определяется столбцом п элементов поля Р — своими координатами — и линейные зависимости между векторами заменяются линейными зависимостями между их координатными столбцами. § 93. Некоторые задачи В этом параграфе мы рассмотрим ряд задач, которые решаются с помощью теоремы о ранге матрицы и введения координат. Будем считать, что координаты всех векторов взяты в одном и том же исходном базисе. 1. Условие линейной независимости Задача 1. Даны m векторов ak(aik, a2hy ... , ап"л), k=l, 2, ... , m. (1) Выяснить, является ли система векторов (1) линейно зависимой. Решение. Составим матрицу А=[ац]9 t=l,2, ...,п, /=1,2, ... , т, столбцами которрй являются координатные столбцы векторов (1)- Система векторов (1) линейно зависима тогда и лишь тогда, когда какой-либо вектор этой системы является линейной комбинацией остальных. Последнее равносильно тому, что какой- либо столбец матрицы линейно выражается через остальные ее
§ 93. Некоторые задачи 267 столбцы, т. е. столбцы матрицы А линейно зависимы. Таким образом, система векторов (1) линейно незйвисима тогда и только тогда, когда ранг матрицы А равен т. Считывая необходимое , и достаточное условие равенства нулю определителя матрицы над полем, получаем, в частности, следующее утверждение: Пусть /г>0. В п-мерном векторном пространстве п векторов составляют базис тогда и лишь тогда, когда определитель матрицы, столбцами которой служат координатные столбцы этих лекторов в некотором фиксированном базисе, отличен от нуля. Из этих рассуждений вытекает известное уже читателю условие коллинеарности двух векторов. Пусть в какой-либо аффинной системе координат заданы два вектора а(хи х2, Хз) и Б (у и Уг, Уз). а и Б коллинеарны тогда и только тогда, когда они линейно зависимы, т. е. когда ранг матрицы (2) меньше двух. Если при этом хотя бы один из векторов а, Б ненулевой, то ранг матрицы (2) равен единице и, значит, один ее столбец пропорционален другому. Аналогично обстоит дело и с условием компланарности трех векторов. Пусть даны три вектора а (хи *2, х3), Б (у и у2, уз), c(zu z2i zg). В § 53 получено условие их компланарности: Г*1 Хг [_*з У Л Уг Уг\ -J> Xi Hi Zi Хг Уг %г Хз Уз 2з =0. (3) Теперь мы получаем это условие еще раз. Векторы а, Б> с компланарны тогда и только тогда, когда они линейно зависимы, т. е. когда ранг матрицы ' Xi t/i Zi Хг у 2 z2 \Хз Уз Z3 меньше трех. Последнее обстоятельство равносильно равенству (3).
268 Глава 9. Векторные пространства Задача 2. Вычислить ранг системы векторов (1). Решение. Ранг системы (1) равен рангу матрицы А. Задача 3. Найти максимальную линейно независимую подсистему системы векторов (1). Решение. Найдем какой-либо базисный минор матрицы А. Пусть он расположен в столбцах с номерами iu i2, ... , h. (4) Тогда йи, йг2У ... , йгг максимальная линейно независимая подсистема системы векторов (1). В самом.деле, в доказательстве теоремы о ранге матрицы показано, что столбцы с номерами (4) составляют максимальную линейно независимую подсистему системы всех столбцов матрицы. Отсюда и из следствия преды: дущего параграфа вытекает сформулированное выше утверждение. Задача 4. Выяснить, является ли вектор fc(Pi, Ра, •.. , Рп) линейной комбинацией векторов (1), и если является, то представить его в виде линейной комбинации векторов (1)^ Решение. Вектор Б есть линейная комбинация векторов (1) тогда и лишь тогда, когда его координатный столбец является линейной комбинацией координатных столбцов векторов (1). В § 89 доказано, что последнее обстоятельство равносильно равенству рангов матриц А и - Г0Сц di2 ... dim Pi "1 v I OC21 0&22 • • • ^2m P2 I LO&nl dnl • • • &nm Pn J Таким образом, вектор Б есть линейная комбинация векторов (1) тогда и лишь тогда, когда ранги матриц А и А равны. Если (vi, Y2> • • • > Уп) одно из решений системы уравнений an*i+'ai2*2+. • .+aim*?n=Pi, v «21*1 + #22*2+. •> . + a2m*m=P2, 06пЛ-ЬсХп2*2+- • •""t"0&nm*m = Pn, TO &=Yiai+Y2U2+.. .+ymam. § 94. Преобразование координат Пусть UU й2, ... , йп (1) и Vu V2, ... , Vn (2)
§ 94. Преобразование координат 269 есть два базиса векторного пространства V над полем Р9 OCijy 0&2J, . . . , <Xnj (3) являются координатами вектора Vj в базисе (1). Матрица Гаи ai2 ... o&in ~] л I «21 «22 • • • 0&2п I \_CLnl &>п2 • • • &пп J столбцы которой составлены из координат (3) векторов (2), называется матрицей перехода от базиса (1) к базису (2). Так как система векторов (2) также является базисом, то det АфО. Обратно, возьмем в качестве А любую невырожденную квадратную матрицу над полем Р и напишем систему векторов (2)/координатными столбцами которых в базисе (1) являются столбцы матрицы АР В предыдущем параграфе доказано, что система векторов (2) — базис пространства V. Если А — матрица перехода от базиса (1) к базису (2), то aiiui+o^iuH-. • .+aniwn=5i, а^Й1+аг2Й2+.. .+апъйп = г>2, CLlnUi-\-a2nU2-]-. . .-\-<XnnUn = Vn. Эта система равенств равносильна матричному равенству [Й,]Л =[»,]. (4) Формула (4) выражает связь между двумя базисами пространства V. Если один из этих базисов, а именно, базис (1), считать фиксированным, исходным, то любой базис пространства V получается по формуле (4) при Подходящем выборе матрицы перехода Л. С другой стороны, взяв а качестве матрицы перехода А произвольную невырожденную квадратную матрицу порядка п над полем Р, мы по формуле (4) получим базис пространства V. Из равенства (4) можно получить формулу для выражения базиса (1) через базис (2). Умножив с этой целью обе части- равенства (4) справа на матрицу Л-1, найдем Установим связь между координатами вектора в базисе (1) и базисе (2). Пусть X и Y — координатные столбцы вектора а
270 Глава Р. Векторные пространства Но поэтому в базисах (1) и (2) соответственно. Тогда а=[й{]Х=[г!г]У. [г>г] = [йг]А, [ui]X=[ui](AY). (5) Как показано в § 91, из равенства (5) следует равенство X=AY. (6) Формула (6) выражает зависимость между координатами вектора а в базисах (1) и (2) —координатный столбец вектора а в базисе (1) получается из его координатного столбца в базисе (2) умножением слева на матрицу перехода от (1) к (2). Формулу (6) можно переписать й виде *i=anyi+ai2i/2+.. .+ain*/n, X2=a2ll/l+a22{/2+. • . + ^2пУп, где Xi L Хп _| =Х, У1 У2 Уп J = Y. Из (6) получается выражение столбца координат вектора в базисе (2) через его координатный столбец в базисе (1): Y=A-iX. § 95. Еще раз об определении определителя > Пусть V—векторное пространство над полем Я, п — натуральное число. Всякое отображение декартовой степени Vn ъ Р называется числовой функцией п переменных, определенной в пространстве V. Например, числовой функцией двух переменных является скалярное умножение векторов (классов направленных отрезков). Пусть пространство V л-мерно, п>0, йи й2, ... , й„ (1) базис пространства V. "Определим числовую функцию п переменных det следующими условиями:
§ 95. Еще раз об определении определителя 271 & 1) для любых векторов .;,;■'■. аи а2, ... , ап (2) !$фостранства V и любого числа а из поля Р t- det(afii, а2, ... , an)=det(ai, аа2, а3, ... , ап) = ...= f\ =det(ab ... , ап-и аапр=а det(ai, а2, ... , ап), |fe е. при умножении одного из векторов (2) на a det(ai, а2, ... , ап) также Умножается на а. V . 2) Если к какому-либо вектору а* системы (2) прибавляется другой вектор a? этой системы, то det (at, a2, ... , ап) не меняется, т. е. 3 det(ai, ... y^ui+uj, ... , an)=det(ai, ... , an); ■>■' v, 3) det(£i,- U2, ... , йп) = 1. Легко заметить, что функция, удовлетворяющая определению, существует. 1В самом деле, пусть Л — матрица, столбцами которой служат координатные ртолбцы векторов (2) в базисе (1). Положив Ч* det(ai, a2, ... , an)=deM, ^получим нужную функцию. Будем называть далее число det(ai, a2, ... , ап) определителем системы векторов (2) в базисе (1). Мы покажем, что условия 1—3. определяют функцию det однозначно, и это Позволит прийти к новому определению определителя матрицы над полем. Выведем прежде из определения некоторые свойства функции det. 1. Если в системе (2) есть нулевой вектор, то ее определитель равен нулю.' ♦ Умножая нулевой вектор на число 0, мы не меняем системы (2), а ее определитель умножаем на 0. ф 2. Определитель .системы (2) не меняется, если к одному из ее векторов- прибавляется другой вектор этой системы, умноженный на произвольный элемент поля Р. ♦ Пусть, например, к а4 прибавляется aa2> aeP, a =^0. Тогда det(ai+aa2, a2> ... , an) =a-1 det(at+aa2, aa2, из an) = = a_1det(ai, aa2, a3, ... , an)=det(ai> a2, ... , an). ф 3. Если два каких-либо вектора системы (2) поменять местами, то определитель системы изменит знак (т. е. умножится на —1). ♦ Пусть, например, переставляются d\ и а2. Этого можно достичь следующими преобразованиями: 1) прибавим к ui вектор а2: di+a2, а2, ... , ап; (3) 2) вычтем из второго вектора системы (3) первый: ai+a2, —аи аз, ... , ап\ (4) 3) прибавим, далее, к первому вектору системы (4) второй: а2у —аи аз,— , ап\ (5) 4) умножим второй вектор системы (5) на — \,
272 Глава 9. Векторные пространства Первые три преобразования не меняют определителя, а в результате применения четвертого преобразования определитель умножается на —1. # 4. Если система векторов Би &2, .. • , Вп получена из системы (2) в результате перестановки, т. е. bi = aS(i), /=1, 2, ... , п, где seSym n} то det(£i, В2, ... > Вп) = (— 1)' det(at, d2, ... , ап), где t = 0, если подстановка s четная, и t=\, если подстановка s нечетная, ♦ Так как четные подстановки разлагаются в произведение четного, а нечетные — нечетного числа транспозиций, то это утверждение очевидно вытекает из свойства 3. ф 5. Если система (2) линейно зависима, то ее определитель равен нулю. ф При я=1 нужное утверждение вытекает, очевидно, из свойства 1. Пусть п>1 и пусть, например, вектор fii является линейной комбинацией других векторов системы (2). Пользуясь несколько раз свойством 2, можно, не изменив определителя, заменить вектор dt нулевым вектором. Следовательно, определитель системы (2) равен нулю, ф 6. Если какой-либо, скажем i-й, вектор системы (2) является суммой двух слагаемых: at = c+d, то определитель этой системы равен сумме двух определителей — определителя системы аи ... , с, ... , ап, (6) полученной из (2) после замены вектора ui вектором с, и определителя системы fit, ... , Я, ... , fin, (7) полученной из (2) после замены вектора ai вектором 3. ♦ Пусть А — система векторов, которая получается из (2) в результате устранения вектора ui. Если система А линейно зависима, то линейно зависимы системы (2), (6), (7), их определители, согласно свойству (5), равны нулю и нужное утверждение очевидно. Пусть А — линейно независимая систему векторов, f — вектор, дополняющий систему'Л до базиса пространства V. Выразим через этот базис векторы с и 3. Пусть в полученные выражения вектор f входит с коэффициентами аир соответственно. Тогда в выражение вектора fit через этот же базис вектор f входит с коэффициентом а+р. Прибавив к вектору а» подходящую линейную комбинацию других векторов системы (2), превратим эту систему в аь ... , fii-i, (a+P)f, fii+i, .... an. (8) Аналогично превратим системы (6) и (7) соответственно в fii, ... , йг-и af, fii+i an (9) и at, ... , ai-u Pf, ai+u ... , an. (10) Ясно, что определитель системы (8) равен сумме определителей систем (9) и (10). С другой стороны, определитель ёйетемы (8) равен определителю системы (2), а определители систем (9) и (10) равны соответственно определителям систем (6) и (7). ф
§ 96. Подпространство 273 Теорема. Существует лишь единственная функция п переменных det, удовлетворяющая условиям 1—3. Если А — матрица, столбцами которой служат координатные столбцы векторов (2) в базисе (1), то det(ai, a2, ... , an)=deM. (11) ♦ Запишем разложения векторов (2) по базису (1): ai = aiiWi+a2i«2+. • .+dniun- Применяя несколько раз свойство 6, получим, что определитель системы (2) равен сумме определителей всех систем вида ajt 1 ujt, aJ2 2 uJ2, ... , ajn n uin. (12) Многие из этих определителей равны нулю в силу свойства 5. Нужно учитывать лишь такие системы (12), в которых числа /*, i=l, 2, ... , /г,^все различны. Определитель одной из таких систем равен произведению ujliO,j22 ... CLjnn(—!)' det(wi, й2, ... , йп), где / = 0 или 1 в зависимости от того, четная или нечетная подстановка /1 2 ... п \ \/i /г ... /я/ Учитывая еще условие 3 в определении функции det, получим равенство (11).# Определитель системы векторов (2) есть элемент поля Я, зависящий от выбора базиса (1). Посмотрим, как изменится определитель при переходе к другому базису. Пусть В — матрица перехода от базиса (1) к базису vu V2, ... , vn (13) пространства F, Л — матрица, столбцами которой являются координатные столбцы векторов (2) в базисе (1). Тогда [ai] = [Qi]A = [vi](B-*A). Следовательно, координатными столбцами векторов (2) в базисе (13) являются столбцы матрицы В~1А. Поэтому в силу предыдущей теоремы det(ai, a2, ... , ап) =det(B-M) или, так как определитель произведения матриц равен произведению их определителей, det (aA, a2, ... , ап) = (det В)"1 det A. Итак, при переходе к новому базису с матрицей перехода В все определители det(ai, аг, ... , ап) умножаются на (det В)-1. § 96. Подпространство Пусть V — векторное пространство над полем Р, а W — подмножество множества V. Если относительно сложения векторов и умножения векторов на числа из основного поля множество W является векторным пространством, то назовем его подпростран-.
274 Глава 9. Векторные пространства ством пространства V: Это означает, что множество W удовлетворяет аксиомам векторного пространства, если складывать его элементы друг с другом и умножать их на числа из основного поля так, как это определено для элементов из Р. Имеет место следующая Теорема 1. Пусть V — векторное пространство над полем Р. Непустое подмножество W пространства V является его подпространством тогда и только тогда, когда выполняются следующие условия: __ 1) для любых векторов а и b из W a+B^W; 2) для любого вектора а из W и числа а из Р aaef. ф Если W — подпространство пространства 7, то, очевидно, условия теоремы выполняются, так что остается доказать достаточность условий теоремы. На W задано сложение: элементы множества W будем складывать как векторы пространства V\ при этом в силу первого условия сумма векторов из W будет принадлежать W. Это сложение ассоциативно и коммутативно, так как аналогичными свойствами обладает сложение векторов в пространстве V. Если a^W, то и -aGf, ибо —a= —la. O^W, так как 0=0a. Таким образом, множество W относительно сложения является абелевой группой. В силу условия 2 задано умножение векторов на числа. При этом, очевидно, условия 4—7 из определения векторного пространства выполняются, так как они имеют место для всех векторов из F. ф Очевидно, совокупность условий теоремы 1 равносильна еле- дующему условию: __ для любых векторов а и Б из W и любых чисел а и р из основного поля aa-\-$b^W. 1. Очевидно, векторное пространство V является своим подпространством. Множество {0}, содержащее лишь нулево_й вектор пространства V, также является подпространством пространства V. Его называют нулевым подпространством. Это тривиальные подпространства пространства V. Все другие подпространства, если они есть, называют нетривиальными. 2. Рассмотрим произвольную систему векторов йи а2, ... , ап (1) векторного пространства V над полем Р. Множество всех линейных комбинаций векторов_ (1) с коэффициентами из поля Р является подпространством пространства V. Это подпространство называют линейной оболочкой векторов (1) или подпространством, натянутым на векторы (1), и обозначают символом L(ai> U2, ... , ап). 13 частности, L(a) — множество всех векторов вида aar a^f,
§ 97. Сумма и Пересечение подпространств 275 3. Множество всех полиномов из Р [*],. степени которых не- превосходят ^Некоторого фиксированного числа п — подпространство пространства Р[х]. 4. Пусть А — квадратная матрица порядка п над полем Р. Обозначим ^Символом Р[А] множество всех полиномов [(Л), где f(x)^P[x]. Очевидно, 3* [А] — подпространство пространства Рп всех квадратных матриц порядка п •щад полем Р. Теорема 2. Всякое подпространство W n-мерного векторного пространства V конечномерно, dim W^n. Равенство dim W=n равносильно равенству W= V. ♦ Если W={0}, то dim W=0^n. Пусть Шф{6}. Тогда ^пространстве W есть линейно независимые системы векторов, Например система из одного вектора, отличного от нулевого. ф пространстве W нет линейно независимой системы, содержащей больше, чем п> векторов, поэтому в W существует максимальная линейно независимая система векторов йи й2, ... , йш. (2) Ясно, что (2)—базис пространству IF. dim W=m^.n.< Если m=n, то (2) —базис пространства V. Всякий вектор простран- ' ства V линейно выражается через базис (2) и потому входит в подпространство W, т. е. V= W. # § 97. Сумма и пересечение подпространств Пусть Wu 1=1,2,...,*, (1) есть конечная система подпространств векторного простран- стэа V. Рассмотрим их сумму (см. § 10). В соответствии с общим определением суммы подмножеств аддитивной группы сумма (1) есть множество всех лекторов а, которые представляются в виде a=ai+й2+.. .+a/t, a^Wu *'=1, 2, ... , k. Очевидны следующие свойства суммы подпространств. 1. Если 1 <;/<&, то 2 Wi+ 2 Wi= 2 Wu г=1 г=/+1 г=1 причем порядок слагаемых значения не имеет.
276 Глава 9. Векторные пространства Это следует из ассоциативности и коммутативности сложения векторов. 2. Для /=1, 2, ... , k W^ Л Wu г=1 ибо каждый вектор В подпространства Wj можно записать в виде где bi=0 для /=7^/, Бз=ф. 3. £слм tFi^r2, то Пересечением подпространств (1) называют множество всех векторов, одновременно входящих в каждое из этих подпространств. Обозначим пересечение подпространств (1) символом Г) ^» f=l, 2, ... , k. Если k=2, то будем писать Wi f| Wz. Аналогично определяется пересечение бесконечной системы подпространств — это множество векторов, общих для всех подпространств системы. Теорема 1. Сумма и пересечение подпространств пространства V являются его подпространствами. ф Пусть (1)—подпространства пространства F, S — их cyMMaL S =7^=0, ибо Wi^S. Пусть a, b^S, а, реР. Вычислим аа+р&. Векторы а и b можно записать в виде: h - k а= JS аи Ь= £ biy агУ bi^Wu i=i i=i поэтому k _ ' aa+$b= J£ (aui+fibi). Так как Wi — подпространство, то сШг+Р&г^ Wi и, значит, aa+$b^S, т. е. S — подпространство. Доказательство второго утверждения теоремы оставлено читателю, ф __ Пусть теперь п>0, V — я-мерное векторное пространство, О и W — его ненулевые подпространства, йи Й2, ... , Щ и tit,
§ 97. Сумма и пересечение подпространств 277 Vb ..., vm —- базисы подпространств U и соответственно W. Тогда просто найти базис суммы U-\-W. В самом деле, ии и2, ... , щ, vi, V2, у Vm (2) есть система образующих подпространства U-\-W, поэтому максимальная линейно независимая подсистема системы векторов (2) является базисом подпространства 0-{-W. Следовательно, размерность подпространства U-\-W равна рангу системы векторов (2). __ Рассмотрим лересечение U f| W. Фиксируем в пространстве V некоторый базис. Пусть Обозначим Ui(auy (Х2г, • . . , ОСпг), 1=1, 2, . . . , /, ^j(Pij> P2j> • • • у Pnj), /=1, 2, ... , m. х(Хи #2, . . . , Хп) (3) (4) произвольный вектор пространства V. x^D (] W тогда и лишь тогда, когда х линейно выражается через векторы (3) и через векторы (4). Для этого необходимо и достаточно, чтобы ранг матрицы (5) 1 an (Xi2 . 1 0&21 0&22 . Lanl 0СП2 • был равен рангу матрицы an ai2 . • 0С21 0&22 • • _ani ссП2 . • а ранг матрицы Три Р12 .. 1 Р21 Р22 .. .. an .. an •. ani . au*i . a2ix2 a-niX-n . Plm • Ргт (6) (7) LPni Pn2 Pnm I
278 Глава 9. Векторные пространства был равен рангу матрицы Ри Р12 ... Pim Х\ P21 P22 •-. Ргт X2 LPni p n2 p* (8) Выберем базисные миноры М и N матриц (5) и (7) соответственно. Для того чтобы ранг матрицы (5) был равен рангу матрицы (6), а ранг матрицы (7) —рангу матрицы (8), необходимо и достаточно, чтобы минор М был базисным в матрице (6), а N — в матрице (8), Приравнивая нулю все миноры матриц (6) и (8), окаймляющие соответственно миноры М и N, содержащие столбец Xi хг хп и имеющие порядок на единицу выше, чем М и N, получим систему линейных уравнений. Вектор х входит в О f| W тогда и лишь тогда, когда (хи х2, ... , хп) — решение полученной системы. Пример. В трехмерном векторном пространстве над полем вещественных чисел фиксирован некоторый базис. Даны векторы ai(l, 2, 1), 62(1, 1, —1), a3(l, 3, 3), М2, 3, -1), 52(1, 2, 2). Пусть U=L(au a2, a3), W=L(6U Б2). Найти UП W.' Решение. Приравняем ранги матриц Г1 1 1 *il Г1 11"] Г 2 1 Jdl f21"l 2 1 3 х2 и 2 1 3 , 3 2 хг и 3 2 . Ll.-l 3 JC3J Ll —1 3 J L~l 2 xs\ L—1 2 J Поэтому I 1 1 1 2 1 2 1 I 3 2| 1 2 1 - — базисный минор второй матрицы, — базисный минор четвертой матрицы. Xi Хг х'з = 0, 2 1 х{ 3 2 x2 -1 2 х3 = 0 — система уравнений, задающая искомое подпространство. Вычисляя соответ-
§ 97. Сумма и пересечение подпространств 279 |рующие определители, перепишем эту систему в виде -3xi+2x2-*3 = 0, | 8jti-5*2+*3=0. I (9) fij», 5а, а), где а — любое вещественное число,— решение системы (9). Поэтому Щ[\ W — одномерное подпространство, ■ состоящее из всех векторов ай, где Размерность пересечения подпространств можно вычислить ^помощью следующей теоремы. Теорема 2. Размерность суммы двух конечномерных подпространств векторного пространства равна сумме их размерностей $инус размерность пересечения. + Если одно из слагаемых — нулевое подпространство, то /|еорема очевидна._Пусть О и W — ненулевые конечномерные подпространства V, d=0(] W, Зи .... , dk— (10) фазис пространства D. Дополним систему (10) до базиса Зи ... , 3h, Vk+u •.. , vi (И) подпространства О и до базиса Зи . . . , 3kt Wk+U , &тп (12) подпространства W. Рассмотрим систему векторов Зи • • • y3h, Vh+i, ... ,Vl, Wk+U . . . , Wm. (13) (В частности, если нет базиса (10), т. е. О (] W={0}, то систему (13) получим, выписав поочередно все векторы произвольного базиса (11) пространства О и любого базиса (12) пространства W. С другой стороны, если одно_из данных подпространств содержится в другом, например U^W, то (10) совпадает с (11) и (13) имеет вид Зи ... , 3k, Wk+i, • • • , Wm- Дальнейшие рассуждения охватывают и эти крайние случаи.) Йокажем, что (13)—базис суммы U+W. Если а^О+W, то й=Б-\-с, Б^П, c^W. Вектор В линейно выражается через векторы (11), а с — через (12), поэтому а линейно выражается через (13). Остается показать, что система (13) линейно незави-
280 Глава 9. Векторные пространства сима. С этой целью рассмотрим равенство at3i+.. .+akdk+fik+iVk+i+:'. -+^iVi+yk+iWk+i+.. .+ymWm=0, ai9 Pi, Y;<=P. (14) Из (14) следует = — (Yfc+iUJft+1-Ь . .+Ym^m). (15) Левую часть равенству (15) обозначим буквой 3. В силу (15) d^U и d^V. Поэтому d^O f] ^ и, следовательно, a=6t3i+.. .+6hah. (16) Сравнивая выражения (15) и (16) и учитывая однозначную определенность координат вектора в фиксированном базисе, найдем Рг=0, i=k-\-l9 ...,/. Тогда равенство (14) примет вид • «1Й1+. • . + 0>h3h+yk+iWh+i+. • .+Ym^m = 0. Из последнего равенства следует, что aj=0, /=1, ...,*, yt=0, t=k+l,...,mf так как (12) —базис. Таким образом, из равенства (14) следует равенство нулю всех коэффициентов, т. е. система (13) линейно независима. Итак, ,(13)—базис подпространства U[}W, содержащий l+m—k векторов, ф Из теоремы (2) получаем формулу для вычисления размерности пересечения подпространств: dim(£7D Щ =dim £7+dim W— dim(0+W). § 98. Прямая сумма подпространств Пусть Wu t=l,2, ...,*- (1) система ненулевых подпространств векторного пространства V над полем А Их-сумма называется прямой, если каждое подпространство Wi пересекается с суммой всех остальных подпространств (1) лишь по нулевому подпространству. Удобно включить в определение прямой суммы подпространств (1) и случай А=1. В этом случае сумма подпространств (1) есть, по определению, одно слагаемое Wi. Всюду ниже мы
§ 98. Прямая сумма подпространств 281 считаем, что прямая сумма подпространств может быть составлена и из одного слагаемого. То обстоятельство, что подпространство 5 является прямой суммой подпространств (1), будем записывать в виде 5=^1+^2+...+ ^. 1. Если П — плоскость, Л — не параллельная ей прямая, U — пространство векторов, V — пространство векторов, параллельных плоскости П, W — пространство векторов, параллельных прямой А, то u=V-i-W. 2. Для того же пространства U U=L(d)-i-L(5)-\-L(c), где а, б, с — три некомпланарных вектора. Если же векторы а, Ьу с компланарны, то сумма L(a)+ L(5)+L(c) не является прямой. Из теоремы 2 предыдущего параграфа вытекает Следствие 1. Размерность прямой суммы подпространств равна сумме их размерностей. Выписав друг за другом произвольные базисы каждого из слагаемых, получим базис прямой суммы. Теорема 1. Пусть S — сумма подпространств (1). 5 — прямая сумма тогда и лишь тогда, когда из всякого равенства вида k _ J£ai=0, ai<=Wiy (2) следуют равенства щ=0у i= 1,2, .,.,*. (3) ф Пусть S — прямая сумма и верно равенство (2). Из (2) следует —flj= JS й- (4) Так как левая часть равенства (4) есть вектор подпространства Wj, а правая его часть — вектор суммы 2 Wi9 (5) то uj принадлежит пересечению этих двух подпространств и по- - тому aj=0, /=1, 2, ..., k. Докажем достаточность условия теоремы. Пусть из равенства (2) следуют равенства (3), Wj— одно из подпространств (1);
282 Глава 9. Векторные пространства D — его пересечение с суммой (5). Если a&D, то Из (6) следует а= J£ aiy ui^Wi. (6) h _ JS fli=0, aj=—d. _ (7) i=i Из (7) вытекает (3),а=0, D={0}, 5 — прямая сумма, ф По определению суммы подпространств каждый вектор а суммы 5 представляется в виде k а= -Л ait ui(=Wi. (8) 2=1 Верна следующая Теорема 2. Для того чтобы сумма 5 была прямой, необходима и достаточна однозначная представимость каждого ее вектора-а в виде (8). ф Пусть 5 — прямая сумма, a^S и наряду с (8) для вектора а есть еще представление вида (8): k а= J£ Би Bi(=Wi. (9) г=1 Вычитая почленно из равенства (8) равенство (9), получим 0= JJ (Ui-Bi).- (10) г=1 Так как аг—5»е1Р*, то из формулы (10) в силу теоремы 1 следует ui-^bi=0y й{=Б{9 t=l, ... , k. Разложения (8) и (9) совпадают. Таким образом, необходимость условия теоремы доказана. Достаточность очевидна, так как если каждый вектор а из 5 лишь единственным образом представляется в виде (8), а для нулевого вектора таким представлением является 0=0+0+...+0, то из равенства (2) следуют равенства (3), т. е. 5 — прямая сумма. # Следствие 2. Если йи /=1,2,..., п,— базис пространства V, то V=L(ui) -\-L (й2) -ь • •:*-£ (tin).
§ 98. Прямая сумма подпространств 283 ф Каждый вектор а пространства V однозначно представляется в виде " " fl=aiui+a2C2+.. .+апйп. ф ? Если V=0+W, - (11) jo подпространство O(W) называется прямым дополнением подпространства W(U). Теорема 3. Для любого нетривиального подпространства конечномерного векторного пространства существует прямое дополнение. ф Пусть V — конечномерное векторное пространство, U — его тривиальное подпространство, йи t=l, 2, ... , m,— базис под: пространства V. Дополним этот базис до базиса йи ...., йы, vm+u ... , vn (12) пространства V и положим W=L(vm+u ... , Vn). Любой вектор а из V представляется в виде линейной комбинации векторов (12): а= (aiSi-f-. .+атйт) + (|WiUn+i+-. .+pn?n) =5+с, Б^О, c^W. Следовательно, ^ V=0+W. (13) Остается доказать, что сумма (13) прямая. Пусть BeO, c<=W, Б+с=0. (14) Тогда 5=ai#i+.. .+am£m, c=am+iVm+i-\--. .+an^n, Из последнего равенства вытекает a;=0, i=l, 2, ... , ny так как векторы (12) линейно независимы. Поэтому Б=с=0. Согласно теореме 1, сумма (13) прямая, ф Если верно (11), то в силу теоремы 2 каждый вектор а из V однозначно представляется в виде а=Б-{-су b^O, c^W. Вектор Б называется проекцией вектора а на подпространство V параллельно подпространству W. Очевидно, проекция суммы векторов равна сумме их проекций, а проекция произведения вектора на число из основного поля равна произведению проекции этого вектора на это число.
284 Глава 9. Векторные пространства § 99. Фактор-пространство Пусть V — векторное пространство над полем Р, a W — подпространство пространства V. Будем рассматривать аддитивную группу пространства V. W—-ее нормальный делитель, поэтому можно перейти к фактор-группе V/W. Ее элементами являются смежные классы a-\-W={a-{-w\weW}9 где а — произвольный вектор пространства F, которые складываются по формуле (a+W) + (B+W) = (a+B) + W. (1) Превратим группу V/W в векторное пространство над полем Р, для чего определим произведение a(a-\-W) числа а из поля Р и элемента d+W группы V/W. Положим a(d+W)=aa+W. (2) Если Б^а+W, то 6=a-\-w, w^W> a6=aa-\-aw^aa+W> т. е. все произведения а5, где 5ea+TF, входят в один класс ad+W. Следовательно, правая часть равенства (2) не зависит от выбора элемента а в классе a-\-W, т. е. определяется числом а и классом а+ТР. Поэтому равенство (2) действительно можно взять в качестве определения произведения <x(a+W). Теорема. Множество V/W относительно сложения классов и умножения классов на элементы поля Р, определенных, соответственно, равенствами (1) и (2), является векторным пространством над полем Р. ф Относительно сложения V/W—абелева группа. Нужно доказать, что для любых а и р из Р, а, Б из V верны следующие равенства: (ар)(а+ТГ)=а(р(Д+1Р)), l(a+W)=a+W, (а+р)(а+1Г)=а(а+1Г)+р(а+1Г), a((d+W) + (B+W)) = a(d+W)+a(5+W). Докажем первое из этих равенств, (ар) (а+ТР) = (аР)а+ТГ=. =а (ра) + W= а (ра+ W) = а (р (а+ W)).. Доказательства остальных равенств аналогичны и оставляются читателю, ф Пространство, о котором идет речь в предыдущей теореме, называется фактор-пространством пространства V по подпространству W и обозначается символом V/W. Элемент d+W пространства V/W называется линейным многообразием пространства V, полученным переносом подпространства W на вектор а.
§ 100. Определение и простейшие свойства гомоморфизмов 285 Очевидно, все подпространства пространства V являются его линейными многообразиями, но не все линейные многообразия — подпространства. Если a€jEW, то a+W не есть подпространство. В силу леммы 3 § 17 подпространство W, переносом которого получается линейное многообразие а+ W, определено однозначно. Размерность подпространства W называется размерностью линейного многообразия а -\- W и обозначается символом dim(a+!P). Глава 10 ЭНДОМОРФИЗМЫ ВЕКТОРНЫХ ПРОСТРАНСТВ § 100. Определение и простейшие свойства гомоморфизмов Пусть Р — поле, г V и W— векторные пространства над этим полем. Отображение /: V-+W называется гомоморфизмом или линейным отображением пространства V в пространство Wy если оно удовлетворяет следующим двум условиям: 1) для любых векторов а и Б пространства V f(a-\-B) =f (a) + +f(5); 2) для любого вектора а пространства V и любого числа a из поля Р f (aa) = a/ (a). Иными словами, гомоморфизм пространства V в пространство W — это такой гомоморфизм аддитивной группы V в аддитивную группу W, который перестановочен с умножением на числа из основного поля. Совокупность условий 1, 2 равносильна, очевидно, условию 3) для любых векторов а и Б пространства V и любых чисел а, р из поля Р f(aa+$B)=af(a)+$f(B). Биективный гомоморфизм векторных пространств называется изоморфизмом. Если существует изоморфизм F-^IF, то говорят, что пространство V изоморфно пространству W и пишут V^ IP. Гомоморфизм пространства V в себя называется эндоморфизмом или линейным преобразованием пространства V. Изоморфизм пространства V на себя называется автоморфизмом или невырожденным линейным преобразованием пространства V. . 1. Для произвольного векторного пространства тождественное отображение является автоморфизмом. 2. Пусть V и W—щекторные пространства над полем Р. Отображение 0: V-+W, ставящее в соответствие каждому вектору пространства V нулевой вектор пространства W, является гомоморфизмом векторных пространств. Этот гомоморфизм называется нулевым. 3. Пусть V — произвольное я-мерное векторное пространство над полем Ру п>0. Фиксируем в V какой-либо базис и поставим в соответствие каждому
286 Глава 10. Эндоморфизмы векторных пространств вектору а его координатный столбец X в отмеченном базисе. Возникающее •при этом отображение /: P-*Pn, i, f(a)=X, пространства V в пространство Рп, 1 столбцов является в силу следствия из § 92 биекцией. Согласно теореме 3 из того же параграфа, эта биекция — изоморфизм векторных пространств. Итак, любое n-мерное векторное пространство над полем Р изоморфно пространству Рп, I- 4. -Пусть П — какая-либо плоскость, а А — не параллельная ей прямая. Поставив в соответствие каждому вектору его проекцию на плоскость П параллельно прямой Л, получим гомоморфизм пространства всех векторов (классов направленных отрезков) в пространство векторов плоскости П. 5. Если V— векторное пространство над полем Р, аеР, f: V-**Vt f (а) =аа, то / — эндоморфизм пространства V. Этот эндоморфизм называется подобием. Если а=^0, то подобие — изоморфизм. Рассмотрим простейшие свойства гомоморфизмов векторных пространств. Пусть f: V-+W — гомоморфизм векторных пространств. 1. Отображению f присущи все * свойства гомоморфизмов групп. В частности, если 0 и 0' — нулевые векторы пространств V и W соответственно, то f (0) =0/; для любого вектора а прост- ранства V f (—а) = —/ (а). 2. Для любых, векторов аи t=l,2, ...,m, (1) и чисел аи t=l,2, ...,т, (2) из основного поля /(aiai+a2a2+. • -+атат) =ai/(ai)+a2f (а2)+.. .+ат/(ат). Доказательство читатель проведет сам. 3. Если (1) — линейно зависимая система векторов пространства V, то система f(ui)9 i=l, 2, ... , m, (3) также линейно зависима. ф Пусть CXi5i+a2a2-b • .+ccmam=0, где (2) — числа из поля Р, не все равные нулю. Тогда f (aiai+a2a2+. • •+^mam) =0'. Следовательно, ccif(ai) +аг/(а2) +•. .4-amf (am) =0'. Последнее равенство означает линейную зависимость системы (3). •
§ 100. Определение и простейшие свойства гомоморфизмов 287 4". Если П — подпространство пространства V, то f(U) — подпространство пространства W. В частности, Im/ — подпространство пространства W. ф Мы уже знаем, что f(U) —подгруппа аддитивной груп- -Пы W. Покажем, что для любых а из Р и b из f(O) ab^f(U). -Пусть b=f(a), a^U. Тогда db = af(a)=f(aa). Так как аае£7, •jof(aa)e/(0)..# 5. Если (1)—система образующих подпространства О ^пространства V, то (3)—система образующих подпространства f(U). Если подпространство 0_конечномерно, то f(U) также конечномерно и dim f(U) ^dimjy. ф Каждый вектор b из f(O) имеет вид b=f(a), где aG[/. Если a=aiai+a2a2+.. .+amam, то b=f (a) =aif (ai) +a2f (а2) +.. .+amf(am). Доказано, что (3)—система образующих пространства f(D). Если (1) —г базис пространства £7, то система (3) либо является базисом пространства f(U)> либо, если сна линейно зависима и имеет хотя бы один ненулевой вектор, содержит базис. Если же все векторы (3) "равны нулевому вектору, то f(U) = {0/}. Поэтому dimf(0Xdim-0. • ■ 6. Если L — линейное многообразие пространства V, то /(X)— линейное многообразие пространства W. -♦ .Если 1=5+0, то f(L)=f (a)+f (О). * 7. Пусть О, V, W — векторные пространства над полем Р, f: V-+V, g: V-+W — UX гомоморфизмы. Тогда и gf: 0-+W— гомоморфизм векторных пространств. Если же f и g — изоморфизмы векторных пространств, то и gf является изоморфизмом, ♦ gf — гомоморфизм аддитивной группы V в аддитивную группу W. Нужно еще показать, что gf перестановочно^ умно-, жением на числа из основного ноля. Для а из Р, а из V имеем: gf(«<ij=g(f(*d))=g(af(a))=ag(f(a))=a(gf)(u)- Доказано, что gf — гомоморфизм векторных пространств. Кроме того, произведение биекций также биективно. # Теорема 1. Пусть V и W — векторные пространства над полем Р, причем пространство V конечномерно. Тогда всякое отображение g некоторого базиса йи Й2, ... , йп (4) пространства V в пространство W однозначно продолжается до гомоморфизма пространства V в W.
28м Глава 10. Эндоморфизмы векторных пространств ф Пусть а — произвольный вектор из V, хх, х2у ... , хп — координаты вектора а в базисе (4). Положим f(a)=Xig(ui)+X2g{U2)+. • .+Xng{Un) и покажем, что /: V-+W—гомоморфизм векторных пространств. Пусть Ь(уи Уь ... , Уп) (координаты_в том же базисе (4)), аир — числа из поля Р. Вектор aa+fib имеет координаты a*;+pf/i, *"=1, 2, ... , м, поэтому /(ош+р5)= J§ (а*г+Р#г) £(";)= a J£-*ig(5*) + г=1 г=1 +pij^("i)=a/(a)+p/(&). г=1 Итак, / — гомоморфизм векторных пространств. Очевидно, отображение g совпадает с сужением гомоморфизма / на множестве (4): f(ui)=8(ui), *=1.2, ... , п. Докажем единственность гомоморфизма /. Пусть h: V-+W — такой гомоморфизм, что h(ui)=g(ui\y i=l,2, ... , п. Тогда для любого вектора а(хи х2, ... , хп) пространства V (п \ п п J} XiUi I = £ Xih(Ui) = JJ Xig(ui) =/(5), Й = /. ф г=1 ' г=1 г=1 Теорема 2. Пусть Р — произвольное поле, V — векторное пространство над ним, W — множество, в котором задана одна алгебраическая операция — сложение. Пусть еще определено отображение P^W-^W, которое называется умножением элементов поля Р. и множества W. Образ пары (a, a), aeP, aef, обозначим символом аа. Если существует такая сюръекция f: V-+W, что_для любых а, р из Р и а, Б из V /(аа+рб) =af(а)+Р/(б), то W также является векторным пространством, a f — гомоморфизмом этих пространств. Доказательство аналогично доказательству теоремы о гомоморфном образе группы (теорема 2 § 20).
§ 101. Изоморфизмы 289 § 101. Изоморфизмы Рассмотрим некоторые свойства изоморфизмов векторных ■пространств. 1. Если f: V-+W — изоморфизм векторных пространств, то отображение /_1 также является изоморфизмом. 4 Мы уже знаем, что /_1: W-+-V — изоморфизм аддитивных ■групп. Остается показать, что для любых а из Р и а из W f-4aa)=af-4a). ' (1) Равенство (1) равносильно равенству ff^(*a)=f(af-*(a)). (2> Докажем (2): //_1 (aa) =e(aa) = aa, /(a/-1(5))=a(//-1) (a)=ae(a)=aa. ф Теорема 1. Отношение изоморфизма векторных пространств есть отношение эквивалентности на множестве всех пространств над одними тем же полем. ф 1) Для любого векторного пространству V V^V, так как тождественное преобразование — изоморфизм. 2) Если Оу V и IF —векторные пространства, D^V9 V^W, то U=W> так как произведение изоморфизмов векторных пространств также является изоморфизмом. 3) Если V^W, то W^V, так как отображение, обратное изоморфизму векторных пространств, также является изоморфизмом! # Пусть снова f: V-*W — изоморфизм векторных пространств. 2. Если ai9 1=1, 2, ... , т, (3) есть линейно независимая система векторов пространства V, то система /(йг), 1=1, 2, ... , т, (4) также линейно независима. ф Если бы векторы (4) были линейно зависимы, то их образы np*t изоморфизме /-1 — векторы (3) — также были бы линейно зависимы. # Отсюда и из § 100 вытекают, очевидно, два следующих утверждения. / 3. Если (3) — базис пространства V, то (4) —базис пространства W.
290 Глава 10. Эндоморфизмы векторных пространств 4. Если пространство V конечномерно, то пространство W также конечномерно и размерности этих пространств равны. 5. Если V—^подпространство пространства V, то f(0)^0 и отображение U->f(U)y аи-/(а), aef7 — изоморфизм векторных пространств. • Доказательство очевидно. 6. Если f: V-+W — гомоморфизм векторных пространств, (3) и (4) — базисы пространств V и W соответственно, то этот гомоморфизм является изоморфизмом. ♦ Вначале докажем инъективность отображения /. С этой целью рассмотрим ядро Кег / гомоморфизма / аддитивных групп VnW. Пусть a=aiai+a2a2+.: . + awam — произвольный вектор из Кег /. Тогда /(a)=ai/(ai)+a2/(fl2)+- • . + <*mf (5m) =0', где 0'— нулевой вектор пространства W. Из последнего равенства вытекает oti=0, i=l, % ... , m, (5) ибо система (4) линейно независима. Из (5) следует а=0, Kerf={0}. Итак, / — инъекция. Очевидно, / сюръективно, так как для каждого вектора Б пространства W 5=p1f(a1)+p2f(a2)+.. .+M(am) = = /(Ml + M2+-.- + Pmam). ф Теорема 2. Конечномерные векторные пространства над одним и тем же полем изоморфны тогда и только тогда, когда равны их размерности. ф Для нулевых пространств теорема очевидна, будем рассматривать ненулевые пространства. Выше уже доказано, что размерности изоморфных пространств равны. С другой стороны, каждое /г-мерное векторное пространство над полем Р изоморфно пространству Рп, i л-членных столбцов (см. пример 3 в § 100), поэтому все n-мерные векторные пространства над полем Р изоморфны друг другу, ф Очевидно Следствие. При фиксированных поле Р и размерности п существует единственное до изоморфизма n-мерное векторное пространство над полем Р.
§ 102. Теорема о гомоморфизмах 291 Всюду ниже произвольное /г-мерное векторное пространство над полем Р обозначается символом Рп. Рассмотрим еще одно свойство конечномерных векторных пространств. 7. Пусть U и W — подпространства пространства Рп равных размерностей. Тогда: 1) существует такой автоморфизм f пространства Рп, что f(U) = W, 2) любой изоморфизм g: O^W пространств U и W продолжается до автоморфизма пространства Рп. ф 1) Пусть йи йг, ... , йт (6) и Vu V2> ... , Vm — (7) базисы пространств (J и f соответственно. Дополним каждый из них до базкса Ни Йг, . . . , йт> йт+и • • • » ЙЛ (8) и 5и 5г,"... > Vm, Vm+u ... , vn (9) пространства Рп и построим отображение h системы "(8) в Рп: h(ui)=vi9 t=l, 2, ... , п. (10) Продолжив h до эндоморфизма пространства Рп, получим нужный автоморфизм. 2) Пусть (6) — базис пространства Пу (7) — базис пространства W, где Vi=g(ui), i=ly 2, ...., т. Дополнив каждый из этих базисов до базиса (8) и соответственно (9), зададим отображение й_формулами (10). Продолжив h до эндоморфизма пространства Рп, получим требуемое, ф § 102. Теорема о гомоморфизмах _Пусть V и W — векторные пространства над_ полем Р, f: V^W — их гомоморфизм. Ядро гомоморфизма /: V-+W аддитивных групп V и W будем называть ядром Кег / гомоморфизма векторных пространств. Теорема 1. Кег / — подпространство пространства V.
292 Глава 10. Эндоморфизмы векторных пространств ф Мы уже знаем, что Кег / — подгруппа аддитивной группы V. Далее пусть аеКег /, аеР. Тогда /(аа) =а/(а) = а0'=0', ааеКег ft Кег f — подпространство пространства V. ф Пусть О — подпространство пространства V. Рассмотрим канонический гомоморфизм k аддитивной группы V на факторгруппу- V/D. Теорема 2. k: V^V/O — сюръективный гомоморфизм векторных пространств, ядро которого совпадает с П. ф Учитывая соответствующую теорему о группах, нужно только показать, что для любых числа а из поля Р и вектора а из V k(aa) = ak (а). Имеем k (аа) = аа+ 0=а (а-\-П) = ak (a) .# Согласно двум предыдущим теоремам, подпространства векторного пространства V играют роль, аналогичную роли нормальных делителей в группе: все подпространства и только они суть ядра гомоморфизмов пространства V. Теорема 3 («теорема о гомоморфизмах векторных пространств») . Пусть f: V-+W — гомоморфизм векторных пространств. Тогда Im/s*F/Kerff причем существует такой изоморфизм В пространства Р/Кег/ на Im /, что коммутативна диаграмма V *_^ я W-—2 tof где k — канонический гомоморфизм, i — вложение. .+ Рассмотрим Ь: Г/Кег f-*-Im f, Ь (Д+Ker f) =f(a), ае=7. Мы уже знаем (теорема о гомоморфизмах групп), что 6 —изоморфизм аддитивных групп V/Kerf и Imfn диаграмма (1) коммутативна. Остается рассмотреть b(К(а■+■ Kerf)). Так как у/юг/ (О
§ 102. Теорема о гомоморфизмах 293 Х(а+Кег /) =АЛ+Кег /, то - 6(^(а+Кег/))=/(Ха)=Х5(а+Кег/). • Следствие 1. Если V=D-\-W — прямая сумма подпространств, то U^V/W. " (2) ф Поставив в соответствие каждому вектору из V его проекцию на О параллельно W, получим отображение /: V-+U. Из свойств проекций следует, что f — гомоморфизм векторных пространств. Очевидно, f сюръективнои Кег/=№. По теореме о гомоморфизмах верно (2). ф Следствие 2. Для любого подпространства О пространства Рп dim(Pn/0)=h—dim П. ф Для нетривиального подпространства О существует прямое дополнение W. Так'как Pn=D-\-W, то Pn/O^W. Поэтому dim(Pn/0)=dim W=n—dim О. Если же D тривиально, то следствие очевидно. # Пусть V и W — векторные пространства над полем Р, f: V-+W — HX гомоморфизм, V конечномерно. Тогда конечномерно Imf. Размерность подпространства Im/ называется рангом, а размерность подпространства . Кег f — дефектом гомоморфизма f. Следствие 3. Сумма ранга и дефекта гомоморфизма f равна dim V. * ♦ Рассмотрим отображение J: F->Imf, 7(a) =/(а), a€=F. Очевидно, J — сюръективный гомоморфизм векторных пространств. По теореме о гомоморфизмах Imf^V/KevJ. Но f действует на векторы пространства V так же, как и f (если f сюръективно, то ?=/), поэтому Ker/=Kerf. Следовательно, Im/^TVKer/.
294 Глава 10. Эндоморфизмы векторных пространств Поэтому dim(Im/)=dim(F/Ker/)=dimF-dim(Ker/). # Очевидны еще два следствия. Следствие 4. Эндоморфизм конечномерного векторного пространства является автоморфизмом тогда и лишь тогда, когда он инъективен. Следствие 5. Эндоморфизм конечномерного векторного пространства является автоморфизмом тогда и только тогда, когда он сюръективен. § 103. Операции над эндоморфизмами В основном нас интересуют не гомоморфизмы одного векторного пространства в другое, а эндоморфизмы пространства. Пусть V — векторное пространство над полем Р. Обозначим множество всех эндоморфизмов пространства V символом End V* Введем на этом множестве две алгебраические операции — сложение и умножение. Определим еще умножение чисел из поля Р на эндоморфизмы пространства V. Суммой /+g эндоморфизмов fug пространства V назовем отображение f+g: V-+V, определяемое формулой (f-\-g) (a) = =/(a)+g(a) Для любого а из V. Умножение эндоморфизмов будем понимать как умножение отображений. Произведением ос/ числа а и эндоморфизма f назовем отображение h: F->F, определяемое формулой /i(a)=af(a) для любого а из V: Теорема 1. Сумма и произведение эндоморфизмов пространства V и произведение числа из поля Р на эндоморфизм пространства V являются эндоморфизмами пространства V. ♦ То, что произведение эндоморфизмов является эндоморфизмом, доказано в § 100. Покажем, что если / и g — эндоморфизмы пространства F, то и-f+g — эндоморфизм этого пространства. Пусть а, б — векторы из V, а а, р — числа из поля Р. Тогда (f+g) (сш+р5) =/(aa+pS) +g(aa+$5) = =a/(a)+p/(5)+ag<a)+pg(5) = * Endomorphism (англ.) — эндоморфизм.
§ 104. Инвариантное подпространство 295 = a[f(c)+g(c)]+P[f(*)+g(*)] = = a(f+g)(a)+V(f+g)(6), т- е- /+£ — эндоморфизм. Оставшаяся часть теоремы доказывается аналогично, ф Отметим одно свойство умножения эндоморфизмов конечномерного векторного пространства. Теорема 2. Ранг произведения двух эндоморфизмов пространства Рп не выше ранга каждого из сомножителей. Если один из сомножителей — автоморфизм, то ранг произведения равен рангу другого сомножителя. ф Пусть / и g— эндоморфизмы пространства Рп, rt s, t — ранги эндоморфизмов f,gugf соответственно. Тогда gf(Pn)=g(f(Pn))^e(Pn), t^s. Если / — автоморфизм, то f(pn)=pnf gftpn^g^pn^ t = St Далее dim g (f (Pn)) ^ dim / (Pn), т. e. t^r. Если g — автоморфизм, то gf (Pn)^f (Pn), dim (gf (Pn)) = dim f (P*), т. e. t=r. ф § 104. Инвариантное подпространство Пусть / — эндоморфизм векторного пространства V над полем Р. Если О — такое подпространство пространства Р, что f(0)^0, то D называют инвариантным относительно f подпространством. Очевидно, ограничение f(U) эндоморфизма f на инвариантном подпространстве О является эндоморфизмом пространства О. 1. Тривиальные подпространства инвариантны относительно любого эндоморфизма. 2. Всякое подпространство инвариантно относительно подобия. Теорема 1. Для любого, эндоморфизма f Im f. и Ker / — инвариантные относительно f подпространства. ♦ Очевидно, для а из V f(f(a))^Imf, так как f(a)^V.
296 Глава 10. Эндоморфизмы векторных пространств Далее для Ъ из Кег/ f(b)=O^Kerf. # Теорема 2. Сумма и пересечение подпространств пространства V, инвариантных относительно эндоморфизма f, также инвариантны относительно этого эндоморфизма. ф Докажем утверждение теоремы о сумме подпространств. Пусть и и i=l, 2, ... , k,— подпространства пространства F, инвариантные относительно эндоморфизма /. Положим 0i+02+... + 0ft=0. Тогда для а из О a=ai+a2+... .+ал, а*е(7* Так как /(аг) е£7г-, то /(a) =/(ai)+f (a2)+.. .+/(&) е=0.' Утверждение теоремы о пересечении читатель легко докажет сам. # Теорема 3. Пусть f и g— эндоморфизмы пространства V, О — инвариантное относительно каждого из них подпространство, а — элемент основного поля. Тогда подпространство О инвариантно и относительно /+& fg, a/. + Для а из О /(a) и g (a) принадлежат U, поэтому (f+g)(a)=f(a)+g(a)<=U. Инвариантность подпространства О относительно эндоморфизма /+£ доказана. Произведения fg и а/ читатель рассмотрит сам. ф Теорема 4. Если О — конечномерное подпространство пространства V, инвариантное относительно автоморфизма f, то ограничение /| —автоморфизм пространства О и О инвариантно относительно /-*. ♦ /I п— инъективный эндоморфизм пространства О и потому является автоморфизмом,
§ 105. Матрица эндоморфизма "* 297 § 105. Матрица эндоморфизма Пусть / — эндоморфизм пространства Рпу Ни Й2, ... , йп— (1) базис этого пространства. Мы уже знаем, что эндоморфизм / однозначно определяется образами ffa), /=1, 2, ... , /г, (2) базисных векторов (1) (теорема 1 § 100). Пусть f(Ui) =aiiWi + (X2iU2+- . . + CXnlUn, f(u2) =ai2i/i+a22W2+- • -+an2^n, (3) f (2n) =ainui+d2nU2+. •.+ Составим матрицу Г an 0C12 ... otin J л I <X21 a22 • • • 0&2n I /ix |_OCnl &n2 • • • &nn _J столбцами которой служат координатные столбцы векторов (2) в: базисе (1). Матрицу А назовем матрицей эндоморфизма f в базисе (.1). Обратно, пусть (4) — произвольная матрица порядка п над полем Л а Vjt /=1, 2, ... , /г,— векторы, координатными столбцами которых в базисе (1) служат соответственно ее столбцы. В силу теоремы 1 § 100 существует единственный эндоморфизм f пространства Рп, такой, что f(uj)=vj9 /=1, 2, ... , /г. Очевидно, (4) — матрица этого эндоморфизма в базисе (1). Итак, доказана Теорема 1. Если в пространстве Рп отметить базис (1) и каждому эндоморфизму этого пространства поставить в соответствие его матрицу в базисе (1), то будет установлена биекция множества EndPn на множество Рп всех матриц порядка п над полем Р. Система равенств (3) равносильна одному матричному равенству [К*0] = [«гИ. (5)
298 ' Глава 10. Эндоморфизмы векторных пространств в чем легко убедиться, перемножив матрицы в правод части равенства (5). 1. Нулевой эндоморфизм имеет в любом базисе нулевую матрицу. 2. Матрица тождественного автоморфизма в любом базисе единичная. 3. Если / — преобразование подобия (f(a)=aa для каждого вектора а пространства Рп), то в любом базисе матрицей эндоморфизма / является матрица аЕ. Теорема 2. Ранг эндоморфизма векторного пространства ра- . вен рангу его матрицы. ф Пусть (4) —матрица эндоморфизма f в базисе (1). Тогда (2)—система образующих подпространства Im/, а столбцы матрицы (4) —координатные столбцы векторов (2) в базисе (1). Поэтому ранг системы (2) (т. е. размерность подпространства Im/) равен рангу матрицы (4). ф Следствие 1. Эндоморфизм f пространства Рп является автоморфизмом тогда и только тогда, когда определитель его матрицы не равен нулю.. Это утверждение очевидно, так как эндоморфизм f является автоморфизмом тогда и лишь тогда, когда его ранг равен п. Теорема 3. Если в базисе (1) пространства Рп эндоморфизмы fug имеют матрицы А и В соответственно, то матрицами эндоморфизмов f-\-g, fg и af, aeP, в этом базисе служат А-\-В, АВ, аА. ♦ (f+g)(ui)=f(ui)+g(ui)9 i = l,2,...,/i, поэтому Равенство [(/+Ж"г) ] = [№)]+ [£(«;)] = = [йг]А+[йг]В=[йг](А+В). W+g)(ui)] = [ui](A+B) как раз означает, что А-\-В — матрица эндоморфизма f+g в базисе (1). Пусть B=[$ij]. Вычислим строку [gf(ui)]. Так как п TQ
§ 105. Матрица эндоморфизма 299 Последняя сумма есть произведение строки [f(ui)] на /-й столбец матрицы В, поэтому №(й<)] = иШВ=([т]А)В=[т](АВ), т. е. АВ — матрица эндоморфизма fg в базисе (1). Наконец, [af(ui)]=a[f(ui)]=a([ui]A) = [ui](aA)f так что аА — матрица эндоморфизма а/ в базисе (1). ф Из двух предыдущих теорем и теоремы 2 § 103 вытекает, очевидно, •Следствие 2. Ранг произведения двух квадратных матриц не выше ранга каждого из сомножителей. Если один из сомножителей— матрица невырожденная, то ранг их произведения равен рангу другого сомножителя. Следствие 3. Множество End Pn относительно сложения эндоморфизмов является абелевой группой, изоморфной аддитивной группе всех квадратных матриц порядка п над полем Р. Относительно сложения и умножения эндоморфизмов множество End Рп является кольцом, изоморфным кольцу Рп всех квадратных матриц порядка п над полем Р. Относительно сложения и умножения эндоморфизмов на числа из поля Р множество End Pn является векторным пространством над полем Р, изоморфным пространству всех квадратных матриц порядка п над тем же полем. ф Зафиксировав в пространстве Рп базис (1) и поставив в соответствие каждому эндоморфизму этого пространства его матрицу в базисе (1), получим биекцию множества End Pn на множество Рп- Эта биекция такова, что образом суммы эндоморфизмов является сумма образов слагаемых, образом произведения эндоморфизмов — произведение образов сомножителей, образом произведения эндоморфизма / на число а — произведение образа эндоморфизма f на а. Нужное утверждение вытекает теперь из теорем об изоморфных образах группы, кольца, векторного пространства. # Из предыдущего утверждения вытекают, в частности, следующие свойства эндоморфизмов.* * Свойствами 1—4 обладают и Эндоморфизмы бесконечномерных векторных пространств. Их просто доказать, исходя непосредственно из определения соответствующих операций. Однако в этой книге эти свойства получены как следствия соответствующих свойств матриц и потому доказаны только для конечномерных пространств.
300 Глава 10. Эндоморфизмы векторных пространств 1. Сложение эндоморфизмов ассоциативно и коммутативно. Определено вычитание эндоморфизмов. 2. Умножение эндоморфизмов ассоциативно и дистрибутивно относительно сложения. 3. Умножение эндоморфизмов на числа дистрибутивно относительно сложения чисел и сложения векторов. 4. Умножение эндоморфизмов на числа ассоциативно. Обратимся к мультипликативной группе кольца End Рп. Мы уже знаем, что для эндоморфизма f существует обратный эндоморфизм тогда и лишь тогда, когда f является автоморфизмом. Поэтому верно / Следствие 4. Множество всех автоморфизмов пространства Рп относительно умножения является группой, изоморфной группе всех невырожденных квадратных матриц порядка п над полем Р. Обозначим группу всех автоморфизмов пространства Рп символом Aut Pn* § 106. Полином рт эндоморфизма ВвеДем понятие полинома от эндоморфизма. Пусть /G=End Рп, - g(x) =ao+ai*+.. .+amxm<=P[x]. Полиномом g(f) назовем отображение aoe+aif+i. .+amfw, где е — тождественный автоморфизм пространства Рп. Теорема 1. Полином g(f) от эндоморфизма f пространства Рп также является эндоморфизмом этого, пространства. Если в некотором базисе эндоморфизм f имеет матрицу А, то матрицей эндоморфизма g(f) в том же базисе является g(A). ф Теоремы 1 § 103 и 3 § 105. ф Из предыдущей теоремы и перестановочности полиномов от одной матрицы вытекает, очевидно, Следствие 1. Если /eEnd Pn, g, h^P[x], то g(f)h(f)=h(f)g(f). Из теоремы 3 § 104 вытекает Следствие 2. Если О — подпространство пространства Рп, инвариантное относительно эндоморфизма f, a g(x)^P[x], то О инвариантно и относительно g(f). * Automorphism (англ.) — автоморфизм.
§ 107. Некоторые задали 301 § 107. Некоторые задачи В этом параграфе рассматриваются некоторые задачи, которые решаются с помощью матрицы эндоморфизма. Пусть f — эндоморфизм пространства Рп, Л=[а^] —его матрица в базисе йи Й2, . • • , Йл. (1) Задача 1. Зная координаты xt, х2, ... , хп вектора а в базисе (1), найти координаты yiy у2у ... , уп вектора f(a). Р е ш е н и е. Так как п а= J£ Х\йи г==1 ТО /(й)= 2х4(йг) = и(щ)]Х. Далее, учитывая формулу (5) § 105, находим На) = ([йг]А)Х=[й{](АХ). • (2) С другой стороны, f(a) = [ui]Y. (3) Сравнивая формулы (2) и (3), получаем [ui](AX) = [ui]Yf откуда следует Y=AX: (4) Итак, формула (4) выражает связь между координатными столбцами векторов а и [(а). Равенство (4) равносильно следующей системе равенств: {/i = 0tii*i+ai2#2+. • .-f"0&in#n> J/2=(Xzi#i-{-(X22*2+. • - + Ot2n-^n, Уп = ttniXi-\- 0Cn2*2+— + CLnnXn* Задача 2. Пусть vu 5г, ... , vm— (5) базис подпространства D и вектор Vj в базисе (1) имеет координатный столбец Xj. Найти базис подпространства /(£7).
302 Глава 10. Эндоморфизмы векторных пространств Решение. Координатный столбец вектора f(vj) равен AXj=Ajy /=1,2, ...,m. Из столбцов Aj составим матрицу [Ai А2 ... Ат]=В, Максимальная линейно независимая система столбцов матрицы В есть система координатных столбцов векторов базиса подпространства f(U) в базисе (1). Если, в частности, и=Рп и система (5) совпадает с базисом (1), то, очевидно, столбец Aj совпадает с /-м столбцом матрицы Л, В=А. Следовательно, максимальная линейнб независимая система столбцов матрицы А есть система координатных столбцов векторов базиса подпространства f(Pn) в базисе (1). Задача 3. Найти ядро эндоморфизма /. Решение. Вектор а(хи х2, ... , хп) тогда и лишь тогда входит в Кег f, когда f(a)=0. (6) Так как вектор /(а) в базисе (1) имеет координатный столбец АХУ а координаты нулевого вектора все равны нулю, то, очевидно, вектор а удовлетворяет условию (6) тогда и только тогда, когда его координаты составляют решение (хи х2у ... , хп) системы.уравнений anA:i+ai2*2+.. . + aln*n=0, a?il^l + an2^2+... + ann-^n = 0. Множество решений этой системы есть подпространство Кег/ размерности п—г, где г — ранг матрицы А. § 108. Изменение матрицы эндоморфизма при замене базиса Пусть / — эндоморфизм пространства Рп, А и В — его матрицы в базисах Ни й2, ... , йп ' (1) и Vi, £>2, • • • , Vn ' (2) соответственно. Посмотрим, как связаны друг с другом матрицы Л и В, связь между базисами (1) и (2) предполагается известной,
§ 109. Эндоморфизм с квазидиагональной матрицей 303 т. е. задана матрица С перехода от базиса (1) к базису (2), Имеем и(г>г)] = [иг]В=([йг]С)В=[йг](СВ). (3) С другой стороны, п Vj= JS Укзйк, [yhj] =C, Ь=1 -поэтому f fa) =J£y«/(&) = №)] fc=l Таким образом, [№)]°=и$й<)]С=([т]А)С=[щ](АС). Сравнивая последнее равенство и (3), получим [ui](CB) = [ui](AC)9 CB=AC, В=С-*АС. (4) Обратно, пусть. А —матрица эндоморфизма f в базисе (1), С — произвольная невырожденная квадратная матрица порядка п над полем Р и В — матрица, определяемая равенством (4). Если (2) — такой базис пространства Рп, что С — матрица пере- хода от (1) к (2), то в силу формулы (4) В — матрица эндоморфизма f в базисе (2). Матрица В называется подобной матрице А над полем Р., если существует невырожденная квадратная матрица С над этим полем, удовлетворяющая равенству (4). Итак, доказана Теорема. Две квадратные матрицы А и В порядка п над полем Р тогда и лишь тогда являются матрицами одного эндоморфизма пространства Рп в подходящих базисах, когда В подобна А над полем Р. § 109. Эндоморфизм с квазидиагональной матрицей Посмотрим, как отражается на матрице эндоморфизма / наличие в пространстве Рп нетривиального инвариантного относительно / подпространства П. Пусть Yii V2j L Упз J Uu • • • > Urn, Vl, • • • t Vh — (1)
304 Глава 10. Эндоморфизмы векторных пространств такой базис пространства Рпу что Vu ... , vh — (2) базис П. Рассмотрим матрицу эндоморфизма / в базисе (1). Так как подпространство О инвариантно относительно f, то вектор f(vi) является линейной комбинацией векторов' (2), поэтому можно написать m ft. f(ui) = JS «ий+' 2 Pi^i» i= 1,..., m, (3) В силу формул (3) матрица эндоморфизма f в базисе (1) имеет' вид Г"ац ... aim 10 ... 0 Otmi • • • CLmm | 0 ... 0 Pit ... Pirn I Yil • • • " Ylfc '-ft ki Jfcm Tftl Yftfe J (4) с нулевым углом. Матрица Ьа], t, /=1 К (5) расположенная в правом нижнем углу матрицы (4), есть в силу формул (3) матрица ограничения эндоморфизма f на подпространстве О в базисе (2). Обратно, пусть (1)—произвольный базис пространства Рп, af — тот эндоморфизм этого пространства, который в базисе (1) имеет матрицу (4) с нулевым углом. Тогда, очевидно, верны формулы (3) и, следовательно, подпространство 0=L(vu ... > vh) инвариантно относительно эндоморфизма f и матрица (5) есть матрица ограничения этого эндоморфизма на подпространстве О в базисе (2). Пусть теперь пространство Рп есть прямая сумма pn=fj±W (6)
§ 109. Эндоморфизм с квазидиагональной матрицей 305 инвариантных относительно эндоморфизма / подпространств О и W. Напишем матрицу эндоморфизма / в базисе (1), где йи • • • , йт— (7) базис подпространства W> а (2) — базис подпространства П. Очевидно, т f ("О = 2 а№> i= 1,...-, m, h f(vi)= 2 ?«% t=l, ... , *, (8) поэтому матрицей эндоморфизма f в базисе (1) является квазидиагональная матрица diag[[ai<], Ы], (9) где (5) и [а;0, /, 1=1, ... , т,— (10) матрицы ограничений эндоморфизма / на подпространствах W и О в базисах (7) и (2) соответственно. Обратно, пусть эндоморфизм / в базисе (1) имеет квазидиагональную матрицу (9). Тогда верны формулы (8) и, следовательно, подпространства 0=L(vu ... , vh) и W=L(uu ... , йт) инвариантны относительно /, (10)—матрица ограничения f\0 в базисе (7), (5) — матрица ограничения Л w B базисе (7). Очевидно, 0-+-'W=Pn. Доказана Теорема 1. Пусть f — эндоморфизм пространства Рп. Рп есть прямая сумма двух своих инвариантных относительно эндоморфизма f подпространств тогда и лишь тогда, когда в каком-либо базисе матрицей этого эндоморфизма является квазйдиагональ* ная матрица вида (9). Аналогичное утверждение верно и в том случае, очевидно, когда число прямых слагаемых в сумме (8) больше двух. В частности, если в этой сумме п прямых слагаемых, то каждое из них одномерно, и верна
306 Глава 10. Эндоморфизмы векторных пространств Теорема 2. Пространство Рп является прямой суммой одномерных инвариантных относительно эндоморфизма f подпространств тогда и лишь тогда, когда в каком-либо базисе матрица эндоморфизма f диагональна. § 110. Характеристический полином Пусть i4=[afj]—квадратная матрица порядка п над полем Р, а х — переменная. Матрицу | X—an —ОС12 —OLin • I „П Л I —a2i X—a22 • • • — 0C2n I |_ —<Xni —CLn2 • • • X—CLnn J называют характеристической матрицей матрицы Л, а ее определитель det(xE—A) — характеристическим полиномом матрицы А. Очевидно, det(xE-A) —полином от х п-й степени, старший коэффициент его равен 1. Свободный член полинома det(xE—A) совпадает с его значением при х=0 и поэтому равен — ац —G&12 • • • —CXln — &21 —0С22 ••• —0&2n | OCni 0&n2 • • • &nn Так как произведение всех корней полинома может отличаться от его свободного члена лишь знаком, то верна Теорема 1. Квадратная матрица тогда и только тогда нёвы- рождена, когда нуль не является корнем ее характеристического полинома. Сумма всех диагональных элементов квадратной матрицы называется ее следом. Очевидно, коэффициент полинома det(xE-A) при х71-1 равен следу матрицы А, взятому с противоположным знаком. Вычислим все остальные коэффициенты характеристического полинома. Минор квадратной матрицы называется главным, если номера строк и номера столбцов, в него входящих, равны. Ясно, что если М — главный минор, то его дополнительный минор Mi также является главным и алгебраическое дополнение Л мино.ра М совпадает с Ми i Теорема 2. Коэффициент при xh характеристического полинома с(х) матрицы А равен сумме всех главных миноров порядка n—k этой матрицы, умноженной на ('— 1)п-\ Здесь 0^&<д. = (-!)* deM.
§ 110. Характеристический полином 307 ♦ Рассмотрим те члены определителя матрицы хЕ—Л, которые содержат хотя бы одно слагаемое а с переменной х точно в k-и степени. Ясно, что каждый из них имеет вид (*-aVl) ... (x-aiHiK)y, (l) где буквой у обозначено взятое с соответствующим знаком произведение все'х остальных элементов матрицы хЕ—Л, входящих в член (1). Согласно лемме о произведении минора на его алгебраическое дополнение, у есть член главного минора М матрицы хЕ—А порядка п—k, расположенного в строках и столбцах, отличных от ii, fa, • • • , ik. (2) Y=yW —полином. Очевидно, а = хку(0), (3) так как y(0) —свободный член полинома у(х). Сохраняя тот же набор номеров (2), следует взять в качестве y каждый из членов минора М. Сложив полученные слагаемые (3), получим хкМ0, где М0— значение минора М при х = 0. Минор М матрицы хЕ—А при * = 0 обращается в занимающий ту же позицию минор матрицы —Л, поэтому M0=(-l)n-kN, (4) где N — главный минор матрицы Л, расположенный в строках и столбцах с номерами, отличными от (2). Теперь видно, что коэффициент при хк полинома с(х) равен сумме миноров (4), получающихся при всех возможных выборах номеров (2). # Теорема 3. Характеристические полиномы подобных матриц равны. ф Пусть В = С-^АС. Тогда хЕ-В=хЕ-С-*АС=С-*хЕС-С-1АС=С-1(хЕ-А)С. Поэтому det(xE-B) = (det С)-* det(xE-A)det C=det(xE-A). ф Обратное утверждение — если характеристические полиномы матриц равны, то эти матрицы подобны — неверно. Например, матрицы £'-н'[Л] имеют один и тот же характеристический полином (х—I)2, однако £2 подобна лишь себе. Следствие. Следы подобных матриц равны. Определители подобных матриц равны.
308 Глава 10. Эндоморфизмы векторных прдстранШ Характеристическим полиномом эндоморфизма пространства Рп называют характеристический полином его матрицы. Поскольку матрицы эндоморфизма в разных базисах подобны, то характеристический полином эндоморфизма не зависит от выбора базиса пространства. Следом эндоморфизма называется след его матрицы, а опре-. делителем эндоморфизма — определитель его матрицы. Как и характеристический полином, след и определитель эндоморфизма не зависят от выбора базиса пространства. § 111. Собственные векторы эндоморфизма Пусть /eEnd Pn. Если в пространстве Рп существует такой ненулевой вектор а, что f(a)=aa, аеР, (1) то число а называется собственным значением эндоморфизма f, а вектор а — собственным вектором, относящимся к собственному значению а. 1. Все ненулевые векторы Кег / — собственные векторы эндоморфизма /, относящиеся к нулевому значению. 2. При тождественном автоморфизме 'все ненулевые векторы пространства— собственные с собственным значением, равным единице. Сформулируем условие существования собственных векторов и найдем эти векторы. Ненулевой вектор а из Рп является собственным вектором эндоморфизма f, если он удовлетворяет условию (1). аа=ае(а), поэтому условия (1) и (f-oe)(S)=0 (2) равносильны. Множество всех векторов а, удовлетворяющих условию (2), является инвариантным относительно эндоморфизма f—ae подпространством, которое совпадает с ядром Кет (f—ae). Так как /=(/—ае)-\-ае, то это подпространство инвариантно и относительно эндоморфизма f. Ker(f—'ae)=j£{0} тогда и лишь тогда, когда det(f—ав)=0. Если в базисе Ни «2, ... , йп эндоморфизм / имеет матрицу А = [ац], то матрицей эндоморфизма f—ae в этом базисе служит А—<хЕ. Поэтому необходимым и достаточным условием существования собственных векторов эндоморфизма /, относящихся к собственному значению а, является равенство det(4—а£)=0.
§ HI. Собственные векторы эндоморфизма ЗОЙ Это равенство верно тогда, когда а — корень характеристического полинома матрицы А. Итак, доказана Теорема 1. Собственными значениями эндоморфизма являются все принадлежащие основному полю корни характеристического полинома этого эндоморфизма и только они. Если а — собственное значение эндоморфизма f, то все относящиеся к нему собственные векторы и нулевой: вектор составляют подпространство Ker(f—-осе) пространства Рп, инвариантное относительно f. Как показано iT§ 107, вектор а(рь р2, ..: , рп) тогда и лишь тогда принадлежит подпространству Ker(f— ae), когда он является решением системы уравнений (an—a)Xi+ai2*2+.. -+(xinxn=0t a2i*i+(a22— a)x2+.. '+a2nxn=09 otni^i+cXn2^2+. •.+ (otnn^-a)A:n=0. Собственными векторами эндоморфизма f, относящимися к собственному значению а, являются все ненулевые решения этой системы и только они. Рассмотрим следующие задачи: 1. Для каких эндоморфизмов f пространства Рп в этом пространстве существуют инвариантные относительно f одномерные подпространства? 2. Если такие подпространства существуют, то как их все найти? 3. В каких случаях пространство Рп есть прямая сумма одномерных инвариантных относительно / подпространств? Пусть О — одномерное подпространство пространства Рп. Если а — ненулевой вектор из Рп,.то, очевидно, О есть множество L(a) всех векторов, кратных а. Если теперь О — инвариантное относительно эндоморфизма / подпространство, то /(a)=aa, aeP, f(pa)=p/(a)=p(aa)=a(Pa), так что все ненулевые векторы подпространства О являются собственными векторами эндоморфизма /, относящимися к собственному значению а. Обратно, если а — собственный вектор эндоморфизма /, относящийся к собственному значению а, а реР, то /(Pa) = a (Pa) и, значит, L(a)—инвариантное относительно / подпространство. Таким образом, в пространстве Рп тогда и лишь тогда существуют одномерные инвариантные относительно эндоморфизма f подпространства, когда f имеет собственные векторы. Если а — произ-. вольный собственный вектор эндоморфизма f, то Ь(а)—инвариантное относительно f одномерное подпространство и все
310 Глава 10. Эндоморфизмы векторных пространств одномерные^ инвариантные относительно f подпространства пространства Рп имеют такое строение, В частности, если основное поле Р — поле комплексных чисел, то, согласно основной теореме алгебры, характеристический полином любого эндоморфизма f пространства Рп имеет комплексные корни, поэтому в пространстве Рп всегда есть одномерное инвариантное относительно эндоморфизма f подпространство. Обратимся снова к случаю произвольного поля Р. Pn=L(ui)-\-L(u2)+.. .+Цйп) тогда и лишь тогда, когда щу йг, ..., йп — базис пространства Рп. Поэтому верна следующая Теорема 2. Пространство Рп является прямой суммой своих одномерных инвариантных относительно эндоморфизма f подпространств тогда и только тогда, когда в Рп есть п линейно независимых собственных векторов эндоморфизма f. Теорема 3. Собственные векторы эндоморфизма f, относящиеся к попарно различным собственным значениям, линейно независимы. ф Пусть oci, а2, ... , ак — попарно различные собственные значения эндоморфизма f, a аи а2, ... , ak (3) есть соответствующие им собственные векторы. Возьмем какую- нибудь максимальную линейно независимую систему множества (3), для определенности пусть это аи а2; ... , а/. (4) Если системы (3) и (4) не совпадают, то вектор a/+i линейно выражается через векторы (4): i a/+i= 2 М*- (5) г=1 Поэтому az+ia/+i= J£ ai+$m. (6) г=1 Применяя к обеим частям равенства (5) эндоморфизм f, получим i /(a/+i) =ai+iai+i= J£ §i<xiai.
§ 112. Критерий совместности. Многообразие решений 311 'Сопоставляя последнее равенство и равенство (6), имеем | i ii __ \ £ ai+$iai= £ аф{йи J£ (az+i—аг)ргЯг = 0. | f=l г=1 г=1 |Так как система (4) линейно, независима, то в последней сумме I все коэффициенты — нули: | (az+i-a<)Pt=0, 4=1, 2, . .. , /. (7) ; Но щ+ьфаи поэтому из (7) следует Pi=D, 1=1,2,... ,/, аш = 0, | что противоречит определению собственного вектора. Значит, ; системы векторов (3) и (4) совпадают. # Следствие. Если эндоморфизм f пространства Рп имеет п различных собственных значений, то это пространство есть прямая сумма одномерных инвариантных относительно f подпространств. Если все корни характеристического полинома принадлежат основному полю Р (например, если Р есть поле комплексных' чисел), то для этого достаточно, чтобы характеристический полином не имел кратных корней. Глава 11 СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ § 112. Критерий совместности. Многообразие решений В этой главе изучаются произвольные системы линейных уравнений над полем. В § 40 приведен способ Гаусса решения таких систем. Здесь мы излагаем общую теорию систем линейных уравнений. Пусть Otll#i +0Ci2*2 +• . . + 0&1гг*п =Pb ) «21*1 +0&22*2 +* • - + a2n#n =Р2, I ,« v 0Cml*iH-am2*2-K • --\-&mnXn = $m J есть система линейных уравнений над полем Я, А — матрица этой систему
312 Глава 11. Системы линейных уравнений Линейное" уравнение называется однородным, если его свободный член 4эавен 0. Систему линейных однородных уравнений «21^1 +a22-^2 +.-. .+а2п^п =0, ' amiACi+am2^2+.. .+атп^п=0, (2) которая получается из (1), если все свободные члены р* заменить нулями, назовем приведенной системой для системы (1). В пространстве Рп фиксируем какой-либо базис ии и2, Вектор с(уи 72, ... , Тп) (3) (4) назовем решением системы (7), если его координаты уь t=l; 2,... , я, составляют решение (yi, 72, • - *, 7п) этой системы. Рассмотрим отображение f пространства Рп в пространство столбцов Рт, и определяемое формулой f(x) —АХУ где х — произвольный вектор пространства Рп, a X — его координатный столбец в базисе (3). Теорема, f: Pn-*Pm,i, f(x)= AX — гомоморфизм векторных пространств. Imf — линейная оболочка столбцов матрицы А, Кег / — множество всех решений системы (2). ф Вначале покажем, что / — гомоморфизм векторных пространств. Нужно доказать, что для любых векторов а и В пространства Рп и чисел а и р из поля Р /(аа+р5)=а/(а)+#(5). (5) Пусть X и Y — координатные столбцы векторов а и Б соответственно. Тогда вектор аа+р5 имеет координатный столбец аХ+рК и, следовательно, f(aa+$B)=A(aX+$Y)=a(AX) + +Р(ЛУ)=а/(а)+Р/(5). Равенство (5) доказано. Рассмотрим Im/. Ясно, что \(щ), /=1, 2, ;.. , п — система образующих пространства Im /. /(й,)= А ГО 1 1 Lo _ = aij "l 0t2j L Unj J
§ 112. Критерий совместности. Многообразие решений 313 есть /-й столбец матрицы Л, поэтому Im/ есть линейная оболочка столбцов матрицы Л. По определению ядра гомоморфизма Kerf есть множество всех решений системы (2). ф • Следствие 1 (критерий совместности системы линейных уравнений). Система линейных уравнений совместна тогда и лишь тогда, когда ранги ее основной и расширенной матриц совпадают. ф Пусть (4) —решение системы (1), Г Yi "* 72 l_Yn_ =г,' г Pi-] р» L Pn J Тогда АТ=В (Б) и, следовательно, fie-Imf. (7) Обратно, если верно (7), то существует вектор (4), удовлетворяющий условию (6). Этот вектор является, очевидно, решением системы (1). Итак, система (1) совместна тогда и только тогда, когда верно (7), т. е. когда столбец В принадлежит линейной оболочке столбцов матрицы Л. Последнее равносильно равенству рангов матрицы Л и расширенной матрицы системы (1) (следствие 3 § 89). • Следствие 2. Множество всех решений системы линейных однородных уравнений является подпространством пространства Рп размерности п—r, где г — ранг матрицы системы. ф Множество всех решений системы (2) совпадает с Кег/, dim(Kerf)=n—dim(Im/)=n—г. ф Очевидно Следствие 3. Система линейных однородных уравнений имеет ненулевое решение тогда и лишь тогда, когда ранг ее матрицы меньше числа неизвестных. Следствие 4. Если система линейных уравнений (1) совместна, то множество всех ее решений является линейным многообразием пространства Рп, получающимся из пространства решений приведенной системы (2) 'переносом на какое-либо фиксированное решение системы (1). Это многообразие является подпространством тогда и лишь тогда, когда система (1) однородна.
314 Глава 11. Системы линейных уравнений + Если вектор а является решением системы (1), то, 'согласно следствию 3 § 21, множество всех ее решений есть смежный класс а+Кег /. Если этот класс ^-подпространство, то a+Kerf=Ker/, aeKerf, f(a) = О О Но /(а) —столбец свободных.членов системы (1). Следовательно, система однородна, ф Н силу предыдущего следствия верны, в частности, два утверждения. 1. Если к какому-либо решению системы (1) прибавить каждое из решений системы (2), то получится множество всех решений системы (1). 2. Разность любых двух решений системы (1) есть решение системы (2). Из Следствий 3 и 4 вытекает Следствие 5. Совместная система линейных уравнений имеет единственное решение тогда и только тогда, когда ранг ее матрицы равен числу неизвестных. Следствия 2 и 4 дают общий способ построения подпространств и линейных многообразий. Верна теорема, обратная этим двум следствиям. Теорема 2. Пусть О — произвольное подпространство, а (3)— произвольный базис пространства Рп. Тогда существует система линейных однородных уравнений с п неизвестными, пространство решений которой в базисе (3) совпадает с П. Аналогично для любого линейного многообразия L пространства Рп существует система линейных уравнений с п неизвестными, многообразие решений которой в базисе (3) совпадает с L. ф Вначале займемся подпространствами. Очевидно, если £7={0}, то нужная система существует — это произвольная система линейных однородных уравнений с п неизвестными, определитель которой отличен от нуля. Если П=Рп> то искомой системой является система линейных однородных уравнений с п неизвестными, матрица которой нулевая. Пусть теперь {0}ФПФ ФРП и векторы Vi(Uu h2, ... , Un), i=l, 2, ... , n, (8)
§ 112. Критерий совместности. Многообразие решений 315 [составляют базис подпространства £/. Рассмотрим систему уравнений | киУх +h2yz +.. .+Я1пуп =0, \ \ ^21*/i +^22#2 +• • .+^2n#n =0, I . . ^ml*/l+^m2*/2+- • -+?Wn7if/n = 0. J Ранг матрицы этой системы равен m, так как строки ее линейно независимы, поэтому размерность пространства решений системы (9) равна /г—т. Пусть Wi(\liU |1г2, • • • , \lin), 1=1, 2, . . . , П — т9 (10) есть базис пространства решений системы (9). Напишем систему уравнений ЦН*1 + М<12*2+. • . + M-in*n = 0, \ (121^1 + ^22^2+- • . + |Х2тг#п = 0, I ,. . . Цп-m 1-^1 + [An—m 2«^2+«" + M'^—wi n«^n = 0 J и покажем, что V есть пространство всех решений системы (11). Обозначим пространство всех решений системы (И) буквой W. Так как векторы (10) являются.решениями системы (9), то ^ilM-jl+^i2M-j2+. . --\-kin\ljn = 0, i=l, ... ,m, /=1, ... , n—m. Следовательно, векторы (8) ,суть решения системы (11), т. е. принадлежат пространству W. Поэтому V^W. (12) Так как ранг матрицы системы (И) равен п—т, то dim W= =п—(п—т)=т=dim V. Из включения (12) теперь следует равенство D= W. Для подпространств теорема доказана. Пусть L = a+£7, где U — подпространство пространства Рп. Напишем систему линейных однородных уравнений, пространство решений которой совпадает с U. Пусть это будет система (2). Напишем теперь систему уравнений (1), выбрав свободные члены pi так, чтобы вектор а был ее решением. Согласно следствию 4, L — многообразие решений системы (1). #
316 Глава 11. Системы линейных уравнений § 113. Общее решение системы линейных уравнений Система линейных уравнений СХц#1 +<Х12*2 +• • - + OCin^n =Pi, 1 I ' 0С21#1 +0&22#2 +. . . + (Х2п#п = Рг, I 0tmi^l + am2^2+- • •"f*awm^n = Pm J над полем Р называется линейно независимой, если линейно не-; зависимы над Р строки ее расширенной матрицы. В § 40 дока-j зано, что если одно из уравнений системы (1) является линейной! комбинацией других уравнений этой системы, тр, устранив это! уравнение, мы получим систему, эквивалентную исходной. Отсю-j да вытекает, что всякая система линейных уравнений эквивалент-1 на некоторой линейно независимой системе. \ Решим систему (1). Учитывая сказанное выше, будем счи-j тать эту систему линейно независимой. Итак, пусть (1) — система! линейных уравнений, граней основной и расширенной матриц которой равны т. Если т=п, то система (1) является крамеровской, так как ее определитель отличен от нуля, и имеет, следовательно, единственное решение. Пусть тфп. Тогда m</i. Выберем какой-либо базисный минор М матрицы системы, порядок его равен т. Для определенности будем считать, что этот минор расположен в первых т столбцах матрицы системы. Неизвестные Xm+i, • . • , %п (2) назовем свободными и перенесем содержащие их слагаемые в правые части уравнений: Otii^i +а12*2 +• • . + (Xim#m =Pi —O&im+i хт+1 —• • • — 0Cm*n, ) Ct2lXi +0&22#2 +. • . + 0&2m#m = Рг —Ctem+i xm+i —• • • — CC2n#n, I ,o\ CGmi#iT~0&m2-£2~r» * •~r&mmXm—Pm—&mm+iXm+l—• • • — QLmnXn» ) Свободным неизвестным (2) придадим произвольные значения из поля Р. Тогда (3) станет системой т линейных уравнений с т неизвестными. Ее определитель совпадает с минором М и потому не равен нулю. Следовательно, это — крамеровская система, которая имеет единственное решение (Ть Y2, ... , Ут). (4)
§ 113. Общее решение системы линейных уравнений 317 Очевидно, что (Yb Y2, • • • , Ут, Хт+и- ... , Хп), (5) где элементы (2) имеют те же значения, что и в (3) — решение системы (1). Если основное поле Р бесконечно, то таким путем получается бесконечное множество решений системы (1). Покажем, что при произвольном поле Р описанным способом может быть получено любое решение системы (1). + Пусть (Уи 72, ... , 7т, 7т+1, • • • » 7п) (6) «есть произвольное решение этой системы. В качестве значений свободных неизвестных (2) в (3) возьмем соответственно элементы уи *'=/л+1, ... , /г, входящие в (6), и получим решение (4) системы (3). Очевидно, построенное с помощью (4) решение (5) системы (1) совпадает с (6). ф Введем принципиально важное понятие общего решения системы уравнений. Строка вида (7i (*m+i, . . . , Хп), . . . , 7m (Xm+U • • • > Хп), *m+i, . . . , Хп), где свободные неизвестные Хщ+и ... , хп (7) независимо друг от друга пробегают поле Р, а (7i(#m+i, . . . , Хп), . . . , 7m(*m+i, . . . , Хп) ) есть решение системы, которая получается из (3), если считать (7) элементами поля Р> называется общим решением системы (1). Замечание. Совместная система линейных. уравнений (1) не имеет свободных неизвестных, если ранг ее матрицы равен п. В этом случае общим решением системы (1) называется ее единственное решение. Из приведенных выше рассуждений вытекает правило решения системы линейных уравнений. 1. Находим один из базисных миноров матрицы А системы. Пусть это будет минор М порядка г. 2. Вычисляем все окаймляющие этот минор миноры порядка г+1 расширенной матрицы системы, не содержащиеся в Л. Если среди них есть отличные от нуля, то система несовместна. Если же все эти миноры равны нулю, то система совместна. 3. Если система совместна, то ив всех ее уравнений оставляем только те, коэффициенты которых входят в минор М. В этих
318 Глава 11. Системы линейных уравнений уравнениях слева оставляем лишь те неизвестные, коэффициенты которых составляют минор М, а остальные неизвестные, если они есть, объявляем свободными и переносим содержащие их слагаемые в правые части уравнений. Считая свободные неизвестные элементами основного поля, выражаем через них оставшиеся неизвестные (например, с помощью теоремы Крамера). Таким путем мы получим общее решение системы (1). Пример. Решить систему уравнений xi—2x2+x3+ #4=1, \ Xi-2x2+xz- *4 = -l, | (8) Xi—2*2+#3+5*4 = 5. J Основное поле — поле вещественных чисел. Решение. Рассмотрим основную Л и расширенную А матрицы этой системы: [1-21 1"] Г1 -2 1 1 1"] 1-21-1, 1=1-21-1-1. 1 -2 1 5 J Ll -2 1 5 5 J Два последних столбца матрицы А одинаковы, поэтому ранги матриц А и А равны и, следовательно, система (8) совместна. Минор расположенный в первых двух строках и в столбцах с номерами 1, 4, отличен от нуля. Окаймляющие его миноры 1 1 1 1 -2 -2 -2 1 -1 5 и 1 1 1 1 1 1 1 1 -1 5 равны нулю, М — базисный минор. Оставим два первых уравнения и объявим свободными неизвестные х2 и х3: • Xi+Xi=l+i2X2—X3, | *4=П, Xl—Xi = — V+2x2—x3. ) Xi = 2xz—x3. Итак, (2*2—*з, х2, х3у 1) —общее решение системы (8). Рассмотрим еще систему ац#1 +ai2#2 +.. .+ain*n =0, 0&2i*i +a22*2 +• • . + 0t2Ti#n =0, (9) 0bml*l+am2*2+. • • + 0tmn^n=0
§ 113. Общее решение системы линейных уравнений 319 линейных однородных уравнений. Пусть г—ранг ее матрицы, U — пространство ее решений в некотором фиксированном базисе пространства Рп. Если векторы Vi(kiujki2, ... , Kin), t= 1,2,.,., п—г, сс^ставляют базис пространства U, то совокупность решений (Кц, ^г2, • • • , Kin) у i= 1,2,..., П-гГу называется фундаментальной системой решений системы уравнений (9). Найдем одну из фундаментальных систем решений. Ради упрощения обозначений будем считать, что базисный минор матрицы системы (9) расположен в первых г столбцах. Тогда общее решение нашей системы примет вид (VlC*T+l> • • • , Хп), . . . , Yr(#r+1, • . • , Хп), Xr+U • • • , Хп). Положив Xr+i=l> Ху+2=.. .=хп=0 и вычислив соответствующие значения для Yi(*r+1, • • • , Хп), • • • , Ут(Хг+и . . . , Хп), (Ю) получим решение Wi(yiu .. • , уг\, 1, 0, ... , 0) системы"(9). Аналогично вычислим решения wu i=29 ... , п—r, этой системы: положив jcr+i=l, *j=0, j¥=r+i, r-fl^/^n, и вычислив соответствующие значения для (10), получим решение т(уц, ... , ун, 0,..;, 1,... , 0). Покажем, что wu m, ... , wn-T (И) есть базис пространства О. Так как в системе (11) п—r векторов — столько, сколько в базисе пространства U, то нужно только доказать ее линейную независимость. Но матрица 1 Yn Vrl 1 0 _о Vl2 • • Yr2 0 .. 1 .. 0 .. fin Yr n 0 0 1 столбцами которой служат координатные столбцы векторов (11), содержит *в последних п—г строках отличный от нуля минор порядка п—r и имеет, следовательно, ранг п—г. Итак, (11) — базис пространства решений системы (9), и, следовательно, координатные строки векторов (11) составляют фундаментальную систему решений этой системы.
320 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Глава 12 ПОДОБИЕ МАТРИЦ НАД ПОЛЕМ. НОРМАЛЬНЫЕ ФОРМЫ МАТРИЦЫ Пусть А и В — квадратные матрицы порядка п над полем Р. Матрица В называется подобной матрице А над полем Р, если существует такая невырожденная квадратная матрица С поряд-, ка п над этим полем, что В = С-*АС. Очевидно, подобие матриц является отношением эквивалентности в множестве Рп всех квадратных матриц порядка п над полем Р и потому множество Рп разбивается на классы попарно подобных матриц так, что матрицы, входящие в различные классы, не подобны. В этой главе устанавливается эффективный критерий подобия матриц, позволяющий фактически определить, подобны ли данные матрицы, и производится классификация матриц с точностью до подобия. Иными словами, для каждого класса подобных матриц указываются некоторые инварианты, полностью определяющие этот класс. Строится полная система представителей классов подобных матриц, т. е. такое множество матриц, которое содержит точно по одной матрице из каждого класса подобных. В § 108 доказано, что матрицы тогда и лишь тогда подобны друг другу, когда они являются матрицами одного и того же эндоморфизма пространства Рп (в соответствующих базисах). Поэтому классификация матриц с точностью доподобия означает классификацию эндоморфизмов пространства Рп. Решение упомянутых вопросов связано с исследованием свойств характеристической матрицы. В связи с этим изучим вначале некоторые свойства матриц над кольцом полиномов Р[х]. § 114. Каноническая форма полиномиальной матрицы Пусть Р — произвольное поле. Будем рассматривать квадратные матрицы над кольцом полиномов Р[х]. Такие матрицы называются полиномиальными. Диагональная полиномиальная матрица /((*)=diag[Mx),/2 (*),... ,M*>] называется канонической, если она удовлетворяет следующим условиям: 1) каждый диагональный элемент fi(x)9 где t<n, является делителем следующего элемента /;+i (*); 2) старший коэффициент каждого из отличных от нуля полиномов fi(x) равен 1.
§ 114. Каноническая форма полиномиальной матрицы 321 Из этого определения вытекает, что если fi(x)=0 и /<д, то fk(x)=0 для k=i+l, ... , /г. Если же ^(х)=аФ09 аеР, to/j(a:) = 1. Если при этом /V=l, то и fk (х) = 1 для Л=1, ...,/—1, так что в общем случае каноническая матрица имеет вид I К(х) = diag[l,..., 1, fp(x),..., frW,D,..., 0], где fi(x)9 i—p, ... , г — непостоянные полиномы со старшим коэффициентом 1, причем каждый из них делится на предыдущий. В частности, единицы или нули на диагонали матрицы К(х) могут и отсутствовать или, наоборот, вся ее диагональ может быть составлена только из единиц и (или) нулей. В этой главе играют важную роль введенные в § 38 понятия элементарных преобразований и эквивалентности матриц. Основным кольцом при этом является Р[х]. Поскольку в Р[х] обратимы все отличные от нуля элементы поли Р и только они, то элементарными преобразованиями строк (столбцов) полиномиальной матрицы в соответствии с общим определением называются следующие операции: 1) умножение строки (столбца) на произвольный, отличный от нуля элемент поля Р; 2) прибавление к одной строке (столбцу) другой строки (столбца), умноженной на произвольный полином. Теорема 1. Всякая полиномиальная матрица эквивалентна некоторой канонической матрице, + Пусть А (х) — произвольная полиномиальная матрица. Если А (х) — нулевая матрица, то она сама каноническая. Пусть А(х) — ненулевая.матрица порядка п. При п=\ теорема очевидна: в этом случае A(x)=f(x), и нужно только умножить этот полином на подходящий элемент поля Р, чтобы его старший коэффициент стал равен 1. Пусть л>1. Сделаем индуктивное предположение: теорема верна для матриц порядка я—1. Обозначим буквой L класс всех матриц, эквивалентных матрице А(х)9 а М — множество всех полиномов, являющихся элементами матриц из L. Если f(x)^M> a aeP, аФО, то af(x)^M9 так как умножение строки матрицы на а — элементарное преобразование. Поэтому в множестве М есть такой полином fi(x)9 который имеет минимальную степень среди всех ненулевых полиномов этого множества и старший коэффициент которого равен 1. В § 38 доказано, что с помощью подходящей цепочки элементарных преобразований можно как угодно переставить строчки и столбцы матрицы. Упорядочив подходящим образом строки и столбцы матрицы из L, элементом которой является /(*), можно сделать этот полином первым эле-
322 Глава 12. Подобие матриц над полем. Нормальные формы матрицы ментом первой строки. Итак, в множестве L есть матрица 7iW h(x) ... flnW Ы{Х) Ы{Х) ... hn{x) Unl(x) fnz(x) fnn(x)J (1) Легко показать, что каждый элемент первой строки матрицы (1) и каждый элемент ее первого столбца делятся на fi(x). В самом деле, рассмотрим, например, элемент fu(x). Представим его в виде hi(x)=fi(x)a(x)+r(x)t где а(х) — частное, а г(х) — остаток при делении полинома fu(x) на а(х). Применим к матрице (1) следующее элементарное преобразование: к ее t-му столбцу прибавим первый, умноженный на — а(х). Первым элементом i-то столбца тогда станет г (х), поэтому г(х)^М. Следовательно, г(х)=0, иное противоречило бы выбору элемента fi(x). Поэтому fii(x) делится на fi(x). Все элементы первой строки матрицы, (1), кроме первого, мы заменим нулями, если к каждому столбцу прибавим первый, умноженный на подходящий полином. Таким же образом заменим нулями все, кроме первого, элементы первого столбца. Поэтому в множестве L есть матрица diag[fi(:*} Рассмотрим матрицу •Е [ В*(Х) ... g2n(x) gn2(x) ... gnn(x) J g22(x) ... g2n(x) ]• gnz(x) ... gnn(x) J (2) (3) Она порядка n—1 и в силу индуктивного предположения может быть приведена элементарными преобразованиями к каноническому виду diag[/2(*), ... . h(x)]. Если те же элементарные преобразования применить к матрице (2), не затрагивая ее первые строку и столбец, то она примет вид diag[M*), h(x), ...,Ш]. (4) Матрица {4) принадлежит множеству L. Покажем, что она ка-
§ 114. Каноническая форма полиномиальной матрицы 323 ионическая. Для этого нужно только доказать, что полином f2(x) делится на полином fi(x). Прибавив к первой строке матрицы (4) ее вторую строку, получим ,. ГГМ*) h(*) 1 п, . , ., ,-ч dwg[[ о f2(x) У f*№' "• ' fn^' (5) Матрица (5) принадлежит множеству L и имеет вид (1), следовательно, каждый элемент ее первой строки, и в частности /г(*), делится на полином ft (х). ф ч Описанный в доказательстве процесс можно осуществить, например, так. Пусть А (х) — ненулевая полиномиальная матрица. Среди ее ненулевых элементов найдем полином наименьшей степени т. Пусть это будет f(x). Если не каждый элемент матрицы А(х) делится на f(x), то с помощью подходящих элементарных преобразований получим матрицу В(х), среди ненулевых элементов которой есть полином степени, меньшей, чем т. С В(х) поступим так же, как поступили вначале с матрицей А(х). Этот процесс будем повторять до тех пор, пока не получим такую матрицу, все элементы которой делятся на один из них. Умножив последний элемент (т. е. содержащий его столбец) на подходящее число из поля Р, получим полином ji(x) со старшим коэффициентом, равным 1, делящий все элементы последней матрицы. Упорядочив соответствующим образом строки и столбцы, переведем fi(x) в левый верхний угол. Теперь можно привести матрицу к виду (2) и применять описанный процесс к стоящей.в ее правом нижнем углу матрице (3). Каноническая матрица, эквивалентная матрице А(х)9 называется канонической формой матрицы А(х). Приведем, например, tf канонической форме матрицу [х х+\ О 1 х+2 х-\ х . х-1 х—1 х J Здесь х — полином наименьшей степени среди всех ненулевых элементов данной матрицы, но не все они делятся на х. Вычитая из первого и второго столбцов третий, получим матрицу I х х+1 О"] В(х) = \ 2 -1 х , L-1 -I х J где4 — 1 — полином наименьшей степени среди ненулевых элементов матрицы* В(х), делящий каждый ее элемент. Переставив первую и третью строки» получим L х х+1 О J
324 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Последующие элементарные преобразования очевидны: .-1 -1 Л Г-1 0 0 1 П ООП 2 -1 х ~ 2 -3 3* ~ 0 -3 Зх ~ х х+1 0 J I х 1 х2 J [_0 1 л2 J [10 0 1 ПО 0 "1 0 1 ~~х \~ ° 1 ~~х I ~diagn.!»**+*]■ 0 1 jc2 J LO 0 **+* J § 115. Наибольшие общие делители миноров полиномиальной матрицы Пусть А(х)—полиномиальная матрица порядка я. Кольцо полиномов Р[х] является подкольцом поля рациональных дробей Р{х). Поэтому можно считать А(х) матрицей над полем Р(х). Следовательно, имеет смысл понятие ранга матрицы и применима теорема о ранге матрицы. Пусть ранг матрицы А (х) равен г. Каждый минор этой матрицы есть полином от х. Пусть dk(x) — наибольший общий делитель всех миноров порядка k матрицы А.(х), l^k^ir. Если г<я, то положим di(x)=0, £=г+1, ... , л. Таким образом, мы получим систему полиномов di(x), d2(x), ... у dn(x), (l) которую называют системой наибольших общих делителей миноров матрицы А (х). Если А (х) =0, то все полиномы (1) — нули. Если же А (х) — ненулевая матрица, то di(x) —наибольший общий делитель ее элементов, dn(x) при г=п равен определителю матрицы А(х)у деленному на его старший коэффициент. Например, если А (х) =хЕ—А — характеристическая матрица, то dn(x) = det (xE—A) —характеристический полином мат- рицы А. Лемма. Система наибольших общих делителей миноров полиномиальной матрицы не изменяется при элементарных преобразованиях. ф Рассмотрим, например, элементарные преобразования строк. Пусть строка матрицы А(х) умножается на отличное от нуля число а. Тогда те миноры, через которые проходит эта строка, умножаются на а, остальные — не изменяются. Наибольший общий делитель системы полиномов не изменится, если некоторые из них умножить на отличное от нуля число. Пусть теперь к первой, например, строке матрицы А (х) прибавляется ее вторая строка, умноженная на полином g(x).
§ 115. Наибольшие общие делители миноров полиномиальной матрицы 325 От этого могут измениться лишь те миноры, через которые проходит первая строка, но не проходит вторая. Рассмотрим один из таких миноров матрицы, полученной в результате применение указанного элементарного преобразования. Пусть это будет для определенности минор fn(x)+g(x)f2i(x) ... fih(x)+g(x)f2k(x) f3i(x) ... f3h(x) fk-Hl(x) где h(x)=p(x)+g(x)q(x)t fn(x) P(X): h+ih(x) =h(x)9 fsi(x) /12W Ы(х) g(*) = fk+li(x) fk+l2(x) Ы(х) /22(x) . fsi(x) /32 (x) fk+ll(x) fk+l2(x) hk(x) fsh(x) fh+ik(x) Ы(х) fsk(x) fh+lh(x) p(x) и g(x) — миноры порядка k матрицы А (х). Таким образом, если к одной строке матрицы А {х) прибавляется другая ее строка, умноженная на полином g(x), то к некоторым минорам порядка k этой матрицы прибавляются другие миноры порядка k, умноженные на g(x) или на —-g(x). Отсюда следует, что наибольший общий делитель миноров порядка k матрицы А {х) является общим делителем всех миноров порядка k матрицы В(х), которая получается из А(х) с помощью элементарных преобразований. Но А (х) в свою очередь получается из В (х) с помощью элементарных преобразований. Следовательно, наибольший общий делитель миноров порядка k матрицы В(х) делит все миноры порядка k матрицы А(х). Поэтому наибольшие общие делители миноров порядка k матриц А (х) и В (х) совпадают. # Очевидно Следствие"1. Системы наибольших общих делителей миноров эквивалентных полиномиальных матриц совпадают. Теорема 1. Каноническая форма полиномиальной матрицы однозначно определяется системой наибольших общих делителей миноров этой матрицы.
326 Глава 12. Подобие матриц над полем. Нормальные формы матрицы ф Пусть А(х)—полийомиальная матрица, (1)—система наибольших общих делителей ее миноров. Пусть, далее, K(x)=di*g[h(x), h(x), ... tfn(x)] (2) есть каноническая форма матрицы А(х). Тогда в силу предыдущего следствия (1)—система наибольших общих делителей миноров матрицы К(х). Если ранг г этой матрицы меньше пу то di(x) =0, i=r+-l, ... , п. Очевидно, U(x)=09 i=r+l,...,n; di(x)=fi(x)t так как fi(x) делит каждый полином fi(x) и его старший коэффициент равен 1. Аналогично d2(x)=h(x)f2(x)y ..., dr(x)=fi(x)f1(xy... fr(x). Следовательно, диагональные элементы матрицы К(х) однозначно определяются системой полиномов (1): h (х) =* (х), U (х) = ^|-, 1=2, при r<n fj(x)=0, /=г+1, .'. ,,/г. • Очевидно Следствие 2. Каноническая форма полиномиальной матрицы определена однозначно. Если (2) —каноническая форма матрицы А(х), то система полиномов fi(x)9 i=l, 2, , пу называется системой инвариантных множителей матрицы А (х). Теорема 1 доставляет еще один способ отыскания канонической формы полиномиальной матрицы. Рассмотрим, например, ту же матрицу что и в § 114. [х х+1 0"| х+2 х—1 х I, х-1 х-\ х\ х х+\ 0 х+2 х—1 х х—1 -х— 1 х I х х+1 0 I- , , j 0, = \ х+2 jc—1 jc =—3 =-3jc(jc4-1). —3001 ' х~~1 х Следовательно, d3(x)=x(x+l). йг(х) является делителем полинома d3(x). Минор | х х+1 I I х+2 х-\ I
при х=0 обращается в а при х= — 1 в. 0 11 2 "Л -1 0 1 -2 § 115. Наибольшие общие делители миноров полиномиальной «матрицы 327 = -2, =2. Следовательно, этот минор не делится ни на х, ни на л?+1. Поэтому d2(x) также не делится ни на х, ни на x+U Итак, d2(x) = \. Тогда и <i±(x) = 1. Следовательно, система инвариантных множителей матрицы А (х) имеет вид М*)=Ы*)=-1.- М*) =*(*+!)> Каноническая форма этой матрицы diag[l, 1, х(х+\)]. Следствие 3. Полиномиальные матрицы эквивалентны тогда и лишь тогда, когда совпадают их системы инвариантных множителей. Это утверждение очевидно. * * ^ В терминах эквивалентности полиномиальных матриц можно сформулировать критерий обратимости матрицы над кольцом Р[х]. Теорема 2. Матрица А(х) обратима над кольцом Р[х] тогда и лишь тогда, когда ее каноническая форма совпадает с единичной матрицей. ф Согласно теореме 3 § 36, матрица А (х)-1 над кольцом Р[х] существует тогда и только тогда, когда deti4(*) —отличный от нуля элемент поля Р. Но dety4(jnr) может отличаться от произведения fi(x)f2(x) ...fn(x) инвариантных множителей матрицы А (х) лишь отличным от нуля множителем из поля Р: det А (х) = afi (х) /2 (х) ... /п (*), аеР, аф 0. Поэтому для существования матрицы А(х)"1* над кольцом Р[х] необходимо и достаточно выполнение условий *h(x)h(x) .*..f»W-ePf aU(x)f2(x) ... fn(x)¥*0..-~ Так как все U (х) — полидомы, старшие коэффициенты которых равны 1, то последние условия равносильны следующему равенству: fi(x)h(x) ...M*) = l. (3) .Равенство (3) в свою очередь равносильно совокупности равенств ft(x) = lt i=l, 2, ... , пу которые означают, что А{х) ~Е. ф
328 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Следствие 4. Полиномиальная матрица обратима над кольцом Р [х] тогда и лишь тогда, когда она является произведением эле- ментарных матриц. ф В § 38 доказано, что элементарные матрицы и, следовательно, их произведения обратимы над основным кольцом. Обратно, пусть матрица А(х) обратима над кольцом Р[х]. Согласно предыдущей теореме, А(х)~Е. Как доказано в § 38, применение к строке или столбцу матрицы элементарного преобразования равносильно умножению ее на подходящую элементарную матрицу. Следовательно, A(x) = Vi(x) ... Vi(x)EUi(x) ... Um(x)9 где Vt(x)9„.9 Щх), Ui(x)9...9Um(x} (4) есть элементарные матрицы, ф Следствие 5. Матрицы А(х) и В(х) порядка п над кольцом Р[х] эквивалентны тогда и лишь тогда, когда существуют такие матрицы U(x) и V(x) порядка п, обратимые над Р[х], что B(x) = V(x)A(x)U(x). (5) ф Л(х) и В(х) эквивалентны в том и только в том случае, когда В (х) можно получить из А (х), применив к последней подходящую цепочку элементарных преобразований. Применение к матрице каждого из элементарных преобразований равносильно умножению ее слева или справа на подходящую элементарную матрицу. Поэтому А(х) и В(х) эквивалентны тогда и только тогда, когда существуют такие элементарные матрицы (4) порядка п, что B(x) = Vi(x) ... Vi(x)A(x)Utlx) ... Um(x). Нужное утверждение теперь вытекает из следствия 4. ф Матрицы U(x) и V(x) в формуле (5) можно найти следующим образом: U(x)=Ui(x) ... Un(x}=EUt(x) ...*/«(*), V(x) = Vl(x) ... Vi(x) = Vi(x) ... Vi(x)E. Найдя цепочку элементарных преобразований, переводящую А(х) в В(х) и применив все преобразования строк (столбцов) в том же порядке к единичной матрице, получим V(x) (U(x)).
§116. Элементарные делители полиномиальной матрицы 329 § 116. Элементарные делители полиномиальной матрицы Пусть f(x) —полином ненулевой степени над полем Я, а / (X) = api (Я) а' р2 (X) а* ... Рт (X) ат «есть его каноническое разложение, т. е. аеР, все полиномы pi(x) неприводимы над Р, при 1Ф\ Р\{х)Фр^{х) и старшие коэффициенты всех полиномов pi(x) равны 1. Полиномы pi(x)ai называются элементарными делителями полинома f(x). Набор элементарных делителей всех непостоянных инвариантных множителей полиномиальной матрицы называется системой элементарных делителей этой матрицы. В этот набор каждый элементарный делитель включается столько раз, во сколько инвариантных множителей он входит. 1. Матрица [х х+1 0 "| х+2 х-1 х х-1 х-1 х J имеет следующую систему инвариантных множителей: М*)=М*) = 1. Ы*)*=х(х+1) (см. § 115). Поэтому х, х+1 — система элементарных делителей матрицы Л(х). 2. Г х2-1 х+1 1 v L х+\ х2+2х+\ 1 di(x)=x+l, d2(x) = (x+\)2(x2-2)1 M*)=*+l. bW = (x+l)(x2-2). Следовательно, над полем вещественных чисел матрица В(х) имеет четыре элементарных делителя: х+1, х+1, х+ y*2J х— ]/Т. Над полем же рациональных чисел она имеет три элементарных делителя: х+1, х+1, х2—2, так как полином х2—2 неприводим над полем рациональных чисел. Теорема 1 (критерий эквивалентности полиномиальных матриц). Матрицы одного и того же порядка над кольцом Р[х] эквивалентны тогда,и лишь тогда, когда их ранги равны и системы элементарных делителей совпадают. ф Если матрицы эквивалентны, то мы знаем уже, что их ранги равны и системы элементарных делителей совпадают, так как совпадают системы инвариантных множителей этих матриц. Докажем достаточность условия теоремы. Пусть А (х) — поли-
330 Глава 12. Подобие матрац над полем. Нормальные формы матрицы ч. номиальная матрица ранга г, а Pi(*)••', ••• , Pi(*)в«, р2(*)6'» ... , Рг{х)ьи ph(x)c', ... , Pk(x)ci (1> есть система ее элементарных делителей. Здесь pi(x)¥=Pj(x) при 1Ф\. Будем считать полиномы в системе (1) расположенными так, что Ci^C<^. . .^Ci. (2) Покажем, что при заданных порядке л матрицы А (*), г и системе элементарных делителей (1) однозначно определяются инвариантные множители h(x),h(X), ...;ы(х) (з) этой матрицы. Система полиномов (1) есть набор систем эле* ментарных делителей непостоянных полиномов (3), поэтому для fi(x)=Pi(x)«iiP2(x)«2i ... pk(x)«ki (Pj(x)o=l). Кроме того, при г</г fj(x)=0y /=г+1, ... , л. Пусть, для определенности, первая цепочка неравенств (2) самая длинная, т. е. s^t, ... , s^l. Введя обозначения bt+i = - • . = Ь8=.. .=q+i=. . . = с3=0, получим сС^-Сг- iCs. (4) Очевидно, 5^г, так как pt(x)ai, i=l, 2,..., 5, есть элементарные делители, никакая пара из которых не входит в один и тот же инвариантный множитель. В силу неравенств (4) fr(x)=pi(x)*4b(x)bi... рк(х)с\ fr-l(x)=Pi(x)a>p2(x)b> . . . Pk{xY\ fr-s+l(x) =pi(x)as p2(x)bs . . . pk(x)cs
§116. Элементарные делители полиномиальной матрицы 331 и, если 5<г, Таким образом, если две матрицы имеют равные порядки, ранги и совпадающие системы элементарных делителей, то инвариантные множители этих матриц совпадают и потому эти матрицы эквивалентны, ф Заметим, что только совпадения систем элементарных делителей и равенства размеров матриц недостаточно для их эквивалентности. Пусть, например, Л (jc) =diag [1, х], B(*)=diag [0, x]. Эти матрицы не эквивалентны, так как их инвариантные множители ^различны. Однако обе они имеют лишь один элементарный делитель х. Теорема 2. Система элементарных делителей полиномиальной диагональной матрицы есть объединение систем элементарных делителей ее диагональных элементов. При этом каждый эле мен- тарный делитель учитывается, столько раз, во сколько диагональных элементов он входит. ф Пусть А (х) —диагональная матрица порядка п> а gi(x), gz(x), ... , gr(x) (5) есть все ее ненулевые диагональные элементы. Можно считать все старшие коэффициенты/голиномов (5) равными 1, так как при умножении строки матрицы на не равное нулю число элементарные делители матрицы и ее диагональных элементов не меняются. Очевидно, г — ранг матрицы А (х), и, следовательно, если (3) —система ее инвариантных множителей, т© при г</г f{(x)=0, i=r+l, ... , п. Произведение fi(x)f2(x) .., fr(x) равно наибольшему общему делителю миноров порядка г матрицы А(х). Но Л (а:) содержит лишь один отличный от нуля минор порядка г. gi (x) g2 (х) .... gr (x), поэтому gi (X) g2 (X) ...gr (X) =h (X) h (X) . . . fr (X) . (6) Пусть Pi(x)> P2M, .... , Ps(x) (7) есть все различные неприводимые над полем Р делители полиномов (5), старшие коэффициенты которых равны 1. Из равенства. (6) следует, что (7) —все различные неприводимые делители, старшие коэффициенты которых равны 1, непостоянных полиномов (3). Поэтому элементарные делители матрицы А(х) имеют вид рН*)ь- (8)
332 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Фиксируем теперь натуральное число /, удовлетворяющее неравенствам 1^/^5, и выделим из каждого полинома (5) максимальную степень полинома Pj(x), на которую он делится, т. е. представим gi(x) в виде gi(x)=pj(x)aitij(x)y где tij(x) не делит полином pj(x). Мы получим тогда систему полиномов Рз(х)*и 1=1, 2, ... , г. (9) Если не считать тех полиномов, в которых а*=0, то система (9) по построению есть система всех элементарных делителей полиномов (5) вида (8) (при фиксированном /). Будем считать полиномы (5) так занумерованными, что аА^а2^ ... ^аг. Тогда максимальная степень полинома Pj(x), на которую делится каждый минор порядка k матрицы А(х), при k^.r равна Pj(x)ai+a2+-+ak. Следовательно, если dk(x)—наибольшие общие делители миноров матрицы А (х), то pj(x)a^a^-+ah — максимальная степень полинома Pj(x), делящая dk(x). Так как ТО ' РЛ*)а* (Ю) есть максимальная степень полинома Pj(x), делящая fh(x). Если акф0, то полином (10)—элементарный делитель полинома fk(x). Если же aft=0, то полином fh(x) не имеет элементарных делителей вида (8). Таким образом, полиномы (9) с ак^ф0 и только они составляют систему элементарных делителей матрицы А (х) вида (8). Следовательно, элементарные делители вида (8) полиномов (5) и матрицы А (х) совпадают. Так как в качестве / можно взять любое число 1, 2, ... , 5, то теорема доказана, ф Следствие. Система элементарных делителей квазидиагональной матрицы есть объединение систем элементарных делителей ее диагональных клеток. + Пусть A(x)=diag[Al(x), А2(х), ... , Аш(х)] есть квазидиагональная полиномиальная матрица. Элементарными преобразованиями приведем клетку Ai(x)y i=l, 2, —, m,
§117. Матричные полиномы 333 к какой-либо диагональной форме diag [gn(x)y ... , gint(x)]. Элементарные делители клетки А{(х) являются элементарными делителями непостоянных полиномов gu(x), ..., gint(x). Элементарные преобразования клеток Ai(x), f=l, 2, ... , m, можно рассматривать как элементарные преобразования матрицы А(х), не затрагивающие строк и столбцов, не входящих в соответствующую клетку. Следовательно, матрица А (х) элементарными преобразованиями приводится к диагональной форме diag [gll(x), . . . , gim(x), . . . , gmt(x), . . . , gmnm(x)] и ее элементарные делители совпадают с элементарными делителями полиномов gu(x),... , gint(x), i=l, 2, ... , т. ф Замечание. Утверждение предыдущего следствия перестает быть верным, если вместо элементарных делителей рассматриваются инвариантные множители. Например, инвариантными множителями матрицы diag [л:, л:+1] являются полиномы 1, х(х+\), а не х, х+\. § 117. Матричные полиномы Посмотрим на полиномиальную матрицу с несколько иной точки зрения. Пусть А (х) — отличная от нулевой полиномиальная матрица порядка п, т — максимальное число среди степеней ее элементов. Тогда, очевидно, А (х) однозначно представляется в виде суммы А (х) =Ат(х) +Лт_1 (*) +.. ,+Ао(*), где для i=0, 1, ... , т каждый элемент матрицы Ai(x) есть полином вида ахг', aEP (x°=l). Представив затем каждую из матриц А г (х) в виде произведения Ai(x)=xiAu где А{ — постоянная матрица, т. е. Лг<=Рп, получим А (х) =х™Ат+х™-*Ат-1+.. .+Л0. (1) Итак, мы представили полиномиальную матрицу А(х) в виде полинома от х, коэффициенты которого — постоянные матрицы. Назовем (1) матричным полиномом от х порядка п, матрицы Лг-, t=0, 1, ... , т,— его коэффициентами, число m — степенью полинома (1), xmAm — его старшим членом. Матрицы равны, если размеры их одинаковы и на одних и тех же местах в них расположены равные элементы. Отсюда следует условие равенства матричных полиномов равных порядков: эти
334 Глава 12. Подобие матриц над полем. Нормальные формы матрицы полиномы равны, если их степени одинаковы и коэффициенты при равных степенях х равны. „ Для матричных полиномов можно строить теорию делимости, аналогичную теории делимости в кольце полиномов над полем. Конечно, здесь будут возникать дополнительные трудности, связанные с наличием в кольце матриц делителей нуля и некомму- тативностью умножения матриц. Мы не станем развивать эту теорию, а получим лишь одно утверждение, нужное для изучения условий эквивалентности характеристических матриц. Теорема. Пусть (1)—матричный полином, В — матрица порядка п над полем Р, В(х)=хЕ—В. Тогда существует единствен^ пая пара Qi(x),Ri ' (2) таких матриц порядка п над кольцом Р[х], что A(x)=B(x)Qi(x)+Ri (3) и Rt — постоянная матрица. Аналогично существует единственная пара Q2(x), R2 матриц порядка п над кольцом Р[х], такая, что A(x)=Q2(x)B(x)+R2 и R2 — постоянная матрица. Матрицы Qi(x) (Q2{x)) и Rt(R2) называются соответственно частным и остатком при делении матрицы А(х) на В(х) слева (справа). ♦ Докажем существование и единственность частного и остатка при делении слева, второе утверждение теоремы получается аналогично. Если А (х) =Л — постоянная матрица, то положим Qi(*)=0, Ri=A. Очевидно, Qi(x) и /?i удовлетворяют условиям теоремы. Если еще A(x)=B(x)Q(x)+R и R — постоянная матрица, то, сравнивая коэффициенты при одинаковых степенях х в обеих частях этого равенства, получаем Q(*)=0, R=A. Для постоянной матрицы А (х) теорема доказана. Пусть А (х) имеет вид А (х) =x™Am+xm-iAm-i+.. .+xAt+Ao, m>0, АтфО. Цели существуют матрицы (2), удовлетворяющие условию (3),
§118. Критерий подобия матриц над полем 335 то Qi(x) имеет вид Qi(x) =х™-*Вт-{+х™-*Вт-2+.. .+xBi+50. Перепишем условие (3): xmAm+xm-iAm-i+.. .+xAi+A0= = (хЕ-В) (x^Br^i+#»-*Bmr*+.m. .+xBt+B0). (4) Сравнивая коэффициенты при одинаковых степенях х в обеих частях равенства (4), получим: Ат==£>т—1» Ат А = Вт-2—ВВт-1, Ат-2 = Вт-.з—BBm-2f Ai=Bo—ВВ\У A0=R—BB0. Из последней системы равенств однозначно определяются коэффициенты полинома Qi(x) и остаток Rt: Bm—l'==zAmy Bm-2=Am-i-\-BBm-i9 Вт-3=Ат-2-\-ВВт-2, Bo—At+BBt, R^Ao+BBo, т. е. коэффициент Bi получается прибавлением к соответствующему коэффициенту Лг-+1 предыдущего коэффициента £*+i, умноженного слева на матрицу 5, f^/n—1. По этой же схеме получается и остаток Ri. ф § 118. Критерий подобия матриц над полем Лемма. Пусть А и В — квадратные матрицы порядка п над полем Р. Их характеристические матрицы тогда и лишь тогда эквивалентны, когда над полем Р есть две такие невырожденные матрицы U и V порядка п, что ' xE-B=V(xE-A)U. О)
336 Глава 12. Подобие матриц над полем. Нормальные формы матрицы ф В § 115 доказано, что для эквивалентности полиномиальных матриц хЕ~-А и хЕ—В необходимо и достаточно существование, таких обратимых над кольцом Р[х] матриц U(x) и V(x), что xE-B=V(x) (xE-A)U(x). (2) Равенство (1) есть равенство вида (2), поэтому достаточность условия теоремы очевидна. Докажем необходимость. Пусть хЕ—А~хЕ—В. Тогда верно равенство (2), где матрицы U(x) и V(x) обратимы над кольцом Р[х]. Положим V(x)~i=W(x). В силу равенства (2) W{x) (xE-B) = (xE-A)U(x). (3) Разделим W(x) слева на хЕ—Л, a U(x) справа ца хЕ—В: W(x) = (xE-A)Qi(x)+Ru\ U(x)=Q2(x)(xE-B)+R2. j W Из равенств (3) и (4) получим [ (хЕ-А) Qt (х) +/?i] \xE-B) = (хЕ-А) [Q2(x) (хЕ-В) +/?2] или {xE-A)[Qi(x)-Q2(x)](xE-B) = (xE-A)R2-Ri(xE-B). (5) Если Qi(x)-Q2(x)*09 (6) то левая часть равенства (5) — полином степени не меньше второй. Правая часть этого равенства — полином степени не выше первой. Поэтому неравенство (6) невозможно, Qi(x)-Q2(x)=0 и из (5) следует (xE^A)R2=Ri(xE-B).-. (7) Положим Rx=W, R2=U. Сравнивая в (7) коэффициенты при х% получаем lT=W. Остается доказать, что U — невырожденная матрица. С этой целью матрицу V(x) разделим слева на хЕ—В: V(x) = (xE-B)Q3(x) + V. Тогда E=W(x)V(x)=W(x)[(xE-B)Q*(x)+V] = = W (x) (xE-B) Q3 (x) + W (х) V. (8)|
§ 118. Критерий подобия матриц над полем 337 Учитывая (3) и (4), из (8) получаем E=(xE-A)U(x)Q3(x) + [(xE-A)Ql(x) + W]V= = (xE^A)[U(x)Q3(x)+Qi(x)V] + WV. Итак, E=(xE-A)[U(x)Q3(x)+Qi(x)V] + WV. (9) Если выражение, заключенное в квадратные скобки в равенстве (9),— не нуль, то правая часть этого равенства непостоянна, что невозможно, так как его левая часть Е, Поэтому из равенства (9) следует E=WV, W=U — невырожденная матрица. Умножая обе части равенства (7) слева на V, получим (1). # Теорема (критерий подобия матриц над полем). Две матрицы одного и того же порядка над полем Р подобны тогда и лишь тогда, когда их характеристические матрицы эквивалентны над кольцом Р[х]. ф Пусть А и В — подобные матрицы. Товда B=C-iAC, хЕ-В=хЕ—С-1АС=С-1хЕС—С-1АС= = С-1(хЕ-А)С. Матрицы хЕ—А и хЕ—В эквивалентны по предыдущей теореме. Обратно, пусть хЕ—А ~хЕ—В. Тогда верно равенство (1), где V=U-K Из (1) следует B = U~^AU. % Следствие 1. Пусть А и В — квадратные матрицы порядка п над полем Р. Каждое из следующих условий является необходимым и достаточным условием подобия матриц А и В: 1) системы инвариантных множителей характеристических матриц хЕ—А и хЕ—В совпадают; 2) системы наибольших общих делителей миноров матриц хЕ—А и хЕ—В совпадают; 3) системы элементарных делителей матриц хЕ—А и хЕ—В совпадают. ♦ Необходимость каждого из приведенных условий доказана ранее. Докажем достаточность. Мы уже знаем, что если выполняется условие 1 или 2, то хЕ—А ~хЕ—В и, следовательно, матрицы А и В подобны. Пусть теперь совпадают системы элементарных делителей матриц хЕ—А и хЕ—В. Ранги этих Матриц, также равны (они равны и, так как определитель каждой из этих матриц отличен от нуля). Согласно одному из условий эквивалентности полиномиальных матриц, хЕ—А~хЕ—В и, следовательно, А и В подобны, ф
338 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Пример. Определить, подобны ли матрицы ГЗ -2 1 1 Г24 -И -221 А = 2 -2 2 и В = 20 - 8 -20 . . L.3 -6 5 J Ll2 - 6 —10 J Основное поле — поле вещественных чисел. Решение. Найдем наибольшие общие делители миноров матрицы хЕ—А. Очевидно, di(x) = \. Один из миноров второго порядка 12 -II I х+2 -2 I ~*~~ ' При х=2 матрица хЕ—А обращается в матрицу Г-1 2 -11 -2 4 -2 , L-3 6 -3J ранг которой равен 1. Следовательно, все миноры второго порядка матрицы хЕ—А при х=2 обращаются в 0. Поэтому каждый из них делится на jc—2 и d2(x)=x-2; ds(x)=det(xE-A) = (x-2)i. Аналогичное исследование проведем для матрицы хЕ—В. di(*) = l. Далее» оДин из миноров I -20 х+8 I = 12(*-2). I -12 6 | При х=2 матрица хЕ—В обращается в матрицу [-22 11 22 1 -20 10 20 , -12 6 12 J ранг которой равен 1. Следовательно, d2 (х) = JC-2; ds (х) = det (xE-B) = (х-2)3. Системы наибольших общих делителей миноров матриц хЕ—А и хЕ—В совпадают, следовательно, А к В подобны. Очевидно Следствие 2. В множестве Рп всех квадратных матриц порядка п над полем Р каждый класс подобных матриц определяется системой полиномов П(х),и(х), ... , fnW, (Ю) удовлетворяющей следующим условиям: 1) старший коэффициент каждого из них равен 1,
§ 119. Построение трансформирующей матрицы 339 2) fi(x) делится на fi-i(x), t=2, ;.. , n; 3) сумма степеней полиномов (10) равна п. Для каждой из матриц класса, определяемого системой полиномов (Ю), (10) является системой инвариантных множителей ее характеристической матрицы, § 119. Построение трансформирующей матрицы Если Л, В, С — квадратные матрицы порядка п и В = С-*АС, (1) то говорят, что С трансформирует А в В. Иногда важно не только установить подобие матриц Л и В, но и найти трансформирующую матрицу С. Такую матрицу С можно найти, например, следующим образом. Пусть А = [ац], B = [p<j], С=[хц]. Равенство (1) равносильно равенству Перемножив матрицы и сравнивая затем элементы, занимающие одну и ту же позицию (£, /') в левой и правой частях последнего равенства (i, /= 1, 2, ... , h)f получим систему пг линейных уравнений с неизвестными хц. Найдя одно из решений этой системы, построим одну из трансформирующих матриц С. Очевидно, таким способом можно найти все трансформирующие матрицы. Опишем еще один способ построения одной из трансформирующих матриц. Пусть А и В подобны. Тогда характеристические матрицы хЕ—А и хЕ—В эквивалентны и имеют, следовательно, одну и ту же каноническую форму К(х). По одному из условий эквивалентности полиномиальных матриц К(Х) = Vi (х) (хЕ-А) Ui (х) = V2 (х) (хЕ-В) U2 (x), (2) где Ui(x)y Vi(x), t=l, 2,—обратимые над кольцом Р[х] матрицы, способ построения которых известен (см. § 115). Из формулы (2), положив U(x)=Ui(xjUt(x)-*, V(x) = V%ix)-*Vi(x)t получим хЕ—В= V(x) (xE—A)U(x). Тогда, как доказано выше, В = С~1АС, где С —остаток при делении матрицы V(x)~l слева на хЕ—А. Пример. Найти матрицу С, трансформирующую А в Ву где А и В — такие же, как и в предыдущем параграфе. Решение. Посредством элементарных преобразований строк и столбцов приведем матрицу хЕ—А к канонической форме. При этом каждое элементарное преобразование, примененное к строкам матрицы хЕ—Л, будем применять и к строкам единичной матрицы. Запишем рядом строки матриц хЕ—А и Е3: *-3 2 -1 1 О ОТ -^Г х+2 -2 0 1 О L -3 6 х-Б 0 0 1 J
340 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Прибавляем к первому столбцу третий, умноженный на х—3, ко второму — удвоенный третий: ГО 0 -1 1 0 01 -2 (х-2) х-2 -2010. [_х2-8х+12 2(х-2) х-5 0 0 1 J Из второй строки вычитаем удвоенную первую, к третьей — прибавляем первую, умноженную на х—5: [0 0 -1 10 0"] -2 (х-2) х-2 0,-210. х2-8х+12 2(х-2) 0 х-Ъ 0 1 J Удвоенный второй столбец прибавляем к первому: [0 0 -1 10 0"] 0 х-2 0 -2 10 . (х-2)2 2(аг—2) 0 х-5 0 lj Из третьей строки вычитаем удвоенную вторую: [О 0-1 10 0 1 О х-2 0-2 10. (х-2)2 0 0 х-1 -2 1 J Умножая третий столбец на —1 и изменяя затем порядок столбцов, получим каноническую форму К(х) матрицы хЕ—А: [10 0 10 0"| 0 х—2 0 —2 10. О 0 (х-2)2 х-\ -2 \\ Vi(x)(xE-A)Ui(x)=diag[l х-2, (х-2)2], Vi(x)- Итак, Г 1 О ОТ |= -2 10. L*-l -2 1J Обратимся к Матрице [х-24 11 22 1 -20 х+8 20 . -12 6 x+lOj Умножаем последний столбец на 6. Далее вычитаем из последнего столбца второй, умноженный на х+10, к первому столбцу прибавляем удвоенный второй: [х-2 И -11 (х-2) 1 0 01 2(х—2) х+8 —х2—18х+40 0 10. 0 6 0 0 0 1 J
§ 119. Построение трансформирующей матрицы 341 Первую и вторую строки умножаем на б, затем из первой строки вычитаем третью, умноженную на 11, а из второй — третью, умноженную на х+8: Г 6(*-2) О -66(*-2)J 6 0 -И I 12(*-2) 0 6(-*2-18х+40) 0 6 -JC-8 . L 0 6 0 0 0 1 J К третьему столбцу прибавляем первый, умноженный на И: [6(л--2) 0 0 6 О -И 1 12(х-2) 0 -6(х-2)2 0 6 -Jc-8 L О 6 0 0 0 1 J Из второй строки вычитаем удвоенную первую: [6(х-2) 0 0 6 О -П] О 0 -6(x-2)2 -12 6 14—л: . Об 0 0 0 1 J Делим первый и второй столбцы на 6, третий — на —6, переставляем первый и второй столбцы: ГО х—2 0 6 0-11"| О 0 (jc-2)2 -12 б 14-х L Li о о о о 1 J Меняем порядок строк: Итак, Далее, где [10 0 0 0. 1 "1 О х-2 0 6 О -И . О 0 (*-2)2 -12 6 14—л: J V2(x) (xE-B)Vi(x) =diag[l, jc-2, (jc-2)2], Г ° ° l 1 V2(x)= 6 0 -11 . L —12 6 14-jc J xE-A = V(x)(xE-B)U(x), A = VBV-ly V(x) = Vi(x)-*V2(x}t V—остаток при делении полинома V(x) слева на хЕ—А. Вычисляем V(x): det Г 1 0 0"] ГО 0 11 Vi(jc) = 1, Vi(Jc)-»= 2 1 04 , V(x)= 6 0 -9 \=xF+Hy L5-x 2 1 J LO 6 -3-2*J Г0 0 0 1 Г0 0 11 F= 0 0 0 , H= 6 0 -9 . LO 0 -2 J 10 6 —3 J
342 Глава 12. Подобие матриц над. полем. Нормальные формы матрицы Полином V(x) делим слева на хЕ—А: V(x) =xF+H= (xE—A)F+(AF+H). Итак, V=AF+H= ГО 0 -11 б 0 —13 . [_0 6 -13 J § 120. Сопровождающая матрица Пусть Р — произвольное поле, а g(x) =ao+ai*+.. .+ап-1Хп-1-{-хп «сть полином ненулевой степени п над этим полем, старший коэффициент которого есть 1. Квадратную матрицу А = назовем матрицей, сопровождающей полином g(x). Например, 0 1 0 0 0 . 0 . 1 . 0 . .. 0 . 0 . 0 . 1 — Обо —ai —а2 — ОСп С »]■ ■■ Е::]- матрицы, сопровождающие соответственно полиномы'.*2—1, х— 1, х3. Лемма. Характеристическая матрица матрицы Л, сопровождающей полином g(x), имеет следующую систему инвариантных множителей: 1,..., 1, g(x). ф Рассмотрим систему di(x), i=l, 2, щих делителей миноров матрицы я, наибольших об- хЕ-А = | о —1 ... -=1 Разлагая det(xE-A) по элементам последнего столбца, получим dn (х) =det(хЕ--А) = (-1) »+* а0(-1) *-*+ +^(-l)»+2aix(-l)»-2+...+ (-l)2n-1an-2*n-a(-l) + X —1 0 0 0 .. х .. — 1 .. 0 .. 0. 0 . ... -1 do ai x+a
§121. Первая нормальная форма матрицы над полем 34Э Минор порядка л— 1, остающийся после вычеркивания первой строки и последнего столбца матрицы хЕ—Ау равен (—1)п_4, поэтому dn-i(x) = l. Следовательно, di(x) = l9 t=l, 2, ... , д—К Отсюда вытекает требуемое. # § 121. Первая нормальная форма матрицы над полем Пусть А — квадратная матрица порядка п над полем Р, 1,..., l,/m(*),...,/n(x)- (1) инвариантные множители характеристической матрицы хЕ—А, причем полином fm(x) имеет ненулевую степень. Обозначим символом Ai матрицу, сопровождающую полином fi(x)9 i=m9 m+l,...,n, B=diag [Am, ... , An]. Так как порядок клетки А{ равен степени полинома fi(x), то порядок-матрицы В равен сумме степеней полиномов fm(x)>... , fn(x), , (2) т. е. степени их произведения. Произведение всех полиномов (2) равно характеристическому полиному матрицы А и, следовательно, имеет степень я. Таким образом, В — матрица порядка п. Теорема L Матрицы А и В подобны. + Вычислим систему инвариантных множителей матрицы* хЕ-В. х£—£=diag [xEim—Am, ... 9 xEin—An], где U — степень полинома ft(x). Посредством элементарных преобразований строк и столбцов каждую из клеток хЕц—Ai приведем к каноническому виду diag[l, ... , 1, /*(*)], где число единиц, на диагонали равно /*— 1. Эти преобразования можно рассматривать как элементарные преобразования матрицы хЕ—В9 поэтому хЕ—В эквивалентна матрице diag[l,...,l,fm(*),l,... ,f»(*)]. (3) Изменив порядок строк и столбцов матрицы (3), приведем ее к виду diag[l, ..., 1,./«(*).-.../»(*)]. (4) (4) — каноническая форма матрицы хЕ—В9 так как каждый из.
344 Глава 12. Подобие матриц над полем. Нормальные формы матрицы полиномов fi(x) делится на предыдущий и их старшие коэффициенты равны 1. Следовательно, (1)—система инвариантных множителей матрицы хЕ—В. Таким образом, системы инвариантных множителей матриц хЕ—А и хЕ—В совпадают, следовательно, матрицы А и В подобны, ф Матрица В называется первой нормальной формой матрицы А (нормальной формой Фробениуса). Первая нормальная форма матрицы Л вполне определяется последовательностью (1) инвариантных множителей характеристической матрицы хЕ—А и потому она однозначно определена. Пример. Найти первую нормальную форму матрицы ГЗ -2 I"! Л= 2-22. |_3 -6 5 J Решение. Наибольшие общие делители миноров матрицы хЕ—А таковы: di(x) = \, d2(x)=x-2, d3(x) = (x-2)* (они вычислены в § Ц8). Поэтому ее инвариантные множители—1, х—2, (х—2)2; 2 — клетка, сопровождающая полином х—2, клетка, сопровождающая полином (х—2)2. Следовательно, • ГО -4 1 diagt^ [x J]- первая нормальная форма матрицы А. Так как для любой квадратной матрицы существует первая нормальная форма, то верна Теорема 2. Для любого эндоморфизма пространства Рп в этом пространстве существует базис, в котором матрица эндоморфизма имеет первую нормальную форму. § 122. Минимальный полином Пусть А — квадратная матрица над полем Я, a g{x) — полином над этим полем. Если g(A)=0, то g(x) называется аннулирующим матрицу А полиномом. Лемма. Для любой квадратной матрицы существует аннулирующий ее полином ненулевой степени.
§ 122. Минимальный полином 345 ф Пусть А — матрица порядка п над полем Р. Так как пространство Рп всех матриц порядка п над полем Р имеет размерность /г2, то степени А°=Е, А, А2, ... , Ап2 линейно зависимы. Поэтому в поле Р есть такие числа ао, ai,* аг, ... , аП2, не все равные нулю, что a0E+aiA+a2A2+.. .+ап2Лп2=0. Заметим, что среди чисел at, аг, ... , апг также есть отличное от нуля, иначе было бы a0£=0, а0=0, аг=0, t=0, 1,..., м2. Положим g(x) =a0+aiA:+a2^2+- • -+аП2Хп\ g(x) — полином ненулевой степени и g(A) =0. ф Если т(х)—такой аннулирующий матрицу А полином ненулевой степени, что: 1) т(х) имеет наименьшую степень среди всех аннулирующих матрицу А непостоянных полиномов, 2) старший коэффициент полинома т(х) равен 1, то т(х) называется минимальным полиномом матрицы Л. Отметим простейшие свойства минимального полинома матрицы. 1. Минимальный полином матрицы определен однозначно. ф Пусть пг(х) и 1(х) —минимальные полиномы матрицы Л, k(x)=m(x)—l(x). Старшие коэффициенты полиномов т(х) и 1(х) равны, следовательно, степень полинрма k(x) ниже степени полиномов т{х)у 1(х). С другой стороны, &(Л)=0, поэтому k(x)=09 m(x)=l(x). • 2. Пусть пг(х)—минимальный полином матрицы Af f(x)^ еР[х]. Полином f(x) аннулирует матрицу А тогда и лишь тогда, когда он делится на т(х). , ♦ Представим f(x) в виде f(x)=m(x)q(x)+r(x), где г(х) —остаток при делении полинома f(x) на т(х). Тогда f(A)=m(A)q(A)+r(A). (1.) Так как т(А) =0, то из равенства (1) следует /(Л)=г(Л). (2)
34(j> Глава 12. Подобие матриц над полем. Нормальные формы матрицы В силу равенства (2) условия /(Л)=0 (3) я г(Л)=0 (4) равносильны. Условие (4) равносильно равенству г(х)=0. (5) Итак, равенство (3) имеет место тогда и лишь тогда, когда верно (5). # В § 30 мы видели, что кольцо Р [А] изоморфно фактор-кольцу Р [x]/It где / — идеал, составленный из всех полиномов, аннулирующих матрицу А (аннулирующий матрицу А идеал). Согласно предыдущему свойству, этот идеал есть множество всех полиномов, кратных пг(х). 3. Множество Р[А] всех полиномов от матрицы А с коэффициентами из поля Р является k-мерным векторным пространством над полем Р, где k — степень минимального полинома матрицы А. Матрицы . ЕУ А, А\ ..., А*-\ (6) составляют базис этого пространства. ♦ В § 30 доказано, что множество Р[А] является векторным пространством над полем Р. Пусть f(A) — произвольный элемент множества Р[А]9 а т(х)—минимальный полином матрицы Л. Тогда верно равенство (1), где г(х) —остаток при делении полинома f(x) на т(х). Так как r(x) =a0+ai*+.. ,+ah-iXk-19 jo f(A) =r(A) =aoE+aiA+.. .+ak-iA*-K Доказано, что (6)—система образующих пространства Р[А]. Остается доказать линейную независимость системы (6). Рассмотрим произвольную равную нулю линейную комбинацию ^матриц (6): Ро£+М+. • .+Р*-И*-1=0. (7) £сли q(x) =p0+p1x+.. .+р*-1**-1, то в силу (7) q(A)=0. Последнее невозможно, если q(x)^09 так как в этом случае q(x) был бы аннулирующим матрицу А полиномом, степень которого меньше степени минимального полинома этой матрицы. Поэтому "q(x)=0, т. е. р* = 0 для /=0,
§ 122. Минимальный полином 347 1/...,Л—1, (7)—тривиальная линейная комбинация, (6) — линейно независимая система. # 4. Минимальный полином $вазидиагональной матрицы равен наименьшему общему кратному минимальных полиномов ее диагональных клеток. ф Пусть Л = (На?[ЛьЛ2,...,Л|], f(*)e=P[x]. Тогда f(A)=diag[f(Ai),f(A2),...,f(Al)]. Следовательно, полином f (x) аннулирует матрицу А тогда и лишь тогда, когда он аннулирует каждую ее клетку А и т. е. делится на минимальный полином mi(x) этой клетки. Следовательно, среди всех аннулирующих матрицу А непостоянных полиномов наименьшую степень имеет наименьшее общее кратное полиномов Шг(х)у i=l, 2, ...,// # 5. Пусть матрица А имеет вид Гаи . CUi . 0 L о . aifc . • Q-hh .. 0 .. 0 Cti fc+i dk fc+i Oft+i ft+l • dn k+l am CLkn . Ctft + i n 0.nn Если m(x) и l(x)— минимальные полиномы матриц А и В соответственно,, то пг(х) делится на 1(х). ♦ Пусть t (х) — произвольный полином. Так как tm-lm F l (см. § 28), то равенство t(A)=0 влечет за собой t(B)=0. Итак, если t(x) аннулирует матрицу Л, то он аннулирует и В. Согласно свойству 2, / (х) делится на 1(х). # Приведем определение минимального полинома эндоморфизма. Пусть / — эндоморфизм пространства Рп, а g(x) —полином над полем Р. Если g(f) =0, то g(x) называется полиномом, аннулирующим эндоморфизм f. Если m (x) — такой аннулирующий эндоморфизм f полином ненулевой степени, что: 1) т(х) имеет наименьшую степень среди всех непостоянных аннулирующих f полиномов; 2) старший коэффициент полинома т(х) равен 1, то т(х) называется минимальным полиномом эндоморфизма /. Минимальный полином эндоморфизма определяется так же, как минимальный полином матрицы, и обладает теми же свой- -г в с1 L On-hh D\
348 Глава 12. Подобие матриц над полем. Нормальные формы матрицы ствами. В частности, для него верны доказанные выше для минимальных полиномов матриц утверждения 1 и 2. Доказательства аналогичны. Теорема 1. Минимальный полином эндоморфизма равен минимальному полиному его матрицы в произвольном базисе. ф Пусть / — эндоморфизм пространства Pn, g(x) —полином над полем Р. Если А — матрица эндоморфизма f, то g(A)— матрица эндоморфизма g(f) в том же базисе. С другой стороны, лишь нулевой эндоморфизм имеет" нулевую матрицу. Следовательно, равенства g(A)=0 и g(f)=0 могут иметь место лишь одновременно, т. е. множество всех полиномов, аннулирующих матрицу Л, совпадает с множеством всех полиномов, аннулирующих эндоморфизм /. Поэтому минимальный полином матрицы А равен минимальному полиному эндоморфизма /. # Очевидно Следствие 1. Минимальные полиномы подобных матриц равны. Следствие 2. Пусть f — эндоморфизм, a Q — ненулевое подпространство пространства Рп, инвариантное относительно f. Пусть далее h — ограничение эндоморфизма f на Q, ш(х) и 1(х)—минимальные полиномы эндоморфизмов f и h соответственно. Тогда пг(х) делится на 1(х). ♦ Возьмем какой-либо базис подпространства Q. Дополнив его до базиса пространства Рп, запишем в последнем базисе матрицу эндоморфизма /:. Гаи . 0 L 0 . aih • • OLkk .. 0 .. 0 «l ft + i Ctfe k + l Ctft + i ft + i . On n + i . . din . . OLkn • • <Xft + i <Xn n Здесь В — матрица эндоморфизма h, m(x) и l(x) — минимальные полиномы матриц А и В соответственно. Далее см. свойство 5 минимального полинома матрицы, ф Теорема 2. Минимальный полином матрицы равен последнему инвариантному множителю ее характеристической матрицы. ф Поскольку минимальные полиномы подобных матриц равны, а их характеристические матрицы имеют равные инвариантные множители, то можно воспользоваться первой нормальной формой матрицы. Пусть вначале ГО 0 . 10. 0 1. Lb о . . 0 . 0 . 0 . 1 —ао —а4 —а2 —ап- [в с\ L On-hh d\
§ 122. Минимальный полином 349 В пространстве Рп отметим некоторый базис йо, йи ... , йп-1 (8) и обозначим буквой / эндоморфизм этого пространства, который в базисе (8) имеет матрицу А. Тогда f(uo)=Uu f(Un-2)=Un-U f(un-i) =_— (a0w0+aii/i+.. .+ +an-iWn-i). Формулы (9) перепишем в виде йо=е(йо), u2=f(ui)=f2(uo), (9) (10) un-i=fn-i(uo). Из (9) и (10) следует fn(uo) =f(un-i) = — (аой0+а1Й1+- • .+an-iwn-i): = —[a0e(u0)+ai/(uo)+. • .+an-i/n_1(i/o)]. Далее где Пусть /n(^0)=_(aoe+ai/+. # ,+aft-ifn-1) (u0)=-A(f) (йо), (И) ft (л:) =ao+atX+.. .+an-i^n~1. g(*) =a0+aiA:+.. .+ап-1*п_1+*п> Как показано в § 120, £(#) —последний инвариантный множитель матрицы хЕ—Л. Вычислим g(f)(uo). Так как £(*)== =ft(*)-f*n, то, учитывая (11), имеем ff(f) (йо) = [Л(/) +fn] (Со) =Л(0 (йо) —A(f) (So) =0. (12) Для любого *'=1, 2, ... , /г—1 *(/)(fc)=*(f) (№)) = [*(/)№)] =
350 Глава 12. Подобие матриц над полем. Нормальные формы матрицы или в силу (12) g(f)(ui)=0, *=0, 1,...,п-1. Поэтому для любого вектора й g(f) (и) =0, т. е. g(f) =01 „Следовательно, полином g(x) делится на минимальный полином т(х) эндоморфизма /. Пусть Тогда m(f) =Poe+Pi/+.. .+рЛ-1/Л-1+/Л=0, т. е. m(f) (wo)=Po^o+pi/(iZo)+. . .+pft-i/ft-1("o)+/ft("o)=0. (13) Из равенства (13) следует, что k^nf так как ко,/(йа), ... , !п"1(йо)—линейно независимая система векторов. Учитывая теперь то, что полином g(x) делится на т(х) и п — степень поли- нома g(x), получим равенство g{x\=m(x). Итак, g(x) —мини- мальный полином матрицы А; сопровождающей этот полином. Пусть теперь A=diag[Au А2у ... , А{\ — произвольная матрица, имеющая первую нормальную форму. Тогда, как показано в § 121, системой инвариантных множителей матрицы хЕ—А является 1, ... , 1, gi(x), gz(x), ... , gi(x)9 где gi(x)—полином, сопровождаемый клеткой А\. Минимальный полином клетки А\ совпадает, как показано выше, с gi(x)x а минимальный полином т(х) матрицы А равен наименьшему общему кратному всех полиномов gi(x). Последний полином. gi(x) делится на каждый из предыдущих, поэтому т(х) =gt(x).+ Следствие 3 (теорема Гамильтона—Кэли). Квадратная мат^ рица аннулируется своим характеристическим полиномом. ф Характеристический полином матрицы делится на ее минимальный полином, так как если fi(x), t=l, 2, ... , м,— инвариантные множители характеристической матрицы хЕ—А, та U{x)hix) ••• fn{x)—характеристический полином матрицы Лк а }п{х) — минимальный полином этой матрицы, ф Очевидно
§ 123. Инвариантные подпространства 351 Следствие 4. Всякий корень характеристического полинома матрицы является корнем ее минимального полинома (возможно, другой кратности). Так как характеристический полином эндоморфизма совпадает с характеристическим полиномом его матрицы, то верно Следствие 5. Всякий эндоморфизм пространства Рп аннулируется своим характеристическим полиномом. § 123. Инвариантные подпространства, связанные с каноническим разложением минимального полинома Лемма.. Пусть f — эндоморфизм пространства Рп, ц(х), t=l, 2, ...,/,- (1) взаимно простые в совокупности полиномы над полем Р, аеРп. Если <М/)(а)="0, (2) то а=0. <► Так как полиномы (1) взаимно просты, то существуют над полем Р такие полиномы /**(*), i=l, 2, ... , /, что qi(x}ri(x)+q2(x)r2(x)+...+qi(x)ri(x) = l. Из этого равенства'вытекает ri(f)lt(f)+rt(f)q*U)+- • •+n(f)gi(f) =e M/)<7i(/) (u)+r*(f)q't(f) (a)+.. ,+r, <f)qi (f) (a|=e(a) =a. (3) Из (2) и (3) следует равенство a=0. # Пусть f — эндоморфизм пространства Рп, т(х) —минимальный полином этого эндоморфизма, т(х)= pi(x)aip2(x)a2 ... Pl(X)ai— (4) каноническое разложение. Будем рассматривать тот случай, когда в разложении (4) />1. Положим mix) *(*) = гтт~, 1=1,2, ...,/, н рассмотрим подпространства qi(f)(pn) = Oi. Теорема 1. d — нетривиальное подпространство пространства Рп, инвариантное относительно эндоморфизма^ f. Минимальный полином ограничения эндоморфизма / на подпространстве Ui равен Di(x)*t. (5)
352 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Подпространство Ui совпадает с ядром эндоморфизма Pi(f)at. Пространство Рп есть прямая сумма pn = Oi+02+...+Ui (6)) подпространств Ui. ♦ Пусть а^Пг. Тогда в пространстве Рп есть такой вектор 5, что a = qi (f)(5). Поэтому f(a)=fqi(f)(5)=qi(f)f(5)=qi(f)(f(6))^qi(f)(P-) = Uu т. е. подпространство £7* инвариантно относительно эндоморфизма f. Полином <7i(х) не делится на т(х), поэтому <7г(/)#0, Яг = Я1(!){РП)Ф$Ь Далее pi(f)°t(Ui)=Pi(f)4qi(f)(pn)=m(f)(P")=Q(P») = {ty1 следовательно^ полином (5) аннулирует ограничение эндоморфизма / на подпространстве Ui. Отсюда вытекает, э частности, что Oi=£Pn> ибо степень полинома (5) ниже степени минимального полинома эндоморфизма /. С другой стороны, пусть* t(x)—произвольный полином, аннулирующий ограничение эндоморфизма / на подпространстве Ui. Тогда {6}=t(f)(Ui)=t(f)qi(f)(P"), поэтому полином t(x)qi(x) делится на т(х) и, следовательно, t(x) делится на полином (5). Таким образом, доказано, что (5)—минимальный полином ограничения эндоморфизма / на подпространстве Ui. Докажем, что пространство Рп есть прямая сумма (6). Очевидно, полиномы qi(x)t i=l, 2, ... , /, взаимно просты в совокупности. Поэтому над полем Р существуют такие полиномы Ui (x), i= 1, 2, ... , /, что щ (х)?1 (х)+.. .+ui (x)qi (*) = !. (7) Из равенства (7) следует, что Ui(x) не делится на Pi (*), так как иначе полином pi (х) делил бы единицу. Кроме того, полином pi (х) неприводим над полем Р и потому Ui (x) и (5) — взаимно простые полиномы. Рассмотрим ядро ограничения эндоморфизма Ui(f) на подпространстве Ui. Пусть cet7j и и* (/) (с) ="б. Учитывая, что и Р*Ш°'(с-)=Д получим, согласно предыдущей лемме, с=0. Итак, ограничение эндоморфизма Ui(f) на подпространстве {7< инъективно и, следовательно, сюръективно, т. е. 0f=«<tf)(l4=««(f)?i(f)(P"). - (8) Из равенства (7) следует Ui{f)qi(f)+...+ut{f)qi(f)=e, поэтому для любого вектора о пространства Рп v=e(vl=lUi(f)4i(f)+.--+Ui(f)qi(fm).
§ 123. Инвариантные подпространства 353 Введя обозначения Vi = Ui(f)qi(f)(v)t i=l, 2, ...,/, получим v = vi+v2+...'+vi9 (9) где в силу равенства (8) Vi^Ui. Из равенства (9) следует, что пространство Рп представляется в виде суммы (6). Докажем, что сумма (6) прямая. Пусть vi+v2+...+vi='0. (10) Тогда Vi = — (V2+. ..4-£Jj), 1i(f) (Vi) =-<7i(ft (^2)-.. .-qi(f) (vi) ="0+.. .+6="o, так как полином qi(x) делится на_ минимальные полиномы ограничений эндоморфизма / на подпространствах £/*, t=2, ...,/. Итак, <7itf)(*i)=0. Нои Pi(/)e'(^i)=a так как vi^Ui. Согласно предыдущей лемме, отсюда вытекает £i = 0. Аналогично получаются равенства г7»=0 для i=2. ... , /. Итак, из равенства (10) следуют равенства Vi = 0, *=1, 2, ...,/, т. е. сумма (6) —прямая. Остается доказать равенство ^=Кегрг(/)^. (11) Мы уже знаем, что для любого вектора и.пространства £/»• М/)а<(*)=0, (12> так как (5) — минимальный полином ограничения эндоморфизма / на подпространстве Vi. Пусть, обратно, вектор й удовлетворяет равенству (12). Представим этот вектор в виде й=Й1+.. -+uit iii^Ui. Рассуждая так же, как и при доказательстве того факта, что сумма (6) прямая, получим <7*(/)(й-й*)=0. Нои М/)а'(Й-Йг)="0* При этих условиях в силу предыдущей леммы и—йг=о, a^Ui^Ui. Равенство (11) Доказано, ф Предыдущей теоремой изучение произвольных эндоморфизмов простран* ства Рп сводится к изучению таких эндоморфизмов, минимальные полиномы которых суть степени неприводимых над основным полем полиномов.
354 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Рассмотрим задачу построения всех подпространств пространства Рп\ инвариантных относительно произвольного (фиксированного) эндоморфизма /. Мы покажем, что эта задача с помощью теоремы 1 сводится к аналогичной задаче для таких эндоморфизмов, "минимальные полиномы которых являются степенями неприводимых над основным полем полиномов. Пусть Qi — подпространство пространства Oi (см. теорему 1), инвариантное относительно ограничения эндоморфизма / на Ui (т. е. инвариантное относительно f), Q=Qt+Q2+...+Qi. Тогда, очевидно, те из подпространств Qu которые отличны от нулевого, составляют прямую сумму, равную Q. Очевидно также, что подпространство Q инвариантно относительно эндоморфизма /. Покажем сейчас, что все инвариантные относительно эндоморфизма / подпространства пространства Рп получаются описанным способом. Теорема 2. Пусть Q— нетривиальное подпространство пространства Рп, инвариантное относительно эндоморфизма f. Тогда Q=Qi+Q2+...+Qh Qi^Uu t=l, 2, ...,/, причем Qi инвариантны относительно f. ~ ♦ Обозначим буквой g ограничение эндоморфизма f на Q. Пусть г (х) — минимальный полином эндоморфизма g. Тогда, согласно следствию 2 § 122, г(х) является делителем полинома т(х). Если (4) —каноническое разложение полинома т(х), то все элементарные делители полинома г(х) имеют вид Р%(х)\ bi^iai. Пусть, для определенности, r(x)=pi(x)bl...pt(x)btt t^lt есть каноническое разложение, Ci(x)= "'J*} , Qi=Ci(g)(Ql t=l, ...,*. Pi W l Согласно предыдущей теореме, _ причем каждое из подпространств Qi инвариантно относительно эндоморфизма g и, следовательно, относительно /, и Qi=KerPi(g)bt. (13) Остается-доказать, что Qi^Ui. Рассмотрим подпространство £*=:/?< (/)««.($,). В силу (13) Ei=Pi(f)*t-bt(Pi(f)bt(Qi)) = {0}t Qi<=KeTpi(f)at=Oi. •
§ 124. Вторая нормальная форма матрицы над полем 355 § 124. Вторая нормальная форма матрицы над полем Пусть Л— квадратная матрица порядка п над полем Р, **(*), t=l, 2, ... , т— (1) система элементарных делителей характеристической матрицы хЕ—А9 B=diag[i4b Л2, ... , Ат]у где для г=1, 2,..., т А\ — матрица, сопровождающая полином е{(х). Так как порядок клетки Л* равен степени полинома е\{х), то порядок матрицы В равен сумме степеней полиномов (1), т. е. степени их произведения. Это произведение совпадает с характеристическим полиномом матрицы А и имеет поэтому степень п. Итак, В — матрица порядка п. Теорема. Матрицы А и В подобны. '♦ Вычислим систему элементарных делителей матрицы хЕ-В: хЕ—B=diag [xEni—Au хЕП2—А2у..., хЕПт—Ат], где П{ — степень полинома в{(х). Клетка хЕщ—А{ имеет единственный элементарный делитель — полином ег(*), так как ее инвариантные множители 1,,.., 1, ei{x). Поэтому (1) — система элементарных делителей матрицы хЕ—В. Матрицы хЕ—А и хЕ—В имеют совпадающие системы элементарных делителей, следовательно, матрицы А и В подобны. # ' Матрица В называется второй нормальной формой матрицы А. Так же, как и первая нормальная форма, это квазидйаго- нальная матрица, диагональные клетки которой сопровождают определенную систему полиномов (в частности, возможна лишь одна клетка). Отличие от первой нормальной формы матрицы А в том, что клетки первой нормальной формы этой матрицы сопровождают инвариантные множители матрицы хЕ—Л, причем последовательность клеток определена, клетки же второй нормальной формы матрицы А сопровождают элементарные делители матрицы хЕ—Л, причем последовательность клеток произвольна. Вторая нормальная форма матрицы определена с точностью до порядка расположения клеток на диагонали. Инвариантные множители полиномиальной матрицы не зависят от того поля, которому принадлежат коэффициенты составляющих ее полиномов. Элементарные же делители матрицы
356 Глава 12. Подобие матриц над полем. Нормальные формы матрицы могут изменяться при расширении (сужении) основного поля, поэтому и вторая нормальная форма матрицы может изменяться при расширении (сужении) основного поля. Так как для всякой квадратной матрицы существует вторая нормальная форма, то верно Следствие. Для любого эндоморфизма f пространства Рп существует базис этого пространства, в котором матрица эндоморфизма f имеет вторую нормальную форму. Пример. Найти вторую нормальную форму матрицы ГЗ -1 01 1=16 —3 2 I [_8 -.6 5 J над полями вещественных и комплексных чисел. Решение. [jt-3 1 ОТ -6 л+3 -2 . -8 б х-5 J Вычислим систему </»(*}, /=1, 2, 3, наибольших общих делителей миноров матрицы хЕ—А. Очевидно, </з(*) = поэтому di(*)«A(*) = l, = (*-!) (ха-4*+5), *-3 1 0 -6 *+3 -2 -8 6 х-5 4 fiW=/iW = l, fs(x) = (x-\)(x*-4x+b)- система инвариантных множителей матрицы хЕ—А. Над полем вещественных чисел эта матрица имеет два элементарных делителя — х—1, х2—4*+5, поэтому 0 -5 diagtl. [{ J,- вторая нормальная форма матрицы А над полем вещественных чисел. Над полем комплексных чисел матрица хЕ—А имеет три элементарных делителя — jc—1, а;—2—1, *—2+1, поэтому diag [1, 2+i, 2—i] есть вторая нормальная форма матрицы А над полем комплексных чисел. В общем случае вторую нормальную форму матрицы найти трудно, так как для решения этой задачи следует разложить произвольный полином на неприводимые над основным полем множители. Однако для решения многих эопросов вторая нормальная форма матрицы является весьма удобной.
§ 125. Критерий диагонализируемости матрицы над полем 357 § 125. Критерий диагонализируемости матрицы над полем Квадратная матрица над полем называется диагонализируе- Mout если она подобна над этим полем некоторой диагональной матрице. Теорема. Квадратная матрица над полем Р диагоналщируема тогда и лишь тогда, когда ее минимальный полином разлагается над полем Р на линейные множители и не имеет кратных корней, + Пусть минимальный полином т(х) матрицы А удовлетворяет условию теоремы. Покажем, что вторая нормальная форма матрицы А диагональна. В нашем случае т(х) = (х—ai) (*— a2) ... (х— a*)> где a;, t=l, 2, ... , ky—попарно различные элементы поля Р. Так как полином т(х) является последним инвариантным множителем матрицы хЕ—А и, следовательно, делится на каждый инвариантный множитель этой матрицы, то все ее элементарные делители имеют вид х— аг\ Следовательно, все клетки второй нормальной формы матрицы А — первого порядка, т. е. эта форма диагональна. ' Обратно, пусть матрица А подобна над полем Р некоторой диагональной матрице 5=diag [аь a2, ... , an]. Минимальный полином клетки а* совпадает с дс—а*. Минимальный полином матрицы В равен наименьшему общему кратному полиномов *—a*f t=l, 2, ... , /г, (1) т. е. произведению всех различных полиномов (1). Минимальный полином матрицы А совпадает с минимальным полиномом матрицы В и имеет, следовательно, в поле Р столько корней, какова его степень, и среди них нет кратных. # § 126. Жорданова нормальная форма матрицы Пусть a — произвольный элемент поля Р. Рассмотрим квадратную матрицу ^а 0 0 ... О О' 1 а 0 ... О О О 1 а ... О О О 0 0 * .*. / i a
358 Глава 12. Подобие матриц над полем. Нормальные формы матрицы порядка п. Обозначим ее символом /п(ос) и назовем клеткой Жордана. В частности, ГО 01 Г2 ° °1 Вычислим инвариантные множители и элементарные делители характеристической матрицы xE—Jn(a) = х—а 0 0 ... 0 0 —1 *—ее 0 ... О 0 0 -1 *-а ... О О О О О О —1 х—а (1) , /»; клетки Жордана. Вначале найдем систему di(x), i=l, 2, наибольших общих делителей ее миноров. Очевидно, dn (х) — det (xE—Jn (a)) = (х—а)п. Далее рассмотрим минор М порядка л— 1 матрицы (1), остающийся после вычеркивания первой строки и последнего столбца: M=(-l)n-i; dn-t(x) = l9 di(x) = l t=l, 2,... , n—1. Таким образом, матрица (1) имеет лишь один непостоянный ин* вариантный множитель /»(*) = (*-«)» (2) и, следовательно, (2) — единственный элементарный делитель этой матрицы. • Квазидиагональная матрица B=diag [/ni(ai), /n2(a2), ... , /nm(am)], (3) на «диагонали» которой расположены клетки Жордана, называется жордановой матрицей. Например, diag[2,2,l], diag[[2 0].,],^ °], JJJ о]]- есть жордановы матрицы.
§ 126. Жорданова нормальная форма матрицы' ч 369 Найдем систему элементарных делителей характеристической матрицы diag [xEni—Jni (at), ..., хЕПт—1Пт{ат) ] (4) жордановой матрицы (3). Так как жорданова клетка (1) имеет единственный элементарный делитель (2) (следствие из теоремы 2 § 116), то элементарные делители матрицы (4) — полиномы (x-ai)ni - (б) и только они. \ Так как системой элементарных делителей матрицы хЕ—А матрица А определяется с точностью до подобия, то верна Теорема 1. Жордановы матрицы тогда и лишь тогда подобны, когда они различаются не больше, чем порядком расположения клеток Жордана на «диагонали». . Если А — произвольная квадратная матрица, а В — жорданова матрица, подобная матрице Л, то матрицу В называют жордановой нормальной формой матрицы А. Теорема 2. Пусть А^Рп. В множестве Рп существует жорданова нормальная форма матрицы А тогда и лишь тогдаг когда характеристический полином матрицы А разлагается над полем Р в произведение линейных множителей. Жорданова нормальная форма матрицы А определена с точностью до порядка следования диагональных клеток Жордана. ф Очевидно, на «диагонали» матрицы Жордана расположены корни ее характеристического полинома. Характеристические полиномы подобных матриц равны, поэтому необходимым условием существования над полем Р жордановой нормальной формы матрицы А является принадлежность этому полю всех корней характеристического полинома матрицы А. Это же условие и достаточно. В самом деле, произведение инвариантных множителей матрицы хЕ—А равно характеристическому полиному c(x)f поэтому всякий неприводимый над полем Р делитель непостоянного инвариантного множителя матрицы хЕ—А имеет первую степень. Следовательно, все элементарные делители этой матрицы имеют вид (*—а)'. Пусть (5) —система элементарных делителей матрицы хЕ—А. Произведение всех полиномов (5) равно с(х), поэтому Л1+Я2+...+я/=я. Напишем жорданову матрицу В вида (3). В —матрица порядка п, (5) —система элементарных делителей ее характеристической матрицы. Следовательно, матрицы А и В подобны.
360 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Если С — другая жорданова нормальная форма матрицы Л, то в силу теоремы 1 матрицы В и С различаются лишь последовательностью расположения клеток на «диагонали», ф В то время как первая и вторая нормальные формы матрицы существуют при любом основном поле, жорданова нормальная форма существует не всегда. В этом неудобство нормальной формы Жордана. Однако в тех случаях, когда она существует, эта форма облегчает вычисления. Поэтому в приложениях она применяется весьма часто. Из теоремы 2 и основной теоремы алгебры комплексных чисел вытекают два следствия. Следствие 1. Для всякой квадратной матрицы над полем комплексных чисел существует жорданова нормальная форма. Следствие 2. Для всякого эндоморфизма f пространства Сп над полем С комплексных чисел существует базис пространства, в котором f имеет жорданову матрицу. Пример. Найти жорданову нормальную форму матрицы ГЗ -2 I! Л= 2 -2 2 L3 -6 5J над полем вещественных чисел. Решение. 1, х—2, (х—2)2 — инвариантные множители матрицы хЕ—А (см. § 121), следовательно, х—% (х—2)2 — ее элементарные делители^ и жор-, данова нормальная форма матрицы А имеет вид Г2 01 diag[2, [i2]l § 127. Обобщенная жорданова нормальная форма матрицы над полем вещественных чисел Нас интересуют в первую очередь векторные пространства над полями вещественных и шкомплексных чисел. Над полем комплексных чисел всякая квадратная матрица подобна некоторой жордановой матрице. Над полем же вещественных чисел это не так, ибо существуют вещественные матрицы с комплексными корнями характеристического полинома. Для этих матриц есть другая нормальная форма, близкая к жордановой. Пусть x2+y*+6 — неприводимый над полем R полином, a+fk' и a—pi —его корни, а и р — вещественные числа, р>0. Рассмотрим матрицу
§ 127. Обобщенная жорданова нормальная форма матрицы 361 Л = а -р 1 0 0 0 0 0 р а 0 1 0 0 0 0 0 0 а -Р 1 0 0 0 0 0 р а 0 1 0 0 0 0 0 0 а -Р 0 0 0 . 0 . 0 . 0 . р • а . 0 . 0 . . 0 . 0 . 0 . 0 . 0 . 0 .. 1 .. 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 а -Р 0 0 0 0 0 0 р а порядка 2т. Эту матрицу можно записать в виде с Е 0 0 0.. С 0 . Е С . . 0 .. 0 .. 0 0 0 0 0 0 0 Е С (1) где клетка С= а р] -Р « J повторяется на «диагонали» т раз, а £ и 0 — единичная и нулевая матрицы второго порядка. Матрицу (1) назовем обобщенной клеткой Жордана и обозначим символом /ш(а; р). Например, АО; 2)= [ J j]> /2(0; 1) = 0 1 0 0 -10 0 0 10 0 1 0 1—10 Вычислим элементарные делители характеристической матрицы хЕ—А = х—а Р -1 о - -р о х—а 0 0 х—а -1 р 0 0 -Р х—а .. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ... —1 0 х— а —р 0 0 0 0 0 — 1 р *—а. (2)
36Я Рлава 12. Подобие матриц над полем. Нормальные формы матрицы обобщенной клетки Жордана. По теореме Лапласа х—а —р р д:—ot I = (х2+ух+6)т. det(*£-4) = = (*2—2а*+аЧ-р2)т= Если di(x), i=l, 2, ... , 2m,— система наибольших общих делителей миноров матрицы (2), то йш{х) =det(xE~A) = (*2+Y*+6)™. - Полином d2m~i(x) —делитель полинома йгт{х), поэтому либо d2m-l(*)=l, (3) либо d2m-i(x) делится на полином хг-\-ух-{-6, и, следовательно, a+pi — его корень. В последнем случае каждый минор порядка 2т—1 матрицы (2) должен был бы обращаться в нуль при x=a-\-$i. Возьмем минор g(x) матрицы (2), остающийся после вычеркивания ее первой строки и последнего столбца, и вычислим его значение при x=a+$i: g(a+P0 = р -1 0 0 0 0- р; 0 -1 0 0 0 0 Pi р -1 0 0 0 .. -р •• pi .. 0 .. 0 ;. 0 .. 0 0 0 0 . -1 0 0 0 0 0 0 0 0 0 0 pi -1 р (4) Определитель (4) имеет порядок 2т—1. На диагонали стоят числа р, 0, р, 0, ... , р. Параллельно диагонали под ней расположена полоса — 1, — 1,... ,,*—1, над диагональю расположены две полосы: р*\ ... , р/ и 0, —Р", 0, —р, ... , 0. Все остальные элементы равны нулю. Обозначим определитель порядка п вида (4) символом Ап и найдем для его вычисления рекуррентную формулу. Для этого разложим определитель (4) по элементам первой строки: Агт-i= 0 -1 0 0 0 pi р -1 0 0 -р pi 0 0 0 0 ... 0 0 .. -1 .. 0 0 0 0 0 0 0 0 pi -1 р р-
§ 127. Обобщенная жорданова нормальная форма матрицы 363 -1 0 0 0 0 Р» Р -1 0 0 -Р •• р* .. о .. 0 .. 0 .. 0 0 0 . -1 0 0 0 0 0 0 0 о р/ -1 р Р'- Из первой строки первого определителя вынесем за знак .определителя pt и затем разложим полученный определитель по элементам первого столбца. Тогда получим Дгт-1 = Р^А2т-3+Р^А2т-3=2pf Агт-З. (5) В силу формулы (5), так как Р^О, A2m-i^=0, если Ai^O. Но Ai=—р=т*=Ь. Таким образом, ^(а+РО^О и, следовательно, верно равенство (3). Из этого равенства следует, что di{x) = \ для i^2m—1. Таким образом, матрица (2) имеет единственный непостоянный инвариантный множитель (х2-\-ух~\-6)т, который, следовательно, и является ее единственным элементарным делителем. Квазидиагональную матрицу A=diag [Аи А2, ... , А{\, каждая «диагональная» клетка М которой есть клетка Жордана или обобщенная клетка Жордана, назовем обобщенной жордано- вой матрицей. В частности, может быть 1=1. Характеристическая матрица хЕ—i4=diag [хЕП1—Аи ..., хЕП1—А{[ обобщенной жордановой матрицы имеет / элементарных делителей: ei{x), i=I, 2, , /, полином ei(x) —элементарный делитель клетки хЕп.— Ai. Если Л*=/Я<(а), то ej(x) = (дг— a)mi. Если же Л;==/т(а;Р), ТО где a+pt и a—pi — корни полинома jc2+y*+6.
364 Глава 12. Подобие матриц над полем. Нормальные формы матрицы Например, если A = diag[0, [,"]]. то ei(х) =х, е2{х) = (х-(l+l)) (x-(l-i)) =х>+2х+2. Так как системой элементарных делителей матрицы хЕ—А матрица А определяется до подобия, то верна Теорема 1. Обобщенные жордановы матрицы тогда и лишь тогда подобны, когда они различаются не больше, чем порядком следования «диагональных», клеток (жордановых или обобщенных жордановых). Обобщенную жорданову матрицу, подобную матрице Л, назовем обобщенной жордановой нормальной формой матрицы А. Теорема 2. Всякая квадратная матрица А над полем веще- ственных чисел подобна некоторой обобщенной жордановой матрице. Обобщенная жорданова нормальная форма матрицы определена однозначно с точностью до порядка следования «диагональных» клеток. ф Пусть А — квадратная матрица над полем /?, Pi (*)">> /=1,2, ...,/,- (6) система элементарных делителей характеристической матрицы хЕ—А (над полем /?). Так как каждый из полиномов pj(x) неприводим над /?, то pj(x)=X—(Xj или Pj(*)=*2+Yi*+6i- В первом случае положим а во втором — Aj=Jn .{<X}\ Pj), где otj+iPj и aj—t'Pj — корни полинома pj(x)9 Pj>0.
§ 127. Обобщенная Жорданова Нормальная форма матрицы 365 Рассмотрим обобщенную жорданову матрицу B=diag[Au Л2, ... , А{\. Порядок ее равен степени произведения (6), т. е. порядку матрицы Л. (6) —система элементарных делителей матрицы хЕ—Ву следовательно, матрицы А и В подобны. Далее теорема 1. # Пример. Найти обобщенную жо]рданову нормальную форму матрицы ГЗ -1 О"! Л= 6 -3 2 . L8 -6 5 J Решение. Элементарные делители матрицы хЕ—А над полем R таковы: х— 1, х2—4х+5=[*—(2+/)][*— (2—i)] (см. § 124). Искомая нормальная форма имеет вид diagt,,[J J]], Ниже используется следующая Теорема 3. Для любого эндоморфизма f пространства Rn над полем R вещественных чисел, п>0, в Rn существует одно- или двумерное инвариантное относительно f подпространство. ф Если характеристический полином с(х) эндоморфизма / имеет хотя бы один вещественный корень, то, как отмечалось в § 111, в пространстве Rn есть одномерное инвариантное относительно этого эндоморфизма подпространство. Если же полином с(х) не имеет вещественных корней, то выберем тот базис йи U2, ... , йп пространства Rn, в котором матрица эндоморфизма / — обобщенная жорданова. Тогда, очевидно; Ь(йп-и йп)— двумерное инвариантное относительно эндоморфизма / подпространство, ф
366 Глава 13. Билинейные и квадратичные формы Глава 13 БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ § 128. Линейные преобразования переменных Пусть Р — произвольное поле, а Х\, #2> • • • > Хп — переменные. Переход от переменных (1) к переменным Уи Угу •.. , Уп с помощью формул • xt =exnyi +ai2t/2 +.. .+ашУп, ) Хг =a2if/i +OC22I/2 +•. .+a2nf/n, ^п=аП1У1+аП2У2+. ..+annf/n, ) (1) (2) (3) где ац — произвольные элементы поля Р9 называется линейным преобразованием переменных над полем Р\ матрица А = оси ai2 0&21 0&22 (tin 0t2n LOCni 0СП2 dnn . [~*i x2 L %n _ =x> У1 "1 Уг Lf/n J называется матрицей линейного преобразования переменных (3). Очевидно, если ' = Y9 то система равенств (3) равносильна матричному равенству X=AY. (4) Рассмотрим последовательное применение двух линейных преобразований переменных. Пусть переменные (1) преобразуются в переменные (2) по формуле (4), а переменные (2) —
§ 128. Линейные преобразования переменных 367 в переменные Zl, Z2, • • • » Zn (5) по формуле Y=BZ9 (6) где В — квадратная матрица порядка /г,- Г zi "1 L Zn _1 Из формул (6) и (4) получим ~ ' X=A(BZ) = (AB)Z. (7) Итак, если переменные (1) линейно выражаются через переменные (2), а последние линейно выражаются через переменные (5), то существует линейное преобразование, выражающее переменные (1) через (5). Это преобразование определяется формулой (7) и.называется произведением линейных преобразований переменных (4) и (6). Очевидно, матрица произведения линейных преобразований переменных есть произведение матриц сомножителей. Так как линейное преобразование переменных определяется своей матрицей, то из ассоциативности умножения матриц вытекает ассоциативность умножения линейных преобразований переменных. Линейное преобразование переменных с невырожденной матрицей называется невырожденным. Если (4) — невырожденное преобразование, то можно выразить переменные (2) через (1): умножая слева обе части равенства (4) на матрицу Л"1, получим . Y=A-*X. (8) Преобразование (8) называется обратным преобразованию (4). Так как определитель произведения квадратных матриц равен произведению их определителей, а матрица произведения линейных преобразований переменных есть произведение матриц сомножителей, то произведение невырожденных линейных преобразований переменных есть невырожденное линейное преобразование переменных.
368 Глава 13. Билинейные и квадратичные формы § 129. Билинейные формы Полином F(xu х2, ... , хп\ Уи №, ... , Уп) (1) от двух систем переменных Хи Хг, ... , хп (2) и Уи У2, ... , Уп (3) называется билинейной формой порядка п, если каждое его слагаемое имеет первую степень относительно переменных (2) и относительно переменных '(3) отдельно. Краткая запись (1)—F(x\ у). Итак, билинейная форма F(x\ у) над полем Р от систем переменных (2) и (3) имеет вид F(*'f У)= 2 OLiiXtyjt CCij€=P. ' (4) г, j=l Матрица |осц ai2 •.. ain Ч а I #21 G&22 • • • 0&2П I LOtnl 0&п2 • • • ' ttnn J называется матрицей формы (4), а ранг этой матрицы — рангом формы (4). Легко проверить, перемножив соответствующие матрицы, что F(x; y)=X*AY. Пусть G(u\ v) — еще одна билинейная форма порядка п. Если G(u\ v) может быть получена из формы (4) в результате применения к каждой из систем переменных (2) и (3) одного и того же невырожденного линейного преобразования переменных над основным полем, то форма G(u\ v) называется конгруэнтной форме/7 (я;у). Например, билинейная форма G(uit и2\ 01, tf2)=Wit>i+4w2i>2 конгруэнтна билинейной форме F{*u х2\ у и У2)=Х1У1>+х2уг (5) над полем рациональных чисел, ибо положив в (5) xi = uit yi = vu х2=2и2, y2 = 2v2t получим F(x\ y)*=G(u; v).
§ 129. Билинейные формы 369 Очевидны следующие утверждения. 1. Каждая билинейная форма конгруэнтна себе. 2. Если билинейная форма F(x; у) конгруэнтна билинейной форме G(u; v), то форма G(u; v) конгруэнтна форме F(x; у). 3. Если билинейная форма F(x; у) конгруэнтна билинейной форме G(u; v), а форма G(u; v) конгруэнтна билинейной форме H(z; w), то форма F(x; у) конгруэнтна форме H(z; w). Следовательно, конгруэнтность билинейных форм есть отношение эквивалентности на множестве всех билинейных форм порядка п над полем Р, и потому это множество разбивается на классы конгруэнтных форм. Основная задача теории билинейных форм — их классификация с точностью до конгруэнтности. Это значит, что требуется найти эффективный критерий конгруэнтности билинейных форм и построить полную систему представителей классов конгруэнтных форм, т. е. указать такой набор билинейных форм, в который входила бы точно одна форма из каждого класса конгруэнтных. Лемма. Пусть А=[ац], В=[$ц] —квадратные матрицы порядка п над полем Р. Если для любых п-членных столбцов X и Y над полем Р X*AY=^X*BY, то А=В. ф В качестве X возьмем столбец, k-и элемент которого равен 1, а остальные 0, в качестве Y — столбец, 1-я элемент которого равен 1, остальные 0. Тогда X*AY=aku X*BY^=$hl. Следовательно, aw=Pftz, К 1=1, 2, ... , п; А=В. ф Рассмотрим матрицы конгруэнтных билинейных форм. Пусть билинейная форАма G{u\ v) с матрицей В конгруэнтна форме (4), т. е. получается из (4) в результате применения невырожденного линейного преобразования переменных с матрицей С. Так как X=CU, Y=CV9 (6) то F{x\y)=X*AY={CUyA(CV) = W{&AC)V. Далее, так как преобразование (6) переводит форму F(x\ у) в форму G(u\ v), то W{C*AC)V=WBV. Согласно предыдущей лемме, В=СТАС.
370 Глава 13. Билинейные и квадратичные формы Итак, если системы переменных (2) и (3) билинейной формы с матрицей А подвергнуть линейному преобразованию с форму- лами (6), то эта форма превратится в билинейную форму от сие- тем переменных ии и2, *.. , ип\ vir vit... , vn (7) с матрицей CMC. Обратно. Пусть F(x; y)=X*AYt G{u\ v)=U*BV— (8) билинейные формы от систем переменных (2) и (3) и (7) соответственно. Пусть, далее, Я=СМС, (9) где С — невырожденная матрица порядка п над основным полем. Тогда формы F(x; у) и G(u; v) конгруэнтны. Действительно; применив к переменным (2) и (3) линейное преобразование (^формулами (6), переведем форму ^(л:; у) в форму G(u\ v). Итак, доказана Теорема 1. Билинейные формы (8) конгруэнтны тогда и лишь тогда, когда их матрицы А и В связаны соотношением (9), где С — невырожденная матрица над основным полем. Очевидно Следствие. Ранги конгруэнтных билинейных форм равны. Билинейная форма называется симметрической, если ее матрица Л симметрическая, т. е. АТ=А. Теорема 2. Если билинейная форма F является симметриче: ской, то и всякая конгруэнтная ей форма также симметрическая. ф Пусть А — матрица билинейной формы F. Тогда АТ=А. Матрица любой конгруэнтной формы G имеет вид CMC. Далее, (СТАС) т=СМТ (Ст) Т=СМС. Следовательно, форма G является симметрической. #. Далее в этой книге рассматриваются только симметрические билинейные формы. При этом характеристика основного поля предполагается отличной от 2.* * Читатель, не знакомый с понятием характеристики поля, может считать, что основное поле является числовым, т. е. подполем поля комплексных чисел.
§ 130. Квадратичные формы 371 § 130. Квадратичные формы Пусть Р — произвольное поле, характеристика которого отлична от 2. Квадратичной формой от п переменных Xl> *2, • • • , Хп (1) над полем Р называется полином от этих переменных с коэффициентами из поля Р, каждое слагаемое которого второй степени. Каждая квадратичная форма от переменных (1) может быть записана в следующем'симметричном виде: у п F(x) =F(xu х2,..., хп) = jj aijXiXj= = aiiXi2-bai2#i#2+. •'•"b<Xin#i#n+ 4 + a21#2*i + 0&22#22+- . • + a2n*2«*:n + + ani*n*i+an2*n*2+. • • + 0Cnn^n2, (2) где все коэффициенты удовлетворяют условию aij=a,ji. (3). (Если в первоначальной записи квадратичной формы коэффициенты при XiXj и XjXi различны, то можно сложить их и, разделив сумму на 2, получить равные. Например, для квадратичной формы „. " F=Xi2+2xiX2 такой записью является F = Xi2+XiX2+X2Xi.) Матрица ■Л = [ац]9 i, /=1, 2, ... , п, называется матрицей формы (2), а ранг матрицы А—рангом формы (2). В силу равенства (3) матрица квадратичной формы симметрическая. Очевидно, .F(x)=X*AX. (4) Две квадратичные формы от одного и того же количества переменных называются конгруэнтными, если одна из них превращается в другую в результате применения к входящим в нее
372 Глава 13. Билинейные и квадратичные формы переменным невырожденного линейного преобразования над основным полем. Билинейная форма F(x;y)=X*AY9 имеющая ту же матрицу, что и квадратичная форма (4), называется полярной для формы (4). Если в полярной билинейной форме отождествить обе системы переменных, то получится исходная квадратичная форма. Очевидно, в результате применения линейного преобразования переменных матрица квадратичной формы меняется так же, как и матрица полярной билинейной формы. Поэтому верны следующие утверждения: 1. Если систему переменных (1) квадратичной формы (4) подвергнуть линейному преобразованию по формуле X=CZ, то получится квадратичная форма от переменных Zl, 22, . . . , 2Л с матрицей СТАС. 2. Квадратичные формы F(x)=X*AX и G(z)=Z*BZ от одного и того же количества переменных конгруэнтны тогда и только тогда, когда их матрицы А и В связаны соотношением В=СТАС, где С — невырожденная матрица над основным полем. 3. Ранги конгруэнтных квадратичных форм равны'. § 131. Диагональные билинейные и квадратичные формы Билинейная или квадратичная форма называется диагональной, если ее матрица диагональна. Теорема. Всякая квадратичная форма конгруэнтна над основным полем некоторой диагональной квадратичной форме. ф Пусть п F(x)= ]£ atjXiXj— (l) i, j=l квадратичная форма над полем Р. Покажем, что посредством невырожденного линейного преобразования переменных над этим полем она может быть приведена к диагональному виду. Если п=1, то форма (1) диагональна. Пусть /г>1. Будем считать утверждение теоремы верным для квадратичных форм от мень-
§ 131. Диагональные билинейные и квадратичные формы 373 шего, чем л, количества переменных. Рассмотрим отдельно три случая: 1) все коэффициенты формы (1) равны нулю; 2) среди коэффициентов аи есть отличный от нуля; 3) среди коэффициентов формы есть отличный от нуля, но все au=0. В первом случае (1) —нулевая форма, она диагональна. Рассмотрим второй случай. Пусть, например, ацфО. Тогда п air1(anA:i+ai2^2+- • .+ain*n)2=aiiXi2+2 J£ aaXiXi+A, (2) i=2 где буквой А обозначена сумма слагаемых, не зависящих от Хь Сравнивая (1) и (2)>получим F(x)=airi(aiiXi+ai2X2+....+ )2+G(x2,...iXn), где G(x2f ... , хп)—квадратичная форма от я— 1 переменных #2, ... , хп» По индуктивному предположению существует линейное невырожденное преобразование переменных #i = Pi2#2+. • . + Ргп#п, 1 — 2, . . . , Я, приводящее эту форму к диагональному виду. Преобразование f/i = CCii#l-|-ai2#2-|-"» • • + 0tin^n, f/i = Pi2*2+. • .+Pin#n, 1 = 2, . . . , П, также является невырожденным, ибо определитель его матрицы otu ai2 О р22 ain Ргп О Р п2 Рп =апЫ[$цУФ0. Применив это преобразование к переменным формы F(x), получим ее диагональный вид: air1t/i2+Y2f/22+.. .+Ynf/n2. Для второго случая теорема доказана. Рассмотрим третий случай. Пусть, например, а^^О. Рассмотрим линейное преобразование переменных Xi=yu i=3, ... , п. (3)
374 Глава 13. Билинейные и квадратичные формы Определитель матрицы преобразования (3) 1 1 0 1 0 . -1 0 . .01. .. 0 .. 0 .. 0 о о о 1 1 1 1 -1 = -2ф0. Применив это преобразование к переменным формы i7(it), получим F(x)=2ai2yi2+... (4) Правая часть равенства (4) — квадратичная форма, рассмотренная в случае 2. С помощью некоторого невырожденного линейного преобразования переменных эта форма приводится к диагональному виду. Так как произведение невырожденных линейных преобразований переменных есть невырожденное линейное преобразование переменных, то аналогичное утверждение верно для формы (1). ф Учитывая закон изменения матрицы квадратичной формы при линейном преобразовании переменных и тот факт, что любая симметрическая матрица, есть матрица квадратичной формы*... получаем Следствие 1. Для всякой симметрической матрицы А из Рп существует в Рп такая невырожденная матрица С, что СТАС — диагональная матрица. Так как матрица квадратичной формы и матрица полярной ей билинейной формы при линейном преобразовании переменных изменяются одинаково, то верно Следствие 2. Всякая симметрическая билинейная форма конгруэнтна над основным полем некоторой диагональной билинейной форме. Пример. Привести посредством невырожденного линейного преобразования переменных над полем вещественных чисел к диагональному виду билинейную форму 11111 F(xlt x2t Xz\ У и 1/2, Уз) = —Х1У2+ — ХгУз+ — х*у2+ — х1у*+ — Хзу1. Решение. Рассмотрим квадратичную форму F(X) =*i*2+*2*3+*3*l,
; $ 132. Нормальный вид квадратичной и симметрической билинейной форм 375 для которой данная форма является полярной. Положим Xt = Zl+Z2, X2 = Zi—Z2, Хз=г$. Тогда F(x) ±=2i2-z22'+2ziz3=: (21+г3)2-222-гз2=М12-м22-Из2, где 1 1 «i=Zi+Z3= —Xi+ — X2+X3t 1 ' 1 "2 = 22= -T-*i Г~~*2» 2 2 Us = Zs = X$. Невырожденное линейное преобразование двух систем переменных 11 11 «1 = — X1+ — Х2+Хз, Vi=—-yi+—- У2+УЗ, Z Z Z Z 11' 11 UZ=—Xi— —~*2, ^2="— У I— — |/2, 2 2 2 2 "s=*s, Уз = 1/3 приведёт билинейную форму F(^; у) к виду ^(*; i/)=«iVi'+"2V2—ад>3. § 132. Нормальный вид квадратичной и симметрической билинейной форм над полем комплексных чисел Пусть F(x)—квадратичная форма над полем комплексных чисел, a aif/i2+a2i/22+- • -+<х>пУп2 — конгруэнтная ей диагональная форма. . Рассмотрим линейное преобразование переменных, определяемое формулами Zi=faiyi9 тФО, Zj=yh aj=0. Очевидно, это невырожденное преобразование. Применив его к форме F(x)f приведем ее к виду eiZi2+e2Z22+'. .+enZnzt ei=l или ег=0. Последнюю форму называют нормальной. Соответственно диагональную билинейную форму называют нормальной, если все диагональные элементы ее матрицы равны 1 или 0. Итак, доказана
376 Глава 13. Билинейные и квадратичные формы Теорема 1. Всякая квадратичная (симметрическая билинейная) форма над полем комплексных чисел конгруэнтна некоторой нормальной квадратичной (билинейной) форме. При этом число единиц на диагонали матрицы соответствующей нормальной формы равно рангу исходной формы, так что нормальная форма определена однозначно до наименования переменных. Отсюда вытекает критерий конгруэнтности квадратичных (симметрических билинейных) форм: Следствие 1. Квадратичные (симметрические билинейные) форумы над полем комплексных чисел конгруэнтны тогда и только тогда, когда равны их ранги. ф Необходимость условия теоремы доказана в § 129, 130. Достаточность следует из того, что в этом случае обе формы приводятся к одному и тому же нормальному виду, ф В терминах матриц справедлив аналог теоремы 1: Следствие 2. Для всякой комплексной (т. е. над полем комплексных чисел) симметрической матрицы А существует такая комплексная невырожденная матрица С, что CMC=diag [1, ... , 1, 0, ... ,0]. § 133. Нормальный вид квадратичной и симметрической билинейной форм над полем вещественных чисел Пусть F(x) —вещественная квадратичная форма, т. е. квадратичная форма с вещественными коэффициентами, a ai*/i2+ +**2#22+.. .+an{/n2 — конгруэнтная ей диагональная форма. Применив к этой форме вещественное невырожденное линейное преобразование переменных Zi=i~aiyu если аг>0; 2j=y — ajr/j, если aj<0; [ zk=tjk, если аь=0, j приведем ее к виду eiZi2+e2322-b . .+enZn\ ej=l, -1, 0. (1)
§ 133. Нормальный вид квадратичной и симметрической билинейной форм 377 Квадратичная форма (1), а также билинейная форма, ей полярная, называются вещественными нормальными формами. Доказана Теорема 1. Всякая квадратичная (симметрическая билинейная) форма над полем вещественных чисел конгруэнтна некоторой нормальной квадратичной (билинейной) форме. Число ненулевых коэффициентов в нормальном виде формы F(x), т. е. в конгруэнтной ей нормальной форме, не зависит от выбора невырожденного линейного преобразования, приводящего ее к нормальному виду — оно равно рангу этой формы. Покажем, что число положительных и число отрицательных квадратов также являются инвариантами формы, т. е. что ее нормальный зид определен однозначно с точностью до наименования переменных. Теорема 2 (закон инерции вещественных квадратичных и симметрических билинейных форм). Количество положительных и количество отрицательных коэффициентов в нормальном виде вещественной квадратичной (Симметрической билинейной) формы не зависят от выбора невырожденного линейного преобразования переменных, приводящего эту форму к нормальному виду. ф Пусть невырожденное линейное преобразование переменных yi=auXi+a*2*2+.. .+a*n*n, t=l, 2, ... , n, приводит квадратичную форму F(x) к нормальному виду У\+.,.+У\-у\+~...-У\, (2) а невырожденное линейное преобразование переменных *i«=Pii*i + P<2*2+. . . + Pin*n, 1=1, 2, . . . , П, (3). приводит форму F(x) к виду **+...+2'-^-...-г*. (4) Теорема будет доказана, если доказать равенство s=t. (5) Предположим, что s<t, ' (6)
378 Глава 13. Билинейные и квадратичные формы и рассмотрим систему линейных уравнений aii*i+oti2*24~- • .+ain*n=0, \ P*+l i*i+P*+l 2*2+. —+P*+i n#n = 0, Pnl*i+Pn2#2+. • . + Pnn^n=0. J (7) Она содержит n—t+s<n линейных однородных уравнений с п неизвестными и потому имеет ненулевые решения. Пусть (7ь V2, ... , Уп)— (8) одно из них. Вычислим F(yif у2, ... , Yn). Из (4), учитывая, что п Zj(Yl Т2, ..., Yn) = JS PiiYx=0, /=/+1,..., n, ((8) — решение системы (7)), получим ^(Ть у*..., Уп) = (jg Mi )V.. •+ (J/ Mi)'. (9) В правой части равенства (9) (i;piiYi)2^o. Из (9) следует поэтому, что F(yu Y2, ... ,Yn)>0. (10> Диалогично из (2), учитывая,что п Уз(Уи Y2, • • * > Yn) = JS ajiYi=0, /= 1, 2,..., st t=i получим F(yu Y2, ... , Yn)^0. (11) Сопоставляя неравенства (10) и (11), имеем F(yu Y2, ... , Yn)=0.
§134. Знакоопределенные вещественные квадратичные и билинейные формы 379 Теперь из равенства (9) следует, что равна нулю каждая сумма отдельно. Итак, PjiYi+P;2Y2+. - .+PjnYn=0, /=l, 2, ... , t. (12) Для /=f+l, ... , п равенство (12) также верно, ибо (8) —решение системы (7). Итак, (8)—ненулевое решение системы уравнений Pil*l + Pt2*2+. • . + P*n*n = 0, 1=1, 2, . . . , Я. Матрицей этой системы служит невырожденная матрица преобразования (3), поэтому эта система не имеет ненулевых решений. Полученное противоречие доказывает, что неравенство (6) невозможно. По аналогичным причинам невозможно неравенство t<s. Следовательно, верно равенство (5). ф Разность между числом положительных и числом отрицательных коэффициентов в нормальном виде вещественной квадратичной (симметрической билинейной) формы называется ее сигнатурой. Если заданы ранг формы и сигнатура, то количество положительных и количество отрицательных коэффициентовv в нормальном виде этой формы можно определить. Поэтому из закона инерции вытекает следующий критерий конгруэнтности форм. Следствие 1. Совпадение рангов и равенство сигнатур является необходимым и достаточным условием конгруэнтности квадратичных (симметрических билинейных) форм над полем вещественных чисел. Очевидно Следствие 2. Для всякой вещественной симметрической матрицы А существует такая вещественная невырожденная матрица С, что С7АС— диагональная матрица, на диагонали которой расположены числа 1,-1 или 0. Количество положительных и отрицательных элементов на диагонали матрицы СТАС не зависит от выбора подходящей матрицы С. § 134. Знакоопределенные вещественные квадратичные и билинейные формы Пусть у F(xu x2y ... , хпу— (1) квадратичная форма над полем вещественных чисел и переменные хь-хъ ... , хп (2)
380 Глава 13. Билинейные и квадратичные формы принимают лишь вещественные значения. Тогда при любом наборе значений переменных (2) форма (1) —вещественное число. Форму (1) называют положительно определенной, если для любых значений pi» Рг, . .. i Рп (3) переменных (2), среди которых хотя бы одно отлично от нуля, /ЧРь р2, ... , рп)>0. Аналогично форму (1) называют отрицательно определенной, если для любых значений (3) переменных (2), среди которых хотя бы одно отлично от нуля, /ЧРЬ Р2, ... , Рп)<0. Например, форма F(xu x2)=*i2+*22 является, очевидно, положительно определенной. Формы же G(xu х2) =*12-**2, Н(хи хг) =*i2 не являются положительно определенными, так как G(0, 1)= —1, #(0, 1)=0. Симметрическая билинейная форма называется положительно определенной, если она полярна положительно определенной квадратичной форме. Теорема 1. Если квадратичная (симметрическая билинейная) форма является положительно определенной, то положительно определенны все формы, ей конгруэнтные. ♦ Пусть (1) и G(yu У2, ... , Уп) — (4) конгруэнтные квадратичные формы. Это значит, что F(xu *2, ... , xn)=G(yu у2, ... , Уп), (5) где 0<=Y«*i+'Yfc*2+. V+Y<n*n, l= 1, ... , п, detlYiil^O. Если форма (4) не является положительно определенной, то существует такой набор (3) вещественных чисел, что хотя бы одно из них не равно нулю и G(Pi, р2, ... , рп)^0.
§ 134. Знакоопределенные вещественные квадратичные и билинейные формы 381 Система уравнений Yii*i+Yi2*2+. . .+yinXn = $U '=1,2, . . . , Л, имеет ненулевое решение (6i, 62, ... , бп). В силу равенства (5) F(6U б2, ... , 6n)=G(pi, р2, ... , М^О, т. е. форма (1) не является положительно определенной. Для квадратичных форм теорема доказана, поэтому она верна и для симметрических билинейных форм, ф Найдем нормальный вид знакоопределенных форм. Если форма (1) имеет нормальный вид У12+У22+...+Уп2, (6) то она является положительно определенной, так как, очевидно, (б) — положительно определенная форма. Если же нормальный вид G=eif/i2+e2y22+.. .+en#n2 (7) квадратичной формы (1) отличен от (6), то она не есть положительно определенная, так как в этом случае форма (7) не является положительно определенной. В самом деле, пусть, для определенности, ei=/M (т. е. ei= — 1 или ei = 0). Положим Pi=l, p2 = ... = Pn = 0. Тогда « О(Рь Р* ... , Pn)^0. Итак, доказана Теорема 2. Квадратичная (симметрическая билинейная) форма является положительно определенной тогда и лишь тогда, когда ее нормальный вид имеет единичную матрицу. ,Опишем теперь эффективный способ распознавания положительной определенности квадратичной и симметрической билинейной форм без приведения их к нормальному виду. Прежде докажем одну лемму и введем определение. Лемма. Знак определителя матрицы вещественной квадратичной формы не меняется при применении к этой*форме невырожденного линейного преобразования переменных.
382 Глава 13. Билинейные и квадратичные формы ф Если А и В — матрицы конгруэнтных квадратичных форм, то В=СТА С, det Сф 0. Далее det B= (det С*) (det Л) (det С) = (det C)*(deU), (detC)2>0. • Следствие 1. Определитель матрицы положительно определенной квадратичной формы — положительное число. ♦ Нормальный вид такой формы имеет единичную матрицу. # Пусть А = [ац], U /=1,2, ... , гс- квадратная матрица., Назовем угловыми минорами матрицы А все ее миноры, расположенные в левом верхнем углу: |0СЦ «12 1 . , - ,... det Д. 0&21 С&22 I Теорема 3 (критерий положительной определённости). Вещественная квадратичная (симметрическая билинейная) форма является положительно определенной тогда и только тогда, когда положительны все угловые миноры ее матрицы. ф Достаточно доказать эту теорему для квадратичных форм, Пусть F(x)= JZ aijXiXj— (8) вещественная квадратичная форма, Л —ее матрица. Если п=1, то форма (8) имеет вид F(x)=anx^ и является положительно .определенной \ только при условии ац>0. an — единственный угловой минор матрицы формы, так что'для/1=1 теорема верна. Воспользуемся индукцией по п. Положим п>\ и будем считать утверждение теоремы верным для форм от меньшего, чем /г, количества переменных. Квадратичную форму (8) запишем в виде п—1 п—1 Г \Х) === ^j GLijXiXj-\-Z ^f OLin%iXn'i OLnn%n • \У/ г, j=i г=1 Положим n-1 2J ацХ{Х}=0(хи *2, ... , *n-i). (10)
§ 134. Знакоопределенные вещественные квадратичные и билинейные формы 383 Это квадратичная форма от ft—1 переменных, матрица В которой получается из матрицы А после вычеркивания ее последних строки и столбца. Докажем сейчас необходимость "условия теоремы. Пусть (8) — положительно определенная квадратичная форма. Легко видеть, что тогда и форма (10) является положительно определенной. Если бы это было не так, то существовал бы такой набор Pi, Рг, ... , Pn-i вещественных чисел, среди которых хотя бы одно не равно нулю, что G(pi, р2, ... , Pn-i)<0. Из формулы (9) тогда следовало бы F($u Р2,..., pn-i, 0) =G(pb р2,... , p„-i) <0, что противоречит положительной определенности формы (8). Итак, по индуктивному предположению все угловые миноры матрицы В положительны. По предыдущему следствию также сМЛ^О. Доказана положительность всех -угловых миноров матрицы Л. Перейдем к доказательству достаточности. Пусть все угловые миноры матрицы А положительны. Тогда положительны, в частности, все угловые миноры матрицы В и по индуктивному предположению (10) —положительно определенная квадратичная форма. Существует линейное невырожденное преобразование переменных yi = Pii^i+Pi2^2+. . . + Pin-i*n-i, 1=1, 2, . . . , П—1, приводящее эту форму к нормальному виду yi*+y#+.. .+f/2n-i. Преобразование У г =Рг1*1 + Рг2#2+. • .+Pzn-i#n-i, 1=1, 2, . . . , ft— l, Уп==Хп также является невырожденным. Применив его к форме (9), получим F(X) = 5 #i2+2 ^УгпУгУп+ЧппУп2. (11) г=1 г=1 Рассмотрим линейное преобразование переменных с формулами *г =У1+УгпУпу 1=1, 2, . . . , ft—1, ^п===Уп'
384 Глава 13. Билинейные и квадратичные формы Очевидно, оно невырожденное. Применив его к форме (11), получим F(x)= 3s'*<2+e*»2'— (12) диагональный вид формы F(x). Определитель матрицы квадратичной формы, стоящей в правой части равенства (12), равен 6. В силу леммы он отличается от deti4 лишь положительным множителем. Так как detA>>0, то и 6>0 и (12) —положительно определенная квадратичная форма, ф Квадратичная форма F(x) является, очевидно, отрицательно определенной тогда и лишь тогда, когда положительно определенна форма — F(x). Матрицы этих двух форм отличаются друг от друга множителем — 1, поэтому их угловые миноры одинакового порядка равны, если их порядок четен, и различаются знаком, если они нечетного порядка. Следовательно, имеет место следующий критерий отрицательной определенности вещественных квадратичных (симметрических билинейных) форм. Следствие 2. Вещественная квадратичная (или симметрическая билинейная) форма является отрицательно определенной тогда й только тогда, когда все угловые миноры ее матрицы нечетного порядка отрицательны, а все угловые миноры четного порядка положительны. § 136. Условия разложимости вещественной и комплексной квадратичных форм Пусть F(xu х2у ... , хп) — (1) квадратичная форма над полем Р. Будем говорить, что эта форма разложима над Р, если ее можно представить в виде следующего произведения: F(x) = (at*i+.. .+anXn) (Pi*i+-. .+Pn*n), (2) Obi, $j^P- Найдем необходимые и достаточные условия разложимости квадратичной формы над полем вещественных и над полем комплексных чисел. Пусть форма (1) представляется в виде (2). Рассмотрим матрицу [CCi G&2 ... OLn Pi p2 • • • Pn J (3)
§ 135. Условия разложимости квадратичных форм т 385 Ранг этой матрицы не больше, чем 2. Если он равен нулю, то это — нулевая матрица и (1)—нулевая форма, ранг ее равен нулю. Пусть (1) —ненулевая форма, ранг матрицы (3) равен 1 и, для определенности, ai^O. Тогда из разложения (2) имеем Рассмотрим линейное преобразование переменных t/i=aiA:i+<X2*2+-. .+апхп, Уг=хи 1 = 2, ... , п. (4) (5) Определитель его матрицы ai аг О 1 a^ О О О 1 = at^=0, так что (5) — невырожденное преобразование. Применив его к форме (1), получим в силу формулы (4) F(x)=yyi2. Значит, ранг формы (1) равен 1. Пусть, наконец, ранг матрицы (3) равен 2 и пусть, для определенности, |ai a2'|^o. Рассмотрим линейное преобразование переменных, определяемое формулами: У1=оцХ1+а,2Х2+...+ #2 = 01*1 +02*2 +• • - + Pn*n, Уг=Хи 1 = 3, . . . , П. Это невырожденное преобразование, так как ФО. ai Pi 0 a2 Р2 0 a3 .. Рз • 1 . • ССп • • Ри .. 0 1 ai ~l Pi a2 Р2 0 0 0
386 Глава 13. Билинейные и квадратичные формы Применив его к форме (1), мы в силу формулы (4) получим Р{х)=У&ъ (6) Ранг формы (6) равен 2. Если Р — поле вещественных чисел, то, положив yi=zi+z2, y2=Zi—z2y Hi = zu i=3, ... , n, из (6) получим F{x)=z?-z2\ значит, сигнатура этой формы равна нулю. Мы доказали, таким образом, что если квадратичная форма разложима над полем Р, то ее ранг не больше, чем 2. Если при этом Р — поле вещественных чисел, а ранг формы равен 2, то ее сигнатура равна нулю. Пусть, обратно, ранг квадратичной формы (1) равен 1. С помощью подходящего невырожденного линейного преобразования переменных !Л=ааХ1+а&Хг+.. -+сыпхп, t=l, 2, ... , я, (7) приведем эту форму к диагональному виду /7(х)=рг/12=р(ацл:1+а12^2+- • .+ain*n)2. Итак, (1) —разложимая квадратичная форма. Пусть сейчас Р — поле комплексных или поле вещественных чисел, (1) —квадратичная'форма над Р, ранг которой равен 2 и, если Р — поле вещественных чисел, сигнатура равна нулю. С помощью подходящего невырожденного линейного преобразования переменных (7) приведем форму (1) к виду F{x) =У12—У22= (У1+У2) {Vi—Уг) = — (Yi*i+Y2*2+. . .+УпХп) (8l*i+62X2+:. . . + 6n*n). Значит, (1) —разложимая квадратичная форма. Очевидно, если ранг формы F(x) равен 0, то она также разложима: F(x) =0(ai*i+a2x2+. • .+an*n)2. Итак, доказана
§ 136. Эрмитово-сопряженная матрица 387 Теорема. Комплексная квадратичная форма разложима над полем комплексных чисел тогда и лишь тогда, когда ее ранг не больше, чем 2. Вещественная квадратичная форма разложима над полем вещественных чисел тогда и лишь тогда, когда ее ранг не больше, чем 2, и, если он равен 2, сигнатура равна 0. Следствие. Квадратичная форма от двух переменных над полем комплексных чисел всегда разложима. Квадратичная форма от двух переменных над полем вещественных чисел разложима тогда и лишь тогда, когда определитель ее матрицы неположителен. Доказательство очевидно, так как нормальный вид вещественной квадратичной формы ранга 2 t нулевой сигнатурой есть § 136. Эрмитово-сопряженная матрица Если f A=[v>jk], /=1,2, ...,m; Л=1, 2, ... , /г,— . (1) тХя-матрица над полем комплексных чисел, то наряду с транспонированной матрицей Ат рассматривают еще эрмитово-тран- спонированную матрицу А*. По определению, Л'*=[Ы, /=1,2,...,/г; £=1,2, ...,т- такая nX^-матрица, что где звездочка означает замену комплексного числа сопряженным числом: (а+Р0* = а~-Р*'> если а и f$ — вещественные числа. Верны следующие утверждения: 1. Если А и В — такие матрицы, чтв определено произведение АВ, то определено также и произведение В*А* и верно равенство В*А*=(АВ)*. 2. Если А и В — матрицы одинаковых размеров, то (Л+Я)*=Л*+Б*. 3. Если А—матрица, а X — комплексное число, то CKA)W= =К*А*.
388 Глава 13. Билинейные и квадратичные формы Доказательства этих утверждений аналогичны приведенным в § 31 доказательствам свойств операции транспонирования и оставляются читателю. Квадратная матрица Л над полем комплексных чисел называется эрмитовой, если А*=А. Очевидно, для эрмитовой матрицы А вида (1) • <Xjk = <X>h]t поэтому все диагональные элементы эрмитовой матрицы веще- ственны. Заметим еще, что определитель эрмитовой матрицы — веще- ственное число. ф В самом деле, пусть А — матрица вида (1). Перейти к матрице А* можно, последовательно выполнив две операции — транспонирование и замену каждого элемента матрицы сопряженным числом. Следовательно, det (Л*) = (det Л)*. Если А*=А9 то det A*==det Л, поэтому для эрмитовой матрицы Л (det Л) *s=det Л, т. е. det Л — вещественное число, ф § 137. Эрмитовы билинейные и квадратичные формы Если основное поле совпадает с полем комплексных чисел, то наряду с билинейными и квадратичными формами рассматривают эрмитовы билинейные и квадратичные формы. Эрмитова билинейная форма F(x; у) порядка п от систем переменных Х{, *2> • • • , Хп (1) и Уи J/2, .... , Уп— (2) это билинейная форма от систем переменных * * * Хи *2, . . . , Хп (3) и (2): ?(*'> У)= 2 oLijXiyj, aijSC, (4) г', j=i С—поле комплексных чисел. Звездочка в (3) и (4) означает переход к сопряженному комплексному числу: если переменным (1) придаются значения Рь Рг, . •. , Рп, то переменные (3) принимают значения pi, р2,..., рп.
§ 137. Эрмитовы билинейные и квадратичные формы 389 Аналогично эрмитова квадратичная форма F(x) от переменных (1) — это билинейная форма от систем переменных. (3) и (1), матрица которой эрмитова. Иными словами, эрмитова квадратичная форма F от переменных (1) — это полином вида п # F{x) = J£ aijXiXj= г, j=l = anXiA(:i+ai2*i*2+.. .+am№+ * „ * # + «21^2^1 +0^22^2-^2+• • - + a2fiX2^n + * * * -pOCnl#n#iT"0£n2#ri'*'2T"» • '[&nnXnXn, где все коэффициенты aij являются комплексными числами * и удовлетворяют условию aij=a,ji. Так же, как и для обычных билинейных и квадратичных форм (не эрмитовых), определяются матрица формы и ранг формы. Если А — матрица формы, то F(x;y)=X*AY (5) для эрмитовых билинейных форм и F(x)=X*AX (6) для эрмитовых квадратичных форм. Равенства (5) и (6) проверяются прямыми вычислениями. Эрмитова билинейная форма называется симметрической, если ее матрица А эрмитова, т. е. Л*=Л. В этой книге рассматриваются только симметрические эрмитовы билинейные формы. Так же, как и в случае обычных (не эрмитовых) билинейных и. квадратичных форм, определяются конгруэнтные эрмитовы билинейные и квадратичные формы и полярные формы. Остается верным все, что сказано в § 129 и 130 о конгруэнтности форм. Нужно только, учитывая равенства (5) и (6), во всех формулах заменить операцию транспонирования матрицы операцией перехода к эрмитово-транспонированной матрице. В частности, матрицы А и В конгруэнтных эрмитовых билинейных или квадратичных форм связаны соотношением В = С*АС, где С — матрица соответствующего преобразования переменных. Все доказательства аналогичны приведенным в § 129, 130 и оставляются читателю. Эрмитова билинейная или квадратичная форма называется диагональной, если ее матрица диагональна.
390 Глава 13. Билинейные и квадратичные формы Теорема 1. Всякая эрмитова квадратичная форма конгруэнтна некоторой диагональной эрмитовой форме. Аналогичное утверждение верно и для билинейных эрмитовых форм. ф Основная часть доказательства такая же, как и для случая обычных (не эрмитовых) форм (см. § 131). Пусть * F(x)= £ aijXiXj— (l) эрмитова квадратичная форма. Вместо трех случаев, приведенных в § 131, здесь рассмотрим следующие четыре: 1) все коэффициенты формы (1) равны нулю; 2) среди коэффициентов од хотя бы один отличен от нуля; 3) все коэффициенты од равны нулю, среди других коэффициентов есть не равный нулю и не являющийся чисто мнимым числом; 4) все ненулевые коэффициенты формы (1)—чисто мнимые числа и все од-равны нулю. Для первых трех случаев рассуждения те же, что и в § 131. Рассмотрим четвертый случай. Пусть, например, <%хгФ0. Запи- шем квадратичную форму (1) в виде * Л /л • \ F(х) 55**1 2 «н*«+ [ 2 aii*i ) Xi+G(x2t..., хп), Рассмотрим линейное преобразование переменных У1=хи *—1,3,... ,п, Очевидно, оно невырожденное. Применив его к нашей форме, получим ^(*) =У1У2+У1У1+Н(У2> • • •, Уп), где Н (г/г, ... , Уп) не зависит от yim Мы привели форму к уже рассмотренному виду. Эрмитова квадратичная форма от п переменных, имеющая вид eif/i*/i-fe2*/2 у2+. • .+епУпУп, где Ег=1, —1 или 0, а также билинейная форма, ей полярная, называются нормальными эрмитовыми формами. Так же, как и для случая вещественных квадратичных форм, доказываются теоремы 2 и 3.
§ 137. Эрмитовы билинейные и квадратичные формы 391 Теорема 2. Всякая эрмитова квадратичная (билинейная) форма конгруэнтна некоторой нормальной форме. Теорема 3. Количество положительных и количество отрицательных коэффициентов в нормальном виде эрмитовой квадратичной формы не зависят от выбора невырожденного линейного преобразования переменных, приводящего ее к нормальному виду. Лемма. Пусть (1) — эрмитова квадратичная форма, а Рь Рг, . .. , Рп — • комплексные числа. Тогда F($u Рг, ... , Рп) — вещественное число. ф Нужно доказать, что /ЧРь Р2, ... , Pn)*=/v(pb р2, ... , рп). (2) Но ' /7(Pl,p2,...,pn)*= ( 2 *ффХ= = 2 ajiPjPi=^(Pi> Рг, ... , Рп). г, j=l Равенство (2) доказано, ф Доказанная лемма позволяет дать определения знакоопреде- ленных эрмитовых форм. Эрмитова квадратичная форма (1) называется положительно определенной, если для любых значений Pi, Рг, ... , Рп (3) переменных, среди которых хотя бы одно отлично от нуля, Fftu Рг, ... , Рп)>0. Эрмитова квадратичная форма (1) называется отрицательно определенной, если для любых значений (3) переменных, среди которых хотя бы одно отлично от нуля, /4Pi, Р2, ... , Рп)<0. Эрмитову билинейную форму, полярную положительно (отрицательно) определенной эрмитовой квадратичной форме, также называют положительно (отрицательно) определенной. Так же, как и в § 134, доказываются теоремы 4 и 5.
392 Глава 14. Евклидовы и унитарные пространства Теорема 4. Эрмитова квадратичная форма (1) является положительно определенной тогда и лишь тогда, когда y*yi+yly2+.. ЛУпУп — ее нормальный вид. Теорема 5. Эрмитова квадратичная форма является положительно определенной тогда и только тогда, когда все угловые миноры ее матрицы положительны. Глава 14 ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА В этой и следующей главах изучаются пространства над полями вещественных и комплексных чисел. Читателю рекомендуется первоначально прочитать лишь то, что относится к случаю поля вещественных чисел. ф § 138. Билинейные функции Пусть V — векторное пространство над полем Р, характеристика которого отлична от 2. Будем рассматривать числовые функции двух переменных, определенные в пространстве F, т. е. отображения вида V*->P. Функция / двух переменных называется линейной относительно первой переменной, если для любых векторов ai, a2, Ь и чисел ai, <Х2 ИЗ ОСНОВНОГО ПОЛЯ /(aiai+a2a2, b)=aif(au 5)+a2/(a2, Б). (1) Функция называется линейной_ относительно второй переменной, если для любых векторов a, biy Ь2 и чисел Pi, р2 из основного f(a, Pi5i+p252) =Pif (a, 5i)+fef (a/fc). "^ * (2/ Функция называется билинейной, если она линейна относительно каждой переменной в отдельности. Совокупность условий (1) и (2) равносильна, очевидно, следующему условию: f(aiai+.. '+amam, Pi5*+.. .+pn&n) = .771 71 = 22 a<Pj/(&, S}) (3) i=i j=i для любых векторов щ, В, и чисел ai, Pj из основного поля, i=l, 2, ...,пг, /=1, 2,..., п.
§ 138. Билинейные функции 393 Если основное поле Р является полем комплексных чисел, то наряду с билинейными функциями рассматриваются* еще эрмитовы билинейные функции. Функция / двух переменных называется косолинейной относительно первой переменной, если для любых векторов 5i, а2, Б и комплексных чисел Ьс±, а2 f(aiut+a2a2, B)=aif(au 5)+a2f(a2i Б), (4) где звездочка означает замену комплексного числа ему сопряженным. Функция / двух переменных называется эрмитовой билинейной, если оца косолинеина относительно первой переменной и линейна относительно второй. Совокупность условий (2) и (4) равносильна условию 771 71 ь = 2 2 ыМ(Ъ, Bi) (5) <=i. j=l для любых векторов й\, Sj и чисел оы, Pj, 1=19 2, ... , т, /=1, 2,..., /г. Очевидно, для любой (эрмитовой) билинейной функции f и каждого вектора a f(a, 0) =/(0, а) =0. В самом деле, например, f(a, 0)=f(a, 0a)=0/(a, a)=0. Далее мы считаем пространство V конечномерным. Пусть йи й2, , йп— (6) базис нашего пространства, ~а(хи х2, ... , хп)\ Б {у и у2, ... , уп). Тогда f(a, Б) =f(xiUt+.. .+хпйп, yiui+.. .+Упйп). Отсюда, учитывая равенства (3) и (5), получаем п f(a, Б)= £ Xiytfiui, щ), (7) г, j=i если / — билинейная функция, и 71 * f (2, Б) =. JS МуДии щ), (8) г, j=l
394 Глава 14, Евклидовы и унитарные пространства если / — эрмитова билинейная функция. Положим f(uit 2j)=aij, A = ОСИ . 0&12 «21 <%22 ain СХ2п .ani ccn2 (Хпп Матрица А называется матрицей функции f в базисе (6). Зная матрицу А, можно, пользуясь формулой (7) ((8)), вычислить значение \(а, Б) (эрмитовой) билинейной функции f для любых векторов а и Б. Очевидно, взяв в качестве А произвольную квадратную матрицу порядка п над основным полем, можно с по- мощью формулы (7) ((8)) определить (эрмитову) билинейную функцию f. Из формул (7) и (8) получим f(a9B) = ^ aaXiy^XtAY, если f — билинейная функция, и ' f(a,B)= J£ aijXiyj=X*AY, г, j=l если / — эрмитова билинейная функция.' Здесь , Х*^= [xi xl (9) (10) х= Г*1" Хг L %п _ , Y= Vi 1 \)г L«/n J Xn]. Пусть С — матрица перехода от базиса (6) к новому базису vi, v2, ... , дп, (11) В и D — координатные столбцы векторов а и соответственно Б в базисе (11). Тогда Х=СВ9 Y=CD. Из формул (9) и (10) получаем f(a9 B) = (CB)*A(CD)=B*(C*AC)D9 если / — билинейная функция, и f(a9 S)'=(CB)*A(CD)=B*(C*AC)D9 если f — эрмитова билинейная функция.
§ 139. Симметрические билинейные функции 395 Итак, при фиксированном базисе значение f(a, Б) (эрмитовой) билинейной функции f выражается (эрмитовой) билинейной формой от координат векторов а и Б, имеющей ту же матрицу, что и матрица функции f в данном базисе. При этом переход к новому базису влечет замену соответствующей билинейной формы конгруэнтной ей формой, поэтому конгруэнтные билинейные формы можно рассматривать как билинейные формы, соответствующие одной и той же билинейной функции в разных базисах. § 139. Симметрические билинейные функции Билинейная функция / называется симметрической, если для любых векторов а и Б /(а, Б) =/(&, a). Эрмитова билинейная функция / называется симметрической, если для любых векторов а и Б 1{а,Б) = f(B, а) *. Пример. В пространстве С [а, 0] всех вещественных функций, непрерывных на сегменте [а, р], определим функцию двух переменных f формулой Р f{g,h)=fg(x)h(x)dx. а Так как интеграл суммы функций равен сумме интегралов этих функций, а постоянный множитель можно выносить из-под знака интеграла, то / — билинейная функция. Очевидно, она является симметрической. Для конечномерных пространств вопрос о симметрических билинейных функциях решается просто. В этом случае, очевидно, (эрмитова) билинейная функция является симметрической тогда и лишь тогда, когда соответствующая (эрмитова) билинейная форма является симметрической. Поэтому, фиксируя в пространстве некоторый базис и взяв произвольную (эрмитову) симметрическую матрицу в качестве матрицы (эрмитовой) билинейной функции в этом базисе, мы получим симметрическую функцию, причем все симметрические (эрмитовы) билинейные функции получаются таким образом. Так как в разных базисах значения (эрмитовой) билинейной функции выражаются конгруэнтными (эрмитовыми) билинейными формами и так как всякая симметрическая (эрмитова) билинейная форма конгруэнтна некоторой диагональной форме, причем в случае эрмитовых форм диагональные элементы матрицы формы вещественны, то верна Теорема. Для любой симметрической билинейной функции, определенной в конечномерном пространстве, существует такой базис пространства, в котором матрица этой функции диаго- нальна.
396 Глава 14. Евклидовы и унитарные пространства Для любой симметрической эрмитовой билинейной функций^ определенной в конечномерном пространстве, существует такой базис пространства, в котором матрица этой функции диаго- нальна и вещественна. Очевидно, для любой симметрической эрмитовой билинейной функции f все значения f(a, а) вещественны. § 140. Скалярное произведение В этой главе в векторные пространства над полями вещественных и комплексных чисел вносятся понятия длины и ортогональности. В элементарной геометрии скалярным произведением двух векторов названо произведение их длин и косинусу угла между ними. Мы видели, что скалярное произведение аВ векторов а и b обладает следующими свойствами: 1) (аа+$Б)с=а(ас)+$(ас)\ 2) a(a£+pg)=a(fi£)-+p(ac); 3) аБ=Ва\ 4) аа>0 при афО. Наличие первых трех свойств означает, что скалярное произведение является билинейной симметрической функцией. Длина вектора выражается через скалярное произведение: \a\=-ftt. (1) Условие ортогональности векторов а и В также выражается с помощью скалярного произведения: . аБ=0.' (2) Здесь мы введем понятие скалярного произведения в произвольном векторном пространстве над полем вещественных или комплексных чисел, а затем определим длину вектора формулой (1), а ортогональность ректоров — равенством (2). В основу определения скалярного произведения возьмем перечисленные выше его свойства. ( Пусть V — векторное пространство над полем R вещественных чисел. Пусть на пространстве V задана функция двух переменных. Образ пары векторов а и Б будем обозначать символом аВ. Эта функция называется скалярным произведением, если она удовлетворяет следующим трем условиям: 1) для любых векторов а, Б, с и вещественных чисел аир (аа+р5)с=а(ас)+р(&с); _ 2) для любых векторов а и Б аБ=Ба\ 3) для любого ненулевого вектора а аа>0.
§ 140. Скалярное произведение 397 Из условий 1 и 2 вытекает, очевидно, условие 4) для любых векторов а, Ьу с из V и вещественных чисел а и р с(аа+р5)=а(са)+р(с5), поэтому можно сказать, что скалярным произведением в векторном пространстве V над полем вещественных чисел называется билинейная симметрическая функция, удовлетворяющая условию 3. Из условий 1—3 вытекает, очевидно, (т \ I п \ т п 2 am) (2 №j ) = 2 2 аЫаФ;) для любых векторов щ, Б, и чисел щ, fa, t=l, 2, ... , m, /=1, 2,.... п. 1. Скалярное произведение векторов, введенное в гл. 4, удовлетворяет, как уже отмечалось, условиям 1—3. 2. В пространстве я-членных вещественных столбцов определим умножение столбцов формулой Г ai "1 a2 -• L On _ г в== Г Pi 1 Р* • Lpn J Тогда, очевидно, 1) (ЯЛ+цЯ)С=Я(ЛС)+ц(ДС), 2) АВ=ВА, 3) если то АА= ^Jai2>0. i = i 3. В пространстве С [а, 0] всех вещественных функций, непрерывных на отрезке [а, 0], определим скалярное произведение функций fug формулой Э fe= J/(*)*(*)<**• (3) a Читатель сам проверит, что (3) удовлетворяет определению скалярного произведения. Пусть теперь V — векторное пространство над полем С комплексных чисел. Пусть на пространстве V задана функция двух
398 Глава 14. Евклидовы и унитарные продтранстёа переменных; образ пары векторов а и Б будем обозначать символом ab. Эта функция называется скалярным произведением, если она удовлетворяет следующим трем условиям: 1) для любых векторов а, Б и с и комплексных чисел аир (aa+P6)c=a*(Sc)+p'*(5c)j 2) для любых векторов а и b ab= (ba)*\ 3) для любого ненулевого вектора а аа — положительное вещественное число. Из условий 1 и 2 вытекает, очевидно, условие 4) для любых векторов а, б и с и комплексных чисел аир с(аа+р&)=а(ш)+р(с&), поэтому можно сказать, что скалярным произведением в векторном пространстве V над полем комплексных чисел называется симметрическая эрмитова билинейная функция, удовлетворяющая условию 3. Например, в пространстве /г-членных столбцов над полем комплексных чисел можно определить скалярное умножение столбцов формулой ЛВ= jg а*р«, г = 1 где Га! "| а2 1_ап _ , в= Г Pi "1 р2 Lpn J Вещественное векторное пространство (т. е. векторное пространство над полем вещественных чисел) с определенным в нем скалярным произведением называется евклидовым векторным пространством. Комплексное векторное пространство (т. е. векторное пространство над полем комплексных чисел), с определенным в нем скалярным произведением называется унитарным векторным пространством. Очевидно, любое подпространство U евклидова (унитарного) пространства V также евклидово (унитарно) (скалярное произведение — сужение скалярного произведения, определенного в V, т. е. скалярное произведение векторов подпространства О определяется так же, как и скалярное произведение этих векторов eV). Рассмотрим все возможные способы задания в вещественном векторном пространстве Rn скалярного произведения. В пространстве Rn фиксируем произвольный базис йи й2, ... , йп. (4) Пусть а(хи x2i ... у хп), Б(уи угУ ... , Уп).
§ 140. Скалярное произведение 399 Тогда значение f(a, В) каждой билинейной функции / является билинейной формой от координат векторов а и Б: где f(a,B) = 2 xiyjf(ui9ui)=X^AYt i, j=l x= Г*! *2 L %n __ L Y= Г yi 1 f/2 Lf/n J A = an ai2 0&21 a22 «2n .otni an2 OCn ttij = f(Ui, Uj) (cm. §#138). Очевидно, функция f является скалярным произведением тогда и лишь тогда, когда соответствующая билинейная форма XTAY является положительно определенной, т. е. когда А — симметрическая матрица, все угловые миноры которой строго положительны. Таким образом, для задания в пространстве Rn скалярного произведения нужно фиксировать произвольный базис этого про- странства, выбрать некоторую вещественную симметрическую матрицу А порядка п, все угловые миноры которой строго положительны, и положить aB=XTAY, где X и Y — координатные столбцы векторов а и В в отмеченном базисе. Тогда А будет мат- рицей скалярного произведения. Для унитарного пространства вопрос решаемся аналогично. Если (4) — произвольный базис пространства Сп над полем С комплексных чисел, то значение f(a9 Ь) каждой эрмитовой билинейной функции / является эрмитовой билинейной формой от координат векторов а и В: « f(a,B)= 2 х{уДйищ)'=Х*АУ, i, j=i A=[a<ij\, ctij=f(uu щ). Очевидно, функция f является скалярным произведением тогда и лишь тогда, когда соответствующая эрмитова билинейная форма X*AY положительно определена, т. е. когда А—эрмитова матрица, все угловые миноры которой строго положительны.
400 Глава 14. Евклидовы и унитарные пространства Следовательно, для задания в пространстве Сп скалярного произведения нужно фиксировать некоторый базис (4) этого пространства, выбрать произвольную эрмитову матрицу А порядка п, все угловые миноры которой строго положительны, и положить аб=Х*АУ, где X и Y — координатные столбцы векторов а и Б соответственно в базисе (4). Доказана, в частности, Теорема 1. Всякое конечномерное вещественное (комплексное) векторное пространство может быть превращено в евклидово (унитарное). Теорема 2. В ненулевом конечномерном евклидовом (унитарном) пространстве существует базис, в котором скалярное произведение имеет единичную матрицу. < ♦ Все конгруэнтные (эрмитовы) билинейные формы являются значениями одной (эрмитовой) билинейной функции в разных базисах. С другой стороны, каждая положительно определенная симметрическая (эрмитова) билинейная форма конгруэнтна форме с единичной матрицей, ф § 141. Длина вектора Длиной вектора а евклидова или унитарного пространства называется число Уаа. Будем обозначать длину вектора а символом \а\. Отметим некоторые свойства длины. |а|^0, |а|=0 лишь при а=0. Для любого комплексного (в случае евклидова пространства— вещественного) числа а |аа| = |а||а|, где |а|—модуль числа а. В самом деле, |ай\ =У(аа) (аа) =У а*а(аа) =У а*аi~Eu= |а| \а\. Теорема 1 (неравенство Кощи — Буняковского). Для любых векторов а и Б евклидова или унитарного пространства \аВ\^\а\\Б\, (1) причем равенство имеет место тогда и только тогда, когда векторы а и Б линейно зависимы.
§141. Длина вектора 401 + При 5=0 неравенство (1) очевидно. Если же БФ09 то рассмотрим квадрат длины вектора а+хБ, где х — произвольное число из основного поля: (а+хБ) (а+хБ) =аа+х*(Ба) +х{аЬ) +х*х(ББ) >0. (2) Положив в выражении (2) Ба получим ББ' Ба /с_ч Ба (аБ)(Ба) аа- Ж {Ъа)" -W {аЬ) + ТЕ— >0' т. е. (аа)(ББ)^(аБ)(Ба)у * (3) так как 55>0. Перепишем неравенство (3) в виде |а|2|5|2^|а5|2. (4) Остается извлечь из обеих частей неравенства (4) положительные квадратные корни, и мы получим неравенство (1). Если векторы а и Б линейно независимы, то при каждом значении х а-\-хБ=£0 и, значит, (4) — строгое неравенство. Если же а и Б — линейно зависимые векторы, то пусть, для определенности, Б=аа. Тогда \аБ\*=\а(аа)\2=\а\2(аа)[(аа)(аа)] = \а\*\Б\*. # Рассмотрим равенство (а+Б) (а+Б) =аа+Ба+аБ+ББ. (5) Ба+аБ=аБ+ (аБ)*=2ге(аБ)9 где ге а — вещественная часть числа а. Очевидно, ге а^ |а|, поэтому из равенстве (5) следует |а+5|2^|а|2+2|а5| + |5|2, или в силу неравенства Коши — Буняковского |а+5|2^|а|2+2|а||5| + |5|2=(|а| + |5|)2, |а+5|^|а| + |5|. Таким образом, доказана
402 Глава 14. Евклидовы и унитарные пространства Теорема 2 (неравенство треугольника). Длина суммы двух векторов евклидова или унитарного пространства не превосходит суммы длин слагаемых. 1. Для пространства векторов — классов направленных отрезков теорема 2 означает тот факт, что длина стороны треугольника меньше суммы длин двух других его сторон. 2. В пространстве л-членных столбцов над полем комплексных чисел мы определили скалярное произведение формулой АВ= J^Ja-Рг, Л = В силу неравенства Коши — Буняковского 171 12 / П \ / П \2 i = i I x i=i * х г = 1 ' Неравенство (6) верно для любых наборов cti, аг, ... , an; Pit Рг, ... , рп комплексных чисел. Из неравенства треугольника следует Гсц П а2 1_ап __ , В = fPi "1 р2 LPn J (6) (7) g |a<+M* ^Cj/jjIaip+l/jjIPil2)*. 3. В пространстве С [a, p] мы определили скалярное произведение формулой Р a Следовательно, для любых функций f и g из С [а, р] верны равенства в Э Э ( Jf(*)*M<fc)< (JW^) (JeM**) a x * a r a 4. Приведем еще один пример бесконечномерного евклидова пространства. Рассмотрим множество V всех бесконечных последовательностей • (di, аг, ... , an, ...) п вещественных чисел, для которых сходится ряд квадратов J£ an2.
§ 142. Ортогональные векторы 403 Сложение последовательностей, умножение последовательности на вещественное число и скалярное умножение последовательностей определим формулами: (cti, ... , ап, ...) + (Pi, ... , р2, ...) = (ai+Pi, ... , "(Zn+Pn, ...). Y(<zi, ... , an> ...) = (yau ... , Y<*n, .-..). (at, ... , an, ...) (pi, ... , Pn, ...) = jg anPn. (8) n = i Покажем, что V является евклидовым пространством. С этой целью рассмотрим вначале сумму n = i В силу формулы (6) |anpn+an+ipn+i+. ..+аЛ+трп+т|2< ( ]£ al+i) ( J£ Pn+i). (10) oo oo Так как ряды J£ an2, Jj£ pn2 сходятся, то из (10) вытекает сходимость n = i n = i ряда (9). Очевидно, ряд ^ (Y°n)2 также сходится. n=*i Рассмотрим ряд 2 (an+pn)2; (И) ■JJ (an+Pn)2= Jj a»2+2 2 а"$*+ H P» 2 Следовательно, и (11)—сходящийся ряд. Итак, сумма последовательностей из Г и произведение последовательности из V и вещественного числа определены и принадлежат V. Очевидно, V является векторным пространством над полем R. Очевидно, функция (8) удовлетворяет аксиомам скалярного произведения. § 142. Ортогональные векторы В § 51 приведено необходимое и достаточное условие ортогональности двух векторов (классов направленных отрезков) — это равенство нулю их скалярного произведения. Аналогично определим сейчас ортогональность векторов в произвольном евклидовом или унитарном пространстве. Будем говорить, что вектор а ортогонален вектору В и писать а АЛ, если аБ=0. Очевидно, а±.В =»- 5j_a, поэтому можно просто сказать, что векторы а и Б ортогональны.
404 Глава 14. Евклидовы и унитарные пространства аА-й тогда и лишь тогда, когда а=0; 0J_a для любого вектора а. Если вектор а ортогонален каждому вектору пространства, то а=0, ибо в этом случае а_1_а. Очевидно, верна «теорема Пифагора»: если а=Б+с и 5J_c, то \а\*=\Б\>+\с\*. ф В самом деле, \а\>=(Б+с)(Я+с) = \Б\>+\с^ • Если ait а2, ... , аш— (1) конечная система векторов евклидова или унитарного пространства, а Б — вектор этого пространства, ортогональный каждому а%, то Б ортогонален и любой их линейной комбинации, ибо (m \ m J£ tLiUi ) = Jj «г(5аг) =0. Теорема 1. Ортогональное множество (множество попарно ортогональных векторов), не содержащее нулевых векторов, ли- нейно независимо. ф Пусть (1) —конечное ортогональное множество, не содержащее нулевых векторов. Если aiai.+a2a2+.. .+amam=0, (2) где <Xi, t=l, 2, ... , m,— комплексные (или вещественные) числа, то, умножив обе части равенства (2) слева на вектор а*, получим в силу ортогональности множества' (1) «г(am) =0, аг=0, i= 1, 2,:... , m. Таким образом, (1) —линейно независимая система. Бесконечное ортогональное множество, не содержащее нулевого вектора, также линейно независимо, поскольку линейно независима каждая его конечная часть. % Теорема 2. Пусть (1) — конечная система векторов евклидова или унитарного пространства. Тогда существует в этом пространстве ортогональная система векторов Би Бг, .... , Бт, (3)
§ 142. Ортогональные векторы 405 такая, что для k= 1., 2,..., m системы aif ik, ... 9 а*, - (4) и Би Б2, ... , Ък (5) эквивалентны. ф Систему (3) будем строить последовательно, применяя так называемый процесс ортогонализации. Положим 5i = ai. Далее воспользуемся индукцией. Если уже построена ортогональная система (5), эквивалентная системе (4) и &<т, то положим 5fc+i = a/l+i+ai5i+-. .+.оьл5а, (6) где а;, 1=1,2, ...,*+1- ~ (7) неизвестные пока числа из основного поля. Легко видеть, что системы векторов аи i=l,2,...,fc+l, (8) и Ъи t=l,2,...,£+l (9) эквивалентны при любом наборе коэффициентов (7). В самом деле, система (5) линейно выражается через систему (4), а вектор Бк+i — через систему (8), значит, система (9) линейно выражается через систему (8). В свою очередь система (4) линейно выражается через систему (5), а вектор ал+i в силу равенства (6) линейно выражается через систему (9). Значит, (8) линейно выражается через (9), и, следовательно, это — эквивалентные системы векторов. Попытаемся теперь подобрать коэффициенты а* в равенстве (6) так, чтобы система (9) была ортогональной. Так как (5) — ортогональная система, то нужно только, чтобы равенства 5*5Ж=0 (10) имели место при г=1, 2, ... , k. Учитывая формулу (6), получим из (10) систему уравнений для определения коэффициентов а*: ai+iBi+ai(BiBi) =0, t=l, 2, ... , k. (11) Если 5^0, то а* определяется из (11). Если же 5г=0, то (11) имеет место при любом аг* и его выбор в равенстве (6) не существен. #
40Q Глава 14. Евклидовы и унитарные пространства Замечание 1. Если система векторов (1) линейно независима, то и построенная процессом ортогонализации система (3) также линейно независима, ибо ранги эквивалентных систем векторов равны. Поэтому в системе (3) нет нулевого вектора. Если же (1) —линейно зависимая система, то ,0 входит в систему (3), иначе она была бы линейно независимой по теореме 1. Замечание 2. Если в (1) аи *=1, 2,..., ky k^m — ненулевые попарно ортогональные векторы, то в системе (3), полученной из (1) в результате применения процесса ортогонализации, 5i = di. (12) ♦ В самом деле, при т=1 (12) верно. Воспользуемся далее индукцией по т. Пусть /л>1 и (12) верно для всех is^m—l. Согласно формуле (6), 6т имеет вид £m = flm + (Xi5i+. . .+am-i£m-i- Из равенства Б{6т=0, Г5^*<т— 1, следует аг(5г5х)=0, а«=0. (12) доказано. # Из последних замечаний вытекает, очевидно, Теорема 3. Любая ортогональная система ненулевых векторов конечномерного евклидова или унитарного пространства либо является базисом, либо может быть дополнена до ортогонального базиса. Система векторов называется ортонормированной, если любые два ее вектора друг другу ортогональны и длина каждого из них равна 1. Из предыдущей теоремы вытекает Следствие. В ненулевом конечномерном евклидовом или унитарном пространстве V существует ортонормированный базис. Любая ортонормированная система векторов пространства V либо является базисом, либо может быть дополнена до ортонор- мированного базиса. Построить ортогональный базис можно, применяя процесс ортогонализации к любому базису пространства. Умножив затем каждый вектор ортогонального базиса на число, обратное его длине, получим ортонормированный базис. Пусть йи й2т ... у йп— (13)
§ 143. Связь между ортонормированными базисами 407 базис евклидова или унитарного пространства F, A=[aij]9 £, /=1, 2, ... ,п — матрица скалярного произведения в этом базисе. Так как (Xij = UiUjy то базис (13) является ортонормированным тогда и лишь тогда, когда А =Е. В ортонормированном базисе упрощаются многие вычисления - Так, если (13) — ортонормированный базис пространства V, а(хи x2,...f хп), Б(уи у2, ... , уп), то аЪ= (х{)*Е (уг) = (х{) * (у{) = £ хф г=1 (в случае евклидова пространства Xi=Xi). Условие ортогональности векторов а и Б принимает вид хт+х1у2+.. .+^пУп=0. § 143. Связь между ортонормированными базисами Пусть ёи ё2, ... , ёп (1) и йи й2, ... , йп — (2) два базиса евклидова или унитарного пространства, причем (1) — ортонормированный базис. Пусть, далее, С — матрица перехода от базиса (1) к базису (2). Тогда, как показано в § 140, в базисе (2) скалярное произведение имеет матрицу С*ЕС=С*С (в случае евклидова пространства С*=СТ). Для того чтобы базис (2) был ортонормирован, необходимо и достаточно, чтобы скалярное произведение имело в нем единичную матрицу. Следовательно, верна Теорема. Пусть (1) — ортонормированный базис евклидова или унитарного пространства, С — матрица перехода Ьт базиса (1) к базису (2). Базис (2) ортонормирован тогда и лишь тогда,
408 Глава 14. Евклидовы и унитарные пространства когда С удовлетворяет условию С*С=Е (3) для евклидова пространства и С*С=Е —. (4) для унитарного. Вещественная матрица С, удовлетворяющая равенству (3), называется ортогональной. Комплексная матрица С, удовлетворяющая условию (4), называется унитарной. Из равенства (3) вытекает следующее условие ортогональности матрицы: вещественная матрица С=[аг;], t,/=1,2, ... , л, (5) ортогональна тогда и лишь тогда, когда имеют место следующие равенства: п i=l где 8jk — символ Кронекера, j, k=\t 2,... , я. Например, матрицы 4 ["coscp — sincp] П 0] Lsincp coscp J L0 —1 J ортогональны. Аналогично комплексная матрица (5) унитарна тогда и лишь тогда, когда верны следующие равенства: 2 a>ija,ik=8jh, /, й=1, 2, ... , п. г=1 Доказательства оставляются читателю. § 144. Определитель Грама Пусть ait 5& . . . , Sm— - (1) произвольная система векторов евклидова или унитарного про-
§ 144. Определитель Грама 409 странства. Определитель I UiCLi йч&г . . . UtUm a25i а2а2 ... йгйт | CimCLi ClmQ>2 • • • йтО>т \ обозначим символом Т(ай я2> ... , am) и назовем определителем Грама системы векторов (1). Теорема. Если система векторов Би 52, ... , Бт (3) получена из системы (1) процессом ортогонализации, то Т(Би 52, ... , Ъш)=Т(.аи а2, ... , ат). ф По условию теоремы Bi=au Б2 =a2+a2iai, 5m = #m+0Cml#l+- . . + amm-l5m-i. Поэтому для />1 6jai=aj5i-j-0Cjiaiai-i-.. .-{-ос^ j—iaj—tui. Значит, замена левого сомножителя uj всюду в /-й строке определителя (2) сомножителем bj равносильна прибавлению к этой строке подходящей линейной комбинации предыдущих строк, отчего определитель не изменяется. Аналогично замена всюду в /-м столбце (/>1) правого сомножителя clj сомножителем Bj равносильна прибавлению к этому столбцу некоторой линейной комбинации предыдущих. Наконец, замена в определителе (2) вектора а4 вектором 5i несущественна, так как эти векторы совпадают. # Следствие. Г(Й1, а2, ... , ат) — вещественное неотрицательное число, равное нулю тогда и лишь тогда, когда система векторов (1) линейно зависима. v ф Если система' (3) —результат применения к системе (1) процесса ортогонализации, то
410 Глава 14. Евклидовы и унитарные пространства Г(Й1, Й2, . . . , Вт) =T(5i, 52, • . . , Вт) = 5А 0 О О ЬгЪг ... О О 0 ... БтБт = |&i|2|52|2... IM2. (4) Равенство нулю в формуле (4) имеет место тогда и лишь тогда, когда в системе (3) содержится 0, т. е. когда система (1) линейно зависима, ф § 145. Ортогональное дополнение подпространства Пусть О — подпространство евклидова или унитарного пространства V. Множество V1 всех векторов пространства V, ортогональных каждому вектору из подпространства О, называется ортогональным дополнением подпространства D. Например, {0}1 = Р, Г± = {0}. Теорема. Для любого подпространства О пространства V множество О1 также является подпространством. Если V — нетривиальное подпространство и V конечномерно, то V=U+U±. (1) ф Oef/1, так что О1 непусто. Далее, пусть а, Б^О1, а, р — числа из основного поля. Для любого вектора и из О й(аа+р?) = = а (йа)+р(й5)==0. Следовательно, aa+pSetf1. Доказано, что О1 — подпространство пространства V. Пусть теперь О — нетривиальное подпространство пространства V и V конечномерно. В подпространстве О выберем ортогональный базис И\9 U2, ... , Urn и дополним его до ортогонального базиса UU ^2, ... , ищу Vm+i> . . . » Vn пространства V. Ясно, что V=0+L(vm+b ••• > Vn). Остается доказать равенство L(vm+i, ... ,Вп) = 0\ (2)
§ 145. Ортогональное дополнение подпространства 411 Очевидно, каждый вектор этой линейной оболочки ортогонален подпространству О. Пусть теперь Тогда UiV=0, i=l, 2, ... , т. (3) Из (3) следует ai(uiui)=0, ai=0, i=l,2, ... , m, v^L(vm+u ... , vn)> Равенство (2) доказано. # Следствие. dim(£71)=dim V—dim {7. ф Найдем систему уравнений, определяющую £7-4 Пусть 5ь a2 am — (4) какая-либо конечная система образующих подпространства О (например, базис этого подпространства). Вектор Б из V входит в О1 тогда и лишь тогда, когда он ортогонален каждому из векторов (4). Фиксируем в пространстве V какой-либо ортонормиро- ванный базис. Пусть в этом базисе ui(au9 a*2, ... , аг-п), i=l, 2, ..., m; Б(хи х2> ... , хп). Тогда условия ортогональности -BJLai примут вид a*i*i+o4*2+. • .+аг*п*п=0, t=l, 2, ... , т. (5) Подпространство О1 есть пространство решений линейной однородной системы (5). # Согласно формуле (Л), каждый вектор а из V однозначно представляется в виде а=Б+с, 5e=i7, сеО1. Вектор Б называется ортогональной проекцией вектора а на подпространство О.
412 Глава 15. Линейные преобразования евклидовых и унитарных пространств Глава 15 ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ ЕВКЛИДОВЫХ И УНИТАРНЫХ ПРОСТРАНСТВ § 146. Изоморфизм Пусть V и W — векторные пространства над одним и тем же полем. В § ПО введено понятие изоморфизма пространства V на пространство W. Биекция /: V-+W называется изоморфизмом, если для любых векторов а и В пространства V и числа а из основного поля f(a+B)=f(a)+f(B), f(aa)=af(a). Будем теперь считать V и W евклидовыми (унитарными) пространствами. Если изоморфизм / такой, что для любых векторов а и В пространства V f(a)f(B) =аВ, то будем называть f изоморфизмом евклидовых (унитарных) пространств. Отображение g: V-+W называется изометрическим, если для любых векторов й и В пространства V g(a)g(B) =аБ. Теорема 1. Изометрическое отображение линейно и инъек- тивно. Пусть g: V-+W — изометрическое отображение. Докажем вначале, что g линейно, т. е. для любых векторов а и В и любых чисел а и р из основного поля g(*a+№)=*g(a)+$g(B). (1) С этой целью рассмотрим вектор c=g(aa-{-$B)— ag(a)'—$g(B): cc=g (a'a+p5) g (aa+P^) — a [g(aa+$B) g (a) ] — -№(*a+$B)g(B)]-a4g(a)g(aa+№)] + ! +F*[g(B)g(d)]+№*[g(l>)g(B)]. Учитывая изометричность отображения g, находим с с= (aa+p5) (aa+p5) — a[ (aa+p5) a] — —p [ (aa+p5) 5] —a* [a (aa+p5) ]+aa* (aa) — -a*p (ad) -p* [5 (aa+p5) ] +p*a (ба) +рр* (66) = = aa* (aa) +a*p (аб) +p*a (Bo) +p*p (55) -a*a (ad) —
§ 146. Изоморфизм 413 -ар* (Ба) -Ра* (аБ) -рр* (ББ) —а*а (аа) -а*р (аБ) + +аа* (аа) —а*р (об) —Р*а (5 а) -р*р (55) + +Р*а(ба)+рр*(55)=0. Так как сс=0, то с=0. Равенство (1) доказано. Остается доказать инъективность отображения g. С этой целью покажем, что Kerg={0}. (2) Пусть d€=Kerg. Тогда g(d)=0, dd=g(d)g(d)=0, Я=0. (2) доказано, ф Следствие. Сюръективное изометрическое отображение является изоморфизмом евклидовых (унитарных) пространств. Рассмотрим пример. Фиксируем некоторую плоскость П и обозначим буквой V пространство всех векторов этой плоскости. Скалярное произведение определим как произведение длин векторов и косинуса угла между ними. Если фиксировать в пространстве V ортонормированный базис, то скалярное произведение векторов а(хи *2), 6(уи Уг) будет вычисляться по формуле аб=*i*/i+*2*/2. В пространстве W двучленных столбцов над полем вещественных чисел определим скалярное произведение формулой Зададим теперь отображение f: V-+Wy a(xux2)-+X. Очевидно, f сюръективно. Покажем, что f — изометрическое преобразование. Если б (у и Ы» Z(zu z2), то f(6)f(c) = YZ=yizl+y2Z2 = 5c. Итак, f — изоморфизм евклидова пространства V на евклидово пространство W. Очевидно, при изоморфизмах евклидовых (унитарных) про- странств ортонормированный базис переходит в ортонормированный базис и сохраняются длины векторов. Верно и обратное. Точнее, верны следующие две теоремы: Теорема 2. Пусть f: V-+W — линейное отображение евклидова (унитарного), пространства V в евклидово (унитарное) пространство W. Если образы всех векторов какого-либо ортонормирован-
414 Глава 15. Линейные преобразования евклидовых и унитарных пространств ного базиса пространства V составляют ортонормированный базис пространства W, то f — изоморфизм евклидовых (унитарных) пространств. ф Пусть ёи ё2, ... , ёп — (3) ортонормированный базис пространства F, /(й), /(&), ... ,f(en)- (4) ортонормированный базис лространства W. Тогда, очевидно, f является сюръекцией, и нужно доказать только, что / изометрич- но. Пусть а к 5 — векторы пространства V. Тогда п п а— J£J oLieu Б= J£J fiiei, г==1 г=1 п * аб= J£J агРг, fW-JSckKft), f(5)-i?p«f(*«), и, так как (4) — ортонормированный базис, то f(a)f(5)«J; а<р<=Д5. • Теорема 3. Пусть f: V-*W — сюръективное линейное отображение евклидова (унитарного) пространства V в евклидово (унитарное) пространство W, Если для любого а из V |/(а) | = = | а |, то f — изоморфизм евклидовых (унитарных) пространств. ф Пусть а и Б — векторы пространства V, а х — произвольное комплексное (в случае евклидова пространства — вещественное) число. Тогда |а+хВ12= (а+хБ) (а+хБ) = \а\2+х*(Ба) +*(аб) +хх* \Б\\ (5) \f(a+x6) \*=f(a+xB)f(a+x5) = = [f(a)+xf(B)][f(a)+xf(B)] = = \f(u)\2+x[№f(B))+x*[f(5)f(a)} + +хх*\!(Б)\>. (6)
§ 146. Изоморфизм 415 Но \a+x6\ = \f(a+x5)\, \a\ = \f(a)\ и |5| = |f(5)|, поэтому из формул (5) и (6) следует x(aB)+x*(Ba)=x[f(a)f(B)]+x*[f(6)f(a)]. (7) Равенство (7) верно для любых векторов а и Б и каждого числа х. Если V — евклидово пространство, то скалярное произведение в нем коммутативно и х в формуле (7) вещественно, т. е. х*=х. Тогда из равенства (7) следует равенство аБ=№№. (8) Если же пространство V унитарно, то, положив в формуле (7) поочередно х=1 и x=i и разделив обе части полученного во втором случае равенства на t, найдем a6+5a=f(a)f(b)+f(B)f(a), aB-6a=f(a)f(B)-f(B)f(a), откуда и следует (8). Итак, в обоих случаях / — изометрическое отображение. # Легко видеть, что отношение изоморфизма евклидовых (унитарных) пространств есть эквивалентность на множестве всех евклидовых (унитарных) пространств. А именно: 1) всякое евклидово (унитарное) пространство изоморфно себе, 2) если\: 7-+W — изоморфизм евклидовых (унитарных) про- странете, то и /-1: W-*V — изоморфизм евклидовых (унитарных) пространств, 3) если f: V-*W и g: W-+D — изоморфизмы евклидовых (унитарных) пространств, то и gf: V-+0 — изоморфизм евклидовых (унитарных) пространств. Доказательство оставлено читателю. Теорема 4. Два конечномерных евклидовых (унитарных) пространства изоморфны тогда и лишь тогда, когда их размерности совпадают. ^ Если пространства изоморфны, то, как показано в § 101, их размерности совпадают. Нам сейчас нужно доказать обратное утверждение. Пусть V — л-мерное евклидово (унитарное) пространство, a W — пространство вещественных (комплексных)
416 Глава 15. Линейные преобразования евклидовых и унитарных пространств столбцов с умножением п # (Xi) (у{) = J} Xi\)i. i=l Пусть еще (3) — ортонормированный базис пространства V. Определим отображение /: V-+W формулой f(a) = (Xi), а(хих2, ... ,*я). Очевидно, / — сюръекция. Если еще БЦуи Уг> ... > Уп), то f(a)f(6)=*(xi)*'(yi)= 2хф=аБ. <=i Итак, / — изоморфизм евклидовых (унитарных) пространств, произвольное n-мерное евклидово (унитарное) пространство изоморфно некоторому фиксированному евклидову (унитарному) прюстранству. Так как два евклидовых (унитарных) пространства,, изоморфных третьему, изоморфны друг другу, то теорема доказана. # Следствие. Для любого натурального числа п существует единственное с точностью до изоморфизма евклидовых (унитарных) пространств n-мерное евклидово (унитарное) пространство. Всюду ниже произвольное я-мерное евклидово или унитарное пространство обозначается символом Еп. § 147. Сопряженное преобразование Здесь мы начинаем изучение некоторых специальных классов линейных преобразований евклидова или унитарного пространства. Линейное преобразование /* евклидова или унитарного пространства называется сопряженным линейному преобразованию /, если для любых векторов а и Б f*(a)6=af(5). Далее изучаются только конечномерные пространства. Теорема 1. Пусть fug — линейные преобразования пространства Еп, А и В соответственно — их матрицы в некотором орто- нормированном базисе. Тогда равенство В=А* необходимо и достаточно для того, чтобы преобразование g было сопряженным преобразованию f.
§ 147. Сопряженное преобразование 417 ф Преобразование g является сопряженным преобразованию / тогда и лишь тогда, когда для любых векторов а и Ь g(a)5=af(B). (1) Если а(хи х2,..., хп), В(уи Уг,... , Уп), то g (й) Б= [В (Xi) ] * (Уi) = (Xi) *В* (уi), uf (Б) = (*<) М. (t/i) . Поэтому условие (1) равносильно равенству (Xi)*B*(yi) = (xi)*A(yi)9 которое верно для любых столбцов (xi) и (уг) лишь при условии Я*=Л (см.§ 129). • Так как при фиксированном базисе любое линейное преобразование пространства вполне определяется своей матрицей и так как для любых квадратных матриц А и В (АВ)*=В*А*, Л**=Л, то очевидны два следующих утверждения. Следствие 1. Для любого линейного преобразования пространства Еп существует единственное сопряженное преобразование. (Всюду ниже преобразование, сопряженное линейному преобразованию Д обозначается символом /*.) Следствие 2. Для любых линейных преобразований fug пространства Еп №*=g*f*> /**=/. Теорема 2. Если f —линейное преобразование пространства Еп, a U — инвариантное относительно f подпространство, то подпространство U1 инвариантно относительно /*. ф Пусть astf1; b^U. Тогда P(a)b=af(b)=09 (2) так как f(b)^0. В силу равенства (2) f*(a)<=OK • Из определения сопряженного преобразования вытекает, оче-4 видно, равенство f*f(a)b=f(a)f(b).
418 Глава 15. Линейные преобразования евклидовых и унитарных пространств § 148. Изометрии В этом параграфе изучаются изометрические преобразования, ?или изометрии, евклидова или унитарного пространства, т. е. такие его преобразования, которые сохраняют скалярное произведение (см. § 146). Изометрии евклидова пространства называются ортогональными преобразованиями, а унитарного — унитарными. В § 146 (теорема 1) доказано, что изометрии.линейны и инъ- ективны. Из инъективности линейного преобразования конечномерного векторного пространства следует его сюръективность {§ 101). Из этого и теорем 2 и 3 § 146 вытекают, очевидно, три следующих утверждения: 1. Множество всех изометрии пространства Еп совпадает € множеством всех его изоморфизмов на себя. 2. Изометрии сохраняют длины векторов. Если линейное преобразование пространства Еп сохраняет длины векторов, то оно является изометрией. 3. Изометрия любой ортонормированный базис пространства Еп переводит в ортонормированный базис. Если линейное преобразование пространства Еп некоторый ортонормированный базис отображает на ортонормированный базис, то оно изометрическое. Теорема 1. Линейное преобразование f является изометрическим тогда и лишь тогда, когда f*f=e. ф В силу равенства (3) предыдущего параграфа, линейное преобразование f является изометрией тогда и только тогда, когда для любых векторов аи Б П(а)6=аВ. (1) Равенство (1) равносильно равенству [f*f(a)-a]B=0. Последнее верно для всех векторов Б только при условии f*/(a)-a=0, f*f(d)=a9 m=e. • Следствие 1., Линейное преобразование евклидова (унитарного) пространства является ортогональным (унитарным) тогда и лишь тогда, когда его матрица в ортонормированном базисе ортогональна (унитарна).
§ 148. Изометрии 419» Следствие 2. Определитель матрицы ортогонального преобразования равен 1 или —У. Модуль определителя матрицы унитарного преобразования равен 1, Теорема 2. Множество всех ортогональных преобразований евклидова (унитарного) пространства Еп — группа относительно- умножения преобразований, изоморфная группе всех ортогональных (унитарных) матриц порядка п. ф Очевидно, произведение изометрии и тождественное преобразование являются изометриями. Далее, пусть / — изометрия.. Тогда /-1 — также изометрия, ибо /*/=e=^/-i(f*)-i=e=^ (/-1)*/-!=<>. Согласно следствию 1, при фиксированном базисе изометрии к только они задаются ортогональными (унитарными) матрицами. # Теорема 3. Если подпространство V инвариантно относительно изометрии f, то подпространство О1 также инвариантно относительно f. ф По теореме 2 § 147 подпространство О1 инвариантно относительно преобразования /*. Но в нашем случае /*=/~1, а подпространство, инвариантное относительно f"1, инвариантно и относительно /. ф Из теоремы 3 и того факта, что для любого эндоморфизма f вещественного конечномерного векторного пространства существует инвариантное относительно / одно- или двумерное подпространство (§ 127, теорема 3), следует Теорема 4. Пусть f — ортогональное преобразование евклидова пространства Еп. Тогда либо п^2, либо пространство Еп есть прямая сумма попарно ортогональных одно- или двумерных подпространств, инвариантных относительно f. ф Воспользуемся индукцией по п. Пусть м>2 и теорема верна для пространств, размерность которых меньше л. Обозначим символом Oi одно- или двумерное подпространство пространства Еп, инвариантное относительно /. Тогда E*=Ui±Oi± (2) и подпространство d1 инвариантно относительно /. Очевидно,
420 Глава 15. Линейные преобразования евклидовых и унитарных npoctpancTe ограничение /i преобразования / на подпространстве Oi1 — ортогональное преобразование пространства Oi1, dim (7i±=n1<n, поэтому, по индуктивному предположению, щ^2 или подпространство Ui1 — прямая сумма попарно ортогональных одно- или двумерных подпространств Du инвариантных относительно /. Тогда в силу формулы (2) J?n=(71+t72+---+«7m и каждое подпространство d инвариантно относительно f. # Аналогично получается Теорема 5._ Если f — унитарное преобразование унитарного пространства Еп, то это пространство есть прямая сумма п одномерных инвариантных относительно f попарно ортогональных подпространств. Доказательство оставлено читателю. Взяв в каждом из этих подпространств вектор длины 1 и выписав эти векторы друг за другом, получим ортонормированныи базис пространства, составленный из собственных векторов преобразования /. Поэтому из теоремы 5 вытекает Следствие 3. Для любого унитарного преобразования f унитарного пространства Еп существует ортонормированныи бйзис этого пространства, составленный из собственных векторов преобразования f. В силу двух предыдущих теорем описание ортогональных преобразований n-мерного евклидова пространства сводится к случаю п^2, а описание унитарных преобразований п-мерного унитарного пространства — к случаю п=\. При м=1 всякое линейное преобразование пространства Еп определяется формулой f(a)=aa для любого вектора а (а — число из основного поля). /(а)/(а)=аа*(аа), поэтому преобразование / тогда и лишь тогда является изометрией, когда аа* = 1. При а вещественном последнее равенство равносильно а=1 или а= — 1. Итак, существуют только два ортогональных преобразования евклидова пространства Е1:
§ 148. Изомётрии 421 1) тождественное преобразование, 2) преобразование —е, определяемое для каждого вектора а формулой —е(а)=—а. Всякое унитарное преобразование f унитарного пространства Е1 определяется формулой f(a) =Ха, где К — произвольное комплексное число с модулем, равным 1, одно и то же для всех а. Попутно доказано, что: если а — собственное значение ортогонального преобразования, то а=1 или а= —1; если а — собственное значение унитарного преобразования, то |а| = 1. Найдем сейчас все ортогональные преобразования евклидова пространства Е2. Если / — изометрия пространства Е2, то в орто- нормированном базисе она задается некоторой ортогональной матрицей А=[<ц}], U /—1> 2; det Л = ±1. Рассмотрим отдельно два случая: det Л=—1 и det Л = 1. В первом случае характеристический полином с(х)=х2-\-$х—1 преобразования / имеет вещественные корни 1 и — 1. Пусть а — собственный вектор, соответствующий собственному значению 1. Тогда Подпространства L(a) и (L(a))L инвариантны относительно f. Если ei(=L(a), ^еЩа))1 |*i| = |&| = lf то ёи ёч— (3) ортонормированный базис пространства £2, составленный из собственных векторов преобразования f. В этом базисе f имеет матрицу diag[l,--l]. (4) Пусть det 4 = 1. (5) Для нахождения матрицы А заметим, что а11+а21=1' «110612+0621022 = 0. - (6)
422 Глава 15. Линейные преобразования евклидовых и унитарных пространств В силу первого из соотношений (6) можно положить aii=cos ф, a2i=sin ф, тогда второе из них и равенство (5) приведут к системе уравнений относительно неизвестных ai2, агг: ai2 cos ф+агг sin ф=0, — 0С12 8тф-|-а22СО8ф=1, . которая имеет единственное решение (—зтф, созф). Следовательно, Гсовф —sn^J L sin ф cos ф J * ' Таким образом, всякое ортогональное преобразование евклидова пространства Е2 в подходящем ортонормированном базисе имеет матрицу (4) или (7). Из этих построений вытекают два следствия. Следствие 4. Всякая ортогональная матрица А порядка п ортогонально подобна некоторой ортогональной матрице В вида 5=diag [Си С2, ... , Ст], (8) где С г — ортогональная матрица порядка п^2\ при П{=1 Сг=±1, при я*=2 С г имеет вид (7); П!+П2+. . . + Пт = М. Другими словами, для всякой ортогональной матрицы А существует такая ортогональная матрица D, что D^AD=B. Следствие 5. Всякая унитарная матрица А порядка п унитарно подобна некоторой диагональной матрице 5==diag [cci, a2, ... , ап]„ где для 1=1, 2, ... , п |а<| =1. Иными словами, для всякой унитарной матрицы А существует такая унитарная матрица D, что D-*AD=B. Доказательства этих следствий аналогичны, мы докажем следствие 4. ф Пусть А — ортогональная матрица порядка п. При /г^2 А ортогонально подобна матрице вида (8). Пусть п>2. В евкли-
§ 148. Изометрии 423 довом пространстве Еп фиксируем какой-либо ортонормированный базис ёи ё2, ... , вп. _ (9) Пусть / — линейное преобразование, которое в базисе (9) имеет матрицу А. В_силу следствия 1 / — изометрия. По теореме 4 пространство Еп — прямая сумма попарно ортогональных одно- или двумерных подпространств Vu t=l, 2, ... , m, инвариантных относительно /. Выписав друг за другом подходящие ортонорми- рованные базисы этих подпространств, получим ортонормированный базис пространства Еп, в котором преобразование / имеет матрицу В вида (8). Так как этот базис и базис (9) ортонорми- рованы, то их связывает ортогональная матрица лерехода D. Итак, В=й-*АО. # Пример. Ортогональное преобразование / евклидова пространства Е$ в ортонормированном базисе ёи ёг, ёз имеет матрицу - Г 2 2 _ * П Т Т "Т 2 1 2 __ j_ 2_ JL- L Т ~з~ ~з~_| Найти тот ортонормированный базис, в котором матрица преобразования / имеет форму (8). Найти также эту форму. Решение. Характеристический полином с(х) матрицы Л равен с(х) = = (*— 1)2(*+1), собственными значениями являются 1 и —1. Все собственные векторы а, соответствующие собственному значению 1, имеют вид а (а, р, 2р-а), где а и р—вещественные числа, не равные одновременно нулю. Множество всех этих векторов и 0 составляют двумерное подпространство О, инвариантное относительно /. Найдем какой-либо ортонормированный базис этого подпространства. Пусть wi(l, 0, —1). Вектор йг(а, р, 2p—a) найдем из условия Й!Й2 = 0. * (Ю) В силу (10) 2а—2Р=0, а=р, й2(1, 1, 1). йи й2 — ортогональный базис; ортонормированный базис подпространства V. Найдем ортогональное допол-
424 Глава 15. Линейные преобразования евклидовых и унитарных пространств нение 0J-. £7-L есть пространство решений системы уравнений - Общее решение этой системы (*, —2лг, х). Поэтому 0-L есть множество всех векторов v(x, —2х, х)\ /(£/)=—£7; \v\=~f6\x\, при х= |е?| =-1. Итак, Ч^' ~Fr Ff)~ ортонормированный базис, составленный из собственных векторов преобразования /. В этом базисе/ имеет матрицу diag[l, 1, —1]. § 149. Самосопряженное преобразование Линейное преобразование / пространства Еп называется самосопряженным, если /*=/, т. е. для любой пары векторов а и Б f(a)5=af(b). Теорема 1. Линейное преобразование является самосопряжен- ным тогда и лишь тогда, когда его матрица А в ортонормирован- ном базисе удовлетворяет условию А*=А, т. е. является симметрической в случае евклидова и эрмитовой в случае унитарного пространства. ф Пусть А — матрица линейного преобразования f в ортонормированием базисе. Тогда f* имеет в этом базисе матрицу А*. Равенства /=/* и А=А* равносильны, ф Теорема 2. Все корни характеристического полинома эрмитовой матрицы вещественны. В частности, вещественны все корни характеристического полинома вещественной симметрической матрицы. ф Пусть А — эрмитова матрица порядка я, а — корень ее характеристического полинома. В унитарном пространстве Еп фиксируем ортонормированный базис и обозначим буквой / то линейное преобразование, которое в отмеченном базисе имеет матрицу А. а является собственным значением преобразования jf. Пусть а — соответствующий собственный вектор. Так как А — эрмитова матрица, то / — самосопряженное преобразование: f(a)a=af(a) =>- (аа)а=а{аа) =>- а*(аа)=а(аа).
§ 149. Самосопряженное преобразование 425 Но афО, поэтому ааФО и из последнего равенства следует а*=а. # Очевидно (см. § 111) Следствие 1. Для любого _самосопряженного линейного преобразования f пространства Еп существует в этом пространстве одномерное инвариантное относительно f подпространство. Теорема 3. Если_\ — самосопряженное линейное преобразование пространства Еп, a U — инвариантное относительно f подпространство, .то О1 также инвариантно относительно f. ф О1 инвариантно относительно f*. В нашем случае /*=/. ф Из этой теоремы и предыдущего следствия вытекает Следствие 2. Для любого самосопряженного линейного преобразования f пространства Еп в этом пространстве существует ортонормированный базис, составленный из собственных векторов преобразования f. Следствие 3. Всякая вещественная симметрическая матрица ортогонально подобна некоторой диагональной матрице. Всякая эрмитова матрица унитарно подобна некоторой вещественной диагональной матрице. Эти следствия доказываются так же, как и аналогичные утверждения в предыдущем параграфе. Отметим еще две теоремы. Теорема 4. Собственные векторы самосопряженного преобразования, относящиеся к попарно различным собственным значениям, ортогональны. + Если / — самосопряженное преобразование, а и В — его собственные векторы, относящиеся к различным собственным значениям а и р, то f(a)B=af(B) =>- (аа)Б=а($Б) и, следовательно, а*(аБ)=$(аБ). (1) Но а— вещественное число, поэтому а*=а и 55=0, так как а^р. •
426 Глава 15. Линейные преобразования евклидовых и унитарных пространств Теорема 5._Для произвольного линейного преобразования f пространства Еп произведение f*f — самосопряженное преобразование, все собственные значения которого неотрицательны. ♦ (f*f)*=f*f**=f*f ' Далее, пусть а — собственное значение преобразования /*/, а — соответствующий собственный вектор. Тогда f*f(a)a=f(a)f(a) =>- (аа)а=а(аа)^0. Так как аа>0, то а^О. ф Следствие 4. Для любого линейного преобразования f прост- ранства Еп существует такое самосопряженное преобразование 8, что f*f=g2* (2) ♦ f*f — самосопряженное линейное преобразование, все собственные значения которого неотрицательны. Существует орто- нормированный базис пространства Еп, составленный из собственных векторов преобразования /*/. В этом базисе /*/ имеет вещественную диагональную ма.трицу i4 = diag [аь a2, ... , an], a^O. Напишем матрицу B=diag [У~аГ, /оГ, ... , fa£\. Если g— линейное преобразование с матрицей В, то верно (2). В*=В, поэтому g является самосопряженным, ф § 150. Приведение вещественной квадратичной формы к диагональному виду ортогональным преобразованием переменных В § 133 доказано, что всякая вещественная квадратичная форма с помощью вещественного невырожденного линейного преобразования переменных может быть приведена к диагональному виду. Покажем сейчас, что это преобразование можно выбрать так, чтобы его матрица была ортогональной. Теорема 1. Для всякой вещественной квадратичной формы F(XU *2, ... , Хп) (1)
§151. Разложение линейного преобразования 427 существует линейное преобразование переменных с ортогональной матрицей С, приводящее эту форму к диагональному виду ait/i2+a2l/22+.. .+anf/n2, где ai, ссг, ... , an—корни характеристического полинома матрицы А формы (/). А — вещественная симметрическая матрица, поэтому существует такая ортогональная матрица С, что С~1АС — диагональная матрица, на диагонали которой расположены корни характеристического полинома матрицы А. Применив в квадратичной форме (1) линейное преобразование переменных (Хг)=С(Уг)9 переведем ее в квадратичную форму G(yi, угУ ..., уп) с матрицей В=СТАС (§ 130). Так как С — ортогональная матрица, то СТ=С-1 и, значит, В=С-*АС. В — диагональная матрица, на ее диагонали расположены корни характеристического полинома матрицы Л. ф Аналогично доказывается Теорема 2. Для всякой эрмитовой квадратичной формы F(xif *2, ... , хп) (2) существует линейное преобразование переменных X=CY с унитарной матрицей С, приводящее эту форму к диагональному виду а1У*У1+а>2У2У2+.. .+апУпУпу где ai, аг, ... , an — корни характеристического поликома матрицы формы (2). § 151. Разложение линейного преобразования в произведение изометрического и самосопряженного Теорема. Для любого линейного преобразования f пространства Еп существуют такие самосопряженное преобразование g и изометрия К что f=hg. (1) ♦ По следствию 4 § 149 существует такое самосопряженное линейное преобразование g, что
428 Глава 15. Линейные преобразования евклидовых и унитарных пространств Пусть вначале g — невырожденное преобразование. Очевидно, тогда и / невырождено. Положим Остается доказать, что h — изометрия. Для В из Еп 4B)h(B)=fg-i(5)fg-i(B) = (fg-i)*fg-i(B)5= = (§-*)* (f*f)g-i(B)B=g-ig*g-i(B)B=e(B)B=BB. Доказано, что h сохраняет длины векторов. Так как h еще и сюръективно, то оно является изометрией. Для невырожденного g теорема доказана. Пусть теперь g вырождено. Тогда £» = Kerg+(Ker£)l, (2) причем в силу теоремы из § 149 подпространство (Kerg)-L инвариантно относительно g. Обозначим символом gi ограничение преобразования g на подпространстве (Kerg)-L. Легко видеть, что Kergi=^{0}. В самом деле, пусть ae=Kergi. Тогда gi(a)*=l), g(a)=a ae=Kerg, ае=Кег g П (Кег g) 1, а=а Таким образом, существует преобразование gi_1. Для В из Еп g(6)g(5)=g*g(6)6=g*(B)B=f*f(5)6=J(6)f(B). (3) В силу равенства (3) Кег g=Kerf, (4) ибо равенства g(B) =0 и f(B) =0 равносильны. Из (4) следует, что dim (f (En)) =п—dim (Кег /) = dim (Кег g) i- и, значит, dim(/(£*))l = dim(Kerg). (5J Для с из (Кег g) J- положим, hi(c)=fgr4c). (6) Тогда h: (Kerg) l—>f(En)—линейное отображение (произведение линейных отображений). hi (с) hi (с) =fgr* (с) fgr* (с) = (fei-1) ♦fei"1 (с) с= = (ёГхГ(Н)В1-1 (с) с= tei-1) V*-1 (с) с= = (^t"1) *gt2gri (с) с=е(с) с=ссу значит, отображение Л4 сохраняет длины векторов. Следовательно, /it — изоморфизм евклидова (унитарного) пространства (Kerg)-L на евклидово (унитарное) пространство f(En). В силу формулы (5) Kerg и (f(£n))JL— изоморфные евклидовы (унитарные) пространства. Пусть h2: Кегg-+(f(En))-L — произвольный их изомор-
§151. Разложение линейного преобразования 429 физм, сохраняющий скалярное произведение. Каждый вектор d пространства Еп в силу формулы (2) единственным образом представляется в виде d=u+v, tteKerg, t/<=(Kerg)-L. Положим h(d)=h2(u)+hi(v). Очевидно, h: Еп-+Еп. Покажем, что h — изометрия. Если еще di = ui+vu wt«=Kerg, iJie(Kerg)J-, а а и at — числа из основного поля, то a5+ai#i= (a//+ai5i) + (ai;+ait/ij, ай+aiWieKer gf а£Ч-сцЙ1<= (Ker g) -L, h(ad+aidi) =h2(^u+aiui) +hi(av+aiVi) = = a[h2(u)+hi(v)]+ailh2(ui)+hl(vi)] = = ah(d}+aih(di)t т. e. h — эндоморфизм векторного пространства. Если ёи ё2, ... , ёт — (7) ортонормированный базис пространства Kerg, а U, t2t ... . Ti — ортонормированный базис пространства (Ker g) -L, то ёи ё2у ... , ёщу Ну h, ... , h — (8) ортонормированный базис пространства Еп. Так как ej^Kerg, 7ье(Кегg)\ то h(ej)=h2(ej), h(Th)=hi(tk). Таким образом, эндоморфизм h переводит ортонормированный базис (8) пространства Еп в h2(et), ... , h2(em)f hi(ti)t ... , hi{h). (9) Ho h2(ei), ... , h2(em)—ортонормированный базис пространства (f(En))±t ибо j(7) — ортонормированный базис пространства Ker g, а преобразование h2 сохраняет скалярное произведение. Точно так же Л±(7±), ... , /ti(7i)—ортонормированный базис пространства f(En). Тогда (9)—ортонормированный базис пространства Еп. Таким образом, эндоморфизм h пространства Еп переводит ортонормированный базис (8) этого пространства в ортонормированный базис (9), т. е. h — изометрия. Если же Kerg={0}, то (Kerg)l = £*. Положим тогда h=hit где hi определяется формулой (6). Легко показать, что верна формула (1). В самом деле, для 5 из Kerg hg(6)=0 и в силу равенства (4) f(6)=0. Если ce(Kerg)J-, то hg(c)=fgi-igi(c)=f(c).
430 Глава 15. Линейные преобразования евклидовых и унитарных пространств Для а из Е" а=Б+с, Л^(Я)=/(5)+/(с)=/(5+с)=/(Я). Формула (1) доказана, ф Следствие 1. Для любого автоморфизма f векторного пространства Еп существует такой ортогональный базис этого пространства, который переводится •автоморфизмом f в ортогональный базис. ♦ Представим автоморфизм f в виде (1), где g — самосопряженное преобразование, h — изометрия. Ясно, что g невырождено. По теореме 4 из § 147 существует ортогональный базис Еп йи «2, ... , йп (10) пространства Еп, составленный из собственных векторов преобразования g. Этот базис переводится преобразованием g в ортогональный базис оцйи агйг, ... 9 аЛйп. который изометрией h переводится в ортогональный базис Vi, V2, ... , tfn. (И) Преобразование f переводит базис (10) в базис (11). # Следствие 2. Всякая квадратная вещественная матрица есть произведение ортогональной и симметрической. Всякая квадратная комплексная матрица есть произведение унитарной и эрмитовой. Доказательство оставлено читателю.
Часть IV ТОЧЕЧНЫЕ ПРОСТРАНСТВА Здесь мы возвращаемся к изучению аналитической геометрии на новом уровне. Теперь имеется возможность использовать аппарат линейной алгебры, развитый в третьей части. Кроме того, объектом исследования будет не только то пространство Е3 которое рассматривается в средней школе и во второй части этой книги, но и некоторые его многомерные обобщения. Глава 16 АФФИННЫЕ ПРОСТРАНСТВА § 152. Определение и простейшие свойства Рассмотрим некоторые свойства пространства Е3. Как указывалось в § 41, каждая упорядоченная пара точек пространства Е3 определяет направленный отрезок, а вслед затем и вектор. От произвольной точки можно единственным образом отложить .данный вектор. Сумму векторов можно получить по правилу за- мыкающей. Наконец, в § 85 было показано, что множество всех векторов пространства Е3 образует трехмерное векторное пространство над полем вещественных чисел. Отправляясь от указанных свойств пространства £3, мы сформулируем теперь определение аффинного пространства. Пусть Я — произвольное поле, элементы которого будем называть числами и обозначать малыми греческими или латинскими буквами, а V — векторное пространство над этим полем, векторы которого будем обозначать малыми латинскими буквами, напечатанными с чертой сверху буквы. Пусть далее А — непустое множество, элементы которого будем обозначать большими латинскими буквами и называть точками. Множество А называется аффинным пространством, связанным с векторным пространством Р, если выполнены следующие аксиомы: 1. Определено отображение декартова произведения А^(У в Л, т. е. каждой паре (М, а), Л1е!Д, ае7 сопоставлена^точка из Л, которая обозначается М+й. 2. М+ (а+5) = (М+а) +5 для любых М^А, а, 5е7. 3. Для любых точек М, N^A существует единственный вектор ае V такой, что M+a=N. (1) *
432 Глава 16* Аффинные пространства Этот вектор будем обозначать символом MN. Равенство (1) перепишется теперь в виде M+MN=N. (V) Если векторное пространство V я-мерно, то связанное с ним аффинное пространство называется л-мерным и обозначается символом Ап. Пространство £3, изучаемое в средней школе и во второй части этой книги, очевидно, удовлетворяет аксиомам аффинного пространства Л3, связанного с трехмерным вещественным векторным пространством. Рассмотрим простейшие следствия, вытекающие из аксиом аффинного пространства. 1. Если М — произвольная точка пространства А и 0 — нуле- вой вектор пространства V, то М+0=М. (2) В самом деле, для пары точек М, М в силу аксиомы 2 существует единственный вектор а такой, что М-\-а=М. Тогда М=М+а=М+ (а+0) = (М+а) +0=М+0, т. е. (2) имеет место. 2. Ш=а=>Ш=—а. (3) Имеем М=М+0=М+ (а-а) = (М+а) + (-а) =N+ (-а), откуда и следует (3). 3. Фиксируем в аффинном пространстве Л, связанном с векторным пространством Р, некоторую точку О. Тогда каждой точке МеА будет соответствовать единственный вектор aeF, удовлетворяющий равенству М=0+а, т. е. вектор ОМ. Этот вектор^назовем радиус-вектором точки М. Обратно, всякий вектор cg7 является радиус-вектором вполне определенной точки М&А. Таким образом, при фиксированной точке О множество радиус-векторов всех точек пространства А 4 совпадает с пространством V.
§ 152. Определение и простейшие свойства 433 4. Для любых трех точек О, M, N^A имеет место «правило замыкающей» ОМ+Ш=ON. (4) ф В самом деле, по аксиоме 2 0+ (ОМ+Ш) = (0+ОМ) +Ш. Далее, по формуле (У) 0+ (ОМ+Ш) =M+MN=N. (5) С другой стороны, 0+ON=N. (6) Из равенств (5) и (6) следует в силу аксиомы 3 равенство (4). # Из формулы (4) получим MN=ON—OM. (7) 5. Равенства N=M+a (8) и ON=OM+a . (9) равносильны. ф Действительно, (8) =>■ a=MN, а тогда из правила замыкающей следует равенство (9). Обратно, (9) =ф- a=ON-ob=MN => (8). ф 1. Пусть V — векторное пространство над полем Р. Будем называть точками векторы пространства vt а сложение точек (векторов пространства V) с векторами из V определим как сложение векторов в V. Аксиомы 1—3 аффинного пространства будут выполняться в силу того, что векторы пространства образуют группу относительно сложения. Построенное пространство будем называть каноническим аффинным пространством, связанным с векторным пространством V, и обозначать A(V). 2. Пусть Р — произвольное поле. Будем называть векторами строки вида (аи а2, ... , ап, 0), а{<=Р, (10) а точками — строки (ЬиЬъ...,Ья, 1), ЬЦ=Р. , (11)
434 Глава 16. Аффинные пространства Определим операции над векторами (10) и точками (11) с помощью равенств: (at, а2, ..., ап, 0) + (а4', а2\... , ап\ 0) = = (ai+я/, а2+а2', ... , ап+ап', 0), К(аи а2у ... , ап, 0) = (Xai, Яа2, ... , Яая, 0), Я(=Я, (6i, 62, ... , bnt \) + (аи а2, ... , ап, 0) = = (6i+ai, 62+а2, ... , Ьп+ап, 1). Тогда легко проверить, что множество всех векторов (10) -образует я-мерное векторное пространство над полем Р — Роп, а множество всех точек (11) — л-мерное аффинное пространство, связанное с векторным пространством Р*п. Будем обозначать это аффинное пространство символом Лоп. § 153. Координаты Системой координат или репером в пространстве Ап называют совокупность (О, ёи ё2, ... , ёп), (1) составленную из некоторой точки ОеЛп и базиса . . ёи ё2, ... , ёп (2) соответствующего векторного пространства Рп. Пусть задан репер (1). Координатами точки М в. репере (1) называются координаты Хи #2, •. • , хп (3) ее радиус-вектора ОМ в базисе (2), т. е. коэффициенты в разложении OM=Xiei+x2e2+.. .+хпёп. В силу теоремы 1 § 92 верна Теорема. Координаты точки в заданном репере определены однозначно. Пусть N — еще одна точка пространства Ап с координатами Уи Уь ... , У п. (4) Тогда ON=yiei+y2ez+.. .+Упё»
§ 153. Координаты 435 и по формуле (7) § 152 MN=ON—OM= (yi—xi)et+ (у2—х2)ё2+. -.+ (уп—хп)ёп. Таким образом, координаты Хи Х2, ... , Хп вектора MN в базисе (2) связаны с координатами (3) и (4) точек М и N в репере (1) формулами Xi=yi—Xu 1= 1, 2, . . . , П. Пусть наряду с рейером (1) задан еще один репер "(О', *',&', ... , £/)• (5) Пусть, далее, он, a2f..., ап — координаты точки О' в репере (1), Т—[ац] — матрица перехода от базиса (2) к базису et, ё2\ ... , ёп'. (6) Пусть еще хи х2, ... , хп (7) и Xi', х2у ... , Хп — , (8) координаты точки М соответственно в реперах (1) и (5). Найдем формулы, связывающие координаты (7) и (8). Введем обозначения: ^ -л ■ Г at 1 а2 L an _ . (*) = Г*11 х2 L Хп _j . (*') = Г*1' 1 **' L Хп Л [ё] — (ёи ёг, ...,ёп), [ё'] = (ё%, ё2г, ..., ёп). Тогда ОМ=[ё](х), 00'= [ё] (а), <9) (УМ=[ё'](д;'). - (10) Учитывая формулу (4) § 94, перепишем (10) в виде 07М=([ё]Т) (х') = [ё] (Т(х>)). (11)
436 Глава 16. Аффинные пространства Из равенств (9), (11) и ОМ=00'+0'М получим [ё](х) = [ё](а) + [ё](Т(х')) = [ё]((*)+Т(х')). (12) В силу линейной независимости векторов (2) из (12) следует (*) = (а)+Г«)- (13) формула преобразования координат. Перепишем (13) в развернутом виде: Xi =(Xii#i/+(Xl2#2/ +• • • + 06in^n/ +0&i, Хч =a21^i,+ a22^2/ +• • -ЛгЫгпХп +«2, Xn = <X>nlXl +CCn2#2 +. . --\-CCnnXn +an. J (14) В этих формулах коэффициентами при х/ служат координаты вектора ei в базисе (2), а свободные члены ai, 02, ... , an 'есть координаты точки О' в репере (1). Заметим, что det(a«i)=3*0, (15) так как [a2j] — матрица перехода от одного базиса пространства Рп к другому. Очевидно обратное: всякие формулы вида (14) при условии (15) есть формулы преобразования координат точек пространства Ап. Из -формулы (13) можно получить выражение для (х') через (х): (13) =>- (х)-(а)=Т(х') =>7-i [(*)-(a)] = (*'), (д/) = (Р)+7^(х), где (р)=-Г-»(а). Пусть (у) и (</') — координатные столбцы точки N соответственно в реперах (1) и (5). Тогда по формуле (13) _^ M = (a)+W). (16) Вектор MN имеет в базисах (2) и (6) соответственно координатные столбцы Х= (у) — (х) и Х'=(у!) — (х'). В силу формул (13) и (16) Х=[(а)+Т(у')]-[(а)+Т(х')] = =Т[(у')-(х>)]=ТХ'- формула преобразования координат вектора. Она получена ранее в § 94. '
§ 154. Плоскости 437 § 154. Плоскости В § 65 мы получили следующее уравнение прямой А: г=го+Ш, (1) где fo — радиус-вектор некоторой точки М0 прямой, а — направляющий вектор прямой, а / — параметр, принимающий все вещественные значения. В § 66 было получено аналогичное уравнение плоскости П: r=ro+tiai+t2a2. В силу формул (8) и (9) § 152 уравнение (1) можно представить в виде M=M0+ta, (2) и, следовательно, прямая А есть множество всех точек (2). Аналогично плоскость П есть множество точек А1=М о+/iai+/2аг. Множество векторов ta есть одномерное подпространство R1 пространства R3 всех векторов, а множество {^Й+^яг} —двумерное подпространство R2. Поэтому прямую А можно задать, как множество M0+Ri={M0+v\ve-Ri}9 а плоскость П — как множество M0+R2= {iWo-f v | £е=/?2}. i Теперь мы определим понятия прямой и плоскости в /г-мерном аффинном пространстве. Пусть Рп — /г-мерное векторное пространство над полем Р и Ап — связанное с ним аффинное пространство. Пусть далее, М0 — некоторая точка пространства Лп, а Рт — m-мерное подпространство пространства Рп. Множество М0+Рт= {Mo+v\ve=Pm} (3) назовем т-мерной плоскостью, точку М0 — начальной точкой плоскости (3)у а подпространство Рт — направляющим пространством этой плоскости. Очевидно, нульмерная плоскость М0-\-{0}—это одна точка М0. Единственной л-мерной плоскостью является само пространство Ап. Одномерную плоскость назовем прямой, а (/г—-1)- мерную — гиперплоскостью. Отметим некоторые простейшие свойства плоскостей.
438 Глава 16. Аффинные пространства Теорема L В качестве начальной можно взять любую точку плоскости. ф Пусть точка Mi принадлежит плоскости (3). Нам нужно доказать, что Mi+Pm=M0+Pm. Но М$=Мо+би vt^Pm, поэтому для любого вектора v^Pm Mi+iJ= (Af0+£>i) +£J=Af0+ (vi+v) =Af0+^2, где V2=vi+v. Легко видеть, что vz пробегает при фиксированном i>t все пространство Рт, если v пробегает Р™. ф Следствие. Две плоскости, имеющие общую точку и одно и то же направляющее пространство, совпадают. Теорема 2. Если точки М и N принадлежат плоскости (3), то вектор MN входит в направляющее пространство Рт этой плоскости. Обратно, для любого вектора а^Рт в плоскости (S) найдутся такие точки М и N, что MN=a. ф Если М — точка плоскости (3), то эту плоскость в силу теоремы 1 можно записать в виде М+Рт. Если точка N также принадлежит этой плоскости, то N=M+v, v^Pm =>- v=MN. Обратно, если v^Pm, a M — произвольная точка плоскости (3), то точка N=M-\-v принадлежит плоскости (3) и v=MN. ф Теорема 3. Плоскость (3) является m-мерным аффинным пространством, связанным с направляющим пространством Ртэтой плоскости. ф Пусть М — произвольная точка плоскости (3), а уеР™. Плоскость (3) можно задать как множество М + Р™. Тогда M+v — также точка плоскости (3), следовательно, аксиома 1 в определении аффинного пространства выполняется. Аксиома 2 справедлива для всех точек пространства Ап и всех векторов .пространства Рп и потому в проверке не нуждается. Пусть, на-
§ 154. Плоскости 439 конец, М и N — произвольные точки плоскости (3). По теореме 2 MN^Pm и, значит, аксиома 3 выполняется, ф Будем обозначать в дальнейшем m-мерные плоскости через Ат, Вт и т. д. Пусть Q — произвольное непустое множество точек пространства Ап. Будем искать минимальную плоскость, содержащую все точки множества Q, т. е. плоскость П, удовлетворяющую условиям: 1) Й<=П; 2) любая плоскость, содержащая Q, содержит П. Теорема 4. Для любого непустого множества Q<=:An существует единственная минимальная плоскость, содержащая Q. ф Если П и IIi — две искомые плоскости, то IIsHi и ШеП, поэтому n=IIi. Итак, если искомая плоскость существует, то она единственна. Покажем теперь, что такая плоскость существует. Пусть Af0eQ. Рассмотрим множество и его линейную оболочку L(A) =Ph. Покажем, что A(Q)=M0+Ph (4) есть искомая плоскость. Во-первых, плоскость (4) содержит все точки множества Q. С другой стороны, если некоторая плоскость П содержит все точки из Q, то ее направляющее пространство содержит все векторы из Л, а также их линейные комбинации, поэтому П^Л (Q). В силу единственности искомой плоскости указанное построение не зависит от выбора начальной точки M0eQ. Заметим также, что размерность плоскости A(Q) равна, рангу системы векторов Л. # Плоскость Л(й), построенную в теореме 4, будем называть аффинной оболочкой множества Q или плоскостью, натянутой на Q. Точки М0у Ми ..., Мн пространства* Ап будем называть аффинно независимыми, если их аффинная оболочка Л-мерна. Из доказательства теоремы 4 следует, что точки М0, Ми ... , Afjt аффинно независимы тогда и только тогда,'когда векторы 'AfoMi, AfoAf2, • • • у М0Мк линейно независимы.
440 Глава 16. Аффинные пространства Теорема 5. Через любые k-\-\ аффинно независимых точек пространства Ап проходит единственная k-мерная плоскость. Во всякой k-мерной плоскости есть k+l и нет больше, чем £+1, аффинно независимых точек. Любую систему аффинно независимых точек в k-мерной плоскости можно дополнить до системы, состоящей из k-\-l аффинно независимых точек, лежащих в этой плоскости. ♦ Первое утверждение теоремы следует из определения аффинно независимых точек и теоремы 4. Пусть теперь М0+Р* (5) произвольная ^-мерная плоскость, a vt, £2, ... , v'k — базис пространства Рн. Тогда Mo, Mo+vu ... , Мо+ин — аффинно независимые точки. Наконец, предположим, что в плоскости (5) существует &-J-1+/ аффинно независимых точек, где />0. Тогда аффинная оболочка этой системы точек имела бы размерность k+l и в то же время содержалась бы в ^-мерной плоскости (5). Полученное противоречие доказывает второе утверждение теоремы. Пусть М0, Miy ... , Mi — аффинно независимые точки, лежащие в плоскости Ak. Тогда векторы М^Ми М»М2у ... , NkMt (6) линейно независимы. В силу теоремы 3 § 80 система векторов (6) может быть дополнена некоторыми векторами AfoMz+i, М0М1+2, ... у M0Mk до базиса направляющего пространства Рк плоскости А*. Тогда Мо, Ми ... , Ми Mi+u ... ,Mk есть система k-\-\ аффинно независимых точек, лежащих в плоскости Ак. ф Следствие. Через любые две различные точки пространства Ап проходит единственная прямая. Пусть в пространстве Ап фиксирована точка О. Тогда в силу свойства 5 § 152 плоскость (5) можно задать векторным уравнением f=h+P\ (7)
§ 155. Геометрическое истолкование систем линейных уравнений 441 где г0=ОМо — радиус-вектор точки М0, а г=ОМ — радиус-вектор произвольной точки М этой_шюскости. Если йи 02, ... , a>k — некоторый базис пространства Рк, то уравнение (7) можно представить в виде r=r0+ttai+.. .+tkuh. (8) Когда tu ..., tk принимают всевозможные значения из Я, точка-Af с радиус-вектором (8) описывает плоскость Ah. (8) называется векторным параметрическим уравнением этой плоскости, a tu ..., tk — параметрами. Если точка О принадлежит плоскости А\ то уравнение этой плоскости можно записать, взяв О в качестве начальной точки, в виде r=fi5i+fe52+l. • .+*ьйь. В этом случае множество всех радиус-векторов точек плоскости совпадает с направляющим пространством Ph. Если же точка О не принадлежит плоскости Ah, то множество радиус-векторов точек Ak не есть подпространство пространства Рп, ибо, например, 0 не входит в это множество. § 155. Геометрическое истолкование систем линейных уравнений Пусть задана система линейных уравнений 0СЦ#1 +#12*2 -{-. . . + ain*n =Pl, | 0&2i#l +0C22^2 +• • - + a2n*n = ^2, I n, < ч 0&ni#i + an2*2+. • • + 0&nn*n = Pn, J где an, Рг принадлежат основному полю Р. Систему однородных линейных уравнений схгЛ +а22^г +.. -+«271^71=О, I ,~v CCni*i + 0&n2*2+- . . + ann^n = 0 J будет называть приведенной системой для системы (1). Следующие две леммы указывают на связь, существующую между решениями систем (1) и (2).
142 Глава 16. Аффинные пространства Лемма 1. Сумма решения системы (1) и решения системы (2) есть решение системы (1). Лемма 2. Разность любых двух решений системы (1) есть ре- шение системы (2). Мы докажем первую лемму, а доказательство второй оставим читателю. ♦ Пусть (ки ta, ... , ЯЛ) —решение системы (1), a (|ц, Ия, ... , [in) —решение системы (2). Тогда для г= 1,2, ... , пг имеем aii(ki+[Al)+at2(ta+|X2)+. . . + Щп(К+\1п) = + (аг1Ц1+аг2Ц2+- • - + ^in[ln) =Рг+0 = рг, -_-. т. е. (Xi+iiu ^2+[i2, ... , kn+iin) — решение системы (1). ф Из этих двух лемм вытекает, очевидно, Теорема 1. Все решения совместной системы линейных уравнений (1) можно получить, складывая какое-либо одно решение этой системы с каждым решением приведенной системы (2). Дадим полученным результатам геометрическое истолковав ние. В аффинном пространстве Ап, связанном с векторным пространством Рп, фиксируем репер - (О, ёи ё2у ... ,ёп). (3) Тогда Рп={ОМ\М^Ап}. Координатами точки М в репере (3) являются координаты вектора СШ в базисе ёи ё2, ... , ёп. В силу следствия 2 § 112 множество векторов-решений системы (2) есть (я—г)-мерное подпространство Рп_г пространства РЛ, где г — ранг матрицы системы. Если fii, йг, ... , ап-г — базис этого подпространства, то каждый его вектор г представляется в виде r = tiUi+. ., + tn-rUn-r, U<=P. (4) В силу теоремы 1, если система (1) совместна и вектор г0 — одно из ее решений, то все ее решения г получаются по формуле r=fo+*iai+.. .+fn_ran-r. <5) Точку М^Ап назовем решением системы (1) (или (2)), если ее радиус-вектор г есть решение этой системы. Так как уравне-
§ 155. Геометрическое истолкование систем линейных уравнений 443 ние (5) задает (л—г) -мерную плоскость, направляющее пространство Рп~г которой есть подпространство векторов (4), т. е. подпространство решений системы (2), то справедлива Теорема 2. Пусть (1) — совместная система линейных уравнений, г — ранг ее матрицы. Тогда множество точек аффинного пространства Ап, являющихся решениями этой системы, есть (п—г) -мерная плоскость М0-\-Рп-т, направляющее пространство Рп-Г которой совпадает с подпространством решений приведенной системы (2). (5) —уравнение этой плоскости. Плоскость (5) проходит через начало координат тогда и только тогда, когда система (1) однородная. Верна и обратная Теорема 3. Любая k-мерная плоскость Ah аффинного пространства Ап есть множество всех решений некоторой линейной системы, состоящей из n—k линейно независимых уравнений с п неизвестными. ф Пусть плоскость Ah проходит через начало координат О. Тогда Ph={OM\M&Ah} —направляющее пространство плоскости Ah. В силу теоремы 3 § 112 существует однородная система линейных уравнений (2), векторы-решения, которой образуют пространство Ph, причем можно считать, что m=n—k. Множество точек-решений этой системы совпадает с плоскостью Ak. Пусть теперь плоскость Ah не проходит через начало координат и задается уравнением (5), где n—r=k. Рассмотрим плоскость Bk> проходящую через начало координат и определяемую уравнением (4). Построим однородную систему (2) (m=r), определяющую плоскость Bh. Возьмем теперь в плоскости Ak какую-либо точку, например М0 с радиус-вектором го, и, подставив ее в систему (1) с определенными выше коэффициентами а#, найдем Pi, р2, ... , Рп. Построенная таким образом неоднородная система (1) в силу теоремы 1 будет задавать плоскость Ак. ф Из теорем 2 и 3, в частности, следует, что линейное уравнение ai*i+a2*2+. < .+an*n=P, (6) задает гиперплоскость в пространстве Ап и, обратно, любая гиперплоскость пространства Ап может быть задана уравнением (6). Частные случаи этого утверждения были доказаны в §55 и 61.
444 Глава 16. Аффинные пространства § 156. Взаимное расположение двух плоскостей Рассмотрим в аффинном пространстве Ап, связанном с векторным пространстаом Рп, две плоскости Ah=M0+V, (1) Bl=N0+W. (2) Будем называть эти плоскости пересекающимися, если они имеют по крайней мере одну общую точку. Теорема 1. Плоскости (1) и (2) пересекаются тогда и лишь тогда, когда AUNo^V+W. (3) Если эти плоскости пересекаются, то их пересечение есть плоскость с направляющим пространством V [\ W (см. § 97). ф Если М — общая точка плоскостей (1) и (2), то M=M0+a=No+5t flEF, b^W. Поэтому Afo+(a—5)= No, AWV0=a-5eF+f. Равенства (1) и (2) можно записать теперь в виде Ah=M+V, Bi=M+W. (4) Если с — произвольный вектор пространства Ffl^, то точка N=M+c, очевидно, принадлежит пересечению плоскостей (4). Пусть теперь N — произвольная точка из пересечения плоскостей (4). Тогда найдутся такие векторы d и ё, что N=M'+d=M+e. Отсюда следует равенство й=ё и поэтому <fePf| W- Итак, если плоскости (1) и (2) имеют общую точку, то их пересечение есть . плоскость __ Cm=M+Vf[W и имеет место (3). Обратно, пусть справедливо (3). Тогда М0Ы0=а+Б, где
§ 156. Взаимное расположение двух плоскостей 445 поэтому М0+ (а+Б) =N0k M+a=N-b<=Ab f| В1, т. е. плоскости (1) и (2) пересекаются. # Из результатов § 154 следует, что для любых двух плоскостей (1) и (2) существует их аффинная оболочка, т. е. минимальная плоскость, содержащая плоскости (1) и (2). Теорема 2. Пусть m — размерность пересечения V (]W направляющих пространств плоскостей (1) и (2). Тогда размерность аффинной оболочки плоскостей (1) и (2) равна s=k+l—m, (5) если эти плоскости пересекаются, и Si=k+l—m+l, (6) если они не пересекаются. ф Пусть плоскости (1) и (2) пересекаются и О — их общая точка. Если принять эту точку за начало отсчета радиус-векторов, то множества радиус-векторов точек плоскостей (1) и (2) и их пересечения есть соответственно V9 W и V [)W. Но тогда формула 5 следует из теоремы 2 § 97. Пусть теперь плоскости (1)_и (2) не пересекаются. Рассмотрим векторное пространство S = V+W+T, где Т — одномерное подпространство в Рп, натянутое на вектор MqNq. В силу теоремы 1 вектор MqN0 не принадлежит подпространству V-\-W> поэтому dim S=k+l—m+1. Плоскость D=M0+S9 (7) очевидно, содержит каждую из плоскостей (1) и (2). С другой стороны, любая плоскость, содержащая плоскости (1) и (2), содержит плоскость (7). Итак, (7) есть аффинная оболочка плоскостей (1) и (2) и формула (6) доказана, ф Назовем характеристикой пары плоскостей (1) и (2) упорядоченный набор чисел (k, /, my s), где k и I — размерности этих плоскостей, 5 — размерность их аффинной оболочки и m — размерность пересечения их направляющих подпространств. Без ограничения общности можно предположить, что k^l. Тогда, очевидно,
446 Глава 16. Аффинные пространства Непересекающиеся плоскости (1) и (2) называются: 1) параллельными, если m=k\ 2) частично параллельными, если 0<т<&; 3) скрещивающимися, если т=0. Рис. 100 На рис. 100 изображены все случаи взаимного расположения двух двумерных плоскостей в пространстве Е3 и указаны соответствующие характеристики. § 157. Аффинное отображение Пусть А и At — аффинные пространства, связанные соответственно с векторными пространствами V и Fi над одним и тем же полем. Отображение . f: Л-WU (1) называется аффинным, если существует такое линейное отображение: Ф: V-+Vu (2) что /(Af+a)=/(Af)+q>(fi) для любых М^А и aeF. Отображение ф называется однородной частью отображения!. Теорема 1. Для любого линейного отображения (2) и любых точек М^А и Mi^Ai существует единственное аффинное отображение f такое, что ф — его однородная часть и Mi=f(M). ♦ Если искомое отображение / существует, то для любого f(M+a)=Mi+<f(a), (3)
§ 157. Аффинное отображение 447 • -» - -■ - ■—■... откуда видно, что оно определяется однозначно. С другой стороны, отображение /, определяемое формулой (3), переводит М в Мх и является аффинным с однородной частью ф, так как для любых N^A и 5eF имеем f(N+B)=f((M+a)+b)=f(M+(a+B)) = =Ali+ф (а+Б) =Mi+q> (а) +Ф (Б) = =f(M+a)+<v(B)=f(N)+<?(B\. • 1 Теорема 2. Пусть M0f Miy ... , Мп — система аффинно независимых точек пространства Ап, a N0r Nu ..., Nn — произвольная система точек пространства А. Тогда существует единственное аффинное отображение f: 4*-Wl, переводящее Mi в Ni, /=0, 1, ..., п. ф Если ф — однородная часть отображения /, то условия f(Mi)=Nu t=0, l,... ,n, равносильны следующим: f(M0)=N09 (4) ф (AUMi) =N^NU i= 1, 2, ... , л. (5) Так как векторы MqM{ линейно независимы, то по теореме 1 из § 100 существует единственное линейное отображение (2), удовлетворяющее условиям (5). Тогда по теореме 1 существует единственное аффинное отображение (1), удовлетворяющее условиям (4), (5). # Пусть A, Ai и Ач — аффинные пространства, связанные соответственно с векторными пространствами F, Fi и Чг над одним и тем же полем. Пусть, далее, наряду с (1) задано аффинное отображение * /ь Ai-+A2 с однородной частью _ ф1: Fi->F2- Тогда имеет место Теорема 3. Отображение /i/ является аффинным с однородной -частью ф1ф.
448 Глава 16. Аффинные пространства ф Пусть М^А и asV. Тогда ЩМ+а)=и [f(M) +Ф(a)]=hf(M)+W(а). • § 158. Изоморфизмы Пусть Л и Л± — аффинные пространства, связанные соответственно с векторными пространствами V и Ft над полем Р, и f:A-+Ai- (1) аффинное отображение с однородной частью q>: V-*rVt. (2) Если отображение / биективно, оно называется изоморфизмом пространства А на пространство Ai. Говорят, что аффинное пространство А изоморфно аффинному пространству Л4 и пишут А^Аи если существует изоморфизм (1). Теорема 1. Аффинное отображение (1) является изоморфиз-- мом тогда и только тогда, когда его однородная часть (2) — изоморфизм. ф Если М^А, то А = {М+а\а<=Щ. f(A) есть множество точек пространства At: f(A) = {f(M)+<v(a)\a<=V}. (3) Множество (3) ^совпадает с пространством Л4 тогда и только тогда, когда ф(Т) = Vu т. е. когда ф — изоморфизм, ф Теорема 2. Изоморфизм аффинных пространств есть эквивалентность в множестве всех аффинных пространств. ф 1. Покажем, что А^А. Для этого в равенстве f(AH-a)=/(Af)+q>(a), (4) определяющем изоморфизм, достаточно взять в качестве / и ф тождественные отображения. 2. Покажем, что A^Ai=>Ai^A. * (5) Так как A^Aif то существует биективное отображение (1), удов-
§ 158. Изоморфизмы 449 летворяющее условию (4). При этом линейное отображение ф: V-^Vt также биективно. Рассмотрим биективные отображения f-1: Ar+A и ф"1: Ft->F. Пусть Г Mi^Au uieFi, f-i(Ml)=MJ ф-1(аО=а. Тогда /-K^i+ai)^/-1 [/(М)+Ф(а)]=/-* [f(M+a)] = =M+a=f-i(Mi)+<p-i(ai)9 т. е. /-1 — изоморфизм и соотношение (5) доказано. 3. Наконец, соотношение A^Ai и Ai^A2=>A^A2 следует из теоремы 3 предыдущего параграфа, ф Теорема 3. Для каждого векторного пространства V существует единственное с точностью до изоморфизма аффинное пространство, связанное с V. ф В § 152 мы связали с каждым векторным пространством V каноническое аффинное пространство A(V), взяв в качестве точек векторы пространства V и определив сложение точек с векторами как сложение векторов. Покажем теперь, что произвольное аффинное пространство Л, связанное с векторным пространством F, изоморфно пространству А (V). Для этого выберем в А какую-либо точку О и построим отображение f: A-+A(V), положив для произвольной точки МеЛ f(M)'=OMe=A(V). Как показано в § 152,отображение / биективно. Для М^А и аеГ f(M+a)=f[(0+OM)+a]=f [0+(OM+a)] = = OM+a=f(M)+J. Итак, / удовлетворяет условию (4), если ф — тождественное отображение, т. е. / — изоморфизм, ф
450 Глава 16. Аффинные пространства Теорема 4. Любые два аффинных пространства А и А и связанные с изоморфными векторными пространствами V и Vi, изоморфны. ф_ Рассмотрим канонические аффинные пространства A(V) и A (Fi). По теореме 3 A**A(V), Ai^A(Vi). Так как отношение изоморфизма транзитивно, то для доказательства теоремы_ достаточно убедиться в том, что изоморфны пространства A(V) и А(7\). Но изоморфизм этих пространств следует из изоморфизма пространств V и 7и в качестве отображения f в равенстве (4) можно взять изоморфизм (2). ф Из теоремы 3 и теоремы 2 § 101 вытекает, очевидно, Теорема 5. Пусть Р — произвольное поле, а п — натуральное число. Существует единственное с точностью до изоморфизма аффинное пространство, связанное с n-мерным векторным пространством над полем Р. § 159. Аффинные преобразования Аффинное отображение пространства Ап в себя называется аффинным преобразованием этого пространства. Иначе говоря, преобразование f пространства Ап называется аффинным, если существует такое линейное преобразование ф пространства Рп, с которым связано Ап, что для МеЛп, а^Рп f(Af+S)=f(M)+q>(a). В частности, аффинным преобразованием является всякий изоморфизм пространства Ап на себя (см. § 158). Однако есть аффинные преобразования, .не являющиеся изоморфизмами. Например, пусть О — фиксированная точка пространства Ап. Для М^Ап положим f(M) =0. Тогда f(M+a)=O=f(M)+0(a)9 где 0 — нулевое преобразование пространства Рп. Пусть а^Рп. Определим преобразование т_ пространства Ап формулой х_(М)=М+а, Ме=Ап. Преобразование т_ назовем параллельным сдвигом пространства Ап на вектор а.
§ 159. Аффинные преобразования 451 Теорема 1. т _ — аффинное преобразование, однородная часть которого — тождественное преобразование. Всякое аффинное преобразование, однородная часть которого — тождественное преобразование, есть параллельный сдвиг. ф Для N(=An, Бе=Рп x_(N+6) = (N+Б) +а= (N+a) +5=т. (N) +е (Б). Первое утверждение теоремы доказано. Пусть теперь / — аффинное преобразование пространства Ап с тождественной однородной частью, Ме=Л", M'=f(M). Тогда f(M) =M+MM'. Если теперь N — произвольная точка пространства Лп, то N=M+a =>f(N) =f(M) +a=(M+MM') +a= = (M+a)+im/=N+Am/=>f=x_^ . • мм' Теорема 2. Все параллельные сдвиги пространства Ап составляют относительно умножения преобразований группу, изоморфную аддитивной группе пространства Рп. ф Определим отображение ф: Рп->Т, где Т — множество всех параллельных сдвигов пространства Ant формулой <p(«)=V Тогда ф(а+5) =т_ -. Но для М^Ап хй+в(М) =М+ (й+Б) = (М+5) +а= -Te[Tff(Af)]-Vff(AI). Поэтому Ф(с+5)=т.т5.' ♦ Биективность отображения ф очевидна. Таким образом, ф — изоморфизм, и теорема следует из теоремы 2 § 20. ф
452 Глава 16. Аффинные пространства Аффинное^преобразование / пространства Ап назовем центро-\ аффинным относительно некоторой тонки О, если f(0) = 0. Цент-] роаффннное преобразование определяется своей однородной! частью ф, так как для М^Ап f(M)=f(0+OM)=f(0)+(p(OM)=0^(OM). 1 I Очевидно, произведение центроаффинных относительно точки О преобразований также является центроаффинным преобразованием относительно этой точки. Теорема 3. Пусть О^Ап, а ф — линейное преобразование пространства Рп. Существует единственное центроаффинное относительно точки О преобразование f пространства Ап, имеющее ф своей однородной частью. Это утверждение следует из теоремы 1 § 157. Теорема 4. Пусть 0&4П. Всякое аффинное преобразование f пространства Ап однозначно разлагается в произведение параллельного сдвига и центроаффинного относительно точки О преобразования. ф Если f(O) =0, то f=ef=xjf. Пусть 1(0)=МФ0, ОМ=а, ф — однородная часть преобразования /. Построим центроаффинное относительно точки О преобразование if, однородная часть которого совпадает с ф: для rf^An yp(N)=0+(f(ON). Тогда т.*(^)=т^О+ф(0^)] = [0+Ф(ОЛ?)]+а= = (0+а) +ф (ON) =М+ф (ON) =f (О) +Ф (ON) = =f(0+ON)=f(N)^xu<p=f. (1) Докажем сейчас единственность разложения (1). Если еще где \|н — центроаффинное относительно точки О .преобразова-
§ 159. Аффинные преобразования 453 ние, то т.ф=т^1 =* т.*(О) =t^i(О) =► т .(О) =0+а= Выберем в пространстве Ап репер (О, ёь ё2, ... , ёп). (2) Пусть ось аг, ... , <хп — координаты вектора а в базисе ёи ё2,'... , ёп, (3) Xi, X2,..., хп и лч', х2',..., *п' — координаты соответственно 'Гочек М и т_(Л1) б репере (2). Тогда из равенства- х.(М)=М+а следуют формулы параллельного сдвига: Xi'=Xi+ai9 i=l, 2, ... , п. (4) Пусть -ф — центроаффинное относительно точки О преобразование, ф — его однородная часть, Л==[аг;] —матрица преобразования ф в базисе (3), Г*11 х2 ! L Хп _ , (о= Г*' 1 *2' L Хп _| координатные столбцы соответственно точек М и -ф (Af) в репере (2). Так как $(М)=0-\-у(ОМ) и координатный столбец вектора ф(ОЛ1) в базисе (3) равен А (х), то (*')=Л(х), . (5) т. е. п Xi'= ]£ ttijXj, 1=1, 2, ... , /г. (6) j=i (5) (или (6)) — формулы центроаффинного относительно точки О преобразования в репере (2).
454 Глава 16, Аффинные пространства Учитывая теорему 4 и формулы (4), (6), получим формулы произвольного аффинного преобразования Xi = ]£ aijXj+au /= 1, 2, ..., я, (7) или (х')=А(х) + (а). (8) § 160. Автоморфизмы Изоморфизм аффинного пространства на себя называется автоморфизмом или невырожденным аффинным преобразованием этого пространства. Как показано в предыдущем параграфе, формулы произволь- ' ного аффинного преобразования / пространства Ап имеют вид п Xi'*= JS <Xij*j+Cti, 1=1, 2, ..... /I, (1) где Xj — координаты произвольной точки М пространства Ап в некотором репере, а х/ — координаты точки f(M) в том же репере. Однородная часть ф преобразования / выражается нри этом формулами п Xi = ]£ &ijXi> 1=1, 2, . . . , П. Поскольку преобразование / является автоморфизмом тогда и. только тогда, когда ф— автоморфизм (§ 158), а для этого необходимым и достаточным условием является неравенство (§ 105) detta^O, (2) то имеет место Теорема 1. Аффинное преобразование (1) является автоморфизмом тогда и только тогда, когда имеет место неравенство (2). В частности, параллельный сдвиг — автоморфизм. Очевидна Теорема 2. Множество всех автоморфизмов пространства Ап— группа относительно умножения. Группу всех автоморфизмов пространства Ап над полем Р называют аффинной группой степени п над Р.
§ 160. Автоморфизмы 455 Теорема 3. При автоморфизме f пространства Ап всякий репер (О, ёи ё2, ... , ёп) : (3) переходит в репер (О', ei', h', • • • , ёпЪ (4) а любая точка М, имеющая в репере (3) координаты xiy хг, ... , хп, переходит в точку М', имеющую координатами в репере (4) те оке числа. ♦ Так как однородная часть ф автоморфизма / является автоморфизмом векторного пространства Рп, то базис ёи ёг> ... , ёп переходит в базис, и первая часть теоремы доказана. Далее, координаты точки М в репере (3) определяются как коэффициенты разложения OM=Xiet+x2e2-\-.. .+хпёп. Но при автоморфизме векторного пространства линейные зависимости сохраняются, следовательно, 07M'=xiei'+x2e2'-\-. - .+хпёп'. • Теорема 4. Для любых двух реперов (3) и (4) аффинного пространства, Ап существует единственный автоморфизм f, переводящий первый репер во второй. ф Репер (3) вполне определяется заданием упорядоченной системы из Аг+1 аффинно независимых точек О, O+ei, ... , 0-\-ёп. То же относится и к любому другому реперу. Но тогда теорема 4 следует из теоремы 2 § 157. ф Теорема 5. Для любых двух систем аффинно независимых точек М0, Мь ... , МЛ, (5) Mo', MS, ... , Мк* (6) в пространстве Ап существует'автоморфизм этого пространства, переводящий точки первой системы в соответствующие точки второй системы. ф Так как система векторов М0МЬ М0М2, ... , MQMk *
456 Глава 16. Аффинные пространства линейно независима, то ее можно дополнить некоторыми векторами MoMk+u M0Mk+2, ... , М0Мп так, чтобы получился репер (ЛГо, Юли НШь ... , MrfAn) (7) пространства Ап. Аналогично построим еще один репер (М0\ Mo'Mt', Мо'М2', ... , М0'Мп') (8) пространства А71. Ацтоморфизм пространства Апу переводящий репер (7) в репер (8), переводит точки (5) в точки (6). ф § 161. Геометрия аффинной группы Пусть К — непустое множество, элементы которого будем называть точками, и G — некоторая подгруппа группы всех подстановок множества К Фигурой называется произвольное множество точек из /С. Под геометрией группы G будем понимать совокупность всех свойств фигур множества /С, которые сохраняются при любой подстановке из группы G. Две фигуры <Di и Фг называются эквивалентными относительно группы G, если в G существует подстановка, переводящая одну фигуру в другую. Множество всех фигур разбивается на классы эквивалентных фигур. Любые две фигуры, принадлежащие одно- му классу, можно 'перевести друг в друга с помощью преобразований из группы G. Фигуры же, взятые из разных классов, пре-. образованиями из группы G друг в друга не переводятся. Рассмотрим в качестве множества К аффинное пространство* Лп, связанное с некоторым полем Р, а в качестве группы G — аффинную группу, т. е. группу автоморфизмов пространства Ап. Свойства фигур, сохраняющиеся при всех преобразованиях аффинной группы, будем называть аффинными. Рассмотрим некоторые из этих свойств. Теорема L Автоморфизм f пространства Ап всякую k-мерную плоскость Ak переводит в k-мерную плоскость Bk, причем отображение Ah на Bh является аффинным. Все плоскости данной раз- мерности k в пространстве Ап аффинно эквивалентны, т. е. образуют один аффинный класс.
§161. Геометрия аффинной группы 457 + Плоскость Ah есть множество точек {M+a\a<=V}, (1) где М — некоторая фиксированная точка из Ah, a V — направляющее пространство плоскости Ah. Автоморфизм / переводит множество (1) в множество ЛКЛ*)+Ф(а)|аеР>,- (2) Где ф — автоморфизм пространства Рп, являющийся однородной частью автоморфизма /. Так как при автоморфизме векторного пространства любое его &:мерное подпространство переходит в ^-мерное подпространство, то множество точек (2) образует А-мерную плоскость Bh. Аффинность отображения Ah на Bh оче- . видна. Пусть теперь Ah и Bh — две произвольные /z-мерные плоскости. Выберем в плоскости Ah какую-либо систему &+1 аффинно независимых -точек Л*о, Mi9 ... ,Mh ^ (3) и в плоскости Bk некоторую систему k-\-l аффинно независимых точек Mo', MS, ... , Mh'. (4) В силу теоремы 5 § 160 существует автоморфизм пространства Ап, переводящий точки (3) в точки (4). Этот автоморфизм переведет плоскость Ак в плоскость Вк. ф Теорема 2. Множество всех пар плоскостей пространства Ап, имеющих одну и ту же характеристику, образует один аффинный класс. ф Пусть Ak={M+a\a<=V}t &={N+5\beEW} — две плоскости пространства Ап с характеристикой (k, I, m, s). Обозначим через Т пересечение подпространств V и W, а через Е — аффинную оболочку плоскостей Ah и С1. Рассмотрим теперь произвольный автоморфизм f пространства Ап с однородной частью ф. Имеем: /(А*) = {/(А1)+ф(е)|ф(й)еЧ.(Г)>, /(С') = {Г(^)+Ф(5).|ф(5)еФ(1Г)},. &\my(V)=k, dim<f(W)=l
458 Глава 16. Аффинные пространства Итак, плоскости f(Ak)__n /(С')_имеют_размерности соответственно k и /. Из равенства <p(V) П ф(^) =ф(7,) вытекает, что третье число в характеристике плоскостей f(Ak) и f(Cl) равно т. Заметим далее, что автоморфизм / пространства Ап переводит пересекающиеся плоскости в пересекающиеся и непересекающиеся — в непересекающиеся. Теперь цз теоремы 2 § 156 вытекает, что аффинная оболочка пары плоскостей f(Ah) и f(Cl) имеет размерность 5. Итак, любые две пары плоскостей пространства, принадлежащие одному аффинному классу, имеют одну и ту же характеристику. Пусть теперь заданы две пары плоскостей пространства Ап, имеющие одну и ту же характеристику (k, /, т, s): Ah и С1, Вк и D1. Обозначим через Е8 аффинную оболочку плоскостей Ак и С1, а через F8— аффинную оболочку плоскостей Вк и D1. Если плоскости Ak и С1 пересекаются (а значит, в силу теоремы 2 § 156 пересекаются и плоскости Вк и D1), то положим Gm=Ah П С1, Н™=Вк П DK Пусть Мо, Ми ... , Мт- (5) аффинно независимые точки, лежащие в плоскости Gm, и М0', М,\ ... , Мт'- (6) аффинно независимые точки, лежащие в плоскости Нтл (Если плоскости Ah и С1 не пересекаются, то (5) й (6) — пустые множества.) В силу теоремы 5 § 154 существуют такие точки Mm+U Мт+2, . • • , Mk\ Nm+U Nm+2, • • • , Ni\ M'm+u M'm+2y . . . , Mh'\ N'm+U N'm+2, ...,W, ЧТО M0, All, ... , Mmf Mm+U • • • , Mk — система аффинно независимых точек в плоскости Ак, Мо, Ми ... , Mm, Nm+U ...,Ni — система аффинно независимых точек в плоскости С1, Mq, ... , Mm, Mm+U • • • , Mk, Nm+U ... 9Ni — (7) система аффинно независимых точек в плоскости Е8, Afo', Mi', . . . , Mm', Mfm+U ...,Mkl-
§ 161. Геометрия аффинной группы 459' система аффинно независимых точек в плоскости В\ MQ',Mi'9...;Mm'9-N'n«i9...9Ni'- система аффинно независимых точек в плоскости D1 и Мо'9 ... , Мт\ MWi, • • • , Mk\ N'm+it ... , N{— (8) система аффинно независимых точек в плоскости Fs. В силу теоремы 5 § 160 существует автоморфизм / пространства Апу переводящий точки (7) в соответствующие точки (8). Очевидно, f{A*)=B\ f(C*)=DK • Следствие. При любом автоморфизме пространства А3 параллельные прямые переходят в параллельные прямые, а параллельные плоскости в параллельные плоскости. Далее в этом параграфе основное поле Р предполагается числовым. Три точки аффинного пространства, лежащие на одной "прямой, будем называть коллинеарными. Пусть Ми М2у М3— коллинеарная тройка точек, причем М2фМ3. Тогда J^M3=%jiuM29 (9) где ХеА К называется простым отношением коллинеарных точек Ми М2у М3и обозначается (MiM2M3). Теорема 3. Автоморфизм f пространства Ап сохраняет коллинеарность точек и простое отношение тройки коллинеарных точек. ф Пусть Ми М2у М3— коллинеарная тройка точек пространства Лп. Будем предполагать все эти точки различными, так как в противном случае утверждение теоремы очевидно. Тогда имеем равенство (9). Пусть f(M{)=Nit i= 1,2,3. Тогда Л^з=ф(Л^Мз), Л^2=Ф(Л&), где ф — однородная часть преобразования /. В силу линейности ф
460 Глава 16. Аффинные пространства из равенства (9) следует Но это равенство указывает на то, что точки Ni, N2, N3 колли- неарны и простое отношение тройки точек Ni9 N2> N3 равно Я, т. е. простому отношению тройки точек Ми М2, М3. # Пусть Mi и М2 — произвольные точки пространства Ап. Пару Mi, M2 назовем отрезком. Если точки МА и~М2 различны, то через них проходит единственная прямая, (см. § 154). Точку М этой прямой такую, что М^Л=ММ2у (10) будем называть серединой отрезка MiM2. Если'же Mi=M2l то серединой отрезка MiM2 назовем М4. Пусть задан некоторый репер (О, ёи ё2, ... у ёп). Тогда точки Mi, М2у M будут иметь определенные координаты: Mi (xi', х2\ ... , *„'), М2 (дД х2", ... , *п"), , М(хи х2, .... , хп). Равенство (10) принимает вид •(*!—*i')ei + (^2~^2/)^2+. . •+ (^п—^n7)^n = = (*i"—*i)<?i+ (л:/—х2)ё2+...+ (Яп"—*п)ёл. В силу линейной независимости векторов ёи e2i ... , ёп Xi~~~~Xi —Х% ~~~Xiy I — 1, Z, ... , /*••* Таким образом, формулы для координат середины отрезка MiM2 имеют вид Xi= Xi'+Xi" , i=l,2,...,n. Рассмотрим в пространстве Ап некоторую фигуру Ф. Точка МеЛп называется центром фигуры Ф, если для всякой точки М4еФ существует такая точка М2еФ, что точка М является серединой отрезка MiM2. В силу теоремы 3 автоморфизм f пространства Ап переводит середину любого отрезка в середину преобразованного отрезка, а центр фигуры Ф — в дентр преобразованной фигуры. *
§ 162. Определенна и простейшие свойства 461 Глава 17, ТОЧЕЧНЫЕ ЕВКЛИДОВЫ И УНИТАРНЫЕ ПРОСТРАНСТВА § 162. Определение и простейшие свойства Пусть Еп — евклидово пространство. Аффинное пространство, связанное с пространством Еп, будет называться точечным евклидовым пространством. Аналогично точечным унитарным пространством называется аффинное пространство, связанное с унитарным пространством. Если не оговорено противное, символ Еп обозначает п-мерное точечное евклидово или точечное унитарное пространство. Трехмерное точечное евклидово пространство Е3 — это как раз то пространство, которое изучается в средней школе и во 'второй части настоящей книги. Двумерное точечное евклидово пространство Е2 совпадает с плоскостью, изучаемой в средней школе. Репер (О, Ти *2, ... ,Тп) (1) пространства Еп назовем ортонормированным, если базис 7i, 7г, ... , 1п (2) пространства Еп ортонормирован. Так как в любом ненулевом конечномерном евклидовом или унитарном пространстве существуют ортонормированные базисного в любом точечном ненулевом евклидовом или унитарном пространстве существуют ортонормированные реперы. Пусть наряду с ортонормированным репером (1) задан еще один ортонормированный репер (О', 7/, 12', ...,7»'). (3) Если Г*1 1 Х2 L %п _ . (о= Г*1' 1 Х2 L %п J координатные столбцы точки М^Еп в реперах (1) и (3), (а) — координатный столбец точки О' в репере (Г), a S — матрица перехода от базиса (1) к базису 7 ' 7 ' 7 ' И , 12 f . . . , In i (4)
462 Глава 17. Точечные евклидовы и унитарные пространства то, как показано в § 153, (*)=£(*') +(а). (5) Так как базисы (2) и (4) — ортонормированные, то матрица в формуле (5) ортогональная в случае точечного евклидова пространства и унитарная в случае точечного унитарного пространства. Пусть М и N -^- точки пространства Еп. Расстоянием р(М, N) между точками М и N назовем длину вектора MNy т. е. л p(MyN)= V MNMN. Если точки М и N заданы своими координатами в ортонормиро-. ванном репере: М(хи х2,..., хп), N(yu у2,..., уп), то MN(yi—xu Уг—ХгУ ... , уп—хп)у MNMN= J/ \Уг-Хг\*. ^ Поэтому г=1 р(М,Ы)=У±\У1-Хг\\ г г=1 § 163. Плоскости Пусть Е и Ei — две прямые в пространстве Епу Ми М2 — две различные точки на прямой Е и Ni, N2— две различные точки- на прямой Е±. Векторы MiM2 и NtN2 удовлетворяют неравенству Коши-Буняковского (§141) |Л^2Л^У2| <t \MtMt\\Nitr2\ Поэтому найдется такое вещественное число ф, что соэф=—L_ _-!_ 1о<ф^_1-/ (1) \м,м2\\ы^2\ Это число ф не зависит от выбора пар различных точек на заданных прямых. В самом деле, если М\9 М2 —две различные точки
§ 163. Плоскости 463 прямой £, a Ni't ЛГ2' — две различные точки прямой Еи то найдутся такие числа X и \х из основного поля, что поэтому \M?M2'N7N2'\ |%|i| |Л&ММ| ' , ' = .' . | . 4z; ) =cosф. | Mi'M2') | MM | ' ' "*' | Л14M 211 NtN21 Таким образом, вещественное число ф, удовлетворяющее условиям (1), однозначно определяется данными прямыми Е9 Et и называется углом между этими прямыми. В точечном евклидовом (унитарном) пространстве А-мерная плоскость, очевидно, является Л-мерным j-очечным евклидовым (унитарным) пространством. Две плоскости- Eh=M+E\ (2) Et*=N+Eil (3) пространства Еп будем называть ортогональными, если они имеют общую точку и каждый вектор из Ек ортогонален каждому вектору из Eil. Ортогональные плоскости имеют лишь одну общую точку. В. самом деле, если ЛГ и N'— две различные точки, принадлежащие двум ортогональным плоскостям, то M'N' MT=0, что невозможно в евклидовом (унитарном) пространстве. Ортогональным дополнением к ^-мерной плоскости Ek пространства Еп будем называть (я—k) -мерную плоскость, ортогональную плоскости Ek. Теорема 1. Если в пространстве Еп задана плоскость (2), то через каждую точку N пространства Еп проходит единственное ортогональное дополнение к плоскости (2). ф Рассмотрим плоскость Et»-*=N+.(Eb)\ (4) где (Я'1)1 — ортогональное дополнение к подпространству Eh в пространстве Еп. Так как MN^Ek-\- (Eh) 1=Еп> то в силу теоремы 1 § 156 плоскости (2) и (4) имеют общую точку. Итак, (4) — искомое ортогональное дополнение к плоскости (2). Единственность следует
464 Глава 17. Точечные евклидовы и унитарные пространства из того факта, что каждая плоскость однозначно определяется заданием какой-либо ее точки и направляющего пространства, ф Если (О, Ji, h> ... , in) — ортонормированный репер в Еп9 eif ё2,..., eh —■ базис подпространства Eh и аи, <Хг2,.. •, аг-п (*=1» 2,..., k) — координаты вектора ei в базисе н, h, ... , *п, то (£А)-Ь есть пространство решений однородной системы линейных уравнений ail^i+ai2^2+- • . + 0&гп*п = 0, *=1, 2, . . . \ k (5) (см. формулу (5) § 145), Тогда в силу результатов § 155 плоскость (4) есть плоскость решений системы уравнений вида CCiiXi+ai2#2+. * -~\~(:x'inXn = bu *=1> 2, . < . , k, (в) где bi — неизвестные пока числа из основного поля. Если N(($1, Рг,..., Рп), то, так ка£ N лежит в плоскости (4), Из (6) теперь следует, что * * * = aiipi+a*2P2+.. .+аг*прп, 1=1, 2,..., k — (7) система уравнений плоскости (4). В частности, ai#i+a2#2+." .+an*n=& — (8) >V уравнение гиперплоскости, ортогональной вектору и (аь аг, ... , ап). Направляющим пространством этой плоскости служит Ь(й)1. В § 61 был получен этот результат для трехмерного точечного евклидова пространства. Сейчас мы введем понятие расстояния точки N от плоскости (2). Проведем через точку N ортогональное дополнение (4) к плоскости (2). Пусть Р — точка пересечения плоскостей (2) и (4), а Q — произвольная точка плоскости (2) (рис. 101). Тогда ^7 Р И /. Рис. 101 NP+PQ=NQ. (9)
§ 163. Плоскости 465 Так как Р, Qe£ft, то PQ^Ek. Аналогично NP^(Ek)-L9 поэтому NP J_ PQ. Применяя теперь к равенству (9) теорему Пифагора, получим |A^|2=|JVP|2+|^Q|2. ' (Ю) Если точки Q и Р не совпадают, то |PQ|2>0 и из равенства (10) следует \NP\<\NQ\ (длина перпендикуляра, опущенного из точки N, лежащей, вне плоскости Ekt на эту плоскость, меньше длины любой наклонной, проведенной из N к Eh). Это дает основание назвать расстоянием точки N от плоскости (2) длину вектора NP. Очевидно, расстояние точки N от плоскости (2) равно нулю тогда и лишь тогда, когда точка N лежит в этой плоскости. Для расстояния точки от гиперплоскости есть удобная формула, аналогичная формуле (6) § 59. Пусть (1) —ортонормиро- ванный репер. Произвольная гиперплоскость /Г71-1 задается в репере (1) линейным уравнением аГ*1+а£*2+. • -+апХп = Ь, (11) где й(аь <Х2, ... , ап)—вектор, перпендикулярный к плоскости (11). Число 1 назовем нормирующим множителем уравнения (11). Умножив почленно обе части (11) на нормирующий множитель, мы приведем это уравнение к нормальному виду Yi*i+Ya*2+:. .+Yn*n—p=0. (12) Пусть теперь N(xi°, х2°,..., хп°) — произвольная точка .пространства Еп. Проведем через нее ортогональное дополнение к гиперплоскости (12). Так как эта гиперплоскость ортогональна вектору w(yi, Y2, ... , Yn),TO г=г0+Ш, (13) где го — радиус-вектор точки N, — уравнение искомой плоскости.
466 Глава 17. Точечные евклидовы и унитарные пространства Запишем уравнение (13) в координатной форме» Xi=Xi»+tyu i=l, 2, ... , п. (14) Пусть Р — точка пересечения прямой~*(14) и плоскости (11). Тогда ее координаты Xi°=toyi, i=l, 2,... , п, и, значит, • NP(t0yu /0Y2, •• • , t0yn). Поэтому \NP\t=\t0\*\a\*=\to\K (15) Подставив формулу (14) в (12), получим уравнение для вычисления t0: * jt y<(Xi°+toyi)—p = 0, т. е. J2 ум0+и—р=о, 1=1 t0=p- J} yW. (16) 1=1 Таким образом, расстояние точки N от гиперплоскости (10) равно 1 jl • I JS Yi^i0—Р\ • i=i • В частности, расстояние начала координат от гиперплоскости (10) равно \р\. § 164. Объем параллелепипеда Как известно, площадь параллелограмма равна произведению его основания на высоту. Если этот параллелограмм построен на векторах йи йь то его площадь равна длине вектора йи умноженной на длину перпендикуляра, опущенного из конца вектора й2 на прямую вектора й±. Аналогично объем параллелепипеда, построенного на векторах йи йг, из, равен площади параллелограмма, построенного на векторах йи йг> умноженной на длину перпендикуляра, опущенного из конца вектора из на плоскость векторов йи U2. Сейчас мы аналогично определим объем А-мерного параллелепипеда.
§ 164. Объем параллелепипеда 467 Пусть Еп — точечное евклидово (унитарное) пространство, связанное с евклидовым (унитарным) пространством Еп, йи U2, ... , йк— (1) линейно независимая система векторов из Еп. Фиксируем некоторую точку М и совокупность [М, йи й2, ... , йк] (2) назовем k-мерным параллелепипедом. Объем Sk ^-мерного параллелепипеда (2) .определим индуктивно: Si=|ui|, далее, если Si уже определено и /<&, то положим где йг+i — вектор, соединяющий конец Мц\ вектора ui+i (т. е. точку M-\-ui+i) с точкой Ni пересечения плоскости (Я*)1, где Ei=M+L(uu й2у .-.. , Hi), (3) проведенной через точку Mi+i и Е*.* Из определения объема следует, что Sfc=|2i||«2| •-. \Kh\ и,следовательно, 5fca=|Si|*|fi2|a... \Лк\2. (4) Так как вектор Ям-1=Л^М<+1 принадлежит направляющему пространству плоскости (Е{) L9 то !МЛш ±.йа, s= 1, 2, ... , i. (5) По правилу замыкающей = tiUi+. . . + tiUi-\-Ui+l, (6) так как N{M^L(uu йг, ..., йг). Из выражений (5) и (6) следует, что Яг+i J- hs, 5 = 2, ... , Г, Яг+i -L ЙА. .
468 Глава 17. Точечные евклидовы и унитарные пространства Тогда в силу равенства (4) Sfc*=s=r(«Zi,'«2, ...,ЯЛ). Учитывая формулу (6) и теорему § 144, получаем Sfe2=r(t7i, й2, ... ,**)• (7) Пусть теперь &=п, *ь ^2, ... , in — (8) ортонормированный базис пространства Еп\ щи otj2, •. • , a>jn- (/=1, 2, ... , п)—координаты вектора щ в базисе (8). Тогда С= [а]ъ] — матрица перехода от базиса О) к базису (8). Следовательно, матрица скалярного произведения S= UiUi UiU2 . . . U\Un й%й\ щйгйг ... йчйп = С*ЕС=С*С mUnUi UnU2 ... UnUnJ (см. § 140). Поэтому Г(Й1, й2,... , йп)=det С det C*=det С (det С)*= | det C|2. Из формулы (7) теперь следует Теорема. Объем n-мерного параллелепипеда, построенного на векторах (1), равен модулю определителя, столбцами которого служат столбцы координат векторов (1) в ортонормированном базисе. Для п=3 эта теорема получена в § 53. § 165. Движения Отображение / точечного евклидова или унитарного пространства Еп в себя называется движением пространства Еп, если оно не изменяет расстояний между точками, т. е. для любых точек М и N этого пространства . . р(л*,ло=р(/(Л1),/(ло). Теорема 1. Всякое движение f пространства Еп есть аффинное преобразование этого пространства.
§ 165.. Движения 469 ф Пусть О — некоторая точка пространства Еп. Отображение / индуцирует отображение ф пространства Еп={ОМ\М<=Е"} в пространство Ein={67M'\0'=f(0)t M'=f(M), M<=E"}. В силу условия теоремы ф есть изометрия евклидовых пространств и в силу теоремы 1 § 146^- линейное отображение. Итак, f есть аффинное отображение с однородной частью ф. ф Теорема 2. Аффинное преобразование f пространства Еп является движением тогда и только тогда, когда его однородная часть Ф есть изометрическое преобразование пространства Еп. ф Пусть М и N — две произвольные точки пространства Еп. Тогда N'=f (N) =f (M+MN) =f(M) +Ф (MN) =M'.+<f (Ш), Из этого равенства следует, что равенства \M7N'\ = \MN\\9 \у(Ш)\ = \Ш\ равносильны, откуда и вытекает теорема, ф Из этой теоремы и теоремы 1 § 15^ытекает Следствие. Всякий параллельный сдвиг пространства Еп является движением. Если (О, 7i, 72, ... , in) — (1) ортонормированный репер пространства Еп, то в силу формулы (8) § 159 движение / задается формулой (х>)=А(х) + (а), (2) где (х), (х') и (а) — координатные столбцы соответственно точек М, f(M) и f(O) в репере (1), а А —ортогональная (унитарная)
470 Глава 17. Точечные евклидовы и унитарные пространства матрица — матрица однородной части движения f в базисе hy h, ... , in- (3) Теорема 3. Множество всех движений пространства Еп есть подгруппа в группе всех невырожденных аффинных преобразований этого пространства. Доказательство оставляется читателю. Будем обозначать группу всех движений пространства Еп символом G(En). Метрическими свойствами фигур пространства Еп называются такие свойства, которые сохраняются при всех движениях. Две фигуры пространства Еп называются метрически эквивалентными, если существует движение, переводящее одну из этих фигур в другую. Множество всех фигур пространства Еп разбивается на классы метрически эквивалентных фигур. Теорема 4. Все ортонормированные реперы пространства Еп образуют один метрический класс. ф Так как в силу теоремы 2 любое движение / пространства Еп сохраняет скалярные произведения векторов, то f переводит всякий ортонормированный репер в ортонормированный репер. Пусть теперь заданы два ортонормированиях репера — (1) и (0',ii',I2',...,I»'), (4) причем cti, о&2, ... , ап — координаты точки О' относительно репера (1) и А — матрица перехода от базиса (3) к базису н'9 7 г 7 I *>2 > • • • > In • Как известно из § 143, матрица А ортогональна. Поэтому формула (2) задает движение, которое переводит репер (1) в репер (4). • Теорема 5. Все k-мерные плоскости пространства Еп (при фиксированном k) образуют один метрический класс. ♦ Всякое движение пространства £Л, являясь аффинным преобразованием, переводит любую ^-мерную плоскость в &-мер- ную плоскость. Пусть теперь заданы две плоскости Eh=M+E\ (5) Eik=N+Eik. (6) Пусть (М, 7i, Г2, ... , ik) — ортонормированный репер пространства Ek. В силу теоремы 3 из § 142 существуют векторы h+u
§ 166. Движения точечной евклидовой плоскости 471 *м-2,... у in такие, что (М, Ти h, ... , in) — (7) ортонормированный репер плоскости (5). Аналогично построим ортонормированный репер (N, 1±\ 727, ... , h') плоскости (6) и дополним его до ортонормированного репера (N9h',h'^..,ln') (8) пространства Еп. Движение пространства £п, переводящее репер (7) в репер (8), переведет плоскость (5) в плоскость (6). # § 166. Движения точечной евклидовой плоскости Пусть О -^ фиксированная точка точечной евклидовой плоскости Е2 и / — движение плоскости Е2, оставляющее точку О неподвижной. Однородная часть ф преобразования / ортогональна, поэтому detcp=±l. Если det ф= — 1, то, как показано в § 148, существует ортонормированный базис iu h, (1) в котором ф задается матрицей L о -1J"' Тогда координаты точек плоскости в репере (О, Ти 72) изменяются при преобразовании / по формулам #2/=—*2, J где Хи Хг и х±'9 х2' — координаты соответственно точек М и f(M). f называют отражением относительно оси вектора н (рис. 102). Если det ф= 1, то в любом ортонормированном базисе (1) Ф задается матрицей Г cos a —sin a 1 [ sin а cos а J * Следовательно, формулы преобразования / имеют вид *i/==*i cos а—Хг sin а, 1 x2'=Xi sin a+^^cos a. j
472 Глава 17. Точечные евклидовы и унитарные пространства В этом случае преобразование / называется поворотом вокруг точки О на угол а (рис. 103). Теорема. Всякое движение плоскости Ег есть одно из следующих преобразований: отражение относительно прямой, поворот вокруг точки, параллельный сдвиг, произведение параллельного сдвига и отражения относительно прямой. Ч^ <>' 0 i Ч J Л/ I*' *£ *1 Рис. 102 Рис. 103 ф*Как следует из § 159 и 165, всякое движение плоскости Е2 есть произведение параллельного сдвига и движения, оставляющего неподвижной некоторую точку. Как показано выше, любое движение,,оставляющее неподвижной некоторую точку О, есть либо отражение относительно прямой, проходящей через точку О, либо поворот вокруг точки О. Поэтому для доказательства теоремы достаточно показать, что произведение параллельного сдвига и поворота на ненулевой угол а вокруг точки О есть поворот вокруг некоторой точки. Указанное произведение задается формулами Xi=Xi cos а—Хг sin a+fr, x2'=Xi sin a+#2 cos a+02, (2) где аФ2ки. Покажем, что преобразование (2) имеет единственную неподвижную точку и поэтому является поворотом. В самом деле, координаты хи х2 неподвижных точек преобразования (2) должны удовлетворять системе уравнений- *i(l—cos a)+Ar2sin a=Pi, —Xi sin a+;t2(l— cos а) =Рг- Так как определитель этой системы 2(1—cos a) отличен от нуля, то система имеет единственное решение. #
§ 167. Движения трехмерного точечного евклидова пространства 473 § 167. Движения трехмерного точечного евклидова пространства Пусть О — фиксированная точка трехмерного точечного евклидова пространства Е3 и / — движение пространства Е3У оставляющее точку О неподвижной. Однородная часть <р преобразования / ортогональна, поэтому в силу результатов § 148 существует ортонормированный базис tu *2, *з, (i> в котором ф имеет матрицу одного из двух видов: 1/ cos a —sin a О sin a cos a О О 0 1 cos a — sin a О sin a cos a О О (2) (3) Движение /, соответствующее матрице (2), задается в репере (О, 7Ь 72, h) (4) формулами *i =*i cos a—х2 sin a\ x2'=Xt sin а+х2 cos а, Хз -=Хз* (5) Как указывалось в § 166, при этом преобразовании в плоскости OXiX2 происходит поворот вокруг точки О на угол а. В каждой плоскости, параллельной плоскости ОХ{Х2, происходит поворот вокруг точки её пересечения с осью Ох3 на угол а. Преобразование (5) называется поворотом пространства Е3 вокруг оса Ох3 на угол а (рис. 104). Движение /, соответствующее матрице (2) при а=0 задается в репере (4) формулами: Xi =Хи Х2 =Х2, Х$/=—Х$. (6) При этом преобразовании каждая точка М переходит в точку М\ симметричную с точкой М относительно плоскости Ох\Х2.
474 Глава 17. Точечные евклидовы и унитарные пространства Преобразование (6) называется отражением в плоскости Ох\Хг (рио. 105). Движение f, соответствующее матрице (2) при а=^0, задается в репере (4) формулами х\'=х± cos a—#2.sin а, Хъ=Ху sin a+x2 cos а, Хз =—Хз и является Произведением отражения в плоскости Ох\Хг и поворота на угол а вокруг оси Ох3. Рис. 104 Рис. 105 Теорема. Всякое движение трехмерного евклидова пространства есть одно из следующих: поворот вокруг неподвижной оси, отражение относительно плоскости, произведение отражения относительно плоскости на поворот вокруг перпендикулярной к этой плоскости оси, параллельный сдвиг, произведение параллельного сдвига и поворота вокруг неподвижной оси, произведение параллельного сдвига и отражения относительно плоскости. ф Как следует из § 159 и 165, всякое движение пространства Е3 есть произведение параллельного сдвига и движения, оставляющего неподвижной некоторую точку. Как показано выше, любое движение, оставляющее неподвижной точку О, есть поворот вокруг прямой, отражение в плоскости или произведение поворота вокруг прямой и отражения в плоскости, перпендикулярной этой прямой. Поэтому для доказательства теоремы достаточно показать, что произведение / поворота вокруг прямой на угол а^О'и отражения в плоскости, перпендикулярной к этой прямой и параллельного сдвига, имеет неподвижную точку. Доказательство аналогично тому, которое дано в § 166 и оставляется читателю. #
§ 168. Аффинные преобразования пространства Еп 475 § 168. Аффинные преобразования пространства Еп Пусть (О, Ти Т2, ... , in) — ортонормированный репер пространства Еп, а ф.1 — линейное преобразование пространства Еп> имеющее в базисе Ти hy ... , in (l) матрицу Га 0 Lo 0 ... 1 ... 0 ... где а — вещественное число. Пусть, далее, tfi — центроаффинное относительно точки О преобразование пространства Еп с однородной частью ф4, т. е. для М^Еп yi(M)=0+yi(OM). Назовем преобразование ipi сжатием к гиперплоскости 0+ +L(i2, ... , Тп) параллельно-вектору 7А с коэффициентом а. Сжатие ^я переводит точку M(xit x2, ... , хп) в точку М'(ахи *2, •.. , хп). Аналогично определяются сжатия параллельно век- торам Тг, ... , Тп- Рассмотрим теперь центроаффинное преобразование ф, однородная часть которого ф в базисе (1) имеет матрицу ГаА О ... О "] О а2 ... О I Lo о ... anJ где ai, i=l, 2, ... , л,— вещественные числа. При этом преобразовании точка M(Jcu х2, ... , хп) переходит в М"(ацхи аг*2, ... , осп^п). Очевидно, -ф можно представить как произведение п последовательных сжатий параллельно векторам (1). Пусть ф — произвольное самосопряженное линейное преобразование пространства Еп, а -ф — центроаффинное относительно точки О преобразованиепространства Еп с однородной частью ф. По следствию 2 § 149 в Еп существует ортонормированный базис, составленный из собственных векторов преобразования ф. Пусть это будет базис (1). В нем матрица ф диагональна, причем диагональные элементы ее вещественны, поэтому t|) — произведение п последовательных сжатий параллельно векторам (1).
476 Глава 17. Точечные евклидовы и унитарные пространства ^Теорема 1. Всякое аффинное преобразование пространства Еп есть произведение движения и п последовательных сжатий параллельно попарно ортогональным векторам. ф По теореме 4 § 159, аффинное преобразование / есть произведение параллельного сдвига и центроаффинного относительно точки О преобразования -ф. Так как параллельный сдвиг—* движение и произведение движений — движение, то нам доста-^ точно доказать теорему для преобразования ty. Пусть <р — однородная часть преобразования г|э. В силу теоремы 1 § 151 ф=ф1ф2, где ф! — изометрическое, а ф2 — самосопряженное линейные преобразования пространства Еп. Для М^Еп положим - ^(М)=0+Фг(ОМ), i=l,2. tyi — центроаффинное относительнЪ точки О преобразование с однородной частью фг, так что г|н — движение, а орг — произведение п последовательных сжатий параллельно попарно ортогональным векторам. ЬЬ(М) =Ы°+^(М)] =0+ф1ф2(ОМ) = = 0+ф(ОМ) =г|?(Л1) =^ ^1^2=^. • Следствие. Для всякого невырожденного аффинного преобразования f пространства Еп существует ортонормированный репер, переводящийся этим преобразованием в репер, базисные векторы которого попарно ортогональны. ф f=fif2> где ft — движение, а /г — произведение п последовательных сжатий параллельно попарно ортогональным единичным векторам (1), причем /г — невырожденное преобразование. Тогда (О, iu h, •.. , in) — искомый репер, ф Теорема 2. При аффинном невырожденном преобразовании пространства Еп объемы всех n-мерных параллелепипедов умножаются на одно и то же отличное от нуля вещественное число, так что отношение этих объемов сохраняется. ф Пусть / — невырожденное аффинное преобразование пространства £п, ф —его однородная часть, [О, йи йг, ... , йп] — n-мерный параллелепипед, Sn — его объем, Sn' — объем параллелепипеда [/(0),ф(Й1),ф(Й2), ... ,ф(Йп)],
§ 169. Вещественно-комплексное пространство 477 С — матрица преобразования ф в базисе йи й2, ..-. , йп. _ (1) По формуле (7) § 164 5/2=Г(Ф(Й!), Ф(й2), ... , q>(2„-)). (2) Определитель Грама в формуле (2) есть определитель матрицы S скалярного произведения в базисе q>(5i), ф(й2), ... , ф(йп), (3) С —матрица перехода*от базиса (1) к базису (3), поэтому S=C*TC, где Т— матрица скалярного произведения в базисе (1). Тогда Sn,2=det S = det С* det С det Г= (det C)2 Sn2. Так как объем — вещественное неотрицательное число, то S/HdetqSn. • Глава 18 % КВАДРИКИ § 169. Вещественно-комплексное пространство В этой главе мы введем понятие квадрики, обобщающее понятие фигуры второго порядка, рассмотренное во второй части книги. В настоящем параграфе будет введено вещественно-комплексное пространство, в рамках которого рассмотрение квадрик оказывается наиболее удобным. Пусть Еп — n-мерное точечное евклидово пространство, связанное с (векторным) евклидовым пространством Еп, и (О, ёи ё2, ... , ёп) — (1) некоторый репер в Еп. Каждой точке М пространства Еп сопоставим строку (#1, *2, • • • , Хп, 1), (2) где лг±, *2, ...,_хп — координаты точки М в репере (L), а каждому вектору а из Еп сопоставим строку , №, ^2,..., хп), (3) где Хи Х2, ... , Хп — координаты вектора а в репере (1). Множество всех строк (3) образует я-мерное евклидово пространство
478 Глава 18. Квадрики Ein, а множество строк (2) — л-мерное точечное евклидово пространство £in, связанное с пространством Etn (см. § 162). Будем теперь придавать xi, x2i ... , хп и Xi, X2t ... , Хп произвольные комплексные значения. Тогда строки (3) образуют-/г-мерное унитарное пространство £7П, в котором скалярное произведение строки (3) и строки (уи У2, ... , Уп, 0) равно Xiyi+x2y2+.. .+хпУп, а строки (2) образуют при этом n-мерное точечное унитарное пространство Un9 связанное с пространством Un. Пространство Vй с выделенным в нем пространством £tn будем называть /г-мер- ным вещественно-комплексным пространством и будем обозначать его символом En(i). Указанный переход от я-мерного точечного евклидова пространства Еп к n-мерному вещественно-комплексному пространству En{i) будем называть вложением пространства Еп в пространство En(i). Точки пространства En(i), принадлежащие Ein, будем называть вещественными, остальные точки пространства En(i) —лшижшш.«Аналогично вводятся вещественные и мнимые векторы. Рассмотрим формулы 71 1 Х{= ^j CCijXj *j-Cli, 1= 1, Z, . . . , /I, I y .v j=i [ \V det(aij)=7^0, aij, аг* — вещественные числа. J Можно считать, что эти формулы задают преобразование rfb- ординат: координаты хи х2, ... , хп точки М относительно репера (1) 'выражаются через координаты xi, х2у ... , хп' этой точки относительно некоторого репера (О', ei',h', ...,*»'). (5) Если репер (1)—ортонормированный, а матрица (aij) ортогональна, то репер (5) также является ортонормированным. Мы будем рассматривать только такие системы координат, которые связаны с исходной системой (1) формулами вида (4). В любом таком репере координаты вещественных точек и векторов вещественны, а среди координат мнимой точки или мнимого вектора обязательно есть невещественное число. Можно считать также, что формулы (4) задают преобразование пространства En(i), переводящее точку М с координатами Хи х2, ... , хп относительно репера (1) в точку ЛГ, имеющую относителвно репера (1) координаты Xt', x2i ... , хп'. Такие преобразования мы будем называть аффинными преобразованиями, а в случае ортонормированного репера (1) и ортогональной матрицы (a2j) —движениями пространства En(i).
§ 170. Определение квадрики 479 § 170. Определение квадрики Пусть в пространстве En(i) выбран некоторый репер (О, ёи ёг, ... , ёп) . _ (1) и задано уравнение п п 2 aijXiXj+2 % aiXi-\-a=0, (2) i, j*=l г=1 коэффициенты которого вещественны, среди ац есть отличные от нуля, причем ац=а#. Квадрикой назовем множество всех точек пространству En(i), координаты которых в выбранном репере удовлетворяют уравнению (2). Примерами квадрик являются фигуры второго порядка, рассмотренные в гл. 7, 8 (правда, мы ограничились там только вещественными точками). Уравнение (2) будем называть уравнением той квадрики, которую оно определяет. Очевидно, уравнение *» I JEuijXiXj+2 JS cLiJii+a ) =0, ^ i, j=l г=1 ' где % — отличное от нуля вещественное число, определяет в выбранном репере ту же квадрику, что и уравнение (1). Верно и обратное: если два уравнения вида (2) определяют в выбранйом репере одну и ту же квадрику, то левые части этих уравнений отличаются лишь отличным от нуля числовым множителем. Однако доказательство этого утверждения не столь очевидно, и мы докажем вначале некоторые вспомогательные предложения. Лемма 1. Если полином п п Jg aijXiXj+2 J£ aiXi+a (3) Ш г, j=l г=1 от неизвестных хи *г, . •. , хп с комплексными коэффициентами обращается в нуль при любых значениях переменных, то все коэффициенты этого полинома — нули. ♦ Доказательство будем вести индукцией по п. Пусть п=1, т. е. полином имеет.вид anXi2+2aiXi+a. (4)
480 . Глава 18. Квадрики Придавая Xi значения 0, 1,2, получим а =0, | aii+2ai = 0, I яц+ ai = 0, J следовательно, ^ a11=ai=a=0. Предположим теперь, что лемма 1 справедлива для п— 1 неизвестных (л>1) и докажем ее для полинома (3). Перепишем этот полином в виде (71 \ П П 2 uilXi+CLi ) + JSf QijXiXj+Z 2 Q>i*i+a- i=2 /• i, j=l i=i Придавая неизвестным jc2, ... , xn произвольные числовые значения, мы получим полином от неизвестной х4. По предположению индукции 0ii==O, ,5/flii^t+fli=-0, JS uijXiXj+2 2j diXi+a=0. г=2 ■ г, j=2 г=2 Так как эти соотношения имеют место при любых значениях неизвестных х2, ... , хп, то в силу предположения индукции aij=0, ai=0, a=0, i, /=1, 2, ... , п. # Лемма 2. Если два полинома с комплексными коэффициен-^ тами— (3) и п п J£ bijXiXj+2 Д} biXi+b — (5) г, j=l г=1 принимают равные значения при любых значениях неизвестных *и Хч,..., *тъ го эпг полиномы равны, т. е. dij=bijy ai=bif a=by i, /= 1, 2,... , /г. ф Для доказательства достаточно применить лемму 1 к разности полиномов (3) и (5). # Лемма 3. Пусть каждый из полиномов (3) и (5) имеет вторую степень, т. е. среди коэффициентов а^ есть отличные от нуля и не все коэффициенты Ьц—нули. Если эти полиномы имеют одни и те же корни, т. е. обращаются оба в нуль лишь при одних и тех
§ 170. Определение квадрики 481 же значениях неизвестных, то bij=Xdijt bi=Xcii, b=Xa, (6) где h— отличное от'нуля комплексное число. ф Пусть п=1, т. е. мы рассматриваем полиномы (4) и &ii*i2+26uti+6, (7) причем ац=^=0, ЬцФ'0. Пусть аир — корни полиномов (4) и (7): atiXt2+2atXi+a=ait(Xi—а) (*i—р), biiXi*+2bixi+b = bii(xi-a) (*i-p) bit и соотношения (6) имеют место при Х= 1.1 ац Пусть теперь п>\. Предположим вначале, что по крайней мере один из полиномов, например (3), содержит квадрат какой- нибудь неизвестной, например Xi. Тогда представим полиномы (3) и (5) в виде: (п \ п Л ацХг+ai) xi+ Л <*цЪХ}+ %=2 ' г, з=2 +2 J} aiXi+a, (8) г=2 0=btiXt*+2 [Л buXi+bi) Xi+ Jj ЬцХгХ3+ M=2 / t, j=2 +2 2 biXi+b, (9) aii^O. Пусть также ЬцФО. Придавая неизвестным *г, ... , хп какие-либо числовые значения, мы превратим (8) и (9) в полиномы от одной неизвестной х±. По доказанному выше bu=kaiU 2J biiXi+bt=K[ jt С1цХ{+аЛ , i=2 „ * г=2 ' n n J£ bijXiXj+2 Л b{Xi-\-b= i, j=2 г=2 (n n \ Л aijXiX3+2 Л diXi+a , „ ^ г, j=2 г=2
482 Глава 18. Квадрики где Я — отличное от нуля комплексное число. Отсюда в силу! леммы 1, учитывая произвольность значений Хг, ... , хПу получаем равенства (6). Пусть теперь 6ц=0. Тогда полином Ф относительно Xi имеет первую степень, и так как у полиномов F и Ф одни и те же корни; то ^ = ЯФ2, (10); где Л=А,(*2,..., хп) — функция от х2, ... , хп. Сравнивая в обеих частях равенства (10) коэффициенты при х\2, получим а11=<Ш>ц. Отсюда следует, что A,=const. Тогда из равенства (10) следует: Ьц=0, Ьц=0, i, /=2, ... , п. Мы получили, что полином Ф имеет первую степень вопреки предположению. Обратимся теперь к случаю, когда полиномы (3) и (5) не содержат квадратов неизвестных. Так как по крайней мере один из коэффициентов aij (t, 7—1, 2, ... , м) отличен от нуля, то положим, например, что а^фЬ. Совершим преобразование неизвестных: *i = {/i + */2, *2=yi—f/2, Xi=yit i=3f ...,n. Подставляя эти выражения неизвестных в (3) и (5), получим: п п п п 2 aijXiXj+2 2£ aiXi+a= J£ а{/у{у^+2 j} a/yi+a', (11) i, j=l t=l i, j=l i=l 2 ЬцХЪ+2 2 btXi+b= 2 bi)'yiy>+2 2 bi'yi+b', (12) i, j=i t=l i, j=l . i=l причем ati'=2ai2=£0. Полиномы (11) и (12) относительно неизвестных уи f/2, ... , Уп удовлетворяют условию леммы и для них справедливо доказательство, приведенное выше. Но тогда 2 bijXiXj+2 JtbiXi+b= jt bi/yiyj+2 JJ bi'yi+b'= i, j=l i=l i, j=l г=1 (n n \ 2 ац%Уз+2 2 ui'Ui+a') = i, j=l t=l ' =X ( J£ uijXiXj+2 J£ diXi+a) . * i, j=l i=l ' Отсюда следуют соотношения (6). #
§ 170. Определение квадрики 483 Теперь можно утверждать, что имеет место Теорема. Для того чтобы два уравнения п п "2 aijXiXj+2 Д? aiXi-{-a=09 i, j=t i=l n n J£ bijXiXj+2 J£J biXi+b=0 i, j=l г=1 задавали в выбранном репере одну и ту же квадрику, необходимо и достаточно, чтобы коэффициенты этих уравнений были прдпор* циональны, т. е. выполнялись условия (5). ф Достаточность указанного условия отмечалась выше, необходимость следует из леммы 3. # Выясним теперь, как преобразуется уравнение квадрики при переходе к новым координатам. Введем следующие обозначения: Л = [ctij], (а) = (аи а2, ... , ап), Т= [оы,-], Г xt х2 L хп J V оо= VxS 1 х»' L хп __ I («)=.. Г OCi ~j «2 _ an J (xy=(xux2, ... ,xn). Тогда уравнение квадрики (2) можно записать в виде (хуА(х)+2(а)(х)+а=0, (13), а формулы преобразования координат при переходе от репера (1) к реперу (О', ёх'9 h\ • - • , *»') (14) в виде (х)=Т(х>) + (а) (15), (здесь xt, х2,..., хп— координаты произвольной точки М из En{i)\ относительно репера (1), а */, х2\ ... , хп' — координаты той же точки относительно репера (14)). Вставляя выражение (х) из (15) в левую часть уравнения (13), получим (х)т А (х) +2(а) (х) +а= (х'У В (*') +2(Ь) {х') +bt (16£
484 Глава 18. Квадрики где В=ГАТ, (Ь) = (а)тАТ+(а)Т9 b=(a)TA(a)+2(a)(a)+a. Из равенства (16) следует, что уравнение квадрики (2) относительно репера (Й) имеет вид (хуВ(х')+2(Ь)(х')+Ь=0. (17) При переходе от уравнения (2) к уравнению (17) квадратичная форма (х)тА(х) преобразуется в квадратичную форму (х')тВ(х') так; же, как и в результате преобразования (х) =Т(х') (см.§ 130). Отсюда следует, что уравнение (17) удовлетворяет тем же условиям, что и уравнение (2). Если рассматривать (15) как формулы аффинного преобразования пространства En(i), то мы получим следующий результат. Теорема. При аффинном преобразовании пространства En(i) любая квадрика преобразуется в квадрику. В § 171—178 мы рассмотрим аффинные свойства квадрик, т. е. такие свойства, которые сохраняются при любых аффинных преобразованиях пространства En(i). В § 179—181 будут изучены метрические свойства квадрик, т. е. такие свойства, которые сохраняются при движениях пространства En(i). § 171. Пересечение квадрики с прямой Выберем в пространстве En(i) некоторый репер и рассмотрим квадрику, определяемую в этом репере уравнением п п Д/ aijXiXj+2 Д? а{Хг+а=0. (1) г, j=l г=1 Найдем точки пересечения квадрики (1) с прямой Xi=bi+tci9 i=l, 2, ... , /г, (2) где bi и Ci — вещественные числа. Подставляя выражения х\ из формул (2) в уравнение (1) и приводя подобные члены, получим уравнение относительно t: 1 2 aijdCj) P+2pt+q=0t (3) ■Л г, j=i '
§ 171. Пересечение квадрики с прямой 485 где л. п П р= jg dijbiCj-\- д;. а&и i, j=l г=1 n n flf= Д aijfti6j+2 Д? афг+а. г, j=l г=1 Подставляя корни уравнения (3) в качестве значений t в формулы (2), получим координаты всех искомых точек пересечения. Будем различать следующие два случая: п п 1) 2 ciijCiCj^O, 2) Д7 ацС{С}=0. i, j=l г, j=l В первом случае уравнение (3) — квадратное, и в зависимости от характера его корней U и t2 имеются три возможности: а) tiy t2 вещественны и различны, прямая (2) пересекает квадрику (1) в двух различных вещественных точках; б) и=42 — вещественное число, прямая (2) имеет с квадрикой (1) одну общую вещественную точку; Рис. 106 в) /i и /2 не вещественны, прямая (2) не имеет с квадрикой (1) общих вещественных точек, но имеет две мнимые точки. Во втором случае имеем: г) рФО, уравнение (3)—линейное, и прямая (2) имеет с квадрикой (1) одну общую вещественную точку; д) р=0, q=£0, равенство (3) противоречиво, прямая (2) не имеет с квадрикой (1) общих точек;
486 Глава 18. Квадрики е) р=0, q=0, равенство (3) является тождеством, все точки прямой (2) принадлежат квадрике, т. е. сама прямая принадлежит квадрике. В качестве иллюстрации на рис. 106 изображена гипербола и 5 прямых различных типов. § 172. Асимптотические направления Выберем в пространстве En{i) репер (О, ёи h, ... , ёп) (1) и рассмотрим квадрику п п ]g aijXiXj+2 Д? a{Xi+a=0. (2) i, j=l t=l Пусть задан ненулевой вектор ё(си с2, ... , сп), (3) вещественный или мнимый. Будем говорить, что все векторы ас, где а — произвольное отличное от нуля комплексное число, задают в пространстве En(i) одно определенное направление. любой же другой ненулевой вектор задает другое направление.' Направление, определяемое вектором (3), будем называть веще^ ственным, если существует такое число а, что все координаты вектора ас вещественны; в противном случае направление, определяемое- вектором с, будем называть мнимым. Направление вектора (3) будем называть асимптотическим относительно квадрики (2), если п £ aijdCj=0. (4) i, i=l В противном случае будем говорить, что вектор (3) имеет неасимптотическое направление. Поскольку левая часть уравнения квадрики (2) в репере (1) определена с точностью до числового множителя, отличного от нуля, то определение асимптотического направления не зависит от выбора уравнения заданной квадрики в фиксированном репере. Кроме того, имеет место Теорема 1. Асимптотическое направление относительно квадрики (2) не зависит от выбора репера.
§ 172. Асимптотические направления 487 ф Запишем уравнение квадрики (2) в виде (*)М(*)+2(а)(х)+а=0 (5) и равенство (4), определяющее асимптотическое направление, в виде (с)М(с)=0, (6) где (с)т=(си с2, ..., сп). Пусть переход к новому реперу задается формулами: (*)=7(*'Жа) (7) (с) =740, (8) где (х') — столбец новых координат точки М, а (с') — столбец новых координат вектора (3). В новом репере уравнение квадрики (5) имеет вид (х'уТ*АТ(х')+2(Ь) (х')+Ь=0. (9) Используя формулу (8), получим (с')А(с) = (с'уТ'АТ(с'). Но отсюда следует, что равенство (6) равносильно равенству (с')*Т'АТ(с')=Оу определяющему асимптотическое направление относительно квадрики (9). # Проведенному сейчас рассуждению можно дать и другое истолкование. А именно будем рассматривать (7) как формулы аффинного преобразования пространства En(i), выражающие координаты точки М(хи х2, ... , хп) (прообраза) в репере (1) через координаты точки M'(xt', х2\ ... , хп') (образа) в том же репере. При этом преобразовании квадрика (5) перейдет в квадрику (9), а вектор (3) — в вектор с'(с/, с2\ ... , сп'). Тогда полученный выше результат можно сформулировать следующим образом. Теорема 2. Пусть вектор с имеет асимптотическое (неасимпто- тическое) направление относительно квадрики К и f — аффинное преобразование пространства En(i) с однородной частью ср. Тогда вектор у(с) имеет асимптотическое (неасимптотическое) направление относительно квадрики f(K)>
488 ' Глава 18. Квадрики Теперь мы можем утверждать* что проведенное в § 171 разделение вещественных прямых пространства En(i) на шесть типов относительно данной квадрики имеет аффинный характер, а именно, справедлива Теорема 3. Пусть в пространстве En(i) заданы квадрика К, прямая Л и аффинное преобразование f. Тогда прямая f(TL) имеет относительно квадрики f(K) тот же тип (в смысле § 171), что и прямая П относительно квадрики К- Доказательство вытекает из теоремы 2 и из того факта, что при аффинном преобразовании пространства Еп (i) вещественные точки переходят в вещественные, а мнимые —* в мнимые. Докажем еще одну теорему, которая понадобится нам в дальнейшем. Теорема 4. Существует п линейно независимых векторов, имеющих неасимптотические относительно заданной квадрики (2) направления. ♦' Существует вещественное невырожденное преобразование переменных п Xi= J£ *ijXi', i=l, 2, ... , л, (10) приводящее квадратичную форму п Jr^ U,{jXiXj г, j=i к нормальному виду JSBi(Xi')*9 6г = ±1, 0<Г<П. г=1 Рассмотрим (10) как формулы преобразования координат и запишем уравнение квадрики (2) в новом репере: £ е*(*/)2+2 £ а/х/+а=0. (11) На основании теоремы 1 мы можем искать векторы неасимптотических направлений, исходя из уравнения (11), т. е. как векторы c(ci't..., Сп), удовлетворяющие неравенству г=1 *
§ 173. Линии эллиптического, гиперболического и параболического типов 489 Очевидно, условию теоремы удовлетворяют следующие векторы: ci(l, 0, .... О, 0, ... , 0), с2(0, 1, ... , 0, 0, .. Сг(0, 0 1, 0, . cr+i(l, 0, .... 0, 1, . с«(1, 0, О, О, , 0), , 0), , 0), 1). § 173. Линии эллиптического, гиперболического и параболического типов Трехмерное точечное евклидово пространство Е3 можно рассматривать как множество всех 'вещественных точек пространства E3(i). Аналогично евклидову плоскость Ег можно рассматривать как множество всех вещественных точек пространства E2(i). Само пространство E2(i) также будем называть плоскостью. Пусть на плоскости E2(i) выбран некоторый репер и задано уравнение квадрики aiiXi2+a22X2z+2ui2XtX2-{-2aiXi-\-2a2X2-\-ci=0. (1) Будем называть эту квадрику линией второго порядка. Векторы, имеющие относительно линии (1) асимптотические направления, определяются равенством auCi2-\-2ai2CiC2+a22C22=0. (2) Пусть вектор с имеет асимптотическое направление относительно линии (1). Так как любой вектор ас, где а — произвольное Комплексное число, отличное от нуля, имеет то же направление, то направление вполне определяется заданием отношения CiiC2 координат вектора с, если С2ФО. Мы будем употреблять символ CiiC2 и в том случае, когда Сг=<), символ 1:0 задает направление базисного вектора ё±. Пусть ацфО. У вектора, имеющего асимптотическое направление, с2ф09 так как в противном случае из равенства (2) следует auCi2=0, a ацф0 и й=7^0. Запишем теперь равенство (2) в виде an (— ) +2а12— +022=0. \ С2 ' С2 (3)
490 Глава 18. Квадрики Решая это квадратное уравнение относительно —', получим Сг Ci — 0i2± V а12—аца22 /Л. — .' (4) Возможны следующие случаи: 1. I 011 ^12 = 0110*2—Я^Х). Не существует (вещественных) асимптотических направлений относительно линии (1) или, иначе, существуют два мнимых асимптотических направления. Такая линия называется линией эллиптического типа. х2. I Оц ai2 I 0i2 022 =0ц022—0f2<O. Имеются два вещественных асимптотических направления. Такая линия называется линией гиперболического типа. 3. 011 012 | Л п « Л I =аца22—0?9=О. 012 022 ' 12 Имеется одно вещественное асимптотическое направление. Такая линия называется линией параболического типа. Если ац=0, но 022=7^=0, то, меняя ролями Ci и сг, мы придем к тем же случаям. Наконец, пусть ац=0 и а22=0. Тогда *0i2#O и уравнение (2) принимает вид: a12CiC2=0. В этом случае существуют два асимптотических направления, определяемых векторами с(1, 0) и с'(0, 1), т. е. линия (1) —гиперболического типа. Итак, все линии второго порядка по количеству различных вещественных направлений делятся на три типа: эллиптические (нет вещественных асимптотических направлений), гиперболического типа (два направления) и параболического типа (одно направление). ч- При аффинных преобразованиях плоскости E2(i) линия второго порядка не может изменить свой тип, так как при этом вещественные асимптотические направления переходят в вещественные асимптотические направления. Пример. Найти асимптотические направления линии *i2—3*i*2+2*2—5x2z+2x2—3=0. (5) Решение. Координаты Ci и с2 вектора, имеющего асимптотическое направление, находятся из уравнения Ci2—3ciC2+2c22=0. Перепишем это урав-
§ 174. Центр квадрики* 491 нение в виде (M2_3iL+2==0. \ Сг ' Сг Оно имеет два решения Ci:c2 = 2:l и ci/:c2,= l:l, и, следовательно, линия (5) — гиперболического типа. Предоставляем читателю убедиться в том, что линии, рассмотренные в § 72, имеют следующие типы: эллипс — линия эллиптического типа; гипербола и пара пересекающихся прямых — линии гиперболического типа; парабола, пара параллельных прямых и прямая — линии параболического типа. § 174. Центр квадрики Пусть в пространстве Еп(1) выбран некоторый репер и задана квадрика п п 2£ (ZijXiXj+2 J2 Яг*;+й=0. (1) г, ;=Ы г=1 Пусть точка В(Ьи Ь2у ... , Ьп) —центр квадрики (1) (см. § 161) Xi=bi+City /=1, 2, ... , /г,— (2) уравнения прямой, имеющей неасймптотическое направление. Как известно из § 171, прямая (2) имеет с квадрикой (1) две общие точки различные или совпадающие. Для отыскания этих точек подставим значения Xi из формул (2) в уравнение (1) и приведем подобные члены. Мы получим t2 £ aijcicj+2t'-'S'ls *ubj+ai) й+?=0, (3) где n n q= ]£ dijbibj+2 Д? ciibi+a. Если U и t2 — корни уравнения (3), то точками пересечения прямой (2) с квадрикой (1).будут Mi(bi+Citu bz+crfu ... , bn+cJi) и M2(bi+Cit2i b2+c2t2, ... , bn+Cnh). Так как точка В является серединой отрезка MiM2, то (см. § 161) Ь<= ibi+Cih)pbi+Cih) =bi+f(ti+t2y, f-1,2 п. (4)
492 Глава 18. Квадрики Поскольку среди чисел си С2, ... , сп - (5) есть отличные от нуля, то из равенств (4) следует, что ti+t2=0. Но тогда в квадратном уравнении (3) должен быть равен нулю коэффициент при первой степени t, т. е. sis *ijbi+*i) ъ=о. (6) Рассмотрим (6) как систему линейных однородных уравнений относительно неизвестных (5) (система состоит из одного уравнения). Она должна удовлетворяться для любого неасимптотического направления. Как известно из § 172, существует п линейно независимых решений этой системы и, следовательно, ее ранг^равен нулю, т. е. 4 п 2 ацЬ5.+сц=0, t=l, 2, ... , п. (7) j=i Системе (7) должны удовлетворять координаты Ъ\ любого центра квадрики (1). Верно и обратное: любая точка B(biy 62> • • Л Ьп)> удовлетворяющая системе (7), является центром квадрики (1), так как (7) =>■ (4). Перепишем систему (7) в виде п J2 а^-+а»=0, i*=l, 2, ... , п. (8) j=i Если обозначить левую часть уравнения квадрики (1) буквой F, то систему (8) можно представить в форме dF =0, i=l, 2,..., я, (9) дх dF где -5 частная производная функции F=F{xu хг хп) ОХ\ YVOXi. Итак,- решения системы (8) и только они являются координатами центров квадрики (1). Так как система (8) —линейная,
§ 174. Ц[ентр квадрики 493 то множество центров квадрики (1), если оно непустое, является плоскостью пространства Еп (i). Квадрика, обладающая единственным центром, называется центральной. Рассмотрим теперь плоскость E2(i). Пусть в некоторой аффинной системе координат задано уравнение линии второго порядка 0ii*i2+20i2*i*2+022*22+2ai*i+202*2+0=O. Система уравнений для определения координат центра имеет вид 0ii*i+0i2*2+0i=O, 1 012*1+022*2+02 = 0. J (10) Так как для линий эллиптического и гиперболического типов определитель системы (10) I aii aa \фо, 1 012 022 ' V то каждая из этих линий имеет единственный центр, т. е. является центральной линией. Таким образом, линии эллиптического и гиперболического типов центральные. У параболы Aii2—2/7*2=0 нет центра, так как второе уравнение системы (10) дает /7=0, что противоречит определению параболы. Для пары параллельных прямых *i2-02=O (И) система (10) сводится к одному уравнению *i=0. (12) Отсюда следует, что каждая точка прямой (12) является центром линии (11), т. е. линия (11) имеет прямую центров. Тот же результат получается для линии *12=0.
494 Глава 18. Квадрики § 175. Диаметральные плоскости Пусть в пространстве En(i)- выбран некоторый репер и задана квадрика п п 2Z aijXiXj+2 JS aixi +a=0. (1) г, j=i i=i Пусть Xi=bi+dtt i=\, 2, ... , n— (2) уравнение прямой, направляющий вектор которой с(си с2, ... , сп) (3) имеет неасимптотическое относительно квадрики (1) направление. Прямая (2) пересекает квадрику (1) в двух точках М'^Л*/, ...,*„') и М"(*Л*2", ...,*»"), может быть, совпадающих. Отрезок М'М" будем называть *ор- дой, высекаемой на прямой (2) квадрикой (7). Если в качестве начальной точки В(Ь±, Ь2> ... , Ьп) прямой (2) взять середину хорды М'М", то должно выполняться равенство (6) из предыдущего параграфа: п п ]£ aifibj+ ]£ aiCi=0. (4) г, j=l г=1 « (Если ЛГ=ЛГ, то положим В=М'=М".) 4 Рассмотрим теперь все прямые с заданным направляющим вектором (3). Середины хорд, высекаемых на этих прямых квадрикой (1), образуют множество точек, определяемое уравнением п п JS ацс{Х}+ J£ aid=0, (5) г, j=l г=1 которое получается из равенства (2) заменой обозначений bj на Ху Уравнение (5) — линейное. В самом деле, если в этом уравнении все коэффициенты при Xj — нули, т. е. п -J} <*ijCi=0, /=1, 2, ... , л, то, умножая каждое из этих равенств на соответствующее Cj и суммируя по /, получим п ^^ afjCiCj — и, i. J=i
§ 176. Диаметры линий второго порядка 495 т. е. вектор (3) имеет асимптотическое направление, вопреки предположению. Таким образом, имеет место Теорема. Множество середин хорд, высекаемых квадрикой (1) на всех параллельных прямых с направляющим вектором (3), имеющим неасимптотическое направление, является гиперплоскостью с уравнением (5). Гиперплоскость (5) называют диаметральной гиперплоскостью квадрики (1), сопряженной с направлением вектора (3). Заметим, что уравнение диаметральной гиперплоскости (5) можно записать в виде п dF где -т частная производная от левой части уравнения (1) • ОХ{ по Х{. Сопоставляя это уравнение с уравнениями (9) из § 174, определяющими центр квадрики (1), мы получим, что каждая диаметральная плоскость квадрики (1) проходит через любой ее центр. Очевидно, диаметральная плоскость — аффинное понятие. § 176. Диаметры линий второго порядка Рассмотрим плоскость E2(i). Пусть выбран некоторый репер и задана линия второго порядка с уравнением anXt2-\-2ai2XiX2+a22X22+2aiXi+2a2X2+a=0. (1) В рассматриваемом случае диаметральная гиперплоскость является прямой и называется диаметром. Уравнение диаметра, сопряженного с неасимптотическим направлением вектора с(си Сг), имеет вид (aiiCi+ai2C2)xi+ (ai2Ci-\-a22C2)X2+aiCi+a2C2=0 (2) или dF , dF dF dF где -т— и -г частные производные от левой части уравнения UX\ (JX2 (1) по Xi и х2 соответственно. Как отмечалось в предыдущем параграфе, каждый диаметр линии (1) проходит через любой ее центр. Для линии (1), имею-
496 Глава 18. Квадрики щей прямую центров, вопрос о диаметрах решается теперь полностью: у такой линии имеется только один диаметр — прямая центров. Рассмотрим теперь вопрос о диаметрах центральной линии (1). В-этом случае fliiO22-fl^¥=0. (3) Два направления Ciic2 и с^!\с2 называются сопряженными относительно центральной линии второго порядка (1), если они удовлетворяют соотношению aitCtCi +а12 (c&'+CzCi') +а22с2с2/=0. (4) Отметим основные свойства сопряженных направлений. 1. Каждому направлению С\\с2 соответствует в качестве сопряженного одно вполне определенное направление Ci':c2. ф В самом деле, перепишем равенство (4) в виде (ailCi+ai2C2)Ci'+(ai2Ct + a22C2)C2' = 0. (5) Если предположить, что «11^1 + ^12^2 = 0, 1 «12^1+^22^2 = 0, J (6) то в силу неравенства (3) мы получим, что система уравнений (6) относительно неизвестных й и с2 имеет только нулевое решение: й=0, С2=0. Но это невозможно, так как вектор с(си с2) — ненулевой. Итак, оба коэффициента при с/ и с2 в уравнении (5) обратиться в нуль не могут, и, следовательно, из этого уравнения мы найдем вполне определенное отношение ci':c2'. • 2. Асимптотическое направление и только оно сопряжено самому себе. ♦ В самом деле, если для данного направления Ciic2 сопряженным является само это направление, то равенство (4) дает aiiCi2+2ai2cic2+a22c22=0t (7) т. е. направление с^\с2 — асимптотическое. Обратно, если направление с^\с2—асимптотическое, т. е. удовлетворяет равенству (7), то равенству (4) удовлетворяют с±=с± и с2'=с2. Следовательно, направление ciic2 сопряжено самому себе. #
§ 176. Диаметры линий второго порядка 497 3. Если направление с4:с2— неасимптотическое, то сопряженное направление также неасимптотическое и является на- правлением диаметра, сопряженного с направлением ci:c2. ♦ В самом деле, диаметр, сопряженный с неасимптотическим направлением сс.Сг,— это прямая (2). Для направляющего вектора c'(ci', с2) этой прямой Ci':c2'= — (ai2ci+a22c2): (aiiCi+ai2c2). Но отсюда следует равенство (5). ф Два диаметра, имеющие взаимно сопряженные направления, называются сопряженными диаметрами, каждый из них делит пополам все хорды, параллельные второму диаметру (рис. 107). Мы знаем, что любой диаметр центральной линии второго порядка (1) проходит через ее центр. Покажем теперь, что любая прямая / неасимптотического направления, - проходящая через центр центральной линии Рис. 107 второго порядка, является диаметром этой линии. В самом деле, пусть с±\с2 определяет направление прямой / и с{: с2 — сопряженное направление, причем оба эти направления — неасимптотические. Рассмотрим диаметр, сопряженный. £ направлением Ci'\c2. Он имеет направление с±:с2 и, проходя через центр линии (1), совпадает с прямой I. Наконец, рассмотрим диаметры, параболы. Пусть парабола в некоторой ортонормированной системе координат выражается уравнением 2pxi-x22=0, p>0. (8) Уравнение диаметра параболы (8); сопряженного с направлением Ci: с2, имеет вид pd—с2х2=0. Л; Отсюда следует, что все диаметры параболы параллельны ее оси, и любая,прямая, параллельная оси параболы, является диа- метром< Пример. Написать уравнение диаметра линии 5jc±2—4*1*2—6*1—2*2+1 =0, (9) проходящего через точку М (2, —4). -Решение. Уравнение (2) для линии (9) принимает вид (5*i~2*2-3) Ci- (2*i'+ 1)с2=0. * (101
498 Глава 18. Квадрики Координаты точки М должны удовлетворять этому уравнению, следовательно, 3ci = c2. Вставляя выражение с2 через Ci в (10), сокращая на с4 и приводя подобные члены, получим уравнение искомого диаметра *1+2х2+6=0. § 177. Упрощение уравнения квадрики с помощью преобразования координат Пусть в пространстве En(i) выбран некоторый репер и задано уравнение квадрики п п J£ dijXiXj+2 Д? aiXi+a=0. ^(1) i, j=l i=l Постараемся за счет преобразования координат упростить это уравнение. Как известно из § 131, существует невырожденное линейное преобразование переменных Х\у х2у ... , хп — п Xi= 2 UikXk, 1=1, 2, ... , /г, *=* [ (2) det [aih] Ф0У <хш — вещественны, приводящее квадратичную форму п ^^ ClijXiXj i, j=l к нормальному виду п ^/ E>iXi , г=1 где ег=±1,0. Если рассматривать формулы (2) как-формулы преобразования координат, то можно сказать, что уравнение квадрики (1) в новых координатах имеет вид 2 бг*/2+2 J2 сц'х{'+а=0, (3) i=i i=i гдеег=±1,0. Если Е{ф0 для некоторого £, то параллельным сдвигом осей координат можно добиться исчезновения члена с первой степенью Xi\ Пусть, например, ei=j£0, тогда / а/ V а/2 eix^+2ai/xi/=ei U'+ —) -—.' \ ei / ei
§ 177. Упрощение уравнения квадрики с помощью преобразования координат 499 Совершим теперь^ параллельный сдвиг координатных осей по формулам а/ *i=*i4 , Xi=Xi'9 i=2, 3, ... , п. ei При переходе к новым координатам в уравнении квадрики (3) коэффициент при квадрате первой координаты сохранится, первая степень первой координаты исчезнет, свободный член получит дополнительное слагаемое. Аналогичные преобразования мы произведем и с другими координатами, для которых е^О. Предположим, что в уравнении (3) 61=^0, е2¥=0, ... , ег^=0, 8г+1=0, ... , en = 0, 0<г^/г. (4) Этого всегда можно'добиться. В самом деле, если, например,' е1==0, a er+i^O, то, совершая преобразование координат Xi = Xfr+U Xr+i = Xi', Xi = Xi', [ф\, Г+\>, мы придем к тому, что ei^O. Итак, предполагая, что выполнены условия (4) и совершая указанные выше параллельные сдвиги координатных осей, мы приведем уравнение квадрики (4) к виду 2 е&2+ jg a/Xj+b=0, ег = ±1, 0<r^n. (5) i=l j=r+l Пусть a,r+i=^/r+2=- • .=#n/—0, т. е. уравнение (5) имеет вид JS EiXi2+b=Q. (6) Если ЬФО, введем обозначения Xi=--y-f t=l,2, (M,r, Тогда уравнение (6) примет вид JJb<xf=l. (7) г=1
500 Глава 18. Квадрики Преобразуя координаты по формулам.: Xi=yYiXiy если Хг>0, Xj=y —XjXj, если Xj<0, Xh=Xk для остальных хн> ) приведем уравнение (7) к виду 2}щХ? = \, jbii=±l, 0<г^/г. (8) Если в уравнении (6) 6=0, это ураэнение имеет вид V ^6iJci2=0, ег=±1, 0<г^/г. (9)! Пусть теперь в уравнении (5)-среди коэффициентов а/ есть| отличные от нуля, например a'r+i=#=0. Совершим тогда преобразование координат п Xi=xi9 гфг. Тогда уравнение (5) примет вид J2 еДг2=2Хг+1, 0<г<п. в. (10) Назовем уравнения (8) — (10) нормальными уравнениями квадрик в пространстве En(i). Таким образом, имеет место Теорема 1. Любая квадрика пространства En(i) в подходящем репере может быть задана нормальным уравнением. Выясним геометрический смысл системы координат, в которой квадрика задается нормальным уравнением (8), (9) или (10). Рассмотрим вектор ёи i<r. Диаметральная гиперплоскость, сопряженная с направлением этого вектора, имеет уравнение Xi=0. (11) Гиперплоскость (11) называется координатной гиперплоскостью репера (О, ёи ёг,.. -, ёп).
§ 178. Аффинная классификация квадрик 501 Таким образом, для вектора ёи Кг сопряженная с ним диаметральная гиперплоскость является координатной. Если же 1>г, то вектор ёи очевидно, имеет относительно квадрики асимптотическое направление. Заметим, что уравнения (8), (9) в отличие от уравнения (10) не содержат первых степеней неизвестных. Это связано с тем, что у каждой из квадрик (8), (9) есть по крайней мере один центр — начало координат, а у квадрики (10) центра нет, что легко проверить. В связи с этим отметим следующий результат, j Теорема 2. Для того чтобы в уравнении квадрики отсутствовали члены Q первыми степенями неизвестных, необходимо и достаточно, чтобы начало координат являлось центром квадрики. ф Если ^ начало координат является центром квадрики, то уравнения центра п ■2 aij#j+0i=O, i=l, 2, ... , п9 удовлетворяются значениями х1=0, х2=0, ... , хп=0. Следовательно, а1=0, а2=0, ... , ая=0. Обратно, если в уравнении (1) нет членов первой степени, то этому уравнению наряду с точкой M(xit хг,... , хп) удовлетворяет и точка M?(xi% X2,... , хп) и, следовательно, начало координат является центром квадрики. # § 178. Аффинная классификация квадрик Рассмотрим нормальные уравнения квадрик пространства En(i)t полученные в предыдущем параграфе: -*i2-' • •-*£+**+!+• • -+х?=1> 0<г^п, А^О, (1) -*;-.. .-#к+#ш+.. .+*2г=о, о<т^п, o^k^ X-fv (2) -х\-.. .-xl+xl+i+.. .+x*=2Xr+t9 0<r<n, 0^*< —-. (3) Пусть квадрика Ф задается в репере (О, ёи ё2, ... , ёп) (4)
502 Глава 18. Квадрики уравнением (1), а квадрика Ф' в репере (0'f ft', &', ... , *»') (5) тем же уравнением (с теми же г и k). Рассмотрим аффинное! преобразование пространства En(i), переводящее репер (4); в репер-(5). При этом преобразовании квадрика Ф как множество: всех точек пространства, координаты которых в репере (4) удовлетворяют уравнению (1), перейдет в квадрику Ф', состоящую из всех точек, координаты которых в репере (5) удовлетворяют тому же уравнению. Приведенное рассуждение применимо к любым двум квадрикам, которые в подходящих реперах задаются одним и тем же нормальным уравнением (1) —(3) (при одних и тех же г и k): для таких квадрик существует аффинное преобразование пространства En(i)y переводящее одну квадрику в другую. Пусть теперь Ф и Ф' — две квадрики, которые в репере (4) задается соответственно уравнениями: п п J£ aijXiXj+2 J£ a{Xi+a=Oy (6) i, j=l i=l , jt ац'х/х/+2 J2 щ'х/+а'=0. (7) i, j=l i=l В последнем уравнении мы поставили штрихи у координат для удобства дальнейших рассуждений. Пусть существует аффинное преобразование / пространства En(i)y переводящее квадрику (6) в квадрику (7). Запишем формулы этого преобразования в виде п xi= 21 ««*/+«*, i=l, 2, ... , пу det [a<j]#0; a<j, a* — вещественные числа, тде xi, X2, ... , хп — координаты произвольной точки М пространства Еп (i) в репере (4), а х±\ х2', ... , хп' — координаты точки f(M) в том же репере. Если в левую часть уравнения (6) подставить выражения Хи Xj из формул (8), то получится выражение, отличающееся от левой части уравнения (7) лишь постоянным вещественным множителем ЬфО. При этом квадратичная форма п i. 3=1 (8)
§ 178. Аффинная классификация квадрик 503? » : . преобразуется в квадратичную форму Ь J; а{/х/х/, (10) г, j=l причем коэффициенты аг/ не зависят от аг-, т. е. переход от (9) к (10) совершается фактически с помощью преобразования п ^ хг-= 2j cCijXj , t= 1, 2, ... , nf /in j=i [ - (11J det [aij]=7^0, cxij — вещественные числа J с последующим умножением на вещественное число ЬфО. Покажем теперь, что от любого из нормальных уравнений (1) — (3) нельзя перейти к какому-либо другому нормальному уравнению с помощью преобразований (8). Иначе говоря, мы покажем, что квадрики пространства En(i), задаваемые различными нормальными уравнениями, не переводятся друг в друга с помощью аффинных преобразований этого пространства. Квадрика (3) отличается от квадрик (1) и (2) отсутствием центров. Далее, любой центр квадрики (2) принадлежит этой квадрике, а центры квадрики (1) не принадлежат ей. Если теперь сравнить квадратичные формы двух нормальных уравнений одного и того же вида, например (2) при несовпадающих г или k, то они отличаются либо рангом г, либо абсолютной величиной сигнатуры \r—2k\. Но при преобразовании (11) ранг и сигнатура квадратичной формы не меняются, а при умножении на вещественное число ЬФО ранг не меняется, а сигнатура может изменить только знак. Проведенные выше рассуждения позволяют сформулировать следующий результат. Теорема. Разобьем множество всех квадрик пространства En(i) на классы, отнеся в один класс .все квадрики, которые в подходящих реперах задаются одним и тем же нормальным уравнением. Это разбиение на классы является эквивалентностьну в множестве всех квадрик. Все квадрики, принадлежащие одному- классу, аффинно эквивалентны. Квадрики, принадлежащие раз- личным классам, аффинно различны, т. е. не могут переводиться друг в друга с помощью аффинных преобразований пространства En(i). В заключение приведем таблицы аффинных классов линий и поверхностей второго порядка в пространствах E2(i) и E3(i). Аффинная классификация линий второго порядка на плоскости E2(i):
504 Глава 18. Квадрики х*-\-х*=\ — эллипс, л;2+а:|=—1 — мнимый эллипс, xz—x*=l —гипербола, х2—jc|=0 —пара вещественных пересекающихся прямых* jcJ+jc|=0 —пара мнимых пересекающихся прямых (*i+~ +ijc2=0 и 'Xt—ix2=0)f х2=2х2 —парабола, л:^— 1 = 0 — пара вещественных параллельных прямых, *2+1=0 —пара мнимых параллельных прямых (#i-f/=0 и -xi—1=0), х2=0 — сдвоенная прямая. Аффинная классификация поверхностей второго порядка (квадрик) в пространстве E3(i): *1+#2+*з= * — эллипсоид, xl+xl-hxl= — l — мнимый эллипсоид, xl~^xl~xl=^ —однополостный гиперболоид, х2+х2—*х2= — 1 —двуполостный гиперболоид, • х1+х1—х1=0 —конус, *i+*i*+*2=0 — мнимый конус, х2+х2=2х3 —эллиптический параболоид, х2—х2=2х3 — гиперболический параболоид, х2-\-х^= 1 — эллиптический цилиндр, х2+х2= — 1 — мнимый эллиптический цилиндр, xl~~xl= * — гиперболический цилиндр, х1—х1=0 —пара вещественных пересекающихся плоскостей, x2t+x2=0 —пара мнимых пересекающихся плоскостей, х2=2х2 — параболический цилиндр, х2—1=0 —пара вещественных параллельных плоскостей, #i+l =Q —пара мнимых параллельных плоскостей, х2=0 — сдвоенная плоскость.
§ 179. Упрощение уравнения квадрики 605 Пример. Определить аффинный класс поверхности второго порядка в пространстве E3(i), заданной относительно некоторой прямоугольной системы координат Oxyz уравнением x2—2y2+z2+4xy—\0xz+4yz+2x+\6y—z+2 = 0. (12) Решение. Преобразуем уравнение (12): __ (*!2+4xy-\0xz+2x) -2y*+4yz+\6y-z2-z+2=0, (x+2y-5z+1) z-Qy2+24yz+12</-24z4-9z+1 = 0, (x+2y-5z+1) 2~6 (y-2z+1)2-15z+7 =0. (13) Совершим преобразование координат по формулам х*=х+2у-Вг+1, y'=fe(y-2z+\), z'= Z~~ ., В новых координатах уравнение (13) примет вид (x')2-{y')2=2z'. Таким образом, уравнение (12) задает гиперболический параболоид. § 179. Упрощение уравнения квадрики, заданного в ортонормированном репере Пусть в пространстве En(i) относительно ортонормированного репера (О, ёи ё2, ... , ёп) ' (1) задано уравнение квадрики Ф: п п J£J a,ijXiXj+2 J£ aiXi+a=0. (2) i, j=l г=1 • Будем упрощать уравнение этой квадрики за счет подходя- * щего выбора ортонормированного репера. Как показано в § 150, существует преобразование п Xi= J^J GLijXj'y 1=1, 2, . . . , П> j=l [an] — вещественная ортогональная матрица, приводящее квадратичную форму п 2 aijXiXj i, 3=1 (3)
506 Глава 18. Квадрики К виду JEM**')*. г=1 где &i, &2, ... , Ьп — собственные значения матрицы [аг;]. Будем рассматривать (3) как формулы преобразования координат, соответствующего переходу от репера (1) к новому лэртонормированному реперу (О', ei'.h', ... , ёи'). (4) Вставляя выражения х\ из формул (3) в уравнение (2) и приводя подобные члены, мы получим уравнение квадрики (2) в новых координатах JS'M*<')2+2 JE ciXi'+a=6. ' (5) Ортонормированный репер, относительно которого квадрика Ф задается уравнением, (5), не содержащим произведений различных координат, будем называть репером главных направлений этой квадрики. Так же, как это делалось в § 177, за счет параллельного сдвига координатных осей и изменения нумерации координат можно привести уравнение (5) к виду Д7 ЬгХ*+2 J} см+Ь=0, 0<rs£n, Ь{ф0. (6) г=1 j=r+i Пусть cr+i = cr+2=. • :=сп=09 т. е. уравнение (6) имеет вид JZ Ьх£+Ь=09 bi=£0. (7) г=1 рели ЬФ'О, введем обозначения Ь -to Рг = —у,' 1=1, 2, ... , Г. Тогда уравнение (7) примет вид ЗЕсли в уравнении (7) 6=0, то уравнение можно представить
§ 179. Упрощение уравнения квадрики 507 в виде If-- Пусть теперь в уравнении (6) r<nf cr+i¥=0f ... , cr+s=j£0, cr+s+i = 0, ... , cn=0, 5>0. Тогда можно совершить переход к новому ортонормированному реперу так, чтобы в уравнении (6) пропали первые степени всех координат, кроме одной. В самом деле, в пространстве всех вещественных строк длины я со скалярным произведением п (tti, 0&2, . . . , O&n) (Pi, р2, • • • , Рп) = JEJ OtiPi система строк ii=(l,0,...,0), i2= (0, 1,0, ...,0), 7Г=(0, ...,0, 1,0, ...,0), 7r+1=-^- (0, ... , 0, Сг+и —у Cr+Sy0, ... , 0), где т= fcr+i-)-...+Cr+s, является ортонормированной. Следовательно, она может быть дополнена до ортонормированного базиса iu h, ... , in, (Ю)' h= (Yib Yj2, ... , yjn), /=r+2, ... , n. Рассмотрим теперь преобразование координат: ^=i(, i= 1, 2, ... , г, | Xr+i= — ( Cr+ixr+t+.. .+cr+sXr+s+ -y ) »' (!!) Xj=yjixi+yj2x2+.. .+yjnxn, j=r+2, ... , n. ) Так как репер (10) ортонормирован, то матрица преобразования (11) ортогональна и это преобразование соответствует переходу к новому ортонормироаднному реперу. В этом репере уравнение квадрики имеет вид ^Щ-^2Хгн, (12)
508 Глава 18. Квадрики где Р*=—-Ь7<: *=1.2,...эг. Уравнения (8), (9), (12) называются каноническими уравне- миями квадрик в пространстве En(i). Таким образом, имеет место Теорема. Любая квадрика пространства En(i) может быть задана в подходящем ортонормированном репере каноническим уравнением. *■ § 180. Исследование поверхности второго порядка в пространстве E3(i) по общему уравнению Пусть в пространстве E3(i) задана поверхность П второго порядка своим уравнением aiiX2+a22y2+a33z2-\-'2ai2xy+2at3xz+ - +2а2зУ2+2а1Х+2а2у+2а3г-\-а=0 (1) в прямоугольной системе координат Oxyz. Чтобы определить вид, размеры и расположение этой поверхности относительно системы координат Oxyz, проделаем следующие операции. 1. Найдем репер главных направлений поверхности (1). Координатные строки базисных векторов ^/(ан, аги «зО,* e2f(ot,i2, «22, азг), ё3 (аы, агз, азз) этого, репера в соответствии с § 179, Г48 являются решениями системы линейных уравнений (Я—#ii)*i—#12*2—а1з*з=0г — 012*1+ (А,—#22) *2—#23*3=0, —ai3xi—a23X2+ (k—a33)x3=0, (2) где в качестве К берутся собственные значения матрицы . А = an ai2 ai3 #12 #22 #23 #13 #23 #33 (3) 2. Составим формулы преобразования координат, задающие переход к новому реперу (О, ё/, ё2, ё3) или, иначе,.к новой пря-
§ 180. Исследование поверхности второго порядка по общему уравнению 509 моугольной системе координат Ox'y'z': (4) *=a11*/+ai2#'+ai3z', у=a2i*'+ а>22У'+a23z', z= аз^+азг^'+азз^, где х, уу z — старые координаты произвольной точки М, а *', у'у z? — новые координаты этой точки. Подставляя выражения х> у, z из формул (4) в уравнение (1), приведем это уравнение к виду h (*') 2+62 (*/') 2+йз (г') *+2cix'+2c2y'+2c3z'+a=0, где Ьи Ьг, bz — собственные.значения матрицы (3). Заметим, что здесь фактически приходится находить только коэффициенты Си С2, Сз, так как Ьи &2, Ьз вычислялись раньше. 3. С помощью параллельного сдвига координатных осей и поворота вокруг одной из них мы придем к декартовой прямоугольной системе координат O'XYZ, в которой уравнение поверхности П будет иметь канонический вид. 4. Теперь легко решаются поставленные выше вопросы. Пример 1. Исследовать поверхность второго порядка, заданную в прямоугольной- системе координат Oxyz уравнением 5хЪ+6у*+7г2-4ху+4уг-\0х+8у+Ш-6=0. (5) Решение. Матрица (3) имеет вид [5 -2 0"| -2 6 2, 0 2 7J а ее характеристический полином I Х-5 2 О I 2 Х-6 -2 I 0 -2 Я-7 I имеет корни 3, 6, 9. Составим систему (2) для К = 3: —2*i+2*2=0, 2jct—3*2—2*з=0, —2*2—4x3=0. Решение этой системы — вектор a(2a, 2а, —а), где а — произвольное вещественное число. Нормируя вектор а, получим вектор
510 Глава 18. Квадрики Аналогично находятся векторы /2 1 2 \ / 1 2 2 \ 62 \Т'-Т'Т)> Ч-ГТ'Т)- (7) Итак, точка О и векторы (6), (7) образуют репер (О, ё/, ё2', ё3') главных направлений поверхности (5). Запишем формулы преобразования координат, соответствующие переходу от исходного репера к реперу (О, ei', ёгУ ez): 2x'+2y'—z' 2x'—y'+2z' —x'>+2y'+2z' х- , if- . z= 5 . (8) Подставляя выражения xy у, z из формул (8) в полином- -'lO*+80+14z и приводя подобные члены, получим —a^+iaz'. Итак, в системе координат Ox'y'z' уравнение поверхности (5) имеет вид 3(^)2+6(/)2+9(2,)2-6jc'+182,-6=0 или (*') 2+2 (у') 2+3 (г') 2-2*'+6г'-2 = 0. Представим это уравнение в виде (*'-l)2+2(i/')2+3(z'+l)2 = 6. Совершая параллельный сдвиг системы координат Ox'y'z' iio формулам Х=х'-\, Y=y', Z=z'>+\y мы придем к каноническому уравнению поверхности (5): X2 У2 Z2 = 1. 6 3 2 Итак, поверхность (5) —эллипсоид с полуосями а==/б", 6 = /3^ с=У 2. Пример 2. Исследовать поверхность второго порядка, заданную в прямоугольной системе координат уравнением x2+y2+4z2+2xy+4xz+4yz—2y+z = 0. (9) Решение. Матрица (3) имеет вид 1_2 2 4 J а ее характеристический полином имеет корни 0 и 6. Система (2) для Я==0 сводится к одному уравнению: *1+*2+2х3 = 0.
§ 180. Исследование поверхности второго порядка по общему уравнению 511 « Этому уравнению удовлетворяют все векторы вида а (—а—2(J, а, (J), где а и р — произвольные вещественные числа. Рассмотрим один из этих векторов, например й\ (—1, 1, 0). Второй вектор найдем из условия ортогональности вектора а вектору й\\ а+2р+а=0. Следовательно, можно взять вектор а2 (1, 1, —1). Нормируя векторы а4 и аг, получим два из искомых векторов: \ V2 У2 j V УЗ УЗ УЗ ) (10) Для отыскания третьего главного направления можно воспользоваться тем обстоятельством, что искомый вектор ёг ортогонален векторам ei', ёг и, значит, коллинеарен векторному произведению [ё^ёг]. Следовательно, , / 1 1 2 \ ё3'\ , , . (11) V ут уё /ё / Репер, образованный точкой О и векторами (10), (11), есть репер главных направлений поверхности (9). Запишем формулы преобразования координат, соответствующие переходу от исходного репера к реперу (О, ё/, ёгУ ёз'): . х' у' г' х' у' z' ; + -—■• У= ■+■ УУ /з" Уб" уТ уУ уб z = - +——. /з" уб В системе координат Ох'у'г' уравнение поверхности (5) имеет вид 6(г')2-У~2x'-f3y'=0. (12) Запишем формулы поворота системы координат Ох'у'г' вокруг оси Ог'\ х'=Х cos a— Y sin а, y'=Xs'm а+Kcos a, z'=Z. Подставляя выражения *', */', г' из этих формул в уравнение (12), получим 6Z2-(/2"cos a+V3 sin a)X+0T2 sin a-УЗ cos a) У=0. (13) Найдем значение a из условия ' y^2sina—/3cosa=0. Отсюда tga=l/—» sina=l/—, cos a=y—.
512 Глава 18. Квадрики Уравнение (13) принимает канонический вид Z'=-L-X (14) Итак, поверхность (9) — параболический цилиндр с каноническим уравнением (14). § 181. Метрические инварианты полинома второй стедени Пусть в пространстве En(i) выбран ортонормированный репер и в этом репере задано уравнение квадрики п п Д7 ciijXiXj-\-2 Д} aiXi-\-a=0. (1) i, j=l i=l Левая часть этого уравнения П П JS aijXiXj+2 Д[ ciiXi+a — (2) i, j=i i=i полином второй степени относительно переменных Хи #2, , хп с вещественными коэффициентами. Совершим преобразование переменных Xi= ^ CLihXh'-\-&h 1=1, 2, . . . , /1, . h=l С= [a,ik] — вещественная ортогональная матрица, оц — вещественны. (3) Можно считать, что формулы (3) задают преобразование' координат точек при переходе к новому ортонормированному реперу. Подставляя значения х\ из формул (3) в полином (2) и приводя подобные члены, мы получим полином второй степени относительно переменных #/, х2\ ... , хп': п п 2 ац'Хг'х/+2 Д; ctiW+a'. (4) i, j=l i=l Метрическим инвариантом полинома (2) называется такой полином F(aih aky a) относительно коэффициентов полинома (2), который не изменяет своей численной величины, если вместо коэффициентов а*;, а& и а
§181. Метрические инварианты полинома второй степени 513 поставить соответствующие коэффициенты #г/, ак и а! полинома (4), получающегося из полинома (2) в результате произвольного преобразования вида (3), т. е. ?(рц\ ak'\ a')=F(aijy ak, #). Теорема. Коэффициенты полинома относительно К I X—an —#12 ... —#m — #21 ^—а22 • • • — #2п | —#nl #п2 • • • Л &пп т. е. характеристического полинома \ХЕ—А\ матрицы А=[а^]9 и определитель' #н #21 #nl #1 #12 • - #22 . • #П2 • #2 . • #1п • #2п #пп . #п #1 #2 #71 1 а являются метрическими инвариантами полинома (2). ф Перейдем к новому ортонормированному реперу по формулам (3). Как показано в § 179, уравнение квадрики (1) примет вид 2 ац'х/х/+2 J} ai'Xi'+a'=*0, i, j=l i=i причем В=[ац']=С*АС. (7) Так как матрица С ортогональна, т. е. Ст=С-*9 то из равенства (7) следует, что матрицы А и В подобны. Как известно из § 110, у подобных матриц характеристические полиномы одинаковые \Х—#ц' —#127 . . . —#1п — #21 А,—#22 • • • —&2п I —#ш' —#п2х . • • к—апп' Представим определитель \ХЕ-—А\ в виде \№—А | =к»—1№-*+1№*—.. .+ + (-l)"-1/n-iM-(~l)n'n, (5) Я—#Ц —#12 — #21 Я—#22 —#Ш — #2п — #Ш —#п2 • . • А,—#я
514 ' , Глава 18. Квадрики где /л — определитель матрицы Л, а /л —сумма диагональных!; миноров Л-го порядка определителя /п. Аналогично \ \%Е—В | =Х»—/А^+№-2—.. .+ -Ь (—1) »-*//«-iX+ (—1) ^/п'. Равенство (8) запишется теперь в виде V-/iV-i+/2^-2-...+ (—l)»-t/n^A,+ (—1)»/п= Так как у равных полиномов коэффициенты при соответствую- ■ щих степенях К равны, то /n'==/n, I'n-{=In-U ... , Ii,=zli. Итак, величины /n, /n-i, ... , h являются метрическими инвариантами полинрма (2). Перейдем к исследованию определителя (6). Рассмотрим вместо полинома (2) полином Д7 ацХгХэ+2 JJ diXit+at2, (9) i, j=l г=1 введя новую переменную /. Полином (9) является квадратичной[ формой относительно переменных хи х2, ... , #п, £. Полином (2) получается из полинома (9) при t=V. Рассмотрим, кроме того, линейное преобразование переменных Хи х2,..., хп, t в переменные х/, х2\ ..., Хт/, *': 71 ^ Xi= 2j CLijXj -\-<Xit ,1 MOV t=t', 1=1, 2, . . . , П, J где [ocij] — ортогональная матрица. Определитель матрицы Т преобразования (10) равен определителю матрицы Т=[ац] и, следовательно, равен 1 или —1. Пусть квадратичная форма (9) в результате преобразования (10) принимает вид J2 ац'Хг'х/+2 J; йМГ+а'ф)*.. (11) i, j-=l 1=1
«и «21 «nl «1 «12 • • «22 • • «n2 • «2 • . dm di | . «2n «2 . . «nn CLn .. an a _ , M= «и «2/ «n/ L«i' «12 . «227 • «п2Л - > ai .. • «In . «2/ • Ann ;. an' a/ si f Mn a' § 182. Исследование линий второго порядка с помощью инвариантов - gtS Рассмотрим матрицы квадратичных форм (9) и (И): Я= Как известно из § 130, Ai=FaT. Применяя теорему об определителе произведения матриц, получим №IHr||i|m-Hr|i|*|-M;|. Тем самым показано, что определитель (6) из коэффициентов полинома (2) является; метрическим инвариантом. Обозначим этот инвариант через /n+i. # § 182. Исследование линий второго порядка с помощью инвариантов Рассмотрим плоскость E*(i). Пусть в некоторой прямоуголь-. ной* системе координат Оху задано уравнение линии второго порядка «11*2+«22У2+2«12ХУ+2«1Х+2«2#+« = 0. (1) Как следует из § 179, путем подходящего выбора прямоугольной системы координат О'х'у' уравнение линии'(1) можно привести к одному из следующих видов; Ad(^)1+4K/)2+*=A (2) M*')2+2q/'=0, (3) %l^)2+d=0y (4) где A*, ta, bt с и d — вещественные числа, причем A,i, А,2, и с отличны от нуля. Мы укажем сейчас, как с помощью инвариантов найти коэффициенты уравнений (2), и (3) и как исследовать линию (4). Вычислим для левых частей уравнений (1) и (2) инварианты* введенные в предыдущем параграфе: А = «11+ «22 = ^1+^2, (5> '-It ad=«* да
516 Глава 18. Квадрики /з= 011 012 Я! #12 #22 ^2 01 а2 # =М**: (7) Из равенств (5) и (6) следует, что Xi и Яг являются корнями квадратного уравнения Х2-М+/2=0. (8) Из .равенств (6) и (7) получим *=-f-' (9) '2 Вычислим инварианты левой части уравнения (3): /i=A,i, /2=0, /3=-a,iC2. Следовательно, с=±У--£-. (Ю) Обратимся к уравнению (4). Имеем /з=0. (11) Покажем, что в этом случае левая часть уравнения (1) распадается на два линейных множителя (вещественных или нет). Рассмотрим квадратичную форму alix2+a22y2+2al2xy+2aixt+2a2yt+at2 (12) относительно переменных х, у, t. В силу равенства (11) ранг квадратичной формы (12) меньше трех, и, следовательно, она раскладывается на два линейных множителя (см. § 135): aiiX2+a22y2+2ai2xy+2aiXt-\-2a2yt+at2= = (ai*+Piy+YiO (a2x+py2+Y20, (13) где ai, pi, vi, <X2, P2, V2 — комплексные числа. Полагая в равенстве (13) t=ly мы.получим разложение на линейные множители левой части уравнения (1). Для отыскания этих линейных множителей можно применить следующий прием. Если апФО, то разложение должно иметь вид ац[х-(Х1у+\ц)] |>-(Я2у+Ц2)].
§ 182. Исследование линий второго порядка с помощью инвариантов 517 Но тогда величины kty+\ii и Л2У+Ц2 можно найти как корни квадратного относительно х уравнения (1). Если а^Ф^ уравнение (1) можно решить как квадратное относительно у. Наконец, если ац=а22=0, то разложение должно иметь вид 2ai2xy+2aiX+2a2y+a=2ai2(x+a) (у+Р) (14) и числа а, р можно найти сравнением соответствующих коэффициентов в обеих частях равенства (14). Примеры. С помощью инвариантов исследовать следующие линии. 1. 5х2+\2ху-22х-\2у-\9=0, 5 6 /i = 5, /2= , =-36, 6 0 /з = 5 6 -11 6 0-6 -11 -6 -19 = 1296. Решаем уравнение (8): А,2-5Л-36=0, Я1=9, Я2 = -4. По формуле (9) находим £ = —36. Итак, уравнение исследуемой линии можно записать в виде 9(*')2-4(*/')2-36 = 0 или (*')2 (У')2 1 — гипербола. 4 9 2.шх2-2х//+г/2-10х-6#+25 = 0, Zi = 2, /2=0, /3 = -64. Следовательно, линия может быть задана уравнением 2(х')*-У~32у = 0 или (л/)2 = 4/2*/' и является параболой. 3. 4х2-12л:*/+9*/2*-2х+3*/-2=0, (15) /з = 0. Запишем уравнение (15) в виде 4л:2—2 (6у+1) х+9у2+Зу-2=0 и решим его как квадратное уравнение относительно х. Получим 3*/+2 3*/-1 *1= , *2= •
518 Глава 19. Проективные пространства Следовательно, уравнение (15) можно представить в виде или (2*-3#-2) (2x-3y+'l) =0. Линия распадается на пару параллельных прямых 2*—3#—2=0 и 2х—Зу+1=0. Глава 19 ПРОЕКТИВНЫЕ ПРОСТРАНСТВА § 183. Определение В этой главе мы введем еще одно пространство — проективное, тесно связанное с векторным и аффинным пространствами. Рассмотрим (п-f-l)-мерное векторное пространство Рп+* над полем _Р. Множество Рп одномерных подпространств пространства pn+lv называется n-мерным проективным пространством, связанным с пространством Pn+4. Элементы пространства Рп называются точками. Множество Pk одномерных подпространств (£+1) -мерного векторного подпространства p&+ic:Pn+1 называется k-мерной плоскостью пространства Рп. Пусть Лп+1— (м+1)-мерное аффинное пространство, связанное с векторным пространством рп+4. Если зафиксировать в пространстве An+i некоторую точку О, то множество векторов {ОМ |Afei4n+1} будет совпадать с пространством Pn+1. Тогда точки пространства Рп будут изображаться в пространстве An+t прямыми, проходящими через точку О, а ft-мерные плоскости пространства Рп—(&+1)-мерными плоскостями пространства Лп+1, проходящими через точку О. Возьмем теперь в пространстве Рп гиперплоскость Р71-1, т. е. плоскость размерности я— 1, Пусть Ап — гиперплоскость пространства Лп+1, являющаяся изображением гиперплоскости Р71-1 (рис. 108). Построим в пространстве An+i гиперплоскость В, параллельную гиперплоскости Ап, и следующим образом отобразим на нее множество Рп \ Рп-1 всех точек проективного пространства Рпг не принадлежащих гиперплоскости Р»-1. Пусть точка М^ ePn \ Рп-1 изображается прямой А (проходящей через точку О). Так как прямая А не лежит в гиперплоскости Ап, она пересекает гиперплоскость В в некоторой точке, которую мц обозначим сим-
§ 183. Определение 519 волом р{М). Теперь можно определить отображение р: Pn\Pn-i-+B, поставив в соответствие точке М^Рп \ Р"-1 точку р(Л1)еВ. Рис. 108 Аффинное пространство В вместе с отображением р называется аффинной картой (В, р) проективного пространства Рп, а точка р(М)е=В (МеР« \ Pn-i) _ изображением точки М на этой карте. Точки гиперплоскости Рп~1 на карте (В, р) не изображаются, о4йи называются несобственными по отношению к этой карте. Остальные точки пространства Рп называются собственными. Пусть Ph — fe-мерная плоскость пространства Рп и Л&+1— изображающая ее (&+1)-мерная плоскость пространства Лп+4.. Если плоскость Ak+i целиком принадлежит гиперплоскости Апу она не пересекается с плоскостью В. В этом случае плоскость Pk не имеет изображения на карте (В, р\. Пусть теперь плоскость Л*+1 не принадлежит,гиперплоскости Лп, тогда она пересекает гиперплоскость В по ft-мерной плоскости Ck. Плоскость Ch является изображением плоскости Ph на карте (В, р). Обратно, пусть Ch=Mo+Ph — произвольная ^-мерная плос- костьпространства В. рассмотрим (&+1) -мерное подпространство РА+1 пространства Рп, натянутое на векторы подпространства Ph и вектор ОМ0. Если Лл+1 — плоскость пространства Лп+1, изображающая подпространство Рл+1, она пересекает гиперплоскость В по плоскости Ch и, следовательно, плоскость Ck является изображением плоскости Ph на карте (В, р).
520 Глава 19. Проективные пространства Таким образом, если из n-мерного проективного пространства выбросить какую-либо гиперплоскость, то оставшееся множество точек проективного пространства может быть биективно отображено на n-мерное аффинное пространство так, что плоскостям проективного пространства, не принадлежащим выброшенной гиперплоскости, будут соответствовать в аффинном пространстве плоскости той же размерности, и наоборот, § 184. Координаты Пусть Рп — /г-мерное проективное пространство, связанное с векторным пространством Pn+1 над полем Р. Обозначим символом jt(Jc), где х — произвольный ненулевой вектор из Pn+i, одномерное подпространство, натянутое на х. Очевидно, п{х) = =я(у) тогда и только тогда, когда у=Хх, где X — отличный от нуля элемент поля Р. Возьмем теперь в пространстве Pn+i какой- либо баз^с ёо, ёи - • • » ёп. (1) Однородными координатами точки М^Рп в базисе (1) называются координаты любого ненулевого вектора x^Pn+i, такого, что п(х)=М, т. е. однородные координаты точки М — это коэффициенты хо, *ь ■....., Хп (2) в разложении п х== ^^ х%е%* Каждые п+1 элементов (2) поля Р, не равные одновременно нулю, являются однородными координатами вполне определенной точки М^Рп относительно базиса (1). Однородные координаты точки М определены неоднозначно: для того чтобы скаляры (2) и t/o, уи ... , Уп были координатами одной и той же точки в одном и том же базисе, необходимо и достаточно, чтобы в поле Р существовал такой элемент Я, что Уг = Хх{, 1 = 0, 1, . . . , П. Пусть наряду с базисом (1) в пространстве Pn+l задан еще один базис ёо', ei', ... , ёп'. (3) Координаты Хо', Х\, ... , хп' произвольного вектора JcePn+1 в базисе (3) связаны с координатами (2) этого же вектора в базисе
§ 184. Координаты 521 (1) формулами: п \ Xi= J£ сщх/, *=0, 1, ... , /г, i«=o > - det [<хц]фО. J Следовательно, однородные координаты точки М=п(х) в ба-> зисах (1) и (3) связаны формулами: п KXi= J£ CLijXj', / = 0, 1, . . . , П, j=0 где А, — некоторый отличный от нуля элемент поля Р. Пусть (В, р).— аффинная карта пространства Рп (см. § 183). Рассмотрим в аффинном пространстве В некоторый репер (Мо, ёи ё2, ... , ёп). (4) Каждая точка пространства В будет иметь в репере (4) координаты 1и £г, • • • , In. (б) Приписывая точке M&Pn\Pn~i координаты точки р(Л1)еВ, мы получаем так называемую неоднородную систему координат в проективном пространстве Рп. Эта система координат в отличие от системы однородных координат определена не во всем пространстве РЛ, а лишь на множестве Рп \ РЛ_1, зато это множество биективно отображается на множество всевозможных наборов координат (5). Установим связь между однородными и неоднородными координатами. Так как (4) — репер аффинного пространства В, _то векторы ёи ёг, ... , ёп образуют базис векторного пространства Рп, с которым связано пространство В, а векторы ёо=ОМ0, -ёи ё2, ... , ёп — (6) базис пространства P*+i. Пусть х0, хи .., , хп — однородные координаты точки М^Рп \ Р71-1 в базисе (6). Условие MzfcP71-1 означает, что х0Ф0. Если (5) — неоднородные- координаты -точки М в репере (4), то п п р(М) =ё0+ % liei=b 2 Xjej, г=1 j=0 откуда •^=-^, 1г="4Ч '=1,2 п. Xq Xq
Б22 Глава 19. Проективные пространства § 185. Плоскости Рассмотрим проективное пространство Рп как множество прямых аффинного пространства Лп+1, проходящих через фиксированную точку ОеЛп+1. В соответствии с § 154 Л-мерная плоскость Ph пространства Рп изображается (&+1) -мерной плоскостью ЛЛ+1 пространства Лп+1, проходящей через-точку О. А именно: Ph есть множество прямых плоскости Л**1, проходящих через точку О. Очевидно, ^-мерная плоскость проективного пространства Рп является ^-мерным проективным пространством. (п—1) -мерная плоскость пространства Рп называется гиперплоскостью, 1-мерная шюскость называется прямой. Каждом/ предложению,- относящемуся к плоскостям пространства Лп+1, проходящим через точку О, отвечает некоторое предложение, относящееся к плоскостям пространства Рп. Рассмотрим некоторые из этих предложений. Пусть Q — произвольное непустое множество точек пространства Рп. Назовем проективной оболочкой множества Q плоскость P(Q) пространства Рп, удовлетворяющую условиям: 1) QsP-(Q); 2) любая плоскость, содержащая й, содержит P(Q). Теорема 1. Для любого непустого множества Q^Pn существует единственная проективная оболочка. ф Рассмотрим отображение я: (Лп+1 \ 0)-+Рпу сопоставляющее каждой точке М пространства Лп+1, отличной от точки Оу точку пространства Рп, изображаемую прямой ОМ. Множество л~4(£2) в силу теоремы 4 из § 154 имеет единственную аффинную оболочку Л(я~1(£2)), и искомая проективная оболочка множества Q, очевидно, задается формулой ' Р(й)=я(Л(л-»(й))). • (1) Точки Мо, Ми ... , Mk (2) пространства Рп будем называть проективно независимыми, если их проективная оболочка Л-мерна. Теорема 2. Точки (2) являются проективно независимыми тог- да и только тогда, когда в пространстве Лп+* существуют точки No, Nu ... ,Nk (3) такие, что Mi=n(Ni), i=0, 1, ... , k, (4)
§ 185. Плоскости 523 и точки О, No, Nu ... , Nk аффинно независимы, т. е. векторы ONo, ONu ..., ONh линейно независимы. ф Обозначим буквой Q множество точек (4). Тогда А (л-1(Й))-Л (О, Wo, Nu...f Nk). (5) В силу формул (2) и (5) плоскость А (О, Af0, Nif ... , Nk) &-мерна тогда и только тогда, когда Л-мерна плоскость P(Q). ф Из теоремы 2 и теоремы 5 § 154 вытекает следующая Теорема 3. Через любые k+1 проективно независимых точек пространства Рп проходит единственная k-мерная плоскость. Во всякой k-мерной плоскости есть k+l и нет больше, чем k-\-l, проективно независимых точек. Любую систему проективно независимых точек пространства Рп, лежащих в k-мерной плоскости, можно дополнить до системы, состоящей из k-\-l проективно независимых точек, лежащих в этой плоскости. Пусть в пространстве Лп+1 выбран репер (О, ёо,.ёи ... , ёп). (6) Тогда в соответствии с § 184 каждая точка- М пространства Рп снабжается однородными координатами #о, хи ..: , хп, которые Определяются как коэффициенты разложения п Х== ^^ XiCiy i=0 где х — любой вектор, такой, что п(х)=М. Другими словами, однородными координатами точки М^Рп называются координаты относительно репера (6) любой точки из множества лг1(М)9 т. е. любой отличной от О точки прямой ОМ в пространстве Лп+1. Пусть теперь Pk — произвольная плоскость пространства Рп и Ah+i — изображающая ее плоскость пространства An+i. Тогда Л*+1\0=дг-1(Р*). (7) Как известно из § 155, плоскость /4fe+1 есть множество точек- решений системы уравнений аю*о +au*i +.. .+ain^n =0, Otn-Л, O^O+Otn-ft, 1*1+ • • - + аП-Ь 71*71 = 0, (8)
524 Глава 19. Проективные пространства и, обратно, любая система вида (8) задает плоскость в пространстве Лп+1. Будем говорить, что плоскость Ph задается в однородных координатах системой (8), если координаты любой точки этой плоскости образуют решение системы (8) и, обратно, любое ненулевое решение системы (8) представляет координаты некоторой точки плоскости Pk. В силу сказанного выше имеет место Теорема 4. Любая плоскость пространства Рп задается в однородных координатах системой (8), и, обратно, любая система (8) задает плоскость пространства Рп. Пусть в пространстве Рп заданы две плоскости — Pk и Pi1. Пересечением плоскостей Pk и Pi1 назовем множество всех точек пространства Рп> которые принадлежат одновременно обеим этим плоскостям. Будем называть плоскости Pk и Pi1 пересекающимися, если их пересечение не пусто; в противном случае будем называть эти плоскости непересекающимися. Из теоремы 4 вытекает Теорема 5. Если плоскости Ph и Pi1 пересекаются, то их пересечение есть плоскость. Пусть Ph и Рх1 — две произвольные плоскости в пространстве Рп и s — размерность их проективной оболочки. Если плоскости- Ph и Pi1 пересекаются, то обозначим через m размерность их пересечения. Если же эти плоскости не пересекаются, то положим т=—К Назовем характеристикой пары плоскостей Рк и Pi1 упорядоченный набор чисел (&, /, /л, s). Будем считать при этом, что Теорема 6. Для любой характеристики (k, I, m, s) имеют место соотношения: — l^m^k^l^s^n, Osgft; (9) s=k+l—m. (10) Для любого набора целых чисел m, k, I, s, n, удовлетворяющих соотношениям (9), (10), существует в пространстве Рп пара плоскостей Ph, Ptl с характеристикой (k, I, m, s). ф Для любой пары плоскостей неравенства (9) очевидны. Пусть плоскости Ph и Pi1 пересекаются по плоскости Ргт и Ah+i9 Ail+*, Л2т+1 и A3s+i — плоскости пространства Лл+1, проходящие через точку О и изображающие соответственно плоскости Pk, /V, Яг™ и проективную оболочку плоскостей Ph и Pi1. В силу формулы (5) из § 156 s-j-l = (£+l) + (/+l) — (m+1), откуда и следует формула (10). Если плоскости Ph и Pi1 не пересекаются, то изо-
§ 185. Плоскости 525 бражающие их плоскости Ah+i и Л/+1 имеют лишь одну общую точку и в силу той же формулы (5) § 156 Н-1 = (М-1) + (Н-1) + 1. Так как в этом случае т= —1, то снова получаем формулу (10)* Пусть теперь задан произвольный набор целых чисел m, k, ly s, п, удовлетворяющих соотношениям (9), (10). Возьмем в пространстве Рп любые п+1 проективно независимых точек М0„ Ми ... , Мп. Тогда в качестве плоскостей Р% и Р1 можно взять проективные оболочки систем точек М0, Mt, ... , Мт, Mw+1, . . . , Mh\ M0, Aft, ... , Mm, Mh+u ... 9 Mk+il-m). ф Назовем репером пространства Рп упорядоченную систему точек Mo, Мь ... , Mn+i (11) таких, что любые п+1 из этих точек проективно независимы. • Теорема 7. Любую систему Мо, Мь ... , Mk (12) проективно независимых точек пространства Рп можно дополнить до репера этого пространства. ф В силу теоремы 3 § 185 систему (4) можно дополнить до Системы М0, Мь ... , Мпу (13) также состоящей из проективно независимых точек. Пусть во, ёи •.. , ёп — ненулевые векторы пространства Pn+f, лежащие в одномерных подпространствах, определяемых соответственно точками (13), en+i=eo+ei+.. .+ёп . (14) и Mn+i — точка, определяющая одномерное подпространство, натянутое на вектор en+i. Тогда точки М0, Mif ... , Mn+i образуют репер. В самом деле, предположим, например, что точки Mi, ... , Mn+i содержатся в гиперплоскости Рп~1. Тогда из равенства (14) следует, что в этой гиперплоскости содержится и точка М0. Однако, это противоречит тому, что точки (13) .проективно независимы. #
526 Глава 19. Проективные пространства Теорема 8. Пусть в пространстве Рп задан репер (11). Тогда найдется единственная система проективных координат, в кото-' рой точки (11) имеют следующие однородные координаты: М0(1, 0, .... О, 0), \ •ЛМО, 1, •-., О, О), Afn(0, 0, ... ,0, 1), Мп+1(1, 1, ... , 1, 1). (15) ф В соответствии с теоремой 2 § 185 в каждом из одномерных подпространств пространства Рп+*, определяющих точки (11), можно выбрать вектор так, что любые /г+1 из этих векторбв До, аи ... , an+i (16) будут линейно независимы. Поэтому существуют Ло, Яь ..., 'Кп^Р такие, что #п-н=^o#o+A<i0i+« • .+^пйЛ. Ни один из элементов Я0, %и • • • Лп не равен нулю. В самом дёле,^ если бы, например, Яо=0, то векторы Si, аг, . <. , йп+i были бы линейно зависимы вопреки их выбору. В результате мы получим, что векторы ei=Xiau i=0, 1, ... , п, (17) образуют базис пространства Pn+i и an+i=e0+ei+.. .+ёп. ' (18) Очевидно, что базис (17) определяет искомую проективную систему координат. Пусть в пространстве Pn+1 имеется еще один базис ёо', ft', ... , ёп' (19) такой, что в определяемой этим базисом проективной системе координат выполняются условия (15). Тогда одномерные под* пространства пространстЁа рп+*, определяемые векторами (19)» совпадают с одномерными подпространствами, определяемыми векторами (17), и, следовательно, ei'=ineu i=6, 1, ... , nt (20> причем- все \ц отличны от нуля. В силу последнего условия (15) вектор a'n+i=eo'+ei'+.. .+ёп'- -: (21),
§ 186. Проективная группа 527 лежит в одномерном подпространстве пространства Р*+1, определяемом точкой Мп+1. В этом же подпространстве лежит и вектор (18), поэтому Я_'п+1= |Xji+i5n+i. (22) "Из равенств (18), (20) — (22) получим a'n+i=eo'+ei'+.. .+ёп'= = 110^0+^1^1 + . . . + jLlwen = |In+l^n+l=^ = ^/1+1^0+^+1^1+. . . + \ln+len. Отсюда в силу линейной независимости векторов (17) имеем |Го=м,1=.. .=jin=iin+i, а следовательно, ё/=Цоёг\ *=0, 1, ... , /г. Отсюда следует, что однородные координаты произвольной точки М пространства Рп в проективной системе координат, определяемой базисом (17), пропорциональны однородным координатам этой точки в проективной системе координат, определяемой базисом (19). ф § 186. Проективная группа Рассмотрим проективное пространство Рп одномерных подпространств векторного пространства Pn+1 над полем Р. Пусть f — автоморфизм пространства Pn+1. Так как_при автоморфизме / одномерные подпространства пространства Pn+1 переходят в одномерные подпространства, то в пространстве Рп_индуцируется преобразование J. Автоморфизм f_1 пространства Pn+1, очевидно, инДуцирует преобразование f_1 пространства Рп, обратное* преобразованию /. Таким образом, преобразование }: рп-+Рп есть биекция. Это преобразование J называется проективным преобразованием пространства Рп, индуцированным автоморфизмом f пространства Pn+1. Пусть в0, ёи • • • , ёп— (1) базис пространства Р7**1. Как известно из § 107, координаты #0, JCi,..., хп вектора xePn+1 связаны с координатами Хо', xt,..., хп' образа этого вектора при автоморфизме / формулами: п х/= % aijXj, t=0> 1, .. - , л: j=0 det [а#]ф0.
528 Глава 19. Проективные пространства Рассмотрим в проективном пространстве Рп точку М=п(х), т. е, одномер1?ое векторное подпространство пространства Pn+i, натянутое на вектор х. Однородные координаты этой точки в базисе (1) равны координатам вектора х или любого вектора ах, где а — отличный от нуля элемент поля Р. Аналогично однородными координатами точки f(M) являются координаты вектора f(x). Теперь ясно, что однородные координаты х0, хи ... , хп точки М связаны с однородными координатами х0', х±, ... , хп' образа этой точки при проективном преобразовании J формулами: п \ tei'= 2'aijXj, i=0, 1,..., п, \ /0v j=0 > U/ det [а;,]¥=0, J где % — произвольный элемент поля Р. Обратно, любое преобразование проективного пространства, выражаемое равенствами (2), является проективным. Из формул (2), в частности, видно, что если два автоморфизма /i и /г пространства Pn+i связаны равенством /2=aft, где a — элемент основного поля, то эти автоморфизмы индуцируют одно и то же проективное преобразование: fi=h- Множество всех проективных преобразований пространства Рп образует группу, которая называется проективной. Проективными свойствами фигур в пространстве Рп называются такие свойства, которые сохраняются при всех преобразованиях проективной группы. Две фигуры называются проективно эквивалентными, если существует проективное преобразование, переводящее одну фигуру во вторую. Множество всех фигур пространства РЛ разбивается на непересекающиеся классы проективно эквивалентных фигур. Теорема 1. Все реперы пространства Рп образуют класс проективно эквивалентных фигур. Для любых двух реперов существует единственное проективное преобразование, переводящее первый репер во второй. ф Пусть Afo, Ми ... , Mn+i- (3) репер пространства Рп. Так как произвольный автоморфизм f пространства Pn+i переводит линейно независимые векторы в линейно независимые, то индуцируемое им проективное преобразо-
§ 186. Проективная группа 529 вание f переводит проективно независимые точки в проективно независимые. Отсюда следует, что при любом проективном преобразовании репер переходит в репер. Пусть наряду с репером (3) задан еще один репер Mo', MS, ... , M'n+i. (4) Как и в теореме 8 § 185, выберем в одномерных подпространствах пространства Pn+1, определяемых точками (3), ненулевые векторы ёо, ft, ... , ёп, йп+1 (5) такие, что an+i=ft)+ft+-. .+еп. (6) Аналогично в одномерных подпространствах, определяемых точками (4), выберем ненулевые векторы ёо', ft', ... у ёп', а'п+и (7) удовлетворяющие условию a'n+i=eo'+ei'+.. .+ёп'. (8) В силу теоремы 1 § 100 существует автоморфизм /пространства Pn+1, переводящий базис во, в\у ... , еп в базис ёо'; ft', ... , ёп'. (9) Из равенств (6) и (8) получаем / (an+i) =t (ёо) +f (ft) +.. <+f (ёп) = =ft)'+ft'+.. .+ёп'=а'п+1. Итак, автоморфизм f переводит векторы (5) в векторы (7), поэтому индуцируемое проективное преобразование f переводит репер (3) в репер (4). Предположим теперь, что имеется еще одно проективное преобразование g пространства РЛ, переводящее репер (3) в репер (4). Согласно определению, g индуцируется некоторым автоморфизмом /i пространства Рп+*9 т. е. g=fi. Так как автоморфизм ft переводит одномерные подпространства пространства РЛ+1, определяемые векторами (5), в одномерные подпространства, определяемые векторами (7), то найдутся такие \ю, |ii, ... , Hn+i^P, что h(an+i)=\in+ian+i, fi(ft)=fiift', i=0, 1, ... , п. (10)
530 Глава 19. Проективные пространства В силу (6) и (10) имеем h (a«+i) =h (ё0) +.'. r+ft(fin) = =\юёо'+...+\1пё.п. (11) С другой стороны, из (8) и (10) получаем f(an+i) =iin+ia'n+t=\in+ieo'+.. .+[in+ien/. (12) Так как векторы (9) линейно независимы, то из (11) и (12) следует |io=|ii=.. .=|in+i. Из (10) получаем . , /i(ei)=jio/(?i), i=0, 1, ... , п, а поэтому fi(x)=lt0f(x) (13) I для любого вектора хеРя+1. Равенство (13), равносильное равенству fi=\iofy означает, что fi=f. Ит&к доказано, что существ вует единственное проективное преобразование пространства Рп„ переводящее репер (3) в репер (4). ф Теорема 2. Для данного k (l^k^n+1) все системы, состоящие из k проективно независимых точек, образуют класс проективно эквивалентных фигур. + Выше уже было отмечено, что любое проективное преобразование переводит проективно независимые точки в проективно независимые. Пусть теперь заданы две системы проективно независимых точек: Мо, Ми ... , Affc-i,- . (14) M0',Mi',...9M'h-i. ' (15) В силу теоремы 7 § 185 систему (14) можночдополнить до репера (3), а систему (15) —до репера (4). Проективное преобразование, переводящее репер (3) в репер (4), переведет систему (14) в систему (15). ф Теорема 3. Для данного k (O^zk^in) все k-мерные плоскости образуют класс проективно эквивалентных фигур. . . ♦ Тот факт, что проективное преобразование любую ^-мерную плоскость переводит в ^-мерную плоскость, следует из результатов § 100. Пусть теперь Ph и Р\1 — две произвольные Л-мерные плоскости пространства Рп. Возьмем в плоскости Ph
§ 186. Проективная группа 531 какие-либо k+l проективно независимых точек Afo, Ми •'..■,-Affc: (16); Аналогично возьмем в плоскости Pih проективно независимые точки Afo', MS, ... , Mh'. (17) Проективное преобразование, переводящее точки. (16) в точки (17), переведет плоскость (16) в плоскость (17). ф Теорема 4. Все пары плоскостей пространства Рп, имеющие одну и ту же характеристику, образуют класс проективно эквивалентных фигур. ф Пусть задана пара плоскостей Pk и Pi1 с характеристикой (*. /, m, s>. " (18) Так как при любом проективном преобразовании всякая плоскость переходит в плоскость той же размерности, то пара плоскостей РЛ, Pi1- перейдет при этри преобразовании в пару плоскостей, имеющих ту же характеристику (18). . Пусть теперь в пространстве Рп заданы две пары плоскостей Pk, Pi1 и Ph, Pi1, имеющие одну и ту же характеристику (18). Соответствующие пары плоскостей Л*+1, Ail+i и Ah+i, Ail+i пространства An+i также имеют одну и ту же характеристику (&+1, J?—|— 1, т+1, 5+1). В силу теоремы 2 § 161 существует автоморфизм / пространства Лп+1, переводящий плоскости ЛЛ+1, ЛАг+1 в плоскости Ah+1, Ail+i. Как видно из доказательства теоремы 2 $ 161, автоморфизм / можно считать центроаффинным относительно точки О преобразованием. Тогда проективное преобразование f, индуцированное автоморфизмом /, переведет плоскости Pk, Pi1 В ПЛОСКОСТИ Pk, Pi1, ф В заключение установим связь^между проективными и аффинными преобразованиями. Рассмотрим аффинную карту (В, р) пространства Рп, считая, что направляющее пространство плоскости В натянуто на векторы Й, ... , ёп. В этом случае несобственные точки пространства Рп характеризуются равенством Хо—0, а для остальных точек неоднородные координаты gi, 62,. • •, Sn связаны с однородными с помощью формул (см. § 184): Б<=-г-, '=1.2,.:., п. (19),
532 Глава 19. Проективные пространства Запишем формулы проективного преобразования: Xxi = аю#о —|—ocuATi -(-.. .-f-G&in#n, (20). Рассмотрим теперь такое проективное преобразование fa, которое несобственные точки переводит в несобственные. Оно характеризуется соотношением лго=0 =>- *о'=0. Из первого равенства (20) получим aoi = ao2=.. . = aon=0, (21) т. е. первое равенство (20) принимает вид Xxq =olqoXo. (22) Из невырожденности матрицы [а1;] и равенств (21) вытекает; что аоо=7^0. Поэтому равенство (22) показывает, что преобразо>- вание /о собственные точки переводит в собственные. Разделив; теперь на А,х0'=аоо*о °бе части каждого из равенств (20), кроме первого, и используя формулы (19), получим 6i' =Pli£i + р12§2 +. . . + PlnSn + Pi, Ъ>2 =p2lSl +P22§2 +• • - + P2n|n + P2, in/ = Pni|l + Pn2§2+- где Pij= otoo Pi= ttiO aoo •+Pnn|n+Pn, i, /=i, 2,.: (23) Очевидно, det [ргЛ^О. Преобразование /0 индуцирует на карте аффинное преобразование g, задаваемое формулами (23). Итак, имеет место f Теорема 5. Множество всех проективных преобразований л- мерного проективного пространства, переводящих в себя совокупность точек, несобственных относительно некоторой аффинной карты, индуцирует на этой карте аффинную группу. -
§ 187. Сложное отношение четырех точек 533 § 187. Сложное отношение четырех точек Пусть в проективном пространстве Рп задана прямая Р1 и выбрана система проективных координат, определяемая базисом ёо, ёи ... , ёп пространства Pn+1. Как известно из § 155, прямая^Р1 может быть задана системой уравнений otoo-^o +o&oi*i +.. .+аоп-^п =0, \ ОСю^О -\-OLnXi -j-. . -+ain*n =0, I | U> CXn-2, 0^0+Otn-2, i*i+. • - + an-2, n#n = 0, j ранг которой равен л— 1. Пусть (q0t qu ... , qn)y (r0, /ч, ... , rn) — фундаментальная система решений системы (1), а Q, /? — соответствующие точки прямой Р1. Тогда для любой точки М(х0> *и • • • у Хп) прямой Р1 найдутся такие pii, |i2^P, что Xi=[iiqi+[i2ru i=0y 1, •;.. у п, (2) причем, если точка М отлична от Q и /?, то jii^O, ц,2=т^0. Пусть. S(50, si, ... , sn)y T(t0f tu .. • , fn) — две различные точки прямой: Р1, отличные от точек Q, /?. Тогда Si=a\qi+b1ru /=0, 1, ... , /г, (3> /г = Т1?г+Т2П, 1 = 0, 1, . . . , /I, (4> причем ai=7^0, о^фО, Ti=?^0, t2=7^0. Число (У2 . Т2 (Ti # Ti называется сложным или двойным отношением четырех точек Q„ /?, 5, Т и обозначается (QRST). Итак, (QW) = -^-:^L.' (5> CTi Ti Покажем, что сложное отношение (5) зависит только от выбора точек Q, R, S, Т и не зависит от координат этих точек, ф Во-первых, в выбранной системе координат координаты точек определены лишь с точностью до множителя, поэтому точки Q, /?, 5, Т могут быть заданы соответственно координатами
534 Глава 19. Проективные пространства где А-1, А,2, Кзг А* — hpoизвoльныe отличные от нуля элементы поля Р. Относительно этих координат равенства (3) и (4) примут вид OiAtf ~ . О2К3 ~ Si= -Т ?г+ —Г Г и К\ А2 1 TiA,4 ~ . ТгА>4 _ *г= —5 ?г+ —7 П At. ч А2 и в соответствии с этим сложное отношение точек Q, /?, S, 7 будет равно 0>2АзЛ-1 ^ T2^4Ai O2 %2 А2О1Я3 А2Т1А4 Oli Ti т. е. оно не зависит от выбора координат точек Q, /?, 5, Т в данной системе координат. Перейдем теперь к какой-либо новой системе- проективных координат. Как известно из § 184, старые координаты хо, Хи ... , хп произвольной точки М выражаются чер'ез новые координаты *</, х/, ... , хп' этой точки по формулам: п Xi=\i J] dux/, 1=0, 1, ... , я, (6) где det '[««] Ф0, a jx —не равный нулю элемент поля А В частности, для точек Q, /?, S, Г имеем п п j=0 ^ j=0 n n j=0 j=0 ♦ (7) Подставляя эти выражения в равенства (3), (4) и сокращая порученные равенства на \i, нолучим П' JS ^ij(s/—Oiq/—a2r/)=0f i=0, 1, ... , я, (8) •jt а«(//—tiflf/—Т2Г/) =0, i=0, 1, ... , п. (9) j=0 Равенства (8) показывают, что 5/-aiqf/-aar/=0,- /=0, 1, ... , /г, (10) так как в противном случае столбцы матрицы (a2j) были бы линейно зависимы вопреки, невырожденности этой матрицы.
§ 188. Квадрики в проективном пространстве 53& Перепишем равенства (10) в виде 5/=ai(7/+a2r/, /=0, 1, ... , п. (И) Аналогично из равенств (9) получаем //=Т1?/+т2г/, /=0, 1, ... , п. (12) Равенства (И) и (12) показывают, что сложное отношение точек Q, /?, S, Т, выраженное в новых координатах, имеет то же значение (5), что и в старых координатах. # Проведенным выше вычислениям можно дать и другое истолкование. А именно будем рассматривать (6) как формулы проективного преобразования пространства Рп, переводящего произвольную - точку Му заданную в некоторой проективной системе координатами Хо, xiy ... ,'хп, в точку М'у заданную в. той же системе координат координатами хо'у Xi'y ... , хп'. Тогда мы получаем следующий результат. Теорема.'Сложное отношение четырех точек^сохраняется при любом проективном преобразовании. § 188. Квадрики в проективном пространстве Рассмотрим вещественное (п-f-l)-мерное аффинное пространство, вложенное в комплексное (п+1)-мерное аффинное пространство—An+i(i) (см. §J69). Зафиксировав в пространстве An+i(i) вещественную точку и проводя через нее все прямые пространства An+i(i)y мы получим вещественное тг-мерное проективное пространство, вложенное в комплексное я-мерное проектиб- ное пространство — Рп (i). Выберем в пространстве Rn+l некоторый базис ё0у ёи ... , ёп (1) и рассмотрим уравнение п j^ aijXiXj, (Z) г, j=0 где aij — вещественные числа, не все равные нулю, и а^=а^. Квадрикой пространства Pn(i) будем называть множество всех точек этого пространства, однородные координаты которых в базисе (1) удовлетворяют уравнению (2). В силу леммы 3 §^ 170 уравнение заданной квадрики в данном репере определено однозначно с точностью до умножения левой части уравнения на произвольное отличное от нуля вещественное число.
536 Глава 19. Проективные пространства Перейдем теперь к новому базису ёо', ei', ... , ёп'. (3) •Формулы, выражающие однородные координаты #о, *ь ... , хп точки М в базисе (1) через однородные координаты х0', *Л ... , хп' -этой же точки в базисе*(3), имеют вид п \ AXi= ^j CCijXj , l = U, 1, . . . , П, I ... 3=0 f \**) det [aij] Ф0, ctij — вещественные числа. J Вставляя выражения х\ из формул (4) в уравнение (2), получим уравнение квадрики (2) в новых координатах J§ aij'xi%'=0. if 3=0 Если рассматривать формулы (4) как формулы проективного преобразования, переводящего точку М с координатами *о, .дсь ..., хп в репере (1) в точку М' с координатами xo't xt,..., хп' в том же репере, то мы получим следующий результат. Теорема 1. При проективном преобразовании пространства -Рп(1) любая его квадрика преобразуется в квадрику, т. е. понятие квадрики — проективное. Как показано в § 133, квадратичную форму, стоящую в левой *части уравнения (2), с помощью преобразования (4) можно привести к нормальному виду -*»-.. -*к+х*ш+.. .+**, 0<г^п. В результате получается Теорема 2. Для любой квадрики (2) можно подобрать базис *(3) так, чтобы уравнение квадрики в этом репере имело канонический вид - (О2--..- (**')»+ (*/*+0*+. • •+ (х/)*=0. (5) Так как уравнение квадрики можно умножить на —1 и преобразованием вида (4) можно изменить нумерацию координат, то €удем считать, что в уравнении (5) k^ —.
§ 188. Квадрики в проективном пространстве 537 Разобьем теперь множество всех квадрик пространства Pn(i) на классы. В один класс будем относить такие квадрики, которые в подходящих реперах задаются одним и тем же уравнением (5) (при одних и тех жей иг). В силу теоремы 2 и закона инерции для вещественных квадратичных форм каждая квадрика попадет в один вполне определенный класс. Зафиксируем репер (1) и будем считать, что формулы (4) задают проективное преобразование, переводящее точку М с координатами *о, *ь —, хп в точку М' с координатами Хо', Xiy ... , хп'. Рассмотрим квадрики, которые задаются в репере (1) при всех допустимых значениях k и г, назовем их простейшими квадриками. Каждая из них определяет один из названных выше классов: класс состоит из тех квадрик, которые с помощью проективных преобразований могут быть переведены в заданную простейшую квадрику. Очевидно, любую квадрику можно перевести с помощью проективного преобразования в любую другую квадрику того же класса. Квадрики, взятые из разных классов, с помощью проективных преобразований друг в друга не переводятся. Указанное распределение всех квадрик пространства Pn(i) на классы называется проективной классификаций квадрик. Возьмем какую-либо карту (5, р) пространства Pn(i) и исследуем вопрос об изображении квадрик пространства Pn(i) на этой: карте. Как показано в § 184, можно считать, что аффинные координаты gi, |г, ... , in какой-либо точки пространства В связаны с однородными координатами лсо, xif ... , хп прообраза этой точки при отображении р формулами £<=-£-, t=l,2, ...,я. (6) Перепишем уравнение квадрики (2) в виде п п ■JS aijXiXj+2 Д/ aioXiX0+aoQXo2=0. (7) i, j=l г=1 Разделив обе части этого уравнения на х<?, получим 2 auhli+2 JS aioSi+a00=0. (8) г, j=l г=1 Возможны три случая. 1. Среди коэффициентов ац есть отличные от нуля. Тогда? уравнение (8) выражает квадрику в пространстве B(i). 2. Все aij=0, но среди коэффициентов аг-о есть отличные от нуля. В этом случае уравнение (8) выражает гиперплоскость пространстваВ (t). ,
538 * Глава 19. Проективные пространства 3. Все aij и а^ равны нулю, никакая точка пространства B(i) уравнению (8) не удовлетворяет. Итак, при отображении на аффинную карту (В, р) квадрика пространства Pn{i) может изображаться квадрикой пространства -Sfi), гиперплоскостью этого пространства или не будет иметь никакого изображения. * . Обратно, любая квадрика или гиперплоскость пространства В (i) является изображением некоторой квадрики пространства Pn(i). В самом деле, переходя в уравнении (8) к однородным координатам по формулам (6), получим уравнение (7). § 189. Проективная классификация линий второго порядка -. Пространство Р2 (i)'будем называть проективной плоскостью, а квадрики в Я2 (0 будем называть линиями второго порядка. Относительно произвольного репера линия второго порядка задается уравнением.. 2 2£ aijXiXj=0. (1) г, j=0 Согласно результатам предыдущего параграфа, множество.всех линий второго порядка на проективной плоскости P2(i) разбивается на пять проективных классов. Линии этих классов задаются уравнениями -xl+xl+xl=0, (3), х\+х\=0, (4), x\-xl=0, (5) x\=Q (6) и называются соответственно: (2)—мнимая линия, (3) —овальная линия, (4) — пара мнимых прямых, (5) — пара вещественных прямых, (6) —сдвоенная прямая. Исследуем вопрос об изображении линий (2) — (6) на аффинной карте (£, р). Как показано в предыдущем параграфе, линия второго порядка на проективной плоскости может изображаться на аффинной плоскости BczB(i) линией второго порядка, прямой линией или вовсе не иметь изображения. Линия проективной плоскости не будет иметь изображения лишь в том случае, если она совпадает с той* прямой, которая выбрасывается из проективной плоскости при отображении на аффинную плоскость,
§ 189. Проективная классификация линий второго порядка 539 т. е. Только линия (6) может не иметь никакого изображений на аффинной карте. Далее, если какая-то из линий (2) —(6) изображается на аффинной карте прямой, то в состав этой линии должна входить прямая. Прямая входит только в состав линий (4)—(6). Но так как линия (6) может изображаться только сдвоенной прямой, то мы приходим к выводу: из линий (2) — (6) прямой на аффинной карте могут изображаться только линии (4) и (5). Выберем на аффинной плоскости В репер. (М0, ё\9 ёг) и запишем уравнения линий, являющихся представителями всех девяти*аффинных классов линий второго порядка: £*+£*=-1, (7) 6?+51=1. (8) \\-\\=\, (9) s?+'6|=o, (и) S?-il=o, (12) l\+l=0. 03) t2-l=0, (14) 6«=0. (15) Каждая из этих линий, а также любая прямая плоскости В может служить изображением какой-либо из линий (2) —(6). Рассмотрим мнимый эллипс (7). Переходя в уравнении (7) к однородным координатам ХоУ xif х2 по формулам Хо Хо получим уравнение (2). Это означает, что мнимая линия (2) может изобразиться на аффинной карте мнимым эллипсом (7). Никакая другая линия из числа (8) — (15) не может служить изображением мнимой линии (2). В самом деле, в левой части уравнения (2) стоит положительно определенная квадратичная форма,. При переходе к другой системе однородных координат или при умножении этого уравнения на какое-либо отличное от нуля .число мы должны получить уравнение, в левой части которого стоит положительно или отрицательно определенная квадратичная форма: Но никакое из уравнений (8) — (15) при переходе к однородным координатам не может перейти в уравне-
540 Глава 19. Проективные пространства ние (1) с положительно или отрицательно определенной левой частью. Таким образом, мнимая линия (2) может изобразиться на аффинной карте только мнимым эллипсом. Рассмотрим теперь овальную линию (3). Она может изображаться на аффинной карте эллипсом (8), так как, переходя в уравнении (8) к однородным координатам по формулам (16), мы получим уравнение (3). Перейдем теперь к однородным координатам (16) в уравнении гиперболы (9). Мы получим уравнение -*?+*22+^=0, (17) которое выражает овальную линию. Уравнение параболы (10) при переходе к однородным координатам (16) дает Л*—2X2*0 = 0. Переходя к новым однородным координатам г/о, Уи Уг по формулам *1=Уи *о= -т=г (f/o+f/2), х2= —г (Уо—Уг), У2 /2 мы получим уравнение овальной линии Переход к однородным координатам в уравнениях (11) —(15) приводит к уравнениям, в правой части которых стоит 0, а в левой части — квадратичная форма ранга не выше двух. А так как в левой части уравнения (3) стоит квадратичная форма ранга 3, то линии (11) — (15) не могут служить изображениями линии (3). Итак, овальная линия (3) может изображаться на аффинной карте только эллипсом, гиперболой или параболой. Рассмотрим пару мнимых прямых (4). Из уравнений (7) — (15) только уравнения (11) и (13) могут быть дриведены к виду (4) переходом к однородным координатам. Следовательно, пара мнимых прямых (4) проективной плоскости может изображаться яа аффинной карте либо парой мнимых пересекающихся прямых, либо парой мнимых параллельных прямых. Из уравнений (7) — (15) к уравнению (5) могут привести только уравнения (12) ?и (14). Учитывая то, что было сказано о линии (5) выше, мы приходим к выводу: пара прямых (5) проективной плоскости может изображаться на аффинной карте парой пересекающихся прямых, парой параллельных прямых или одной прямой. Наконец, сдвоенная прямая (6) проективной плоскости либо •изображается на аффинной карте сдвоенной прямой, либо не ммеет изображения.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Автоморфизм аффинного пространства 454 — векторного пространства 285 — группы 50 — кольца 57 Алгебраическая операция 31 ассоциативная 33 коммутативная 34 Алгебраическое дополнение 78 Асимптотическое направление 486 Асимптота гиперболы 196 Базис 260 — ортонормированный 406 Вектор 108 Векторы коллинеарные 109 -— компланарные 109 Вершина параболы 205 — эллипса 190 Вложение 17 "Геометрия группы 456 Гипербола 193 — равносторонняя 197 ^- сопряженная 197 Гиперболоид двуполостный 224 ^— однополостный 221 Гиперплоскость 437 — диаметральная 495 — ортогональная вектору 464 Гомомррфизм векторных- пространств 285 < нулевой 285 — групп 50 ■— колец 57 Группа 38 — абелева 40 — аффинная 454 — проективная 528 Движение 468 Декартова степень И Декартово произведение 12 Дефект гомоморфизма векторных пространств 293 Диагональ матрицы 61 Директриса гиперболы 200 — параболы 203 — эллипса 199 Закон инерции квадратичных (билинейных) форм 377 Идеал 56 Изоморфизм аффинных пространств 448 — векторных пространств 285 — групп 50 — евклидовых пространств 412' — колец 57 — унитарных пространств 412 Инверсия 27 Касательная плоскость эллипсоида 217 Квадрика 479, 535 — центральная 493 Классификация квадрик аффинная 501 — линий второго порядка проективная 538 Кольцо 40 Композиция отображений 18 Коническое сечение 220 Конус вращения 219 . — второго порядка 218 Координаты вектора 124, 126 — в пространстве аффинные 129 — на плоскости аффинные 125 — на прямой 124 — полярные 128 — сферические 132 — точки в аффинном пространстве 434 однородные 520 — цилиндрические 131 Критерий диагонализируемости матрицы 357 — подобия матриц 337 — совместности системы линейных уравнений 313 Линейное преобразование переменных 366 невырожденное 367 Линия гиперболического типа 490 — параболического типа 490 — эллиптического типа 490
542 Предметный указатель Матрица 60 — билинейной формы 368 — диагональная 62 — единичная 62 — жорданова 358 — квадратная 60 — квазидиагональная 62 ~г- линейного преобразования переменных 366 — обобщенная жорданова 363 ■— ортогональная 408 — полиномиальная 320 каноническая 320 — скалярная 62 — сопровождающая полином 342 — ступенчатая 97 — трансформирующая 339 — треугольная 62 — унитарная 408 -—эндоморфизма 297 — эрмитова 388 — эрмитово-транспонированная 387 Метрический инвариант полинома 512 Метрически эквивалентные фигуры 47а Метрическое свойство фигуры 470 Минор 77 — дополнительный 77 Направленный отрезок 107 Направляющее пространство плоскости 437 Начальная точка плоскости 437 Неравенство Коши—Буняковского 400 — треугольника 402 Нормальный делитель 48 Образ элемента 14 Общее решение системы линейных уравнений 317 Однородная часть аффинного отображения 446 Определитель Вандермонда 85 — Грама 409 — матрицы 72 — эндоморфизма 3Q8 Отношение (бинарное) 12 — рефлексивное 12 — симметричное 13 — транзитивное 12 — эквивалентности 13 Ортогональное дополнение подпространства 410 Ортогональные плоскости 463 Оси гиперболы 197 Отображение 14 — аффинное 446 — биективное 16 — инъективное 16 — каноническое 22 — обратное 21 — сюръективное 16 Парабола 203 Параболоид гиперболический 228 — эллиптический 226 Параллельный сдвиг 450 Пересечение подпространств 276 Перестановка 25 Плоскость т-мерная 437 Подгруппа 44 Подобные матрицы 303 Подпространство 273 —* инвариантное 295 Подстановка 17 — нечетная 31- — четная 31 Поле 43 Полином, аннулирующий матрицу 344 эндоморфизм 347 — матричный 333 — минимальный матрицы 345 эндоморфизма 347 t — от матрицы 69 — от эндоморфизма 300 Полный прообраз 15 - Полуоси эллипса 190 — эллипсоида 217 Преобразование 17 — аффинное 450 — векторного пространства линейное 285 .невырожденное 285 — изометрическое 412 — ортогональное 418 — самосопряженное 424 — сопряженное 416 — унитарное 418 — центроаффинное 452 Продолжение отображения 24 Проективная оболочка 522 Произведение векторов векторное 145 двойное 149 скалярное 142 смешанное 150 — линейных преобразований переменных 367 — матриц 64 — отображений 18 Пространство аффинное 431 — векторное 244 евклидово 398 унитарное 398 — проективное 518 — точечное евклидово 461 - унитарное 461
Предметный указатель 54* Процесс ортогонализации 405 Йрямолинейные образующие фигуры * второго порядка 235 Яучок плоскостей 173 — прямых 162 Разбиение 13 Разложение каноническое 24 — определителя по элементам столбца (строки) 81 Размерность пространства 261 Ранг билинейной (квадратичной) формы 368 — гомоморфизма векторных пространств 293 — матрицы 254 Репер 125, 434 — главных направлений 506 Связка плоскостей 173 Символ Кронекера 83 Система наибольших общих делителей миноров полиномиальной матрицы 324 — уравнений, крамеровская 90 — элементарных делителей полиномиальной матрицы 329 След матрицы 306 — эндоморфизма 308 Сложение векторов 109 — матриц 63 Сложное отношение четырех точек 533 Смежные классы 45 Собственный вектор эндоморфизма 308 Собственное значение эндоморфизма 308 Сумма подпространств 275 прямая 280 — эндоморфизмов векторных пространств 294 Теорема Лапласа 80 г— о гомоморфизмах групп 55 векторных пространств 292 — .— колец 59 — о линейной зависимости основная. 250 — о ранге матрицы 254 Транспозиция 17 Транспониорвание матрицы 70 Уравнение гиперболы каноническое 195 полярное 208 — квадрики 479 — плоскости в отрезках 172 нормальное 176 — — общее 171 — прямой на плоскости каноническое 159 — общ'ее 156 — фигуры 139 — эллипса каноническое 189 полярное 208 Уравнения прямой в пространстве канонические 180 параметрические 179 -. на плоскости параметрические 159 — эллипса параметрические 192 Фактор-группа 50 Фактор-кольцо 57 Фактор-множество 14 Фигура второго порядка 213 плоская 208 — цилиндрическая 230 Фокальный параметр гиперболы 198 параболы 205 эллипса 191 Фокус гиперболы 193 — параболы 203 — эллипса 187 Форма билинейная 368 диагональная 372 вещественная нормальная 377 комплексная нормальная 375 конгруэнтная 371 отрицательно определенная 380 положительно определенная 380 эрмитова 388 — квадратичная 371 диагональная 372 — — вещественная нормальная 377 конгруэнтная 371 * комплексная нормальная 375 отрицательно определенная 380 положительно определенная 380 —г — разложимая 384 эрмитова 388 — матрицы нормальная вторая 355 жорданова'359 обобщенная 364 первая 343 — полиномиальной матрицы каноническая 323 Фундаментальная система решений системы линейных однородных уравнений 319 Функция билинейная 392 симметрическая 395 — ] эрмитова 395 эрмитова 393
544 Предметный указатель Характеристическая матрица 306 Характеристический полином матрицы 306 эндоморфизма 308 . Центр гиперболы 196 Цилиндр вращения 231 — гиперболический 233 — параболический 232 — эллиптический 231. Эквивалентность матриц 94 — фигур проективная 528 Эксцентриситет гиперболы 197 — эллипса 190 Элементарные преобразования матрицы 94 Элемент нейтральный 32 — симметричный 34 Эллипс 187 Эллипсоид 216 — вращения 218 — трехосный 217 Эндоморфизм группы 50 . — векторного пространства 285 — кольца 57 Ядро гомоморфизма векторных пространств 291 групп 53 Тышкевич Регина Иосифовна Феденко Анатолий Семенович Под редакцией Супруненко Дмитрия Алексеевича ЛИНЕЙНАЯ АЛГЕБРА И АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ Редактор Т. Майборода Оформление переплета В. Бессонова Худож. редактор В. Валентович Техн. редактор М. Кислякова Корректор М. Москаленко Сдано в набор 2/IV 1976 г. Подписано к печати 24/XI 1976 г. Бумага 60X90Vu гип. № 3. Печ. л. 34. Уч.-изд. л. 33,7. Зак. 181. Тираж 10 000 экз. Цена 1 руб. 42 коп. Издательство сВышэйшая школа» Государственного комитета Совета Министров БССР по делам издательств, полиграфии и книжной торговли. Редакция литературы по математике, физике и энергетике. 220600. Минск, ул» Кирова, 24. Ордена Трудового Красного Знамени типография издательства ЦК КП Белоруссии, Минск, Ленинский пр., 79.