Титульный лист
ОГЛАВЛЕНИЕ
Предисловие
Часть 1. Линейные пространства и линейные отображения
§ 2. Базис и размерность
§ 3. Линейные отображения
§ 4. Матрицы
§ 5. Подпространства и прямые суммы
§ 6. Факторпространства
§ 7. Двойственность
§ 8. Структура линейного отображения
§ 9. Жорданова нормальная форма
§ 10. Нормированные линейные пространства
§ 11. Функции линейных операторов
§ 12. Комплексификация и овеществление
§ 13. Язык категорий
§ 14. Категорные свойства линейных пространств
Часть 2. Геометрия пространств со скалярным произведением
§ 2. Скалярные произведения
§ 3. Теоремы классификации
§ 4. Алгоритм ортогонализации и ортогональные многочлены
§ 5. Евклидовы пространства
§ 6. Унитарные пространства
§ 7. Ортогональные и унитарные операторы
§ 8. Самосопряженные операторы
§ 9. Самосопряженные операторы в квантовой механике
§ 10. Геометрия квадратичных форм и собственные значения самосопряженных операторов
§ 11. Трехмерное евклидово пространство
§ 12. Пространство Минковского
§ 13. Симплектические пространства
§ 14. Теорема Витта и группа Витта
§ 15. Алгебры Клиффорда
Часть 3. Аффинная и проективная геометрия
§ 2. Аффинные группы
§ 3. Аффинные подпространства
§ 4. Выпуклые многогранники и линейное программирование
§ 5. Аффинные квадратичные функции и квадрики
§ 6. Проективные пространства
§ 7. Проективная двойственность и проективные квадрики
§ 8. Проективные группы и проекции
§ 9. Конфигурации Дезарга и Паппа и классическая проективная геометрия
§ 10. Кэлерова метрика
§ 11. Алгебраические многообразия и многочлены Гильберта
Часть 4. Полилинейная алгебра
§ 2. Канонические изоморфизмы и линейные отображения тензорных произведений
§ 3. Тензорная алгебра линейного пространства
§ 4. Классические обозначения
§ 5. Симметричные тензоры
§ 6. Кососимметричные тензоры и внешняя алгебра линейного пространства
§ 7. Внешние формы
§ 8. Тензорные поля
§ 9. Тензорные произведения в квантовой механике
Предметный указатель
Обложка
Text
                    А. И. КОСТРИКИН, Ю. И. МАНИН
ЛИНЕЙНАЯ АЛГЕБРА
И ГЕОМЕТРИЯ
ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ
Допущено Министерством высшего
и среднего специального образования СССР
в качестве учебного пособия
для студентов механико-математических специальностей
высших учебных заведений
Ш
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1986


ББК 22.143 К72 УДК 512.64 (053.8) Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия: Учеб. пособ. для вузов. — 2-е изд., перераб. — М.: Наука. Гл. ред. физ.-мат. лит., 1986. — 304 с* Книга посвящена изложению фундаментальных понятий и аппарата линейной алгебры и родственных ей разделов геометрии. От имеющихся курсов линейной алгебры книга отличается большим вниманием к приложениям и связям с другими областями математики: включено обсуждение основных принципов квантовой механики, описана геометрия пространства Минковского, дано введение в линейное программирование. Книга содержит современный математический материал, не излагавшийся в традиционных руководствах: язык категорий и категорные свойства линейных пространств, кэлерова метрика, введение в теорию многочленов Гильберта. Для студентов механико-математических специальностей высших учебных заведений. Рецензенты: кафедра высшей алгебры и теории чисел Ленинградского государственного университета (заведующий кафедрой — профессор 3. И. Боревин); академик АН БССР профессор В. П. Платонов 1702030000-144 053(02) -86 59-85 (С) Издательство Московского университета, 1980: © Издательство «Наука». Главная редакция физико-математической литературы, с изменениями, 1986
ОГЛАВЛЕНИЕ Предисловие 5 Часть 1. Линейные пространства и линейные отображения 7 § 1. Линейные пространства 7 § 2. Базис и размерность 14 § 3. Линейные отображения 21 § 4. Матрицы 27 § 5. Подпространства и прямые суммы 38 § 6. Факторпространства 47 § 7. Двойственность .51 § 8. Структура линейного отображения 54 § 9. Жорданова нормальная форма 61 § 10. Нормированные линейные пространства 68 §11. Функции линейных операторов 74 § 12. Комплексификация и овеществление 77 § 13. Язык категорий 83 § 14. Категорные свойства линейных пространств 88 Часть 2. Геометрия пространств со скалярным произведением 93 § 1. О геометрии '93 § 2. Скалярные произведения 95 § 3. Теоремы классификации 102 § 4. Алгоритм ортогонализации и ортогональные многочлены . . . .110 § 5. Евклидовы пространства 117 § 6. Унитарные пространства 126 § 7. Ортогональные и унитарные операторы 133 § 8. Самосопряженные операторы 137 § 9. Самосопряженные операторы в квантовой механике 147 § 10. Геометрия квадратичных форм и собственные значения самосопряженных операторов 155 §11. Трехмерное евклидово пространство 163 § 12. Пространство Минковского 171 § 13. Симплектические пространства 181 § 14. Теорема Витта и группа Витта 185 § 15. Алгебры Клиффорда J89 Часть 3. Аффинная и проективная геометрия 193 § \. Аффинные пространства, аффинные отображения и аффинные координаты 193 § 2. Аффинные группы , .,·,».♦♦.,», 201 θ
§ 3. Аффинные подпространства 205 § 4. Выпуклые многогранники и линейное программирование . . . .212 § 5. Аффинные квадратичные функции и квадрики 215 § 6. Проективные пространства 220 § 7. Проективная двойственность и проективные квадрики 226 § 8. Проективные группы и проекции 230 § 9. Конфигурации Дезарга и Паппа и классическая проективная геометрия 239 § 10. Кэлерова метрика 243 § 11. Алгебраические многообразия и многочлены Гильберта 245 Часть 4. Полилинейная алгебра 254 § 1. Тензорное произведение линейных пространств 254 § 2. Канонические изоморфизмы и линейные отображения тензорных произведений 259 § 3. Тензорная алгебра линейного пространства 264 § 4. Классические обозначения 266 § 5. Симметричные тензоры 271 § 6. Кососимметричные тензоры и внешняя алгебра линейного пространства 275 § 7. Внешние формы 285 § 8. Тензорные поля 287 § 9. Тензорные произведения в квантовой механике 291 Предметный указатель 297
ПРЕДИСЛОВИЕ На все можно смотреть с разных точек зрения, предмет этой книги — не исключение. Для студента мехмата МГУ линейная алгебра — это то, что читают первокурсникам во втором семестре. Для профессионала-алгебраиста, воспитанного в духе Бурбаки, линейная алгебра — это теория алгебраических структург частного вида — линейных пространств и линейных отображений, или, в более новомодном стиле, теория линейных категорий. С более широкой точки зрения, содержание линейной алгебры состоит в проработке математического языка для выражения одной из самых общих естественнонаучных идей — идеи линейности. Возможно, ее важнейшим специальным случаем является принцип линейности малых приращений: почти всякий естественный процесс почти всюду в малом линеен. Этот принцип лежит в основе всего математического анализа и его приложений. Векторная алгебра трехмерного физического пространства, исторически ставшая краеугольны^ камнем в здании линейной алгебры, восходит к тому же источнику: после Эйнштейна мы понимаем, что ή физическое пространство приближенно линейно лишь в малой окрестности наблюдателя. К счастью, эта малая окрестность довольно велика. Физика двадцатого века резко и неожиданно расширила сферу применения идеи линейности, добавив к принципу линейности малых приращений принцип суперпозиции векторов состояний. Грубо говоря, пространство состояний любой квантовой системы является линейным пространством над полем комплексных чисел. В результате почти все конструкции комплексной линейной алгебры превратились в аппарат, используемый для формулировки фундаментальных законов природы: от теории линейной двойственности, объясняющей квантовый принцип дополнительности Бора, до теории представлений групп, объясняющей таблицу Менделеева, «зоологию» элементарных частиц и даже структуру пространства-времени. Выбор материала для этого курса определялся желанием авторов не только изложить основы аппарата, почти завершенного к началу этого века, но и дать представление о его приложениях, обычно относимых к другим дисциплинам. Традиции преподавания способствуют рассечению живого тела математики на изолированные органы, жизнеспособность которых приходится поддерживать искусственно. Особенно это относится к «критическим периодам» в истории нашей науки, которые характерны вниманием к логической стройности и детальной проработке оснований. Последние полвека были временем теоретико-множественной перестройки языка и фундаментальных понятий; единство математики стало рассматриваться преимущественно как единство ее логических принципов. Не отказываясь от замечательных достижений этого периода, мы хотели отразить в книге и намечающиеся тенденции к синтезу математики как орудия познания внешнего мира. (К сожалению, нам пришлось оставить в стороне теорию вычислительных аспектов линейной алгебры, выросшую в самостоятельную науку.) По этим соображениям в предлагаемую книгу, как и во «Введение в алгебру» одного из авторов, включен не только материал для лекционного курса, но и разделы для домашнего чтения, которые могут быть использованы также на семинарских занятиях. Жесткого разделения здесь не может быть. Все же в соответствии со стандартной программой лекционный курс (один семестр, по две лекции в неделю) должен включать основной материал § 1—9 части 1; § 2—8 А
части 2; § 1, 3, 5, 6 части 3 и § 1, 3—6 части 4. При этом под «основным материалом» мы понимаем не столько доказательства трудных теорем (которых в линейной алгебре немного), сколько систему понятий, которыми следует овладеть. Поэтому многие теоремы из этих разделов могут быть рассказаны в более простом варианте или вовсе опущены; по недостатку времени такие сокращения неизбежны. Как избежать при этом превращения лекций в унылый список определений, составляет серьезную заботу преподавателя. Мы надеемся, что остальные разделы курса помогут ему в этом. При переиздании внесены исправления опечаток и мелких стилистических погрешностей, сообщенных нам рядом читателей. В двух местах пришлось корректировать доказательства. Многочисленные ценные замечания были сделаны сотрудниками кафедры алгебры и теории чисел Ленинградского государственного университета. Конструктивная критика рецензентов, а также высококвалифицированная, тщательная работа редактора издания В. Л. Попова во многом способствовали улучшению качества книги. Мы выражаем им всем глубокую благодарность. Все оставшиеся недочеты в книге авторы, разумеется, относят на свой счет. СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ 1. Кострикин А. И. Введение в алгебру. — М.: Наука, 1977. 2. Ленг С. Алгебра. — М.: Мир, 1968. 3. Мальцев А. И. Основы линейной алгебры. — М.: Наука, 1975. 4. Гельфанд Я. М. Лекции по линейной алгебре. — М.: Наука, 1966. 5. Халмош П. Р. Конечномерные векторные пространства. — М.: Физматгиз, 1963. 6. Артин Э. Геометрическая алгебра. — М.: Мир, 1970. 7. Глазман И. Λί., Любич Ю. И. Конечномерный линейный анализ. — М.: Наука, 1969. 8. Воеводин В. В. Вычислительные основы линейной алгебры. — М.: Наука, 1977.
Часть 1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА И ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ § 1. Линейные пространства 1. Векторы с началом в выбранной точке пространства можно умножать на числа и складывать по правилу параллелограмма. Это — классическая модель законов сложения перемещений, скоростей, сил в механике. В общем определении векторного, или линейного, пространства вещественные чйслй заменяются произвольным полем, а простейшие свойства сложения и умножения векторов постулируются в качестве аксиом. Никаких следов «трехмерности» физического пространства в определении не остается. Понятие размерности вводится и изучается отдельно. Из курса аналитической геометрии на плоскости и в трехмерном пространстве известно много примеров геометрической интерпретации алгебраических соотношений между двумя или тремя переменными. Но, по выражению Н. Бурбаки, «...ограничение геометрическим языком, отвечающим пространству только трех измерений, было бы ярмом для современного математика, столь же неудобным, как то, которое мешало грекам распространить понятие числа на отношения несоизмеримых величин...». 2. Определение. Линейным (или векторным) пространстврм L над полем Ж называется множество, снабженное бинарной опера цией LY^L-^L, обычно обозначаемой как сложение: (1\, /2) ь—> ь-> 1\ + 'г, и внешней бинарной операцией Ж X L -> L, обычно обозначаемой как умножение: (а, /)ι—»а/, которые удовлетворяют следующим аксиомам: а) Сложение элементов L, или векторов, превращает L в коммутативную (абелеву) группу. Ее нулевой элемент обычно обозна чается 0; элемент, обратный к I, обычно обозначается —/. б) Умножение векторов на элементы поля Ж, или скаляры, унитарно, т. е. 11 = 1 для всех /, и ассоциативно, т. е. a(bl) = (ab)I для всех а,Ь^Ж; l^L. в) Сложение и умножение связаны законами дистрибутивности, т. е. я (1\ + к) = οΐχ + al2, {ах +α2)1 = αϊ1 + c^l для всех а, а{, а2 е Ж; I, l\, k e L. 3. Вот некоторые простейшие следствия определения. а) 0/ = аО = 0 для всех а^Ж, 1&L. Действительно, 0/ + 0/ = = (0 + 0)/ = 0/, откуда 0/ = 0 по свойству сокращения в абелевой группе. Аналогично, аО + аО = а (0 + 0)= а0, т. е. аО = 0. 7
б) (—1)1 = —I. Действительно, / + (- 1)/=1/ + (—1)/ = (1 + + (— 1))/ = 0/ = 0, так что вектор (— 1)/ обратен к /. в) Если а/ = 0, то либо а=0, либо / = 0. В самом деле, если а ф 0, то 0 = a-1 (а/) = (a~la) I = 1/ = I. г) Для любых аь ..., ап&Ж\ /ι, ..., ln^L однозначно опре- п делено выражение ах1х + . · · Λ-aJn = Σ ath' благодаря ассоциа- тивности сложения в абелевой группе можно не расставлять скобки, указывающие порядок вычисления попарных сумм. Аналогично, однозначно определено выражение аха2 ... anL η Выражение вида Σ α{1ι называется линейной комбинацией векторов /ι, ..., ln; скаляры а,- — коэффициенты этой линейной комбинации. Следующие примеры линейных пространств будут постоянно встречаться в дальнейшем. 4. Нульмерное пространство. Это —абелева группа L={0}, состоящая из одного нуля. Единственно возможный закон умножения на скаляры: аО «= 0 для всех а^Ж (убедитесь в справедливости аксиом!). Предостережение: нульмерные пространства над разными полями— это разные пространства: задание поля Ж входит в определение линейного пространства. 5. Основное поле Ж как одномерное координатное пространство. Здесь L == Ж, сложение — это сложение в Ж, умножение на скаляры — это умножение в Ж. Справедливость аксиом линейного пространства следует из аксиом поля. Более общо, если имеется поле К и его подполе Ж, то К можно рассматривать как линейное пространство над Ж. Например, поле комплексных чисел С является линейным пространством над полем вещественных чисел R, которое в свою очередь является линейным пространством над полем рациональных чисел Q. 6. /t-мерное координатное пространство. Положим L = Жп = = JS?X ... XJS? (декартово произведение η ^ 1 множителей). Элементы L можно записывать в виде строк (аь ..., ап)у а^^Ж, или столбцов высоты п. Определим сложение и умножение на скаляр формулами: (аь ..<., ап) + (Ьи .··> Ъп) = {ах + Ьь ..., ап + Ьп), а(аь ..., ап)*=*(ааь ..., аа^. При η = 1 получается предыдущий пример. Одномерные пространства над Ж называют прямыми, или Jif-прямыми; двумерные — Jif-плоскостями. 7. Пространства функций. Пусть 5 — произвольное множество^ F(S)— множество функций на 5 со значениями в Ж, или отображений S в Ж. Как обычно, если /: S-^Ж — такая функция, то через /(s) обозначается значение / на элементе seS. *
Сложение и умножение функций на скаляр определяется поточечно: (Ϊ + g)(s) = f(s) + g(s) для всех sg5, (af)(s) = a(f(s)) для всех а^Ж, sgS. Если 5={1, ..., η}, то F(S) можно отождествить с Жп: функции / ставится в соответствие «вектор» всех ее значений (/(1), ..., f(n)). Правила сложения и умножения согласованы относительно такого отождествления. Каждому элементу sgS можно поставить в соответствие важную «дельта-функцию б$, сосредоточенную на {s}», которая определяется так: 6s(s)=l, 6s(0 = 0> если t=£s. Если 5={1, ..., л}, вместо 6i(k) обычно пишут б/* — это символ Кронекера. Если множество 5 конечно, то всякую функцию из F(S) можно однозначно представить в виде линейной комбинации дельта-функций:/= Σ f(s)6s. В самом деле, это равенство следует из совпа- s sS дения значений левой и правой части в каждой точке seS. Наоборот, если /= Σ as6s, то, беря значение в точке s, получаем ssS f(s)= as.. Если множество 5 бесконечно, то этот результат неверен, точнее говоря, не может быть сформулирован в рамках наших определений: суммы бесконечного числа векторов в общем линейном пространстве не определены! Некоторые бесконечные суммы можно определить в линейных пространствах, снабженных понятием предельного перехода, или топологией (см. § 10). Такие пространства составляют основной предмет изучения в функциональном анализе. В случае 5={1, ..., п} функция б/ представлена вектором £, = ((), ..., 0, 1,0, ..., 0) (единица на i-м месте, нули на остальных), а равенство /= Σ f(s)bs превращается в равенство η (αϊ, ..., αη)= Σ β Αι *»1 8. Линейные условия и линейные подпространства. В анализе прежде всего рассматриваются вещественнозначные функции, определенные на всем R или интервалах (a, 6)c:R. Дли большинства приложений, однако, пространство всех таких функций слишком велико: полезно рассматривать непрерывные или дифференцируемые функции. После введения соответствующих определений обычно доказывается, что сумма непрерывных функций непрерывна и произведение непрерывной функции на скаляр непрерывно; то же для дифференцируемости. Это означает, что только непрерывные или только дифференцируемые функции сами по себе образуют линейное пространство. Более общо, пусть L — линейное пространство над полем Ж, а М с L — его подмножество, которое является подгруппой и 9
которое переходит в себя при умножении на скаляры. Тогда Μ вместе с операциями, индуцированными операциями в L (другими словами, ограничениями на Μ операций, определенных в L), называется линейным подпространством в L, а условия, определяющие принадлежность к Μ общего вектора из L, называются линейными условиями. Вот пример линейных условий в координатном пространстве Жп: фиксируем скаляры аи ..., ап^Ж и определим MCiL: η (xl9 ..., *rt)eAf<=*£a,x,==0. (1) Объединение любого числа линейных условий также является линейным условием. Иными словами, пересечение любого числа линейных подпространств также является линейным подпространством (проверьте это!). Позже мы докажем, что в Жп любое подпространство описывдется конечным числом условий вида (1). Важный пример линейного условия дает следующая конструкция. 9. Двойственное линейное пространство. Пусть L — линейное пространство над Ж. Рассмотрим сначала линейное пространство F(L) всех функций на L со значениями в Ж. Назовем теперь функцию f^F(L) линейной (иногда говорят «линейный функционал»), если она удовлетворяет условиям f(/i + « = /(/i) + /(«. f(al) = af(l) для всех /,/i,/2eL, а&Ж. Индукцией по числу слагаемых отсюда получаем, что Мы утверждаем, что линейные функции образуют линейное подпространство в F(L)y или «условие линейности является линейным условием». В самом деле, если /, f{ и /2 линейны, то (ϊι + W (h + k) = h (h + « + h (U + « = = f I (h) + ϊ 1 (k) + U (Ι) + h (k) = (ϊ 1 + /2) (/ΐ) + (ΪΙ + Ϊ2) («· (Здесь последовательно используются: правило сложения функций, линейность f\ и /2, коммутативность и ассоциативность сложения в поле и опять правило сложения функций.) Аналогично, (af) (/, + k) = a [f (/, + /2)] = a [f (lx) + f (/2)] = = a[f (/,)] + a[f (ί2)] - (af)(/,) + (af) (l2). Таким образом, /ι + /2 и af также линейны. Пространство линейных функций на линейном пространстве L называется двойственным, или сопряженным к L пространством, и обозначается L*. В дальнейшем мы встретимся со многими другими конструкциями линейных пространств. JQ
10. Замечания относительно обозначений. Обозначать нуль и сложение в Ж и L одинаковыми значками не вполне последовательно, но очень удобно. Все формулы обычной школьной алгебры, которые осмысленны в этой ситуации, оказываются верными {см. образцы в п. 3). Вот два' примера, когда предпочтительнее другие обозначения. а) Положим L={xeR|x>0}. Рассмотрим L как абелеву группу по умножению и введем на L умножение на скаляры из R по формуле (а, х)*—>ха. Легко проверить, что все условия определения п. 2 выполнены, хотя принимают в обычной записи другой вид: нулевой вектор в L есть 1, вместо 11 = 1 мы имеем л:1=л:; вместо a(bl) = (ab)l — тождество (xb)a = xba; вместо (а + Ь)1 = = al+ Ы — тождество ха+ь = хахь и т. д. б) Пусть L — векторное пространство над полем комплексных чисел С. Определим новое векторное пространство L с той же ад дитивной группой L, но другим законом умножения на скаляры: (а, /)ь->й1, где а — комплексно сопряженное число к а. Из формул а + Ь = = а + δ и аЬ = аЪ без труда следует, что L — векторное пространство. Если в какой-то ситуации нам приходится рассматривать одновременно L и Г, то может оказаться удобно писать вместо а/, скажем, а*/ или а <>/. 11. Замечания о чертежах и наглядных образах. Очень многие общие понятия и теоремы линейной алгебры удобно иллюстрировать схематическими чертежами и картинками. Мы хотим сразу же предупредить читателя о некоторых опасностях таких изображений. а) Малая размерность. Мы живем в трехмерном пространстве, и наши чертежи изображают обычно двух- или трехмерные образы. В линейной алгебре работают с пространствами любой конечной размерности, а в функциональном анализе — с бесконечномерными. Наша «маломерная» интуиция поддается очень серьез ному развитию, но развивать ее нужно сознательно. Простой пример: как представить себе общее расположение двух плоскостей в четырехмерном пространстве? Вообразите две пересекающиеся по прямой плоскости в R3, которые отрываются вдоль этой прямой всюду, кроме начала координат, расходясь в четвертое измерение. б) Вещественное поле. Физическое пространство R3 линейно над вещественным полем. Непривычность геометрии линейного пространства над Ж может быть связана со свойствами поля Ж. Например, пусть Ж = С (важнейший для квантовой механики случай). Прямая над С — это одномерное координатное пространство С1. Мы привыкли, что умножение точек прямой R1 на вещественное число а есть растяжение в а раз (при а > 1), сжатие в а~х раз (при 0 < а < 1) или их комбинация с «переворачиванием» прямой (при а < 0). 11
Но умножение на комплексное число а, действующее на С1, естественно представлять себе при геометрическом изображении С1 в виде R2 («плоскость Аргана» или «комплексная плоскость» — не путать с С2!). При этом изображении числу z = x + iy^Cl отвечает точка (л:, #)^R2, а умножение на а ф 0 соответствует растяжению в \а\ раз и повороту на угол arga против часовой стрелки. Мы видим, в частности, что при а = — 1 вещественное «переворачивание» прямой R1 есть ограничение на R1 поворота С1 на 180°. Вообще, /г-мерное комплексное пространство С1 можно, и часто полезно, представлять себе как 2п-мерное вещественное пространство R2" (ср. § 12 о комплексификации и овеществлении). Другим примером являются конечные поля Ж, в частности поле из двух элементов Fi ={0, 1}, важное в теории кодирования. Здесь конечномерные координатные пространства конечны, и иногда удобно связывать с линейной геометрией над Ж дискретные образы. Например, F% часто отождествляют с вершинами /г-мерно- го единичного куба в R"—множеством точек (еь ..., ε„), где 8ί = 0 или 1. Покоординатное сложение в F"— это операции Буля: 1 + 0 = 0 + 1 = 1; 0 + 0 = 1 + 1 = 0. Подпространство, состоящее из точек с ει + ... + ε„ = 0, определяет простейший код с обнаружением ошибок. Условившись, что точки (ει, ..., гп) коди- п руют сообщения только при £ ε; = 0, и приняв сигнал (εί, ..., en) η с Σ ε' τ^ 0> мы м°жем быть уверены, что помехи при передаче привели к ошибочному приему. в) Физическое пространство евклидово. Это значит, что в нем определены не только сложение векторов и умножение на скаляр, но также д^ины векторов, углы между ними, площади и объемы некоторых фигур и т. п. Наши чертежи несут принудительную информацию об этих «метрических» свойствах, и мы их машинально воспринимаем, хотя в общей аксиоматике линейных пространств они никак не отражены. Нельзя представлять себе, что один вектор короче другого, или что пара векторов образует прямой угол, до тех пор, . пока пространство не наделено специальной дополнительной структурой, скажем, абстрактным скалярным произведением. Таким структурам посвящена вторая часть книги. УПРАЖНЕНИЯ 1. Образуют ли линейное пространство над Q следующие множества вещественных чисел: а) положительные вещественные числа; б) неотрицательные вещественные числа; в) целые числа; г) рациональные числа со знаменателем ^ Ν; д) числа вида а + 6π, где а, Ь — любые рациональные числа? 2. Пусть 5 — некоторое множество, F(S)—пространство функций со значениями в поле Ж. Какие из следующих условий являются линейными: а) / обращается в нуль в данной точке 5;
б) / обращается в единицу в дайной точке S; в) / обращается в нуль во всех точках подмножества So a S; г) / обращается в нуль хотя бы в одной точке подмножества 50 с: S: Д) /(*) -*0 при \х\ ->оо; е) f(x) -*-1 при |*| -»-оо; ж) / имеет не более конечного числа точек разрыва (в д) —ж) предполагаем S = R и Ж = R)? 3. Пусть L — линейное пространство непрерывных вещественных функций на отрезке [—1, 1]. Какие из следующих функционалов на L являются линейными: ι a) f ι—>- \ f (χ) dx\ -1 1 б) f*-> 5 f*(x)dn -1 в) /ι—> /(0) (это — «дельта-функционал Дирака»); г) f ι—> \ f (x) g (x) dx, где g — фиксированная непрерывная функция на [-1,1]? 4. Пусть L = Жп. Какие из следующих условий на (χι, ..., ^)sL являются линейными: η а) Σαιχι=*\\ аи ..., ап&Х: t = l η б) ^ х\ = 0 (разберите отдельно случаи: Ж = R, Jif = С, #* — поле из двух элементов, или, более общо, иоле характеристики два); в) *з = 2*4? 5. Пусть Ж — конечное поле из q элементов. Сколько элементов имеется η в линейном пространстве Жп? Сколько решений есть у уравнения J] aixl = 0? г = 1 в. Пусть Ж°°—пространство бесконечных последовательностей (aua2,az ...)> а-х &Ж, с покоординатным сложением и умножением. Какие из следующих условий на векторы из Ж°° являются линейными: а) только конечное число координат на щ отлично от нуля; б) только конечное число координат а/ равно нулю; в) среди координат щ никакая не равна 1; г) условие Коши: для каждого ε > 0 существует такое N "> 0, что \ат — ап\ < ε при т, п> Ν\ оо д) условие Гильберта: ряд J] \ап\2 сходится; я-1 е) (щ) образуют ограниченную последовательность, т. е. существует такая константа с, зависящая от (at), что \щ\ < с для всех i (в г) — е) предполагаем Ж = R или С)? 7. Пусть 5 — конечное множество. Докажите, что каждый линейный функционал на F(S) однозначно определяется семейством элементов {as|seS} поля Ж: функции / ставится в соответствие скаляр ]Г asf (s). Если η — число элементов в 5 и as = \/п для всех s, мы получаем функционал f (—>— У f(s)—среднее арифметическое значений функции. S€=S 13
Если Ж = R и as > 0, ]£ as = 1, функционал ^ asf (s) называется взвешенным средним функции f (с весами as). §2. Базис и размерность 1. Определение. Семейство векторов {еи ..., еп) в линейном пространстве L называется (конечным) базисом L, если каждый вектор из L однозначно представляется в виде линейной, комбина- п ции l=y.aieh а(^Ж. Коэффициенты at называются координа- t = l тами вектора I относительно базиса {е,·}. 2. 'Примеры, а) Векторы ^ =(0,..., 1,..., 0), 1 ^ i ^ я, образуют базис Жп. б) Если множество S конечно, функции 8S^F(S) образуют базис F(S). Оба эти утверждения были проверены в § 1. Если в L выбран базис из η векторов и каждый вектор задается своими координатами в этом базисе, то сложение и умножение η η на скаляр выполняются покоординатно: У а{е{ + У Ь{е{ = η η η = Σ (αι + h) eb α Σ afti = Σ яя*£*· Поэтому выбор базиса равно- силен отождествлению L с координатным векторным простран- п -> ством. Вместо равенства 1= Σ aiei иногда пишут / = а, подразу- -> мевая под а вектор-столбец [аь .··, ап] = \ ; I \ап/ или вектор-строку (аь ..., an) = [(iu .··, Ял]' координат аь ... ..., ап\ в этих обозначениях явное указание базиса опущено. 3. Определение. Пространство L называется конечномерным, если оно либо нульмерно (см. § 1, п. 4), либо имеет конечный базис. Остальные пространства называются бесконечномерными. Удобно считать, что базис нульмерного пространства образует пустое множество векторов. Поскольку для нульмерных пространств все наши утверждения тривиализируются, мы обычно будем ограничиваться рассмотрением непустых базисов. 4. Теорема. В конечномерном пространстве число элементов базиса не зависит от базиса. Это число называется размерностью пространства L и обозначается dim L или Ахтус L. Если dim L = n, пространство L называется /г-мерным. В бесконечномерном случае мы пишем dimL = оо. Доказательство. Пусть {е\, ..., еп}—некоторый базис L. Мы докажем, что никакое семейство векторов {е\, ..., е'т) с т > η не может служить базисом L по следующей причине: существует 14
представление нулевого вектора 0 =■- Σ хье\, в котором не все κι равны нулю. Поэтому 0 не однозначно представляется в виде линейной комбинации векторов {е\}: всегда существует тривиальное т представление 0 = Σ Oe'i. Отсюда уже следует полное утверждение теоремы, поскольку этим мы проверим, что никакой базис не может содержать больше элементов, чем другой базис. η Положим е'к = Σ aikei> l*= 1» ···»"*. Для любых хк^Ж имеем т т η. η / т \ Σ хА = £ Ч Σ aike{ « g (£ α,ΛJ er Поскольку {ei} образуют базис в L, нулевой вектор имеет един- п ственное представление Σ 0^ в виде линейной комбинации {#&}· т Поэтому условие Σ jcfe^ = 0 равносильно системе однородных линейных уравнений относительно л:*: . m Поскольку число неизвестных m больше числа уравнений /г, эта система имеет ненулевое решение. Теорема доказана. 5. Замечания, а) Можно было бы рассматривать произвольные семейства векторов и называть такое семейство базисом, если любой вектор пространства однозначно представляется в виде конечной линейной комбинации элементов семейства. В этом смысле любое линейное пространство имеет базис, и у бесконечномерного пространства базиЬ всегда бесконечен. Однако это понятие не слишком полезно. Как правило, бесконечномерные пространства снабжаются топологией, и определение базиса видоизменяется с учетом этой топологии и возможности определять некоторые бесконечные линейные комбинации. б) В общих линейных пространствах базисные векторы по традиции нумеруются целыми числами от 1 до η (иногда от 0 до п)> но это совершенно не обязательно. Базис {б*} в F(S) естественно нумеруется элементами множества ssS. Можно также считать базис L просто подмножеством в L, элементы которого не снабжены никакими индексами (ср. п. 20). Нумерация, или, скорее, порядок элементов базиса, существенны при использовании матричного формализма (см. § 4). В других вопросах может оказаться важной другая структура на множестве индексов базиса. Например, если 5 — конечная группа, то важно, как индексы s бази- Ц
ca {6S} перемножаются внутри 5, а случайная нумерация S целыми числами может только загромоздить обозначения. 6. Примеры, а) Жп имеет размерность п. б) F(S) имеет размерность п, равную числу элементов S, если 5 конечно. Позже мы научимся вычислять размерности линейных пространств, не строя их базисов. Это очень важно, потому что многие числовые инварианты в математике определяются как размерности («числа Бетти» в топологии, индексы операторов в теории дифференциальных уравнений); базисы же соответствующих пространств могут оказаться трудно вычислимыми или не имеющими особого смысла. Но пока мы еще должны поработать с базисами. Проверка того, что данное семейство векторов {е\, ..., еп) в L образует базис, в соответствии с определением состоит из двух частей. Их отдельное рассмотрение приводит к следующим понятиям. 7. Определение. Линейной оболочкой семейства векторов называется множество их всевозможных линейных комбинаций в L, Легко проверить, что линейная оболочка является линейным подпространством в L (см. § 1, п. 8). Линейную оболочку Жех-\- + Же2+ ... также называют подпространством, натянутым на векторы {eft или порожденным векторами семейства {ei). Ее можно определить еще как пересечение всех линейных подпространств в L, содержащих все ei (докажите!). Рангом семейства векторов называется размерность его линейной оболочки. Первое характеристическое свойство базиса: его линейная оболочка совпадает со всем L. 8. Определение. Семейство векторов {ei) называется линейно независимым, если никакая нетривиальная линейная комбинация {ei} не равна нулю, т. е. если из Σ aiei= О следует, что все сц = 0. В противном случае оно называется линейно зависимым. Линейная независимость семейства {ei) означает, что нулевой вектор однозначно представляется в виде линейной комбинации элементов семейства. Тогда любой другой вектор имеет либо единственное представление, либо ни одного. Действительно, сравнивая два представления η η η I = Σ aiel = Σ <*/£/, находим 0 = Σ (а, — α'Λ е,, откуда α, = α' Отсюда следует второе характеристическое свойство базиса: его элементы линейно независимы. Объединение этих двух свойств равносильно первоначальному определению базиса. Заметим еще, что семейство векторов линейно независимо тогда и только тогда, когда оно образует базис своей линейной оболочки. Семейство {ех, ..., еп) заведомо линейно зависимо, если среди векторов ei есть нулевой или два одинаковых (почему?). id
Более общо: 9. Лемма, а) Семейство векторов {е\, ..., еп} линейно зависимо тогда и только тогда, когда хотя бы один из векторов в\ является линейной комбинацией остальных. б) Если семейство {еи ..., еп} линейно независимо, а семейство {еи ..., еп, еп+\} линейно зависимо, то еп+\ является линейной комбинацией е\, ..., еп. η Доказательство, а) Если Σ aiei — О и а\ Φ 0> то ^ = = Σ (—я/"!я*)*<· Наоборот, если β/= Σ bieit то е/ — Σ М* = 0. '*/ rt + 1 б) Если Σ aiei = 0 и не все at равны нулю, то обязательно αη+ι Φ 0, иначе мы получили бы нетривиальную линейную зави- п симость между еи ..., еп. Поэтому ел+1 = Σ (~~an+iai)ei· Лемма доказана. Пусть Е={е\, ..., еп}—некоторое конечное семейство векторов в L, F = {eiu ..., £*m} — его линейно независимое подсемейство. Назовем F максимальным, если каждый элемент из Ε линейно выражается через элементы из F. 10. Предложение. Каждое линейно независимое подсемейство Er cz E содержится в некотором максимальном линейно независимом подсемействе F cz Ε'. Линейные оболочки F и Ε совпадают. Доказате л Vc τ в о. Если в Е\Е' есть вектор, не предста- вимый в виде линейной комбинации элементов Е', добавим его к £'. В силу утверждения б) леммы п. 9 полученное семейство £" будет линейно независимым. Применим то же рассуждение к Е" и т. д. Поскольку Ε конечно, этот процесс оборвется на максимальном семействе Fv Любой элемент линейной оболочки Е, очевидно, линейно выражается через векторы семейства F. В случае £; = 0в качестве Е" нужно выбрать ненулевой вектор из Е, если он есть; иначе F пусто. 11. Замечание. Этот результат верен и для бесконечных семейств £. Для его доказательства следует применить трансфинитную индукцию или лемму Цорна: см. пп. 18—20. Максимальное подсемейство не обязательно единственно: рассмотрим £={(1,0), (0,1), (1,1)}, £' = {(1,0)} в Ж\ Тогда Е' содержится в двух максимальных независимых подсемействах {(1,0), (0,1)} и {(1,0), (1,1)}. Однако число элементов максимального подсемейства определено однозначно; оно совпадает с размерностью линейной оболочки Ε и называется рангом семейства £. Часто бывает полезна следующая теорема. 12. Теорема о продолжении базиса.Пусть £'={£Ь ..., ет}— линейно независимое семейство векторов в конечномерном пространстве L. Тогда существует базис L, содержащий £', 17
Доказательство. Выберем какой-нибудь базис {ет+\, ... ...у еп} в L и положим Е={е\, ..., ет, ет+и . .·, £л}· Обозначим через F максимальное линейно независимое подсемейство Е, содержащее Е'. Оно является искомым базисом. В самом деле, нужно только проверить, что линейная оболочка F совпадает с L. Но она равна линейной оболочке Ε по предложению п. 10, а последняя равна L, потому что в Ε содержится базис пространства L. 13. Следствие (монотонность размерности). Пусть Μ — линейное подпространство в L. Тогда dim Μ ^ dim L, и если L конечномерно, то из dim Μ = dim L следует, что Λί = L. Доказательство. Если М бесконечномерно, то L также бесконечномерно. Действительно, покажем сначала, что в Μ можно найти сколь угодно большие независимые семейства векторов. Если семейство из η линейно независимых векторов {еи ..., еп) уже найдено, то его линейная оболочка Λί'<ζΛί не может совпадать с Λί— иначе Λί было бы /г-мерно. Поэтому в Μ есть вектор еп+и линейно не выражающийся через {еи ..., еп}, и утверждение б) леммы п. 9 показывает, что семейство {ей ..., еп, en+i} линейно независимо. Теперь предположим, что Μ бесконечномерно, a L n-мерно. Тогда любые η + 1 линейных комбинаций элементов базиса L линейно зависимы по рассуждению в доказательстве теоремы п. 4, что противоречит бесконечномерности Λί. Остается разобрать случай, когда Λί и L конечномерны. Но тогда любой базис Μ по теореме п. 12 можно продолжить до базиса L, откуда и следует, что dim Λί ^ dim L. Наконец, если dimAi = dimL, то любой базис Μ должен быть базисом L — иначе его продолжение до базиса состояло бы из > dim L элементов, что невозможно. 14. Базисы и флаги. Один из стандартных способов изучения множеств S с алгебраическими структурами состоит в выделении в них последовательности подмножеств S0 cz S\ cz 52 cz ... или So =э 5i z) S2 => ... так, что переход от одного подмножества к следующему устроен в каком-то смысле просто. Общее название таких последовательностей—фильтрации (возрастающая и убывающая соответственно). В теории линейных пространств строго возрастающая последовательность подпространств L0 cz L\ cz ... с: Ln пространства L называется флагом. (Мотивировка названия: флаг {точка 0} g {прямая} cz {плоскость}—это «гвоздь», «древко» и «полотнище».) Число η назовем длиной флага L0cz: Li cz ... с: Lrt. Флаг L0 cz L\ <z ... cz Lncz ... назовем максимальным, если £0={0}, \JLi==L и между L/, Li+{ (для всех /) нельзя вставить подпространство: если L/czAi cz L/+i, то либо Li = M, либо Λί =Ι/+ι. По всякому базису {е\, ..., еп) пространства L можно построить флаг длины п, положив L0={0}, L/ —линейная оболочка {е\, ..., et) (при i^l). Из доказательства следующей теоремы 18
будет видно, что этот флаг максимален и что наша конструкция дает все максимальные флаги. 16. Теорема. Размерность пространства L равна длине любого его максимального флага. Доказательство. Пусть L0cz L{cz L2cz ... — максимальный флаг в L. Для каждого i ^ 1 выберем вектор ei e Lt\L/_i и покажем, что {еь ..., е j образуют базис пространства L/. Прежде всего, линейная оболочка семейства {ей ..., £/-ι} содержится в Li-u a ei не лежит в Ц-\, откуда индукцией по i (с учетом ei=7^0) следует, что {е\, ..., ei} линейно независимы для всех i. Теперь индукцией по / покажем, что {еь ..., ei) порождаютL/. Пусть это верно для i— 1, и пусть Μ — линейная оболочка семейства {ей ···» в/}· Тогда Li~\CzM по индуктивному предположению и Li_i φ Μ из-за того, что ei φ. Li-\. По определению максимальности флага отсюда следует, что Μ = Li. Теперь нетрудно завершить доказательство теоремы. Если LodLjCZ ... aLn = L — конечный максимальный флаг в L, то векторы {ей . · ·, еп}ч ei^ L/\L/_i, по доказанному образуют базис в L, так что η = dim L. Если в L есть бесконечный максимальный флаг, то эта конструкция дает сколь угодно большие линейно независимые семейства векторов в L, так что L бесконечномерно. 16. Дополнение. В конечномерном пространстве L любой флаг можно дополнить до максимального, и поэтому его длина всегда 2^ dim L. Действительно, будем вставлять в исходный флаг промежуточные подпространства, пока это возможно. Этот процесс не может продолжаться до бесконечности, ибо конструкция систем векторов {ей - - - > £/}, ei e L/\L/_i, по любому флагу дает линейно независимые системы (см. начало доказательства теоремы п. 15), и потому длина флага не может превзойти dim L. 17. Основной принцип работы с бесконечномерными пространствами: лемма Цорна, или трансфинитная индукция. Большинство теорем конечномерной линейной алгебры нетрудно доказать, опираясь на существование конечных базисов и теорему п. 12 о продолжении базисов: много примеров тому читатель увидит в дальнейшем. Но привычка к базисам затрудняет переход к функциональному анализу. Мы опишем сейчас теоретико-множественный принцип, который в очень многих случаях заменяет апелляцию к базисам. Напомним (см. «Введение в алгебру», тл. 1, § 6), что частично упорядоченным множеством называется множество X вместе с бинарным отношением порядка *ζ на Х> которое рефлексивно (х *ζ х), транзитивно (если χ <; у, у ^ г, то χ ^ г) и антисимметрично (если χ ^ у и у ^ х, то χ = у). Вполне может оказаться, что пара элементов х, у е X не находится ни в отношении χ *ζ у, ни в отношении у *ζ χ. Если же для любой пары либо χ *ζ yt либо у <; Ху то множество называется линейно упорядоченным, или цепью. 19
Верхняя грань подмножества У в частично упорядоченном множестве X — это любой элемент χ ^ X такой, что у ^ χ для всех !/еУ. Верхняя грань подмножества может и не существовать: если X = R с обычным отношением ^, a Υ = Ζ (целые числа), то верхней грани у У нет. Наибольшим элементом частично упорядоченного множества X называется элемент η е X такой, что χ ^ η для всех χ ^ X, а мак- симальным — элемент /nei, для которого из /n^xei следует х = ш. Наибольший элемент всегда максимален, но не наоборот. 18. Пример. Типичный пример упорядоченного множества X — это множество всех подмножеств &(S) множества S или некоторая его часть, упорядоченное отношением 5Ξ. Если 5 имеет больше двух элементов, то $P(S) частично упорядочено, но не линейно упорядочено (почему?). Элемент Se^(S) максимальный, и даже наибольший в !?(S). 19. Лемма Цорна. Пусть X — непустое частично упорядоченное множество, любая цепь в котором обладает верхней гранью в X. Тогда любая цепь обладает такой верхней гранью, которая является в то же время максимальным элементом в X. Лемму Цорна можно выводить из других, более приемлемых интуитивно аксиом теории множеств, но логически она эквивалентна так называемой «аксиоме выбора», если остальные аксиомы приняты. Поэтому удобно причислять ее к числу основных аксиом, что часто и делается. 20. Пример применения леммы Цорна: существование базиса в бесконечномерных линейных пространствах. Пусть L — линейное, пространство над полем Ж. Обозначим через XcziP(L) множество линейно независимых подмножеств векторов в L, упорядоченное отношением <=,. Иными словами, KgX, если любая конечная линейная комбинация векторов из У, равная нулю, имеет нулевые коэффициенты. Проверим условие леммы Цорна: если S — некоторая цепь в X, то у нее есть верхняя грань в X. Действительно, положим Ζ = (J У. Ясно, что Υ ^Ζ для всякого ΥеS; кроме того, Ζ образует линейно независимое множество векторов, потому что любое конечное множество векторов {уи ·. ·, У А из Ζ содержится в некотором элементе У е S. В самом деле, пусть yi е У/ е S; так как S — цепь, из каждых двух элементов У*, У/ е S один является подмножеством другого; выкидывая по очереди меньшие множества из таких пар, мы получим, что среди У/ есть наибольшее множество; в нем и содержатся все уи ···> Уп, которые, таким образом, линейно независимы. Применим теперь заключение леммы Цорна. Здесь достаточна только часть его: существование в X максимального элемента. Согласно определению, это такое линейно независимое множество векторов УеХ, что если добавить к нему любой вектор /^L, то множество У U {/} уже не будет линейно независимым. Точно такое' 20
же рассуждение, как при доказательстве утверждения б) леммы п. 9, показывает тогда, что / есть (конечная) линейная комбинация элементов У, т. е. Υ образует базис в L. УПРАЖНЕНИЯ 1. Пусть L — пространство многочленов от χ степени ^п—1с коэффициентами в поле Ж. Проверить следующие утверждения: а) 1, *, ..., хп~х образуют базис в L. Координаты многочлена / в этом базисе — это его коэффициенты. б) 1, χ — а, (х — а)2, ..., (х — а)"-1 образуют базис в L. Если charJif = = ρ ^ пу то координаты многочлена f в этом базисе: \ f (α), f (a) fin~l)(a) \ " («-DI У :{/<«? — Μ в) Пусть аь ·.·, йп^Ж—попарно различные элементы. Положим gi(x) = «= Π (χ ~~ α/^ (α* "" α/)~1· Многочлены g\(x), ..., gn{x) образуют базис L («интерполяционный базис»). Координаты многочлена / в этом базисе: {/(«ι),···,/К)}· 2. Пусть L — /г-мерное пространство, f: L-^Ж—ненулевой линейный функционал. Доказать, что Μ = {l&L\f(l) = 0} является (η—1)-мерным подпространством в L. Доказать, что все (п—1)-мерные подпространства получаются таким способом. 3. Пусть L — я-мерное пространство, Μ cz L — m-мерное подпространство. Доказать, что существуют линейные функционалы f\, ..., fn —т €Ξ= L такие, что M={/|/i(/)-...=»f„-m(/)-0}. 4. Вычислить размерности следующих пространств: а) пространства многочленов степени <р отп переменных; б) пространства однородных многочленов (форм) степени ρ от η переменных; в) пространства функций из F(S), \S\ < оо, обращающихся в нуль во всех точках из подмножества 50 cz 5. 5. Пусть Ж— конечное поле характеристики р. Доказать, что число его элементов равно рп для некоторого η ^ 1. (Указание. Рассмотреть Ж как линейное пространство над простым подполем, состоящим из всех «сумм единиц» в Ж: 0, 1, 1 + 1, ...) в. Заменой понятия флага в бесконечномерном случае служит понятие цепи подпространств (упорядоченных по включению). Пользуясь леммой Цорна, доказать, что всякая цепь содержится в максимальной. § 3. Линейные отображения 1. Определение. Пусть L, Μ — линейные пространства над полем Ж. Отображение f: L-+NI называется линейным, если для всех /, /ь /2 е L, а^Ж имеем f(al) = af(l), f(l{ + l2) = f(l{) + f(l2). Линейное отображение является гомоморфизмом аддитивных групп. В сам©м деле, f(0) = 0f(0) = 0 nj(— /) = /((— 1)/) = -/(/). Индукция по η показывает, что для любых а^^Ж, li^L имеем / ( Σ aiU J = Σ atf Vi \/β1 / ί=1 Лийейные отображения /: L-+L называются также линейными операторами на L. 21
2. Примеры, а) Нулевое линейное отображение /: L-νΛί, /(/) = 0 для всех /gL. Тождественное линейное отображение: f: L-+L, f(l) = l для всех /gL. Оно обозначается idi или id (от английского слова «identity»). Умножение на скаляр aeJ?, или гомотетия f: L-+L, f(l) = al для всех /е L. При α = 0 получается нулевой оператор, при а = 1 — тождественный. б) Линейные отображения f: L-^Ж— это линейные функции, или функционалы, на L (см. § 1, п. 9). Пусть L — пространство с базисом {е\, ... > еп). Для любого 1 ^ i <; η отображение е1: L-^Ж, где е1(1)— ί-я координата / в базисе {еи ..., еп}, является линейным функционалом. в) Пусть L ={*e R\x > 0} наделено структурой линейного пространства над R, описанной в § 1, пример а) п. 10, Μ = R l. Отображение log: L->Ai, х\—^logjc, R-линейно. г) Пусть SczT — два множества. Отображение F(T)-*~F(S), которое всякой функции на Τ ставит в соответствие ее ограничение на S, линейно. В частности, если 5= {s}, s^T, f^F(T), то отображение: f*—>(значение / в точке s) линейно. Конструкция линейных отображений с нужными свойствами часто основывается на следующем результате. 3. Предложение. Пусть L, Μ — линейные пространства над полем Ж\ {/ь ..., In} cz L и {ть ..., пгп} а М — два семейства векторов с одинаковым числом элементов. Тогда: а) если линейная оболочка {/ι, ..., ln) совпадает с L, то суще- ствует не больше одного линейного отображения f: L-+M, для которого f(U) = nti при всех i\ б) если {/ь ..., 1п} к тому же линейно независимы, т. е. обра- зуют базис L, то такое отображение существует. Доказательство. Пусть /, /' — пара отображений с /(//)== ==: f(/t) = nti для всех i. Рассмотрим отображение g — f— f, где (/ — П(0=/Ч0 — Γ(0· Легко проверить, что оно линейно. Кроме того, оно переводит в нуль все // и потому любую линейную комбинацию векторов U. Значит, f и f совпадают на каждом векторе из L, откуда f = f. Пусть теперь {/ь ..., In) образует базис L. Так как каждый η элемент L однозначно представляется в виде Σ а{1ь мы можем определить теоретико-множественное отображение /: L-+M формулой Его линейность проверяется непосредственно. В этом доказательстве использовалась разность двух линейных отображений L-+M. Это частный случай следующей более общей конструкции. 4. Обозначим через &{L, M) множество линейных отображений из L в М. Для fyg^S(LyM) и а<=Ж определим af и f + g 22
формулами (af) (I) = a(f (/)), if + g) (β = f(l) + g (I) для всех l^L. Точно так же, как в § i, п. 9, проверяется, что af и f + g линейны, так что 2'(L, Λί)—линейное пространство. 5. Пусть feJ?(L, Αί) и g e&WyN). Теоретико-множественная композиция gof = gf; L-+N является линейным отображением. Действительно, (gf) (h + h) = g If (h + «] = ί [f (/i) + / Μ = g[f (h)] + §U («1 = и, аналогично, (gf) (al) = a(gf(l)). Очевидно, idMo/ = /oidL = f. Кроме того, h(gf) = (hg)f, когда обе части определены, так что скобки можно опустить; это общее свойство ассоциативности теоретико-множественных отображений. Наконец, композиция gf линейна по каждому из аргументов при фиксированном втором: например, g © (afι + bfz) = я(g β/ι) + + b{gof2). 6. Пусть /ei?(L, Αί)— биективное отображение. Тогда у него есть теоретико-множественное обратное отображение /-1: M-+L. Мы утверждаем, что f~l автоматически линейно. Для этого следует проверить, что f~l (т{ + т2) = /-1 (тх) + f~l (m2), /-1 (ат{) = af~x (т{) для всех /щ, rri2SM\ а^Ж. Поскольку / биективно, существуют и однозначно определены такие векторы /i, k s L, что mi =^ /(//). Написав формулы f ft) + f (« - f (/ι + «. a/ ft) = f (alx), применив к их обеим частям f~l и заменив в результате U на f-l(mi)f получим требуемое. Биективные линейные отображения f: L-+M называются изоморфизмами. Пространства L и Μ называются изоморфными, если между ними существует изоморфизм. Следующая теорема показывает, что размерность пространства полностью определяет его с точностью до изоморфизма. 7. Теорема. Два конечномерных пространства L и Μ над полем Ж изоморфны тогда и только тогда, когда у них одинаковые размерности. Доказательство. Изоморфизм /: L-+M сохраняет все свойства, формулируемые в терминах линейных комбинаций. В частности, он переводит любой базис L в некоторый базис М9 так что размерности L и Μ совпадают. (Из этого рассуждения следует также, что конечномерное пространство не может быть изоморфно бесконечномерному.) Наоборот, пусть размерности L и Μ равны п. Выберем базисы {1и · ·. > In) и {ть .,., Шп) в L и Μ соответственно. Формула 83
определяет линейное отображение L в Μ по предложению п. 3. Оно является биекцией, ибо формула /"Ч Σ<νπι)= Σα,/, \ί=1 / ί=1 определяет обратное линейное отображение f*1. 8. Предупреждение. Если даже изоморфизм между двумя линейными пространствами L,M и существует, он определен однозначно только в двух случаях: а) L = M={0}, б) L и Λί одномерны, а Ж— поле из двух элементов (попробуйте доказать это!). Во всех остальных случаях имеется много (если Ж бесконечно, то бесконечно много) изоморфизмов. В частности, имеется много изоморфизмов пространства L с самим собой. В силу результатов пп. 5 и 6 они образуют группу относительно теоретико- множественной композиции. Эта группа называется полной линей- ной группой пространства L. Позже мы сможем описать ее в более явном виде как группу невырожденных квадратных матриц. Иногда бывает, что между двумя линейными пространствами определен некоторый изоморфизм, не зависящий ни от каких произвольных выборов (как выборы базисов в пространствах L и Μ в доказательстве теоремы п. 7). Такие изоморфизмы мы будем называть каноническими или естественными (точное определение этих терминов можно дать только на категорном языке, о котором см. § 13). Следует тщательно отличать естественные изоморфизмы от «случайных». Мы приведем два характерных примера, очень важных для понимания этого различия. 9. «Случайный» изоморфизм между пространством и двойственным к нему. Пусть L — конечномерное пространство с базисом {в\у ..., еп}· Обозначим через e'eL* линейный функционал /ь->е<(/), где е'(/)— i-я координата вектора / в базисе {е,} (не путать с /-й степенью; в линейном пространстве она не определена). Мы утверждаем, что функционалы {е\ ..., еп} образуют базис в L*, так называемый двойственный к {ей ..., еп} базис. Равносильное описание {е1} такое: el(ek) = 8ik (символ Кронекера: 1 при i = k, 0 при 1фк). В самом деле, всякий линейный функционал f: L-^Ж можно представить в виде линейной комбинации {е1}\ f-tf(ei)e1· Действительно, значения левой и правой части совпадают на любой линейной комбинации Σ akek> потому что е1 ι Σ aifik)= αι по определению еК 24
η Кроме того, {ei) линейно независимы: если £ ч;е' = 0, то для ( = 1 всех /г, 1 ^ k ^ /г, имеем ak = lj^aiei\ (ек) = 0. Поэтому L и L* имеют одинаковую размерность η и даже определен изоморфизм f: L-+L*, который переводит et в е1. Однако этот изоморфизм не каноничен: замена базиса {еи ..., еп}У вообще говоря, меняет его. Так, если L одномерно, то для любого ненулевого вектора е\^ L семейство {е\} является базисом L. Пусть {е1} —двойственный базис к {в\}, е1(е\) = 1. Тогда к базису {αβι}, а еЖ\{0}, двойствен базис {а~1е1}. Но линейные отображения /у. е\\—>е1 и f2: ае\^—>а~хех различны, если только а*Ф\. 10. Канонический изоморфизм между пространством и дважды двойственным к нему. Пусть L — линейное пространство, L* — пространство линейных функций на нем, L**=(L*)*—пространство линейных функций на L* — «дважды двойственное к L пространство». Опишем каноническое отображение гс L->£**, не зависящее ни от каких произвольных выборов. Оно ставит в соответствие каждому вектору l^L функцию на L*, значение которой на функционале f e L* равно /(/); в краткой записи: Проверим следующие свойства гс. а) Для каждого /е L отображение sl(1): Ь*-+Ж линейно. Действительно, это означает, что выражение f(l) как функция от f при фиксированном I линейно по f. Но это следует из правил сложения функционалов и умножения их на скаляр (§ 1, п. 7). Следовательно, el действительно определяет отображение L в L**, как и утверждалось. б) Отображение гс L-+L** линейно. Действительно, это означает, что выражение /(/) как функция от I при фиксированном f линейно, — это так, ибо / е ΖΛ в) Если L конечномерно, то отображение eL: L-+L** является изоморфизмом. В самом деле, пусть {ей -.., вп) — базис L, {е\ ..., еп)—двойственный базис L*9 {е\> ..., е'п) — базис в L**, двойственный к {е1, ..., еп}. Покажем, что 8L(ei) = ei, откуда и будет следовать, что sl — изоморфизм (в этой проверке использование базиса L безобидно, ибо в определении ει он не участвовал!). В самом деле, ε/, (β/) согласно определению есть функционал на L*, значение которого на ek равно ek(ei) = 6ik («символ Кроне- кера»). Но e'i — точно такой же функционал на L* по определению двойственного базиса. Заметим, что если L бесконечномерно, то el: /,->£** Остается инъектйвным, но перестает быть сюръективным (см. упражнение 2). В функциональном анализе вместо полного L* обычно рассмат- 25
ривают только подпространство линейных функционалов Z/, непрерывных в подходящей топологии на L иж, и тогда отображение L-+L" может быть определено и иногда оказывается изоморфизмом. Такие (топологические) пространства называют рефлексивными. Мы доказали, что конечномерные пространства (без учета топологии) рефлексивны. Рассмотрим теперь связь между линейными отображениями и линейными подпространствами. 11. Определение. Пусть /: L -> Μ -— линейное отображение. Множество Кег / = {/ ^ L \ f (/) = 0} с: L называется ядром /, а множество Im/ = {m^M | 3teL, /(/) = m}czAf называется образом /. Нетрудно убедиться, что ядро / является линейным подпространством в L, а образ /— линейным подпространством в М. Проверим, например, второе утверждение. Пусть mum2^ Im/, aeJ. Тогда существуют такие векторы /ь/2eL, что /(/i) = mi, /(/2) = = /Η2. Значит, nti +m2 = f(l\-\-k), ami = /(a/i). Следовательно, Ш\ + tf*2 e Im / и ant\ ^ Im /. Отображение / инъективно тогда и только тогда, когда Кег/ = {0}. В самом деле, если /(/!) = /(/2), 1\Ф12у то 0ф1г — -/2еКег/. Наоборот, если 0=И=/е=Кег/, то /(/) = 0 = /(0). 12. Теорема. Пусть L — конечномерное линейное пространство, f: L-*M — линейное отображение. Тогда Кег / и Im / конечномерны и dim Кег / + dim Im f = dim L. Доказательство. Ядро / конечномерно по следствию п. 13, § 2. Выберем базис {е\, ..., ет) в Kerf и продолжим его до базиса {е\у ..., ет, ет+и ..., ет+п) пространства L по теореме п. 12, § 2. Покажем, что векторы /(em+i), ..., f(em+/I) образуют базис в Im/. Отсюда, очевидно, будет следовать теорема. Любой вектор из Im/ имеет вид /ηιλ-η \ т+п f[ Σ <*tet)= Σ {aif(ei)· Следовательно, f(em+\)y ..., f(em+n) порождают Im/. т+п / т+п 'ч Предположим, что Σ а*/Ч^) = 0· Тогда / I Σ α^ J =0. m+л т+п т Это значит,'что Σ a^eKer/, т. е. Σ ^^ί=Σα/^/· Это возможно, только если все коэффициенты равны нулю, ибо {еь ... ..., em+n}— базис L. Следовательно, векторы /(ew+i), ..., /(em+/i) линейно независимы. Теорема доказана. 13. Следствие. Следующие свойства f равносильны (в случае конечномерного L): а) / инъективно. б) dimL = dim Im/. Доказательство. Согласно теореме, dimL = dimIm/ тогда и только тогда, когда dim Кег / = 0, т. е. Кег/= {0}. 20
УПРАЖНЕНИЯ 1. Пусть /: Rm ->- R" — отображение, заданное дифференцируемыми функциями, вообще говоря, нелинейными и переводящими нуль в нуль: f(xu ··., Хпг) ==(..., fi(xu ..... Хт), ···)» /=»1, ···, "> /,(0, ..., 0) = 0. Поставим ему в соответствие линейное отображение df0: Rm ->- R", называемое дифференциалом f в точке О, по формуле №)W) = i|(^; = (|;(») |г(0)). где \ββ, \е^ — стандартные базисы Rm и Rn. Показать, что если произвести замену базисов в пространствах Rm и Rn и вычислить df0 по тем же формулам в других базисах, то новое линейное отображение df0 совпадает со старым. 2. Докажите, что пространство многочленов Q[x] не изоморфно своему двойственному. (Указание. Сравните мощности.) § 4. Матрицы 1. Цель этого параграфа — ввести язык матриц и установить основные связи его с языком линейных пространств и отображений. За дальнейшими подробностями и примерами мы отсылаем читателя к главам 2 и 3 «Введения в алгебру»; в частности, мы будем пользоваться развитой там теорией определителей, не повторяя ее. Читателю следует самостоятельно убедиться в том, что изложение в этих главах без изменений переносится с поля вещественных чисел на любое поле скаляров; исключения составляют лишь те случаи, где используются такие специфические свойства вещественных чисел, как порядок и непрерывность. 2. Термины. Матрицей А размера m χ η с элементами из мш> жества S называется семейство (aife) элементов из 5, пронумерованное упорядоченными парами чисел (/, k)y где 1 ^ / ^ т, 1 ^Г k ^ п. Часто пишут А = (aik), 1 ^ i ^ mt 1 ^ k ^Г п; указание размера может быть опущено. При фиксированном i семейство (aib . · ·, a>in) называется i'u строкой матрицы А, При фиксированном k семейство (αϊ*, ..., amk) называется k-м столбцом матрицы Л. Матрица размера 1 Χ η называется просто строкой, а матрица размера тХ 1 — столбцом. Если пг = п, матрица А называется квадратной (иногда говорят «порядка п» вместо «размера яХ /г»). Если А — квадратная матрица порядка /г, S=Ji? (поле) и aik = 0 при ьфк, матрица А называется диагональной; иногда ее записывают diag(an, ..., апп). Вообще, элементы (а и) называ» ются элементами главной диагонали. Элементы a\,k+\\ &%ь+2\ ...» где k > О, образуют диагональ, стоящую выше главной, а элемен» ты ak+uu ak+2,2l .. ·, где k > 0, —диагональ, стоящую ниже главной. Если S = Ж и atk — 0 при k < it матрица называется верхней 2?
треугольной, а если aik = 0 при k > i, то нижней треугольной. Диагональная квадратная матрица над Ж, у которой все элементы на главной диагонали одинаковы, называется скалярной. Если эти элементы равны единице, матрица называется единичной. Единичная матрица порядка η обозначается Еп или просто Е, если порядок ясен из контекста. Все эти термины обязаны своим происхождением стандартной записи матрицы в виде таблицы Сап ах2 ... аХп \ а2\ а22 ... а2п | ат\ о-тч · · · атп' Транспонированная к А матрица А* имеет размеры /гХт, и ее элемент в i-й строке и А-м столбце равен а&. (Иногда используемое обозначение At = (aki) двусмысленно!) 3. Замечания. Большая часть матриц, встречающихся в теории линейных пространств над полем Ж, имеет своими элементами элементы самого этого поля. Однако бывают и исключения. Например, мы будем иногда рассматривать упорядоченный базис {ей · · ·, с*) пространства L, как матрицу размера 1 Χ η с элементами из этого пространства. Другой пример — блочные матрицы, элементами которых в свою очередь являются матрицы — блоки исходной. Именно разбиение номеров строк [1, ..., ш] — Ix U U h U · · · U /ц и номеров столбцов [ 1, ..., п] = ]\ \} ... U /v на идущие подряд попарно непересекающиеся отрезки определяет разбиение матрицы А на блоки Ли Αμ\ АХ2 Λμ2 . . . **1 V Λμν где Αα$ имеет своими элементами α,·*, ί е /а, fee/β. Если μ = ν, можно очевидным способом определить понятия блочно диагональной, блочной верхней треугольной, блочной нижней треугольной матриц. Этот же пример показывает, что не всегда удобно нумеровать столбцы и строки матрицы числами от 1 до m (или п): часто существен лишь порядок строк и столбцов. 4. Матрица линейного отображения. Пусть N и Μ — конечномерные линейные пространства над Ж с отмеченными базисами {еь ..., еп} и {el, ..., em) соответственно.Рассмотрим произвольное линейное отображение f: N-+M и поставим ему в соответствие матрицу Af размера mXn с элементами из поля Ж следующим образом (заметьте, что размеры Af суть размерности Ν,Μ в обратном порядке). Представим векторы f(ek) в виде линейных ком- m бинаций: f (ek) =* Σ <*****· Тогда по определению Af = {aik). Иными словами, коэффициенты этих линейных комбинаций суть последовательные столбцы матрицы Л/. 28
Матрица Af называется матрицей линейного отображения f относительно базисов (или в базисах) {ek}t {е\}. В силу предложения п. 3, § 3, линейное отображение / однозначно определяется образами f(ek), и в качестве последних можно взять любое семейство из η векторов пространства М. Поэтому описанное соответствие устанавливает биекцию между множеством 3?(Ν, Μ) и множеством матриц размера mX n с элементами из Ж (или над Ж). Эта биекция, однако, зависит от выбора базисов (см. п. 8 ниже). Матрица Af позволяет также описывать линейное отображение / в терминах его действия на координаты. Если вектор / представлен столбцом х = [хи .··> χη] своих координат в базисе η {ей ..·, еп)у т. е. /= Σ xfii, то f(l) представлен вектором-столб- дом у = [уи ..., Ут], где η ·> -> Иными словами, y = AfX— обычное произведение матрицы Af на -> столбец х. Когда речь идет о матрице линейного оператора A=(aik), всегда подразумевается, что в «двух экземплярах» пространства N выбирается один и тот же базис. Матрица линейного оператора квадратна. Матрица тождественного оператора единична. Согласно п. 4, § 3, множество 5?(Ν,Μ) является в свою очередь линейным пространством над Ж. При отождествлении элементов 9?(Ν, Μ) с матрицами эта структура описывается следующим образом. 5. Сложение матриц и умножение на скаляр. Пусть А = (а**), B=(bik) — две матрицы одинакового размера над полем Ж, а^Ж. Положим А + В = (cih), где cik = aik + bikt а А = (aaik). Эти операции определяют на матрицах данного размера структуру линейного пространства. Легко проверить, что если A=Af, В = Ag (в одинаковых базисах), то Af + Ag = Af+g, Aaf = aAf, так что указанное соответствие (а оно биективно) является изоморфизмом. В частности, dim 3?(N, M) = dimAi dim N, потому что пространство матриц изоморфно Жтп (размер mXn). Композиция линейных отображений описывается в терминах умножения матриц. 6. Умножение матриц. Произведение матрицы А размера т X Хл' над полем Ж на матрицу В размера п"Хр над полем Ж 29
определено тогда и только тогда, когда п' = п" = п; размер АВ в этом случае равен тХ р, и по определению η АВ = (ctk), где cik = Σ atibik. Нетрудно проверить, что {АВ)* = В*А*. Может случиться, что АВ определена, но ВА не определена (если тфр) или обе матрицы АВ и ВА определены, но имеют разные размеры (если тфп), или даже определены и имеют одинаковые размеры (т = п = р)у но не совпадают. Иными словами, умножение матриц не коммутативно. Однако оно ассоциативно: если матрицы АВ и ВС определены, то (АВ)С и А (ВС) определены и совпадают. В самом деле, положим Л=(а*/), B=(bfk)9 С = (см). Согласованность размеров А с ВС и АВ с С предлагается проверить читателю. Если она уже проверена, то мы можем вычислять (//)-й элемент (АВ)С по формуле Σ ί Σ йцЬиЛ cki = Σ (α*/Μ ckU а (И)-й элемент Л (ВС) по формуле Σ % (]£ bikCki} = Σ^% (*/*£*/)· Так как умножение в Ж ассоциативно, эти элементы совпадают. Зная уже, что умножение матриц над Ж ассоциативно, мы можем убедиться, что «поблочное умножение» блочных матриц также ассоциативно (см. также упражнение 1). Кроме того, произведение матриц линейно по каждому аргументу: (аА + ЬВ)С = аАС + ЬВС\ А (ЬВ + сС) = ЬАВ + с АС. Важнейшее свойство умножения матриц состоит в τομ,^το оно отвечает композиции линейных отображений. Однако целый ряд других ситуаций в линейной алгебре также удобно описывается умножением матриц: это главная причина унифицирующей роли матричного языка и некоторой самостоятельности матричной алгебры внутри линейной алгебры. Перечислим некоторые из этих ситуаций. 7. Матрица композиции линейных отображений. Пусть Ρ, Ν, я f Af —три конечномерных линейных пространства,?—> N—>М — два линейных отображения. Выберем базисы {е]}> {е'^ и {ет} в Р, NtM соответственно и обозначим через Ag9 Af, Af8 матрицы g9 f9 fg в этих базисах. Мы утверждаем, что Af8 = AfA8. В самом деле, пусть Л/=(а/*), Ag=*(btk). Имеем /f«) - Σ bj (4) - Σ bik^ a{ie{- £ ( ^ al%bih ) ek. ao
Следовательно, (/, k)-\\ элемент матрицы Afg равен ]£ Я//&**, т. е. Afe = AfAe. Согласно результатам пп. 4—6 множество линейных операторов 3?{L,L) после выбора базиса в L можно отождествить с множеством квадратных матриц Мп(Ж) порядка n = dimL над полем Ж. Имеющиеся в обоих множествах структуры линейных пространств и колец при этом отождествлении согласованы. Биекциям, т. е. линейным автоморфизмам f: L-+L, отвечают обратимые матрицы: если /of-1 = idL, то AfAf-i = Еп, так что Af-\ = AJX. Напомним, что матрица А обратима, или невырождена тогда и только тогда, когда det А Ф 0. 8. а) Действие линейного отображения в координатах. В обозначениях п. 4 мы можем представлять векторы пространств Ν, Μ в координатах столбцами -(Г)Ц?) и тогда действие оператора f записывается на языке матричного умножения формулой 'У\ Уп ' Чи, ... cimn\xJ -> -> или y = AfX (ср. п. 4). Иногда удобно писать аналогичную формулу в терминах базисов {et}, {e'k}t где она принимает вид f(el9 ..., en) = (f(el)y ..., f(en)) = (e'u ..., e?m)Af. При этом формализм матричного умножения требует, чтобы в выражении справа векторы Μ умножались на скаляры справа, а не слева; это безобидно, мы просто будем считать, что е,а = ае/ для любых βΈΑί, а^Ж. Пользуясь такого рода записями, мы будем иногда нуждаться в проверке ассоциативности или линейности по аргументам «смешанных» произведений матриц, часть которых имеет элементы из Ж, а другая часть из L, например ((*„ ..., en)A)B = (el9 ..., еп)(АВ) или (*.+*;,..., en + <QA = (elt .... еа)А + (е\, .... е'п)А и т. п. Формализм пп. 4, 5 автоматически переносится на эти ел у чаи. То же замечание относится к блочным матрицам. б) Координаты вектора в измененном базисе. Пусть в про странстве L выбраны два базиса {в J и {^}. Любой вектор /^ / 31
η можно представить его координатами в этих базисах: /= Σ к е.= i «ι η = Σ x'ke'k· Покажем, что существует квадратная матрица А поряд- -> -> ка /г, не зависящая от /, такая, что χ = Ах . η Действительно, если е'к= ^aikei9 то A = (aik); i = \ η η η / η \ η / η ч Σ χ fit =' = Σ *Ά = Σ χ\ (Σ aike{) = Σ ( Σ *ιΑ)«,. Матрица Л называется матрицей перехода (от нештрихованного базиса к штрихованному), или от штрихованных координат к не- штрихованным. Заметим, что она обратима: обратная матрица есть матрица перехода от штрихованного базиса к нештрихован- ному. -> > · Заметим, что формулу х = Ах' можно было прочесть также как ->► формулу, выражающую координаты старого вектора-столбца χ через координаты вектора f{xf), где / — линейное отображение L->L, описанное матрицей А в базисе {ek}. В физике эти две точки зрения называются соответственно «пассивной» и «активной». В первом случае мы описываем одно и то же состояние системы (вектор /) с точки зрения разных наблюдений (со своими системами координат). Во втором случае наблюдатель один, а состояние системы подвергается преобразованиям, состоящим, например, из симметрии пространства состояний этой системы. в) Матрица линейного отображения в измененных базисах. В ситуации п. 4 выясним, как изменится матрица Af линейного отображения, если перейти от базисов {е^у {#'} к новым базисам {ёЛ, {ё'Л пространств N, М. Пусть В—матрица перехода от {^-координат к {ek} -координатам, а С—матрица перехода от {^-координат к {ё'}-координатам. Мы утверждаем, что матрица Af отображения / в базисах {ёJ, {ё^ равна Af = C']AfB. В самом деле, вычисляя в базисах, имеем (**) а,=/ ((«,)) - / (Ы в) = (/ (·*))в - «) V - («О c~lAfB· Рекомендуем проделать аналогичные вычисления в координатах. Особенно важен частный случай N = Mt |ej = {ej}, {et.} = {^}, В = С. Матрица линейного оператора / в новом базисе равна Jf = B-lAfB. 82
Отображение Мп(Ж)-^Мп(Ж): Αν->Β~ΧΑΒ называется сопряжением (посредством невырожденной матрицы В). Сопряжение является автоморфизмом матричной алгебры Мп(Ж): B~l(fiaiAi)B=f\alB-xAiB9 щевХ; B-{(A]...Am)B = (B-{AlB)...(B-{AmB) (в произведении справа внутренние сомножители В и β-1 попарно сокращаются, ибо стоят рядом). Особую роль играют те функции от элементов Мп(Ж)у которые не меняются при замене матрицы на сопряженную, потому что с помощью этих функций можно строить инварианты линейных операторов: если φ —такая функция, то, полагая ф(^) = φ (Л^), получим результат, зависящий лишь от /, но не от базиса, в котором пишется Af. Вот два важных примера. 9. Определитель и след линейного оператора. Положим Trf = Tr4f= Σα«, где Af = (aik) (след—«trace» — матрицы А есть сумма элементов ее главной диагонали); detf = deMf. Инвариантность определителя относительно сопряжения очевидна: det (β-'ЛВ) = (det β)"1 · det A · det β = det A. Чтобы установить инвариантность следа, докажем более общий факт: если Л, В — такие матрицы, что АВ и ВА определены, то ΊχΑΒ = ΊνΒΑ. Действительно, Тг А В = Σ Σ atfilt9 ΎτΑΒ=Σ Σ ЬцаИ. Если теперь В невырождена, то, применяя доказанный факт к матрицам В~ХА и β, получим Тг (β-'Λβ) = Тг (ВВ']А) = Тг Л. В § 8 мы введем собственные значения матриц и операторов, симметрические функции от которых дадут другие инвариантные функции. В заключение этого параграфа мы приведем определения, названия и стандартные обозначения для нескольких классов матриц над вещественными и комплексными числами, исключительно важных в теории групп и алгебр Ли и ее многочисленных приложениях, в частности в физике. Первый класс образуют так называемые классические группы: они действительно являются группами 33
относительно матричного умножения. Второй класс образуют алгебры Ли: они составляют линейные пространства и устойчивы относительно операции взятия коммутатора: [А, В] = АВ — ВА. Параллелизм обозначений для этих классов получит некоторое объяснение в § 11 и в упражнении 8. 10. Классические группы. а) Полная линейная группа GL(n, Ж). Она состоит из невырожденных квадратных матриц размера ηΧ η над полем X. б) Специальная линейная группа SL(n, Jif). Она состоит из квадратных матриц размера лХ/г над полем Ж с определителем единица. В этих двух случаях Ж может быть любым полем. Дальше мы ограничимся полями Ж = К или С, хотя существуют обобщения этих определений на другие поля. в) Ортогональная группа 0(п,Ж). Она состоит из матриц размера «Хпс условием АА*=Еп. Такие матрицы действительно образуют группу, ибо ЕпЕ{п = Еп, Α-'{Α-ι)' = Α-{{Α<)-Χ = {Α<Α)-' = {Εΐν = Εη, наконец, (АВ) (AB)f = ABB* Af = AAf = Έη. При Ж = R, С эта группа называется вещественной или комплексной соответственно. Элементы группы 0(пуЖ) называются ортогональными матрицами. Вместо О (л, R) обычно пишут О(п). г) Специальная ортогональная группа SO (л, Ж). Она состоит из ортогональных матриц с определителем единица: SO (л, Ж) = 0(п, JiOnSUn, Ж). Вместо SO (я, R) обычно пишут SO (л). д) Унитарная группа Ό(η). Она состоит из комплексных матриц размера яХя, удовлетворяющих условию АА* = Еп, где А — матрица, элементы которой комплексно сопряжены с соответствующими элементами матрицы А: если Д«=* (а**), то Д = (а,>). Пользуясь равенством АВ = АВ, нетрудно проверить, как и в случае в), что U (п) является группой, как в предыдущем пункте. Элементы U(n) называют унитарными матрицами. - Матрицу А* часто называют эрмитово сопряженной с матрицей А; математики обычно обозначают ее Л*, а физики А+. Заметим, что операция эрмитова сопряжения определена для комплексных матриц любых размеров. е) Специальная унитарная группа SU(n). Она состоит из унитарных матриц с определителем единица: SU(n) = U(n)flSL(n, С). Из определений ясно, что вещественные унитарные матрицы — это ортогональные матрицы: 0(n) = U(n)f| GL(n, R), SO(n) = = U(n)flSL(n,R). 34
11. Классические алгебры Ли. (Матричной) алгеброй Ли называется любая аддитивная подгруппа квадратных матриц Мп(Ж), замкнутая относительно операции коммутирования [Л,В] = = АВ — В А. (Общее определение см. в упражнении 14.) Следующие множества матриц составляют классические алгебры Ли; обычно они даже образуют линейные пространства над Ж (иногда над R, хотя Ж = С). Они не являются группами по умножению! а) Алгебра gl(n, Jif). Она состоит из всех матриц Мп(Ж) б) Алгебра sl(n, Ж). Она состоит из всех матриц Мп(Ж) со следом нуль (иногда говорят «бесследных»). Замкнутость относительно коммутатора следует из формулы Тт[А, В]= О, доказанной в п. 9. Заметим, что Тг является линейной функцией на пространствах квадратных матриц и линейных операторов, так что si (я, Ж) является линейным пространством над Ж. в) Алгебра о(/г, Ж). Она состоит из всех матриц в Мп(Ж), удовлетворяющих условию А -\-А* = 0. Равносильное условие: A =(aik), где аи = 0 (если характеристика Ж отлична от двух), a\k — —a>ku Такие матрицы называются антисимметричными, или кососимметричными. Заметим, что ТгЛ =0 для всех А ^о(п,Ж). Если Л< = — Л, β< = — В, то [А,В]< = [В',А'] = [—В, -Л] = = — [А, В], так что [А, В] кососимметрична. Такие матрицы образуют линейное пространство над Ж, Попутно заметим, что матрица А называется симметричной, если А* = А. Множество таких матриц не замкнуто относительно коммутирования, но замкнуто относительно антикоммутирования АВ + ВА или операции Йордана -^ (АВ + ВА). г) Алгебра u(n). Она состоит из комплексных матриц размера л X л, удовлетворяющих условию А+А* = 0, или αίΛ = —им. В частности, на диагонали у них стоят чисто мнимые элементы. Такие матрицы называются эрмитово антисимметричными, или антиэрмитовыми, или косоэрмитовыми. Они образуют линейное пространство надЛ*, но не над С. Если А* = — А, В* = —В, то [Л, В]*^[В*, Л'] = [-А -А\ = -[А9В]9 так что u(n) является алгеброй Ли. Попутно заметим, что матрица А называется эрмитово симметричной, или просто эрмитовой, если А = Л', т. е. aki = uik. Очевидно, вещественные эрмитовы матрицы симметричны, а антиэрмитовы — антисимметричны. В частности, o(n, R) = u(n)flsl(n, R). Матрица Л эрмитова, если матрица [А антиэрмитова, и наоборот. д) Алгебра su(n). Это есть и (η) Г) si (n, С)— алгебра бесследных Ънтиэрмитовых матриц. Они образуют R-Линейное пространство. Зр
Во второй части книги, изучая линейные пространства, снабженные евклидовыми или эрмитовыми метриками, мы выясним геометрический смысл операторов, которые представлены матрицами из описанных классов, а также пополним наши списки. УПРАЖНЕНИЯ 1. Сформулировать точно и доказать утверждение о том, что матрицы над полем, разбитые на блоки, можно умножать поблочно, если размеры и количество блоков согласованы: <*!/>(*/*)- (£V/*). когда число столбцов в блоке Ац равно числу строк в блоке β/* и число блочных столбцов матрицы А равно числу блочных строк матрицы В. 2. Ввести понятие бесконечной матрицы (с бесконечным числом строк и/или столбцов). Найти условия, когда можно перемножать две гакие матрицы над полем (примеры: финитные матрицы, т. е. матрицы только с конечным числом ненулевых элементов; матрицы, у которых в каждом столбце и/или каждой строке конечно число ненулевых элементов). Найти условия существования тройных произведений. 3. Доказать, что уравнение ΧΥ — ΥΧ = Ε неразрешимо в конечных квадратных матрицах X, У над полем нулевой характеристики. (Указание. Рассмотреть след обеих частей.) Найти решение этого уравнения в бесконечных матрицах. (Указание. Рассмотреть линейные операторы d/dx и умножения на χ на про- странстве всех многочленов от χ и воспользоваться тем, что -т— (xf) — χ —г— f = 4. Описать явно классические группы и классические алгебры Ли в случаях л = 1 и η = 2. Построить изоморфизм групп U(l) и SO(2, R). 5. Следующие матрицы над С называются матрицами Паули: σ°=(οι)' σι==(ιο)' σ2=(?~ό)' σ3=(ί-ι)· (Их ввел известный физик В. Паули, один из создателей квантовой механики, в своей теории спина электрона.) Проверить их свойства: а) [σα, Оь] = 2ieabcOCi где {а, 6, с} — {1,2, 3} и гаьс — знак перестановки 1 2 3> / 12 34 V а Ь с) б) ОаОь + оьоа = 2δαί>σ0 "(δαί> — символ Кронекера). в) Матрицы to], /σ2, /σ3 над R образуют базис su(2); над С —базис si (2); матрицы σ0, /σι, /σ2, /σ3 над R образуют базис u(2), над С —базис gl(2). 6. Следующие матрицы над С порядка 4 называются матрицами Дирака (здесь аа — матрицы Паули): /σ0 0 4 / 0 σΛ ( 0 σ2λ ( 0 σ3\ (их ввел известный физик П. А. М. Дирак, один из создателей квантовой механики, в своей теории релятивистского электрона со спином). Пользуясь результатами упражнений 5 и 1, проверить их свойства: а) УаУь + УьУа = 2gabEAi где gab = 0 при α Φ by goo = 1, gn = g22 =- == gz3 — —1· б) По определению, γ5 = /γ^ΎβΥο. Проверить, что Ys = — 1 σ qу в) ΥαΥ^ = - Y5Yfl Для а = 0, 1, 2, 3; y\ = Я4. 36
7. Проверить следующую таблицу размерностей классических алгебр Ли (как линейных пространств над соответствующими полями): gl (η, Ж) | si (л, Ж) л2 — 1 о (л, Ж) J u (n) J su (η) Λ (Λ— 1) Ι « 2 ι —^— - η2 л2 — 1 8. Пусть Л — квадратная матрица порядка я, ε — вещественная переменная, ε->0. Показать, что матрица U = £ -f* еЛ «унитарна с точностью до е2> тогда и только тогда, когда Л антиэрмитова: UU* = Ε + О (ε2) -ф> А +~А* = 0. Сформулировать и доказать аналогичные утверждения для других пар классических групп и алгебр Ли. 9. Пусть U = Ε + г А, V = Ε + еВ, где ε-*0. Проверить, что UVU-lV~l = Ε + ε2 [Л, В] + 0(е3) (выражение слева называется групповым коммутатором элементов ί/, V). 10. Ранг гкЛ матрицы над полем — это максимальное число ее линейно независимых столбцов. Доказать, что rk Af = dim Im f. Доказать, что квадратная матрица ранга 1 представляется в виде произведения столбца на строку. П. Пусть Л, В — матрицы над полем размеров т X л, Ш\ χ η\ и пусть зафиксированы нумерации всех тп элементов А и всех т\П\ элементов В (например, последовательно по строкам). Тензорное произведение, или произведение Кронекера, А ® В — это матрица размера тп X тхп\ с элементом а/*6/т на месте αβ, где α — номер α^, β — номер bim. Проверить следующие утверждения: а) A ® В линейно по каждому из аргументов, когда другой фиксирован. б) Если т = л, /л, = л,, то det (А ® В) = (det Л)т' (det B)m- 12. Сколько нужно операций, чтобы перемножить две большие матрицы? В следующей серии утверждений излагается метод Штрассена, позволяющий значительно сократить их число, если матрицы действительно большие. а) Умножение двух матриц порядка N обычным методом требует N3 умножений и N2(N — 1) сложений. б) Имеет место следующая формула умножения при N = 2, обходящаяся 7 умножениями (вместо 8) за счет 18 сложений (вместо 4), коммутативность элементов не предполагается: (_:_i)U _э- ((a + d)(A + D)-(b + d)(C+D)-d(A-C)-(a-b)D,(a-b)D-a(D-B)\ ~\(d-c)A--d(A-C),(a + d)№ + D)--{a + c){A + B)--a(D-B)--(d-c)A)· в) Применяя этот метод к матрицам порядка 2я, разбитым на четыре 2r,_1 X 2"_1-блока, показать, что их можно перемножить, применив 7п умножений и 6(7"— 4") сложений. г) Дополнив матрицы порядка N до ближайшего порядка 2п/ нулями, показать, что для их умножения достаточно ο0ν'°*'7) = ο0ν2·81) операций. Не удастся ли вам придумать что-нибудь лучшее? 13. Пусть L = Μ η (Ж) — пространство квадратных матриц порядка л. Доказать, что для любого функционала f ^ L* существует единственная матрица А^Мп(Ж) со свойством f(X) = Tr(AX) для всех X е Мп{Ж). Вывести отсюда существование канонического изоморфизма i?(L, L)-*[<? (L, L)]* для любого конечномерного пространства L. 37
14. Jif-алгеброй Ли называется линейное пространство L над Ж вместе с бинарной операцией (коммутатор): L χ £,->-£,, обозначаемой [ , ] и удовлетворяющей условиям: а) коммутатор [/, т] линеен по каждому из аргументов /, т е L при фиксированном другом аргументе; б) [/, т] = —[т, I] при всех /, т; в) [/ь [/2,/з]] + [h, [/ι, k]] + [h, [ht h]\ = 0 (тождество Якоби) при всех: /ι, /2, h e L. Проверить, что описанные в п. 11 классические алгебры Ли являются алгебрами Ли в смысле этого определения. Более общо, проверить, что коммутатор [X, У] = XY — YX в любом ассоциативном кольце удовлетворяет тождеству Якоби. § 5. Подпространства и прямые суммы 1. В этом параграфе мы изучим некоторые геометрические свойства взаимного расположения подпространств конечномерного пространства L. Поясним первую задачу на простейшем примере. Пусть Lu L{ cz L — два подпространства. Естественно считать, что они одинаково расположены внутри L, если существует такой линейный автоморфизм f: L-+L, который переводит L{ в LU Для этого, конечно, необходимо, чтобы dimL1 = dimIi, потому что / сохраняет все линейные соотношения и, значит, переводит базис L{ в базис L{. Но этого и достаточно. В самом деле, выберем базисы {βν \.., ет} в L{ и {е[, ..., е'т} в L[. По теореме п. 12 § 2 их можно дополнить до базисов {еи ..., ет, ет+\, ..., еп) й {е[, ..., е'т, е'т+[, ..., е'^ пространства L. По предложению п. 3 § 3 существует линейное отображение /: L-+L, переводящее βέ в е\ для всех /. Это отображение обратимо и переводит Ll в L(. Таким образом, все линейные подпространства одинаковой размерности одинаково расположены внутри L. Дальше естественно рассмотреть возможные расположения (упорядоченных) пар подпространств Lb L2czL. Как выше, будем говорить, что napbi(Lp L2) и (L{, ^)0Динаково расположены, если существует такой линейный автоморфизм /: L->L, что f{L{} = L[ f(L2) = L'2. Снова равенства dimLl = dimL[ и dimL2 = dimZ,2 являются необходимыми для одинаковой расположенности. Однако, вообще говоря, этих условий уже недостаточно. Действительно, если (li, L2) и (Li, L2) одинаково расположены, то / переводит подпространство Ll (] L2 в L\ f) L2, и потому необходимо также условие dim {U f| £2) = dim (Li Π ^)· Если dimLiu dim L2 фиксированы, но L\ и L2 в остальном произвольны, то dim(L\f\L2) может принимать, вообще говоря, целый ряд значений. Чтобы выяснить, какими они могут быть, введем понятие суммы линейных подпространств. 2. Определение. Пусть L\, ..., LnczL — линейные подпространства в L. Их суммой называется множество ■ за
Легко убедиться, что сумма также является линейным подпространством и что эта операция сложения ассоциативна и коммутативна, так же как и операция пересечения линейных подпространств. Другое описание суммы L\ -f- ... + Ln состоит в том, что это наименьшее подпространство в L, содержащее все Li. Следующая теорема связывает размерности суммы двух подпространств и их пересечения: __ 3. Теорема. Если Lu L2czL конечномерны, то L\(]L2 и L\ + L2 конечномерны и dim {Lx Π L2) + dim (L{ + L2) = dim L{ + dim L2. Доказательство. L\-\- L2 является линейной оболочкой объединения базисов L\ и L2 и потому конечномерно; L\ Π L2 содержится в конечномерных пространствах L\ и L2. Положим m = dim L\ f\L2y n= dim Lb ρ = dim L2. Выберем базис {ей ..., £m} пространства L\{\L2. По теореме п. 12 § 2 его можно дополнить до базисов пространств L\ и L2: пусть это будет {ev -··> *m> e'm+v ..., <} и {ev ..., em, е'т+{9 ..., етр}. Назовем такую пару базисов в L\ и L2 согласованной. Мы докажем сейчас, что семейство {ev ..., em, е'т+{, ..., еп, e"m+\i ···> ер} составляет базис пространства L\-\-L2. Отсюда будет следовать утверждение теоремы: dim(Li -\- L2)— р + η — т = dim/,! + dimL2"~ dimLi Л L2. Поскольку каждый вектор из L\ + ^2 есть сумма векторов из L{ и L% т. е. сумма линейных, комбинаций {ev ..., ет, e'm+v ... • · ·>β'η} и {βι> · · ·» em> e"m+v · · ·»' ep}' объединение этих семейств порождает L{ + £2. Поэтому остается лишь проверить его линейную независимость. Предположим, что существует нетривиальная линейная зависимость т η ρ Σ xfii + Σ у/, + h £ * a = о · Тогда обязательно должны существовать индексы / и &, для которых у ι Φ О и 2* =7^=0: иначе мы получили бы нетривиальную линейную зависимость между элементами базиса L\ или L2. Р Следовательно, ненулевой вектор Σ zke"k^L> должен ле- / т η \ жать также в Lb либо он равен—I У. х.е, + X у.е\ I. Значит, он лежит в Li Π ^2 и потому представим в виде линейной комбинации векторов {еи ··., ет}, составляющих базис L\ f\ L2. Но это представление дает нетривиальную линейную зависимость между векторами (е,, ..., ет, е^ + 1» ..., е'р), что противоречит их определению. Теорема доказана. S9
4. Следствие. Пусть П\ ^ п2 ^ η — размерности пространств L\t L2 и L соответственно. Тогда числа / = dimLlf|^2 и s = = dim(Li-\- L2) могут принимать любые значения, подчиненные условиям О <; ί ^ пх, п2 ^ 5 ^ η и i + s = п\-\- п2. Доказательство. Необходимость условий следует из включений L\f\L2czLu L2cz L\ + L2a L и из теоремы п. 3. Для доказательства достаточности выберем s = п\ + п2 — i линейно независимых векторов в L: \ev ..., е(\ e'i+v ..., е'п\ е".+{, ..., е"п^ и обозначим через Lb L2 линейные оболочки \ev ..., et; e'i+{, ..., e'ni} и \ev ..., et; e"i+{f ..., e"n^ соответственно. Как в теореме, нетрудно проверить, что L\{\L2 есть линейная оболочка {ей ..., £/}. 5. Теперь мы можем установить, что инварианты πι == dim Li, п2 = dimL2 и i = dim/,! f| L2 полностью характеризуют расположение пары подпространств (L\, L2) в L. Для доказательства возьмем другую пару (Li, L2) с теми же инвариантами, построим согласованные пары базисов для L\, L2 и L\, L2, затем их объединения — базисы L\ + L2 и L\ + L2t как в доказательстве теоремы п. 3, наконец, продолжим эти объединения до двух базисов L. Линейный автоморфизм, переводящий первый базис во второй, устанавливает одинаковость расположения L\, L2 и L\, L2. 6. Общее положение. В обозначениях предыдущего пункта будем говорить, что подпространства Lu L2cz L находятся в общем положении, если их пересечение имеет наименьшую, а сумма — наибольшую размерность, допускаемую неравенствами из следствия п. 4. Например, две плоскости в трехмерном пространстве находятся в общем положении, если они пересекаются по прямой, а в четырехмерном пространстве, — если они пересекаются по точке. Другой термин для того же понятия: L\ и L2 пересекаются трансверсально. Название «общее положение» обусловлено тем, что в некотором смысле большинство пар подпространств (L\,L2) находится в общем положении, а другие расположения являются вырожденными. Уточнить это утверждение можно разными способами. Один из них состоит в том, чтобы описать множество пар подпространств некоторыми параметрами и проверить, что пара не находится в общем положении, только если эти параметры удовлетворяют дополнительным соотношениям, которым общие параметры не удовлетворяют. Другой способ, который годится для Ж = R и С, состоит в следующем: выбрать в L некоторый базис, определить L\ и L2 двумя системами линейных уравнений и показать, что можно как угодно мало изменить коэффициенты этих уравнений («пошевелить L\ и L2») так, чтобы новая пара оказалась в общем положении. Можно было бы пытаться далее рассматривать инварианты, характеризующие взаимное расположение троек, четверок и большего числа подпространств з L. Комбинаторные трудности здесь 40
быстро растут, и для решения этой задачи нуэкна другая техника; кроме того, начиная с четверок, расположение перестает характеризоваться только дискретными инвариантами типа размерностей разных сумм и пересечений. Заметим еще, что, как показывает наша «физическая» интуиция, расположение, скажем, прямой относительно плоскости характеризуется углом между ними. Но, как мы отмечали в § 1, понятие угла требует введения дополнительной структуры. В чисто линейной ситуации есть только различие между «нулевым» и «ненулевым» углом. Теперь мы изучим один частный, но очень важный класс взаимных расположений /г-ок подпространств. 7. Определение. Пространство L является прямой суммой своих подпространств Lb ..., Ln, если каждый вектор I e L однозначно η представляется в виде Σ '*> где h ^ £*· i — \ Когда условия определения выполнены, мы пишем L = η = L\ Θ ... Θ Ln, или L = @Li. Например, если {е\, ..., еп} — η базис L, а Ц = Же^ — линейная оболочка вектора ей то £ = ©/^. η η Очевидно, если/, = ф/^, то L= Σ Li\ последнее условие является более слабым. 8. Теорема. Пусть L\t ..., LrtczL — подпространства в L. η L = ($)Ll тогда и только тогда, когда выполнено любое из сле- / = 1 дующих двух условий: η а) Σ Li = L и Lf Π (Σ Lt\ = ί°} для всех 1 </<η; ί=ι V/*/ ) η η б) Σ Li = L и Σ dim Lt = dim L (здесь предполагается, что L ί = 1 t=»l конечномерно). Доказательство, а) Однозначность представления любого η вектора /eL в виде Σ h> h^L, равносильна однозначности такого представления для нулевого вектора. В самом деле, если η η η Σ/ί=Σ^> το 0=Σ(^~~~Ό И наоборот. Если имеется нетри- г=1 i=l i=\ » η виальное представление 0 = Σ h> в котором, скажем, // Φ О, то ί = 1 //=— Σ ^^^/ΠΓΣ ^Λ> так что условие а) нарушено. Обра- ίφ] \ίΦ! ) щая это рассуждение, получаем, что из нарушения условия а) следует неоднозначность представления нуля.
η б) Если (J)Lj = Z,, то во всяком случае η η Y4Li = Lu Σ dimLt>dimL, потому что объединение базисов Ц порождает L и, значит, содержит базис L. По теореме п. 3, примененной к L\ и Σ Ζ^, имеем dimLyn^Z ^Л + dim L = dim Ly 4-dim Г Σ LiX Но размерность пересечения слева нулевая по предыдущему утверждению. Кроме того, если сумма всех Li прямая, то и сумма всех L/, кроме L/, прямая, и мы можем по индукции считать, что dim ( Σ Ζ,Λ = Σ dim Ζ^. Поэтому Σ dim Lt = dim L. Наоборот, если Σ dimLi = dimL, то объединение базисов всех i Li состоит из dimL элементов и порождает все L, а потому является базисом в L. В самом деле, нетривиальное представление η нуля 0=Σ'ί» U^Lh дало бы нетривиальную линейную комби- нацию элементов этого базиса, равную нулю, что невозможно. Рассмотрим теперь связь между разложениями в прямую сумму и специальными линейными операторами — проекторами. 9. Определение. Линейный оператор р: L-+L называется проектором, если р2 == ρ op =r p. Прямому разложению L = φ Li естественно сопоставляются п проекторов, которые определяются так: для любых // е Lj л ( Σ!'/)=//· Поскольку любой элемент /eL однозначно представляется в виде η Σ//> 'fSL, отображения pt определены корректно. Их линей- ность и свойство р2. = р. проверяются прямо из определения. Очевидно, Li = Impi. Сверх того, если / Φ /, то ριρ\ = 0: вектору U отвечает представ- п ление // = Σ h> гДе // = 0 при / φ /, // = Ζ/, /-ι η / η \ / η \ η Наконец, Σ Pt = id, ибо ί Σ Pi) [ Σ h )= .Σ '/» если h ^ £/· Наоборот, по такой системе проекторов можно определить отвечающее ей прямое разложение. 42
10. Теорема. Пусть р\у ..., рп: L-*L — конечное множество проекторов, удовлетворяющих условиям η Σ Pi — id» PiPf^Q при i Φ (. η Положим Ll = Impl. Тогда /, = ©£*· η Доказательство. Применяя оператор id = Σ pt к лю- i = l η бому вектору /е L, получим /= Σ Ρ* (Of гДе Pt(0e £*■ Поэтому Δ=Σ^ί·Λ·7151 доказательства того, что эта сумма прямая, при- меним критерий а) из теоремы п. 8. Пусть /^L/ΠίΣ L>i\ В силу определения пространств Li = Im pt существуют такие векторы 1и ..., /я, что / = Ρ/(//)=Σ Ρ/ (Μ· Применим к этому равенству оператор ру и воспользуемся тем, что pf = p}y pjPi = 0 при ιφ\. Получим Ρ/('/>=Σ PfPidi) = 0. . Следовательно, / = 0, что завершает доказательство. 11. Прямые дополнения. Если L — конечномерное пространство, то для любого подпространства L\cz L можно выбрать такое подпространство L2c:L, что L = L\^L2\ кроме тривиальных случаев L\ = {0} или L\ = L этот выбор неоднозначен. В самом деле, выбрав базис {вь ..., ет) в L\ и продолжив его до базиса {еи ... ..., ет, ет+\, ..., еп} в L, мы можем взять в качестве L2 линейную оболочку векторов {ет+и ..., еп}. 12. Внешние прямые суммы. До сих пор мы исходили из семейства подпространств Li, ..., Ln одного и того же пространства L. Пусть теперь Lb ..., Ln — пространства, не вложенные заранее в общее пространство. Определим их внешнюю прямую сумму L следующим образом; а) L как множество есть L\ X ... X Lrt, т. е. элементы L суть семейства (/ь ..., /л), где h^Li. б) Сложение и умножение на скаляр производятся покоординатно: (/ь ..., /я) + (/ь ..., /«) = (/ι + /ί. ..., /« + £), α (/ι. ···> (я) = (fl/i. ···> я**)· Нетрудно проверить, что L удовлетворяет аксиомам линейного пространства. Отображение Д·: L/->L, //(/) = (0, ..., 0,/, 0, ..., 0) 43
(/ на i-u месте) является линейным вложением Li в L, и из опре- п делений немедленно следует, что L = ф/* (L/). Отождествив Li с fi(Li), получим линейное пространство, в котором L, содержатся и которое разлагается в прямую сумму L,·. Это оправдывает название внешней прямой суммы. Часто удобно обозначать внешнюю η прямую сумму также φ Lt. η 13. Прямые суммы линейных отображений. Пусть L = @Li9 ί = 1 η Μ — @Mh f: L->M— такое линейное отображение, что f(Li)a t"= 1 cz Mi. Обозначим через fi индуцированное линейное отображение Li-^Mi. В таком случае принято писать f = ®fi. Аналогично i = l определяется внешняя прямая сумма линейных отображений. Выбрав в L и Μ базисы, являющиеся объединением базисов Li и Mi соответственно, мы получаем, что матрица f является объединением стоящих по диагонали блоков, которые представляют собой матрицы отображений /г, на остальных местах стоят нули. 14. Ориентация вещественных линейных пространств. Пусть L— конечномерное линейное пространство над полем вещественных чисел. Два упорядоченных базиса {е^ и {е'{} в нем всегда одинаково расположены в том смысле, что имеется единственный линейный изоморфизм f: L-+L, переводящий е{ в е\л Поставим, однако, более тонкий вопрос: когда можно перевести базис {ei) в базис {£,} непрерывным движением, или деформацией, т. е. найти тчакое семейство ft: L-+L линейных изоморфизмов, непрерывно зависящее от параметра t&[0, 1], что f0 = id,/1(£i) = £, для всех /? (Непрерывно зависеть от t должны просто элементы матрицы f в каком-нибудь из базисов.) Для этого имеется очевидное необходимое условие: поскольку при изменении t определитель ft меняется непрерывно и не проходит через нуль, знак det ft должен совпадать со знаком det/о = 1, т. е. det// > 0. Верно и обратное утверждение: если определитель матрицы перехода от базиса {е^ к базису \е'^ положителен, то {ei) можно перевести в \е'^ непрерывным движением. Это утверждение, очевидно, можно сформулировать иначе: любую вещественную матрицу с положительным определителем можно соединить с единичной матрицей непрерывной кривой, со- стоящей из невырожденных матриц (множество вещественных невырожденных матриц с положительным определителем связно). Чтобы перейти от языка базисов к языку матриц, достаточно работать не с парой базисов {ei), {ft(ei)}, а с матрицей перехода от первого ко второму. Мы докажем это утверждение, разбив его на серию шагов. 44
а) Пусть A = Βχ ... Вп, где Л, β,- — матрицы с положительными определителями. Если все Bj можно соединить с Ε непрерывной кривой, то это верно и для А. Действительно, пусть 5/(0 — такие непрерывные кривые в пространстве невырожденных матриц, что 5/(0) = 5/, 5/(1) = Е. Тогда кривая А(0 = 5ι(0 ... Bn(t) соединяет А с Е. б) Если А можно соединить непрерывной кривой с 5, а В с Е, то можно соединить А с Е. Действительно, если A(t) такова, что Л(0) = Л, Л(1)=5, и 5(0 такова, что 5(0) = 5, 5(1) = £, то кривая (A(2t) при 0 </<1/2, /ьЧ5(2/-1) при 1/2<*<1 соединяет А с Е. Трюк с изменением масштаба и начала отсчета / использован лишь потому, что мы условились параметризовать кривые матриц числами /е[0, 1]. Очевидно, можно пользоваться любыми промежуточными интервалами параметризации, проводить последовательно все нужные деформации и менять масштаб лишь в конце. Поэтому дальше мы не будем заботиться об интервалах параметризации. в) Любую квадратную невырожденную матрицу А можно представить в виде произведения конечного числа элементарных мат- риц следующих типов: Fs,t, Fs, /(λ), FS(X), λ^ R. Обозначим через Est матрицу с единицей на честе (s, 0 и нулями на остальных местах. Тогда по определению Fs,t = Е — Ess — Ett + Est + Ets; Fs.t (λ) = Ε + λΕ$ΰ Fs(λ) = Ε + (λ - Ι) Ε88. Этот результат доказан в книге «Введение в алгебру», гл. 2, § 4, следствие из теоремы п. 5. г) Пусть теперь матрица А представлена в виде произведения элементарных матриц. Предполагая ее определитель положительным, покажем, как соединить ее с £ с помощью нескольких последовательных деформаций, пользуясь результатами шагов а) и б). Прежде всего, detFs, /(λ)= 1 при всех λ и FS}t(0) = E. Меняя в исходных сомножителях λ от начального значения до нуля, мы можем деформировать все такие множители в £, так что можно считать, что их нет с самого начала. Матрицы /^(λ) диагональны: на месте (5,5) стоит λ, на остальных— единицы. Изменим λ от начального значения до +1 или —1 в соответствии со знаком начального значения. Результатом деформации будет либо единичная матрица, либо матрица линейного отображения, меняющего один из базисных векторов на противоположный и оставляющий остальные на месте. Результатом деформации А на этом этапе будет матрица композиции двух преобразований: одно сводится к перестановке векторов базиса (Fs, t меняет местами 5-й и t-й вектор), другое меняет знаки части векторов (композиция Fs(4-1) и Ft(—1)). 45
Любую перестановку можно разложить в произведение попарных перестановок. Матрицу перестановки векторов .базиса в пло- /0 \\ / — 1 о\ „ /—cos/ sin*\ скости [{ 0) можно соединить с ( Q J кривой ( sin/ cos J, π/2 ^ ί ^ 0. Очевидно, разнеся элементы последней матрицы по местам (5,5), (5, t), (t,s), (t,t), получим соответствующую деформацию в любой размерности, уничтожающую множители Fs, и К этому моменту А превратилась в диагональную матрицу с элементами ±1 на диагонали, причем число минус единиц четно, ибо определитель А положителен. Матрицу [ Q _ι) можно сое- (1 0\ „ /cos t — sin t\ ^ , ^ ~ ^ ^ 1 0 j J кривой I ^ cos / J' π ^ ^ Собрав все —1 попарно и проведя такие деформации всех пар, мы завершим доказательство. Вернемся теперь к ориентации. Будем говорить, что базисы {ej, \е'^ одинаково ориентированы, если определитель матрицы перехода от одного из них к другому положителен. Ясно, что множество упорядоченных базисов L разбивается в точности на два класса, состоящих из одинаково ориентированных базисов, тогда как базисы из разных классов ориентированы по-разному (или противоположно). Выбор одного из этих классов называется ориентацией про- странства L. Ориентация одномерного пространства соответствует указанию «положительного направления в нем» или полупрямой R+e = {ае\а > 0}, где е — любой вектор, определяющий ориентацию. В двумерном пространстве задание ориентации с помощью базиса {еие2} можно представлять себе к&к указание «положительного направления вращения» плоскости от в\ к е2. Это интуитивно согласуется с тем, что базис {е2, е\} задает противоположную ориентацию (определитель матрицы перехода L QJ равен —1) и противоположное направление вращения. В общем случае переход от базиса {ei} к базису {g/}, состоящему из тех же векторов, но в другом порядке, сохраняет ориентацию, если перестановка четная., и меняет ее, если перестановка нечетная. Замена знака у одного из векторов ei меняет ориентацию на противоположную. В трехмерном физическом пространстве выбор конкретной ориентации может быть связан с физиологическими особенностями человека — асимметрией правой и левой стороны. Левая сторона — это та, где у подавляющего большинства людей находится сердце. Большой, указательный и средний пальцы левой руки, согнутые по направлению к ладони, в линейно независимом положении образуют упорядоченный базис, фиксирующий ориентацию («правило левой руки»). Вопрос о том, существуют ли чисто физические процессы, позволяющие выбрать ориентацию пространства, т. е. 46
«неинвариантные относительно зеркального отражения», был решен около двадцати лет назад положительно, ко всеобщему изумлению, экспериментом, установившим несохранение четности в слабых взаимодействиях. УПРАЖНЕНИЯ 1. Пусть (L\t L2, Lz) — упорядоченная тройка плоскостей в Ж3, попарно различных. Доказать, что имеются два возможных типа взаимного расположения таких троек, характеризующихся тем, что dim L\ Π L2{\ ^з = 0 или 1. Какой из этих типов следует считать общим? 2. Доказать, что тройки попарно разных прямых в Ж3 все одинаково расположены, а для четверок это уже неверно. 3. Пусть L\ cz L2 cz ... cz Ln — флаг в конечномерном пространстве L, mt = dim Ц. Доказать, что если Lxa...czLn—другой флаг, mi = dimLi, то автоморфизм L, переводящий первый флаг во второй, существует тогда и только тогда, когда mi = mi для любого L 4. То же для прямых разложений. 5. Доказать утверждения пятого абзаца п. 6. в. Пусть р: L-+L — проектор. Доказать, что £ = КегрФ1тр. Вывести отсюда, что в подходящем базисе L любой проектор ρ представлен матрицей вида (ЕЛ*\ \т\е)· где г = dim Im p. 7. Пусть L — n-мерное пространство над конечным полем из q элементов а) Вычислить количество ^-мерных подпространств в L, 1 ^ k ^ п. б) Вычислить количество пар подпространств L\, L2cz L с данными размерностями L\K L2 и L\ Π L2. Убедиться, что при q-+<x> доля этих пар, находящихся в общем положении, среди всех пар с данными dim Lu dim L2 стремится к 1. § 6. Факторпространства 1. Пусть L — линейное пространство, Μ cz L — его линейное подпространство, a /ei — вектор. Различные вопросы приводят к рассмотрению множеств вида / + M = {i + m|me=M}, «сдвигов» линейного пространства Μ на вектор /. Вскоре мы убедимся, что такие сдвиги не обязаны быть линейными подпространствами в L; их называют линейными подмногообразиями. Начнем с доказательства следующей леммы. 2. Лемма, h + Λίι = l2 + М2 тогда и только тогда, когда Λ1ι = М2 = Μ и 1\ — ί2εΜ. Таким образом, всякое линейное подмногообразие однозначно определяет линейное подпространство М, сдвигом которого оно является. Вектор же сдвига определяется лишь с точностью до элемента из этого подпространства. Доказательство. Прежде всего, пусть 1\ — 12^М. Положим U — 12 = шо. Имеем Ιχ + Μ -= {/, + mI m €= Μ}, /2 + Λί = {/, + m - m01 m e= Λί}. Но когда tn пробегает все векторы из М, m — m0 тоже пробегает все векторы из Λί. Поэтому U -\- Μ = U -j- Λί, 47
Наоборот, пусть 1\ + Μι = /2 + Λί2. Положим m0 = d — /2·' Из определения ясно, что тогда /η0 + Λίι = Λί2. Так как 0еМ2,,мы должны иметь /ηο^Λϊι. Значит, m0 + Ai1=Mi по рассуждению в предыдущем абзаце, так что Λίι = Λί2.= Λί. Это завершает доказательство. 3. Определение. Факторпроетранством L/M линейного пространства L по Μ называется множество всех линейных подмногообразий в L, являющихся сдвигами подпространства Λί, со следующими операциями: а) (/i + M) + (/2 + M) = (/1 + /2)+M, б) α (/ι + Λί) = ah + Μ для любых /ь /2eL, а^Ж. Эти операции определены корректно и превращают L/M в линейное пространство над полем Ж. 4. Проверка корректности определения. Она состоит из следующих шагов: а) Если /,+Λί = /Ί + Λί и /·2 + Λί = /2 + Λί, то /1 + /, + Λί = = 1\ + 1'2 + М. В самом деле, из леммы п. 2 следует, что/j —/ί = mi ^Λί и L— — l2 = ni2^ M. Поэтому снова по лемме п. 2 (/ι + k) + Λί = (/Ί + й) + (mi + /112) + Λί = (/Ι Η- /ί) + Μ, ибо m\ + m2 e M. б) £сли /ι + Μ = /ι + Λί, mo all + Λί = α/ί + Λί. В самом деле, снова полагаяU — l\ = me Λί, имеем α/ι — α/Ί= = атеЛ4, и применение леммы п. 2 дает требуемое. Таким образом, сложение и умножение на скаляр действительно однозначно определены в L/M. Остается проверить аксиомы линейного пространства. Но они сразу же следуют из соответствующих формул в L. Например, одна из формул дистрибутивности проверяется так: α [(/ι + Μ) + (l2 + M)l=a((l{ + /2) + Μ) = α(Ιι + /2) + Λί = = α/, + al2 + Μ = (α/, + Λί) + (al2 + Λί) = α (/, + Λί) + α(12 + Λί). Здесь последовательно используются: определение сложения в L/Λί, определение умножения на скаляр в L/Λί, дистрибутивность в L и снова определение сложения и умножения на скаляр в L/M. 5. Замечания, а) Из определения видно, что аддитивная группа L/Λί совпадает с факторгруппой аддитивной группы L по аддитивной группе Λί. В частности, подмногообразие Λί cz L является нулем в L/M. б) Имеется каноническое отображение /:L->L/Ai: /(/) = /-(- Λί. Оно сюръективно, а его слои — прообразы элементов — суть как раз подмногообразия, отвечающие этим элементам. Действительно, по лемме п. 2 f-l(l0 + M) = {leEL\l^M = lQ + M} = {le-L\l-loeEM} = lQ-\-M, 4$
Заметим, что в этой цепочке равенств 10 + М первый раз рассматривается как элемент множества L/M, а остальные — как подмножества в L. Из п. 4 ясно, что / — линейное отображение, а лемма п. 2 показывает, что Кег/=М, ибо 1о + М = М тогда и только тогда, когда /о ^ М. 6. Следствие. Если L конечномерно, то dim L/M = dim L — — dim Μ. Доказательство. Применить теорему п. 12, § 3 к построенному отображению L-+L/M. Многие важные задачи в математике приводят к ситуации, когда пространства Μ cz L бесконечномерны, а факторпростран- ство L/M конечномерно. В этом случае пользоваться следствием п. 6 нельзя, и вычисление dim L/M обычно становится нетривиальной задачей. Число dim L/M вообще называется коразмерностью подпространства Μ в L и обозначается codimAf или codimLAi. 7. Поставим следующую задачу: даны два отображения f: L-* Μ и g: L-*N\ когда существует такое отображение Л: M-+Nt что g = hf? На языке диаграмм: когда можно вложить диаграмму А м ы в коммутативный треугольник L (ср. § 13 о коммутативных диаграммах). Ответ для линейных отображений дается следующим результатом. 8. Предложение. Для существования h необходимо и достаточно, чтобы Ker fez Ker g; если это условие выполнено и Imf = M, то h единствен. Доказательство. Если h существует, из g = hf следует, что g(l) = hf(l) = 0, коль скоро f(l) = 0. Поэтому Ker/czKerg. Наоборот, пусть Ker/czKerg. Построим сначала h на подпространстве Im/cziM. Единственная возможность состоит в том, чтобы положить h(m) = g(l), если m = f(l). Нужно проверить, чтр h определено однозначно и линейно на Im/. Первое следует из того, что если m = f(h) = f (/2), то 1\ — /2е Ker \a Ker g, откуда g(l{) = g(l2). Второе следует автоматически из линейности / и g. Теперь достаточно продолжить отображение h с подпространства ImfczM на все пространство М, например, выбрав базис Im/, дополнив его до базиса Μ и положив h равным нулю на дополняющих векторах. 49
9. Пусть g: L-+M — линейное-отображение. Мы уже определили ядро и образ g; дополним это определение, положив кообраз g: Coim g = L/Ker g, коядро g: Coker g = M/lmg. Имеется цепочка линейных отображений, «разбирающая g на части», Kerg-J^Z -^ Coling-^- fog· J-^Ж-^ Coker g*, где все отображения, кроме Л, — канонические вложения и факторизация, a h — единственное отображение, делающее коммутативной диаграмму /N Coimg *~ ling* Оно определено однозначно, потому что Kerc = Kerg, и является изоморфизмом, потому что обратное отображение тоже существует и определено однозначно. Смысл объединения этих пространств в пары (с приставкой «ко» и без нее) объясняется в теории двойственности (см. следующий параграф и упражнение 1 к нему). 10. Конечномерная альтернатива Фредгольма. Пусть g: L-> ->Λί— линейное отображение. Число ind g = dim Coker g —- dim Ker g называется индексом оператора g. Из предыдущего пункта следует, что если L и Μ конечномерны, то индекс g зависит только от L и М: ind g = (dim Μ — dim Im g) — (dim L — dim Im g) = dim Μ — dim L. В частности, если dimAi = dimL, например, если g — линейный оператор на L, то ind g = 0 для любого g. Отсюда вытекает так называемая альтернатива Фредгольма: либо уравнение g(x) = у разрешимо для всех у, и тогда уравнение #(*) = 0 имеет лишь нулевые решения; либо это уравнение разрешило не для всех у, и тогда однородное уравнение g(x) = 0 имеет ненулевые решения. Точнее, если ind g = 0, то размерность пространства решений однородного уравнения равна коразмерности пространства правых частей, при которых разрешимо неоднородное уравнение. W
УПРАЖНЕНИЯ 1. Пусть Μ, Ν с: L. Доказать, что следующее отображение является линейным изоморфизмом: (M + N)/N->M/M[\N: т + п + N *—> т + M[\N. 2. Пусть L = Μ θ N. Тогда каноническое отображение M-+L/N: m\-^m + N является извморфизмом. § 7. Двойственность 1. В § 1 мы поставили в соответствие каждому линейному про* странству L двойственное к нему пространство L* = 2?{Ь,Ж), а в § 3 показали, что если dim L < со, то dim L* = dim L, и построили канонический изоморфизм εζ.: L-+L%*. Здесь мы продолжим описание Двойственности, включив в рассмотрение линейные отображения, подпространства и факторпространства. Теория двойственности получила свое название благодаря тому, что она выявляет ряд свойств «двусторонней симметрии» линейных пространств, довольно трудных для наглядного воображения, но совершенно фундаментальных. Достаточно сказать, что дуализм «волна — частица» в квантовой механике адекватно выражается именно на языке линейной двойственности бесконечномерных линейных пространств (точнее, соединения линейной и групповой двойственности в технике анализа Фурье). Удобно следить за этой симметрией, несколько изменив обозначения, принятые в § 1 и 3. 2. Симметрия между L и L*. Пусть !gL, /eL*. Вместо /(/) мы будем писать (/, /') (в знак аналогии со скалярным произведением— йо векторов из разных пространств!). Таким образом, мы определили отображение L*XL->Jif. Оно линейно по каждому из двух аргументов /, /при фиксированном втором: (fi + f2> Ζ)-(Λ. О+ (fa. О, (afl9 0 = a(fu /), (f, /i + /a)»(f. /i) + (f, «, (f, o/,)-a(ff h). Вообще, отображения LXM->Ji? с таким свойством называются билинейными, а также спариваниями между пространствами L и М. Введенное выше спаривание между L и L* называется каноническим (ср. обсуждение этого слова в § 3, п. 8). Отображение ει: L-+L** из § 3, п. 10, как видно из его определения, можно задать условием: (Ч(0> /)-</, 0. где слева стоит символ спаривания между L** и L*, а справа — между L* и L. Если dim L < оо, так что ει является изоморфизмом, и мы условимся отождествлять L** и L посредством ει, эта формула приобретает симметричный вид (/,/) = (/,/). Иными словами, мы можем также рассматривать L как пространство, двойственное к ΖΛ 51
3. Симметрия между двойственными базисами. Пусть {е\, ... ..., вп} —базис в L, {е\ ..., еп}—двойственный базис в ΖΛ Согласно п. 9 § 3 он определяется формулами при / φ ky при i = k. Симметрия (е1, ^) = (^, е1) в соглашениях предыдущего пункта означает, что базис (ek) двойствен к базису (е')> если L рассматривать как пространство линейных функционалов на ΖΛ Таким образом, (е1) и (ей) образуют двойственную пару базисов, и это отношение симметрично. η Представим вектор /*gL* в виде линейной комбинации Σ ^'> t = l а вектор /gL в виде Σ ajer Тогда /-ι (/*, 0= Σ α/Μ*', β/)=Σ«Α = («ι» ···> β«) ί./-=1 ί = 1 ! frrt> = (α0& = (&0α = (&1, ..., Ц j ) = (/, Γ), -> -> где α, & — вектор-столбцы соответствующих коэффициентов. Эта формула совершенно аналогична формуле для скалярного произведения векторов в евклидовом пространстве, однако связывает в этой ситуации векторы из разных пространств. 4. Двойственное, или сопряженное отображение. Пусть f: L -> ->М — линейное отображение линейных пространств. Мы покажем сейчас, что существует единственное линейное отображение f*: M*-+L*y которое удовлетворяет условию (f(m*), l) = (m',f(l)) для любых векторов т* ^ М*, I ^ L. а) Единственность /*. Пусть f*y f\ — два таких отображения. Тогда (/; (/и*), /) = (m\ f (/)) = (f*2 (m*), I) для всех т*е=ЛГ, / е= L, откуда следует, что((/* —/*>)(т*),/) = 0. Фиксируем т* и будем менять /. Тогда элемент(/* — ^МеГ как линейный функционал на L принимает только нулевые значения и, значит, равен нулю. Поэтому f\ = f*,. б) Существование /*. Фиксируем ш* eAf и рассмотрим выражение (т*,/(/)) как функцию на L. В силу линейности / и билинейности (,) эта функция линейна. Значит, она принадлежит ΖΛ Обозначим ее через f*(m*). Равенства Г (w; + wj) = Г (mj) + Г К), Г (^*) = аГ (тГ) 52
следуют из линейности (at?*, f(l)) по т*. Значит, f*—линейное отображение. Пусть в L, W выбраны некоторые базисы, а в L*, М* — двойственные базисы. Пусть f в этих базисах представлено матрицей А Мы утверждаем, что /* в двойственных базисах представлено транспонированной матрицей А*. В самом деле, пусть В— матрица /*. Согласно определениям и п. 3 имеем, обозначив вектор-столбцы > -> координат т*, I через а, 6, (т\ f (/))=VUS), (Р (m*), /) = (δα)' 6 = (α'β*) 6. Из ассоциативности умножения матриц и единственности /* следует, что Л = В\ т. е. В = А1. Основные свойства сопряженных отображений собраны в следующей теореме: 5. Теорема, а) (/ + g)* = /* + g*; б) (afy = af*\3decbf,g:L-+Muae=X\ в) (fg)* = g*f*-y здесь L-^M-t+N; г) id* == id, 0* = 0; д) если канонически отождествить L** с L и М** с М, то f**: L** ->■ М** отождествляется с f: L-+M. Доказательство. Если считать, что L и Μ конечномерны, то проще всего проверить все эти утверждения, представив /, g матрицами в двойственных базисах и воспользовавшись простыми свойствами операции транспонирования: (аА + ЬВ)* = аА' + ЬВ*, (АВ)* = В*А*9 Е* = Е, 0' = 0, (Л')' = 0. Инвариантную проверку мы оставляем читателю в качестве упражнения. 6. Двойственность между подпространствами в L и в L*. Пусть MczL — некоторое линейное подпространство. Обозначим через М1 cz L* и будем называть ортогональным дополнением к Μ множество функционалов, обращающихся в нуль на М. Иными словами, т* е Λί1 <=> (пг*у т) = 0 цля всех шеМ. Легко видеть, что Λί1 является линейным пространством. В следующих утверждениях собраны основные свойства этой конструкции (L предполагается конечномерным). а) Имеется канонический изоморфизм L*/AfJ-->Af*. Строится он так: многообразию Γ + Λ11 ставится в соответствие ограничение функционала /* на М. От выбора /* оно не зависит, ибо ограничения функционалов из Λί1 на Μ нулевые. Линейность этого отображения очевидна. Оно сюръективно, ибо всякий линейный функционал на Μ продолжается до некоторого функционала на L. В самом деле, пусть {ей · ·, #т} — базис в Λί, {еи ..., ет> ет+и ...,*£/г}—его продолжение до базиса L. Функционал / на М, 53
заданный значениями f(e\), ..., f(en), продолжается на L, например, если положить f(em^ \)= ... = }(еп) = 0. Наконец, построенное отображение L*/ML-**M* инъективно. В самом деле, у него нулевое ядро: если ограничение /* на Μ равно нулю, то 1*^Μλ и /* + М1 = М1 — нулевой элемент из L*/ML. б) dim Μ + dim Λί1 = dim L. Действительно, это следует из предыдущего утверждения, следствия п. 6 § 6 и того, что dimL* = = dim L, dim M* = dim Μ. в) При каноническом отождествлении L** с L пространство (Λί1)1 совпадает с М. Действительно, так как (m*, m) = 0 для всех т* и данного т&М, ясно, что Μcz(ML)L. Но, кроме того, по предыдущему свойству, примененному дважды, dim (Λί1)1 = dim L — dijn Λί1 = dim Λί. Значит, M=* (Μ1)1. г) (Λί, + М2у- = Μ1 П Λί1; (Λί, П Μ2)± = Λί1 + Λί1. Доказательство предоставляется читателю в качестве упражнений. УПРАЖНЕНИЯ 1. Пусть с линейным отображением g: L-+M конечномерных пространств связана цепочка отображений, построенных в п. 8 § 6. Построить канонические изоморфизмы Кег g* -> Coker g, Coim g* -> Im g, Im g* -> Coim g} Coker g* -> Ker g. 2. Вывести отсюда «третью теорему Фредгольма>: для того чтобы уравнение g(x)= у было разрешимо (по χ при данном у), необходимо и достаточно, чтобы у был ортогонален к ядру сопряженного отображения g*: Λί*-*ΖΛ f 8 3. Последовательность линейных пространств н отображений L —► Μ —► N называется точной в члене М, если Im f *= Ker g. Проверить следующие утверждения: а) Последовательность 0—>L—> Μ точна в члене L тогда и только тогда, когда / — инъекция. а б) Последовательность Λί —> N —>► 0 точна в члене N тогда и только тогда, когда g — сюръекция. f 8 в) Последовательность конечномерных пространств 0 —* L —> Μ —► а —> N—► 0 точна (во всех членах) тогда и только тогда, когда точна двой- 8,* f* ственная последовательность 0 —>► N* —~> Λί* —>► L* —> 0. 4. Мы знаем, что если отображение f: L-+M в некоторых базисах представлено матрицей А, то отображение f* в двойственных базисах представлено матрицей Л'. Вывести отсюда, что ранг матрицы совпадает с рангом транспонированной матрицы, т. е. что максимальные числа линейно независимых строк и столбцов матрицы совпадают. § 8. Структура линейного отображения 1. В этом параграфе мы начнем изучать следующую задачу: возможно яснее геометрически представить себе устройство линейного отображения /: L-+M. Ответ совсем прост, когда L и Μ никак 54
не связаны друг с другом: он дается теоремой из п. 2 этого параграфа. Гораздо интереснее и многообразнее получается картина, когда Μ = L (этот и следующий параграфы) и Μ = L* (следующая часть). На матричном языке речь идет о приведении матрицы / к возможно более простой форме с помощью подходящего, специально приспособленного к структуре f, базиса. В первом случае базисы в L и Μ можно выбирать.независимо, во втором речь идет об одном базисе в L или о базисе в L и двойственном к нему базисе L*: меньшая свобода выбора приводит к большему разнообразию ответов. На языке § 5 нашу задачу можно переформулировать следующим образом. Построим внешнюю прямую сумму пространств L9M и поставим в соответствие отображению / его график Г^ множество всех векторов вида (/,/(/))^ L®M. Легко убедиться, что Ff есть линейное подпространство в L Θ Μ. Нас интересуют инварианты расположения Г/ в L® Μ. Для случая, когда базисы в L и Μ можно выбирать независимо, ответ дается следующей теоремой. 2. Теорема. Пусть /: L-*~M — линейное отображение конечно* мерных пространств. Справедливы следующие утверждения: а) Существуют такие прямые разложения L = Lo® Lu M = = М\@ М2, что Кег / = Lo и f индуцирует изоморфизм L\ с Мь б) Существуют такие базисы в L и М, что матрица f в этих базисах имеет вид (а«·/), где аи = 1 для 1 ^ i ^ г и ац — О для остальных i, /. в) Пусть А—некоторая матрица размера mXn. Тогда существуют такие невырожденные квадратные матрицы В и С размеров mY^m и пХп и такое число r^min(m, n), что матрица ВАС имеет вид, описанный в предыдущем пункте. Число г определено однозначно и равно рангу Л. Доказательство, а) Положим L0 = Ker/, а в качестве Ly выберем прямое дополнение к Lot это возможно в силу п. 10 § 5. Затем положим Mi = Im f, а в качестве М2 выберем прямое дополнение к Μι. Нужно лишь проверить, что / определяет изоморфизм L\ с Μι. Отображение f: L\-*Mi инъективно, потому что ядро /, т. е. Lo, пересекается с L\ лишь по нулю. Оно сюръективно, потому что если 4 = /о + l\ e L, /0e£o, /ieLb то /(/) = /(/ι). б) Положим г = dimLi = dimMi и выберем в L базис {еь ···> ег, вг+и ··.·> еп}> где первые г векторов образуют базис Lb а следующие — базис L0. Далее, векторы е\ = f (£,), 1 <; i ^ г, образуют базис в Mi = Imf. Дополним его до базиса Μ векторами К+р ···> е'т}- Очевидно, f{el9 ..., er;er+l9 ..., еп) = (е[у ..., <; 0, ..., 0) = {ffp · · · > <v> *г+р · · · > ^mJ ^ q I о ^ ι так что матрица / в этих базисах имеет требуемый вид. v 55
в) Построим по матрице А линейное отображение / координатных пространств Жп-+Жт с этой матрицей, затем применим к нему утверждение б). В новых базисах матрица / будет иметь требуемый вид и выражаться через А в виде ВАС, где В, С — матрицы перехода: см. п. 8 § 4. Наконец, rk А = гк ВАС = rk f = = dim Im/. Это завершает доказательство. Теперь перейдем к изучению линейных операторов. Начнем с введения простейшего класса: диагонализируемых операторов. Назовем в общем случае подпространство L0czL инвариантным относительно оператора /, если /(L0)cz L0. 3. Определение. Линейный оператор f: L-+L называется диаго- нализируемым, если выполнено любое из двух равносильных условий: а) L разлагается в прямую сумму одномерных инвариантных подпространств; б) существует базис L, в котором матрица оператора f диаго- нальна. Равносильность этих условий проверяется без труда. Если в базисе (е,·) матрица оператора / диагональна, то /(£/) = λ,-e,·, так что одномерные подпространства, натянутые на еи инвариантны и L разлагается в их прямую сумму. Наоборот, если L = φ ^ι — такое разложение и et — любой ненулевой вектор из L/, то {ei) образуют базис в L. Диагонализируемые операторы образуют простейший и во многих отношениях самый важный класс. Например, над полем комплексных чисел, как мы убедимся, любой оператор можно делать диагональным, как угодно мало изменив его матрицу, так что оператор «в общем положении» диагонализируем. Чтобы понять, что может помешать оператору быть диагонализируемым, введем два определения и докажем одну теорему. 4. Определение. 1) Одномерное подпространство L\cnL называется собственным для оператора f, если оно инвариантно, т. е. f(L{)czLi. Если L[ — такое подпространство, то f действует на нем как умножение на скаляр Х^Ж. Этот скаляр называется собственным значением оператора f (на L\). б) Вектор I e L называется собственным для /, если линейная оболочка Ж1 является собственным подпространством. Иными словами, ΙΦ О и I (/) = XI для подходящего Х^Ж. Согласно определению п. 3, диагонализируемые операторы / допускают разложение L в прямую сумму своих собственных подпространств. Выясним, когда у / имеется хотя бы одно собственное подпространство. 5. Определение. Пусть L — конечномерное линейное пространство, f: L-+L — линейный оператор, А — его матрица в каком-нибудь базисе. Обозначим через P(t) и назовем характеристическим многочленом оператора /, а также матрицы А, многочлен det (tE— А) с коэффициентами в поле Ж (det — определитель\, W
6. Теорема, а) Характеристический многочлен линейного оператора ι не зависит от выбора базиса, в котором представлена его матрица. б) Любое собственное значение оператора является корнем P(t) и любой корень P(t), лежащий в Ж, является собственным значением для /, отвечающим некоторому (не обязательно единственному) собственному подпространству в L. Доказательство, а) Согласно п. 8 § 4 матрица оператора / в другом базисе имеет вид В~ХАВ. Поэтому, пользуясь мультипликативностью определителя, находим det (tE — β""1 ΑΒ) = det (β"1 (tE -A)B) = = (det β)""1 det (tE - A) det В = det (tE - A). Заметим, что P(t) = tn — Trf-tn-{ + ... +(—l)"det/ (обозначения из п. 9 § 4). б) Пусть Х^Ж— корень P(t). Тогда отображение λ-id — / представлено вырожденной матрицей и, значит, имеет нетривиальное ядро. Пусть 1Ф0 — элемент из ядра; тогда /(/) = λ/, так что λ есть собственное значение для /, а / — соответствующий собственный вектор. Наоборот, если /(/)=λ/, то / лежит в ядре λ-id — /, так что det(λ·id — /)=Ρ(λ) = 0. 7. Теперь мы видим, что оператор / вообще не имеет собственных значений и тем более не диагонализируем, если его характеристический многочлен P(t) не имеет корней в поле Ж. Это вполне может случиться над алгебраически не замкнутыми полями такими, как R и конечные поля. Например, пусть А= ( а d J — матрица с вещественными элементами. Тогда det (tE — A) = t2 — (а + d)t + (ad - be), и если (a + d)2— 4(ad — be) = (a — d)2-f-4&c < 0, то А недиаго- нализируема. Таким образом, мы впервые столкнулись здесь со случаем, когда свойства линейных отображений существенно зависят от свойств поля. Чтобы не принимать последние во внимание как можно дольше, в следующем параграфе до п. 9 мы будем предполагать, что поле Ж является алгебраически замкнутым. Читатель, не знакомый с другими алгебраически замкнутыми полями, кроме С, можег всюду считать, что Ж = С. Алгебраическая замкнутость Ж равносильна любому из двух* условий: а) любой многочлен от одной переменной P(t) с коэффициентами в Ж имеет корень К^Ж\ б) лю- η бой такой многочлен P(t) может быть представлен в виде α Π С — — Я^)г'»где α, \[^Ж\ λΐφλϊ при ίφ]\ это представление однозначно, если Ρ(ί)Φ0. В этом случае число г/ называется кратностью корня λ/ многочлена P(t). Множество всех корней характе- 57
ристического многочлена называется спектром оператора /. Если все кратности равны I, говорят, что / имеет простой спектр. Если поле Ж алгебраически замкнуто, то согласно теореме п. 6 любой линейный оператор /: L-*L имеет собственное подпространство. Однако он все равно может оказаться недиагонализируемым, ибо сумма всех собственных подпространств может оказаться меньше L, тогда как у диагонализируемого оператора она всегда равна L. Прежде чем переходить к общему случаю, разберемся с комплексными 2Х 2-матрицами. 8. Пример. Пусть L — двумерное комплексное пространство с базисом, оператор /: L-*L представлен в этом базисе матрицей =( а -У Характеристический многочлен для /равен /2—(a-\-d)t+ + (ad—bc)y его корни суть λΙ,2 = — ^—±Л/ 4 + be . Рассмотрим отдельно следующие случаи: а) Х\фХ2. Пусть ех — собственный вектор для λι, е2 — для λ^. Они линейно независимы, потому что если ае\ -f- Ье2 = 0, то / (ае{ + Ье2) =* аХхех + ЬХ2е2 = О, откуда λ! (аех + Ье2) — (аХхе\ + ЬХ2е2) = b (λι — λ2) e2 = 0, т. е. b = О и аналогично а = 0. Следовательно, в базисе {ей е2} матрица / диагональна. б) λι = λ2 = λ. Здесь оператор / диагонализируем, только если он умножает на λ все векторы из L: это значит, чтоГ л ) = ( л λ)' т. е. а = d = λ, b = с = 0. Если же эти условия не выполнены, а выполнено только более слабое условие (а — d)2 + 4bc = 0, гарантирующее, что λι==λ2, то у оператора / может быть, с точностью до пропорциональности, только один собственный вектор и / заведомо не диагонализируем. Пример такой матрицы: Г Q А. Эта матрица называется жор- дановой клеткой размера 2 X 2 (или ранга 2). В § 9 мы покажем, что именно такие матрицы образуют «строительные блоки» для нормальной формы общего линейного оператора над алгебраически замкнутым полем. Дадим общее определение: 9. Определение, а) Жардановой клеткой ]Г(Х) размера гХ,г с собственным значением λ называется матрица вида (X 1 О ...0\ °.ν.·:\° Ι 0 0 0 ... λ/ б) Жордановой матрицей называется матрица, состоящая из диагональных блоков 1Г{ (Χι) и нулей вне этих блоков: / = (ММ 0 0 ММ" 58
в) Жордановым базисом для оператора f: L-+L называется такой базис пространства L, в котором матрица оператора f является жордановой, или, как говорят, имеет жорданову нормальную форму. г) Приведением квадратной матрицы А к жордановой нормаль- ной форме называется решение уравнения в матрицах вида Х~ХАХ = ], где X — (неизвестная) невырожденная матрица, a J — (неизвестная) жорданова матрица.. 10. Пример. Пусть Ln(h)— линейнре пространство комплексных функций вида eKxf(x)y где λεΟ, f(x) пробегает многочлены степени ζζη— 1. Поскольку-j^(eKxf(x)) = eKx(λ/(x)+f'(x)), дифференцирование -τ- является линейным оператором на этом про- странстве. Положим ei+i = -ту-еКх (напомним, что 0! = 1), i = 0, ... ..., η— 1. Очевидно, (первое слагаемое отсутствует при / = 0). Следовательно, ~ΊΠ7\β\> ···» &η) — \filt ···» &η) Таким образом, функции f-4j-euJ образуют жорданов базис для d оператора -т- в нашем пространстве. Этот пример показывает особую роль жордановых матриц в теории линейных дифференциальных уравнений (см. упражнения 1—Зк§9). 11. Кроме уже рассмотренных геометрических соображений для нужд следующего параграфа нам понадобятся алгебраические сведения о полиномиальных функциях от оператора. Пусть /: L-+L — фиксированный оператор. η а) Для любого многочлена Yiaiti = Q(t) с коэффициентами η из поля Ж выражение У. aj* имеет смысл в кольце 9?(L,L) эндоморфизмов пространства L; мы будем обозначать его Q(f). б) Будем говорить, что многочлен Q(t) аннулирует оператор /, если Q(/) = 0> Ненулевые многочлены, аннулирующие /, существуют всегда, если L конечномерно. 3 самом деле, если dim L = n, то dimj?(L,L) = η2 и операторы id, f, ..., f*" линейно зависимы над Ж. Это рассуждение показывает, что имеется аннулирующий / многочлен степени ^л2. На самом деле теорема Гамильтона — Кэли, которую мы докажем ниже, устанавливает существование аннулирующего многочлена степени п. 69
в) Рассмотрим многочлен M(t) со старшим коэффициентом единица, аннулирующий / и имеющий наименьшую возможную степень. Он называется минимальным многочленом оператора /. Очевидно, он определен однозначно: если Mi(t), M2(t)—два таких многочлена, то M\(t)—Μ2(ί) аннулирует f и имеет строго меньшую степень, так что M{(t) — M2(t) = 0. г) Покажем, что любой многочлен, аннулирующий /, делится на минимальный многочлен /. Действительно, пусть Q(f) = 0. Разделим Q с остатком на М: Q(t) = X(t)M{t) + R(t), degR(t)< <degM(0. Тогда R(f) = Q(f) — X(f)M{f) = Ot так что R = 0. 12. Теорема Гамильтона — Кэли. Характеристический много- член P(t) оператора f аннулирует этот оператор. Доказательство. Мы будем пользоваться этой теоремой и докажем ее только для случая алгебраически замкнутого поля Ж, хотя она верна и без этого ограничения. Проведем индукцию по dimL. Если L одномерно, то / есть умножение на скаляр λ, P(t) = t — λ и Р(/) = 0. Пусть dimL = n^ 2 и теорема доказана для пространств размерности η—1. Выберем собственное значение λ оператора / и одномерное собственное подпространство L\ cz L, отвечающее λ. Пусть {е\} — базис L\\ дополним его до базиса {еи ..., еп] пространства L. Матрица оператора / в этом базисе имеет вид / λ!* ... * \ Urx~J· Поэтому P(t) = (t — X)det(tE— Л). Оператор f определяет линейное отображение f: L/Li-+L/Lu J(l + L\) = f(l) + L\. Векторы ei = ei-\- Lie L/L\, /^2, образуют базис _L/L\t и матрица оператора f в этом базисе равна Л. Поэтому P(/) = det(/£ — Л) есть характеристический многочлен оператора /, и по индуктивному предположению P(f) = 0. Значит, P(f)l^L\ для любого вектора /gL. Следовательно, P(f)l = (f-VP(f)l = 0, ибо / — λ переводит в нуль любой вектор из L\. Это завершает доказательство. 13. Примеры, а) Пусть / = idi, dimL = n. Тогда характеристический многочлен / равен (t—1)Λ, а минимальный многочлен равен /— 1, так что они не совпадают при η > 1. б) Пусть /представлен жордановой клеткой /Γ(λ). Характеристический многочлен оператора / равен (t — λ)Γ. Чтобы вычислить минимальный многочлен, заметим, что /Γ(λ) = λ£Γ + /г(0). Далее, Со о ... ι о ...о 0 0...0 0...0 где единицы стоят на к-й диагонали выше главной; /г(0)* = 0 при 60
к ^ г. С другой стороны, <Λ(λ)-λ£Γ)* = /Γ(0)* при 0 <; & <; г—1, а поскольку минимальный многочлен — делитель характеристического, это доказывает, что они совпадают. УПРАЖНЕНИЯ 1. Пусть /: L -> L — диагонализируемый оператор с простым спектром. а) Доказать, что любой оператор g: L-+L такой, что gf = fg, может быть представлен в виде многочлена от /. б) Доказать, что размерность пространства таких операторов g равна dim L. Верны ли эти утверждения, если спектр оператора / не прост? 2. Пусть f,g: L-+ L — линейные операторы в пространстве размерности η над полем нулевой характеристики. Предположим, что fn = 0, dimKer/=l, gf — f£—/· Доказать, что собственные значения g имеют вид а, а— 1, а — 2, ... ..., а — (п — 1) для некоторого а^Ж. § 9. Жорданова нормальная форма Основная цель этого параграфа — доказательство следующей теоремы о существовании и единственности жордановой нормальной формы для матриц и линейных операторов. 1. Теорема. Пусть Ж— алгебраически замкнутое поле, L — конечномерное линейное пространство над Ж, f: L-+L — линейный оператор. Тогда: а) Для оператора f существует жорданов базис, т. е. его матрица А в некотором базисе может быть приведена заменой базиса X к жордановой форме: Х~{АX = /. б) Матрица J определена однозначно с точностью до перестановки входящих в нее жордановых клеток. 2. Доказательство теоремы разбивается на ряд промежуточных шагов. Мы начнем с конструкции прямого разложения £ = ©£,·, где Li — инвариантные подпространства для /, которые впоследствии будут отвечать набору жордановых клеток для f с одним и тем же числом λ на диагонали. Чтобы инвариантно охарактеризовать эти подпространства, вспомним, что (Λ(λ) — ХЕг)п = 0. Оператор, некоторая степень которого равна нулю, принято называть нильпотентным. Итак, на подпространстве, отвечающем клетке J г (λ), оператор / — λ нильпотентен; то же верно для его ограничения на сумму подпространств с фиксированным λ. Это мотивирует следующее определение. 3. Определение. Вектор Ζ е L называется корневым вектором оператора /, отвечающим λΕ/, если существует такое г, что (/ —■ λ) Ί = 0 (здесь f — λ обозначает оператор / — λ id). Очевидно, все собственные векторы корневые. 4. Предложение. Обозначим через L(k) множество корневых векторов оператора f в L, отвечающих λ. Тогда L{%) — линейное подпространство в L и ί(λ)φ{0} тогда и только тогда, когда λ — собственное значение для /. 61
Доказательство. Допустим, (/ — λ)η1{ = (/ -— λ)Γ42 = 0. Полагая г = max (η, г2), находим (/ — λ)Γ(/ι -j- /2) = 0 и (/ — λ)Γι(α/,) = 0. Следовательно, Ζ,(λ) является линейным подпространством. Если λ — собственное значение для /, то имеется собственный вектор, отвечающий λ, так что Ь(Х)Ф{0}. Наоборот, пусть Ι·3ί(λ), 1Ф0. Выберем наименьшее значение г, для которого (/ — i)rl = 0. Очевидно, г ^ 1. Вектор Г = (/ — λ)'-1/ является собственным для / с собственным значением λ: V φ 0 по выбору г и (/ —λ)/'= 0, откуда/(/') = λ/'. 5. Предложение. L= φ'^(λ/), где λ, пробегает все собственные значения оператора /, т. е. различные корни характеристического многочлена /. S Доказательство. Пусть Ρ(/) = Ц(/ — Xtf1 — характери- стический многочлен ί,λίφλι при ΊΦ]. Положим Fi(t) = = р(/)(^_^)"% fi = Fi(f)9 Li = lmfi. Проверим следующую серию утверждений. а) (f — λί)ΓΊί={(},τ. е. L/czL(Xi).Действительно,^ —λί)Γί//= = (/ — λ/)Γ' F/ (/) = Ρ (/) = 0 по теореме Гамильтона — Кэли. б) L = Li+ ... +£*· Действительно, так как многочлены Fi(t) в совокупности взаимно простые, существуют такие многочлены s Xi(t), что Σ Fi(t)Xl(t)=l. Поэтому, подставляя вместо t опера- тор f, имеем 5 Σ ^ (/) */(/) = id. Применяя это тождество к любому вектору /eL, находим /=iM*i(f)/)es£l,. в) £ = Li θ ... Φ Ls. Действительно, выберем 1 ^ i ^ s и проверим, что Li(] ( Σ.^Λ^ί0}* Пусть / — вектор из этого пе- ресечения. Тогда (f _λ,)Γί/ = 0, ибо /e=L*; Fd!)l= Π (/-λ,)Γ// = 0, ибо /g Σ L,. /Φi ΙΦί Так как {t — λ;)Γί и Ft (t) — взаимно простые многочлены, существуют такие многочлены X{t) и Y(t), что X(t) (t — λί)Γ' + Υ (t) X Xf.(f)=l. Подставляя сюда f вместо t и применяя полученное операторное тождество к /, находим X(f) (0)+ Y(f) (0)= I — 0. г) Ζ,/ = Δ(λ,). В самом деле, мы уже проверили, что LiCzL(ki). Для доказательства обратного включения выберем вектор /е 62
ei(t) и представим его в виде / =/'+/", 1'^ЦЧ /"е 0 Lt. \ф ι Существует такое число г', что I/·—λ*)Γ7" = О, поскольку Г = I — — V^L(Xt). Кроме того, Fi(f)l" = 0. Написав тождество X(t){t — ki)r' + Y(t)Ft(0= 1,подставив в него f вместо/ и применив к /", получим /" = 0, так что I = lf e Ц. 6. Следствие. Если оператор f имеет простой спектр, то он диа- гонализируем. Доказательство. В самом деле, число разных собственных значений / тогда равно η = degP(t) = dimL. Поэтому в раз- п ложении L = φ L (λ/) все пространства Ζ,(λ,) одномерны, а так как каждое из них содержит собственный вектор, β базисе из этих векторов матрица оператора f становится диагональной. Теперь мы фиксируем одно собственное значение λ и докажем, что ограничение f на Ζ,(λ) обладает жордановым базисом, отвечающим этому λ. Чтобы не вводить новых обозначений, мы будем до конца п. 7 считать, что f имеет единственное собственное значение λ и Δ = Δ(λ). Более того, мы можем считать даже, что λ = 0, потому что любой жорданов базис для оператора f является одновременно жордановым базисом для оператора f -f- μ, где μ —любая константа. Тогда оператор f нильпотентен по теореме Гамильтона — Кэли: Ρ (/) = /", /Λ = 0, и мы докажем следующий факт: 7. Предложение. Нильпотентный оператор f на конечномерном пространстве L имеет жорданов базис\ матрица оператора f в этом базисе является объединением клеток вида /г(0). Доказательство. Если у нас уже есть жорданов базис в пространстве L, удобно поставить ему в соответствие диаграмму • · I I • · · · I I I I i i i i • · · · D, подобную изображенной здесь. В этой диаграмме точки изображают элементы базиса, а стрелки описывают действие / (в общем случае действие / — λ). Элементы нижней строки оператор / переводит в нуль, т. е. в ней стоят собственные векторы оператора /, входящие в базис. Каждый столбец, таким образом, изображает базис инвариантного подпространства, отвечающего одной жорда- новой клетке, размер которой равен высоте этого столбца (числ\ точек в нем): если 63
то СО 1 О ...О 001...О о о о ...о Наоборот, если мы найдем в L базис, элементы которого / переводит в другие его элементы или в нуль так, что элементы этого базиса вместе с действием f можно изобразить подобной диаграммой, то он будет жордановым базисом для L. Проведем доказательство существования индукцией по размерности L. Если dimL=l, то нильпотентный оператор / является нулевым, и любой ненулевой вектор в /. образует его жорданов базис. Пусть теперь dimL = n>l, и пусть для размерностей, меньших я, существование жорданова базиса уже доказано. Обозначим через LoCzL подпространство собственных векторов для /, т. е. Kerf. Так как dimL0>0, имеем dimL/L0<n, а оператор f: L-+L индуцирует оператор f: L/L0-+_L/L0: J(l+ L0) = f(l)+ L0. (Корректность определения оператора J и ею линейность проверяются немедленно.) По индуктивному предположению f имеет жорданов базис. Мы можем считать его непустым: иначе L = L0, и любой базис L0 будет жордановым для f Построим диаграмму D для элементов жорданова базиса оператора f, в каждом ее столбце возьмем самый верхний вектор ё/, /= 1, ..., ту и положим ei = et + L0. βΐ e L. Теперь построим диаграмму D из векторов пространства L следующим образом. Для 1= 1, ..., т столбец с номером ι диаграммы D будет состоять (сверху вниз) из векторов <?,·, /(в/), ... ..., fhi~x (ei)y /*'(#/)> где hi — высота i-ro столбца в диаграмме В. Так как f*< (§,) = (), то /*«(*,) geLq и /Λί+1(^) = 0. Выберем базис линейной оболочки векторов / 1 (е{), .. , f m (ет) в L0, дополним его до базиса Lo и поставим дополняющие векторы в качестве дополнительных столбцов (высоты единица) в нижней строке диаграммы D; / переводит их в нуль. Таким образом, диаграмма D из векторов пространства L вместе с действием оператора f на ее элементы имеет в точности такой вид, как требуется для жорданова базиса. Нужно только проверить, что элементы D действительно образуют базис L. Сначала покажем, что линейная оболочка векторов из D равна L. Пусть / е L\ 7 = / + Ц. По предположению / = Σ Σ aaV (ei)· Так как Lo f-инвариантно, отсюда следует, что т hi-X ι-Σ Σ"αΡ(*ύ^ΐ«· Но все векторы ff(ei), j^hi— 1, лежат в строках диаграммы D, начиная со второй снизу, а подпространство L0 порождено элемен- 64
тами первой строки D по построению. Поэтому I можно представить в виде линейной комбинации элементов D. Остается проверить линейную независимость элементов D. Прежде всего, элементы нижней строки D линейно независимы. Действительно, если некоторая их нетривиальная линейная комби- т нация равна нулю, то она должна иметь вид Σ atfh* {et) = 0, ибо 1 = 1 остальные элементы нижней строки дополняют базис линейной оболочки {/*» (ех\ ..., ihm(em)} до базиса L0Ho все Ы ^ 1, поэтому /(/Σι«^Λί"1(^))=ο, так что τη ш Za/'-'^eLo и Σ «if'-'(*,) = (). Из последнего же соотношения следует, что все щ = 0, потому что векторы f l~ (et) составляют нижнюю строку диаграммы D и являются частью базиса L/Lo. Наконец, покажем, что если имеется любая нетривиальная линейная комбинация векторов D, равная нулю, то из нее можно получить нетривиальную линейную зависимость между векторами нижней строки D. В самом деле, отметим самую верхнюю строку Z), в которой имеются ненулевые коэффициенты этой воображаемой линейной комбинации. Пусть _номер этой строки (считая снизу), равен Л. Применим к этой комбинации оператор fH~l. Очевидно, ее часть, отвечающая А-й строке, перейдет в нетривиальную линейную комбинацию элементов нижней строки, а остальные слагаемые обратятся в нуль. Это завершает доказательство предло-. жёния. Теперь нам осталось проверить часть теоремы из п. 1, относящуюся к единственности. 8. Пусть фиксирован произвольный жорданов базис оператора f. Любой диагон&льный элемент матрицы оператора / в этом базисе, очевидно, является одним из собственных значений λ этого оператора. Рассмотрим часть базиса, отвечающего всем блокам матрицы с этим значением λ, и обозначим через L% его линейную оболочку. Поскольку (Jr(λ)— λ)r = О, имеем Ζ,λ<ζ:ί,(λ), где Ζ,(λ) — корневое подпространство L. Кроме того, £=ф L\{ по определению жорданова базиса и L = φ L(ki) по предложению п. 5, где в обоих случаях λ/ пробегает все собственные значения оператора / по одному разу. Следовательно, dim L\. = dim L (λ^) и L\t = L (λί). Значит, сумма размеров жордановых клеток, отвечающих каждому λ», не зависит от выбора жорданова базиса, и, более того, от выбора базиса не зависят линейные оболочки Lxr Поэтому достаточно.проверить теорему единственности для случая L=L(K) или даже для L = L(О). Λ
Построим диаграмму Ζ), отвечающую данному жорданову базису L = L(0). Размеры жордановых клеток — это высоты ее столбцов; если, как на чертеже, расположить столбцы в порядке убывания, то эти высоты однозначно определятся, если известны длины строк в диаграмме, начиная с нижней, в порядке убывания. Покажем, что длина нижней строки равна размерности L0 = Kerf. Действительно, возьмем любой собственный вектор / для / и представим его в виде линейной комбинации элементов D. В эту линейную комбинацию все векторы, находящиеся выше нижней строки, войдут с нулевыми коэффициентами. Действительно, если бы самые высокие векторы с ненулевыми коэффициентами лежали в строке с номером h ^ 2, то вектор fh-](l) = 0 был бы нетривиальной линейной комбинацией элементов нижней строки D (ср. конец доказательства предложения п. 7), а это противоречит линейной независимости элементов D. Значит, нижняя строка D образует базис L0, так что ее длина равна dimLo, и потому эта длина одинакова для всех жордановых базисов. Точно так же длина второй строки не зависит от выбора базиса, так как она равна размерности Ker f в L/L0 в обозначениях предыдущего пункта. Это завершает доказательство единственности и теоремы п. 1. 9. Замечания, а) Пусть оператор / представлен матрицей А в некотором базисе, тогда задача приведения А к жордановой форме может быть решена с помощью следующих действий. Вычислить характеристический многочлен А и его корни. Вычислить размеры жордановых клеток, отвечающих корням λ. Для этого достаточно вычислить длины строк соответствующих диаграмм, т. е. dim Ker (A — λ), dim Ker (Α—λ)2 — dim Ker (A — λ), dim Ker (Λ — λ)3 — dim Ker (Λ — λ)2, ... Построить жорданову форму / матрицы А и решить матричное уравнение АХ — XJ = 0. Пространство решений этой линейной системы уравнений будет, вообще говоря, многомерно, и среди решений будут и вырожденные матрицы. Но по теореме существования обязательно есть невырожденные решения; можно взять любое из них, б) Одно из важных приложений жордановой формы — вычисление функций от матриц (пока мы знакомы лишь с полиномиальными функциями). Пусть, скажем, нам нужно знать большую степень ΑΝ матрицы А. Так как степень жордановой матрицы вычислить легко (см. § 8, п. 13), экономный способ может состоять в использовании формулы AN = XJNX~\ где А == XJX~l: дело в том, что матрица X вычисляется раз навсегда и не зависит от N. Эту же формулу можно использовать для оценки роста элементов матрицы AN. в) В терминах жордановой формы легко вычислить минимальный многочлен матрицы Л. В самом деле, ограничимся для простоты случаем поля нулевой характеристики. Тогда минимальный многочлен /Γ(λ) равен (t — λ)Γ (см. п. 13 § 8), минимальный многочлен блочной матрицы (/Γί (λ)) равен (/— Л)тах (г'\ наконец, ми- 66
нимальный многочлен общей жордановой матрицы с диагональ- s ными элементами λι, ..., Xs (λιφλ,- при i¥=j) равен Π(ί — λ,)Γ/, где г/ — наибольший размер жордановой клетки, отвечающей λ/. 10. Другие нормальные формы. В этом пункте мы вкратце опишем другие нормальные формы матриц, пригодные, в частности, для алгебраически незамкнутых полей. а) Циклические пространства и циклические клетки. Пространство L называется циклическим относительно оператора /, если в L существует такой вектор /, также называемый циклическим, что векторы /, /(/), ..., fn~[(l) образуют базис L. Полагая ei = f"~l(l)9 i = 1, ..., n = dimL, имеем (αΛ-, 1 0...0 \ ал;2.0.1::0 L a0 0 0 ... 0 / где аг^Ж однозначно определяются из соотношения fn(l) = — Σ aif* (0· Матрица оператора / в таком базисе называется цик- *=о лической клеткой. Наоборот, если матрица оператора / в базисе (ей ..., вп) является циклической клеткой, то вектор 1 = еп цик- личен, и et = 1п~*(еп) (индукция вниз по ί). Покажем, что вид циклической клетки, отвечающей f, не зависит от выбора исходного циклического вектора. Для этого проверим, что первый столбец клетки состоит из коэффициентов минй- п-\ мального многочлена оператора f: M(t) = tn — У atf*. В самом деле, М(/) = 0, потому что M(f) [/<(/)] = /<[М(/)/] = 0, а векторы /'(/) порождают L. С другой стороны, если N(t)— многочлен степени <п, то Ν(ί)φ0, потому что иначе, применив оператор N(f) = 0 к циклическому вектору /, мы получим нетривиальное линейное соотношение между векторами базиса /,/(/), ... б) Критерий цикличности пространства. Согласно предыдущим рассмотрениям, если пространство L циклично относительно f, то его размерность η равна степени минимального многочлена оператора / и, стало быть, минимальный многочлен совпадает с характеристическим. Обратное тоже верно: если операторы id, /, ..., fn~l линейно независимы, то существует такой вектор /, что векторы U/(0» ···» f"~l(0 линейно независимы, так что L циклично. Мы не будем доказывать это утверждение. в) Матрица любого оператора в подходящем базисе может быть приведена к прямой сумме циклических клеток. Доказательство можно провести аналогично доказательству теоремы о жордановой форме. Вместо множителей (t —- λ^1 характеристического многочлена следует рассматривать множители pt(/)Г/> где pi(t) — неприводимые над полем Ж делители характеристического много-- 67
члена. Теорема единственности также имеет место, если ограничиться случаем, когда минимальные многочлены всех циклических клеток Аеприводимы. Без этого ограничения она неверна: циклическое пространство может быть прямой суммой двух циклических подпространств, минимальные многочлены которых взаимно просты УПРАЖНЕНИЯ 1. Пусть L — конечномерное пространство дифференцируемых функций комплексной переменной *, обладающее тем свойством, что если /eL, то -:— е L. Доказать, что существуют такие комплексные числа λι, ..., λ$ и целые числа г и ..., rs ^ 1, что L = QLi, где /./ — пространство функций вида е *хР,(л:) Pi(x)—произвольный многочлен степени ^г/~ 1. (Указание. Рассмотреть жор- данов базис для оператора -т- на L и последовательно вычислить вид входящих в него функций, начиная с нижней строки его диаграммы.) 2. Пусть у(х)—функция комплексной переменной *, удовлетворяющая дифференциальному уравнению вида 4£ + "j>g_o.«,.c. Обозначим через L линейное пространство функций, натянутое на dlyldx' для всех i ^ 0. Доказать, что оно конечномерно и оператор d/dx переводит" его в себя. 3. Пользуясь результатами упражнений 1 и 2, вывести, что /у(*К представляется в виде Ъ е 1хР^х), Pt—многочлены. Как связаны числа λ* с видом дифференциального уравнения? 4. Пусть Л (λ) — жррданова клетка над С. Доказать, что, как угодно мало изменив ее элементы, можно добиться того, что полученная матрица будет диа- гонализируемой. (Указание. Изменить элементы на диагонали, сделав их попарно разными.) 5. Перенести результат этого упражнения на произвольные матрицы над С, воспользовавшись тем, что коэффициенты характеристического многочлена непрерывно зависят от элементов матрицы, а условие отсутствия кратных корней многочлена равносильно тому, что его дискриминант не обращается в нуль. 6. Придать точный смысл следующим утверждениям и доказать их: а) общая 2 X 2-матрица над С диагонализируема. б) общая 2 X 2-матрица с одинаковыми собственными значениями недиаго- нализируема. § 10. Нормированные линейные пространства В этом параграфе изучаются специальные свойства линейных пространств над вещественными и комплексными числами, связанные с возможностью определить в них понятие предельного перехода и построить начала анализа. Особую роль эти свойства играют в бесконечномерном случае, так что по существу излагаемый материал является элементарным введением в функциональный анализ. 1. Определение. Пара (E,d)4 где Ε — множество, a d\ ΕΧΕ-*· *-»■ R — вещественнозначная функция, называется метрическим про- Qb
странством, если выполнены следующие условия для всех х, у, z<=E: а) d(x,y) = d(yyx) (симметрия); б) d(x,x) = 0\ d(x\y)i>0, если хфу (положительность); в) d (χ, ζ) sg: d (χ, у) -f- d (у, ζ) (неравенство треугольника). Функция d с такими свойствами называется метрикой, a d(x,y) — расстоянием между точками х, у. 2. Примеры, а) Е = R или С, d(xyy) = \x — у\. -> -> ( п \1/2 б) E=Rn или С\ d(x, у)=\ £ | Xi — у if 1 -Это так называемая естественная метрика,. Во второй части мы рассмотрим ее систематически и изучим ее обобщения на произвольные основные поля в теории квадратичных форм. Другие метрики: ■> ·> -> ·> А d\ (х, у) = max (\Xi — yt |), d2 (χ, y)= 2^ \χ% — у 11. ί = 1 β) E = C(atb) — непрерывные функции на отрезке [α, b]. Вот три наиболее важные метрики: d,(/. ё)= max \f(t)-g(t)l d2(f,g)=\\f(t)-g(t)\dt, a (Проверьте аксиомы. Для йг в примере б) и d% в примере в) неравенство треугольника будет доказано в следующей части.) г) Ε — любое множество, d(x,y)= 1 при хфу. Это — одна из дискретных метрик на Е. (С каждой метрикой связана некоторая топология на Е9 и последняя описанная метрика индуцирует дискретную топологию;) 3. Шары, ограниченность и полнота. В метрическом пространстве Ε с метрикой d множества В(х0, r) = {x<=E\d(x0, x)<r}, В(х0, r) = {x<=E\d(х0у х)<г}, S(x0> r) = {x<=E\d(x0i x) = r) называются соответственно открытым шаром, замкнутым шаром и сферой с центром в точке яо и радиуса г. Не следует связывать с ними интуитивные представления, слишком близкие к трехмерным пространственным. Например, в примере г) п. 2 все сферы радиуса г φ 1 пусты. €9
Подмножество F а Е называется ограниченным, если оно содержится в некотором шаре (конечного радиуса). Последовательность точек х\, хъ, ..., хп, ... в £ сходится к точке а е £, если lim d (xn, α)=0. Последовательность называется фун- П-+оо даментальной (или последовательностью Коши), если для всякого ε > 0 существует Ν = Ν(ε), такое, что d(xm, хп)<г при т, п> >Ν(ε). Метрическое пространство Ε называется полным, если любая последовательность Коши в нем сходится. Из полноты R и С, доказываемой в анализе, следует, что пространства R" и Сп с любой* из метрик d, db d^ примера б) п. 2 полны. 4. Нормированные линейные пространства. Пусть теперь L — линейное пространство над R или С. Особо важную роль играют метрики на L, которые удовлетворяют двум условиям: а) d(lu /2) = d(l\ + U h + I) для любых /, /ь /2gL (инвариантность относительно сдвига); б) d(alu α/2) = \a\d(lu k) (умножение на скаляр а увеличивает расстояния в |а| раз). Пусть d — такая метрика. Назовем нормой вектора / (относительно d) и будем обозначать через ||/|| число d(l, 0). Из аксиом метрики (п. 2) и условий а), б) вытекают следующие свойства нормы: II01| — 0. ||Л1>0, если 1ф0; ·||α/|| = |α|||/|| для всех а^Ж, /eL; ll/i + /2IKII/ill + 11UII для всех /„ /2eL Первые два свойства очевидны, третье проверяется так: ||/ι + /2!! = = d(lx + /2, 0) = d(lu -/2) < d(lu 0) + d(0, -l2) MI/1II + II/2II. Линейное пространство L, снабженное функцией нормы || ||: L->R, удовлетворяющей перечисленным трем условиям, называется нормированным. Наоборот, по норме восстанавливается метрика: положив d(lu /2)=||/i — /2||, легко проверить аксиомы метрики. Для нее d(/,0) =11/11. Полное нормированное линейное пространство называется банаховым пространством. Пространства R" и Сп с любыми нормами, отвечающими метрикам из п. 2, банаховы. Общее понятие сходимости последовательности в метрическом пространстве, данное в п. 3, специализируется на случай нормированных линейных пространств и называется сходимостью по норме. Линейная структура позволяет определить понятие сходимости ряда, более сильное, чем сходимость по норме его частичных сумм. оо Именно, ряд X '* называется абсолютно сходящимся, если схо- 00 дится ряд Σ IIUII· ί-1 70
5. Норма и выпуклость. Нетрудно описать все нормы на одномерном пространстве L: любые две из них отличаются друг от друга умножением на положительную константу. В самом деле, пусть / е L — ненулевой вектор, || ||ь || ||2 — две нормы. Если IUIIi = dUII2, то ЦаЛ|1=|а|||Л|1 = с|а|||Л12 = с||аЛ|2 для всех аеЯГ. Будем называть кругами (соответственно окружностями) в одномерном пространстве L шары (соответственно сферы) ненулевого радиуса с центром в нуле относительно любой из норм. > Как следует из предыдущего рассуждения, множества всех кругов и окружностей в L не зависят от выбора исходной нормы. Вместо задания любой нормы можно указать ее единичный круг В или единичную окружность S: S восстанавливается по В как граница β, а β восстанавливается по Якак множество точек вида {a/|/eS, |α|^Ξ 1}· Заметим, что при Ж = R круги суть отрезки с центром в нуле, а окружности — пары точек, симметричные относительно нуля. Чтобы перенести это описание на пространства любой размерности, нам понадобится понятие выпуклости. Подмножество EczL называется выпуклым, если для любых двух векторов /ь /2е£ и для любого числа 0 ^ а ^ 1 вектор al\ +(1 —о) к лежит в Е. Это согласуется с обычным определением выпуклости в R2 и R3: вместе с любыми двумя точками («концами векторов U и /2») множество Ε должно содержать весь соединяющий их отрезок («концы векторов ah + (1 — а) /2»). Пусть || ||—некоторая норма на L. Положим В ={/е L\ ||/||^ 5ζ 1}, S={/eL|||/||= 1}. Ограничение || || на любое линейное подпространство LoCzL индуцирует норму на L0. Отсюда следует, что для любого одномерного подпространства LoCzL множество L0(]B является кругом в Lo, а множество L0 Π 5 — окружностью в смысле данного выше определения. Кроме того, из неравенства треугольника следует, что если /ь /2 е В, О ^ а ^ 1, то ||α/!+(1 —^^ΙΚαΙΙ/,ΙΙ + Ο —а)||/2||<1. т. е. a/i+O — a)k^B, так что В — выпуклое множество. Справедлива и обратная теорема: 6. Теорема. Пусть S czL — множество, удовлетворяющее двум условиям: а) Пересечение S f\ L0 с любым одномерным подпространством Lo является окружностью. б) Множество В = {al\ \ а | ^ 1, / е S} выпукло. Тогда на L существует единственная норма \\ ||, для которой В является единичным шаром, a S — единичной сферой. Доказательство. Обозначим через || ||: L->R функцию, которая на каждом одномерном подпространстве L0 является нормой с единичной сферой S (] L0. Ясно, что такая функция существует и единственна, и нуждается в проверке лишь неравенство треугольника для нее. Пусть /ь /2eL, ||/ill=#i, ||/2||=#2, ΝιΦΟ. Применим условие выпуклости В к векторам Ν^ιί{ и Af2-1/2e S. 71
Получим |-Я^Г"Г'/,+1^Л-Ч.|<1, откуда |/i+/2ll<^i + ^2 = ||Z,|| + ||Z2||. 7. Теорема. Любые две нормы \\ \\\ и || ||2 на конечномерном пространстве L эквивалентны в том смысле, что существуют положительные константы 0 < с^с' с условием *ΙΙ/ΙΙ2<ΙΙ/ΙΙιΟΊΙ/Ιΐ2 для всех I e L. В частности, топологии, т. е. понятия сходимости, отвечающие любым двум нормам, совпадают, и все конечномерные нормированные пространства банаховы. Доказательство. Выберем базис в L и рассмотрим есте- ственную норму || χ || = I 2j | xt |21 относительно координат в э'том базисе. Достаточно проверить, что любая норма || Hi эквивалентна этой. Ее ограничение на единичную сферу нормы || || является непрерывной функцией координат х, принимающей лишь положительные значения (непрерывность следует из неравенства треугольника). Следовательно, эта функция отграничена от нуля константой с>0и ограничена константой с' > 0 по теореме Больцано — Вейерштрасса (единичная сфера S для || || замкнутая ограничена). Из неравенства с <||/||ι< с' для всех /eS следует неравенство c||/||^||/||i^c'||/|| для всех /eL. Поскольку L полно в топологии, отвечающей норме || ||, и понятия сходимости для эквивалентных норм совпадают, L полно в любой норме. 8. Норма линейного оператора. Пусть L, Μ — нормированные линейные пространства над одним и тем же полем R или С. Рассмотрим линейное отображение /: L->M. Оно называется ограниченным, если существует такое вещественное число N ^ О, что для всех /ei выполнено неравенство ||f(/)||<; jV||/|| (левая норма —в М, правая —в L). Обозначим через 3?ι(1,Μ) множество ограниченных линейных операторов. Для каждого /е ^3?{{L, Μ) обозначим через ||f|| нижнюю грань всех N, для которых выполняются неравенства ||/(/)||^ N\\l\\, /eL 9. Теорема, a) S?](L,M) является нормированным линейным пространством относительно функции \\f\\, которая называется индуцированной нормой. б) Если L конечномерно, то SX(L, М) = & (L, М), т. е. любое линейное отображение ограничено. Доказательство, а) Пусть /, g e 5?1{L, Μ). Если ||/(/)1К < ΛΜΙ/ΙΙ и \\g(l) IK N2\\/II для всех /, то Ц(/ + ЙГ)(/)1К(^1 + ^2)||Л1, ||α/(/)||<|α|ΛΜ|/||. Поэтому / -\- g и af ограничены и, более того, переходя к нижним 72
граням, имеем llf + fflKII/ll + Ш, Ι|α/|| = |α|||/||. Если ||f||=0, то для любого ε >0 ||f(/)||< ε||/||. Значит, ||/(/)|| = 0, так что f = 0. в) На единичной сфере в L отображение /ь->||/(/)|| является непрерывной функцией. Так как эта сфера ограничена и замкнута, эта функция ограничена и, более того, верхняя грань ее значений достигается. Поэтому на сфере ll/(/)||^Af, так что ||/(/)Н^ Nllfll для всех / е L. Попутно мы обнаружили, что ||fl|=max{||f(Z)|f, /e единичная сфера в L}. 10. Примеры: а) В конечномерном пространстве L последовательность векторов /ι, ..., 1Пу ... сходится к вектору / тогда и только тогда, когда в некотором (и потому в любом) базисе последовательность i-x координат векторов // сходится к /-й координате вектора /, т. е. если f(l\), ..., /(/Л), ... сходится для любого линейного функционала f&L*. Последнее условие можно перенести на бесконечномерные пространства, потребовав сходимость f(U) лишь для ограниченных функционалов /. Это приводит, вообще говоря, к новой топологии на L, называемой слабой топологией. б) Пусть L — пространство вещественных дифференцируемых функций на [0,1] с нормой ||/1| = 1 \ f(t)2dt I . Тогда оператор ι ι умножения на t ограничен, ибо \t2f (if dt ^ \ / (tf dt, а оператор о. о -тт- неограничен. В самом деле, для любого целого η ^ 0 функция д/2я + 1 tn лежит на единичной сфере, а норма ее производной V2n+ ι 2п_ χ ->00 ПрИ АХ->00. f & 11. Теорема. Пусть L—>М—> N —ограниченные линейные отображения нормированных пространств. Тогда их композиция ограничена и Доказательство. Если ||/(/)||<#ιΙΙ/|| и \\g(m)\\^N2\\m\\ для всех / έ L, m g M, то \\g*i(l)\\<N2\\f(l)\\<N2Nx\\ll откуда, переходя' к нижним граням, получаем требуемое утверждение. П
УПРАЖНЕНИЯ 1. Вычислить нормы на R2, для которых единичными шарами являются множества: а) х2 + У2< 1; б) х2 + У2 ^ г2; в) квадрат с вершинами (±1, ±1); г) квадрат с вершинами (0, ±1), (±1, 0). 2. Пусть f(x) ^0 — дважды дифференцируемая вещественная функция на [at b]aR и Г(х)<0. Доказать, что множество {(*, у) \a^.x^b, 0^ «/</(*)} с с: R2 выпуклое. 3. Пользуясь результатом упражнения 2, доказать, что множество 1*|Р+МР^1 Для Р>1 в R2 является единичным шаром для некоторой нормы. Вычислив эту норму, доказать неравенство Минковского: (I *, + у λ" +1Х2 + у, \"У'Р < (Ι χ, |р +1Χ2 |Т" + (| у г \" +1 г/2|7*· 4. Обобщить результаты упражнения 3 на случай R" 5. Пусть В — единичный шар некоторой нормы в L, В* — единичный шар индуцированной нормы в L* = j?(L, Ж), Ж == R или С. Дать явное описание В* и вычислить В* для норм из упражнений 1 и 3. §11. Функции линейных операторов 1. В § 8 и 9 мы определили операторы Q(/), где f: L-+L — линейный оператор, a Q — любой многочлен с коэффициентами из основного поля Ж. Если Ж = R или С, пространство L нормировано, а оператор / ограничен, то Q(f) можно определить для более общего класса функций Q с помощью предельного перехода. Мы ограничимся рассмотрением голоморфных функций Q, задаваемых степенными рядами с ненулевым радиусом сходимости: оо оо Q(t)=Ytaiti. Положим Q(f)=Yialfit если этот ряд из опера- оо торов абсолютно сходится, т. е. если сходится ряд Σαί1ΐ/'ΙΙ. (Вслу- чае dimL<;oo, которым мы в основном будем заниматься здесь, 2?l(L, L) = i?(L, L), и пространство всех операторов конечномерно и банахово; см. § 10, утверждение б) теоремы п. 9.) 2. Примеры, а) Пусть / — нильпотентный оператор. Тогда ||f'||= 0 для достаточно больших /, и ряд Q(f) всегда абсолютно сходится. На самом деле он совпадает с одной из своих частичных сумм. оо б) Пусть \\f\\< 1. Ряд Σ fl абсолютно сходится и Действительно, (id -/) Σ f = id - /*+1 = (Σ /0 (id - f) 74
и переход к пределу при N -+- сю дает требуемое. В частности, если 11/11 < 1, то оператор id — f обратим. в) Назовем экспонентой ограниченного оператора f оператор е' = ехр(/) = £^/ J 1 л=0 Так как ||fn|| ^ \\f\\n (см. теорему п. 11 § 10) и числовой ряд для экспоненты равномерно сходится на любом ограниченном множестве, функция exp(f) определена для любого ограниченного оператора f и непрерывна по f. во Например, ряд Тейлора ^ ^ <р<*>(/)для значения φ(/ + Δ0 можно формально записать в виде ехр ГД/-тг](р. Чтобы эта запись приобрела точный смысл, нужно, конечно, выбрать пространство бесконечно дифференцируемых функций φ с нормой и проверить сходимость в индуцированной норме. Частный случай: exp(aid) = ea id (a — скаляр);exp(diag(ab ... ..., a„)) = diag(expai, ..., ехра*). Основное свойство числовой экспоненты: еаеъ = ea+b> вообще говоря, нарушается для экспоненты операторов. Однако есть важный частный случай, когда оно выполнено: 3. Теорема. Если операторы f,g:L-+L коммутируют, т. е. fg = gf>.™ (expf)(expg)=exp(f + g"). Доказательство. Применяя формулу бинома Ньютона и пользуясь возможностью переставлять члены абсолютно сходящегося ряда, получаем («р/Не.рй-ГЕтгГХЕт*')- Σ W'V = \*>0 /\fc>0 / I. fc>0 m m = V V ! f'*«-'= У J-У 2! figm-i = L· L· i\ (m - i)! * g L· m\ L· i\ (m - /)! ' g Коммутативность fug используется в том месте, где (f + g)m разлагается по биному. 4. Следствие. Пусть f: L-+L — ограниченный оператор. Тогда отображение R->i?l(L, L): t*—>exp(tf) является гомоморфизмом группы R в подгруппу обратимых операторов SX(L,L) no умно- жению. Множество операторов {exp tf\t^ R} называется однопарамет- рической подгруппой операторов. 5. Спектр. Пусть f — некоторый оператор в конечномерном пространстве, Q(t)—такой степенной ряд, что Q(f) абсолютно схо- 75
дится. Нетрудно видеть, что если Q(t)—многочлен, то в жорда- новом базисе / матрица Q(f) является верхней треугольной, и на ее диагонали стоят числа <3(λ,·), где λ* — собственные значения /. Применив это соображение к частичным суммам Q и перейдя к пределу, получим, что это же верно для любого ряда Q{t). В частности, если S(f) — спектр f, то S(Q(f)) = Q(S(f)) = {Q(X) |λ<= eS(/)}. Более того, если учитывать характеристические корни λ/ с их кратностью, то Q{S(f)) будет спектром Q(f) с правильными кратностями. В частности, det (ехр /) = Д ехр λι = ехр ( Σ λ*) = ехР Тг f· Переходя на язык матриц, мы отметим еще два простых свойства, которые доказываются таким же образом: а) Q{A*) = Q(AY\ б) Q(4)=Q04), где черта означает комплексное сопряжение; здесь предполагается, что ряд Q имеет вещественные коэффициенты. Пользуясь этими свойствами и обозначениями § 4, докажем следующую теорему, относящуюся к теории классических групп Ли (здесь Ж = R или С). 6. Теорема. Отображение ехр переводит gl(n,Ж), sl(n,Ж), о{пуЖ)у u(n), su(n) в GL(n,#), SL(n,Jif), SO(n,Jif), U(n), SU(n) соответственно. Доказательство. Пространство gl(n, Ж) переходит в GL(tt, Ж), ибо согласно следствию п. 4 матрицы ехр Л обратимы. Если Тг Л = О, то det ехр Л = 1, как было доказано в предыдущем пункте. Из условия Л-|-Л' = 0 следует, что (ехр Л) (ехр Л)' = 1, а из условия Л +Л' —О следует, что ехр Л (ехр Л)' = 1. Это завершает доказательство. 7. Замечание. Во всех случаях образ ехр покрывает некоторую окрестность единицы соответствующей группы. Для доказательства можно определить логарифм операторов f с условием (-— l)n n и по- казать, что f = ехр (log f). Однако в целом отображения ехр, вообще говоря, не сюръек- тивны. Например, не существует матрицы Л е si(2, С), для которой ехр А = ( ~ , ) е SL (2, С). В самом деле, Л не может быть диагонализируемой, иначе ехр Л была бы диагонализируемой. Значит, собственные значения Л совпадают, а так как след Л равен нулю, эти собственные значения должны быть нулевыми. Но тогда собственные значения ехр Л равны 1, тогда как собственные значения ί""ο—ι) Равны"~~1· 76
§ 12. Комплексификация и овеществление 1. В § 8 и 9 мы убедились, что работа над алгебраически замкнутым полем проясняет геометрическую структуру линейных операторов и дает удобную каноническую форму матриц. Поэтому, даже работая с вещественным полем, удобно иногда пользоваться комплексными числами. В этом параграфе будут изучены две основные операции: увеличения и уменьшения поля скаляров в применении к линейным пространствам и линейным отображениям. Мы уделим больше всего внимания переходу от R к С (комплексификация) и от С к R (овеществление) и кратко коснемся более общего случая. 2. Овеществление. Пусть L — линейное пространство над С. Забудем про возможность умножать векторы из L на все комплексные числа и оставим лишь умножение на R. Очевидно, мы получим линейное пространство над R, которое будем обозначать Lr и называть овеществлением L. Пусть L, Μ — два линейных пространства над С, f: L-+M — линейное отображение. Очевидно, рассмотренное как отображение Lr->jWr, оно остается линейным. Мы будем обозначать его fR и называть овеществлением /. Ясно, что idR = id, (/g)R = /RffR; (af+ + bg\ = afR + bgR, если a,6eR. 3. Теорема, а) Пусть {е\, ..., em}—базис пространства L над С. Тогда {еи ..., em, ιβ\, ..., iem} является базисом пространства LR над R. В частности, dimR L« = 2 dimc L. б) Пусть А = В + iC — матрица линейного отображения f: L-+M в базисах \ev ..., efn} и {e'v ..., е'^ над С, где В, С — вещественные матрицы. Тогда матрицей линейного отображения fR: LR->AiR в базисах {e[t ..., em, ie[9 ..., /em}, \e[t .♦., e'ny fei»'···» К} бУдет (Г5)· Доказательство, а) Для любого элемента /gL имеем mm mm I = Σ ацвк = Σ Фк + "к) e* = Σ Μ* + Σ ck (1ек)9 где bk, Ck — вещественная и мнимая части α*. Поэтому {ekJek} по- m m рождают Lr. Если Σ Μ* + Σ c* (*ел) = Φ где b*> c* e R» T0 fe-1 ft-1 bk + 1ск = 0 в силу линейной независимости {е{у ..., ek) над С, откуда следует, что bk = ck — 0 для всех k. б) Согласно определению Л, имеем f(ev ···· em) = «> ···» <)(Я + *С), откуда, в силу линейности / над С, /(ie, iem) = «, ...,<)(- С + Ю). 77
Поэтому (f(el)....,f(em),f(iel) f(iem)) = ev ..., en, iev ..., iem) \^c By что завершает доказательство. Следствие. Пусть f: L-+L — линейный оператор на конечно- мерном комплексном пространстве L. Тогда det fR = | det f |2. Доказательство. Пусть f представлен матрицей В + iC (β, С вещественны) в базисе {еи ..., ет). Тогда, применяя элементарные преобразования (прямо в блочной структуре) сначала к строкам, потом к столбцам, находим: «/.-«(J-S)-drt(»+»-c+»)_ = det(B + /C B^iC) = det(B + /C)det(B--/C) = = det/diF7=|detf|2. 4. Спуск поля скаляров: общая ситуация. Довольно очевидно, как обобщаются определения п. 2. Пусть К — некоторое поле, Ж— его подполе, L— линейное пространство над /С Забыв про умножение векторов на все элементы поля К и оставив лишь умножение на элементы Ж, мы получим линейное пространство La:над Ж. Аналогично, линейное отображение f: L-+M над К превращается в линейное отображение fx: Ьх-+Мж. Одно из названий этих операции — спуск поля скаляров (от К до Ж).> Ясно, что id^ = id, (fg)x = fxgx* (af + bg)yC = afPC + bgx, если α, ЬееЖ. Само поле К можно также рассматривать как линейное пространство над Ж. Если оно конечномерно, то размерности dim^L и dim^Lx связаны формулой dimyc Lx = άιηΐχ К dim* L. Для доказательства достаточно проверить, что если {еь ..., еп} — базис L над /С, a {6lf ..., bm}— базис К над Ж, то {Ь\ви ... ..., Ь\еп\ ...; Ьтви ...» Ьщвп} образуют базис Lx над Ж. 5. Комплексная структура на вещественном линейном пространстве. Пусть L — комплексное линейное пространство, LR — его овеществление. Чтобы полностью восстановить умножение на комплексные числа в LR, достаточно знать оператор /: L^-^L^ умножения на i: J(l) = ii. Очевидно, этот оператор линеен над R и удовлетворяет условию Ρ = —id; если мы знаем его, то для любого комплексного числа а + W, я, JeR, имеем (a + bi)l = al + bJ(l). Это соображение приводит к следующему важному понятию: 6. Определение. Пусть L — вещественное пространство. Комплексной структурой на L называется задание линейного оператора J: L-*L, удовлетворяющего условию Я = —id. 78
Описанная выше комплексная структура на LR называется ка- ионической. Это определение оправдывается следующей теоремой: 7. Теорема. Пусть (L,J)— вещественное линейное пространство с комплексной структурой. Введем на L операцию умножения на комплексные числа из С по формуле (a + bi)l = al + bJ(l). Тогда L превратится в комплексное линейное пространство £, для которого LR = L. Доказательство. Обе аксиомы дистрибутивности легко проверяются, исходя из линейности / и формул сложения комплексных чисел. Проверим аксиому ассоциативности умножения: (а + Ы) [(с + di) I] = (а + Ы) [cl + dJ (/)] = a[cl + dJ (/)] + + Ы [cl + dJ (/)] = acl + ad J (I) + be J (I) - bdl = = (ac - bd)I + (ad + be) J(l) = [ac - bd + (ad + bc)i]l = = [{a + bi)(c + di)]l. Все остальные аксиомы выполнены по той причине, что L и £ совпадают как аддитивные группы. 8. Следствие. Если (L,J)—конечномерное вещественное про- странство с комплексной структурой, то dimRL = 2n четна, и мат- рица J в подходящем базисе имеет вид Доказательство. Действительно, dimRL = 2dimcL в силу теоремы п. 7 и утверждения а) теоремы п. 3 (конечномерность £ следует из того, что любой базис L над R порождает £ над С). Далее, выберем базис {еи ..., еп} пространства £ над С. Матрица умножения на i в этом базисе равна 1Еп. Поэтому матрица оператора / в базисе {е\у ... t en\ tei, ..., ien) пространства L имеет требуемый вид в силу утверждения б) теоремы п. 3. 9. Замечания, а) Пусть L — комплексное пространство, g: LR -► LR — вещественно линейное отображение. Поставим вопрос, когда существует такое комплексно линейное отображение /: £->■£, что g = fR. Очевидно, для этого необходимо, чтобы g коммутировал с оператором J естественной комплексной структуры HaLR, ибо g(il) = g(Jl) = ig(l) = Jg(l) для всех /eL Это условие является также достаточным, потому что из него автоматически следует линейность g над С: g ((а + Ы) I) = ag (I) + bg (il) = ag (I) + bgJ (I) = - ag (1) + big (1) = (a + bJ) g (I) = (a + bi)g (I). б) Пусть теперь L — четномерное вещественное пространство, f: L-+L — вещественно линейный оператор. Поставим вопрос, когда на L существует такая комплексная структура /, что f является 79
овеществлением комплексно линейного отображения g: £-»■£, где L — комплексное пространство, построенное с помощью /. Вот частичный ответ, относящийся к случаю ditriRL = 2: такая структура существует, если f не имеет собственных векторов в L. В самом деле, тогда f имеет два комплексно сопряженных собственных значения λ + ίμ, λ, με/?, μ =^0. Положим / = μ-1(/ — — λίά). По теореме Гамильтона — Кэли,/2 — 2λ/ + (λ2 + μ2) id = 0, откуда Ρ = μ-2 (Ρ - 2λ/ + λ2 id) = - id. Кроме того, / коммутирует с f. Это завершает доказательство. 10. Комплексификация. Теперь мы фиксируем вещественное линейное пространство L и введем комплексную структуру / на внешней прямой сумме L@ L, определив ее формулой Щи h) = {-k> Ί)· Ясно, что /2 = —1. Назовем комплексификацией пространства L комплексное пространство L φ L, связанное с этой структурой. Мы будем обозначать его Lc. Другие стандартные обозначения: C(g)£ R илиС©//, их происхождение станет ясно после ознакомления с тензорными произведениями линейных пространств. Отождествив L с подмножеством векторов вида (/,0) в L0L и пользуясь тем, что /(/, 0) = /(/, 0) = (0, /), мы можем записать любой вектор из Lc в виде </i, k) = (/ь 0) + (0, /2) = (1Ь 0) + I(/2, 0) = h + il2. Иными словами, Lc= L@ iL, последняя сумма является прямой над R, но не над С! Любой базис L над R будет базисом Lc над С, так что dimRL= = dimcLc. Пусть теперь f: L-+M — линейное отображение линейных пространств над R. Тогда отображение fc (или f ® С): Lc-*Afc, определенное формулой f(h, «-(f(/i). /(«). линейно над R и перестановочно с /, ибо fJ(lu k) = f(-k> /i)-=(-f(/2). f(h)) = Jf(lu «· Следовательно, оно комплексно линейно. Оно называется комплексификацией отображения f. Очевидно, idc = id, (af + bg)c = =afc + bgc\ α, be R; и (fg)c = fcgc. Рассматривая пару базисов L и Μ как базисы Lc и Мс соответственно, убеждаемся, что матрица отображения f в исходной паре базисов совпадает с матрицей отображения /с в этой «новой» паре. В частности, (комплексные) собственные значения отображений f и fc и их жордановы формы совпадают. Проследим теперь, что происходит при композиции операций овеществления и комплексификации в двух возможных порядках. 80
11. Сначала комплексификация, затем овеществление. Пусть L — вещественное пространство. Мы утверждаем, что существует естественный изоморфизм (L%->L®L. Действительно, по конструкции Lc совпадает с L0L как вещественное пространство. Аналогично, (fc)R->f®f (в смысле этого отождествления) для любого вещественного линейного отображения f: L-+M. Композиция в обратном порядке приводит к несколько менее очевидному ответу. Введем следующее определение. 12. Определение. Пусть L — комплексное пространство. Сопряженным комплексным пространством L называется множество L с той же структурой аддитивной группы, но с новым умножением на скаляры из С, которое мы временно обозначим а*1: а*1 = Ш для любых аеС, / е L. Аксиомы проверяются без труда, если воспользоваться тем, что аЬ = аЪ и а + Ь = ά + &. Аналогично, если (L, /) — вещественное пространство с комплексной структурой, оператор —/ также определяет комплексную структуру, которая называется сопряженной с исходной. В обозначениях теоремы п. 7, если L — комплексное пространство, отвечающее (L, /), то L -— комплексное пространство, отвечающее (L,-J). 13. Сначала овеществление, потом комплексификация. Теперь мы можем для всякого комплексного линейного пространства L построить канонический комплексно линейный изоморфизм f: (L*)*-+L®L С этой целью заметим, что на (LR)C имеются два вещественна линейных оператора: оператор канонической комплексной структуры ]{luk) = {—hj\) и оператор умножения на /, отвечающий исходной комплексной структуре L: /(Ζι, /2) = (//1, //2). Так как / коммутирует с ι, он комплексно линеен в этой структуре. Поскольку Я = —id, его собственные значения равны ±ί. Введем стандартные обозначения для двух подпространств, отвечающих этим собственным значениям: L1- ° = {(/!, /2) е (IrF | / tf„ /2) = i (li9 «>, L0·■ = {ft, l2) €= (LR)c \J(lb /2) = - i (lu /2)}. Оба множества ΖΛ° и L0»] являются комплексными подпространствами в (Lr)c: ясно, что они замкнуты относительно сложенш: и умножения на вещественные числа, а замкнутость относительно умножения на / следует из того, что ) и i коммутируют. Покажем, что Ζ, = ΖΛ°ΘΖ,0'1, а также, что Ll-°_ естественно изоморфно L, тогда как Ζ,0»1 естественно изоморфно L. βι
Из определений сразу же следует, что L1·0 состоит из векторов вида (/, —i/), a L0»1 — из векторов вида (m,im). Для данных /ь /2eL уравнение (/ь/2) = (/, —И) + (m, im) на'/, т имеет единственное решение / = ! ^ 2 , m= ! ~* 2 . Следовательно, L = = ΖΛ°ΘΖ,0'1. Отображения L-+Ll>°: /ь->(/,—//) и C-^L0·1: /·—>(/,//) являются вещественно линейными изоморфизмами. Кроме того, они перестановочны с действием ί на L, L и действием / на ΖΛ0, L0'! в силу определений. Это завершает нашу конструкцию. 14. Полулинейные отображения комплексных пространств. Пусть L, Μ — комплексные линейные пространства. Полулинейным (или антилине иным) отображением f: L-+M называется линейное отображение f: L-+M. Иными словами, f — гомоморфизм аддитивных групп, и f(al) = af(l) для всех аЕС, /gL Особая роль полулинейных отображений станет ясна во второй части, при изучении эрмитовых комплексных пространств. 15. Подъем поля скаляров: общая ситуация. Пусть, как в п. 4, К — некоторое поле, Ж— его подполе. Тогда для любого линейного пространства L над Ж можно определить линейное пространств K®Ly или L*, над /С, сохранив размерность. До введения ж языка тензорных произведений дать общее определение LK затруднительно, но для практических целей достаточно следующего полуфабриката: если {ей ...» еп) — базис L над Ж, то LK состоит из всех формальных линейных комбинаций \ Σ aiei \αι е К(> τ· е. имеет тот же базис над К. В частности, (Жп)к = Кп. По Jif-линей- ному отображению f: L-+M определяется /(-линейное отображение fK: LK->MK: если f задано матрицей в некоторых базисах L и М, то fK задается той же матрицей. В заключение укажем одно приложение комплексификации: 16. Предложение. Пусть f: L-+L — линейный оператор в вещественном пространстве размерности ^1. Тогда f имеет инвариант- ное подпространство размерности 1 или 2. Доказательство. Если / имеет вещественное собственное значение, то подпространство, натянутое на соответствующий собственный вектор, инвариантно. В противном случае все собственные значения комплексны. Выберем одно из них λ + /μ. Оно будет также собственным значением fc в Lc. Возьмем соответствующий собственный вектор 1\ + И2 в Lcr /ь /2eL. Согласно определениям /с {/| + щ) = f(l{) + if (у = (λ + ίμ) ft + il2) = (Xl{ - μ/2) + i (μ/ι + λ/2). Следовательно, f(l\) = M\ — μ/2, /(/2) = μ/ι + λ/2, и линейная оболочка {/ь k) в L /-инвариантна. 82
§13. Язык категорий 1. Определение категории. Категория С состоит из следующих данных: а) Класс (или множество) Ob С, элементы которого называются объектами категории. б) Класс (или множество) Мог С, элементы которого называются морфизмами категории, или стрелками, в) Для каждой упорядоченной пары объектов Χ, У е Ob С задано множество Нотс (X, У) cz Мог С, элементы которого называются морфизмами из X в Υ и обозначаются Χ-+Υ или f: Х-*· Υ или X —> Υ. г) Для каждой упорядоченной тройки объектов X, У, Ζ е Ob С задано отображение Нотс(Х, Г) X Нотс (Г, Z)-*HomcCY, Z), сопоставляющее паре морфизмов (/,g) морфизм gf, или gof, называемый их композицией, или произведением. Эти данные должны удовлетворять следующим условиям: д) Мог С есть несвязное объединение (J Homc (Χ, Υ) по всем упорядоченным парам X, УеОЬС. Иными словами, для каждого морфизма f однозначно определены объекты Χ, Υ такие, что f e Нот С(Х, Y): начало X и конец Υ стрелки /. е) Композиция морфизмов ассоциативна. ж) Для каждого объекта X существует тождественный морфизм id* e Homc(X, X) такой, что id* of = foid* =/ всякий раз, когда эти композиции определены. Нетрудно видеть, что такой морфизм единствен: если \άχ— другой морфизм с тем же свойством, то id^ = id^oidx= idx. Морфизм f: X-+Y называется изоморфизмом, если существует такой морфизм g: У->X, что gf = id*, fg = idy. 2. Примеры, а) Категория множеств Set. Ее объекты — множества, морфизмы — отображения множеств. б) Категория Sin ж линейных пространств над полем Ж. Ее объекты — линейные пространства, морфизмы — линейные отображения. в) Категория групп. г) Категория абелевых групп. Различия между классом и множеством обсуждаются в аксиоматической теории множеств и связаны с необходимостью избежать знаменитого парадокса Рассела. Не всякое собирание объектов воедино образует множество, ибо понятие «множество всех множеств, не содержащих самих себя в качестве элемента», противоречиво. В аксиоматике Гёделя — Бернайса такие собрания множеств называются классами. Техника теорий категорий требует собираний объектов, лежащих в опасной близости к таким парадоксальным ситуациям. Мы, однако, будем пренебрегать этими тонкостями. 83
3. Диаграммы. Поскольку в аксиоматике категорий ничего не говорится о теоретико-множественной структуре объектов, мы не можем в общем случае работать с «элементами» этих объектов. Все основные общекатегорные конструкции и их приложения к конкретным категориям формулируются преимущественно в терминах морфизмов и их композиции. Удобный язык для таких формулировок — это язык диаграмм. Например, вместо того чтобы говорить, что у нас имеются четыре объекта X, К, £/, V, четыре мор- физма /е=Нотс(Х, К), ge=Homc(K, К), Ле= Нотс(Х, U) и dE Homc(t/, V), причем gf = dh, говорят, что задан коммутативный квадрат τ τ «Коммутативность» здесь — это равенство gf = dh, которое означает, что «два пути вдоль стрелок» от X к V приводят к одному и тому же результату. Более общо, диаграмма — это ориентированный граф, вершины которого являются объектами С, а ребра — морфизмами, например X ^Y ^Ζ I I "IT ^-V *~W Диаграмма называется коммутативной, если любые пути вдоль стрелок в ней с общими началом и концом отвечают одинаковым морфизмам. В категории линейных пространств, а также в категории абе- левых групп особенно важен класс диаграмм, называемых комплексами. Комплекс имеет вид последовательности объектов и стрелок ... X-+Y-+U-+V-+ ..., конечной или бесконечной, которая удовлетворяет следующему условию: композиция любых двух соседних стрелок является нулевым морфизмом. Заметим, что понятие нулевого морфизма не является общекатегорным: оно специфично для линейных пространств и абелевых групп и для специального класса категорий — так называемых аддитивных категорий. Часто объекты, входящие в комплекс, и морфизмы нумеруются некоторым отрезком целых чисел: γ * γ u γ ' γ * • · · —^ Λ _| > Aq * Λ j > Λ 2 *" · · · 84
Такой комплекс линейных пространств (или абелевых групп) называется точным в члене Х^ если Im fi-{ = Ker ft (заметим, что в определении комплекса условие f/°//-i =0 означает только, что Im/t-_ic: Ker/,·). Комплекс, точный во всех членах, называется точным, или ацикличным, или точной последовательностью. Вот три простейших примера: а) Последовательность 0->L-^->M всегда является комплексом; она точна в члене L тогда и только тогда, когда Кем — образ нулевого пространства 0. Иными словами, точность здесь означает, что i— инъекция. б) Последовательность Λί—► Ν-+0 всегда является комплексом; точность его в члене N означает, что Im/ = Ν, т. е. что / — сюръекция. в) Комплекс 0->L—►Λί—> Ν-> Оточен, если i — инъекция, / — сюръекция и Im / = Ker /. Отождествив L с образом ί — подпространством в М, мы можем поэтому отождествить N с фак- торпространством M/L, так что такие «точные тройки» являются категорными представителями троек (Lcz Μ, M/L). 4. Естественные конструкции и функторы. В математике весьма важны конструкции, которые можно применять к объектам некоторой категории так, что при этом снова получаются объекты категории (другой или той же самой). Если эти конструкции являются однозначными (не зависят от произвольных выборов) и универсально применимыми, то часто оказывается, что они переносятся и на морфизмы. Аксиоматизация ряда примеров привела к важному понятию функтора, впрочем, естественному и с чисто категорной точки зрения. 5. Определение функтора. Пусть С, D — две категории. Функтором F из категории С в категорию D называется задание двух отображений (обычно обозначаемых также F): Ob С ->- Ob D, Мог С-»· Мог D, которые· удовлетворяют следующим условиям: а) если /е=Нотс(Х, К), то F(f)€=HomD(F(X), F(Y)); б) F(gf) = F(g) F(/) всякий раз, когда композиция gf определена, и F(\dx) = \dF(X) для всех X е Ob С. Функторы, которые мы определили, часто называют ковариант- ными функторами. Определяют также контравариантные функторы, «обращающие стрелки»: для них условия а) и б) заменяются условиями а') если fe=Homc(X, К), то F(f) e= HomD(F(y), F(X))\ 60 F(gf) = F(f)F(g) и F(id*)=icW Можно избежать этого различения, если ввести конструкцию, ставящую в соответствие каждой категории С дуальную категорию С° по правилу: Ob С = Ob С°, Мог С = Мог С° и Homc(X, Y) = =Нотс° (Уу X), причем композиция gf морфизмов в С отвечает композиции fg этих же морфизмов в С°, взятых в обратном порядке. Удобно обозначать через Х°, f° объекты и морфизмы в С0, отвечающие объектам и морфизмам X, f в С. Тогда коммутативная 85
диаграмма в С / X ^Y \/г ζ отвечает коммутативной диаграмме в С° /· *с—--—Г r\/t z° (Ковариантный) функтор F: C-+D° можно отождествить с кон- травариантным функтором F: C->Db смысле данного выше определения. 6. Примеры, а) Пусть Ж — поле, &ίηχ — категория линейных пространств над Ж, Set — категория множеств. В § 1 мы объяснили, как любому множеству S e Ob Set поставить в соответствие линейное пространство F(S)^ Ob Sitipc функций на S со значениями в Ж. Поскольку это естественная конструкция, следует ожидать, что она может быть продолжена до функтора. Так оно и есть. Функтор оказывается контравариантньш: морфизму /: S-+T он ставит в соответствие линейное отображение F(f): F(T)-*F(S), чаще обозначаемое /* и называемое подъемом, или обратным образом, на функциях: Πφ) = φο/, где f:S-+T, φιΤ-^Ж. Иными словами, /*(ф)—это функция на S, значения которой постоянны вдоль «слоев» f~l(t) отображения f и равны φ (t) на таком слое. Хорошее упражнение для читателя — проверить, что мы действительно построили функтор. б) Отображение двойственности: 3?έηχ-+3?ιηχ, на объектах задаваемое формулой L*—>L* = i?(L,Ж), а на морфизмах — формулой /»—»/*, является контравариантньш функтором из категории 3?inyc в себя. По существу, это доказано в § 7. в) Операции комплексификации и овеществления, изученные в § 12, определяют функторы l?mR-> SY/ic и Siriz-^Sin^ соответственно. То же относится к более общим конструкциям подъема и спуска поля скаляров, кратко описанным в § 12. г) Для любой категории С и любого объекта X е Ob С определены два функтора из С в категорию множеств: ковариантный hx: C->Set и контравариантньш hx: C->Set°. Вот их определения: hx(Y) = Homc(X, У), hY(f: Y-+Z) есть отображение hx (Υ) = Homc (X, Κ)-> hx (Ζ) = Homc (Χ, Ζ), которое ставит в соответствие морфизму Χ-+Υ его композицию с морфиз- мом f: Y-+Z. 86
Аналогично, hx(Y) = Homc(K,X) и hx(f: Y-+Z) есть отображение Л*(Ζ) = Homc(Z, X)-+hx(Y)= Homc(Y,X), которое ставит в соответствие морфизму Z-+X его композицию с морфизмом /: K->-Z. Проверьте, что hx и hx действительно являются функторами. Их называют функторами, представляющими объект X категории. Заметим, что если C = 3?inx> то hx и hx можно считать функторами со значениями также в iinyc, а не в Set. F С 7. Композиция функторов. Если С\ —► С2—> С3 — три категории и два функтора между ними, то композиция GF: С\-+Сг определяется как теоретико-множественная композиция отображений на объектах и морфизмах. Тривиально проверяется, что она является функтором. Можно ввести «категорию категорий», объектами которой являются категории, а морфизмами — функторы! Более важной, однако, является следующая ступень этой высокой лестницы абстракций: категория функторов. Мы ограничимся объяснением, что такое морфизмы функторов. 8. Естественные преобразования естественных конструкций, или функторные морфизмы. Пусть F, G: C->D-—два функтора с общими началом и концом. Функторным морфизмом φ: F-+G называется класс морфизмов объектов φ(Χ): F(X)-+G(X) в категории D, по одному для каждого объекта X категории С, обладающий тем свойством, что для каждого морфизма /: X-+Y в категории С квадрат F(X)' φ(Χ) G(X) r(f) 4f) Φ(Υ) F(Y) -JLLL·^ G(Y) коммутативен* Функторный морфизм называется изоморфизмом, если все φ (Я) суть изоморфизмы. 9. Пример. Пусть **: Sitix-> Sinyc — функтор «двойного сопряжения»: Lb—>L**, f»—>/**. В § 7 мы построили для каждого линейного пространства L каноническое линейное отображение el: L»—>L**. Оно определяет функторный морфизм ем: Id-»-'»», где Id — тождественный функтор на SZinyc, ставящий в соответствие каждому линейному пространству само это пространство и каждому линейному отображению — само это отображение. Действительно, согласно определению, мы должны проверить коммутативность всевозможных квадратов вида 87
Для конечномерных пространств L, Μ это устанавливается с помощью утверждения д) теоремы п. 5 § 7. Проверку в общем случае предоставляем читателю. УПРАЖНЕНИЯ 1. Пусть Seto — категория, объектами которой являются множества, а мор- физмами — такие отображения множеств f: S-**T, что для любой .точки /εΓ слой f~l(t) конечен. Показать, что следующие данные определяют ковариантный функтор FQ: Set0-* 9?ίηχ: а) Fo(S) = F(S): функции на 5 со значениями в Ж; б) для любого морфизма f: S-+T и функции φ: S-ь-Ж функция /70(/)(φ) = «= /*(φ) &F(T) определяется так: Ыф)Ю- Σ ф« s&rl(t) («интегрирование по слоям>). 2. Доказать, что спуск поля скаляров с К до Ж (см. § 12) определяет функтор SBirtyQ -> SBin^ § 14. Категорные свойства линейных пространств 1. В этом параграфе собраны некоторые утверждения о категории всех линейных пространств &ιη& или конечномерных линейных пространств SPittf^ над данным полем Ж. По большей части они являются переформулировкой на категорном языке утверждений, которые мы уже доказали раньше. Их выбор обусловлен следующим своеобразным критерием: это как раз те свойства категории &ιηχ, которые нарушаются для таких наиболее близких категорий, как категория модулей над общими кольцами (например, над Ζ, т. е. категория абелевых групп) или даже категория бесконечномерных топологических пространств. Детальное изучение этих нарушений для категории модулей составляет основной предмет гомологической алгебры, а в функциональном анализе часто приводит к поиску новых определений, которые позволяют восстановить «хорошие» свойства 3?infx (таково понятие ядерных топологических пространств). 2. Теорема о продолжении отображений. а) Пусть Ρ, Μ, Ν — линейные пространства, Ρ конечномерно, /: Μ-+Ν— сюръективное линейное отображение. Тогда любое линейное отображение g: P-+N можно поднять до такого линейного отображения h: Ρ->Λί, что g = jh. Иными словами, диаграмму с точной строкой Ρ У t Μ »- N *- О
можно вложить в коммутативную диаграмму М- J-*~N *~0 б) Пусть Р, L, М —линейные пространства, Μ конечномерно, v. L-+M — инъективное линейное отображение. Тогда любое линейное отображение g: L-+P можно продолжить до линейного отображения h: M-+P так, что g = hi. Иными словами, диаграмму с точной нижней строкой р 4 М-е- -х^- можно вложить в коммутат^ную диаграмму ж^- р Доказательство, а) Выберем базис {в\, ..., еп} в Р, положим e't = g(e^ ^ N. В силу сюръективности / существуют векторы е" е Λί такие, что /(e") = ej, /=1, ...,п. По предложению п. 3 § 3, существует единственное линейное отображение Л: Р-+М такое, что A (et) =e", i = 1, ..., п. По конструкции /А (е,) = / (#")= = e'i = g(ei). Так как {е*} образуют базис Р, имеем jh = g. б) Выберем базис {e'v ..., ^} пространства L и продолжим ek = i(e'k), 1<£<т, до базиса {еи ..., ет; ет+1, ..., еп) пространства М. Положим А {е^ = g (е\) при 1 ^ i ^ m, Л(е/) = О при т + 1 ^ / ^ п. Такое отображение существует по тому же предложению п. 3 § 3. Можно также прямо применить предложение п. 8 § 6. Теорема доказана. В категории модулей объекты Р, удовлетворяющие условию а) теоремы (при всех Μ, Ν), называются проективными, а объекты, удовлетворяющие условию б), — инъективными. Мы доказали, что в категории конечномерных линейных пространств все объекты проективны и инъективны. 3. Теорема о точности функтора S7. Пусть О -> L —► Μ —> N -► ->0—точная тройка конечномерных линейных пространств, Ρ — любое конечномерное пространство над тем же полем. Тогда & W
как функтор отдельно по первому и второму аргументу индуцирует точные тройки линейных пространств: а) 0-*5*(Р, L)-^S*(P, Af)A#(p, tf)-*0, б) 0+-S?(L, Р)^-2?{М, Ρ)^3?{Ν, Р)<-0. Доказательство, а) Напомним (см. пример г) п. 6 § 13), что /ι ставит в соответствие морфизму P-+L его композицию с i: L-+M, a /Ί ставит в соответствие морфизму Р->М его композицию с /: M-+N. Отображение ίι инъективно, потому что i — инъекция, так что если композиция Ρ -> L—> Μ нулевая, то P-+L — нулевой морфизм. Отображение j{ сюръективно в силу утверждения а) теоремы п. 2: любой морфизм g: P-+N можно поднять до морфизма Ρ->Λί, композиция которого с / дает исходный морфизм. Композиция j\ii нулевая: она переводит стрелку P->L в стрелку P-+N, которая является композицией P-+L—► —> Μ —► Ν, но ji = 0. Мы проверили, таким образом, что последовательность а) является комплексом, и остается установить ее точность в среднем члене, т. е. Ker/i = ImiV Мы уже знаем, что Кег/Ί =э InuV Для доказательства обратного включения заметим, что если стрелка Р-+-М лежит в ядре /ι, то композиция этой стрелки с /: Μ-+Ν равна нулю, а потому образ Ρ в Μ -лежит в ядре /. Но ядро / совпадает с образом i(L)cz M в силу точности исходной тройки. Значит, Ρ отображается в подпространство i(L), и потому стрелку Р-+М можно поднять до стрелки P-+L, композиция которой с i даст исходную стрелку. Это и означает, что последняя лежит в образе i\. б) Здесь рассуждения совершенно аналогичны, или, точнее, двойственны. Отображение 1ч сюръективно в силу утверждения б) теоремы п. 2. Отображение /г инъективно, потому что если композиция Μ—>Ν->Ρ равна нулю, то и стрелка Ν-+Ρ нулевая, так как / сюръективно. Композиция щч равна нулю, ибо композиция L-+M—+Ν-+Ρ нулевая для любой последней стрелки. Поэтому остается доказать, что Кег /г с= Im /2 (обратное включение только что проверено). Но стрелка Μ —► Ρ лежит в ядре /2, если ί f композиция L—►Λί—>Р нулевая. Значит, L=Ker/ лежит в ядре f. Определим отображение /: N-+P формулой J(n) = f(j-l(n)), где /^(rtJGM — любой прообраз п. От выбора этого прообраза ничего не зависит, ибо Кег / с= Кег /. Легко проверить, что / линейно и что /2(f) = f; в самом деле, fa{J) есть композициям —> N—>Р9 которая переводит meAf в fj(m) = f(j-l(j(m))) = f(m). Теорема доказана. 4. Категорная характеризация размерности. Пусть G — некоторая абелева группа, записываемая аддитивно, χ: ObS inf^-^G — 90
произвольная функция, определенная на конечномерных линейных пространствах и удовлетворяющая двум условиям: а) если L и Μ изоморфны, то χ(Ζ,) = χ(Μ); б) для любой точной тройки пространств 0->L->A4->N->0 имеем %(M) = x(L)-{- χ(Ν) (такие функции называются аддитивными). Имеет место 5. Теорема. Для любой аддитивной функции χ имеем X(L)=dimzcL-%(X*)9 где L — произвольное конечномерное пространство. Доказательство. Проведем индукцию по размерности L. Если L одномерно, то L изоморфно Ж\ так что %(L) = x(Xl) = =a\mxL · χ pi?1)· Пусть теорема доказана для всех L размерности и. Если размерность L равна п+1, выберем одномерное подпространство LqCz L и рассмотрим точную тройку О L/L0->0, где i — вложение L0, a /(/) = / +Lo^ L/Lo. В силу аддитивности χ и индуктивного предположения χ (L) = χ (L0) + % Wo) = X {Χ1) + dim^ (L/L0) χ (X') = = x№) + nxm = (n+l)x(Xi)=dimxL-x(X*). Теорема доказана. Этот результат является самым началом большой алгебраической теории, которая сейчас активно развивается, — так называемой /(-теории, лежащей на стыке топологии и алгебры. у УПРАЖНЕНИЯ "о "ι 1. Пусть К: 0-^L{-U »Ln —>· 0 — комплекс конечномерных линейных пространств. Факторпространство //'(/С) == Ker di/lmdi-i называется ί-м пространством когомологий этого комплекса. Число χ (К) = η = V (—-1)* dim Li называется эйлеровой характеристикой комплекса. Доказать, что Х(К)= Σ (-1)'dim #'(*). г=1 2. «Лемма о змее». Пусть дана коммутативная диаграмма линейных пространств *-0 91
с точными строками. Показать, что существует точная последовательность пространств Кег / -> Ker g -> Ker h —*► Coker / -> Coker g -> Coker h, в которой все стрелки, кроме δ, индуцированы dlt d2, а{, d2 соответственно, а связывающий гомоморфизм δ (называемый также кограничным оператором) определяется так: чтобы определить ό(/ι) для /ιε Kerh, следует найти meAi с n = d2(tn), построить g(m)€=AT, найти / el' с rf](/)<=g(/n) и положить 5(л) = V + Im/ е= Coker /. В частности, следует проверить существование δ (η) и его независимость от произвола в промежуточных выборах. di / t di ι 3. Пусть К: . ..->Ζ^—> Li+1-> ... и К: ...->► Lj—> Li+l -> ... —два комплекса. Морашзмом f: /(-►/(' называется такой набор линейных отображений If. Li -> Lit что все квадраты ^ Li + 1 4 τ 4- 1 -&_J •ί+1 ' 'г+1 коммутативны. Показать, что комплексы и их морфизмы образуют категорию. 4. Показать, что отображение К-+Н1(К) продолжается до функтора из категорий комплексов в категорию линейных пространств. f w g 5. Пусть 0 -> К * /С' > К" -> 0 — точная тройка комплексов и их мор- физмов. По определению, это означает, что для каждого i тройки линейных пространств О -> Lj —► L; —> Lj -> О точны. Пусть И1 — соответствующие пространства когомологий. Пользуясь леммой о змее, построить последовательность пространств когомологий ...^HUK)^ Н1 (К') -> Н1 (К") -Д> Hi+l (К) -+ ... и показать, что она является точной.
Ч а с т ь 2. ГЕОМЕТРИЯ ПРОСТРАНСТВ СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ § 1. О геометрии 1. Эта и следующая части нашего курса посвящены теме, ко торую можно назвать «линейные геометрии», и ей уместно предпослать краткое обсуждение современного смысла слов «геометрия» и «геометрический». В течение многих столетий под геометрией понималась геометрия Евклида на плоскости и в пространстве. Она продолжает составлять основное содержание обычного школьного курса, и эволюцию геометрических понятий удобно проследить на примере характерных особенностей этой, ныне весьма частной, геометрической дисциплины. 2. «Фигуры». Школьная геометрия начинается с изучения таких фигур на плоскости, как прямые, углы, треугольники, окружности и круги и т. п. Естественное обобщение этой ситуации состоит в выборе некоторого пространства М, «объемлющего пространства» нашей геометрии, и некоторого множества подмножеств вМ — изучаемых в этом пространстве «фигур». 3. «Движения». Вторая существенная компонента школьной геометрии — это измерение длин и углов и выяснение соотношений между линейными и угловыми элементами различных фигур. Потребовалось длительное историческое развитие, прежде чем было осознано, что в основе этих измерений лежит существование отдельного математического объекта — группы движений евклидовой плоскости или евклидова пространства как целого, и что все метрические понятия могут быть определены в терминах этой группы. Например, расстояние между точками является единственной функцией от пары точек, инвариантной относительно группы евклидовых движений (если потребовать ее непрерывности и еще выбрать «единицу длины» — расстояние между убранной парой точек). «Эрлангенская программа» Ф. Клейна (1872) зафиксировала понимание этого замечательного принципа, и «геометрией» надолго стало изучение пространств М, снабженных достаточно большой группой симметрии, и свойств фигур, инвариантных относительно действия этой группы, включая углы, расстояния и объемы. 4. «Числа». Открытием столь же фундаментальной важности (и гораздо более ранним) был декартов «метод координат» и основанная на нем аналитическая геометрия плоскости и пространства. №
С современной точки зрения координаты суть некоторые функции на пространстве Μ (или на его подмножествах) с вещественными, комплексными или еще более общими значениями. Задание конкретных значений этих функций позволяет зафиксировать точку пространства, а задание соотношений между этими значениями определяет множество точек. Описание класса рассматриваемых в данной геометрии фигур в Μ можно заменить описанием класса соотношений между координатами, которые описывают интересующие нас фигуры. Поразительная гибкость и сила метода Декарта связана с тем, что функции на пространстве можно складывать и умножать, интегрировать, дифференцировать и применять другие процессы предельного перехода и в конечном счете пользоваться всей мощью математического анализа. Все общие современные геометрические дисциплины — топология, дифференциальная и комплексно аналитическая геометрия, алгебраическая геометрия — выбирают в качестве исходного определения понятие геометрического объекта как совокупности пространства Μ и. заданной на нем совокупности F (локальных) функций. 5. «Отображения». Если (Aii,Fi) и (Λί2, F2) — два геометрических объекта описанного выше типа, то можно рассматривать отображения Λίι->Μ2, которые обладают тем свойством, что обратное отображение на функциях переводит элементы из F2 в элементы из F\. В наиболее логически завершенных схемах среди таких отображений находятся как группы симметрии Ф. Клейна, так и сами координатные функции (как отображения Μ в R или С). Геометрические объекты образуют категорию, и ее морфизмы служат достаточно тонкой заменой симметрии даже в тех случаях, когда этих симметрии не слишком много (как у общих римановых пространств, где можно измерять длины, углы и объемы, но движений, вообще говоря, недостаточно). 6. Линейные геометрии. Теперь мы можем охарактеризовать место линейных геометрий в этой общей картине. В известном смысле слова линейные геометрии относятся к числу непосредственных потомков геометрии Евклида. Рассматриваемые в них пространства Μ суть либо линейные пространства (теперь уже над общими полями, хотя R или С по-прежнему остаются в центре внимания, особенно ввиду многочисленных приложений), либо пространства, производные от линейных: аффинные («линейные пространства без отмеченного начала координат») и проективные («аффинные пространства, пополненные бесконечно удаленными точками»). Группы симметрии суть подгруппы линейной группы, которые сохраняют фиксированное «скалярное произведение», а также их расширения сдвигами (аффинные группы) или факторгруппы по гомотетиям (проективные группы). Рассматриваемые функции линейны или близки к линейным, иногда квадратичны. Фигуры суть линейные подпространства и многообразия (обобщения прямых на евклидовой плоскости) и квадрики (обобщения окружностей). Можно представлять себе эти обобщения евклидовой геометрии как результат чисто логического анализа, и устано- 94
вившийся формализм линейных геометрий действительно обладает удивительной стройностью и компактностью. Но жизнеспособность этой ветви математики в значительной мере связана с ее многообразными естественнонаучными приложениями. Понятие скалярного произведения, лежащее в основе всей второй части курса, может служить для измерения углов в абстрактных евклидовых пространствах. Но математик, который не знает, что оно же измеряет вероятности (в моделях квантовой механики), скорости (в пространстве Минковского специальной теории относительности) и коэффициенты корреляции случайных величин (в теории вероятности), лишается не только общей широты кругозора, но и гибкости чисто математической интуиции. Поэтому мы сочли необходимым включить в курс сведения и об этих интерпретациях^ § 2. Скалярные произведения 1. Полилинейные отображения. Пусть Li, ..., Ln, M — линейные пространства над общим полем Ж, Полилинейным отображением (при η = 2 билинейным) называется отображение /: АХ ... XLrt-M, (ll9 ..., ln)^f(lu ..., WeAi, которое линейно как функция любого из аргументов /,· е L,- при фиксированных остальных //eL/, /=1, ..., я, \Фи Иными словами, \{lv .··, li + li> /ί+Ρ ···, g = =f(/P ...,/„...,/,) + /(/„..., /;,..., g, f(lx, ..., alh /ί+1, ..., ln) = af:(/,, ..., lh ..., ln) для i = 1,..., η; а^Ж. В случае М=Ж полилинейные отображения называются также полилинейными функциями, или формами, В первой части мы уже встречались с билинейными отображениями CXL-^Ж: (f,l)^f(l), fe=L*, /e=L; ^(L,M)XL->M: (f,Q*-*f(l), /е=#(1,М), /gL Определитель квадратной матрицы полилинеен как функция от ее строк и столбцов. Еще один пример: ЖпХЖт-+ Ж: £ν)*->Σ gifXiUf = *'<?J, где G — любая матрица размера пХ т над Ж, векторы из Жпу Жт представлены столбцами своих координат. Общие полилинейные отображения мы будем изучать позже, в части, посвященной тензорной алгебре. Здесь же мы займемся важнейшим для приложений классом билинейных функций L XL-^Ж, а также, при Ж = С, функций L X £-> С, где L — пространство? комплексно сопряженное с L (см. ч. 1, § 12). Каждая 95
такая функция называется также скалярным произведением или метрикой, на пространстве L, и пара (L, скалярное произведение) рассматривается как единый геометрический объект. Изучаемые в этой части метрики лишь в специальных случаях являются метриками в смысле определения п. 1 § 10 ч. 1, и читатель не должен смешивать эти омонимы. Скалярное произведение LXL-^C чаще всего рассматривают как полуторалинейное отображение g: LXL->C, линейное по первому аргументу и полулинейное по второму: g(a/i, &/2)=a5g(/b/2). 2. Способы задания скалярного произведения, а) Пусть g: LX XL->Jif (или LXL->C)—некоторое скалярное произведение на конечномерном пространстве L. Выберем базис {е\, ..., еп) в L и определим матрицу G = (g(eh ef)); i, /=1, ..., п. Она называется матрицей Грама базиса {еь ..., еп} относительно g, а также матрицей g в базисе {еи ..., еп}. Задание {ei) и G вполне определяет g, потому что в силу свойства билинейности g (х> У) = 8\jL *ieh Σ yfi J = i Σ ι Xi\}\g teh ej) = x*Gy. В случае полуторалинейной формы аналогичная формула приобретает вид g (*> у) = g (^ х&> Σ У\е\) = ι Σ j XiSiS (eh ei) = x*Gy. Наоборот, если базис {еь ..., еп} фиксирован, a G— любая матрица размера /гХп над Ж, то отображение (х, y)->xGy (или ■>.^ χ Gy в полуторалинейном случае) определяет скалярное произведение на L с матрицей G в этом базисе, как показывают очевидные проверки. Таким образом, наша конструкция устанавливает биекцию между скалярными произведениями (билинейными или полуторалинейными) на n-мерном пространстве с базисом и матрицами размера ηΧη. , Выясним, как меняется G при замене базиса. Пусть А — мат- рица перехода к штрихованному базису. В координатах: χ = Αχ\ где χ — столбец координат вектора в старом базисе, а х'— столбец его же координат в новом. Тогда в билинейном случае g(t у) = х'0}=(А^>'0(Ау') = (х'? Α'ΟΑΪ', так что матрца Грама штрихованного базиса равна AlGA. Аналогично, в полуторалинейном случае она равна AlGA. В первой части курса матрицы служили нам в основном для записи линейных отображений, и интересно выяснить, нет ли естественного линейного отображения, связанного eg и отвечающего 96
матрице Грама G. Оно действительно существует, и его конструкция дает равносильный способ задания скалярного произведения, б) Пусть g: LY^L-^Ж — скалярное произведение. Поставим в соответствие каждому вектору /eL функцию gr. L-^Ж, для которой gi (т) = g (/, т), me=L. Эта функция линейна по т в билинейном случае и антилинейна в полуторалинейном, т. е. gi ^ L* или соответственно gi e= L* для каждого /. Кроме того, отображение g: L-+L* или L-+L*: l*—>gi = g(l) линейно, канонически построено по g и однозначно определяет g по формуле i(/. "О = «(/), m)9 где внешние скобки справа обозначают каноническое билинейное отображение L* X L-^Ж или L*XL->C. Наоборот, по любому линейному отображению g: L->L* (или L->L*) однозначно восстанавливается билинейное отображение g: LX L->Ji? (или g: LX£-> С) по той же формуле g{l> m) = {g{l\ m). Связь с предыдущей конструкцией такова: если в L выбран базис {ей .··, еп] и g задается матрицей G в этом базисе, то g задается матрицей G1 в базисах {еь ..., еп}У {е\ ..., еп), двойственных друг другу. Действительно, если g задано матрицей G', то соответствующее скалярное произведение g в двойственных базисах имеет вид g Й У) = (g Й. J) = (g Й)' У (или (g (χ)γ у) = =»(G'x)'?(или {G'xYh^'Gy(или leWy), что доказывает требуемое. Здесь мы пользовались замечанием, сделанным в § 7 ч. 1, о том, что каноническое отображение L*X У(Ь-+Ж в двойственных базисах определяется формулой (х, у)=* *=х*у. 3. Свойства симметрии скалярных произведений. Перестановка аргументов в билинейном скалярном произведении g определяет новое скалярное произведение g*: £*(/, m) = g(m9l). В полуторалинейном случае эта операция также меняет места «линейного» и «полулинейного» аргументов; если мы хотим, чтобы этого не произошло, то удобнее рассматривать g*: ёг (/, m)=*g (m, /). 97
У g{ линейный аргумент будет на первом месте, если у g он был на первом месте, а полулинейный — соответственно на втором. Операция g^~->gt или g''—>gt легко описывается на языке матриц Грама: она отвечает операции G*—>Gf или Gt-^G* соответственно (предполагается, что g, gf, g* пишутся в одном и том же базисе L).Действительно, 8* (х, У) = 8 (Р х) = Ρόχ = &(&)' = x'G% 8f(x>y) = g (P x) = pGx = (pGxY = Ic'&y. Мы будем заниматься почти исключительно скалярными произведениями, которые удовлетворяют одному из следующих условий симметрии относительно этой операции: а) g* == ё· Такие скалярные произведения называются симметричными, а геометрия пространств с симметричным скалярным произведением называется ортогональной геометрией. Симметричные скалярные произведения задаются симметричными матрицами Грама G. б) ё* = —ё- Такие скалярные произведения называются антисимметричными, или симплектическими, а соответствующие геометрии называются симплектическими. Им отвечают антисимметричные матрицы Грама. Полуторалинейный случай: в) g* = g. Такие скалярные произведения называются эрмитово симметричными, или просто эрмитовыми, а соответствующие геометрии— эрмитовыми. Им отвечают эрмитовы матрицы Грама. Из условия gf = g следует, ч*го g(l, I) = g(l, I) для всех /gL, т.е. все значения g(l, l) вещественны. Эрмитово антисимметричные скалярные произведения обычно не рассматриваются специально, ибо отображение g*—>ig устанавливает биекцию между ними и эрмитово симметричными скалярными произведениями: £'»=£-«* №?= — /£. Геометрические свойства скалярных произведений, отличающихся друг от друга лишь множителем, практически одни и те же. Напротив, ортогональная геометрия во многом отличается от симп- лектической: редукция соотношений g* = g и g* = —g друг к другу таким простым способом невозможна. 4. Ортогональность. Пусть (L,g)—векторное пространство со скалярным произведением. Векторы /ь k^L называются ортогональными (относительно g), если £Τ(/ι, /а) = 0. Подпространства L\, L<idL называются ортогональными, если g(/b/2) = 0 для всех U е L\, I2&L2. Основная причина, по которой важны лишь скалярные произведения с одним из свойств симметрии предыдущего пункта, состоит в том, что для них свойство ортогональности векторов или подпространств симметрично относительно этих векто- 98
ров или подпространств. Действительно: если gf = ±g или g* = g, то g(l9 m) = 0<^±gt(lt m) = 0<^g(mt /) = 0 и аналогично в эрмитовом случае (по поводу обратного утверждения см. упражнение 3). Если не оговорено обратное, в дальнейшем мы будем рассматривать только ортогональные, симплектические или эрмитовы скалярные произведения. Первое применение понятия ортогональности содержится в следующем определении. 5. Определение, а) Ядром скалярного произведения g на про- странстве L называется множество всех векторов I e L, ортогональных ко всем векторам L. б) g называется невырожденным, если ядро формы g тривиально, т. е. состоит только из нуля. Очевидно, ядро формы g совпадает с ядром линейного отображения g: L-+U (или L-+V) и потому является линейным подпространством в L. Поэтому задание невырожденной формы g можно заменить заданием изоморфизма L-+L* (или £*). Так как матрицей g служит транспонированная матрица Грама G* базиса L, невырожденность g равносильна невырожденности матрицы Грама (любого базиса). В тензорной алгебре и ее приложениях к дифференциальной геометрии и физике очень широко используется то обстоятельство, что невырожденная ортогональная форма g определяет изоморфизм L->L*: оно служит основой техники «поднятия и опускания индексов». Ранг g определяется как размерность образа g, или как ранг матрицы Грама G. 6. Задача классификации. Пусть (Lugi), (L2, £2)— два линейных пространства со скалярными произведениями над полем Ж. Назовем их изометрией любой линейный изоморфизм /: Lic=>L2> который сохраняет значения всех скалярных произведений, т. е. gi (/. /') = А(/ (0, / (О) Для всех /, V е Ц. Назовем такие пространства изометричными, если между ними существует изометрия. Очевидно, тождественное отображение является изометрией, композиция изометрий есть изометрия и линейное отображение, обратное к изометрий, есть изометрия. В следующем параграфе мы решим задачу классификации пространств с точностью до изометрий, а затем изучим группы изометрий пространства с самим собой и покажем, что среди них содержатся классические группы, описанные в § 4 ч. 1. Классическое решение задачи классификации состоит в том, что всякое пространство со скалярным произведением разлагается в прямую сумму попарно ортогональных подпространств малой размерности (один в ортогональном и эрмитовом случае, один или 9*
два — в симплектическом). Поэтому мы закончим этот параграф непосредственным описанием таких маломерных пространств с метрикой. 7. Одномерные ортогональные пространства. Пусть dimL = l, g— ортогональное скалярное произведение на L. Возьмем любой ненулевой вектор /gL. Если g(l, /) = 0, то g = 0, так что g вырожденное и нулевое. Если g(/, 1) = аф0, то для любого х^Ж значение g(xl,xl) равно ах2, так что все значения g(l,l) на ненулевых векторах в L составляют в мультипликативной группе Ж* = Ж\{0\ поля Ж смежный класс по подгруппе, состоящей из квадратов: (ах2\х^Ж*}^Ж*/(Ж*)2. Этот смежный класс полностью характеризует невырожденное симметричное скалярное произведение на одномерном пространстве L: для (Lugi) и (L2,g2) два таких класса совпадают тогда и только тогда, когда эти пространства изометричны. В самом деле, если g\(l\, /i)= ax2, #2 (/г, h)=ay2, где li^Li, то отображение /: /ι — y~lxh определяет изометрию L\ с L2, что доказывает достаточность. Необходимость очевидна. Так как R*/(R*)2 = {±1} и С*=(С*)2, мы получаем следующие важные частные случаи классификации. Над R любое одномерное ортогональное пространство изоме- трично одномерному координатному пространству с одним из трех скалярных произведений: ху, —ху, 0. Над С любое одномерное ортогональное пространство изомет- рично одномерному координатному пространству с одним из двух скалярных произведений: ху, 0. 8. Одномерные эрмитовы пространства. Здесь рассуждения аналогичны. Основное поле равно С; вырожденность формы равносильна ее обращению в нуль. Если же форма невырождена, то множество значений g(l,l) для ненулевых векторов l^L есть смежный класс подгруппы R*+ = {x^R*\x > 0} в группе С*, ибо g(al, al) = aug(l, /) = M2g(/, /), и \а\2 пробегает все значения в R+, когда aGC*. Но каждое ненулевое комплексное число ζ однозначно представляется в виде гегЧр, где ге/?+, а е1* лежит на единичной комплексной окружности, которую мы обозначим С!-{*вСв||г|=1}. На групповом языке это определяет прямое разложение С* = R+X X С* и изоморфизм C7R+-*C*. Таким образом, невырожденные полуторалинейные формы классифицируются комплексными числами, по модулю равными единице. Однако мы еще не полностью учли свойства эрмитовости, которое означает, что g(/, /) = g(ly /), т. е. что значения g(l, l) все вещественны. Поэтому эрмитовым формам отвечают только числа ±1 в С*, как и в ортогональном случае над R. Окончательный ответ: Над С любое одномерное эрмитово пространство изометрично одномерному координатному пространству с одним из трех скалярных произведений: ху, — ху, 0. юр
Одномерные ортогональные пространства над R (или эрмитовы над С) со скалярными произведениями ху, —ху, О (или ху, —ху, 0) в подходящем базисе мы будем называть соответственно положи- тельными, отрицательными и нулевыми. Скалярные произведения ненулевых векторов на себя в них принимают соответственно только положительные, только отрицательные или только нулевые значения. 9. Одномерные симплектические пространства. Здесь мы встречаемся с новой ситуацией: любая антисимметричная форма на одномерном пространстве над полем характеристики Ф2 тождественно равна нулю, в частности, вырождена! Действительно, g(l,l) = -g(l, l)°>2g(/,/) = 0, g(aU bl) = abg(l,l) = 0. Что касается характеристики2,то условие антисимметрии g(ltm) = явг—g(m,/) в этом случае равносильно условию симметрии g(l,m) — g(m, /), так что над такими полями симплектическая геометрия не отличается от ортогональной. Впрочем, у ортогональной геометрии также появляются свои особенности, и ivfbi обычно будем этот случай исключать из рассмотрения. Ясно поэтому, что одномерные симплектические пространства не могут быть строительным материалом для конструкции общих симплектических пространств, и нужно пойти по крайней мере на шаг дальше. 10. Двумерные симплектические пространства. Пусть (L, g) — двумерное пространство с кососимметрической формой g над полем Ж характеристики Ф2. Если форма g вырождена, то она автоматически нулевая. В самом деле, пусть 1Ф0 — такой вектор, что g(l, m)=*0, для всех m&L. Дополним / до базиса {/, /'} в L и учтем, что g(l\lf)sEsg(l9l)s=s0 по предыдущему пункту. Тогда для любых а, 5, -а\ Ьг &Ж имеем ί(α/ + α'/', Ы + Ь'1')щ= = abg(l, l) + ab'g{U l')-a'bg(U t) + bb'g(V, Г) = 0. Пусть теперь g ненулевая и, значит, невырожденная. Тогда существует пара векторов ей еъ с g(e\, 62)== а Ф 0 и даже с а= 1: g(a-leue2)= a-la*=* 1. Пусть g(ei,#2)= 1· Тогда векторы^, е2 линейно независимы и, значит, образуют базис L: если, скажем, е\ =» ае^, то g{ae<i, 62)»= = CLg(e2, еъ)*** 0. В координатах относительно такого базиса скалярное произведение g записывается в виде g (х{е{ + х2е2, у{е{ + у2е2) = хху2 — х2у{ и имеет матрицу Грама Окончательно, получаем: 101
Над полем Ж характеристики Ф2 любое двумерное симплек- тическое пространство изометрично координатному пространству Ж2 со скалярным произведением Х\у% — х2у\ или 0. УПРАЖНЕНИЯ 1. Пусть L, Μ — конечномерные линейные пространства над полем Ж и g: L Χ Μ -►- Ж — билинейное отображение. Назовем левым ядром g множество Lo = {/е L|g(/, m)= 0 для всех шеМ}, правым ядром g множество Λί0 = = {m eM|g(/,m)= 0 для всех /sL). Докажите следующие утверждения: а) dim L/L0 = dim ΜίΜ0. б) g индуцирует билинейное отображение g': L/Lo X Λί/Μ0-*· Jif, g'(l + Eo> m + Mo)= g(/, m), у которого левое и правое ядра нулевые. 2. Докажите, что всякое билинейное скалярное произведение g: LXL-^Ж (над полем Ж характеристики ф2) однозначно разлагается в сумму симметричного и антисимметричного скалярного произведения. 3. Пусть g: LXL-^Ж — такое билинейное скалярное произведение, что свойство ортогональности пары векторов симметрично: из ^τ(/ι, /2) ^= 0 следует^ что g(h> /i)= 0. Докажите, что тогда g либо симметрично, либо антисимметрично. (Указания, а) Пусть /, /η,ηεί. Докажите, что g(l,g(l,n)tn — g(l>m)n) = 0, Пользуясь симметрией ортогональности, выведите отсюда, что g(l,n)g(mj) = «■^(я, l)g(lyfn). б) Положив η «=s /, выведите отсюда, что если g(l,fn)¥=g(m>l)> то #(М)= 0. в) Покажите, что g(n,n) = 0 для любого вектора n^L, если g несимметрично. С этой целью выберите /, m с g(l>m) Φ g(m,l) и разберите отдельно случаи g(l,n) Φ g(n,l), g(l,n) = g(n,l). г) Покажите, что если g(n, η) == 0 для всех n&L, то g антисимметрично.) 4. Дайте классификацию одномерных ортогональных пространств над конечным полем Ж характеристики ф2, показав, что Ж*/(Ж*)2 есть циклическая группа второго порядка. (Указание: Покажите, что ядро гомоморфизма Ж*-** Ж*: х\—> х2 имеет * порядок 2, пользуясь тем, что любой многочлен над полем имеет не больше корней, чем его степень.) 5. Пусть (L, g) —линейное пространство размерности η с невырожденным скалярным произведением. Докажите, что семейство векторов {eiy ..., еп] в L линейно независимо тогда и толька тогда, когда матрица (£(£/>£/)) невырождена. § 3. Теоремы классификации 1, Основная цель этого параграфа — дать классификацию конечномерных ортогональных, эрмитовых и симплектических пространств с точностью до изометрии. Пусть (L> g)— такое пространство, LoCiL — его подпространство, ограничение g на L0 является скалярным произведением на L0. Назовем L0 невырожденным, если ограничение g на L0 невырождено, и изотропным, если ограничение g на L0 равно нулю. Существенно, что если даже L невырождено, ограничения g на нетривиальные подпространства могут быть вырожденными ил* нулевыми. Например, в симплекти- ческом случае вырождены все одномерные подпространства, а в ортогональном пространстве R2 с произведением хгу{—х2у2 вырождено подпространство, натянутое на вектор (1, 1). Ортогональным дополнением к подпространству L0 ce L называется множество Lq = {/ е L | g (/0, /) = 0 для всех l0 e L0} (не путать с введенным в первой части ортогональным дополне- 102
нием к L0, лежащим в L*, здесь мы им пользоваться не будем)\ Легко видеть, что Lit является линейным подпространством в L. 2. Предложение. Пусть (L, g) конечномерно. а) Если подпространство L0a L невырождено, то L = L0Q)LoL. б) Если оба подпространства L0 и Lo1 невырождены, то Доказательство, а) Пусть g: L-+L* (или /,*)—отображение, ассоциированное с g, как в предыдущем параграфе. Обозначим через g0 его ограничение на Lo, go'· L0-+L* (или L*). Если Lo невырождено, то Kerg0 = 0: иначе в L0 есть вектор, ортогональный ко всему L и тем более к L0. Поэтому dim Im#0 = dimL0. Это означает, что когда /0 пробегает Lo, линейные формы g(l0, ·) от второго аргумента из L или L пробегают dimLo-мерное пространство линейных форм на L или L. Так как L^ есть пересечение ядер этих форм, dim Lq = dim L — dim L0, т. е. dim L0 + dim Lq = dim L. С другой стороны, из невырожденности L0 следует, что L0 Π ^ο" ^ = {0}, ибо L0n^o' есть ядро ограничения g на Lo. Поэтому сумма L+ Lo прямая; но ее размерность равна dimL, так что Lq@Lq = = L. б) Из определений ясно, что LQc(L0L)1'. С другой стороны, если L0, Lq невырождены, то по предыдущему dim {Lq)1 = dim L — dim Lq = dim L0. Это завершает доказательство. 3. Теорема. Пусть (L, g) — конечномерное ортогональное (над полем характеристики ф2), эрмитово или симплектическое пространство. Тогда существует разложение L в прямую сумму по- парно ортогональных подпространств: L = Li © ... φLm, одномерных в ортогональном и эрмитовом случае и одномерных вырожденных или двумерных невырожденных в симплектическом случае. Доказательство. Проведем индукцию по размерности L. Случай dim L = 1 тривиален; пусть dim L ^ 2. Если g нулевая, доказывать нечего. Если g ненулевая, то в симплектическом случае имеется пара векторов /i, ^eL с g(l\, h)¥=^ Согласно п. 10 предыдущего параграфа, натянутое на них подпространство L0 невырождено. По предложению п. 2 L = LqSLq1, и по индуктивному предположению мы можем далее разложить Lo", как сформулировано в теореме. Это даст требуемое разложение L. В ортогональном и эрмитовом случае мы покажем, что из нетривиальности g следует существование невырожденного одномерного подпространства L0; проверив это, мы сможем положить юз
L = LqQLq и применить прежнее рассуждение, т. е. индукцию по размерности L. В самом деле, допустим, что g(l,l) = 0 для всех /eL, и покажем, что тогда g = 0. Действительно, для всех /ь h^L имеем 0 = g (/, + /2, /1 + /2) = ff (/ι, /ι) + 2g (/,, /2) + g (/2, у = 2g (lu у или 0 = g(/i + /2Ji+/2) = g(/i,/i) + 2Reg(/1,U + ^(/2,/2) = 2Reg(/1,/2). В ортогональном случае отсюда сразу следует, что g(/i,/2) = 0. В эрмитово^ мы получаем лишь, что Reg(l\> /2) = 0, т. е. g(l\t k) = = ία, α ε R. Но если а Ф 0, то также 0 = Reg ((ία)"1/b /2) = Re(/a)~1g(/1, /2)=1. Получаем противоречие. Это завершает доказательство. Перейдем теперь к проблеме единственности. Само по себе разложение в ортогональную прямую сумму, существование которого утверждается в теореме п. 3, далеко не единственно, кроме тривиальных случаев размерности 1 (или 2 в симплектическом случае). Над общими полями в случае ортогональной геометрии неоднозначно определяется также и набор инвариантов щ е: &Ж*/Ж*2, который характеризует ограничения g на одномерные подпространства Ц. Точный ответ на вопрос о классификации ортогональных пространств существенно зависит от свойств основного поля, и для Ж = Q, например, связан с такими довольно тонкими теоретико-числовыми фактами, как квадратичный закон взаимности. Поэтому в ортогональном случае мы ограничимся описанием результата для J=R и С (дальнейшие подробности см. в § 14). 4. Инварианты пространств с метрикой. Пусть (L,g)—пространство со скалярным произведением. Положим η = dim L, r0 = dimL0, где Lq — ядро формы g. Кроме того, введем два дополнительных инварианта, относящихся только к ортогональной для Ж = R и эрмитовой геометриям: г+ и г_, числа положительных й отрицательных одномерных подпространств Ц в некотором ортогональном разложении L в прямую сумму, как в теореме п. 3. Очевидно, го ^ η и η = г0 + г+ + г- Для эрмитовой и ортогональной геометрии над R. Набор (г0, г+, г_) называется сигнатурой пространства. При г0 = 0 сигнатурой называют иногда также (г+, г_) или г+ — г- (считая η = г+ + г- известным). Теперь мы можем сформулировать теорему единственности. 5. Теорема, а) Симплектические пространства над произвольным полем, а также ортогональные пространства над С с точностью до изометрии определяются двумя целыми числами пу г0, т. е. размерностями пространства и ядра скалярного произведения. б) Ортогональные пространства над R и эрмитовы пространства над С с точностью до изометрии определяются сигнатурой 1Ό4
(г0, г+, г-), которая не зависит от выбора ортогонального разложения (это утверждение называется теоремой инерции). Доказательство, а) Пусть (L,g)—симплектическое пространство или ортогональное пространство над С. Рассмотрим его η прямое разложение L = ®L/, как в теореме п. 3, и покажем, что г0 совпадает с числом одномерных пространств в этом разложении, вырожденных для g. На самом деле сумма этих пространств Lo совпадает с ядром g. Действительно, очевидно, что она содержится в этом ядре, ибо элементы L0 ортогональны как к L0, так Го и к остальным слагаемым. С другой стороны, если L0 = © Li и η ι = Σ */. // ^ £/» 3/ > г0, // φ ο, το Β (Ι. 1,) = §(1ι,1,)¥*0 в ортогональном случае, и существует вектор // е L/ с *(/.//) = *(//. /ί)* О в симплектическом случае, ибо иначе ядро ограничения g на L/ было бы нетривиально, и g на L/ была бы нулевой по п. 10 § 2, вопреки тому, что / > го. Поэтому /<^(ядро g), и /,0 = (ядро g). Если теперь (L,g) и (L',g') — два таких пространства с одинаковыми η и го, то, построив их ортогнальные прямые разложения η η Го L=^^Li и L =@L'i, для которых (ядро#) = 0/^ и(ядро#') = Го = φ Lt·, мы можем определить изометрию (L, g) с (L, g') как прямую сумму изометрий ©f*, /ν Lj-> Li, которые существуют в силу результатов пп. 7 и 10 § 2. б) Пусть теперь (L, g) и {L\g') — пара ортогональных пространств над R или эрмитовых над С с сигнатурами (г0, г+, г-) и (^о» г+» г'-)' определенными с помощью некоторых ортогональных разложений L = ®Li, L' = @Li> как в теореме п. 3. Предположим, что между ними существует изометрия. Тогда прежде всего dim L = dim L', так что г0 + г+ + г_ = г'0 + г'+ + ^l· Далее, точно так же, как в предыдущем пункте, проверяется, что г0 совпадает с размерностью ядра g, а ^о"~*с размерностью ядра g\ а эти ядра суть суммы нулевых пространств L{ и LJ в соответствующих разложениях. Поскольку издм^трия определяет линейный изоморфизм между ядрами, имеем г0 = г'0 и г+ + г_ = г^ + Г_· Остается проверить, что r+ — r'+, r_ = r'_- Положим I = Lo φ L+ φ £-ι L' = Lo φ L+ φ L-, где L0, L+, L- — суммы 105
нулевых, положительных и отрицательных подпространств исходного разложения L, и соответственно для V'. Предположим, что r+ = dimL+ > r^ = dimZ/+, и придем к противоречию; возможность г+ < г'+ разбирается аналогично. Ограничим изометрию f: L-+U на L+czL. Каждый вектор /(/) однозначно представляется в виде суммы H/) = f(/)o + f(/)+ + f(/)_, где f(l)±&L+ и т. п. Отображение L+-+L+, /ь~>/(/)+ линейно. Так как по предположению dimL+ > dimL+, существует ненулевой вектор /eL+, для которого /(/)+= О, так что f (0 = /(Оо +/(/)- Но §(/,/)> 0, потому что /eL+ и L+ есть ортогональная прямая сумма положительных одномерных пространств. Так как / — изометрия, мы должны иметь также ^(/(/), /(/))> 0. С другой стороны, g' (f (/). f (/)) = g'(f (Do + f (/)-, f(Oo + f (/)-)=g'(f (D-, f (/)_) < o. Это противоречие завершает доказательство того, что у изомет- ричных пространств сигнатуры, вычисленные по любым ортогональным разложениям, одинаковы. Наоборот, если (L, g), (L',gf)— два пространства с одинаковыми сигнатурами, то между подпространствами из их -ортогональных разложений L = ®L* и L = ®£* можно установить взаимно однозначное соответствие Ц «-* Li, сохраняющее знак ограничения g на Lt и g на Li соответственно. По результатам пп. 7 и 8 § 2 существуют изометрии ft: Lt -> Ц, и их прямая сумма φ/ί будет изометрией между L и ΖΛ Теперь мы выведем несколько следствий и переформулировок теорем пп. 3 и 5, которые подчеркивают разные аспекты ситуации. 6. Базисы. Пусть (L, g) — пространство со скалярным произведением. Базис {#1, ..., еп) в L называется ортогональным, если g(eiieJ) = 0 для всех 1ф j. Из теоремы п. 5 следует, что у любого ортогонального или эрмитова пространства имеется ортогональный базис. Действительно, достаточно построить разложение L = φ/,ί на ортогональные одномерные подпространства и затем выбрать е% e*L/, ei φ 0. Ортогональный базис {ei) называется ортонормированным, если g(eit βή = 0 или ±1 для всех и Обсуждение в конце § 2 показывает, что у любого ортогонального пространства над R или Сиу любого эрмитова пространства имеется ортонормированный базис. Теорема п. 5 показывает, что числа элементов е ортонорми- рованного базиса с g(e, е) = 0, 1 или —1 не зависят от базиса для Ж = R (ортогональный случай) и Ж = С (эрмитов случай). В ортогональном случае над С всегда можно добиться того, 4TQ №6
g(ei,ei) = 0 или 1, и количества таких векторов в базисе не зависят от самого базиса. Матрица Грама ортонормированного базиса имеет вид (Er+\ ° \ ° \ 1 о |-*г_1 о 1 ^ О I 0 ■ I 0 ' (при надлежащем упорядочении). Чаще всего понятие ортонормированного базиса применяют в невырожденном случае, когда векторов βί с g(ei, βή = 0 нет. Следующая простая, но важная формула позволяет явно написать коэффициенты разложения любого вектора ее£ по ортогональному базису (в невырожденном случае): L· g («,, et) е*ш Действительно, скалярные произведения левой и правой части со всеми βι совпадают, а из невырожденности следует, что если g(e, ei) = g(e,i е{) для всех /, то е = е-', ибо е — е' лежит в ядре формы g. В симплектическом пространстве ортогональный базис, очевидно, может существовать, только если g = 0. Теорема п. 3 обеспечивает, однако,существование симплектического базиса {е\,е2, ... ...; ет\ £г+ь ..., е2г\ е2г+и ..., еп), который характеризуется тем, что g(ei> ег_и) = — g(er+i> ei) = !» /= 1, ..., г, а все остальные попарные скалярные произведения равны нулю. Действительно, следует разложить L в ортогональную прямую сумму двумерных невырожденных подпространств L*, 1 ^ i ^ г, и одномерных вырожденных L/, 2г + 1 ^ / ^ п, и в качестве {ей er+i} для 1 ^ i ^ г взять базис Lt·, построенный в п. 10 § 2, а в качестве £/ для 2г + 1 ^ / ^ η взять любой ненулевой вектор из L/. Матрица Грама симплектического базиса имеет вид / 0 1 Ег I 0 \ 1 -Вг\ 0 I Q I 4 о I о о ' Ранг симплектической формы, по теореме п. 5, равен 2г. В частности, невырожденное симплектическое пространство обязательно четномерно. Пусть L — невырожденное симплектическое пространство, {еи ..., еп ег+ь ···, е2г)—симплектический базис в нем. Пусть L\ — линейная оболочка {еи ..., er); L2 — линейная оболочка {ег+и .--*е2г}. Очевидно, пространства L\ и L2 изотропны, имеют 107
половинную размерность и L=* Lx® L2. Каноническое отображение g: L-+L* определяет отображение g{: L2-+ L\\ g{ (/2)(l{) = g(/2, l{). Это отображение является изоморфизмом, ибо dimL2 = dimL1 = = dimLi и Kerg\ = 0: вектор из Ker g{ ортогонален к L2, ибо L2 изотропно, и к L\ по определению, a L невырождено. Отсюда следует, что любое невырожденное симплектическое пространство изометрично пространству вида L = Li © L\ с сим- плектической формой g((f, /). (f\ О) = /(/') -/'(/); /> /'sLl, /. /'el· Дальнейшие подробности см. в § 12. 7. Матрицы. Описывая скалярные произведения их матрицами Грама и переходя от случайного базиса к ортогональному или симплектическому, мы в силу результатов п. 2 § 2 и п. 6 этого параграфа получаем следующие факты: а) Всякую квадратную симметричную матрицу G над полем Ж можно привести к диагональному виду преобразованием Qv->AlGA, где А невырождена. При Jif = R можно добиться, чтобы на диагонали стояли только 0, ±1, а при Ж*=С— только О, 1; количества 0 и ±1 (соответственно 0 и 1) будут зависеть лишь от G, но не от Л. б) Всякую квадратную антисимметричную матрицу G над полем Ж характеристики Ф2 можно привести преобразованием Gi—^Л'бЛ, где А невырождена, к виду / 0 1 Ег 1 0 \ 1 -Ег\ 0 1 0 ). 4 о Ι ,ο Ι υ / Число 2г равно рангу G. в) Всякую эрмитову матрицу G над С можно привести к диагональному виду с числами 0, ±1 на диагонали преобразованием Οι—>Α*ΰΑ, где А невырождена. Количества 0 и ±1 зависят лишь от G. 8. Билинейные формы. Если векторы пространства (L, g) с фиксированным базисом записываются координатами в этом базисе, то выражение g через координаты является билинейной формой от 2п переменных, η = dim L: g = (x{, ..., xn\ Уи ···> Уп)= Σ Bii*iyi=xGy> где G — матрица Грама базиса. Замена базиса сводится к линейному преобразованию переменных хи ..., хп и уи ..., уп с помощью одной и той же невырожденной матрицы А в билинейном случае (или матрицы А для х, А для у в полуторалинейном слу- 108
чае). Предыдущие результаты означают, что в зависимости от свойств симметрии матрицы G форму можно привести таким преобразованием к одному из следующих видов, называемых каноническими. Ортогональный случай над любым полем: над полем R можно добиться того, чтобы at —0, ±1; над полем С — чтобы щ = О или 1. Эрмитов случай (форма полуторалинейная): g(x> y)= Σ(*ιΧι9ι\ щ = 0 или 1. Симплектический случай: п = 2г + ^о, и форма имеет вид g(*> y) = fZ(^yr+i — ίΛ+t)· 9. Квадратичные формы. Квадратичной формой q на пространстве L называется такое отображение q: L-^Ж, для которого существует билинейная форма h: LY^L-^Ж со свойством q(l) = h (/, /) для всех / е L. Покажем, что если характеристика поля Ж не равна 2, то для всякой квадратичной формы q существует единственная симметричная билинейная форма g со свойством q(l) = g(l, /), называемая поляризацией q. Для доказательства существования положим q(l) = h(l,l), где h — исходная билинейная форма, и g(l9 m) = j[h(ly m) + h(m, /)]. Очевидно, g симметрична, т. е. g(l, m) = g(m, I). Кроме того, g(l,D = j[h(l, /) + h (/,/)] = 9 (/). Билинейность g сразу же следует из билинейности h. Для доказательства единственности заметим, что если q(l) = = gi(/,/) = #2(/, 0, гДе gu g2 симметричны и билинейны, то форма g = g\ — g2 тоже симметрична и билинейна, и g(l, /) = 0 для всех /gL. Но по рассуждению в доказательстве теоремы п. 3 отсюда следует, что g(l,m) = 0 для всех /, /neL, что завершает доказательство. Заметим, что если q(l) = g(l, l),g симметрична, то g{U m) = \[q(l + m) — q(l) -q(m)]. Мы установили, таким образом, что ортогональные геометрии (над полями характеристики ф2) можно рассматривать как гео- 109
метрии пар (L,q), где q: L-^Ж— квадратичная форма. В координатах квадратичная форма записывается в виде ч(х) = Σ aifXtXi* где матрица {ац) определяется однозначно, если она симметрична: ац = a,ji. Например, q (xv х2) = апх\ + 2а12хЛ + а22х% Теоремы классификации означают, что невырожденной линейной заменой переменных квадратичную форму можно привести к сумме квадратов с коэффициентами: Я W = Σ fl^f- ί = 1 Если Jif = R, можно считать, что щ = О, ±1; количества г0, г+, г_ нулей и плюс-минус единиц определены однозначно и составляют сигнатуру исходной квадратичной формы; г+ + г- — это ее ранг. Если Ж = С, можно считать, что а/ = 0, 1; количество единиц — это ранг формы; он также определен однозначно. § 4. Алгоритм ортогонализации и ортогональные многочлены В этом параграфе мы опишем классические алгоритмы для отыскания ортогональных базисов и важные примеры таких базисов в пространствах функций. 1. Приведение квадратичной формы к сумме квадратов. Пусть η q(xu . .., χη)= Σ βί/*ί*/. <*η = <*μ> — квадратичная форма над полем Ж характеристики Ф2. Следующая процедура дает удобный практический способ отыскания линейной замены переменных #,·, приводящей q к сумме квадратов (о коэффициентами). Случай -L Существует ненулевой диагональный коэффициент. Перенумеровав переменные, мы можем считать, что ацфО. Тогда Я (*р ···»*„)= аПХ\ + Х1 (2а12*2 + · · · + 2αΐΛ) + Ч' (*2» · · ·. Хп)> где q' — квадратичная форма от ^ я—1 переменных. Выделяя полный квадрат, находим Я(xi xn) = an(Xl+^x2+ ...+^xnf + q,,(x2,..., *„), где q" — новая квадратичная форма от ^я — 1 переменных. Полагая У\ = Х\ + яй1 (^12^2 + ... + а1пхп), у<1 = хъ ·.., уп = Хп> ПО
мы получаем в новых переменных форму αιι#ι + <7"(#2> ···> Уп), и следующий шаг алгоритма состоит в применении его к q". Случай 2. Все диагональные коэффициенты равны нулю. η Если вообще q = О, то делать, ничего не нужно: q = Σ 0 · x\.t Иначе, перенумеровав переменные, можно считать, что an Φ 0. Тогда Q(x\> · · ·> χη)= = 2al2x{x2 + xxlx (x3, ..., xn) + x2l2 (x3t ..., xn) + qr (*3, ..., *„), где /ь /г — линейные формы, а ή/ — квадратичная. Положим *1==01+02. ^2 = ^1—^2. **=#*> /'>3. В новых переменных форма ^ приобретает вид 2αΐ2 (У? ~ #£) + Ч" (У» %····» О» где <7" не содержит членов с у], у\. Поэтому к ней можно применить способ выделения полного квадрата и снова свести задачу к меньшему числу переменных. Последовательное применение этих шагов приведет форму к виду J] atzf. Окончательная ли- ί = 1 нейная замена переменных будет невырожденной,'так как таковы все промежуточные замены. Последняя замена переменных щ = У | at \ zt при at Φ 0 в случае Ж = R и щ = д/α,· ζι ПРИ сцфО в случае Ж = С приведет форму к сумме квадратов с коэффициентами 0, ±1 или 0, 1. 2. Алгоритм ортогонализации Грама — Шмидта. Он весьма близок к описанному в предыдущем пункте, но формулируется в более геометрических терминах. Мы будем рассматривать одновременно ортогональный и эрмитов случай. Исходными данными являются: пространство (L,g) с ортогональной или эрмитовой метрикой, заданной в базисе \e'v ..., е^. Пусть Li — подпространство, натянутое на ev ..., в\, i = 1, ..., п. Процесс ортогонализации, примененный к базису \e'v ..., е'А, можно рассматривать как конструктивное доказательство следующего результата: 3. Предложение. Предположим, что в описанных обозначениях все подпространства L\, ..., Ln невырождены. Тогда существует такой ортогональный базис {е\, ..., еп) пространства L, что линейная оболочка {еи ..., е{) совпадает с Ц для всех i = 1, ..., п. Он называется результатом ортогонализации исходного базиса \е\у ..., е'п}. Каждый вектор et определен однозначно с точностью до умножения на ненулевой скаляр, Ш
Доказательство. Построим βι индукцией по i. В качестве в\ можно взять е\. Если ей - - -, e/-i уже построены, будем искать ei в виде i-i е. = е\^ X хр'р * ι <^W. Так как {е\, ··, е\) порождают L/. а {^, ..., е'£_,} и {<?,, ... ···> ^i-i} порождают Lt-_i, любой т^кой вектор е, вместе с βι, ... ..., £,·_! будет порождать Lt·. Поэтому достаточно добиться того, чтобы βί был ортогонален к е\, ..., et--i, или, что то же самое, к е\> ···, ^_ι. Эти условия означают, что g(eit e'k} = 0, £=1, ... ..., i— 1, или Это система /—1 линейных уравнений для /—1 неизвестных х\. Ее матрица коэффициентов есть матрица Грама базиса^, ...,^_,} пространства Li-\. По предположению, она невырождена, так что Xj существуют и определены однозначно. Любой ненулевой вектор ёи ортогональный к L/_b должен быть пропорционален ег. Более простая и решаемая сразу система уравнений получится, если искать et в виде считая ей ..., e*-i уже найденными. Поскольку ей ..., e*-i попарно ортогональны, из условий g(ei, е}) = О, 1 ^ / ^ i — 1, находим Весь смысл этого доказательства состоит в явном выписывании систем линейных уравнений, последовательное решение которых определяет et. Заметим, что матрица коэффициентов первой системы суть последовательные диагональные миноры матрицы Грама исходного базиса: Если бы мы' не стремились к алгоритмичности, проще всего было бы рассуждать так: в силу предложения п. 2 § 3 и невырожденности Lj-i имеем Li = Li^i φ L/-_i; dim/,/-_! = dim Lt — dimL,_i = 1. Возьмем теперь в качестве в{ любой ненулевой вектор из Lh-\. 4. Замечания и следствия, а) Процесс ортогонализации Грама—Шмидта чаще всего применяется в ситуации, когда g(/,/)>0 II»
для всех / е L, / φ О, т. е. к евклидовым и унитарным пространствам, которые мы подробно изучим позже. В этом случае все подпространства L автоматически невырождены, и ортогонализи- ровать можно любой исходный базис. Форма g с таким свойством называется положительно определенной, и ее матрицы Грама называются положительно определенными. б) В случае Ж = R или С можно строить сразу ортонормиро- ванный базис. Для этого, отыскав вектор ей как в доказательстве предложения, следует тут же заменить его на \g(eu βή \~ι/2βι или g(e/, ei)-x/2ei (для ортогональных пространств над С). в) Любой ортогональный базис невырожденного подпространства Lo cz L можно дополнить до ортогонального базиса всего пространства L. Действительно, L = L0@ Lo*, и в качестве дополнения можно взять ортогональный базис Lo*. Искать его можно методом Грама— Шмидта, если сначала как-нибудь дополнить базис L0 до базиса L, позаботившись о невырожденности промежуточных подпространств. г) Пусть [ev ..., е'п} — базис (L, g), а {еи ..., еп}— его ортогонализация. Положим а* = g(eiiei) — это единственные ненулевые элементы матрицы Грама базиса {е,}. Будем считать, что g эрмитова или g ортогональна над R. Тогда все числа а,- вещественны, и сигнатура g определяется количеством положительных и отрицательных чисел а*. Покажем, как восстановить ее по минорам исходной матрицы Грама G = {g(e'i9 е^)}. Пусть Gi— ί-й диагональный минор, т. е. матрица Грама \ev ..., е^. Если Л* — матрица перехода к базису {е\9 ..., е,·}, то det (g (ek, ej))i < *, /< * = αϊ.. .α* = det (AiQtAi) = det Qt (det A if в ортогональном случае или αχ.. Mi = det (A'iGiAi) = det Gi | det At f в эрмитовом случае. Поэтому всегда знак а1...а< = знак detGi. Итак, сигнатура формы g определяется числом положительных и отрицательных элементов последовательности Λ \ Γ det (?2 det Gn aetCri> detGj » ···' detGn_{ ' В частности, форма g (и ее матрица G) положительно определена тогда и только тогда, когда все миноры det Gi положительны (напомним, что G либо вещественна и симметрична, либо комплексна и эрмитово симметрична). Этот результат называется критерием Сильвестра. Более общо, для невырожденной квадратичной формы над любым полем тождество ах.. .a< = detGf(det A{f 113
Показывает, что исходную форму с симметричной матрицей О и невырожденными диагональными минорами d можно линейным преобразованием переменных привести к виду Edet Gt iitG7T^detGo=b ибо квадраты (deM,·)2, мешающие непосредственно выразить а* через det G/, можно внести сомножителями в переменные. Этот результат называется теоремой Якоби. 5. Билинейные формы на пространствах функций. Рассмотрим i>yHKUHH fu /2, заданные на отрезке (а, Ь) вещественной прямой возможно, а=—оо, Ь = оо) и принимающие вещественные или комплексные значения. Пусть G(x)—фиксированная функция от хе(а, Ь). Билинейные формы на пространствах функций в анализе часто задаются выражениями типа ъ £(/.. te=\G{x)U{x)h(x)dx а или (полуторалинейный случай) ъ g(fu f2)=\G(x)fAx)fAx)dx. а Разумеется, G, f\ и /2 должны удовлетворять каким-то условиям интегрируемости; в последующих примерах они будут выполнены автоматически. Функция G называется весом формы g. Значение ъ ь g(ff f) = \G(x)f(xfdx или J G(x)\f(x)fdx а а есть взвешенное квадратичное среднее функции f (с весом G); если G ^ 0, его можно рассматривать как некоторую интегральную меру уклонения / от нуля. Типичная задача аппроксимации функции / линейными комбинациями некоторого заданного набора функций /ι, ..., /rt, ... состоит в поиске таких коэффициентов tfi, ..., ап, ..., которые при данном η минимизируют взвешенное среднее квадратичное функции Позже будет видно, что коэффициенты а, особенно просто находятся в случае, когда {//} образуют ортогональную или орто- нормированную систему относительно скалярного произведения g. В этом параграфе мы ограничимся явным описанием нескольких важных ортогональных систем. 6. Тригонометрические многочлены. Здесь G = l, (a,ft) = = (0,2π). Тригонометрическими многочленами (или многочленами U4
Фурье) называются конечные линейные комбинации функций cos nx, sin nx или конечные линейные комбинации функций einxy λεΖ. Обычно первые применяются в теории вещественнозначных функций, а вторые — комплекснозначных. Поскольку ёпх ■= = cos nx + / sin nx, над С оба пространства многочленов Фурье совпадают. Над R используется билинейная метрика, над С — полу- торалинейная. Функции {1, cos ля, sin ля | л ^ 1} и {einx\n gZ} линейно независимы (как над R, так и над С). Кроме того, они образуют ортогональную систему, как следует из легко проверяемых формул: г , f . , (π при т = л >0, \ cos mx cos nxdx=\ sin mx sin nx ax = < Λ 2 rf Ιο πϊ о о 2π \ cos mx sin /ι* rfjc = 0 о 2π 2π при тФ η, 2π при m = n, О при т Ф п. Системы {,— , —=rCosnx> —7=r sinnx\ n^ 1 1 и { —-j=einx\n e zl поэтому ортонормированы. Скалярные произведения любой функции / на [0,2π] с элементами этих ортонормированных систем называются коэффициентами Фурье этой функций: 2π У2я "•"fe $'<*>**· О 2π αΛ = —γ=τ \ f (x) cos nx dx, n^U 2π 6Λ=—7=r\ f (x) sin я*d*, л>1, для вещественных функций / и 2π ae--^L$ f(x)e-inxdx, «gZ, для комплексных функций. Если сама функция / является многочленом Фурье, то по формуле разложения из п. 6 § 3 имеем / (х) = -— а0 + -т= У* (ял cos л* + &л sin л*) w л/2я ^ Υπ я% 115
для вещественных функций / и fw==vfc Σα«β д/2я п^-ьоо для комплексных функций /. Суммы справа, разумеется, конечны в рассматриваемом случае. Бесконечные ряды такой структуры называются рядами Фурье. Вопрос об их сходимости вообще и сходимости к той функции /, коэффициентами Фурье которой являются аПу Ьп, в частности, исследуется в одной из важнейших глав анализа. 7. Многочлены Лежандра. Здесь 0 = 1, (а, Ь) = (— 1, 1). Многочлены Лежандра Ро{х), Λ(*), ^Μ*)ι ··· определяются как результат процесса ортогонализации, примененного к базису {1, #, х2, ...,} пространства вещественных многочленов. Обычно они нормируются условием Р„(1)== 1. В такой нормировке их явный вид дается следующим результатом: 1 dn 8. Предложение. Р0{х) =1, РпΜ = "^77*"^"" ^ п>1- Доказательство. Так как степень многочлена (х2—1)п dn равна 2л, степень "^Hri*2 — 1)Λ равна η, так что Рь ..., Р/ порождают то же пространство над R, что и 1, х, ..., я*. Поэтому для проверки ортогональности Ρί, Ρ/, i φ /, достаточно убедиться, что -1 /Р„ (λ;) dx = 0 при & < п. Интегрируя по частям, получим -1 S-erix*- l)ndx = Х dxn-> [X -i)" I - -φ" - 1 dn-i dxn~l (x2-l)ndx. Первое слагаемое обращается в нуль, ибо (х2—1)п в точках ±1 имеет корень кратности я, а каждое дифференцирование снижает кратность корня на единицу. Ко второму слагаемому можно применить аналогичную процедуру; после k шагов получится интеграл, пропорциональный [ ^L(x2-l)ndx= аП~\Х (x2-l)n ι = 0. 116
Далее, по формуле Лейбница dx fe»0 х В точке χ = 1 не обращается в нуль только слагаемое, отвечающее k = /г, так что что завершает доказательство. *=ι 2пп\ 1 . лг1 - 2Л= 1, 9. Многочлены Чебышева. G =—==-, (а, £) = (— 1, 1). Мно- гочлены rrt(A:), η ^ 0, суть результат ортогонализации базиса {1,*, я2, ...}. Явные формулы: Нормировка: при т Φ η, х/2 при /η = η =5*= О, ~ι * - -- ^π ПрИ m==^==o. ίο π/: π 10. Многочлены Эрмита. G = e~x, (α,&) = (—οο, σο). Многочлены Нп(х) суть результат ортогонализации базиса {l,x, л:2, ...}. Явные формулы: #Л*) = (-1Ге*2^(е-*2). Нормировка: при тФПу при т = п. Мы оставляем доказательства читателю в качестве упражнения. j.-^Wtf.Wrfx-l^,0^ УПРАЖНЕНИЯ 1. Доказать, что эрмитова hjjh ортогональная форма g неотрицательно определена, т.е. £(/,/) ^0 для в£ех /fet, тогда и только тогда, когда все диагональные миноры ее матрицы Грама неотрицательны. 2. Доказать утверждения п. 9 и 10 этого параграфа. § 5. Евклидовы пространства 1. Определение. Евклидовым пространством называется конечномерное вещественное линейное пространство L с симметричным положительно определенным скалярным произведением. 117,
Мы будем писать (/, т) вместо 'g{Um) и |/| вместо (/,/)1/2; число |/| будем называть длиной вектора /. Из результатов, доказанных в § 3—,4, следует, что: а) во всяком евклидовом пространстве есть ортонормирован- ный базис, все векторы которого имеют длину 1; б) поэтому оно изометрично координатному евклидову пространству Rn (η = dim L), в котором Ключом ко многим свойствам евклидова пространства является многократно переоткрывавшееся неравенство Коши — Буняков- ского — Шварца: 2. Предложение. Для любых lu h ^ L имеем Ни /2)<|/ιΙΙ/2|. Равенство достигается тогда и только тогда, когда векторы /ь /2 линейно зависимы. Доказательство. В случае 1\ = О имеет место равенство и /ι, /2 линейно зависимы. Будем считать, что 1\фЪ. Для любого вещественного числа t имеем Ι «ι + h 12 = № + /2, «ι + l2) = f\h \2 + 2t(lu l2) + |/2|2 >0 в силу положительной определенности скалярного произведения. Поэтому дискриминант квадратного трехчлена справа неположителен, т. е. (/i, /2)2-Uil2U2l2<0. Он равен нулю тогда и только тогда, когда этот трехчлен имеет вещественный корень /0. В этом случае 1У1 + /212 = 0^/2 = -/0/ь что завершает доказательство. 3. Следствие (неравенство треугольника). Для любых /ь /2,/3eL U1 + /2KU1I + I/2I. I/1-/3KI/1-/2I + I/2-/3I. Доказательство. Имеем |/i + /2P = Uil2 + 2(/1, y + |/2P<|/1|2 + 2|/1IU2| + l/2P = = fl/il + |/2l)2. Заменив здесь 1\ на 1\ — /2 и U на U — /3, получим второе неравенство. 4. Следствие. Евклидова длина вектора \1\ является нормой на L в смысле определения в п. 4 § 10 ч. 1, а функция d{U rn) = = | / — га | — метрикой в смысле определения п. 1 там же. Доказательство. Остается проверить только, что |а/'| = = |а| |/| для всех а ^ R, но | al\ = (а/, а/)1'2 = (а21/12)1/2 = |а|| Л- 118
5. Углы и расстояния. Пусть /ь /2^L— ненулевые векторы. В силу предложения п. 2 Поэтому существует единственный угол φ, 0 ^ φ ^ π, для которого cosq)- ι/ιΐι/.ι · Он называется углом между векторами /ь /г. Поскольку скалярное произведение симметрично, это «неориентированный угол», чём и объясняется интервал его значений. В соответствии со школьной геометрией угол между ортогональными векторами равен π/2. Можно систематически развить евклидову геометрию на основе данных определений длины и угла и убедиться, что в размерностях два и три она совпадает с классической. Например, многомерная теорема Пифагора есть тривиальное следствие определений: если векторы /ι, ..., ln попарно ортогональны, то |2 Ι Π 2 п Обычная формула косинусов в геометрии плоскости, примененная к треугольнику со сторонами /ь /2, /з, утверждает, что |/з12 = |/1р + и2Р-2|/1|||/2|со8Ф, где φ — угол между /ι и /2. В векторном варианте h = h — /2, и эта формула превращается в тождество |/i-feP = |/if + lfeP-2(/i,u в соответствии с нашим определением угла. Пусть ί/, V cz L— два множества в евклидовом пространстве. Расстоянием между ними называется неотрицательное число d(U, l/) = inf{|/1-/2||/1st/, /2е=1/}. Рассмотрим частный случай: U={1} (один вектор), V = L0czL — линейное подпространство. В силу предложения п. 2 § 3 имеем L = Lo0 Lo" и / = /о + /о, где/o^Lo, /о е Lo". Векторы /0, k суть ортогональные проекции I на Lo, Lo" соответственно. 6. Предложение. Расстояние от I до Lo равно длине ортогональной проекции I на Lo*. Доказательство. Для любого вектора /nsL0 имеем I / — w |2 = I /о + /о —- m |2 = | /0 — w |2 Ч- I /о |2 в силу теоремы Пифагора, ибо векторы l0 — m^L0 и /о е Lo" ортогональны. Следовательно, U-wf^l/al2, И9
и равенство достигается только в случае т = /о, что доказывает требуемое. Если в Lq выбран ортонормированный базис {ей ..., ет}у то проекция I на L0 определяется формулой Действительно, левая и правая части имеют одинаковые скалярные произведения со всеми ei> поэтому их разность лежит в L^. Окончательно, т d(l, L0) = -^(^ ejei есть наименьшее значение |/ — ml, когда т пробегает /^.Поскольку |/о|2 ^|/|2 по той же теореме Пифагора, имеем т Е(/,е,)2<1Пг. 7. Приложения к пространствам функций. Рассмотрим в качестве примера пространство непрерывных вещественных функций на [a, 6]cz R со скалярным произведением ь (f>g)=\fgdx. а Оно бесконечномерно, но все наши неравенства будут относиться к конечному числу таких функций, так что каждый раз можно будет считать, что мы работаем в конечномерном евклидовом про- b b странстве: \f2(x)dx^0 и если \ f2(χ)dx = 0, то f(x) = 0. а а Неравенство Коши — Буняковского — Шварца приобретает вид (ь \2 ъ ъ \ f (х) g (χ) dx J < J f (xf dx \ g {xf dx. a ' a a Неравенство треугольника: Cb \ 1/2 / b \ 1/2 / b ч 1/2 \(f(x) + g(x))2dxj <y\f(x)2dxj +y\g(x)2dxj . a ' N a ' N a Если (α,&) = (0, 2π) и α,·, bL — коэффициенты Фурье функции f(x), как в п. 6 § 4, то многочлен Фурье N h (*)= "тг^ а° + "Тг Σ <α*cos пх +**sin nx>i У2я VjT 120
является ортогональной проекцией f(x) на линейную оболочку {l,cosnx, sinnx\ 1 sg: η ^ Ν). Поэтому коэффициенты Фурье f(x) при каждом N минимизируют среднеквадратичное отклонение f(x) от многочленов Фурье «степени» ^ГЛЛ Неравенство |Μ2^|/Ί2 приобретает вид Ν 2π ao+Y^Wi + tiX^fixfclx. ί-ΐ О Поскольку правая часть не зависит от Ν, а а*, 6*^0, ряд оо do + Σ Wi + bf) сходится для любой непрерывной функции f(x) на [0, 2π]. Можно 2π доказать, что он сходится в точности к \ f (x)2 dx. о Совершенно аналогичные соображения применимы к многочленам Лежандра, Чебышева и Эрмита. Мы оставляем их в качестве упражнения читателю. 8. Метод наименьших квадратов. Рассмотрим систему m линейных уравнений для η неизвестных с вещественными коэффициентами η Предположим, что эта система «переопределена», т. е. m > η и ранг матрицы коэффициентов равен п. Тогда она, вообще говоря, не имеет решений. Но можно попробовать найти такие значения неизвестных^, ..., x°ni чтобы суммарное среднеквадратичное отклонение левых частей от правых m / η \ 2 Σ (£ *uA - bij принимало наименьшее возможное значение. Эта задача имеет существенные практические приложения. Например, при геодезических работах местность разбивается на сеть треугольников, некоторые элементы которых измеряются, а другие вычисляются по формулам тригонометрии. Поскольку все измерения приближенные, рекомендуется сделать их больше, чем строго необходимо для вычисления остальных элементов, но по той же причине тогда уравнения для этих элементов почти наверняка окажутся несовместными. Метод наименьших квадратов позволяет получить «приближенное решение», более надежное из-за большего количества вложенной в систему информации. Покажем, что наша задача может быть решена с использованием результатов п. 7. Интерпретируем столбцы матрицы коэффи- 121
циентов βι = (an, ,.., ат{) и столбец свободных членов / — = (&ι, ..., bm) как векторы координатного евклидова пространства Rm со стандартным скалярным произведением. Положив η ε=Σ xiei> получим,что Σ (Σ я*/*/ -&*) = Σ * α - π · Поэтому минимум среднеквадратичного отклонения достигается η тогда, когда Σ x\ei является ортогональной проекцией f на под- пространство, натянутое на £,. Это означает, что коэффициенты х*\ должны находиться из системы η уравнений с η неизвестными так называемой «нормальной системы». Ее определитель есть определитель матрицы Грама ((е*,£/)), где Он отличен от нуля, ибо предполагалось, что ранг исходной системы, т. е. системы векторов (е,·), равен η (см. упражнение 5 к § 2). Поэтому решение существует и единственно. Вернемся теперь к теме «измерения в евклидовом пространстве». 9. /i-мерный объем. На одномерном евклидовом пространстве простейшим фигурам — отрезкам и их конечным объединениям — можно поставить в соответствие длины и суммы длин. На евклидовой плоскости школьная геометрия учит измерять площади таких фигур, как прямоугольники, треугольники и, с некоторым трудом, круги. Обобщение этих понятий дает глубокая общая теория меры, естественное место которой не здесь. Мы ограничимся списком основных свойств и элементарными вычислениями, связанными со специальной мерой фигур в /г-мерном евклидовом пространстве— их n-мерным объемом. /г-мерный объем есть функция vol", определенная на некоторых подмножествах я-мерного евклидова пространства L, называемых измеримыми, и принимающая неотрицательные вещественные значения или оо (на ограниченных измеримых множествах — только конечные значения). Совокупность измеримых множеств достаточно богата. Мы просто постулируем следующий список свойств vol" и измеримость фигурирующих в них множеств, не доказывая существование функции с такими свойствами и не указывая естественную область ее определения. 122
а) Функция vol* счетно аддитивна, т. е. оо = Σ \o\nUt, если ί/, ηί//=» 0 при i φ j; ί=·1 vol1 (точка)=0; vol1 (отрезок)= длина отрезка. Отрезок в одномерном евклидовом пространстве есть множество векторов вида tU + (1 — t) h9 0 ^ t ^ 1; его длина есть | U — U |. б) Если U ^ V, то vol" ί/ < vol" V. в) Если L = Li©L2 (ортогональная прямая сумма), dimLi = m, dim Z.2 = ^» VczLu VczL2, то для i/XV = = Шь /2) |/iei/, /2eK}eLi® L2 имеем νοΓ+Λ (С/ X V) = volm ί/ · vol" V. г) Если /: L-*L — произвольный линейный оператор, то vol71 (/ (ί/)) = I det / Ι νοΓ ί/, η = dim L. Свойства, а), б) едва ли нуждаются в комментариях. Свойство в) является сильным обобщением формулы площади прямоугольника (произведение длин сторон) или объема прямого цилиндра (произведение площади основания на длину образующей). Заметим, что из свойства в) вытекает, что (т + п) -мерный объем ограниченного множества W в L, лежащего в подпространстве L\ размерности т < т + /г, равен нулю. Действительно, тогда L = = LX®L± и W=VX{0}y наконец, volrt({0}) = 0 при п > 0 в силу а) и в). Смысл свойства г) менее очевиден. Оно является основным вкладом линейной алгебры в теорию евклидовых объемов и служит причиной появления якобианов в формализме многомерного интегрирования. Возможно, наиболее интуитивное объяснение его состоит в замечании, что оператор растяжения в aeR раз вдоль одного из векторов ортогонального базиса должен умножать объемы на \а\ в силу свойств а) ив). Но любой ненулевой вектор можно дополнить до ортогонального базиса, поэтому диагонали- зируемый оператор / с собственными значениями аи ..., o„gR должен умножать объемы на JaJ ... |an| = |det/|. Наконец, изо- метрии должны сохранять объемы, и, как мы убедимся позже, любой оператор есть композиция диагонализируемого и изометрии (см. § 8, упражнение 11). Теперь, пользуясь этими аксиомами, приведем список объемов простейших и наиболее важных /г-мерных фигур. 10. Единичный куб. Это множество {t\ei + ..· + ^£/ι|0^ί,^1}, где {ей ..., еп} — некоторый ортонормированный базис L. Из свойств а) и в) из п. 9 сразу следует, что его объем равен единице. Куб со стороной а > 0 получится, если разрешить U пробегать значения 0 ^ U ^ а. Так как он является образом единичного куба относительно гомотетии — умножения на а, — его объем равен а\ 11. Параллелепипед со сторонами {1\> ..., 1п}. Это множество {t\h 4- ..· -Μ|Α|Ι^^ **^Ξ 1}· Мы покажем, что его объем равен "Чу,"-) ш?
д/| det G I, где О = ((//, //)) — матрица Грама сторон. В самом деле, если {/ι, ..., /„} линейно зависимы, то соответствующий параллелепипед лежит в подпространстве размерности <dimL и его /г-мерный объем равен нулю по замечанию в п. 9. В то же время матрица G вырождена. Поэтому остается разобрать случай, когда {/ι, ..., ln) линейно независимы. Пусть {еи ..., еп) — ортонормированный базис в L, а / — линейное отображение L-+L, переводящее е{ в /,·, /=1, ... ..., /г. Если А — матрица этого отображения в базисе {а}: (/ι. ···> /«) —(*ι. ..., *n)At то матрица Грама {//} равна А*А, ибо матрица Грама {а} единичная. Следовательно, Vl det GI = Vl det {A*A) | = | det A |. С другой стороны, I det A | = |det/|, и / переводит единичный куб в наш параллелепипед. В силу свойства г) из п. 9 объем параллелепипеда равен |det/|, что завершает доказательство. 12. л-мерный шар радиуса г. Это множество, векторов Bn{r)-{l\\l\<r). или, в ортогональных координатах, ли-{(*„.... *n)|J>?<r2}. Так как Вп(г) получается из Вп(1) растяжением в г раз, имеем volnBn(r) = volnBn(l)rn. Константа volnBn(l) — bn может быть вычислена лишь аналитическими средствами. Рассекая (п+ Г)-мерный шар /г-мерными линейными подмногообразиями, ортогональными к некоторому направлению, получим индуктивную формулу 1 *w>= [2S(Vrrra"d^ilft.. «>»· о J 4 Разумеется, Ь{ = 2, Ь2 = π, &3 = у π* 13. /г-мерный эллипсоид с полуосями rb ..., гл. Он задается в ортогональных координатах уравнениями 2 1. Σ(ΐ)< Поскольку он получается из Вп(1) растяжениями в η раз вдоль ί-й полуоси, его объем равен ЬпГ\ ... гп- 14. Одно свойство /г-мерного объема. Оно состоит в τρΜ, что при очень больших η «объем n-мерной фигуры сосредоточен 124
вблизи ее поверхности». Например, объем шарового кольца хмежду сферами радиуса 1 и 1—ε равен bn[l—(1—е)л], что при фиксированном сколь угодно малом ε, но растущем η стремится к Ъп- Двадцатимерный арбуз радиуса 20 см с толщиной корки 1 см чуть не на две трети состоит из корки: Это обстоятельство играет большую роль в статистической механике. Рассмотрим, например, простейшую модель газа в резервуаре, состоящего из η атомов, которые будем считать материальными точками массы 2 (в подходящей системе единиц). Представим мгновенное состояние газа η трехмерными векторами -> -> (ϋ\, ..., ϋη) скоростей всех молекул в физическом евклидовом пространстве, т. е. точкой 3/г-мерного координатного пространства R3". Квадрат длины векторов в R3/l имеет прямой физический смысл энергии системы (суммы Кинетических энергий атомов): Для макроскопического объема га?а в нормальных условиях порядок η есть 1023 (число Авогадро), так что состояние газа описывается точкой на сфере огромной размерности, радиус которой есть корень квадратный из энергии. Пусть два таких резервуара соединены так, что они могут обмениваться энергией, но не атомами, и сумма их энергий £Ί + + Е2 = Ε остается постоянной. Тогда энергии Е\ и Е2 большую часть времени будут близки к таким, которые максимизируют «объем пространства состояний», доступный объединенной системе, т. е. произведение vol^B(E\l2)vo\n^B(El2f2) (мы заменили площади сфер объемами шаров, что буквально не верно, но почти не влияет на результат). Так как с ростом Е\ и убыванием Е2 (£Ί + Е2 = const) первый объем невероятно быстро растет, а второй убывает, имеется резкий пик этого произведения при некоторых значениях Еи Е2, отвечающий «наиболее вероятному» состоянию объединенной системы. Очевидно, это происходит там,где Ж log vol- В (Ef) - -^ log vol- ЩЕГ). Обратные к этим величинам суть (с точностью до пропорциональности ) температуры резервуаров, и наиболее вероятное состояние отвечает равенству температур. 125
УПРАЖНЕНИЯ 1. Доказать, что угол φ наклона прямой в плоскости R2, проходящей из начала координат в среднеквадратичном как можно ближе к т заданным точкам (щ, bi)y i = 1, ..., m, определяется формулой '"-(Ι,«λ)/(Ι;4 {Указание. Найти наилучшее «приближенное решение> системы уравнений сих = bi.) 2. Пусть Рп(х) — /1-й многочлен Лежандра. Доказать, что старший коэффн- / ч 2п(п\)2 D , ч циент многочлена ип (х) =—. ^ Рп(х) равен единице и что минимум интеграла /(и) = \ и (х)2 dx на множестве многочленов и(х) степени η со старшим -1 коэффициентом 1 достигается при и «= ип. (Указание. Разложить и по многочленам Лежандра степени ^п.) 3. Пусть (5, μ) — пара, состоящая из конечного множества «S и вещественной функции μ: S-*R, удовлетворяющей двум условиям: μ(«)^0 для всех s&S и Σ μ (s)« 1. Рассмотрим на пространстве вещественных функцийF(S) smS на S (со значениями в R) линейный функционал Е: F(S) -*R: * (/>- Σ μ («Ж*)· Обозначим через F0(S) ядро Е. (S, μ) называется конечным вероятностным пространством, элементы F(S)— случайными величинами на нем, элементы F0(S)—нормированными случайными величинами, число E(f)—математическим ожиданием величины f. Случайные величины образуют кольцо относительно обычного умножения функций. Доказать следующие факты. а) F(S) и F0(S) имеют структуру ортогонального пространства с квадратом длины вектора f, равным E(fz). Пространство F(S) евклидово тогда и только тогда, когда μ($) > 0 для всех se5. б) Для любых случайных величин f,g e F(S) и α, 6eR положим Ptf-α)- У μ(«); P(/-a;ff-6)- У μ (s) f(i5*a f(s%a g(s)=b («вероятности того, что f принимает значение α или f = а и g «= b одновременно^. Назовем две случайные величины независимыми, если P(f = cr,g = b) = P(f = a)P(g = b) при всех a, b ge R. Доказать, что если , нормированные случайные величины ftg&Fo(S) независимы, то они ортогональны. Построить пример, показывающий, что обратное неверно. Скалярное произведение величин f,geF0(5) называется их ковариацией, а косинус угла между ними — коэффициентом корреляции. § 6. Унитарные пространства 1. Определение. Унитарным пространством называется комплексное линейное пространство L с эрмитовым положительно on· ределенным скалярным произведением^ 126
Как в § 5, мы будем писать (/, т) вместо g(l,m) и |/| вместо (/,/)1/2. Ниже мы убедимся, что |/| является нормой на L в смысле § 10 ч. 1. Унитарные пространства, полные относительно этой нормы, называются также гильбертовыми, В частности, конечномерные унитарные пространства гильбертову. Из результатов, доказанных в § 3—4, следует, что: а) всякое конечномерное унитарное пространство #имеет орто- нормированный базис, все векторы которого имеют длину 1; б) поэтому оно изоморфно координатному унитарному пространству С (п = dimL) со скалярным произведением ·> ·> А ·> / п Y/2 (*> #)= Σ*^ί> \x\*=\Jj\*i?) · Ряд свойств унитарных пространств близок к свойствам евклидовых, главным образом по следующей причине: если L — конеч- номерноех унитарное пространство, то на его овеществлении LR имеется (единственная) структура евклидова пространства, в которой норма |/| вектора та же, что и в L. Существование видно из предыдущего абзаца: если {еи ..., еп}— ортонормированный базис L, a {e\tie\t £2, ί#2, ···, en,ien} — соответствующий базис Lr, то | Σ xfii \ = Σ U/12 = Σ ((Re xi? + dm х,П и выражение справа есть евклидов квадрат нормы вектора η η Σ Re xfii + Σ Im Xf (tef) в ортонормированием базисе {β/, /β/}. Единственность следует из п. 9 § 3. Однако скалярные произведения в унитарном пространстве L и евклидовом Lr не совпадают: второе принимает только вещественные значения, а первое — комплексные. На самом деле, эрмитово скалярное произведение на комплексном пространстве приводит не только к ортогональной, но и к симплектической структуре на Lr с помощью следующей конструкции. Временно мы возвращаемся к обозначению g(l>m) для эрмитова скалярного произведения на L и положим а(/, m) = Reg(/, m), b (/, m) = Im g (/, m). Тогда имеют место следующие факты: 2. Предложение, а) а(1,пг) — симметричное, a b(l,m)—антисимметричное скалярное произведение на L r ; оба они инвариантны относительно умножения на ί, г. е. канонической комплексной структуры на Lr: a (il, im) = a(l, m), b(il, im)=&(/, m)\ б) а и Ь связаны следующими соотношениями: a(/, m) = b(//, m), b(/, m)— — a(//, m)\ 127
в) любая пара связанных соотношениями б) {-инвариантных форм а, Ь на Lr, первая из которых симметрична, а вторая антисимметрична, определяет эрмитово скалярное произведение на L по формуле g (Um) = а (/, m) + ib (/, m)\ г) форма g положительно определена тогда и только тогда, когда форма а положительно определена. Доказательство. Условие эрмитовой симметрии g(lym) = = ё(ту 0 равносильно тому, что а (/, т) + ib (/, т) = а (т, I) — ib (m, /), т. е. симметрии а и антисимметрии Ь. Условие g(il,im) = = iig(ly m) = g(l, m) равносильно ^-инвариантности а и 6. Условие С-линейности g по первому аргументу означает R-линейность и линейность относительно умножения на ι, τ. е. а (//, т) + ib (//, m) = g (Я, т) = ig (/, /η) = — b (/, m) + ш (/, m), откуда следуют соотношения б) и утверждение в). Наконец, g(l, l)=a(l, I) в силу антисимметрии Ь, откуда следует г). 3. Следствие. В прежних обозначениях, если g положительно определена и{е\, ..., еп)—ортонормированный базис для g, то {в\, ..., еп, ieu ..., ien} является ортонормированным базисом для а и симплектическим для Ь. Наоборот, если L — 2п-мерное вещественное пространство с евклидовой формой а и симплектической Ь, а также базисом {е\, ..., еп, £п-м, ..., е2п}У ортонормированным для а и симплектическим для Ь, то, введя на L комплексную структуру с помощью оператора /(e/) = <W 1</</г, /(*,)= — *>,_„, /г+1</<2/г, и скалярное произведение g(l, m) = a (I, m) + ib(l, m), мы получим комплексное пространство с положительно определенной эрмитовой формой, для которого {е\, ..., еп} является ортонормированным базисом над С. Доказательство получается простой проверкой с помощью предложения п. 2, и мы оставляем его читателю. Вернемся теперь к унитарным пространствам L. Комплексное неравенство Коши — Буняковского — Шварца имеет следующий вид: 4. Предложение. Для любых l\, /2 e L Ι(/ι, /2)Ι2<ΙΊΙ2Ι'2ΐ2, причем равенство достигается тогда и только тогда, когда векторы /ь /2 пропорциональны. Доказательство. Как в п. 2 § 5, для любых вещественных t имеем l«i+/2P»/2|/il2 + 2/Re(Zlf /2) + |/2l2>0. 128
Случай U = 0 тривиален. Считая, что 1Х -ф 0, вбтводим отсюда, что (Re (Л, /2))2<|/il2|/2l2· Но если (/1(/2) = |(/1)/2)|е'Ф) φ g= R, то Яе(е-'ч>1и 12) = \(1и 12)\. Поэтому 1(/„/2)12<|е-Ч.12|/212 = |/,121/212· Строгое равенство здесь достигается тогда и только тогда, когда |*οβ-"ίφ/ι + h I = 0 Для подходящего t0 e R, что завершает доказательство. В точности так же, как в евклидовом случае, отсюда выводятся следствия: 5. Следствие (неравенство треугольника). Для любых 1и /2, /з^ U1+/2KU1I + I/2I, U1-/3KI/1-/2I + I/2-/3I. 6. Следствие. Унитарная длина вектора \1\ является нормой на L в смысле определения в п. 4 § 10 ч. 1. (Здесь несколько изменяется проверка свойства |α/| = |α||/|: | al\ = (α/, al)m = (ad (/, /))l/2 = | a \ | /1.) 7. Углы. Пусть /ι, Ii^lL — ненулевые векторы. В силу предложения п. 4 (\<r liihJul. <r ι "^ |/il|/2l ^Ь Поэтому существует единственный угол φ, 0 ^ φ ^ π/2, для которого Однако в важнейших естественнонаучных моделях, использующих унитарные пространства, эта же величина λ .. :\ (точнее, ее квадрат) интерпретируется не как косинус угла, а как вероятность. Опишем вкратце постулаты квантовой механики, включающие такую трактовку. 8. Пространство состояний квантовой системы. В квантовой механике постулируется, что с такими физическими системами, как электрон, атом водорода и т. п., можно связать (неоднозначно!) математическую модель, состоящую из следующих данных. а) Унитарное пространство Ж, называемое пространством состояний системы. Такие пространства, рассматриваемые в стандартных учебниках, по большей части являются бесконечномерными гильбертовыми пространствами, которые реализуются как пространства функций на моделях «физического» пространства или прюстранства-времени. Конечномерные пространства Ж 129
возникают, грубо говоря, как пространства внутренних степеней свободы системы, если она рассматривается как локализованная или если ее движением в физическом пространстве можно так или иначе пренебречь. Таково двумерное унитарное пространство «спиновых состояний» электрона, к которому мы еще вернемся. б) Лучи, т. е. одномерные комплексные подпространства в Ш, называются (чистыми) состояниями системы. Вся информация о состоянии системы в фиксированный момент времени определяется заланием луча La Ж или ненулевого вектора φε^ который называется иногда ^функцией, отвечающей этому состоянию, или вектором состояния. Фундаментальный постулат о том, что ψ-функции образуют комплексное линейное пространство, называется принципом супер- позиции, а линейная комбинация £ α-Ψ/» α/е С, описывает /-/ суперпозицию состояний ψι, ..., ψ*. Заметим, что, поскольку физический смысл имеют только лучи Οψ,·, а не сами векторы ψ,, коэффициентам a,j также нельзя приписать однозначно определенного смысла. Однако, если выбирать ψ/ нормированными, |ψ;·|2=1, ч и линейно независимыми, а также нормировать Σ α/ψ7, го произ- вол в выборе вектора ψ, в своем луче сводится к умножениям на числа £/(Р/, которые называются фазовыми множителями-, таков же будет произвол в выборе коэффициентов α7·, которые мы сможем тогда сделать вещественными и неотрицательными, что вместе с условием нормировки /§*'*' = 1 позволяет определить их однозначно. Сильно идеализированные предположения о связи этой схемы с реальностью состоят в том, что у нас имеются физические при боры А^ («печки»), способные приготовлять много экземпляров нашей системы в мгновенных состояниях ψ (точнее, €ψ) для различных феЖ Сверх того, имеются физические приборы Ву («фильтры»), на вход которых подаются системы в состоянии ψ, на выходе обнаруживаются они же в некотором (возможно, другом) состоянии χ, или же не обнаруживается ничего (система «не проходит» через фильтр В ). Второй основной (после принципа суперпозиции) постулат квантовой механики состоит в том, что: система, приготовленная в состоянии ψ е 5#, может быть сразу же после этого обнаружена в состоянии χ е Ж с вероятностью litii 2 = cos26, где θ —угол между ψ и χ. В дальнейшем, по мере введения дополнительных геометрических понятий, мы уточним математическое описание «печек» и «фильтров». Сверх того, мы объясним, что произойдет, если приготовленную в состоянии ψ систему ввести в фильтр не сразу, а 130
по истечении времени t: оказывается, что в промежутке состояние ψ, а вместе с ним и скалярное произведение (ψ, χ) будет меняться, и это изменение также прекрасно описывается в терминах линейной алгебры. Если ψ, χ нормированы, го указанная выше вероятность равна Ι(Ψ>Χ)|2> а само скалярное произведение (ψ, χ), являющееся комплексным числом, называется амплитудой вероятности (перехода от ψ κ χ). Заметим, что физики вслед за Дираком обычно рассматривают скалярные произведения, антилинейные по первому аргументу, и записывают наше (ψ, χ) в виде <χ|ψ>, так что начальное и конечное состояние системы расположены справа налево. Скобки < > по английски называются «bracket». Соответственно, Дирак называет символ |ψ> «кет-вектором», а символ <χ| — соответствующим «бра-вектором». С математической точки зрения, |ψ> есть элемент Ж, а <ψ] — соответствующий ему элемент пространства антилинейных функционалов '4ь*у и <χ|ψ> есть значение χ на ψ. Если ψ, χ ортогональны, т. е. (ψ,χ) = 0, то систему, приготовленную в состоянии ψ, нельзя будет (сразу же после приготовления) обнаружить в состоянии χ, τ. е. она не пройдет через фильтр В% (наоборот, через фильтр В$ она пройдет с достоверностью). Во всех остальных случаях ненулевая вероятность перехода от ψ к χ имеется. Элементы любого ортонормированного базиса {г^, ..., ψ„} образуют набор базисных состояний системы. Предположим, что у нас есть фильтры βψ,, ..., В$ . Многократно пропуская через них η системы, приготовленные в состоянии \Ъ = Σ а^, 0 ^ а,- ^ 1 (вектор считается нормированным), мы обнаружим ψ*· с вероятностью а?. Таким образом, коэффициенты этой линейной комбинации могут быть измерены экспериментально, однако в принципиально статистическом опыте. Это одна из причин, по которым квантовомеханические измерения требуют обработки большого статистического материала. Впрочем, часто системы в состоянии* ψ идут в фильтр «потоком» и на выходе вероятности а\ получаются в виде интенсивностей, чего-то вроде «спектральных линий»; эти интенсивности сами по себе уже являются результатом статистического усреднения. В дальнейшем мы уточним связь этой схемы с теорией спектров линейных операторов. 9. Правила Фейнмана. Пусть в Ж выбран ортонормирован-ный базис {ψι, ..., ψΛ}· Для любого вектора состояния tfe^ имеем η ί = 1 откуда η '(*;%)= Σ (*. ΨιΜΨ*. χ). ί-1 131
Аналогично, (ψ, ψ/)=Σ(Ψ' Ψ/) (Ψ/» Ψ/V. подставляя эту формулу /-ι в предыдущую, получим η (Ψ> χ) = Σ (Ψ. Ψ*.) (**,. Ψί2) (Ψ*„ χ) и вообще для любого т ^ 1 (ψ. х) = Σ (*. ψ*.) (Ψ/. +J · · · (*<m· x). Эти простые формулы линейной алгебры можно интерпретировать, по Фейнману, как законы «комплексной теории вероятностей», относящиеся к амплитудам вместо вероятностей. Именно, будем рассматривать последовательности типа (ψ, ψ^, ψ*2, ..., "ф/т, χ) как «классические траектории» системы, последовательно пробегающей состояния в скобках, а число (ψ, ψί,^ψί,ι Ψ*2) · · · (%m> X) — как амплитуду вероятности перехода из ψ в χ вдоль соответствующей классической траектории. Эта амплитуда является произведением амплитуд переходов вдоль последовательных отрезков траектории. Тогда приведенная выше формула для (ψ, χ) означает, что эта амплитуда перехода есть сумма амплитуд перехода от ψ ас χ по всевозможным классическим траекториям («одинаковой длины»). Бесконечномерный и более рафинированный вариант этого замечания, в котором основную роль играют пространственно-временные (или энергетически-импульсные) наблюдаемые, Р. Фейн- ман'положил в основу своей полуэвристической техники выражения амплитуд через «континуальные интегралы по классическим траекториям». Пространство траекторий является бесконечномерным функциональным пространством, и математикам до сих пор не удалось построить общую теорию, в которой были бы оправданы все замечательные вычисления физиков. 10. Расстояния. Расстояние между подмножествами в унитарном пространстве L можно определить точно так же, как в евклидовом: d (£/, V) = inf {| /, - /ί 11 /ι €= С/, /2 €= V). Расстояние от вектора / до подпространства L0 также равно длине ортогональной проекции / на Lo- Доказательство ничем не отличается от евклидова случая. В частности, если {ей ..., ет} — ортонормированный базис Lo, то I т d(l,U) = \ _ Ι ί-ι как в евклидовом случае, и / — Σ (и ei) et т ι ι т Σ (I, e,)e,\ «ΣΚ/,β,ίΡ^Ι/Ι* ί-1 по теореме Пифагора. 132
11. Приложение к пространствам функций. Как в § 5 и 4, мы можем вывести неравенства для комплекснозначных функций: ь γ ь ь Af(x)g(x)dx\ <\\f(x)\2dx\\g(x)\2dx, \а Ια α / Ь ч 1/2 • Ь ν 1/2 / Ь \ 1/2 [\\f(x) + g(x)\2dx\ <(j|/(*)|2d*J + \[\g(x)?dxj . а также для их коэффициентов Фурье. Рассматривая функции на отрезке [0,2π] и полагая 2π a»=irn\f{x)e-inxdx> получаем, что в пространстве со скалярным произведением 2л \ f(x)g(x)dx сумма д/2я является ортогональной проекцией'/ на пространство многочленов Фурье «степени ^.N» и минимизирует среднеквадратичное отклонение / от этого пространства. В частности, 14 *>Л £ |α„Ρ<$ \f(x)fdx, П--Л/ так что ряд Σ \anf сходится. § 7. Ортогональные и унитарные операторы 1. Пусть L — линейное пространство со скалярным произведением g. Множество всех изометрий /: L-+L, т. е. обратимых линейных операторов с условием ί(/(/ι)· /(«)«*(/ι. 4) для всех /ι, /г^ L, очевидно, образует группу. Если L — евклидово пространство, такие операторы называются ортогональными, а если L унитарно, то унитарными, Симплектические язометрии будут рассмотрены позже. 2. Предложение. Пусть L — конечномерное линейное пространство с невырожденным скалярным произведением ( , ), симметричным или эрмитовым. Для того чтобы оператор /: L -* L был 133
изометрией, необходимо и достаточно, чтобы выполнялось любое из следующих условий: а) (f(Oi Д/)) = (/, /) для всех /е L (здесь предполагается, что характеристика поля скаляров отлична от двух); б) пусть {еи ..., еп}—базис в L с матрицей Грама G, А — матрица оператора f в этом базисе. Тогда A'GA^G, или AtGA = G; в) f переводит некоторый ортонормированный базис в ортонор- мированный базис, г) если сигнатура скалярного произведения равна (р, q), то матрица оператора f в любом ορτοπορ жированном базисе {е\, ... ..., ер, вр+и ..., ep+q) с (е,·, е») = -М при /<р и (eiy β,·) = — Ι при p+l^i^p + Q удовлетворяет условию или *ίϊ -1)*-ίϊ -Ι) в симметричном и эрмитовом случае соответственно. Доказательство, а) В симметричном случае это утверждение следует из п. 9 § 3: если f сохраняет квадратичную форму (Z, /)= q(l), то f сохраняет и ее поляризацию (/, m) = j[q(l + m) — q{l) — q(m)]. В эрмитовом случае имеем аналогично Re(/, m)=\[q(l + m)-q(D-q(m)] и предложение п. 2 § 6 показывает, что (/, гп) однозначно восстанавливается по Re(Z, m) по формуле (/, m) = Re (Ζ, rit) — i Re (//, m) и потому / сохраняет (Ζ, m). б) Если f — изомерия, то матрицы Грама базисов {е\9 ..., еп} и {f(ei)> ..., f(en)} совпадают. Но последняя матрица Грама равна AfGA в симметричном и AfG%B эрмитовом случае. Наоборот, если f переводит базис {е , ..., еп} в {е\, ..., е'п} и матрицы Грама базисов {ej и {е\} совпадают, то / — изометрия в силу формул координатной- записи скалярного произведения из п. 2 § 2. в), г). Эти утверждения являются частными случаями предыдущих. Из предложения п. 2 следует, что ортогональные (соответственно унитарные) оператрры—это операторы, которые в одном (и потому в любом) ортонормированном базисе задаются ортого- 134
нальными (соответственно унитарными) матрицами, т. е. матрицами U, которые удовлетворяют соотношениям ии1^Еп или UUf = En. Множества таких матриц размера η Χ η были введены впервые в § 4 ч. 1; они обозначались О (я) и V(n) соответственно. Аналогично, матрицы изометрий в ортонормированных базисах сигна- ТУР (Р» Q)y удовлетворяющие условиям г) предложения 2, обозначаются 0(р, q) и U(p, q)\ при ρ, ηφΟ они называются иногда псевдоортогональными и псевдоунитарными соответственно. В этом параграфе мы будем заниматься только группами О(п) и U(/i). Фундаментальная для физики группа Лоренца 0(1,3) будет изучена в § 10. 3. Группы U(Г), 0(1) и 0(2). Из определения немедленно следует, что U(l)={aeC ||a| = l} = {e"4q>€sR}f 0(l) = {±l} = U(l)nR. Далее, если U е 0(/?), то UUt = £„, откуда (det U)2 = 1 и det U = dbl. Если ί/ = Г а , J — ортогональная матрица с определителем — 1, то (_a__d) — ортогональная матрица с определителем 1, принадлежащая SO (2). Матрицы из SO (2) имеют вид {(acbd)\ad--bc = a2 + b2==c2 + d2==l> ac+bd = o}. Очевидно, любую такую матрицу можно представить в виде / eos φ — sin φ \ r^ ο \ . , Φ5θ, 2π), V sin φ cos φ /' Ύ L ' ' т. е. она задает евклидов поворот на угол φ. Отображение U(l)->S0(2):^^fC0S<p"sin<pY v ч ' V sin φ cos φ / является изоморфизмом. Его геометрический смысл объясняется следующим замечанием: овеществление одномерного унитарного пространства (С1, |г|2) есть двумерное евклидово пространство (R2, x2+ xfjy а овеществление унитарного преобразования Ζ¥^^6ΐψζ задается матрицей поворота на угол φ. В § 9 мы построим значительно менее тривиальный эпиморфизм SU(2)->SO(3) с ядром {±1}. Повороты (^ф ~со"Ф) на Угол Φ ^ Ο» π не имеют собственных векторов в R2 и потому не диагонализируемы. Наоборот, все матрицы UeO(2) с det ί/= — 1 диагонализируемы. Точнее говоря, характеристический многочлен матрицы / cos φ —- sin φ \ Ч — sin φ — cos φ J 135
равен t2—1 и имеет корни ±1. Легко проверить непосредственно, что соответствующие этим корням собственные подпространства ортогональны; ниже это будет доказано в гораздо большей общности. Поэтому любой оператор из 0(2) с det U = —1 является отражением относительно некоторой прямой: он действует тождественно на этой прямой и меняет знак векторов, ортогональных к ней. Пользуясь этой информацией, мы можем теперь установить структуру общих ортогональных и унитарных операторов. 4. Теорема, а) Для того чтобы оператор f в унитарном пространстве был унитарным, необходимо и достаточно, чтобы он диагонализировался в ортонормированном базисе и имел спектр, расположенный на единичной окружности в С. б) Для того чтобы оператор f в евклидовом пространстве был ортогональным, необходимо и достаточно, чтобы его матрица в подходящем ортонормированном базисе имела вид [Α (φ,) J Λ (qpw) ι ι 1 О Ι -ι где на пустых местах стоят нули. в) Собственные векторы ортогонального или унитарного one- ратора, отвечающие разным собственным значениям, ортогональны. Доказательство, а) Достаточность утверждения очевидна: если L/ = diag(Xi, ..., λΛ), |λ/|2= 1, то ϋϋ* = Εη, так что U— матрица унитарного оператора. Наоборот, пусть /— унитарный оператор, λ--его собственное значение, ίχ— соответствующее собственное подпространство. По предложению п. 2 § 3 имеем L = LKQ)L£. Подпространство L% одномерно, /-инвариантно, и ограничение / на L* является одномерным унитарным оператором, поэтому λ^υ(1), τ. е. |λ|2=1. Если мы покажем, что подпространство L£ также /-инвариантно, то индукцией по dimL отсюда можно будет вывести, что L разлагается в прямую сумму /-инвариантных попарно ортогональных одномерных подпространств, что докажет требуемое. Α (φ) = ( cos φ — sin sin φ cos 136
В самом деле, если /0 ^ L*, /0 Φ 0 и (/о, /) = 0, то (/о, /:(0) = (/:(λ-1Ζο), /(/)) = (λ-,/0, /) = λ-ι(/ο, 0 = 0, так что /(/)е Lj{-. б) В ортогональном случае рассуждения аналогичны: непосредственно проверяется достаточность условия и затем проводится индукция по dim L. Случаи dim L = 1,2 разобраны в предыдущем пункте. Если dim ί^3 и / имеет вещественное собственное значение λ, нужно снова положить L = Lk@Lfc и рассуждать, как выше (заметим, что здесь обязательно λ=±1). Наконец, если / не имеет вещественных собственных значений, то следует выбрать двумерное /-инвариантное подпространство L0 cz L, которое существует по предложению п. 16 § 12 ч. 1. На нем матрица ограничения / в любом ортонормированном базисе будет иметь вид Α (φ) в силу предыдущего пункта. Поэтому остается проверить, что подпространство L£ также /-инвариантно. Действительно, если (/о, /) = 0 для всех /о е L0, то (/о, f(/)) = (f(f-1(/o)), /(/))- (Г1 (W, 0 = 0, ибо f-l(lo)^Lo для всех /0 е Lo· Это завершает доказательство. в) Пусть /(/;) = λ*/,, i = 1, 2. Тогда (/ι, /2) = (/(/ι), ί(/2)) = λ^2(/„ /2). Так как |λ,·|2=1, при λι =т^= λ2 имеем λιλ^^Ι. Следовательно, (/ь/2) = 0. Это рассуждение применимо одновременно к унитарному и ортогональному случаю. Доказательство окончено. 5. Следствие («теорема Эйлера»). В трехмерном евклидовом пространстве любое ортогональное отображение /, не меняющее ориентацию (г. е. элемент группы SO(3)), является вращением относительно некоторой оси. Доказательство. Так как характеристический многочлен / имеет степень 3, у него обязательно есть вещественный корень. Если он единственный, то он должен быть равен 1, ибо det/= 1. Если есть больше одного вещественного корня, то все корни вещественные, и возможны комбинации (1,1,1) или (1, —1, —1). В любом случае собственное значение I, имеется. Соответствующее собственное подпространство является осью вращения, а в ортогональной к нему плоскости индуцируется элемент ISO(2), т.е. вращение на некоторый угол. § 8. Самосопряженные операторы 1. В первой части мы видели, что простейший и наиболее важный класс линейных операторов образуют диагонализируемые операторы. Оказывается, что в евклидовых и унитарных пространствах совершенно особую роль играют операторы с вещественным спектром, диагонализируемые в некотором ортонормированном базисе. Иными словами, эти операторы осуществляют вещественные 137
растяжения пространства вдоль системы попарно ортогональных направлений. Пусть {е1у ..., et,}— ортонормированный базис в L uf:L-+L — оператор, для которого f(ei) = %iety λ/eR,/=1, ..., п. Нетрудно убедиться, что он обладает следующим простым свойством: (/(/ι). /2) = (ίι. f(k)) Для всех /lf /2gL. (1) Действительно, (/(Σ*λ)' Σ У/*/) = Σ λ**,·0ι или Σλίχί9» (Σ*Α· f ( Σ У/*/)) = Σ λ/**ίΛ или Σ^ίθί (в унитарном случае вещественность λ* использовалась во второй формуле). Операторы со свойством (1) называются самосопряженными, и мы установили, что операторы с вещественным спектром, диагонализируемые в ортонормированном базисе, самосопряжены. Вскоре мы докажем и обратное утверждение, но сначала исследуем свойство самосопряженности более систематично. 2. Сопряженные операторы в пространствах с билинейной формой. В первой части курса мы показали, что для любого линейного отображения /: L-*~ M существует единственное линейное отображение /*: Af*->L*, для которого (Пт·),/)~(т·, /(/)). где т* е М*, IgL и где скобки означают канонические билинейные отображения L* X L-+X, M*XAi->Jif. В частности, при Μ = L оператору /: L-+L отвечает оператор f*: L*-+L*. Предположим теперь, что на L имеется невырожденная билинейная форма g: LXL->Jif, определяющая изоморфизм g: L-+L*. Тогда, отождествив L* с L посредством g-1, мы можем рассмотреть /*, точнее g~[of*ogy как оператор на L. Мы по-прежнему будем обозначать его /* (точнее было бы писать, например, /J но /* в старом смысле в этом параграфе больше не будет фигурировать). Очевидно, новый оператор /* однозначно определяется формулой «(ПО. ") = *(/. /(«))· Он по-прежнему называется сопряженным с / (относительно скалярного произведения if). В полуторалинейном случае g определяет изоморфизм L с L*9 а не с L*. Поэтому на I с помощью этого изоморфизма следует переносить оператор f*: £*->£*, который определяется как f*(m) = /*(m). Перенесенный оператор §-lofiog: L-+L линеен. Следовало бы обозначить его f+, но мы сохраним более традиционное обозначение /*. Тогда и в полуторалинейном случае будет справедлива формула g(T('). w) = et/. /<"»· 138
Операция /*—>/* линейна, если g билинейна, и антилинейна, если g полуторалинейна. Операторы /: L ->- L со свойством /* = / в евклидовых и конечномерных унитарных пространствах называются самосопряженными, в евклидовом случае — также симметричными, а в унитарном— эрмитовыми. Эта терминология объясняется следующим простым замечанием. 3. Предложение. Если оператор f: L-+L в ортонормированном базисе задается матрицей А, то оператор f* задается е этом же базисе матрицей А* (евклидов случай) или Я* {унитарный случай), В частности, оператор самосопряжен тогда и только тогда, когда его матрица в ортонормированном базисе симметрична или эрмитова. Доказательство. Обозначая скалярное произведение в L скобками," а векторы — столбцами их координат в ортонормированном базисе, имеем (/(*), у)^(А^У у = Сх'А')у^Р(А'у) = (1 Г (У)) (евклидов случай). Отсюда и следует, что матрица /* равна А*. Унитарный случай разбирается аналогично. 4. Самосопряженные операторы и скалярные произведения. Пусть L — пространство с симметричным или эрмитовым скалярным произведением ( , ). Для любого линейного оператора /: L-+L мы можем определить новое скалярное произведение (, )f на L, положив (/i, /2)f = (f(/i), /2). Предположим, что L невырождено, так что мы можем пользоваться понятием сопряженного оператора. Тогда (/2, /i)f = (/&). /i) = fe Γ(/ι)) = (Γ(/ι)..« = (Ί· «г в евклидовом случае, и аналогично (/2, /i)f-(f («. /1) -«2. Г (/,)) = (Г (W. к) = (1ь «г в унитарном. Следовательно, если оператор f самосопряжен, то построенная по нему новая метрика (/ι, /2)f будет по-прежнему симметричной или эрмитовой. Верно и обратное, как нетрудно убедиться прямо или с помощью предложения п. 3. Таким образом, мы установили биекцию между множествами самосопряженных операторов, с одной стороны, и симметричных скалярных произведений в пространстве, где одно невырожденное скалярное произведение задано, — с другой. В евклидовом и унитарном случае после выбора ортонормированного базиса охнвет- ствие легко описывается на матричном языке: матрица Грама (, )f транспстирована к матрице отображения /♦ 139
Теперь мы докажем основную теорему о самосопряженных операторах, параллельную теореме п. 4 § 7 об ортогональных и унитарных операторах и тесно с ней связанную. 5. Теорема, а) Для того чтобы оператор f в конечномерном евклидовом или унитарном пространстве был самосопряжен, необходимо и достаточно, чтобы он диагонализировался в ортонор- мированном базисе и имел вещественный спектр. б) Собственные векторы самосопряженного оператора, отвечающие разным собственным значениям, ортогональны. Доказательство, а) Достаточность мы проверили в начале этого параграфа Вещественность спектра в унитарном случае устанавливается просто: пусть λ — собственное значение оператора f, I e L — соответствующий собственный вектор. Тогда λ (Л /) = (/(/), /) = (/, /(/)) = λ (/, /), откуда λ = λ, ибо (/, /)=т^0. Ортогональный случай сводится к унитарному следующим приемом: рассмотрим комплексифицирован- ное пространство Iе и введем на нем полуторалинейное скалярное произведение по формуле (/ι + ih, h + На) = du h) + (/2, /4) + / (/2. /з) - / (/1, /4). Легкая прямая проверка показывает, что Lc превращается в унитарное пространство, а /с — в эрмитов оператор на нем. Спектр оператора /с совпадает со спектром оператора f, ибо в любом R-базисе L, являющемся в то же время С-базисом Lc, / и /с задаются одинаковыми матрицами. Поэтому спектр оператора / веществен. Дальше оба случая можно рассматривать параллельно и провести индукцию по dimL. Случай dim L = 1 тривиален. При dim L > 1 выберем собственное значение λ и отвечающее ему собственное подпространство Ц, затем положим L{ = L}. По предложению п. 2 § 3 имеем L = L0(BL\. Подпространство Lx инвариантно относительно /, потому что если /0eL0, lo Φ 0 и ZeLi, т. е. (/о, /) = 0, то (/о, f (/))-(/ (/0), /) = λ(/0, 0 = 0, так что f(/)eL. По индуктивному предположению ограничение / на L\ диагонализируется в ортонормированном базисе L\. Добавив к нему вектор /0 е L0, |/o|= 1, получим требуемый базис в L. б) Пусть f (h) = λι/ι, Hh) = λ2/2. Тогда λι(/„ /2) = (/(/ι), /2) = (/ι, /(/2)) = λ2(/1, /2), откуда следует, что если λι φ λ2, το (1\, /д) = 0. 6. Следствие. Любая вещественная симметричная или комплексная эрмитова матрица имеет вещественный спектр и диагонали- зируема. Доказательство. Построим по матрице А самосопряженный оператор в координатном пространстве R" или Сп с канони- 140
ческой евклидовой или унитарной метрикой и применим теорему п. 5. Из нее видно даже больше: матрицу X такую, что Х~ХАХ диагональна, можно найти в О(п) или bU(/i) соответственно. 7. Следствие. Отображение exp: u(n)-+\J(n) сюръективно. Доказательство Алгебра Ли и(п) состоит из антиэрмитовых матриц (см. § 4 ч. 1), а любая антиэрмитова матрица имеет вид М, где А — эрмитова матрида. Чтобы решить относительно А уравнение ехр(/71 )= U, где U е Щ/г), реализуем U как унитарный оператор / в эрмитовом координатном пространстве С". После этого по теореме п. 4 § 7 найдем в Сп новый ортонормированный базис {#1, ..., еп), в котором матрица оператора / имеет вид diag(ei(Pi, ..., £ίφ/ι), зададим в этом базисе оператору матрицей diag((pi, ..., ψη) и обозначим через А матрицу оператора g в исходном базисе. Очевидно, ехр (/#)=/ и ехр(М)= U. 8. Следствие, а) Пусть gu g2 — две ортогональные или эрмитовы формы в конечномерном пространстве L, и одна из них, скажем gu положительно определена. Тогда в пространстве L существует базис, матрица Грама которого относительно g\ единична, а относительно g2 диагональна и вещественна. б) Пусть gu g2 — две вещественные симметричные или комплексные эрмитово симметричные формы относительно переменных Хи ···> χη\ у\, ..., Уп, и g\ положительно определена. Тогда с помощью невырожденной линейной замены переменных (общей для χ и у) эти две формы можно привести к виду ■> > п -> -> п 8\ (*» У)= Σ х$и Ы*> У)=Тм hxiHb h ^ R, или -> -> n ■> -> n g\ (*. У)=11 XiH g2(x> У)= Σ λιΧι9ι> λ/GR. Доказательство. Очевидно, обе формулировки эквивалентны. Чтобы доказать их, рассмотрим (L, g\) как ортогональное или унитарное пространство, переобозначим gi(l\,k) через (/ь /2) и представим g2(luh) в виде (luh)u гДе /: L-+L — некоторый самосопряженный оператор, как это было сделано в п. 4. После этого найдем ортонормированный базис в L, в котором / диагона- лизируется. По замечанию в конце п. 4 этот базис будет удовлетворять требованиям следствия (точнее, утверждения а)). 9. Ортогональные проекторы. Пусть L — линейное пространство над Ж и пусть дано его разложение в прямую сумму: L =- = L\ Θ Ζ,2· Как было показано в ч. 1, оно определяет два проектора рс L-+L таких, что Im pi = Ц, idz. = ρ, -j- Pi, Р\Ръ = ΡιΡ\ = 0, p2t — pr Собственные значения проекторов равны 0 или 1. Если L — евклидово или унитарное пространство и L2 — L^, τη соответствующие ортогональные проекторы диагонализируются в ортонормированием базисе L — объединении таких базисов L\ и L2 — и* потому самосопряжены. Наоборот, любой самосопряженный 141
проектор р есть оператор ортогонального проектирования на подпространство. Действительно, Кегр и Imp натянуты на собственные векторы р, отвечающие собственным значениям 0 и 1 соответственно, так что Кегр и Imp ортогональны по теореме и. 5 и L = Кегр Θ Imp. Далее, если самосопряженный оператор f диагонализируется в ортонормированном базисе {е,·}, /(£;) = λ/e/, и р, — ортогональный проектор L на подпространство, натянутое на е,·, то /=Σλ,ρ,. (2) /-ι Эта формула называется спектральным разложением оператора /. Можно считать, что λ/ пробегает только попарно различные собственные значения, а р, есть оператор ортогонального проектирования на полное корневое подпространство L(Xi)\ формула (2) останется верной. Теорема п. 5 обобщается также на ограниченные по норме (и, с осложнениями, на неограниченные) самосопряженные операторы в бесконечномерных гильбертовых пространствах. Однако это обобщение требует очень нетривиального изменения некоторых основных понятий. Главные проблемы связаны со структурой спектра: в конечномерном случае λ является собственным значением / тогда и только тогда, когда оператор λ id—/ необратим, тогда как в бесконечномерном случае множество точек необратимости оператора λ id — / может быть больше множества собственных значений f: для неизолированных в спектре точек λ0 собственных векторов, вообще говоря, нет. С другой стороны, именно множество точек необратимости оператора λ id — / служит правильным обобщением спектра в бесконечномерном случае. Эта нехватка собсФвенных векторов требует изменения многих формулировок. Основной результат является обобщением формулы (2), где, однако, суммирование заменяется интегрированием. Мы ограничимся описанием нескольких важных принципов на примерах, где эти затруднения не возникают. 10. Формально сопряженные дифференциальные операторы. Рассмотрим какое-нибудь пространство вещественных функций на отрезке [а, Ь] со скалярным произведением ъ (f,g)=[f(x)g(x)dx. Предположим, что оператор -т- переводит его в себя. Согласно формуле интегрирования по частям 142
Поэтому, если пространство состоит только из функций, принимающих на концах интервала одинаковые значения, то d т.е. на таком пространстве оператор — -т- сопряжен с операто- р°м -к- Используя формулу интегрирования по частям несколько раз или пользуясь формальным операторным соотношением (/ ° · · · °/я)*===/,* ° · · · °/р получаем, что на таких пространствах [E;.w^r]=|(-i)i-£r-.w( (з) где запись —т- <*а{ (л)для оператора означает, что, применяя его dxl к функции /(*), мы сначала умножаем се на α,·(*) и затем дифференцируема* раз по х. Формула (3) определяет операцию (формального) сопряжения дифференциальных операторов: Dr—>£)*. Оператор D называется (формально) самосопряженным, если D = D*. Слово «формальный» здесь.напоминает о том, что в определении не указано явно пространство, на котором D реализуется как линейный оператор. Если скалярное произведение определяется с помощью веса G(x): ь (f, g)o = [G(x)f(x)g(x)iix, a то очевидные вычисления показывают, что вместо D* следует рассматривать оператор ΰ-Ό/)*υβ (считая, что G не обращается в нуль); именно он является кандидатом на роль сопряженного оператора к D относительно (/, g)c· Покажем, что ортогональные системы функций, рассмотренные в § 4, состоят из собственных функций самосопряженных дифференциальных операторов. а) Вещественные многочлены Фурье степени ?ζΝ. Оператор d2 -тт ·> формально самосопряженный, переводит это пространство в себя и самосопряжен на нем. Кроме того, его собственные значения равны 0 (кратность 1) и —I2, —22, ..., —Ν2 (кратность 2). Соответствующие собственные векторы суть 1 и {cosnx, sinnx}, 1 ^ η *ζ N. б) Многочлены Лежандра. Оператор из
формально самосопряжен и переводит пространство многочленов степени ^N в себя. Имеет место очевидное тождество (х2 - 1) -27 (х2 ~ П" = Ъпх (х2 - 1)", откуда по формуле Лейбница, примененной к обеим частям, „rt+l [(*?-!) j;(*-l)n] = dx + η(η+1)^(χ*-1)η = 2ηχ-^(χ2-1)η+2η(η+1)^Γ(χ*-\)η. Разделив последнее равенство на 2пп\ и вспомнив определение многочленов Лежандра, получим отсюда [(x2-V-B+2x-t]Pn(x) = n(n+l)Pn(x). Таким образом, оператор (х2 ·— 1) ^р-+ 2*-^. на пространстве многочленов степени ζζΝ диагонализируется в ортогональном базисе из многочленов Лежандра и имеет простой вещественный спектр. Стало быть, он самосопряжен. Разумеется, самосопряженность на этом пространстве можно было бы проверить и непосредственным интегрированием по частям: член типа /g|l_, пропадет здесь из-за множителя х2—1 в коэффициентах оператора. Тогда из результатов этого пункта и теоремы п. 4 получается другое доказательство попарной ортогональности многочленов Лежандра. Мы оставляем читателю часть проверок и интерпретацию в терминах линейной алгебры соответствующих фактов для многочленов Эрмита и Чебышева (помнить о весовых множителях G (*)!). d в) Многочлен Эрмита Нп(х) = (--\)пе*7--^ {е~*2) есть собственный вектор с собственным значением —2п оператора Κ=τ?~2χ-Τχ· dn Функция е~х2/2 Нп (*) = (-— \)пе*212 -j^r (e~x*) является собствен- ным вектором оператора Н = — — х2 П dx2 х с собственным значением —(2/г + 1). Первое утверждение проверяется прямой индукцией по п, которую мы опускаем. Для доказательства второго утверждения рас- 144
смотрим вспомогательный оператор M = -f -χ. ах Отсюда следует, что если / есть собственная функция оператора Я с собственным значением λ, то Mf есть собственная функция оператора Я с собственным значением λ — 2: HMf = [Я, Μ] f + MHf = - 2Mf + XMf = (λ - 2) Mf. Поскольку Я (β-χ2/2)=— е'*2'2, мы получаем, что М1 (е~*2/2) есть собственная функция для Я с собственным значением — (2/г + 1) при всех η ^ 0. С другой стороны, прямая проверка показывает, что ех'РМ {β-*η {х)) = **> ^_ {e-*f (x))t откуда вытекает, что e-xa*2Hn(x) = (—l)nMn{e-x4% что завершает доказательство второго утверждения, г) Многочлен Чебышева есть собственный вектор с собственным значением —п2 оператора /ι ъ\ d2 d 11. Нормальные операторы. Как унитарные, так и самосопряженные операторы в унитарном пространстве являются частным случаем нормальных операторов, которые можно описать двумя равносильными свойствами: а) Это операторы, диагонализируемые в ортонормированном базисе. б) Это операторы, коммутирующие со своим сопряженным оператором. Проверим равносильность. Если {е,·}—ортонормированный базис с f(ei)=Xei> то f*(ei) = — λιβΐ, так что [/, /*] = 0, и из а) следует б). Для доказательства обратной импликации выберем собственное значение λ оператора / и положим £* = {/€= L|/(/) = W>. Проверим, что /*(£&) с: L*. В самом деле, если I (= L, то /(Γ(/)) = Γ(/(0) = Γ(λ/) = λΓ(/), 145 Легко проверить, что [Я, Ail = ЯМ —
поскольку /у* = f*f. Отсюда вытекает, что пространство 1\ f-ин- вариантно: если (/, /0) = 0 для всех /0 е L, то (/(О,/о) = (Л Г(/о)) = 0· Такое же рассуждение показывает, что L£ /"-инвариантно. Ограничения / и /* на L^, очевидно, коммутируют. Применяя индукцию по размерности L, мы можем считать, что на Lfc / диагона- лизируется в ортонормированном базисе. Так как то же верно для L%, это завершает доказательство. УПРАЖНЕНИЯ 1. Пусть /: L-+L — оператор в унитарном пространстве. Доказать, что если I (/(О· О I ^ СЮ2 Для всех / е /.. и некоторого с > О, то I (ПО. /*)| + 1(/, i(m))\<t2c\l\\m\ для всех /, m e L. 2. Пусть /: L-+L — самосопряженный оператор. Доказать, что l(/(0,0KI/i|/|2 для всех / е L, где |/| — индуцированная норма /, и если с < |/|, то существует вектор IgLc К/(0, /)|>с1Л*. . 3. Самосопряженный оператор / называется неотрицательным, / ^ О, если (/(О» 0^0 Аля всех '· Доказать, что это условие равносильно неотрицательности всех точек спектра /. 4. Доказать, что отношение'/ ^ g: /— g ^ 0 является отношением порядка на множестве самосопряженных операторов. 5. Доказать, что произведение двух коммутирующих неотрицательных самосопряженных операторов неотрицательно. в. Доказать, что из каждого неотрицательного самосопряженного оператора можно извлечь единственный неотрицательный квадратный корень. 7. Вычислить явно поправку второго приближения к собственному вектору и собственному значению оператора Но~\-гН\ 8. Пусть / — самосопряженный оператор, ω е С, Im ω φ 0 Доказать, что оператор g=(/ —ώ id) (/ — ω id)"1 унитарен, его спектр не содержит единицы и f = (<о^ — <о id) (^ — id)"1. 9. Наоборот, пусть g — унитарный оператор, спектр которого не содержит единицы. Доказать, что оператор /=(<*>£ — ώ id) (g — id)"1 самосопряжен и Я = (/ —о> ici) (/ — со id)~!. (Описанные здесь отображения, которые связывают самосопряженные и унитарные операторы, называются преобразованиями Кэли. В одномерном случае а — ώ они отвечают отображению а ь-~*> ———, которое переводит вещественную ось в единичную окружность.) 10. Пусть f: L-+L — любой линейный оператор в унитарном пространстве. Доказать, что /*/ — неотрицательный самосопряженный оператор и что он положителен тогда и только тогда, когда / обратим. 146
11. Пусть f обратим и rx=*tf , г2 = 1 f, где r\, r2 — положительные самосопряженные операторы. Доказать, что f = rlwl =ы2г2' где Μι, ί/2 унитарны. (Эти представления называются полярными разложениями линейного оператора f, где ui, иг — соответственно правый и левый фазовые множители /. В одномерном случае получается представление ненулевых комплексных чисел в виде re1®.) 12. Доказать, что полярные разложения / = rxU\ = uzr2 единственны. 13. Доказать, что полярные разложения существуют также для необратимых операторов f, но однозначно определяются лишь /Ί, г2, а не унитарные сомножители. § 9. Самосопряженные операторы в квантовой механике 1. Мы продолжаем здесь обсуждение основных постулатов квантовой механики, начатое в п. 8 § 6. Пусть Ж— унитарное пространство состояний некоторой квантовой системы. Для характеризации конкретных состояний в физике пользуются возможностью определить на них («измерить») значения некоторых физических величин таких, как энергия, спин, координата, импульс и т. п. Если единица измерения каждой такой величины, а также начало отсчета («нуль») выбраны, то возможные значения являются вещественными числами (это по существу определение скалярных величин), и мы всегда будем считать это условие выполненным. Третий (после принципа суперпозиции и интерпретации скалярных произведений как амплитуд вероятности) постулат квантовой механики состоит в следующем. Каждой скалярной физической величине, значения которой можно измерять на состояниях системы с пространством состояний Ж, можно поставить в соответствие самосопряженный оператор f: Ж-*Ж со следующими свойствами: а) Спектр оператора f есть полное множество значений величины, которое можно получить, производя измерения этой величины на разных состояниях системы, б) 'Если ψε<^ — собственный вектор оператора f с собственным значением λ, то при измерении этой величины на состоянии ψ с достоверностью получится значение λ. в) Более общо, измеряя величину f на состоянии ψ, |ψ|=1, мы можем получить значение λ из спектра оператора f с вероятностью, равной квадрату нормы ортогональной проекции ψ на полное собственное подпространство Ж (λ), отвечающее λ. Так как в силу теоремы п. 4 § 8 Ж разлагается в ортогональ- m ную прямую сумму ф<9ё (λί), λί Φ λ/ при ιφ ]\ мы можем разло- жить ψ в соответствующую сумму проекций ψ; ε Ж (λ,·), /= 1, ... ..., m. Теорема Пифагора m 1 = 1Ч>Р — ΣΙ4»*Ρ 147
интерпретируется тогда как утверждение о том, что, производя измерения / на любом состоянии ψ, мы с вероятностью I получим хоть какое-нибудь из возможных значений /. Физические величины, о которых мы говорили выше, и соответствующие им самосопряженные операторы также называют наблюдаемыми. Постулат о наблюдаемых иногда трактуется более широко и считается, что любому самосопряженному оператору отвечает некоторая физическая наблюдаемая. В бесконечномерных пространствах Ж эти постулаты несколько меняются. В частности, вместо б) и в) следует рассматривать вероятность того, что при измерении / в состоянии ψ значения попадут в некоторый интервал (a, 6)czR. Этому интервалу также можно поставить в соответствие подпространство <5^(а, &> cz <9# — образ ортогонального проектора /?(а, ь) на φ 36(%ι)β конечно- К{е={а, b) мерном случае, — и искомая вероятность равна ΙΡ(α,6)ψί2 = (Φ,^(α.5)Ψ). Кроме того, в бесконечномерном случае операторы наблюдаемых могут оказаться определенными лишь на некотором подпространстве Ж0 с Ж. Связь этой терминологии с понятиями, введенными в п. 8 § 6, такова. Фильтр Вх — это прибор, который измеряет наблюдаемую, отвечающую ортогональному проектору на подпространство, порожденное χ. Ей приписывается значение 1, если система прошла через фильтр, и 0 в противном случае. Печка 4ψ —это комбинация прибора, производящего систему, вообще говоря, в разных состояниях, и фильтра βΜ, пропускающего затем лишь системы в состоянии ψ. Рецепт вычисления вероятностей, данный в п. 8 § 6, очевидно, согласуется с рецептом, данным в свойствах б), в) выше На этом примере видно, что прибор, измеряющий некоторую наблюдаемую, скажем В0 в состоянии ψ, вообще говоря, меняет это состояние: с вероятностью | (ψ, χ)|2 он превращает его в χ, а с вероятностью 1 — | (ψ, χ) |2 «уничтожает» систему. Поэтому термин «измерение» в применении к такому акту взаимодействия системы с прибором может привести к совершенно неадекватным интуитивным представлениям. Классическая физика основана на предположении о том, что акт измерения можно в принципе произвести, сколь угодно мало повлияв на состояние системы, подвергшейся измерению. Тем не менее термин «измерение» общепринят в физических текстах, и мы сочли необходимым ввести его здесь, начав ранее с менее обычных, но интуитивно более удобных <печек» и «фильтров». 2. Средние значения и принцип неопределенности. Пусть f — некоторая наблюдаемая, {λ;} —ее спектр, Ж = 0 Ж (λι) — соответствующее ортогональное разложение. Как было сказано, на состоянии ψ, |ψ|=1, f принимает значение λ/ с вероятностью ( Φ ΛΨΪ > гДе Pt — ортогональный проектор на Ж (λ/). Поэтому 148
среднее значение /\р величины f на состоянии ф, взятое по многим измерениям, можно вычислить так: U = Σ λ, (φ, ρ,ψ) = Σ (ψ, λ,ρ,φ) = (ψ, / (φ» i i (повторяем, что |ф| = 1). Наша величина (ψ,/(χ)) в обозначениях Дирака выглядит так: <ЗС|ЛФ>- Часть этого символа f\$> есть результат действия оператора / на кет-вектор |ф>, a <x|f — резу^тат действия сопряженного оператора на бра-вектор <χ|. Вернемся к средним значениям. Если операторы /, g самосопряжены, то оператор fg, вообще говоря, не является самосопряженным: если /, g не коммутируют. Однако f2, f — λ ^gR) и коммутатор — [f, g]=-r(fg — gf) по-прежнему самосопряжены. Среднее значение [(/— /ψ)2] ί наблюдаемой (f—f*)2 в состоянии φ есть среднеквадратичное отклонение значений f от их среднего значения, или дисперсия (разброс) значений /. Положим &>=V[(/-^)2]; 3. Предложение (принцип неопределенности Гейзенберга). Для любых самосопряженных операторов f> g в унитарном пространстве Дг^>||М£И> +)ΐ· Доказательство. Пользуясь очевидной формулой [/ —?*> 8 ~" £*] = [f. gl самосопряженностью операторов f, g и неравенством Коши — Бу- няковского — Шварца, находим (fx = f — J^, g\ = g — g^,) I ([/, g] Φ, Φ) I = I {(fxgx - ffi/i) Ψ> Φ) I = Ι (£ιΨ. fιΦ) - (f ιΦ, £ιΨ) I = = |21т(^ф, /,ф) |< 21(^,11), Αφ) |< <2 V(/i*. fi*) V(ffi*. ^ιΦ) = 2Δ^Δ^. Это показывает, что средний разброс значений некоммутирую- щих наблюдаемых /, g, вообще говоря, не может быть одновременно сделан как угодно малым. Говорят еще, что некоммути- рующие наблюдаемые не измеримы одновременно] к этой формулировке следует относиться с теми же предосторожностями, что и к термину «измерение». Особую роль играет применение неравенства Гейзенберга к случаю* канонически сопряженных пар наблюдаемых, которые по 149
определению удовлетворяют соотношению — [f, #1 = id. Для них каково бы ни было состояние ψ. Заметим, что в конечномерных пространствах таких пар нет, ибо Тг [/, g] = 0, Тмс1 = сПтЖ Однако в бесконечномерных пространствах они существуют. Классический пример: 1 г 1 d Ί ., т\х, -г -т- =id. ί [ / dx ] Эти операторы появляются в квантовых моделях физических систем, которые на классическом языке называются «частица, движущаяся в одномерном потенциальном поле». Опишем эти и некоторые другие наблюдаемые подробнее. 4. а) Наблюдаемая координаты. Это оператор умножения на χ в пространстве комплексных функций на R (или некоторых подмножествах R) со скалярным произведением \f(x)g{x)dx. Подразумевается квантовая система: «частица, движущаяся по прямой, во внешнем поле». б) Наблюдаемая импульса. Это оператор -^"Т"~ в аналогичных пространствах функций. (При нем обычно пишут множителем постоянную Планка ft; это относится к выбору системы единиц, на котором мы не останавливаемся.) в) Наблюдаемая энергии квантового осциллятора. Это — оператор у | — -J-7 + я2!» снова в подходящих единицах. г) Наблюдаемая проекции спина для системы «частица со спином 1/2». Это любой самосопряженный оператор с собственными значениями ±1/2 на двумерном унитарном пространстве. Дальнейшие подробности о нем будут даны позже. В примерах а) — в) мы намеренно не уточняли, в каких унитарных пространствах действуют наши операторы. Они существенно бесконечномерны и строятся и изучаются средствами функционального анализа. О примере г) мы скажем кое-что еще ниже. 5. Наблюдаемая энергии и эволюция системы во времени. В описание любой квантовой системы вместе с ее пространством состояний Ж входит, задание фундаментальной наблюдаемой Н: Зв-+3в, которая называется наблюдаемой энергии, или оператором Гамильтона, или гамильтонианом. В ее терминах формулируется последний из основных постулатов квантовой механики. Если в момент времени О система находилась в состоянии ψ и за промежуток времени t развивалась как изолированная си- стема, в частности, над ней не производились измерения, то в мо- 150
мент времени 1 она будет находиться в состоянии ехр(~-iHt) (ψ), где ос ехр ( - LHt) = £ ( ~ 1%>П*П : Ж -> Ж (см. § 11 ч. 1). Оператор exp(—iHt)=U(t). унитарен. Однопараметрическая группа унитарных операторов {U(t)\t €ξΚ} целиком определяет эволюцию изолированной системы. Физическая размерность (энергия)X (время) называется «действием». Многие эксперименты позволяют определить универсальную единицу действия — знаменитую постоянную Планка h = = 1,055· 10"84 Дж-с. В нашей формуле подразумевается, что Я/ измеряется в единицах β, и чаще ее пишут в виде βχρΙ.-ψΙψ. Мы будем опускать h для сокращения записи. Заметим еше, что, поскольку оператор e~iHt линеен, он переводит лучи в 1в лучи и в самом деле действует на состояния системы, а не просто на векторы ψ. Закон эволюции можно записать в дифференциальной форме: ± (е - wtty = _ ш (e-ui4f), или, полагая ψ(ί) = £~ί/"ψ> -^ = — /Я ψ i-jjj- Яг|э, если помнить о единицах J . Последнее уравнение называется уравнением Шрёдингера. Впервые оно было написано для случая, когда ψ реализованы как функции в физическом пространстве и Я представлен дифференциальным оператором относительно координат. В следующих комментариях мы, как обычно, ограничимся в основном конечномерными пространствами состояний Ж. 6. Энергетический спектр и стационарные состояния системы. Энергетический спектр системы — это спектр ее гамильтониана Я. Стационарные состояния — это состояния, которые не меняются со временем. Отвечающие им лучи должны быть инвариантны относительно оператора eitH, т. е. быть одномерными собственными подпространствами этого оператора. Но эти подпространства те же, что и для оператора Я. Собственному значению Е\ гамильтониана, или энергетическому уровню системы, отвечает собственное значение eitEi = cos /£/ + / sin lEj оператора эволюции, меняющееся со временем. Если Я имеет простой спектр, то пространство Ж снабжено каноническим ортонормированным базисом, состоящим из векторов стационарных состояний (они определены с точностью до фазовых множителей е^). Если кратность энергетического уровня Ε больше единицы, этот уровень и соответствующие состояния называются вырожденными, а кратность Ε — степенью вырождения. 151
Все состояния, отвечающие нижнему уровню, т. е. наименьшему собственному значению //, называются основными состояниями системы; основное состояние единственно, если нижний уровень невырожден. Этот термин связан с представлением о том, что квантовая система никогда не может рассматриваться как полностью изолированная от внешнего мира: с некоторой вероятностью она может излучить или получить порцию энергии. В некоторых условиях гораздо вероятнее, что энергия будет потеряна, чем приобретена, и система будет иметь тенденцию «свалиться» в свое нижнее состояние и в дальнейшем в нем оставаться. Поэтому неосновные состояния называются иногда возбужденными. В примере г) п. 4 был написан гамильтониан квантового осциллятора: — —-г-у +χ2 · В разделе в) п. 10 § 8 было показано, что функции β-χ2/2Ηη(χ) образуют еистему стационарных состояний гармонического осциллятора с уровнями энергии Еп = п + -^, η=\, 2, 3, ... (Более подробный анализ показывает, что энергия измеряется здесь в единицах /ΐω, где константа ω отвечает частоте колебаний соответствующего классического осциллятора.) Разумным образом определив унитарное пространство, в котором следует работать, можно показать, что это полная система стационарных состояний. При η > 0 осциллятор может излучить порцию энергии Еп— Ет = (п— πι)Ηω и перейти из состояния ψ„ в состояние г|эт. В применении к квантовой теории электромагнитного поля об этом говорят как об «излучении η — т фотонов частоты ω». Обратный процесс будет поглощением η — пг фотонов; при этом осциллятор перейдет в более высокое (возбужденное) состояние. Важно, что энергия может быть получена или передана лишь целыми кратными /ш. В основном состоянии осциллятор имеет ненулевую энергию — βω, которая, однако, никак не может быть передана — более низких энергетических состояний осциллятор не имеет. Электромагнитное поле в квантовых моделях рассматривается как суперпозиция бесконечно многих осцилляторов (отвечающих, в частности, разным частотам ω). В основном состоянии — вакууме — оказывается поэтому, что поле имеет бесконечную энергию, хотя с классической точки зрения оно является нулевым — раз от него нельзя отнять энергию, оно не может ни на что воздействовать! Эго простейшая модель глубоких трудностей современной квантовой теории поля. Ни математический аппарат, ни физическая интерпретация квантовой теории поля не лостигли какой-либо степени законченности. Это открытая и увлекательная наука. 7. Формулы теории возмущений. В аппарате квантовой механики важную роль играют ситуации, когда гамильтониан Η системы может рассматриваться как сумма Н0-\-еН\, где Н0 — «невозмущенный» гамильтониан, а ε#ι — малая добавка, «возмущение». С физической точки зрения возмущение часто обусловливает 152
взаимодействие системы с «внешним миром» (например, внешним магнитным полем) или компонент системы между собой (тогда Н0 отвечает идеализированному случаю системы, состоящей из свободных, невзаимодействующих компонент). С математической точки зрения такое представление оправдано, когда спектральный анализ невозмущенного гамильтониана Н0 проще, чем //, и спектральные характеристики Я удобно представлять рядами по степеням ε, первые члены которых определяются через Н0. Мы ограничимся следующими наиболее употребительными формулами и качественными замечаниями к ним. а) Поправки первого порядка. Пусть Н0е0= λ0βο, |е0|=1. По пытаемся найти собственный вектор и собственное значение Но + ε#ι, близкие к во и λ0 соответственно, с точностью до членов второго порядка малости по ε, τ. е. решить уравнение (Н0 + ε//,) (е0 + ге{) = (λ0 + ελ,) (е0 + ге{) + о (ε2). Приравнивая коэффициенты при ε, получаем (Я0-Яо)е1 = (Л1-Я1)в0. Неизвестные здесь — это число λι и вектор е\. Их можно найти по очереди с помощью следующего приема. Рассмотрим скалярное произведение обеих частей последнего равенства на ед. Слева будет нуль в силу самосопряженности Η — λ0: ({Н0 - λ0) еи во) = (еь (Н0 - λ0) eQ) = 0. Поэтому ((λι — Н\)ео,ео) = 0 и в силу нормированности ес λι = (#,6ο, е0). Это поправка первого порядка к собственному значению λο: «сдвиг энергетического уровня» ελι равен (еН\е0,во), т. е. по результатам п. 12 совпадает со средним значением «энергии возмущения» гН\ на состоянии е0. Для определения е\ теперь нам нужно обратить оператор Но — λ0. Разумеется, он необратим, ибо λ0 — собственное значение Но\ но правая часть уравнения, (λι — Н\)е0, ортогональна к е0. Поэтому достаточно, чтобы Н0 — λ0 был обратим на ортогональном дополнении к е0, которое мы обозначим е£. Это условие (в конечномерном случае), очевидно, равносильно тому, чтобы кратность собственного значения λ0 у Н0 была равна единице т. е. невырожденности энергетического уровня λ0. Если это так, то ^((^ο-λο^χΓ'ίλ,-Ή,)^, что дает поправку первого порядка к собственному вектору. Выберем ортонормированный базис {е0 = е(0), е(1), ..., е(л>}, в котором Н0 диагоналей с собственными значениями λ0 = λ(0\ 153
λ<!\ ..., λ(η\ В базисе {е(1), ..., е(п)} пространства е£ имеем (λ! - Н{)е0 = Σ αλί - #ι)*ο, *")*" - - Σ кНхе0, *'>)*'>, откуда Интуитивно ясно, что эта поправка первого порядка может быть хорошим приближением, если энергия возмущения мала по сравнению с расстоянием от уровня λ0 до соседнего: ε должно компенсировать знаменатели λο — λ(ίλ Физики так обычно и считают. б) Поправки высших порядков. По аналогии с разобранным случаем покажем, что когда собственное значение λο невырождено, можно индуктивно найти поправку (/+1)-го порядка к (λ0, е0), считая, что поправки порядков ^f уже найдены. Пусть /^ 1. Мы решаем уравнение (Я() + гНг) ( Σ, в***) = ( Σ *%) ( Σ ε'*,) + о (ε<+2) относительно β,·+ι, λ,>ι Приравнивая коэффициенты при ε'+1, получаем (Ηq — λ0) еш = (λ, — Η{) et + Σ λ/βί+1_/ + λί+1β0. Как выше, левая часть ортогональна е0, откуда λί+ι = {(Hi — λΟ eif e0) — Σ ^ fa+i_/, β0)» /-2 еш = ((Н0 - λ0) Ι.1)-1 [(λι - Нх)ег + £λι*ι + ι-/] . Таким образом, все поправки существуют и единственны. в) Ряды теории возмущений. Формальные ряды по степеням ε /-0 ί-0 где λ/ и е/ находятся по выписанным рекуррентным формулам, называются рядами теории возмущений. Можно доказать, что в конечномерном случае они сходятся при достаточно малых ε. В бесконечномерном случае они могут расходиться; тем не менее несколько первых членов часто приводят к предсказаниям, хорошо согласующимся с экспериментом. Физическая роль рядов теории возмущений в квантовой теории- поля очень велика. Их математическое исследование приводит к- многим интересным и важным задачам. 154
г) Кратные собственные значения и геометрия. В наших предыдущих вычислениях запрет на кратное собственное значение λ0 проистекал из желания обратить Я, — λό^Η& е£ и формально выражался в появлении разностей λ0 —λ(ί) в знаменателях. Можно получить формулы и в общем случае, надлежащим образом изменив рассуждения, но мы ограничимся разбором геометрических эффектов кратности. Они видны на типичном случае //0 = id: все собственные значения равны единице. Малое изменение Н0 приводит к следующим эффектам. Собственные значения становятся разными, если это изменение достаточно общее: этот эффект в физике называется «расщеплением уровней», или «снятием вырождения». Например, одна спектральная линия может расщепиться на две или больше либо при увеличении разрешения прибора, либо при помещении системы во внешнее поле. Математическая модель в обоих случаях будет состоять в учете малой поправки к Я0, ранее неучтенной (впрочем, иногда и в изменении исходного пространства состояний). Теперь обдумаем, что может происходить с собственными век* торами. В полностью вырожденном случае Н0 диагонализируется в любом ортобазисе. Малое изменение Я0, снимающее вырождение, означает выбор ортобазиса, вдоль осей которого происходят растяжения, и коэффициентов этих растяжений. Коэффициенты должны мало отличаться от исходного λο, но сами оси могут идти в любых направлениях. Таким образом, вблизи вырожденного собственного значения его собственные направления начинают зависеть от возмущения очень сильно. Два сколь угодно малых возмущения единичного оператора с простым спектром могут диа- гонализироваться в двух фиксированных и жестко повернутых друг от друга орхобазисах. Это показывает внутреннюю причину появления разностей λο — λ(/> в знаменателях. § 10. Геометрия квадратичных форм и собственные значения самосопряженных операторов 1. Этот параграф посвящен изучению геометрии графиков квадратичных форм q на вещественном линейном пространстве, т. е. множеств вида xn+i =q{xu . ·., *п) в Rn+1, и описанию некоторых приложений. Одна из важнейших причин, по которой эти классические результаты вызывают живой интерес и в наши дни, состоит в том, что квадратичные формы дают следующее (после линейного) приближение к любой дважды дифференцируемой функции и потому являются ключом к пониманию геометрии «искривления» любой гладкой многомерной поверхности. В § 3 и 8 мы уже доказали общие теоремы о классификации квадратичных форм с помощью любых линейных или только ортогональных преобразований, поэтому здесь мы начнем с прояснения их геометрических следствий. Будем считать, что мы работаем η в евклидовом пространстве со стандартной метрикой Σ χ\· Забве- »" =t I 155
ние евклидовой структуры означает лишь введение более грубого отношения эквивалентности между графиками. План геометрического исследования состоит в том, чтобы разобраться с малыми размерностями, где форму графика можно представить себе наглядно, и затем посмотреть на маломерные сечения многомерных графиков в разных направлениях. Читателю рекомендуется рисовать картинки, иллюстрирующие наш текст. Мы считаем ось хп+\ направленной вверх, а пространство Rn расположенным горизонтально. 2. Одномерный случай. График кривой χλ = λχ\ в R имеет три основных формы: «чаша» (выпуклость вниз) при λ > О, «купол» (выпуклость вверх) при λ < 0 и горизонтальная прямая при λ = 0. Относительно линейной классификации, допускающей произвольное изменение масштаба вдоль оси к\у эти три случая исчерпывают все возможности: можно считать, что λ = ±1 или 0. При ортогональной классификации λ является инвариантом: |λ| определяет крутизну стенок чаши или купола, она тем больше, чем больше |λ|. Другая характеризация |λ| состоит в том, что γτττ есть радиус кривизны графика на дне или в вершине (0,0). Действительно, уравнение окружности радиуса /?, касающейся оси х\ в начале, имеет вид х\ + [х2 — R)2 = /?'2, и вблизи нуля имеем 3. Двумерный случай. Чтобы разобраться в нем, перейдем к ортонормированному базису в R2, в котором q приводится к сумме квадратов с некоторыми коэффициентами: q{y[y #2)=^*/? + Х?у*. Прямые, натянутые на элементы этого базиса, называются главными осями формы q\ они, вообще говоря, повернуты относительно исходных осей. Числа λι и λ2 определены однозначно, будучи собственными значениями самосопряженного оператора Л, для кото- рого q(x) = xAx {в старых координатах). При λ\φλ2 сами оси также определены однозначно, но при λι = λ2 их можно выбирать произвольно (лишь бы они были ортогональны). Для каждого из коэффициентов λι, λ2 есть три основные возможности (λ* > 0, λι < 0, λ, =0), но соображения симметрии позволяют ограничиться четырьмя основными случаями (из которых только первые два невырождены). а) Хх===%ху\-\-Х2у\, λρ λ2>0. График является эллиптическим параболоидом, имеющим форму чаши. Прилагательное «эллиптический» объясняется тем, что проекции горизонтальных сечений Хху\ + -\~Х2у22 = с при с>0 суть эллипсы с полуосями AjcXf1, направленными вдоль главных осей формы q (при λι = λ2 — окружности). /Эти проекции являются линиями уровня функции q.) Существительное «параболоид» объясняется тем, что сечения графика вертикальными плоскостями аух + Ьу2 = 0 суть параболы (при χ{ = λ2 график является параболоидом вращения). 15G
Случай λι, λ2<0 — это та же чаша, но опрокинутая. б) лг3 = ^ιί/? — ^2£/|, λ,, λ2>0. График является гиперболическим параболоидом. Линии уровня q суть гиперболы, непустые для всех значений хъ, так что график уходит и выше, и ниже плоскости хъ = 0; сечения вертикальными плоскостями— по-прежнему параболы. Линия уровня хъ = 0— это «вырожденная гипербола», сводящаяся к своим асимптотам, двум прямым V^ii/i zh V^2#2 =υ· Эти прямые в R2 называются «асимптотическими направлениями^ формы q. Если рассматривать q как (неопределенную) метрику в R2, то асимптотические прямые состоят из всех векторов длины нуль. Асимптотические прямые делят R2 на четыре сектора. Линии уровня q=x$ при хъ > 0 лежат в паре противоположных секторов; когда л:3->+0 сверху, они «прижимаются» к асимптотам, превращаются в них при х% = 0 и при хъ < 0, «пройдя насквозь», оказываются в другой паре противоположных секторов. Вертикальные сечения графика плоскостями, проходящими через асимптотические прямые, суть сами эти прямые, «распрямившиеся параболы». Случай — Х{у\Л- λ2#2, λ,, λ2 > 0, получается из разобранного заменой знака хъ. в) ν3=λ#2, λ > 0. Поскольку от у2 функция не зависит, сечения графика вертикальными плоскостями у2 = const имеют один и тот же вид: весь график заметается параболой хъ = %у\ в плоскости (y\yXs) при ее движении вдоль оси ί/2 и называется параболическим цилиндром. Линии уровня суть пары прямых Ух = -L· ^/*3λ~ι; при дсз = 0 они склеиваются в одну прямую; весь график лежит над плоскостью хъ = 0. Случай xi=Xy2{9 λ<0 получается «опрокидыванием». г) хг = 0. Это — плоскость. 4. Общий случай. Теперь мы в состоянии понять геометрию графика xn+i = q(xu ···> χη) при произвольных значениях п. Перейдем к главным осям в Rn, т. е. к ортонормированному тп базису, в котором q(yv .. ·, уп) = Σ ^(УЬ λι ... ληφ 0. Как выше, они определяются однозначно, если m = η и λ, φ λ/ при i φ j или если m = n— 1 и λΐφλ, при i Φ /. От координат ym+\, ..., yn форма q не зависит, поэтому весь график получается из графика m У! A^J в Rm+l переносом вдоль подпространства, натянутого на ы\ {em+u ···, £л}· Иными словами, вдоль этого подпространства график «цилиндричен». Нетрудно убедиться, что оно является как раз ядром билинейной формы, полярной к qy и тривиально тогда и только тогда, когда q невырождена. Пусть q невырождена, т. е. m = п. Можно считать, что λι, ... ..., λ, > 0, λΓ+ι, ..., λΓ+<? < 0, т. е. (г, s) —сигнатура формы q. Если форма q положительно определена, т. е. г = /г, s = 0, то 157
график имеет вид n-мерной чаши: все его сечения вертикальными плоскостями суть параболы, а все линии уровня q = с > 0 суть эллипсоиды с полуосями л^сХ~\ направленными вдоль главных осей. Уравнение такого эллипсоида имеет вид т. е. он получается из единичного шара растяжениями вдоль ортогональных направлений. В частности, он ограничен: целиком лежит в прямоугольном параллелепипеде | xi | ^ <\JcXjly i = = 1, ..., п. Ниже мы убедимся, что изучение вариации длин полуосей разных сечений эллипсоида (тоже эллипсоидов) дает полезную информацию о собственных значениях самосопряженных операторов. При г = О, s = n получается купол. В обоих случаях график называется (/г-мерным) эллиптическим параболоидом. Промежуточные случаи rs=£0 приводят к многомерным гиперболическим параболоидам разных сигнатур. Ключом к их геометрии является снова структура конуса асимптотических направлений С в R", т. е. нулевого уровня формы q(yu ..., уп) = 0. Конусом он называется потому, что заметается своими образующими: прямая, содержащая один вектор из С, целиком лежит в нем. Чтобы составить себе представление о базе этого конуса, рассмотрим его пересечение, скажем, с линейным многообразием Уп= 1: Видно, что база является множеством уровня квадратичной формы от η—1 переменной. Простейший случай получается, когда она положительно определена: тогда это множество уровня есть эллипсоид, в частности, оно ограничено, и наш конус похож на «школьные» трехмерные конусы. Этот случай отвечает сигнатуре (п— 1, 1) или (1,л— 1); при /г = 4 пространство (R4, q) есть знаменитое пространство Минковского, которое будет подробно изучено ниже. Для других сигнатур С устроен заметно сложнее, ибо его база «уходит на бесконечность». Сечения графика q вертикальными плоскостями, проходящими через образующие С, совпадают с этими образующими. Для любых других плоскостей получаются либо «чащи», либо «купола» — асимптотические направления разделяют эти два случая. Поэтому конус С делит пространство Rrt\C на две части, сплошь заметаемые прямыми, вдоль которых q соответственно положительна или отрицательна. Одна из этих областей называется совокупностью внутренних пол конуса С, другая — его внешностью. Геометрический смысл сигнатуры (г, 5) грубо, но наглядно можно описать следующей фразой% график формы q по г направлениям уходит вверх, а по $ — вни& 158
Хотя мы работали все время с вещественными квадратичными формами, те же результаты применимы к комплексным эрмитовым формам. Действительно, овеществление Сп есть R2", и ове- п ществление эрмитовой формы Σ ацх{хг αη = άμ, есть вещественная квадратичная форма. При овеществлении все размерности удваиваются: в частности, комплексная сигнатура (г, 5) превращается в вещественную сигнатуру (2r, 2s). Опишем теперь вкратце и без доказательств два приложения этой теории в механике и топологии. 5. Колебания. Представим себе сначала шарик, который может кататься в плоскости R2 под действием силы тяжести по желобу формы Ху—кх]. Точка (0,0) во всех случаях является одним из возможных движений шарика — положением равновесия. При λ > 0 это положение устойчиво: небольшое начальное отклонение шарика по положению или скорости приведет к его колебаниям около дна чаши. При λ < 0 оно неустойчиво: шарик свалится вдоль одной из двух ветвей параболы. При λ = 0 оно безразлично относительно отклонений но положению, но не по скорости: шарик может оставаться в любой точке прямой х2 = 0 либо равномерно двигаться в любую сторону с начальным импульсом. Оказывается, что математическое описание большого класса механических систем вблизи их положений равновесия хорошо моделируется качественно многомерным обобщением этой картинки: движением шарика вблизи начала координат по многомерной поверхности хп+\ = q(x\, ..., хп) под действием силы тяжести. Если q положительно определена, любое «малое» движение будет близкое суперпозиции малых колебаний вдоль главных осей формы q. Вдоль нулевого пространства формы возможен уход на бесконечность с постоянной скоростью. Вдоль направлений, где q отрицательна, возможно сваливание вниз. Наличие как нулевого пространства, так и отрицательной компоненты сигнатуры свидетельствует о неустойчивости положения равновесия и сомнительности приближения «малых колебаний». Важно, однако, что когда это равновесие устойчиво, малые изменения формы чаши, по которой катается шарик (или, более технически, потенциала нашеп системы), не нарушают этой устойчивости. Чтобы понять это, вернемся к сделанному в начале параграфа замечанию о приближенном представлении любой (скажем, трижды дифференцируемой) вещественной функции f(x\t ..., хп). Вблизи нуля она имеет вид η η / η \ /(χι,..., *») = /(<>,..., ο>+Σ «<*,· + Σ bi}xlXi + o[Z\Xi\2) где
Вычтя из / ее значение в нуле и линейную часть, получаем, что остаток квадратичен с точностью до членов более высокого порядка малости. Это вычитание означает, что мы рассматриваем отклонение графика / от касательной гиперплоскости к этому графику в нуле. Обозначив эту касательную плоскость через R", обнаруживаем, что поведение f вблизи нуля определяется квадратичной формой с матрицей (-g-4— (0, ..., 0)). по крайней мере, когда эта форма невырождена, — иначе нужно учитывать члены более высокого порядка малости. (Например, график л:2= х\ слева уходит вниз, а справа — вверх; графики квадратичных функций так себя не ведут Двумерный график хъ = х\ + х\ ~~ это «обезьянье седло», в одном криволинейном секторе х] + х\<§ уходящее вниз — «для хвоста».) η Точка, в которой дифференциал df = /]-^> dxt обращается в нуль (т. е. —γ-— = 0 для всех /=1, ..., п\ называется критической точкой функции / (в наших примерах это было начало координат). Она называется невырожденной, если в ней η квадратичная форма V -г—-^—Δχ/Δλ;, невырождена. Пред- /. /-ι ' f шествующее обсуждение можно резюмировать в одной фразе: вблизи невырожденной критической точки график функции расположен относительно касательной гиперплоскости, как график ее квадратичной части. После этого можно доказать, что малое изменение функции (вместе с ее первыми и вторыми производными) может лишь слегка сдвинуть положение невырожденной критической точки, но не меняет сигнатуры соответствующей квадратичной формы и потому общего поведения графика (в малом). Можно также доказать, что вблизи невырожденной критической точки можно сделать такую гладкую и гладко обратимую (хотя, вообще говоря, нелинейную) замену координат yi = = yi(xu ..., jc/i), /=1, ..., η, что в новых координатах f будет задаваться в точности квадратичной функцией: f(y» ...,i/J = /(o, . ., о)+.^М^/· Строгое изложение теории малых колебаний читатель сможет найти в книге В. И. Арнольда «Математические методы классической механики» (М.: Наука, 1974, гл. δ). 6. Теория Морса. Представим себе в (п + 1)-мерном евклидовом пространстве Rn+1 n-мерную гладкую ограниченную гиперповерхность V, вроде яйца или баранки (тора) в R3. Рассмотрим сечения V гиперплоскостями xn+i = const. Предположим, что имеется только конечное число значений с\9 ..., ст таких, что 160
гиперплоскости хп+\ = Cf касаются V и притом в единственной точке Vi e V. Вблизи этих точек касания V можно приблизить графиком квадратичной формы хп+\ = Ci + qi \х\ — Х\ (vi), ... ..., хп — Xn(Vi))> если только V находится в достаточно общем положении (например, бублик не должен лежать горизонтально). Оказывается, что важнейшие топологические свойства V, — в частности, так называемый гомотопический тип V — вполне определяются набором сигнатур форм qu т. е. указанием того, по скольким направлениям V вблизи νι уходит вниз и по скольким — вверх. Самое замечательное то, что, хотя информация о сигнатурах qt чисто локальна, восстанавливаемый по ней гомотопический тип V есть глобальная характеристика формы V. Например, если имеются только две критические точки с\ и сч с сигнатурами (/г, 0) и (0, и), то V топологически устроена как и-мерная сфера. Подробности читатель сможет найти в кйиге Дж. Милнора «Теория Морса» (М.: Мир, 1965). 7. Самосопряженные операторы и многомерные квадрики. Пусть теперь L — конечномерное евклидово или унитарное пространство, f: L-+L — самосопряженный оператор. Нас интересуют свойства его спектра. Расположим собственные значения f в порядке убывания с учетом кратностей: λι^λ2^ ... ^ λη и выберем соответствующий ортонормированный базис {е\,е2, ..., вывернемся к точке зрения п. 4 § 8, согласно которой задание / равносильно заданию новой симметричной или эрмитовой формы (/(/ι),/г) или же квадратичной формы qf(l) = (f(l)J) (в унитарном случае она квадратична на овеществленном пространстве). В базисе {е\, ..., еп} она приобретает вид η η 4f(*\> ···> χη) = £Κχΐили Σ^Iя,-12 и, таким образом, направления Re, (или Cei) суть главные оси qf. Простейшее экстремальное свойство собственных значений %ι выражается следующим фактом. 8. Предложение. Пусть S ={/ е L\ |/| = 1}—единичная сфера пространства L. Тогда λ\ = max qf (/), λη = min qf (I)- Доказательство. Поскольку |xx\2 ^ 0 и λι ^ ... ^ λΛ, очевидно к ( Σ ι χι ι2) < Σ h ι * Ρ < λ, ( g ι Χι ι2)· На единичной сфере левая часть есть λη, а правая λι. Эти значения достигаются на векторах (0, ..., 0, 1) и (1, 0, ..., 0) соответственно (координаты берутся в базисе {еи ..., еп}, диагонализи- рующеад /). Щ
9. Следствие. Пусть 1~ — линейная оболочка семейства {е\, ..., ek}> L+— линейная оболочка семейства {е*, ..., еп}. Тогда λ/k = max{ί7f(^)|/eSntί} = min{^(/)|^eSnLί}. Доказательство. Действительно, в очевидных координа- п тахограничение qf на 1+ имеет вид Σ*ί|**|2» а ограничение на k ^ϊ — вид g λ, I xf |2. Следующее важное усиление этого результата, в котором вместо L\ рассматриваются любые линейные подпространства в I коразмерности k— 1, называется теоремой Фишера — Куранта. Она дает «минимаксную» характеристику собственных значений дифференциальных операторов. 10. Теорема. Для любого подпространства V cz I коразмерности k— 1 справедливы неравенства: λ* < max {qf (1) \ I e= 5 П Ι'}, λ„__*+1 > min {qf (I) I / e= 5 П L'}. Эти оценки точны для некоторых I' {например, L\ и L~_k+l со- ответственно), так что Xk = min max {qf (/) | / e= 5 f| I'}, Xn-k+] = max min {qf (/) | / e= S П I'}. Доказательство. Поскольку dim Ι'+ dim Ι" = (м- k+ l) + k = n+ 1, a dim(L'-{-Li}^din\L = n, из теоремы п. 3 § 5 ч. 1 следует, что dim (Ι' Π Ι* ) ^ 1. Возьмем вектор /0 e I' f| 1^ (] S. Согласно следствию 9 Xk = min {qf(l)\l ^ S (\ L^}, так что λΛ^^(/0) и тем более λ* <i max{<7f (/) |/ е Sfl^'}· Второе неравенство теоремы проще всего получить, применив первое неравенство к оператору— f и заметив, что знаки и порядок собственных значений при этом обращаются. 11. Следствие. Пусть dim I/I0 = 1 и ρ — оператор ортогонального проектирования I -> Ιο. Обозначим через λ\ ^ λ'2 ^ ... ^ λ'η_, собственные значения самосопряженного оператора pf: I0 -> I0. Тогда λ,>λ;>λ2>λ;> ... >λ;.!>λ„, г. β. собственные значения операторов f u pf перемежаются. Доказательство. Ограничение формы qf на L0 совпадает с qPf- if(l)J)= (pf(0»0. если /g I0. Поэтому λ; = max{(7pf(^)|^eSnI,} = max{9f(^)|^s^ΠI,} 162
для подходящего подпространства V cz L0, имеющего коразмерность k—1 в Lq. Значит, в L оно имеет коразмерность k, откуда λΛ+j <λ^. Записав это неравенство для —f вместо f, получим — λ^^-— λ^, т. е. λ^^λΛ. Это завершает доказательство. Мы предоставляем читателю возможность убедиться в том, что следствие п. 11 имеет Следующий простой геометрический смысл. Будем считать, что λι ^ λ2 ^ ... ^ λη > 0 и вместо функции qi(l) на S рассмотрим эллипсоид ε: qf(l)= 1. Тогда его сечение εο подпространством Lo также представляет собой эллипсоид, длины полуосей которого перемежаются с длинами полуосей эллипсоида ε. Вообразите себе, например, эллипсоид ε в R3 и его сечение плоскостью εο. Большая полуось ε0 не превосходит большой полуоси β («очевидно»), но не меньше, чем средняя полуось ε. Малая полуось εο не меньше малой полуоси ε («очевидно»), но не больше средней полуоси ε. Контрольный вопрос: как получить в сечении окружность? § 11. Трехмерное евклидово пространство 1. Трехмерное евклидово пространство & являете^ основной моделью физического пространства Ньютона и Галилея. Четырехмерное пространство Минковского Ж, снабженное симметричной метрикой сигнатуры (г+, г_) = (1, 3), является моделью пространства-времени релятивистской физики. Уже поэтому они заслуживают более пристального изучения. С математической точки зрения они также имеют особые свойства, существенные для понимания устройства мира, в котором мы живем: связь вращений в ^ с кватернионами и существование векторного произведения; геометрия векторов нулевой длины в Л. Эти специальные свойства весьма удобно излагать на языке связи геометрии 8 и Μ с геометрией вспомогательного двумерного унитарного пространства 36, называемого пространством спиноров. Эта связь имеет также глубокий физический смысл, ставший ясным лишь после появления квантовой механики. Мы избрали именно такре изложение. 2. Итак, фиксируем двумерное унитарное пространство Ж. Обозначим через 8 вещественное линейное пространство самосопряженных операторов в 36 с нулевым следом. Каждый оператор / е & имеет два вещественных собственных значения; они отличаются только знаком, ибо след, равный их сумме, обращается в нуль. Положим | / | = д/| det f I — положительное собственное значение f. 3. Предложение. & с нормой \ \ является трехмерным евклидовым пространством. Доказательство. В ортонормированном базисе Ж операторы / представлены эрмитовыми матрицами вида .168
т. е. линейными комбинациями Re Ь · σ! + Im b · σ2 + я^з» где σι, σ2, σ3 — матрицы Паули (см. упражнение 5 к § 4 ч. 1): σ'-(?ί)· σ*=(?"ί)· σ3=(ί-?)· Так как аь аг, аз линейно независимы над R, dimR<§P = 3. Положим теперь ·(/, £) = iTr(fe). Это билинейное симметричное скалярное произведение, и если собственные значения / равны ±λ, то \f\2=±Tr(f2) = ±.(X2 + X2) = \detf\. Очевидно, λ2 = 0 тогда и только тогда, когда / = 0. Это завершает доказательство. Назовем направлением в & множество векторов вида R+/=={af|a>0}, где / — ненулевой вектор из &. Иными словами, направление — это полупрямая в &'. Направление, противоположное к R+/, — это R+(-f). 4. Предложение. Имеется взаимно однозначное соответствие между направлениями в & и разложениями Ж в прямую сумму двух ортогональных одномерных подпространств Ж+ Θ Ж-. Именно, направлению R+/ отвечают Ж+ — собственное под про- странство Ж для положительного собственного значения f, Ж- то же для отрицательного собственного значения. Доказательство. Ж+ и Ж- ортогональны по теореме п. 4 § 7. Замена f на afy а > 0, не меняет Ж+ и Ж— Наоборот, если ортогональное разложение Ж = Ж+ Θ Ж-. задано, то множество операторов / ε S, растягивающих Ж в λ > 0 раз вдоль Ж+ и в —λ < 0 раз вдоль Ж-, образует направление в &. 5. Физическая интерпретация. Отождествим S с физическим пространством, например, посредством выбора ортогональных координат в <$ и в пространстве. Отождествим Ж с пространством внутренних состояний квантовой системы «частица со спином 1/2у локализованная вблизи начала координат» (например, электрон). Выбрав направление R+fczdf, включим магнитное поле в физическом пространстве вдоль этого направления. В этом поле система будет иметь два стационарных состояния, которые как раз и суть Ж+ и Ж~. Если направление R+/ отвечает, скажем, верхней вертикальной полуоси избранной координатной системы в физическом пространстве («ось ζ»), то состояние Ж+ называется состоянием «с проекцией спина + у2 на ось ζ» (или «спин вверх»), а Ж- — соответственно состоянием «с проекцией спина —*/2» (или «спин вниз»). 164
Такая традиционная терминология является реликтом докванто- вых представлений о том, что наблюдаемая спина отвечает классической наблюдаемой «момент количества движения» — характеристике внутреннего вращения системы и потому может быть сама представлена вектором в &\ который поэтому имеет проекции на оси координат в &. Это совершенно неверно: состояния системы суть лучи в <3#, а не векторы в <$. Расхождение с классикой становится еще более очевидным при рассмотрении систем со спином 5/2, 5 > 1, для которых а\тЖ = s + 1. Точное утверждение дается именно предложением п. 4. Мы дали идеализированное описание классического эксперимента Штерна — Герлаха (1922). Вместо электронов в нем использовались ионы серебра, проходившие между полюсами электромагнита. Из-за неоднородности магнитного поля ионы, вышедшие в состояниях, близких к Жь и Ж- соответственно, пространственно разделялись на два пучка, что и позволило макроскопически отождествить эти состояния. Серебро испарялось в электрической печке, а магнитное поле между полюсами играло роль объединения двух фильтров, пропускающих раздельно состояния 2/β+ и 36-.. Продолжим теперь изучение евклидова пространства 8\ 5. Предложение. (/, g) = 0 тогда и только тогда, когда fg -f- + £/ = 0. Доказательство. Имеем (/. g) = ^r(fg) = ^Tr(fg + gf) = ^Tr[(f + gf^f^g% Но f2 имеет единственное собственное значение |/|2, поэтому все квадраты операторов из <$ являются скалярными, значит и fg + gf — скалярный оператор, и он равен нулю тогда и только тогда, когда его след равен нулю. 6. Ортонормированные базисы в <£. Из. доказательства предложения п. 5 ясно, что операторы {£ι,£2, еъ) образуют ортонормиро- ванный базис тогда и только тогда, когда е\ = е\ = е\ = \а\ eief + e.el^0y ίφ]. В частности, если в Ж выбран ортонормированный базис, то операторы, заданные в нем матрицами Паули σι, σ2, σ3, образуют ортонормированный базис в &: σ? = σ! = σ3 = σο=(ί ι); oiaf + aJai = 0i i Φ j. Теперь мы можем объяснить математический смысл матриц Паули, доказав обратное утверждение. 7. Предложение. Для каждого ортонормированного базиса {в\, е2, £з} пространства & существует ортонормированный базис {Αι, А2} пространства 2/6, обладающий тем свойством, что Aei = alt Аег = о2 или — σ2, Ле,«=а3, где Ае — матрица оператора е в базисе {h}, А2}. Он определен с точностью до умножения на комплексное число, по модулю равное единице. 1G5
Доказательство. Собственные значения в{ суть ± 1. Пусть 36 = 3@+ Θ 36-, где еъ действует на 36+ тождественно, а на 36-—изменением знака. Выберем сначала векторы h\^36+y h'2^36_, |Αί| = |Α2|=1. Они определены с точностью до умножения на е**\ е'ф»; матрица еъ в базисе {Ар h2} есть σ3. Далее, e\(K) = eMhi) = -ef\(h'i)> так что ех (А{) есть ненулевой собственный вектор для еъ с собственным значением—1. Поэтому е{ (h\) = ah2. Аналогично ех (h'2) = βΑ|β Матрица в\ в базисе {Αι, А2} эрмитова, поэтому, α = β. Наконец, е^ = id, поэтому αβ = 1 =|α|2=|β|2. Заменив {Ар ti2} на {Ль h^ = {xh\> УК}> гДе |^^| = | £/1 == 1, чтобы превратить матрицу в\ в новом базисе в σι, получим в\ (Αι) = хе\ (Αι) = χahi — α ху~ А2> ei (A2) = ye{ (fi2) = у βΑί = β ι/*" V Поэтому χ, у должны удовлетворять еще условию ху~1 = а-1; тогда автоматически аху~1 = βί/лг1 = 1. Можно положить, например, χ = 1, ί/ = α. Итак, в базисе {Αι,Λ2} имеем Лв, = a8,i4ei = alf и этот базис определен с точностью до умножения на скаляр, по модулю равный единице. Те же рассуждения, что для е\, показывают, что в таком базисе Aei имеет видГ-ф), где |γ|2=1. Кроме того, условие ортогональности е\е% + ^ι = 0 дает (ίί)(ίϊ)+(ίΣ)αΐ)-°· т. е. γ + γ = 0, откуда γ = /, либо γ = —i. Поэтому Ав1 = σ2 или Ае2 = — σ2. 8. Следствие. Пространство & снабжено отмеченной ориентацией: ортоноржированный базис {е\,е2,ег} принадлежит к классу, отвечающему этой ориентации, тогда и только тогда, когда существует ортонормированный базис {Λι,Α2} в 9/6, в котором Аеа = Оа9 а=1, 2, 3. Доказательство. Мы должны проверить, что если {еа} в базисе \hb} и {*'а] в базизе {А'ь} задаются в точности матрицами Паули, то определитель матрицы перехода от {еа} к {е'а} положителен, или что имеется непрерывное движение, переводящее [еЛ в {е'а}. Мы построим такое движение, показав, что {hb} переводится в {Л^} унитарным непрерывным движением: существует такая система унитарных операторов /*: Эв->~36, зависящая от параметра /е=[0,1], что fo«=id, f{(hb) = h'b и {МАО, fr(A2)} образуют ортонормированный базис 26 для всех t Тогда, обозначив А66
через {gt(e\)t gt(e2), gt(ez)} ортонормированный базис 8, задающийся матрицами Паули в базисе {ft(hi), ft(h2)}> мы построим нужное нам движение в 8. Пусть \h\y h2} = {h]t h2}U. Поскольку оба базиса ортонорми- рованы, матрица перехода U должна быть унитарна. По следствию п. 7 § 8 ее можно представить в виде ехр(/Л), где А—эрмитова матрица. Тогда для всех t^A матрица tA эрмитова, а оператор ехр(//Л) унитарен, и мы можем положить ft {hi, h2) = {K Л2}ехр(/М), 0</<1. Это завершает доказательство. Операторы σι/2, σ2/2, оз/2 в Ж называются наблюдаемыми проекций спина на соответствующие оси в 8\ эту терминологию объясняет квантовомеханическая интерпретация из п. 5. Множитель 1/2 введен для того, чтобы их собственные значения были равны ±1/2. 9. Векторное произведение. Пусть {е\, е2, е$} — ортонормированный базис в 8\ принадлежащий отмеченной ориентации. Векторное произведение в 8 определяется классической формулой {ххех + х2е2 + хге3) X (ухех + у2е2 + у3е3) = = (*2Уз — *ъУ2) е\ + (хзУ\ — Х\Уз) ^ + (*ι*/2 — *2У\) ^з· Замена базиса на другой, ориентированный так же, не меняет векторное произведение; если же новый базис ориентирован противоположно, то у него меняется знак. Инвариантную конструкцию векторного произведения нетрудно дать в наших терминах. Вспомним, что антиэрмитовы операторы вЖ с нулевым следом образуют алгебру Ли su(2) (см. § 4 ч. 1). Пространство 8 можно отождествить с этой алгеброй Ли, разделив каждый оператор из 8 на i. Поэтому на — 8 имеется структура алгебры Ли. Имеем [Таа> J °ь\ = 2e°bc J °c где 8ΐ23 = 1 и гаьс кососимметричен по всем индексам, или К> <*&] = 2/еаЬсас. Поэтому Σ χα<*α> Σ Уъ<*Ъ =2/( Σ Ха<Уа)Х\ Σ Ч<* ь) · так что векторное произведение с точностью до тривиального множителя есть просто коммутатор операторов. Это позволяет без вычислений установить классические тождества ·> -* > -> хХу = — уХх; £x(Jx*) + *X(*Xy) + 0X(*X*) = O. 16Т
Есть еще один способ ввести векторное произведение, одновременно связав его со скалярным произведением и кватернионами. 10. Кватернионы. Как и коммутирование, умножение операторов из 8\ вообще говоря, выводит нас за пределы 8\ одновременно нарушается эрмитовость и условие обращения следа в нуль. На самом деле произведение операторов из 8 лежит в Rid + ί^\ ПРИ" чем «вещественная часть» есть как раз скалярное произведение, а «мнимая» — векторное. Действительно, aaGb = ieabcac при а ф Ъ, {а, ft, с} = {1, 2, 3}, σϊ = σο=(ο ι)' α=1» 2' 3' так что у Σ *а<*а J \JL Уь<*ь) = (Σ хаУа J °0 + I ( Σχ xa°aJ X ( Σ Уь<*ъ) » или, как пишут физики, (*·σ)(0·σ)=(*· ί/)σ0+/(χΧΐ/)·σ, а = (а1э σ2, σ3). Отсюда видно, что вещественное пространство операторов Rid + i& замкнуто относительно умножения. Его базис составляют в классических обозначениях элементы 1 = σ0, I = — ial9 j = — /σ2, k = — /σ3 с таблицей умножения i2 = j2 = k2=-i, ij = -ji = k, ki = — ik = j; jk = —kj = t. Иными словами, мы получаем тело кватернионов в одном из традиционных матричных представлений (ср. «Введение в алгебру», гл. 9, §4). 11. Гомоморфизм SU(2)->SO(3). Фиксируем ортонормирован- ный базис {ЛьЛг} в Ж и соответствующий ему ортонормирован- ный базис {βι,£2, еъ) в 8\ для которого Aet = Oi. Любой унитарный оператор U: Ж-+36 переводит \hv A2} в {h'v /г^}, этому последнему базису отвечает базис {e'v e2, е'3}, и имеется ортогональный оператор s(U): 8-+S, который переводит^.} в {£,}. По следствию п. 8 s(£/)eSO(3), ибо определитель s(U) положителен. Реализовав 8 матрицами в базисе {Α ι, к2}, мы можем представить действие s(U) на 8 простой формулой: s(U)(A) = UAU-1 для любых А е 8. Действительно, это частный случай общей формулы замены матрицы оператора при замене базиса. Мы можем теперь доказать следующий важный результат, 163
12. Теорема. Отображение s, ограниченное на SU(2), определяет сюръективный гомоморфизм групп SU(2)->SO(3) с ядром {±Е2}. Доказательство Из формулы s(U) (A) = UAU~l сразу видно, что s(£)=id и s(UV)=s(U)s(V), так что 5 является гомоморфизмом групп. Его сюръективность проверяется так. Выберем элемент geSO(3) и пусть g переводит базис (σι,σ2, σ3) в 8 в новый базис (σ{, σ2, oQ. Построим по нему базис \h\y h2} в Ж, в котором операторы о\ задаются матрицами σ*. По предложению п. 7 {А[, h2} существует с точностью до того, что матрица а2, возможно, равна —σ2, а не σ2. На самом деле эта возможность исключена по следствию п. 8, ибо geSO(3) сохраняет ориентацию 8\ Оператор ί/, переводящий {Ар А2} в {tiv h'2}, удовлетворяет условию s(U) = g. Правда, он может принадлежать лишь U(2), а не SU(2). Если det U = е1*, то r/(P/2i/eSU(2). Матрица e~i(»/2U переводит {Ль А2} в {e-W2h'v e-W2h2}y а этому базису в Ж по-прежнему отвечает базис [σ[, σ2, σ^} в &. Следовательно, также s(e-i(*/2U) = g, и мы получаем, что 5: SU(2)-^SO(3) сюръективен. Ядро гомоморфизма s: U(2)-vSO(3) состоит только из скалярных операторов {ei(*id}: это следует из предложения п. 7, согласно которому базис {Л'р h2} восстанавливается по {e'v е2, е'3} как раз с точностью до умножения на Л Пересечение группы {в1* id} с SU(2) равно в точности {dbid}, что и завершает доказательство. Смысл построенного гомоморфизма выясняется в топологии: группа SU(2) односвязна, т. е. любую замкнутую кривую на ней можно непрерывным движением стянуть в точку, тогда как для SO(3) это неверно. Таким образом, SU(2) является универсальным накрытием группы SO(3). Мы воспользуемся доказанной теоремой для того, чтобы разо·,· браться в структуре группы SO(3), играя на том, что SU(2); устроена проще. Здесь уместно процитировать Р. Фейнмана: «Не правда ли, странно, что, живя в трех измерениях, мы все же с трудом воспринимаем, что произойдет, если сперва повернуться так, а потом еще как-нибудь. Вероятно, если бы мы были птицами или рыбами и если бы мы на собственном опыте знали, что бывает, когда все время крутишь разные сальто в пространстве, нам было бы легче воспринимать подобные вещи». (Фейнман Р., Лейтон Р. Сэндс М. Фейнманввские лекции по физике, вып. 8, гл. 4.— М.: Мир, 1978, с. 101). 13. Структура SU(2). Прежде всего, элементы SU(2) суть 2Х2-матрицы с комплексными элементами, для которых U1 = Ό и det U = 1. Отсюда сразу же следует, что SU(2) = {(_^)||ap + m2=l}· 169
Множество пар {(ayb) | |α|2 + \b\2 = 1} в С2 превращается в сферу единичного радиуса в овеществлении С2, т. е. R4: (Re a)2 + (Im α)2 + (Re bf + (Im bf = 1. Итак, группа SU(2) топологически устроена как трехмерная сфера в четырехмерном евклидовом пространстве. Теперь напишем некоторую систему образующих группы SU(2), вдохновляясь следствием п. 7 § 8, согласно которому отображение ехр: u(2)->U(2) сюръективно. Непосредственное вычисление экспоненты от трех образующих пространства su(2) дает; ехр(-1^з) = (е'о Д,). Любой элемент ( _ JeSU(2), для которого аЬФО, можно представить в виде ехр (~ /φσ3) exp (у /θσχ) exp (γ /ψσ3) = θ ίφ . . θ ι*ϊ* cos — e ζ ι sin — e l . . θ *ν θ -'4* * sin — e * cos — β Δ где 0 ^ φ < 2π, 0 < θ < π, —2π ^ ψ < 2π. Для этого достаточно положить Ι α | = cos γ, arga= ή » arg0 = ——эр-—. (Элементы SU(2) с & = 0, очевидно, имеют вид ехр (у'Ф^з); мы оставляем читателю возможность разобраться с элементами, для которых а = 0.) Углы φ, θ, ψ называются углами Эйлера в группе SU(2). 14. Структура SO(3). Мы отождествили SU(2) топологически с трехмерной сферой. При гомоморфизме 5: SU(2)->SO(3) в одну точку SO(3) переходят пары элементов ±i/eSU(2). На сфере они образуют концы одного из диаметров. Поэтому SO(3) топологически есть результат склеивания трехмерной сферы по парам противоположных точек. С другой стороны, пары противоположных точек сферы находятся во взаимно однозначном соответствии с прямыми в четырехмерном вещественном пространстве, соединяющими точки пары. Множество таких прямых называется трех- 170
мерным вещественным проективным пространством и обозначается иногда /?Р3; позже мы изучим проективные лространства подробнее. Таким образом, S0(3) топологически эквивалентна /?Р3. Посмотрим теперь, во что гомоморфизм 5 переводит образующие SU(2), описанные в предыдущем пункте. В стандартном базисе {σι, σ2, аз} пространства & имеем ехр (γ ita^ σ{ exp ( — у ito^ = ou exp Γγ #σι) σ2 exP ( — γ #σι) = (cos 0 σ2~~ (s*n 0 σ3> ехр (у йа^ σ3 ехр ( -- -^ #σι) = (sin t) σ2 + (cos /) σ3. Поэтому /10 0 \ s (ехр (-г- ftat)) =1 0 cos t — sin t ) V W У/ \0 sinf cosf / является вращением & на угол £ вокруг оси Rai. Совершенно аналогично проверяется, что s Гехр Гу itokJj есть вращение $ на угол t вокруг оси Gk также для k = 2, 3. В частности, любое вращение из SO(3) разлагается в произведение трех вращений относительно сГз, orj, σ3 на углы Эйлера ψ, θ, φ, причем ψ можно считать меняющимся от 0 до 2π. УПРАЖНЕНИЯ 1. Доказать тождества (*Х I/, Ζ.) = (*. 1/Х*), -> -> -> -> -> -> +->·>·>·>·> (хХ у)Хг-х Х(у X z)=*(x, y)z~x (t/, ζ). (Указание. Воспользоваться ассоциативностью умножения в алгебре кватернионов.) 2. В трехмерном евклидовом пространстве выделены две оси ζ и ζ\ образующие между собой угол φ. Пучок электронов с проекцией спина +1/2 на ось ζ подается на фильтр, пропускающий лишь электроны с проекцией спина +1/2 на Φ ось ζ'. Показать, что доля прошедших через него электронов будет равнасоэ2—. § 12. Пространство Минковского 1. Пространством Минковского Л называется четырехмерное вещественное линейное пространство с невырожденной симметричной метрикой сигнатуры (1,3) (иногда работают с сигнатурой (3,1))· Прежде чем приступить к математическому изучению этого пространства, укажем основные принципы его физической интерпретации, лежащие в основе специальной теории относитель- ностиА Эйнштейна. 171
а) Точки. Точка (или вектор) пространства Ж есть идеализация физического события, локализованного в пространстве и времени, типа «вспышки», «излучения фотона атомом», «столкновения двух элементарных частиц» и т. п. Начало координат Ж следует представлять себе как событие, происходящее «здесь и сейчас» для некоторого наблюдателя; оно фиксирует одновременно начало отсчета времени и начало отсчета пространственных координат. б) Единицы измерения. В классической физике длины и времена измеряются в разных единицах. Поскольку Ж есть модель пространства-времени, в специальной теории относительности должен быть способ пересчета пространственных единиц во временные и наоборот. Принятый способ эквивалентен принципу «постоянства скорости света с»: он состоит в том, что выбранной единице времени t0 ставится в соответствие единица длины lo = cto — расстояние, проходимое светом за время ί0 (например, «световая секунда»). Одна из единиц 10 или t0 считается далее выбранной раз навсегда; после того как вторая зафиксирована условием /0 = cto, скорость света в этих единицах становится равной 1. в) Пространственно-временной интервал. Если 1\У12^Ж— две точки пространства Минковского, скалярное произведение (1\ — /2, U — h) называется квадратом пространственно-временного интервала между ними. Этот квадрат может быть положительным, нулевым или отрицательным; в физических терминах соответственно времениподобным, светоподобным или пространственноподобньш. (Некоторое объяснение этих терминов будет дано ниже.) Если /2 = 0, эти же термины применяются к вектору 1\ в зависимости от знака (/i, U). г) Мировые линии инерциальных наблюдателей. Если на прямой La Ж хоть один вектор времениподобен, то и все векторы времениподобны. Такие прямые называются мировыми линиями инерциальных наблюдателей. Хорошим приближением к отрезку такой линии может служить множество событий, происходящих в космическом корабле, который движется свободно (с выключенными двигателями) вдали от небесных тел (учет их тяготения требует изменения математической схемы описания пространства- времени и перехода к «искривленным» моделям общей теории относительности). Заметим, что мы ввели пока в рассмотрение только мировые линии, исходящие из начала координат. Инерци- альный наблюдатель, не бывший «здесь и сейчас», движется по некоторому сдвигу / + L времениподобной прямой L. Пусть /i, k — две точки на мировой линии инерциального наблюдателя. Тогда (/i — kyh — k) > 0, и интервал |/ι — /21 == (^ι — k, h — k)l/2 есть собственное время этого наблюдателя, протекшее между событиями 1и 12 и измеренное по показаниям движущихся вместе с ним часов. Мировая линия инерциального наблюдателя есть его собственная «река времени». Физический факт направленности времени (из прошлого в будущее) математически выражается заданием ориентации каждой 172
времениподобной примой, так что длина |/| времениподобного вектора может быть снабжена знаком, отличающим векторы, направленные в будущее и в прошлое. Ниже мы увидим, что имеет смысл представление о согласованности этих ориентации, т. е. о существовании общего направления времени — но не самих времен!— для разных инерциальных наблюдателей. д) Физическое пространство инерциального наблюдателя. Линейное подмногообразие ^l = l + L^cz Ж интерпретируется как множество точек «мгновенного физического пространства» для инерциального наблюдателя, находящегося в точке / своей мировой линии L. Ортогональное дополнение берется, разумеется, относительно метрики Минковского в Ж. Нетрудно убедиться, что Ж = L® LL и что на L1 индуцируется структура трехмерного евклидова пространства (только с отрицательно определенной метрикой вместо обычной положительно определенной). Все события, отвечающие точкам L1, интерпретируются наблюдателем как происходящие «сейчас»; для другого наблюдателя они не будут одновременными, ибо Lf- Φ L^ при L\ φ L2. е) Инерциальные системы координат. Пусть L — времениподоб- ная прямая с ориентацией, во — положительно ориентированный вектор на ней длины единица, {βι, ег, £з}— ортонормированный базис в L1: (е,·, £/) =—1 для i= 1,2,3. Система координат в Жу отвечающая базису {ео, ..., £з}, называется инерциальной системой. В ней Сз з \ з С Χιβι, Σ У&г I = *οί/ο — Σ *iHi · Поскольку Xq = с/о, где /0 — собственное время, пространственно- временной интервал от начала до точки Σ xiei равен I сН\ — 3 у/2 — Σ*?) ' Каждая инерциальная система координат в Ж определяет отождествление Ж с координатным пространством Минковского ί R4, a:q — Σ х\у Изометрии Ж (или координатного пространства) образуют группу Лоренца\ изометрии, сохраняющие ориентацию во времени, — ее ортохронную подгруппу. ж) Световой конус. Множество точек / е Ж с (/,/)= 0 называется световым конусом С (начала координат). В любой инерциальной системе координат С задается уравнением з x0s= Д, хг При хо > 0 точка (*o, хи *2, *з) на световом конусе отделена от положения наблюдателя (х0, 0, 0, 0) пространственноподобным 173
8 интервалом с квадратом — Σ *2 = — *о> т· е· находится на рас- стоянии, которое за время х0 пройдет квант света, выпущенный из начала координат в начальный момент времени. (При xq < О множество таких точек отвечает вспышкам» которые произошли в момент собственного времени х0 и могли наблюдаться в точке начала отсчета: «приходящее излучение».) Соответственно «нулевые прямые», целиком лежащие в С,— это мировые линии частиц, испущенных из начала координат и летящих со скоростью света, например, фотонов. Читатель может увидеть базу «приходящей полы» светового конуса, выглянув в окно, — это небесная сфера. Прямые в Жу состоящие из векторов с отрицательным квадратом длины, не имеют физической интерпретации. Они должны были бы отвечать мировым линиям частиц, летящих быстрее света,— гипотетических «тахионов», не обнаруженных экспериментально. Перейдем теперь к математическому изучению Ж. 2. Реализация Ж как пространства метрик. Как в § 9, фиксируем двумерное комплексное пространство Ж и рассмотрим на нем множество Ж эрмитово симметричных скалярных произведений. Оно является вещественным линейным пространством. Если выбран базис {hu A2} в Ж, то матрицы Грама этих метрик будут всевозможными эрмитовыми 2Х 2-матрицами. Поставим в соответствие метрике / е Ж определитель ее матрицы Грама G, который будем обозначать det/. Переход к базису ψν /Q = {Л2, Л2} V приведет к замене G на G' = VGF, и det G' = | det V\2 det G. В частности, если Fg SL(2, С), то det G = det G'. Поэтому вычисление det / в любом из базисов Ж, лежащих в одном классе относительно действия SL(2, С), приведет к одному и тому же результату. Впредь мы фиксируем такой класс базисов Ж, и все det будем вычислять относительно него. Замена класса только умножает det на положительный скаляр. 3. Предложение, а) Ж является четырехмерным вещественным пространством. б) На Ж имеется единственная симметричная метрика (/, т), для которой (/, /) = det/. Ее сигнатура равна (1, 3), так что Ж представляет собой пространство Минковского. Доказательство, а) Пространство эрмитовых 2 X 2-матриц имеет базис σ0=ί 0 1J=£2>* аь <*2, <*з, гДе <*/> ίΞ^Ι, — матрицы Паули. Поэтому dim Ж =а 4. б) Покажем, что в матричной реализации Ж функция det / представляет собой квадратичную форму, поляризация которой имеет вид (/, m) = y(Tr/Trm-TrM, явно симметричный и билинейный. В самом деле, если λ, μ — собственные значения /, то det / = λμ, Тг / = λ + μ> Tr P = λ2 -f- μ2, так 174
что λμ = (1βί/ = {((λ + μ)2-λ2-μ2) = 4«ΤΓ/)2-ΤΓΖ2) = (/>/). Теперь очевидно, что {σ0, σι, σ2, аз} является ортонормированным базисом Ж с матрицей Грама diag(lf —1,—1, —1), так что сигнатура нашей метрики равна (1,3). Это завершает доказательство. 4. Следствие. Пусть La Ж — времениподобная прямая. Тогда L1 с метрикой — (/, ш) является трехмерным евклидовым пространством, и Ж = L@ L1. Доказательство. Утверждение М=*Ь®Ь^ следует из предложения п. 2 § 3, ибо времениподобные прямые, очевидно, невырождены. Так как сигнатура метрики Минковского на Ж есть (1,3), а на L1— (1,0), на L1 она должна быть (0,3), что завершает доказательство. Перейдем теперь к изучению геометрического смысла скалярных произведений. Неопределенность метрики Минковского приводит к замечательным отличиям от евклидовой ситуации, которые имеют важный физический смысл. Самые яркие факты связаны с тем, что неравенство Коши — Буняковского — Шварца для вре- мениподобных векторов оказывается обращенным в другую сторону. 5. Предложение. Пусть (/ь /ι)>0, (/2, /2)>0, U&Jt. Тогда (lukTXh, h)(l2, /2). Равенство достигается тогда и только тогда, когда /lf /2 линейно зависимы. Доказательство. Прежде всего проверим, что квадратный трехчлен (tl\ + h, tl\ + /2) всегда имеет вещественный корень to. В матричной реализации Ж условие (/2, /2) > 0 означает, что det /2 > 0, т. е. что /2 имеет вещественные характеристические корни одного знака, скажем, ε2 (+1 или —1). Аналогично, пусть ει — знак собственных значений 1{. Тогда при *-> — (ειε2)οο матрица tl\ + k имеет собственные значения, примерно пропорциональные собственным значениям 1\ (ибо 1\ + t~xh стремится к /ι), и их знак будет —ε2, а при t = 0 матрица 01\ + /2 = /2 имеет собственные значения знака ε2. Следовательно, при изменении t от 0 до —(ειε2)οο собственные значения tl\ + /2 проходят через нуль, и det(tl\ -J- h) обращается в нуль. Значит, дискриминант этого трехчлена неотрицателен, так что (/i, kfXlu Ш/2> /2). Если он равен нулю, то некоторое значение to e R является двукратным корнем, и матрица toh + /2, имея два нулевых собственных значения и будучи диагонализируемой (она эрмитова!), равна нулю. Поэтому /ι и /2 линейно зависимы. 6. Следствие («неравенство треугольника в обратную сторону»). Если /ι, /2 времениподобны и (1и /2)^ 0, to l\ + k времениподобен и \h + k\>\k\+ 141 175
(где |/| = (/, /)1/2), и равенство достигается тогда и только тогда, когда /ι, 12 линейно зависимы. Доказательство. |/i+/2p = l/iP + 2(Zlf k) + \kf> >\hf + 2\lx ΙΙ/2Ι + |/2ΐ2 = (Ι/ιΙ + Ι/2Ι)2. Равенство достигается лишь при (Ιχ912) = \ 1\ \ | /21. Дадим теперь физические интерпретации этих фактов. 7. «Парадокс близнецов». Времениподобные векторы 1\, 12 с (/ι, /г)^0 назовем одинаково временно ориентированными. Из предложения п. 5 видно, что для них (/ь /2) > 0. Вообразим двух близнецов-наблюдателей: один инерциален и движется по своей мировой линии от точки 0 до точки l\ -f- /2, другой доходит до той же точки от начала отсчета, двигаясь сначала инерциально от 0 до 1Х и затем от 1\ до l\ + k'- вблизи нуля и вблизи 1{ он включает двигатели своего космического корабля, чтобы сначала улететь от брата, а затем снова вернуться к нему. Согласно следствию п. 6 собственное время, протекшее для путешествующего брата, будет строго меньше времени, протекшего по часам домоседа. 8. Множитель Лоренца. Если 1\ и /2 времениподобны и одинаково временно ориентированы, то по предложению п. 5 Д1*,., , ^ ^ 1, и мы не можем интерпретировать эту величину как косинус угла. Чтобы понять, что она собой представляет, снова прибегнем к физической интерпретации. Пусть |/ι|=1, |/2|=1; в частности, инерциальный наблюдатель U прожил единицу собственного времени с момента начала отсчета. В точке 1{ физическое пространство одновременных событий для него есть Zi+iR/i)1· Мировая линия наблюдателя R/2 пересекает это пространство в точке х/2, где χ находится из условия {xl2 — li, /i) = 0, т. е. χ =(/ι, /г)-1. Расстояние от h до xl2 пространственнопо- добно: для наблюдателя Ю\ — это расстояние, на которое R/2 удалился от него за единицу времени, т. е. относительная скорость R/2. Она равна (учесть, что у метрики в (R/i)1 следует изменить знак!) Ό = [ - (χΐ2 - lu xl2 - /О]1/2 = [ - (xl2 -1» хк)У12 = = [ - х2 (k. « + х du h)V12 = I - (lu k)~2 + I]1'2, откуда Это знаменитый множитель Лоренца\ часто его пишут в виде . явно указывая, что скорости измеряются по отноше- У1 — O2/C2 нию к скорости света. В частности, J76
т. е. в момент собственного времени единица для первого наблюдателя второй наблюдатель находится в его физическом пространстве, когда часы второго наблюдателя показывают ^\—υ2. Это — количественное выражение эффекта «сокращения времени» для движущегося наблюдателя, качественно описанное в предыдущем пункте. 9. Евклидовы углы. В пространстве (R/o)1, где /о— времени- подобный вектор, геометрия евклидова, и там скалярное произведение имеет обычный смысл. Пусть 1и 12 — еще два времениподоб- ных вектора с той же ориентацией. Мы можем спроектировать их на (К/о)1 и вычислить косинус угла между проекциями. Предоставляем читателю самостоятельно убедиться в том, что для наблюдателя R/o это — угол между направлениями отлета от него наблюдателей Ю\ и R/2 в его физическом пространстве. Абсолютного значения этот угол не имеет; другой наблюдатель WQ увидит его другим. 10. Четыре ориентации пространства Минковского. Пусть {е,}, |^}, i = 0, ..., 3, — два ортонормированных базиса в Ж'- (е0, £0) = =(ео» ео)==^» {ер ei) = {e'i> ei) = ~~ 1 ПРИ *'= 1» ···> 3. По аналогии с прежними определениями назовем их одинаково ориентирован- ными, если один переводится в другой непрерывной системой изо- метрий ft: Ж-> Ж, 0^/<П, f0=id, f, (ef) = ej. Два условия одинаковой ориентированности, очевидно, необходимы: а) {ео> ео) > 0. Действительно, (е0, /* (е0))2^ * по предложению п. 5, так что знак (е0, ft (во)) не может меняться при изменении t, а (^о,/о(^о))= 1. Выше мы назвали е0 и e'Q с таким свойством одинаково временно ориентированными. б) Определитель отображения ортогональной проекции Σ R^-> з -> Σ Rep записанного в базисах {е^ или {е^}, положителен. 3 3 Действительно, проекция Σ ^ei -* Σ R/# ifiii невырождена ни при каком значении /: иначе пространственноподобный вектор из 3 3 £ Re( был бы ортогонален Σ Rft(e'i) = {ft(e'o))19 τ· е· пропорционален ft (e'J) — времениподобному вектору;это невозможно. Значит, определители этих проекций при всех t имеют одинаковый знак, а при t = 0 он положителен. Можно сказать, что пары базисов со свойством б) одинаково пространственно ориентированы. Наоборот, если два ортонормированных базиса в Ж имеют одинаковую пространственную и временную ориентацию, то они одинаково ориентированы, т. е. переводятся друг в друга непрерывной ^системой изометрий ft. Чтобы построить ее, положим 177
прежде всего f, (eQ) = . ,—-—г. Из условия (е0> ej) > 1 | ieo+ U — *) ео I следует, что /*(βο) времениподобен и имеет квадрат длины единица при всех 0^/^1. Далее, в качестве ft(eue2> ez) выберем орто- нормированный базис в ft (во)1, получающийся из проекции {#ι,£2, ег} на ft (во)1 процессом ортогонализации Грама — Шмидта; очевидно, он непрерывно зависит от t. Ясно, что ^ (еЛ = е^ а {^i (ei)> f\ (е2)> fi (вз)} и {е'\> e'v е'з} СУТЬ одинаково ориентированные ортонормированные базисы в (^о)1. Их можно перевести друг в друга непрерывным семейством чисто евклидовы^ вращений (^о)1» оставляющих е'0 неподвижным. Это завершает доказательство. Обозначим через Λ группу Лоренца, т. е. группу изометрий пространства Ж> или 0(1,3). Пусть далее Λ* -— подгруппа Л, сохраняющая ориентацию некоторого ортонормированного базиса; Л* — подмножество Л, меняющее его пространственную, но не временную ориентацию; Л* — подмножество Л, меняющее его временную, но не пространственную ориентацию; Л* — подмножество Л, меняющее его временную и пространственную ориентации. Нетрудно убедиться, что от выбора исходного базиса эти подмножества не зависят. Мы доказали следующий результат: И. Теорема. Группа Лоренца Л состоит из четырех связных компонент. Л = Л* |J A* |J A* IJ А*· Тождественное отображение лежит, очевидно, в А*. Аналогом теоремы п. 12 § 11 является следующий результат. 12. Теорема. Реализуем Ж как пространство матриц Грама эрмитовых метрик в Ж в базисе {huh2}. Для любой матрицы V е SL (2, С) поставим в соответствие матрице I <= Ж новую мат- рицу ]_ s(V)l=VHV. Отображение s определяет сюръективный гомоморфизм SL (2, С) на Л* с ядром {± Е2). Доказательство. Очевидно,^ что s(V)l линейно по / и сохраняет квадраты длин: det(VHV) = det /. Поэтому s(F)sA. Так как группа SL(2, С) связна, любой ее элемент можно непрерывно деформировать в единичный, оставаясь внутри SL(2, С),— преобразование Лоренца s(V) можно непрерывно деформировать в тождественное, так что 5 (V) ^ А*. Поскольку s(id)=id й s(V\V2) = s(Vi)s(V2), s является гомоморфизмом групп. Если VHV = / для всех / е Ж, то, в частности, ν*θιV = σ,·, где σ0 = Е2) <*ь θ2, Оз — матрицы Паули. Условие ν*ν = Ε2 означает, что V унитарна; после этого условия VlOiV = Ι^σ,ίν*)"1 = σ, означает, что V =ζ ±Ε2\ это было доказано в п. 12 § 11. Таким образом, Кег 5= {±Е2}. 178
Осталось установить, что 5 сюръективен. Пусть f: Ж^-Л — преобразование Лоренца из Λ*, переводящее ортонормированный базис \е{} в [е'^. Метрики на Ж, отвечающие е0 и е'0, определены, ибо собственные значения как е0, так и е'0 имеют одинаковый знак, потому что dete0 — det^ = 1. Из (е0, е'0) > 0 следует, что эти метрики одновременно положительно или отрицательно определены. Действительно, выше мы убедились, что соединяющий их отрезок /е^+(1 — /е0), 0^/^ 1, целиком состоит из временипо- добных векторов. Отсюда уже вытекает существование такой матрицы VeSL(2, С), что s(V) переводит е0 в е^ т. е. e'0=V*e0V9 где eQ и e'Q отождествлены с их матрицами Грама. Действительно, V — это матрица изометрии {Ж, е0) с {Ж, е'0): априори ее определитель может быть равен —1, но это противоречило бы возможности соединить V с Е2 в SL(2, С) с помощью деформации V , где ^=(У^)^(в0) V^,/^ — соответствующая деформация в Л*. Итак, s(V) переводит е0 в е'0. Дальше остается показать, что евклидов поворот {s(V)el9 s(V)e2, s(V)e3} в {е\, е'2, е'3} можно осуществить с помощью s(U)t где £/е SL(2, С) и s(U) оставляет е0 на месте. Можно считать, что е{) представлен матрицей σ0 в базисе {fti,fts}. Тогда мы должны выбрать U унитарной с условием U(<s(V)el"jU-l = e/iдля /= 1, 2, 3. Это можно сделать по теореме п. 12 §11, ибо базисы{s(V)et} и {е'.}> /=1, 2, 3, в (е^ортонор- мированы и одинаково ориентированы. Доказательство окончено. 13. Евклидовы повороты и бусты. Пусть е0, е£— два одинаково временно ориентированных времениподобных вектора длины единица, L0, Lq— ортогональные дополнения к ним. Имеется стандартное преобразование Лоренца из Λ*, переводящее е0 в е'0, которое в физической литературе называется бустом. При е0 = е'0 это — тождественное преобразование. Прие0=т^ е'0 оно определяется так: рассмотрим плоскость (L0 f| ^о)1· Она содержит е0 и e'Q. Сигнатура метрики Минковского на ней равна (1, 1). Поэтому существует пара единичных пространственноподобных векторов е]9 е(е (^Π^ό)1» ортогональных к е0 и е'0 соответственно. Буст оставляет на месте все векторы из L0f|^o и переводит eQ в е'0, ех в е\ соответственно. Чтобы вычислить элементы матрицы перехода {ео> е\}\ь ^ ) = {^о» βι}> замети^ прежде всего, чтоа = (е0, е'^ = ι = , , где ν — скорость относительного удаления инерциаль- ных наблюдателей, отвечающих е0 и е'0. Далее, матрицы Грама {eQt ех) и {е'0, е\) суть ( J _ j ) . поэтому α2-&2=1, ac-bd = 0, с2 —d2=—1. 179
Из первого уравнения, зная а, находим Ь = . . Добавляя VI — ν1 сюда условие, что определитель буста ad— be равен единице, получаем d = α, с = b. Окончательно, матрица буста в базисе W £ь е2, #з}, где {е2, £з}—ортонормированный базис (Z^fl^o)1» имеет вид VT= ϋ Vr= 0 0 υ2 υ2 Vn= 1 Vb= 0 0 ϋ2 Ό2 0 0 1 0 0 1 или в терминах пространственно-временных координат _ x'Q + υχ[ _ υχ'0 + χ[ _ , _ , *ο— ^/ΐ—σ2 ' *1_ ΥΓ^σ2" ' *2 —*2' ^з —Настоящую в левом верхнем углу матрицу можно записать также как матрицу «гиперболического поворота» / ch θ sh θ \ V sh θ ch θ ) ' найдя θ из условий 1 2 Vl -*>2 sh9 = *θ-*-θ Vl - σ2 Если исходить из двух одинаково ориентированных ортонорми- рованных базисов {е0, ev е2, е3} и {е[> е[> е'2, е'г}> то преобразование Лоренца, переводящее один в другой, можно представить в виде произведения буста, переводящего е0 в e'Qf и затем евклидова поворота в (^о)1» который переводит образ базиса {ei,e2, £з} после буста в базис {e'v e'v e'3}> оставляя efr на месте. 14. Пространственные и временные отражения. Любое трехмерное подпространство LczM, на котором метрика Минковского (анти) евклидова (т. е. прямая L1 времениподобна), определяет преобразование Лоренца, тождественное на L и меняющее знак на L1. Все такие операторы называются отражениями времени. Любое трехмерное подпространство L а Л, на котором метрика Минковского имеет сигнатуру (1,2) (т. е. прямая L1 простран- ственноподобна), также определяет преобразование Лоренца, тождественное на L и меняющее знак на L1. Все такие операторы называются пространственными отражениями. Если фиксировать какое-нибудь отражение времени Τ и пространства Р, то все элементы из Λ*, Λ*, Λ* будут получаться из элементов Л* умножением на Г, Ρ, ΡΤ соответственно. 180
§ 13. Симплектические пространства 1. В этом параграфе мы будем рассматривать конечномерные линейные пространства L над полем Ж характеристики Ф2, снабженные невырожденным кососимметрическим скалярным произведением [ , ]: LXL->Jif, и называть их симплектическими про- странствами. Напомним свойства симплектических пространств, которые уже были установлены ранее, в § 3. Размерность симплектического пространства всегда четна. Если она равна 2г, то в пространстве существует симплектический базис {е\у ..., ег\ ег+\, ..., е2г}, т. е. базис с матрицей Грама вида В частности, все симплектические пространства одинаковой размерности над общим полем скаляров изометричны. Подпространство L\cz L называется изотропным, если ограничение скалярного произведения [, ] на него тождественно равно нулю. Все одномерные подпространства изотропны. 2. Предложение. Пусть L — симплектическое пространство размерности 2r, L\CiL — изотропное подпространство размерности г\. Тогда гх^г, и если η < г, то L\ содержится в изотропном подпространстве максимальной возможной размерности г. Д о к аз а те л ьство. Поскольку форма [,] невырождена, она определяет изоморфизм L -> L*, при котором вектору / <= L ставится в соответствие линейный функционал /Ί—>[/, /']. Отсюда следует, что для любого подпространства L\<zzL имеем dim L± = = dim L — dim Lx (cp. § 7 ч. 1). Если к тому же Lx изотропно, то L{ cz Lj1, откуда rx = dim Lx ^ dim L^ = dim L—dim L, = 2r—r,, так что rχ ^ τ. Рассмотрим теперь ограничение формы [, ] на L{L. Во всем пространстве L ортогональное дополнение к L{L имеет размерность dim L — dim L(- = dim Lx по предыдущему рассуждению. С другой стороны, L\ лежит в этом ортогональном дополнении и потому совпадает с ним. Значит, L\ есть в точности ядро ограничения [, ] на Lj1. Но в Lj- имеется симплектический базис в том его варианте, который рассматривался в § 3, где допускались вырожденные пространства: с матрицей Грама ( ° 1*",|о\ -*r-*| ° 1° у \ о ι о |о/ Размер единичной клетки есть ^-(dimLf — dimLj) = r — г ,. Векторы ^2(г-г1)+1. · · ·» etr-n порождают ядро формы на/^т. е. L\\ 181
добавив к ним, например, ей ···> ^г-и, получим г-мерное изотропное подпространство, содержащее L\. 3. Предложение. Пусть L — симплектинеское пространство размерности 2г, L\cz L — изотропное подпространство размерности г. Тогда существует другое изотропное подпространство L2cz L размерности г такое, что L = L\ Θ L2t и скалярное произведение индуцирует изоморфизм L2 -> L\. Доказательство. Мы докажем несколько более сильный результат, полезный в приложениях, а именно установим существование подпространства L2 среди конечного числа изотропных подпространств, связанных с фиксированным симплектическим базисом {еи ..., ег\ ег+\у ..., е2г) в L. Именно, пусть дано разбиение {1, ..., r}=I[)J на два непересекающихся подмножества. Тогда г векторов {ei, er+j \ i e /, /е/} порождают г-мерное изотропное подпространство в L, называемое координатным (относительно выбранного базиса). Очевидно, их имеется 2Г. Покажем, что L2 можно найти среди координатных подпространств. Пусть Μ натянуто на {еи ..., ег) и dim(Li (]М) = s, 0 <; 5 ^ г. Существует такое подмножество /с:{1, ..., г} из г — 5 элементов, что L\f\M трансверсально к N, натянутому на {в/|/е/}, т. е. Li(]M(]N = {0}. Действительно, множество {базис L\(]M}\j U{ei, ..., ег} порождает М, поэтому базис L\(]M можно дополнить до базиса Μ с помощью г—s векторов из {е\, ..., ег} по предложению п. 10 § 2 ч. 1. Номера этих векторов образуют искомое/, ибо Li(]M + N = Μ, так что Li(]M(]N ={0}. Положим теперь /={1, ..., г}\1 и покажем, что изотропное подпространство L2, натянутое на {е,·, βΓ+/· 11 е/, /е/}, является прямым дополнением к L\. Достаточно проверить, что L\(]L2 = {0}. Действительно, из доказательства предложения п. 2 следует, что Lj- = L[t L£ = L2. Но L\(]M содержится в Lb N содержится в L2, так что сумма Μ = L\{\M-\- N ортогональна к L\ f) L2. Но Μ изотропно размерности г, поэтому М1 = М, и L\QL2cz M. Значит, окончательно Lli]L2 = (Lli]M)i](L2i]M) = (Ll(]M)(]N = {0}. Линейное отображение L2->L\ ставит в соответствие вектору IgL2 линейную форму m >—>[/, пг] на L\. Оно является изоморфизмом, ибо dimL2—dimL* = r, а его ядро содержится в ядре формы [,], которая, по предположению, невырождена. Это завершает доказательство. 4. Следствие. Любые пары взаимно дополнительных изотропных подпространств в L одинаково расположены: если L = LX®L2 = — L[(&L2, то существует изометрия f: L-+L такая, что f(L{) — = L\,f(L2) = L2. Доказательство. Выберем базис {ей ..., ег) в L\ и двойственный к нему базис {ег+и --- ·, ^2г} в L2 относительно описан- 182
ного выше отожлествления L\-+L2. Очевидно, {еи ..., е2г} есть симплектический базис в L. Аналогично построим симплектический базис \е[у ..., ^2Г} по'разложению L[@L'r Линейное отображение /: е.ь->е\, ί=1, ..., 2г, очевидно, является требуемой изо- метрией. Из этого следствия и предложений пп. 2, 3 следует, что любые изотропные подпространства одинаковой размерности в L переводятся одно в другое подходящей изометрией. 5. Симплектическая группа. Множество всех изометрий f: L-+L симплектического пространства образует группу. Множество матриц, представляющих эту группу в симплектическом базисе {ей .··> е2г}у называется симплектической группой и обозначается Sp(2r,Ж), если dim L = 2г. Условие А е Sp(2r,«3if) равносильно тому, что матрица Грама базиса {е\у ..., е2г}А совпадает с /2Γ = = ( — Ε (/)' τ· е' что Л^2гЛ =/дг, так что det A = ±1;ниже мы докажем, что det Л = 1 (см. п. 11). Поскольку Р2г = — Е2г> это условие можно записать также в виде А =—I2r(Af)-lI2r. Отсюда вытекает 6. Предложение. Характеристический многочлен P(t)=* = det (tE2r— А) симплектической матрицы А возвратен, т. е. P(t) = t2rP(t-iy Доказательство. Имеем, пользуясь тем, что det А — 1, det (tE2r - А) = det (tE2r + I2r (Л<Г72г) = det (tE2r - (Л')"1) = = det (tAf - E2r) = t2r det (ГlE2r - Л') = t2r det (Г^2r - A). 7. Следствие. £с/ш «5ί? = R и А — симплектическая матрица, то вместе с каждым собственным значением λ у А есть собственные значения λ"1, λ и λ-1. Доказательство. Поскольку А невырождена, λ Φ 0 и Ρ(λ-1) = λ~2ΓΡ(λ) = 0. Поскольку коэффициенты Р вещественны, Ρ(λ) = Ρ(λ) = 0. Комплексное сопряжение есть симметрия относительно вещественной оси, а отображение λf~> λ-1 — симметрия относительно единичной окружности. Значит, комплексные собственные значения А появляются четверками, симметричными одновременно относительно вещественной оси и единичной окружности, а вещественные собственные значения — парами. 8. Пфаффиан. Пусть Ж2г — координатное пространство, А — невырожденная кососимметрическая матрица порядка 2г над Ж. Скалярное произведение [л:, у] = х*Ау в Ж2Г невырождено и косо- симметрично. Переходя от исходного базиса к симплектическому, получаем, что для матрицы А найдется такая невырожденная матрица β, что '-'(-It)* 183
откуда det A = (det β)2. Итак, определитель каждой кососимметри- ческой матрицы является точным квадратом. Это наводит на мысль попытаться извлечь из определителя квадратный корень, который был бы универсальным многочленом от элементов Л. Это действительно возможно. 9. Теорема. Существует единственный многочлен с целыми коэффициентами Pi А от элементов кососимметрической матрицы А такой, что deM=(Pfi4)2 и Pf ( _ Е r J = l. Этот многочлен называется пфаффианом и обладает следующим свойством: Pi (B<AB) = det В-Pi A для любой матрицы В. (В случае с\\агЖфО коэффициенты Pi щелы» β том смысле, что лежат β простом подполе поля Ж, т. е. являются суммами единиц.) Доказательство. Рассмотрим г(2г—1) независимых переменных над полем Ж: {ац\ 1 ^ i < / ^ 2г}. Обозначим через К поле рациональных функций (отношений многочленов) от ац с коэффициентами из простого подполя поля Ж. Положим А — (ац)> где ац = —ац при i > /, ац = 0, и введем на координатном пространстве К2г невырожденное кососимметрическое скалярное про- изведение х*Ау. Перейдя к симплектическому базису с помощью некоторой матрицы β, получим, как выше, det A = (det β)2. Априори det β является лишь рациональной функцией от ац с коэффициентами из Q или простого поля конечной характеристики. Но так как det A — многочлен с целыми коэффициентами, квадратный корень из него также должен иметь целые коэффициенты (здесь мы пользуемся теоремой об однозначном разложе- нии на множители в кольце многочленов Ζ [ац] или Fp[a*/]). Знак Vdet А, очевидно, однозначно фиксируется требованием, чтобы значение Vdet/2r было равно единице. Последнее равенство из формулировки теоремы устанавливается так. Прежде всего, В*АВ кососимметрична вместе с Л, так что Pf2 (В'АВ) = det (В*АВ) = (det β)2 det A = (det β)2 Pf2 Л. Поэтому Pi (В*АВ) = ± det BPi А. Чтобы установить знак, достаточно выяснить его в случае Л = /2г, β = Е2г> где он, очевидно, положителен. 10. Примеры. и (4, ?*)-<« (0 а12 в13 flu — а12 0 а2з я24 — аи — а24 — Яз4 0 = — anaZi + α[Ζθ24 — α14α&. 134
11. Следствие. Определитель любой симплектической матрицы равен единице. Доказательство. Из условия АЧ2г А = 12г и теоремы п. 3 следует 1 = Pf /2г = pf (АЧ2гА) = det A Pf /2г, что доказывает требуемое. Мы пользовались этим фактом при доказательстве предложения п. 6. 12. Связь ортогональной, унитарной и симплектической групп. Пусть R2r — координатное пространство с двумя скалярными произведениями: евклидовым (,) и симплектическим [,]: (х, у) = х1у\ ■> -> >. -> -> -> [л:, f/] = * /2гУ = (Xf /2ri/). Поскольку l\r= — E2r, оператор /2г определяет на R2r комплексную структуру (см. § 12 ч. 1) с комплексным базисом? {е, + ier+j\j= 1, ..., г}, относительно которой имеется эрмитово скалярное произведение -> > -> > -> ·> <*» У) = (х, y) — i[x, У) (см. предложение п. 2 § 6). В терминах этих структур имеем U (г) = О (2г) П Sp (2r) = GL (г, С) П Sp (2r) = GL (г, С) П О (2г). Мы оставляем читателю проверку в качестве упражнения. § 14. Теорема Витта й группа Витта 1. В этом параграфе мы изложим результаты Витта, относящиеся к теории конечномерных ортогональных пространств над произвольными полями. Они уточняют теорему классификации из § 3 и могут рассматриваться как далеко идущее обобщение теоремы инерции и понятия о сигнатуре. Начнем с некоторых определений. Как обычно, считаем характеристику поля скаляров не равной двум. Гиперболической плоскостью называется двумерное пространство L с невырожденным симметричным скалярным произведем нием (,), имеющее ненулевой изотропный вектор. Гиперболическим пространством называется пространство, разлагающееся в прямую сумму попарно ортогональных гиперболических плоскостей. Анизотропным пространством называется пространство, не имеющее (ненулевых) изотропных векторов. Над вещественным полем анизотропные пространства L имеют сигнатуру (я, 0) или (0, /г), где n=^dimL. Мы сейчас покажем, 185
что гиперболические пространства суть обобщения пространств с сигнатурой (т,т). 2. Лемма, У гиперболической плоскости L всегда существуют базисы \ev е2} с матрицей Грама (Q J и {ev е2} с матрицей Грама (JJ). Доказательство. Пусть l^Ly (/, /) = 0. Если /i e L не пропорционален /, то (1\,1)Ф0У ибо L невырождена. Можно считать, что (/ь/)=1. Положим е{ = 1> e2 = lx — *'2 /. Тогда (βι,βι) = (β2,β2) = 0, (βι,β2)= 1.Положим e\=ex+2e\ е2 = **~*2 . Тогда (βρ β[) = 1, (е'2, e'2) = — 1, (^, ^) = 0. Лемма доказана Базис {βι, е2} мы будем называть гиперболическим. Аналогично, в общем гиперболическом пространстве мы будем называть гиперболическим базис с матрицей Грама, состоящей из диагональных блоков (j 0)· 3. Лемма. Пусть L0 cz L — изотропное подпространство в невырожденном ортогональном пространстве L, {е\, ..., ет)—базис в L0. Тогда существуют такие векторы ev ..., e^Ei, что \еи е'{9 ..., em, e'm} образуют гиперболический базис своей линейной оболочки. Доказательство. Пусть L\ — линейная оболочка {е2, ... ..., ет}. Так как L\ строго меньше L0, то Li1 строго больше Lo* в силу невырожденности L. Пусть е{ е L\ \ Lor. Тогда (е'и е*) = 0 при /^2, но (е\у е{) φ 0. Можно считать, что (e'v β,) = 1, так что е" не пропорционален в\. Как в доказательстве леммы п. 2, положим (е\· е"\) е\ = е\— 2 е{. Тогда \ev e\y образуют гиперболический базис своей линейной оболочки. Ортогональное дополнение к ней невырождено и содержит изотропное подпространство, натянутое на {е2, ..., ет). К этой паре можно применить аналогичное рассуждение, и индукция по m дает требуемое. 4. Теорема (Витт). Пусть L — невырожденное конечномерное ортогональное пространство, U, L" aL — два его изометричных подпространства. Тогда любая изометрия f: U-+L" может быть продолжена до изометрии f: L-+L, совпадающей с f на V. Доказательство, Разберем последовательно несколько случаев. а) U = L" и оба пространства невырождены. Тогда L = = U Θ (U)λ и можно положить f = f 0 id(LM±· б) U Φ L", dim V = dim L" = 1, и оба пространства невырождены. Изометрию /': U-+L" можно продолжить до изометрии f": L' + L"-+L' + L'\ положив /"(0=П0 *ля /geL'> П0 = = (Г)"1(0 Для /eL". Если L'-\-L" невырождено, то f" продолжается до / по предыдущему случаю. Если U + L" вырождено, то ι за
ядро скалярного произведения на U + L" одномерно. Пусть е\ порождает это ядро, е2 порождает U. В ортогональном дополнении к е2 в L найдем такой вектор е\, что базис {ev е^ порождаемой этими векторами плоскости гиперболичен. Это возможно по лемме п. 3. Покажем, что подпространство L0, натянутое на{в,, е[, е2}, невырождено, и изометрия f: U -+L" продолжается до изометрии /: L0->L0. После этого можно будет применить случай а). Невырожденность следует из того, что {е2уе2)ф0, а матрица Грама векторов {ех, е[, е2} имеет вид (?; ;). V 0 0 (е2, е2) / Для продолжения f заметим сначала, что ортогональное дополнение к f (е2) в L0 двумерно, невырождено и содержит изотропный вектор е\. Поэтому оно является гиперболической плоскостью, так же как и ортогональное дополнение к е2 в Lo. По лемме п. 2, существует изометрия второй плоскости с первой. Ее прямая сумма с /' является искомым продолжением. в) dim V = dim L" > 1 и L\ L" невырождены. Проведем индукцию по dim V. Так как в U имеется ортогональный базис, существует разложение L = Li ® Li в ортогональную прямую сумму подпространств ненулевой размерности. Так как /'—изометрия, то £' —Li ф/,2, где Li = f (Li), и эта сумма ортогональна. По индуктивному предположению ограничение [' на Ц продолжается до изометрии /1: L-> L. Она переводит (Li)1 =э L2 в {L\)L гэ L2. Снова по индуктивному предположению существует изометрия (Li)1 с (l'\)l, которая на L2 совпадает с ограничением /'. Дополнив его ограничением f на Li, получим требуемое. г) L' вырождено. Мы сведем этот последний случай к уже разобранному. Пусть Lo с: L — ядро ограничения метрики на ΖΛ Выбрав ортонормированный базис в Z/, мы можем построить прямое разложение L =Li©Lo, где Ц невырождено. В ортогональном дополнении к L\ внутри L мы можем найти подпространство Lo такое, что сумма Lo φ L\ © Lo прямая и пространство LoQ)Lq гиперболично, как в лемме п._3; в частности, Lo©Li©Lo невырождено. Аналогично построим Lo®Li®Lo, исходя из пространства L". Очевидно, изометрия /': U-+L" продолжается до изометрии этих прямых сумм, ибо все гиперболические пространства одинаковой размерности изометричны. Возможность дальнейшего продолжения этой изометрии следует теперь из случая в). Теорема доказана. 5. Следствие. Пусть Lu L2— изометричные невырожденные пространства и L\, L2— их изометричные подпространства. Тогда ортогональные дополнения (l'i)1» (L2)1 к ним изометричны. 187
6. Следствие. Пусть L — невырожденное ортогональное пространство. Тогда любое изотропное подпространство L содержится в максимальном изотропном подпространстве, и для двух максимальных изотропных подпространств V, L" существует изометрия /: L-+L, переводящая U в L". Доказательство. Первое утверждение тривиально. Для доказательства второго допустим, что dim Z/ ^ dim L". Любая линейная инъекция /': U-+L" является изометрией Z/ с Im/'. Поэтому она продолжается до изометрии /: L-+L. Тогда L' czf-l(L") и /-1 (L") изотропно. Так как U максимально, dim U = dim /-1 (L") =* β dim L". 7. Следствие. Для любого ортогонального пространства L су- ществует ортогональное прямое разложение Lo θ Lh Θ Ld, где L0 изотропно, Lh гиперболично и Ld анизотропно. Для любых двух таких разложений существует изометрия f: L-+L, переводящая одно из них в другое. Доказательство. Возьмем в качестве L0 ядро скалярного произведения. Разложим L в прямую сумму Lq@ L\. В L\ возьмем максимальное изотропное подпространство и вложим его в гиперболическое подпространство удвоенной размерности Lh, как в лемме п. 3. В качестве Ld возьмем ортогональное дополнение к Lh в L\. Оно не содержит изотропных векторов, иначе такой вектор можно было бы добавить к исходному изотропному подпространству, которое не было бы максимальным. Это доказывает существование разложения требуемого вида. Наоборот, в любом таком разложении L0© Lh@*Ld пространство Lo является ядром. Далее, максимальное изотропное подпространство в Lh одновременно максимально изотропно в Lh θ Ld, поэтому размерность Lh определена однозначно. Значит, для двух разложений Lo®Ln®Ld и Lo®Lh@Ld существует изометрия, переводящая Lo в Lo, Lh в Lh- Она дополняется изометрией Ld в Ld по теореме Витта, что завершает доказательство. Назовем Ld анизотропной частью пространства L; она определена с точностью до изометрии. Это следствие есть обобщение принципа инерции на произвольные поля скаляров, сводящее классификацию ортогональных пространств к классификации анизотропных пространств или, на языке квадратичных форм, к классификации форм, не представляющих нуля, для которых из q (/) = 0 следует, что 1 = 0. 8. Группа. Витта. Пусть Ж — поле скаляров. Обозначим через W(X) множество классов анизотропных ортогональных пространств над Ж (с точностью до изометрии), дополненное классом нулевого пространства. Введем на W(X) следующую операцию сложения: если Lb L2 —два анизотропных пространства, [Li], ![L2] —их классы в W(X), то [Li] + [U] — класс анизотропной части L\ θ L2 (справа стоит ортогональная внешняя прямая сумма). Нетрудно убедиться, что определение корректно. Далее, эта операция сложения ассоциативна, и класс нулевого пространства служит нулем в W(X\. Более того, имеет место 188
θ. Теорема, а) Ψ pi?) с введенной операцией сложения является абелевой группой, называемой группой Витта поля Ж. б) Пусть La означает одномерное координатное пространство над Ж со скалярным произведением аху, а^Ж\{0}. Тогда [La] зависит только от смежного класса а(Ж*)2у и элементы [La] составляют систему образующих группы №(Ж). Доказательство. Нам осталось убедиться, что у каждого элемента №(Ji?) существует обратный. Действительно, пусть L — анизотропное пространство с метрикой, которая в ортогональном η базисе {ей ..., еп} задана формой £ а.х2.. Обозначим через L про- п странство L с метрикой — J] а{х\ и покажем, что L Θ L гипер- болично, так что [L] + [£] = [0] в №(Ж). Действительно, метрика η в L Θ L задана формой Σ αι {Α — У])· Но плоскость с метрикой а(х2 — у2), очевидно, гиперболична, ибо форма невырождена, а вектор (1,1) изотропен. То, что [La] зависит лишь от а (Ж*)2, было проверено в п. 7 § 2. Кроме того, каждое я-мерное ортогональное пространство разлагается в прямую ортогональную сумму одномерных пространств вида La- Это завершает Доказательство. § 15. Алгебры Клиффорда 1. Алгеброй над полем Ж мы будем называть ассоциативное кольцо с единицей Л, содержащее поле Ж и такое, что Ж лежит в центре Л, т. е. коммутирует со всеми элементами А. В частности, А является Jif-линейным пространством. Рассмотрим конечномерное ортогональное пространство L с метрикой g. В этом параграфе мы построим такую алгебру C(L) и «Ж'-линейное вложение р: L-+C(L), что для любого элемента / е L будет выполнено соотношение P(l)2 = g(l> /)·1. т. е. скалярный квадрат каждого вектора из L будет реализован как его квадрат в смысле умножения в C(L). Кроме того, элементы p(L) будут мультипликативными образующими C(L), т. е. любой элемент из C(L) окажется представимым в виде линейной комбинации (некоммутативных) одночленов от элементов p(L). Алгебра C(L) (вместе с отображением р) с такими свойствами будет называться алгеброй Клиффорда пространства L. 2. Теорема, а) Для всякого конечномерного ортогонального пространства L алгебра Клиффорда C(L) существует и имеет размерность 2п над Ж, где η = dim L. б) Пусть σ: L-+D — любое Ж-линейное отображение L в Ж-алгебру D, для которого σ(/)2 = g(l, I) · 1 для всех /е L. Тогда существ!/ет единственный гомоморфизм Ж-алгебр τ: C(L)-+D 189
такой, чтоt σ = τ©р. В частности, C(L) определена однозначно с точностью до изоморфизма. Доказательство, а) Выберем в L ортогональный базис {ей ..., еп}> (βι9βί) = αι. По определению, в C(L) должны выполняться соотношения ρ (etf = ah ρ (ei) ρ {ej) = — ρ {et) ρ (et), i φ j. Второе из них следует из того, что [р (е* + £/) ]2 = ρ (βι)2 + + P(ei)p(ef) + p(ei)p(ei) + p(ej)2 = p(ei)2 + p(ej)2. Разложив эле- менты /ι, ..., lm eL по базису {ei} и пользуясь тем, что умножение в L Jif-линейно по каждому из сомножителей (это следует из того, что Ж лежит в центре), мы можем представить любое произведение ρ (/ι) ... p(/m) в виде линейной комбинации одночленов относительно ρ (е{). Заменив ρ (β/)2 на α, и ρ (β*) ρ (β/) при i> j на —P(*/)'p(*j)i мы можем привести любой одночлен к виду αρ (β;,)... ...р(е*ш), где aeJif, ιΊ.<ί2< ... < im. Дальнейших соотношений между такими выражениями не видно; одночленов р^)... ... ρ (e*m) имеется 2m (включая тривиальный одночлен 1 при m = 0). План доказательства состоит в том, чтобы сделать строгими эти наводящие соображения, действуя более формально. С этой целью для каждого подмножества Scz{l, ..., η} введем символ es (который впоследствии окажется равным ρ(eix)... ...p(etm), если S={iu ..., im}, i\ < ... <im)\ положим также e0== l (0 — пустое подмножество)! Обозначим через C(L) Ж-ли- нейное пространство с базисом {es}. Определим умножение в C(L) следующим образом. Если 1 ^ s, t ^ и, положим ( 1 ПрИ S^f, {St t] = X - 1 при s > U Для двух подмножеств S, Гс{1, ..., п) положим a(S, Л=П(5, t) Π "ι, se=S i&S(\T t&T где, напомним, a, = g(ei,e{). Пустые произведения считаются равными единице. Наконец, произведение линейных комбинаций Σ ases> Σ bTeT e C(L); as>bT e Жу определим формулой ( Σ ases) ( Σ bTeT) — Σ asbT <*(5, Τ) *5Vr> где SVr = (S U Л \ (S Π Л — симметрическая разность множеств S, Г. Все аксиомы «Ж*-алгебры проверяются тривиально, за исключением ассоциативности. Ассоциативность достаточно проверить на элементах базиса, т. е. установить тождество (eseT)eR = es(eTeR). 190
Поскольку eseT = a(S, T)esVr, имеем (eseT)eR = a(S, T)a(SvT, #)e<sVr)V*> es (eTeR) = a (S, TvR) a (T, R) esV<rV*)· Нетрудно проверить, что (Svr)V# = SV(7V#) = = {(5и7,и^)\[(5ПЛи(5П/?)и(7,П/?)]}и(5П7'ПЛ). Поэтому остается убедиться лишь в совпадении скалярных коэффициентов. Часть a(S, T)a(SW T,R), относящаяся к знакам, имеет вид Π (s, О Π >, г). Заставив во втором произведении и пробегать сначала все элементы S, а затем все элементы Τ (при фиксированном г), мы введем сомножители (а, г)2, и ε S f| t равные единице, так что этот «знак» можно записать в симметрическом по S, Г, R виде Π (s, t) П (и, г) Π («, г). ssS «€=S иеГ feT r€=tf ге/? Аналогично с тем же результатом преобразуется знак, относящийся к a(S, Τ ν/?)α(Γ, /?). Остается разобрать множители, в которые входят скалярные квадраты щ. Для a(SyT)a(SV T,R) они имеют вид Π Αι Π А/. Ho (SVr)n/?=(5n/?)V(rn/?), a S П ^ с этим множеством не пересекается, и (Sf| OU [(S Π ^?) V(ГΠ /?)] состоит из тех элементов SU^U#> которые содержатся более чем в одном из этих трех множеств. Поэтому наш множитель симметрично зависит от S, Г,/?. Аналогично с тем же результатом вычисляется нужная нам часть коэффициента a(S, Τ V R)a(T, R). Это завершает доказательство ассоциативности алгебрыС(£). Определим, наконец, Jif-линейное отображение р: L-+C(L) условием p(ei)=e{i}. Согласно формулам умножения <?0 является единицей в C(L), и з0 при / = /, пе{{) при / Φ ]. Поэтому (р, C(L)) есть алгебра Клиффорда для L. б) Последнее утверждение доказывается формально. Пусть a: L->D — Jif-линейное отображение с σ(/)2 = g(ly /)·1. Существует единственное Jif-линейное отображение τ: C(L)-+D, которое на элементах базиса es определено формулой τ(^ι-'«))-σΚ)···σ(β'«)· τ(*0)=10· 191 ( aie0 p(«i)p(*/)-W«>-|_* β
Для него τορ = σ, ибо это так на элементах базиса L. Наконец, τ является гомоморфизмом алгебр. Действительно, x(eseT) = x(a(S9 7>Svr) = a(S, T)x(eSVT), и нетрудно проверить, что T(es)x(eT) можно привести к тому же виду, пользуясь соотношениями <j(ei)2 = ah σ (βι) a (ef) = — σ (ef) σ (et) при ίφ]'. Это завершает доказательство. 3. Примеры, а) Пусть L — двумерная вещественная плоскость с метрикой — (х2 + у2). Алгебра Клиффорда C(L) имеет базис (1,*ι, *2, *ιέ2) с мультипликативными соотношениями Нетрудно убедиться, что отображение C(L)-*H: 1ι—> 1, βι»—>i, 02»—Η, ^1^2'—>k определяет изоморфизм C(L) с алгеброй кватернионов Н. б) Пусть L — линейное пространство с нулевой метрикой. Алгебра C(L) порождена образующими {е\, ..., еп) с соотношениями е2 = 0, eie/= — ejei при ιΦ\. Она называется внешней алгеброй, или алгеброй Грассмана, линейного пространства L. Мы еще вернемся к ней в части 4. в) Пусть L = ^c—комплексифицированное пространство з Минковского с метрикой xi — J] #; относительно ортонормирован- ного базиса {et} в ΛΓ, являющегося одновременно базисом Jt°. Покажем, что алгебра Клиффорда С (J(c) изоморфна алгебре комплексных 4Х4-матриц. С этой целью рассмотрим матрицы Дирака, записываемые в блочном виде: Пользуясь свойствами матриц Паули σ/, нетрудно убедиться, что V/ удовлетворяют тем же соотношениям в алгебре матриц М4(С) что и ρ (ej) в алгебре С{ЖС)\ Υο=-Ύι = -Ύ2=-Υ3=1 (т. е. £4); YiV/ + V/Vi = 0 при ί φ /. Значит, С-линейное отображение σ: ЛГС->М4(С) индуцирует гомоморфизм алгебр τ: С(^с)-> -*Ai4(C), для которого τ·ρ(£/) = ν/. Непосредственным вычислением можно проверить, что отображение τ сюръективно, а так как обе С-алгебры С(Жс)и М4(С) шестнадцатимерны, τ является изоморфизмом.
Часть 3. АФФИННАЯ И ПРОЕКТИВНАЯ ГЕОМЕТРИЯ § 1. Аффинные пространства, аффинные отображения и аффинные координаты 1. Определение. Аффинным пространством над полем X называется тройка (A,Lf +), состоящая из линейного пространства L над полем Ж, множества Л, элементы которого называются точками, и внешней бинарной операции "Л XL-»·Л: (а, /)·—► a + /, удовлетворяющей следующим аксиомам: а) (а + 0+ m "** а + 0 + т) для всех α θ Л; /, mm L; б\ а + 0=«а для всех а&А; в) для любых двух точек а,Ь ψ А существует единственный вектор 1& L со свойством Ь —» а + I. 2. Пример. Тройка (X, L,+), где L — линейное пространство, а + совпадает со сложением в L, является аффинным пространством. Удобно говорить, что она задает аффинную структуру линейного пространства L. Этот пример типичен; позже мы увидим, что всякое аффинное пространство изоморфно такому. 3. Термины. Мы часто будем называть аффинным пространством пару (A,L) или даже просто Л, опуская указания на +· Линейное пространство L называется ассоциированным с аффинным пространством Л. Отображение А-+А: а*->а-\-1 называется сдвигом на вектор /; удобно иметь для него специальное обозначение U. Мы пишем а—1 вместо t~i{a) или a + (—t). 4. Предложение. Отображение /■—^ ί/ определяет цнъективный гомоморфизм аддитивной группы пространства L в группу пере- становок точек аффинного пространства А, т. е. эффективное действие L на Л. Это действие транзитивно, т. е. для любой пары точек, а, Ь&А существует /eL с ti(a) = b. Наоборот, задание транзитивного эффективного действия аддитивной группы L на множестве А определяет на А структуру аффинного пространства с ассоциированным пространством L. Доказательство. Из аксиом а) и б) следует, что при любых /eL и а е Л уравнение ti(x) = а имеет решение χ = == α+(—/), так что все U сюръективны. Если U{a)=ti(b), то, найдя по аксиоме в) такой вектор m^Ly что b = a-\- m, получаем а 4- / = (а + т) + I = (а + I) + т. Но а + I = (а + I) + 0, поэтому из условия единственности аксиомы в) следует, что т = 0, так что а = Ь. Поэтому все U инъективны. !$3
Аксиома а) означает, что tmoti = ti+m, а аксиома б)—что fo = id^i- Поэтому отображение /ь—>U является гомоморфизмом аддитивной группы L в группу биекций Л с самим собой. Его ядро равно нулю в силу аксиом б) и в). Наоборот, пусть £ХЛ->Л: (/, а)\—> а + / — эффективное транзитивное действие L на Л. Тогда аксиомы а) и б) получаются прямо из определения действия, а аксиома в) — из соединения свойств эффективности и транзитивности. 5. Замечание. По поводу действия групп (не обязательно абе- левых) на множествах см. § 2 главы 7 «Введения в алгебру». Множество, на котором группа действует транзитивно и эффективно, называется главным однородным пространством над этой Группой. Отметим, что в аксиомах аффинного пространства не фигурирует явно структура умножения на скаляры в L. Она появляется лишь в определении аффинных отображений и затем барицентрических комбинаций точек Л. Но прежде несколько слов о формализме. 6. Правила вычислений. Тот единственный вектор / е L, для которого Ь = а + /, удобно обозначать Ь — а. Эта -операция «внешнего вычитания» Ay^A-^L: (&, а)у—>b— а обладает следующими Свойствами: а) (с — b) + (b — а)=с — а для всех а, Ь9 се Л; сложение слева — это сложение в L. Действительно, пусть с = Ь + /, Ь =» а + гп\ тогда с =*= р=а+(/ + т), так что с — а = / + m = (с — Ь) + (Ь — а). б) а — а = 0 для всех а&А. в) (a + l) — (b + m) = (a — b) + (l — m) для всех а,Ь^А, /,me L. В самом деле, достаточно проверить, что (b + m)+(a— b) + *{-(l — m) = a + /, или b + (a — b) = а, а это — определение а — b. Вообще, употребление знаков ± для различных операций LXL-+-L, ЛХ£->-£, АУ^А-^L подчиняется следующим формальным правилам. Выражение ±а\ ± a2 ± ... ±aw + /iH- ... ... + ln для aj&A, Ik&L имеет смысл, если либо m четно и все d=a/ можно объединить в пары вида а,· —0/, либо m нечетно, и все точки можно объединить в такие пары, кроме одной, входящей со знаком -f. В первом случае вся сумма лежит в L, во втором — >в Л. Кроме того, она зависит от своих слагаемых коммутативно и ассоциативно: например, а\ — а2 + / можно вычислять как (αϊ — а2)+ I или (αϊ + 0— «2 или αϊ —(α2 — /); мы позволим себе писать a -f- /, так же как / + а. Доказывать это правило в общем виде мы не станем. Всякий раз, когда мы будем им пользоваться, читатель без труда разобьет нужную выкладку на серию элементарных шагов, каждый из которых сведется к применению одной аксиомы или формулы а)—в) начала этого пункта. Заметим, что сумма a-f &, где a, b e Л, вообще говоря, смысла не имеет, так же как и выражение ха, где х&Ж (исключение: 194
A = L). Тем не менее ниже мы придадим однозначный смысл, например, выражению γ а + -jb (но не его слагаемым!). Интуитивно аффинное пространство (A,L, +) следует представлять себе как линейное пространство L с «забытым» началом координат 0. Оставлена лишь операция сдвига на векторы L, суммирования сдвигов и умножения вектора сдвига на скаляр. 7. Аффинные отображения. Пусть (AuL\), (Л2, L2)— два аффинных пространства над одним и тем же полем Ж, Аффинко 'линейным, или просто аффинным, отображением первого во второе называется пара (/,£>/), где /: А\-+А2, Df: L\-+L2, удовлетворяющая следующим условиям: а) Df— линейное отображение. б) Для любых αϊ, а2^А имеем4 / (ах) -/(α2) = Dffa-ъ). (Оба выражения лежат в L2.) Df (или D(f)) называется линейной частью аффинного отображения /. Поскольку αϊ — α2 пробегает все векторы L\, когда аь а2е^, линейная часть Df определяется по / однозначно. Это позволяет обозначать аффинные отображения просто /: Л1->Л2. 8. Примеры, а) Любое линейное отображение /: L\-+L2 индуцирует аффинно линейное отображение пространств (Lu Lb +)-> ->(L2, L2, +). Для него Df = /. б) Любой сдвиг U: А-+А аффинно линеен и D(^) = idz.. Действительно, U Ы — U (ог) = (а{ + 1) — (а2 + I) = а{ — а^. в) Если /: Л1-*-Л2 — аффинно линейное отображение и /eL2, то отображение tiof; AX-*A2 аффинно линейно, и D(ti°f) = D(f). В самом деле, //ο/(α1)~//ο/(α2)=(/(α1) + /)~(/(α2) + /)=/(α1)-/(α2) = β/(α1~α2). г) Аффинно линейная функция f: А-+Ж определяется как аффинно линейное отображение А в (Ж1,Ж\+), где Ж1 — одномерное координатное пространство. Таким образом, / принимает значения в Ж, a Df есть линейный функционал на L. Любая постоянная функция / аффинно линейна: D/ = 0. 9. Теорема, а) Аффинные пространства вместе с аффинными отображениями образуют категорию, б) Отображение, ставящее в соответствие аффинному пространству (A,L) линейное пространство L, α аффинному отображению f: (j4i,Li)->(j42, L2) линейное отображение Df: L\-+L2, является функтором из категории аффинных пространств в категорию линейных пространств. Доказательство. Справедливость общекатегорных аксиом (см. § 13 ч. 1) вытекает из следующих фактов. Тождественное отображение id: А-+А аффинно. Действительно, αϊ — a2 = idz,(ai — a2). В частности, D(id^) = idL· 195
Композиция аффинных отображений А—>А—>А является аффинным отображением. В самом деле, пусть а, Ь&А. Тогда fi(a) — fi(b) = Df\(a— Ь) и далее Ух (а) - tJx (Ь) = Df2 [f{ (а) - fx (b)] = Df2° Dfx (а - b). Мы доказали требуемое и заодно получили, что D(f2f\)** = Df2°Df\. Вместе с формулой ZD(id^ )=s id/, это доказывает утверждение б) теоремы. Следующий важный результат характеризует изоморфизмы в нашей категории. 10. Предложение. Следующие три свойства аффинного отображения f: А\-+А2 равносильны: а) / — изоморфизм; б) Df— изоморфизм; в) f — биекция в теоретико-множественном смысле. Доказательство. Согласно общекатегорному определению f: Ах-+А2 есть изоморфизм тогда и только тогда, когда имеется такое аффинное отображение g: Л2->ЛЬ что gf = HAif fg = ldA2. Если оно существует, то D(fg) = idL2 = D(f)D(g) и &(#/) = Idr.,*» = £)(g)D(/), откуда следует, что D(f) — изоморфизм. Покажем теперь, что Df— изоморфизм тогда и только тогда, когда f — биекция. Фиксируем точку αχ^Αχ и положим α2 = /(αι). Любой элемент Αι однозначно представляется в виде αι + //, At e L/, i = 1, 2. Из основного тождества / (fli + U) - / (αϊ) = Df [(а{ + l{) - fll] = Df (/,) следует, что f(a\ + /i)= a2-\-Df(h). Следовательно, f—биекция тогда и только тогда, когда Df(l\) при l\^L{ пробегает все элементы L2 по одному разу, т. е. Df является биекцией. Но линейное отображение есть биекция тогда и только тогда, когда оно обратимо, т. е. является изоморфизмом. Наконец, покажем, что биективное аффинное отображение является аффинным изоморфизмом. Для этого следует проверить, что обратное к / теоретико-множественное отображение аффинно. Но в обозначениях предыдущего абзаца это отображение определяется формулой rl(02+k) — al + (Df)'l(tu. Ь«1* Поэтому Г1 (02 + Ь) - Г1 (а2 + й) - (Dfy1 (h) - (Df)'1 (й) - (Dfyl (h - Й) в. силу линейности (Df)"1. Итак, f-1 аффинно и D(hl) = D(f)~l. Окончательно, мы установили импликации а) =ф-6)^=^в) *=>- а, откуда и следует предложение. Конструкция конкретных аффинных отображений часто основывается на следующем результате. 1*6
11. Предложение. Пусть (Ait Z,J, \А2> L2)—dea аффинных пространства. Для любой пары точек а\^А\, а2^А2 и любого линейного отображения g: L\-+L2 существует единственное аффинное отображение f: A\-+A2 с f(a\)= a2 и Df = g. В самом деле, положим f(fll+/l)-02+i(/l) для h^Lu Поскольку любая точка Αχ однозначно представляется в виде «ι + /ь эта формула определяет теоретико-множественное отображение /: А\-+А2. Оно аффинное, f(a\)=a2 и Df = g, потому что /(«1+Μ-/(β. + 0-*(Μ-*('ί)-*(ίι-ίί)- Это доказывает существование f. Наоборот, если / — отображение с требуемыми свойствами, то f(al + l)-f(al) = g(l), откуда f (αϊ + /) = а2 + g(l) для всех / е L. 12. Важный частный случай предложения п. 11 получается, если применить его к (Л, L), (L, L), а<=Л, OgL и g =■ idb Мы получим, что для любой точки а^А существует единственный аффинный изоморфизм f: A-+L, переводящий эту точку в начало координат, с тождественной линейной частью. Это и есть точный смысл представления о том, что аффинное пространство есть «линейное пространство с забытым началом координат». В частности, аффинные пространства изоморфны тогда и только тогда, когда изоморфны ассоциированные линейные пространства. Последние классифицируются своей размерностью, и мы можем назвать размерностью аффинного пространства размерность соответствующего линейного пространства. 13. Следствие. Пусть fu f2: Αχ-+Α2 — два аффинных отображения. Их линейные части совпадают тогда и только тогда, когда f2 есть композиция f\ со сдвигом на некоторый вектор из L2, который определяется однозначно. Доказательство. Достаточность условия была проверена в примере в) п. 8. Для доказательства необходимости выберем любую точку αε/Ιι и положим f2 — tf2{a)-u(a)0f\· Очевидно, f'2(a) = — f2(a) и D(f'2) = D(f2y По предложению п. 11 f2 = f2. Наоборот, если f2 = ti°f\, то / = f2(a)— /ι(α); этот вектор не зависит от аеЛ из-за совпадения линейных частей f\, f2. 14. Аффинные координаты, а) Система аффинных координат в аффинном пространстве (Л, L) есть пара, состоящая из точки а0^А (начала координат) и базиса {еи ·.·, еп} ассоциированного линейного пространства L. Координаты точки αε^ в этой системе образуют вектор (хи ..., хп\&Хп9 однозначно определяе- п мый условием α = θο+ Σ xiet* 197
Иначе говоря, отождествим А с L посредством отображения с тождественной линейной частью, переводящего а0 в 0, и возьмем координаты образа точки а в базисе {еи ..., еп): это и будут *1, ...,.Χη. Пусть в пространствах Αι, Л2 выбраны системы координат, отождествляющие их с Жт, Жп соответственно. Тогда любое аф- финно линейное отображение /: Л1->Л2 можно записать в виде f(x) = Bx + yt где В— матрица отображения Df в соответствующих базисах L\t ^2» а У"" координаты вектора /(αό)"""~αυ' Β базисе L2; α^~ начало координат в A[t α" — начало координат в Л2. Действительно, отображение χ t—> Вх + у аффинно линейно, переводит а{ в /(а^) и имеет ту же линейную часть, что и f. б) Другой вариант данного определения системы координат состоит в том, чтобы заменить векторы {ей ..., еп) точками {яо + е\9 ..., ао + еп) в А. Положим щ = ао + ей ί = 1 л. Координаты точки аеЛ находятся тогда из представления я = Яо + Σ χι (ai ~~ αο)· Возникает соблазн «привести подобные члены» и написать выражение справа в виде ί 1 — Σ xi) βυ+ η + Σ *iaf Отдельные члены в этой сумме не имеют смысла! Тем не менее оказывается, что суммы такого вида можно рассматривать, и они весьма полезны. 15. Предложение. Пусть ас, ..., as— любые точки аффинного 8 пространства Л. Для любых у0, ..., ys^X с условием Σ#ί = 1 определим формальную сумму Σ Viat выражением вида 8 8 YJyiai = a + Σί/ί(«ί — а), где а — любая точка А. Утверждается, что выражение справа не S зависит от я. Поэтому точка Σ У1а1 определена корректно. Она называется барицентрической комбинацией точек ао, ..., as с коэффициентами уо, ..., ys. Доказательство. Заменим точку а на точку а + /, /eL, Получим s s *-ύ ί-ϋ 198
ибо ( 1 — Σί/ί)/=0. Мы пользовались здесь правилами, сформулированными в п. 6. Читателю будет полезно провести эту выкладку подробно. 16. Следствие. Система {а0; а,\ — а0у ..., ап — а0), состоящая из точки а0^А и векторов ai — a0 в L, образует систему аффинных координат в А тогда и только тогда, когда любая точка А однозначно представима в виде барицентрической комбинации η η Σ *ιαι> ^(Sl, Σ**-1· Когда это условие выполнено, система точек {а0, ..., я*} называется барицентрической системой координат в Л, а числа лго, ... η ..., Хп—барицентрическими координатами точки Σ *ιαι· Доказательство. Все непосредственно следует из опреде- п η лений, если вычислять Σ χιαι по формуле а0 + Σ xt (α* ~~ αο)· Действительно, так как любая точка А однозначно представляется в виде ao + l, 1&L, система {а0, αχ — αο, ..., ап—а0} является аффинной системой координат в А тогда и только тогда, когда всякий вектор /ei однозначно представляется в виде линейной η комбинации Σ*ί(α* — ао)> т· е· если {а\ — ао> ···» <*п—Яо} обра* зуют базис L. По координатам хи ..., хп вектора I барицентрические координаты точки а0 + / восстанавливаются однозначно в η виде 1 — Σ *i = *о> Хи · · ·» χη- 17. С барицентрическими комбинациями можно во многом обращаться так же, как с обычными линейными комбинациями в линейном пространстве. Например, слагаемые с нулевыми коэффициентами можно выбрасывать. Наиболее полезное замечание состоит в том, что барицентрическая комбинация нескольких барицентрических комбинаций точек а0, ..., as в свою очередь является барицентрической комбинацией этих точек, коэффициенты которой можно вычислять по ожидаемому формальному правилу! s s s s / m \ Х\ УлУпШ + Χ2Σ УКЫ + ··· +Xm Σ yimai^ Σ ί Σ **#**) 01·" Действительно, s m m s m так что последняя комбинация барицентрична. Вычисляя левую и правую части этого равенства по правилу, сформулированному в предложении п. 15, с помощью одной и той же точки а^А й применяя формализм п, 6, легко получим, что они совпадают. 194
Наконец, барицентрические комбинации ведут себя как линейные комбинации относительно аффинных отображений. 18. Предложение, а) Пусть /: Αγ-*·Α2 — аффинное отображение и α0, ..., а8&А\. Тогда ί\£0χ*α*) = %>χό(αΑ9 если Σ Χι = 1. б) Пусть α0, ..., βη задают барицентрическую систему координат в Ль Тогда для любых точек b0l ..., Ьп^Ач существует единственное аффинное отображение f, переводящее αι в &,·, I = — 1, ..., п. Доказательство. Выбрав а е Ль получим /(go^^) = f (« + ^Σ^^ — α)) = / (α) +/)/ (^^(α, —α)^) = - f (α) + g **£>/ to " β) - f (a) + |l0 ** (f (<h)-f (a)) - g *if (fli) по предложению п. 15, что доказывает утверждение а). Если а0, ·. · > а>п образуют барицентрическую систему координат в Ль то по следствию п. 16 всякая точка Л представляется η единственной барицентрической комбинацией У лзд. Определим тогда теоретико-множественное отображение f: А[-*-А2 формулой Μ Σ χιαι)= Σ xtbf В СИЛУ а) эт0 единственное возможное определение, и нужно лишь проверить, что f—аффинное отображение. Действительно, вычисляя, как в предложении и. 15, получаем / п \ / п \ п п п f (^Σο xiai) — f уg УМ) = g *ibi — J yih = b0 + g *, (&, — 60) — — \bQ rf fyt(bt ~ fto) J <= .Σ (*/ - λ)(*ι —*o)=^f (j^i —gyiflij» где £)/: L\-+L<i — линейное отображение, переводящее αι — α0 в 6/ — bo для всех ί=1, ..., /г. Оно существует, ибо а{ — а0, ... ..., ап — «о по предположению образуют базис L\. 19. Замечания. В аффинном пространстве Rrt барицентрическая m комбинация V—at представляет положение «центра масс» си- ♦ ί=ι стемы единичных масс, помещенных в точках а,·. Этим объясняется терминология. Если а/ = (0, ..., 1, ..., 0) (единица на ί-м месте), то множество точек с барицентрическими координатами х\ хп, O^JCi^l, составляет пересечение линейного многого
образия Σ л:^ = 1 с положительным октантом (точнее, «2*-тантом»у. В топологии это множество называется стандартным (п—^-мерным симплексом. Одномерный симплекс — это отрезок прямой, двумерный — треугольник, трехмерный — тетраэдр. Вообще, множество < Σ χιαί Σ xt==I 1> 0 ^ xi ^ 11 есть замкнутый симплекс с вершинами αϊ, ..., αη в вещественном аффинном пространстве. Он называется вырожденным, если векторы а% — αϊ, ..., ап — αϊ линейно зависимы. § 2. Аффинные группы 1. Пусть А— аффинное пространство над полем Ж. Множество аффинных биективных отображений /: А-+А в силу предложения п. 10 § 1 образует группу, которую мгы будем называть аффинной группой и обозначать AHA. ♦ Ее отображение D: AfM->GL(L), где GL(L)— группа линейных автоморфизмов ассоциированного векторного пространства, является гомоморфизмом. Он сюръективен по предложению п. 11 § 1 и имеет своим ядром группу сдвигов {U\l&L} по следствию п. 13 § 1. Эта группа сдвигов изоморфна аддитивной группе пространства L по предложению п. 4 § 1. Таким образом, Aff А есть расширение группы GL(L) с помощью аддитивной группы L, которая является нормальным делителем в Aff Л. Это расширение является полупрямым произведением GL(L) и L. Чтобы убедиться в этом, фиксируем любую точку α е А и рассмотрим подгруппу GaczAfM, состоящую и? отображений, оставляющих α на месте. По предложению и. И § 1 каждый элемент f^Oa однозначно определяется своей линейной частью D/, и Df можно выбирать как угодно. Следовательно, D индуцирует изоморфизм Ga с GL(L). Для любого отображения feAfM можно найти единственное отображение fa e Оа с той же линейной частью, и f = ti°fa для подходящего /eL по следствию п. 13 § 1. Фиксировав а, будем записывать tt°fa в виде пары [#;'/], где g = Df = Dfa^GL(L). Правила умножения в группе Aff Л на языке таких пар имеют следующий вид. 2. Предложение. Имеем Ш l\] \g* У = [ё\ёь gi (k) + h], [g;i]-l = [g-u> -g-l№ Доказательство. Согласно определениям [g; l] переводит точку а + fn e А в a + g(m) -f- /, откуда [gi; h] [g2\ h] (a + m) = \gx\ lx] (a + gi (m) + /,) = ■= a + gi (g2(m) + h) + h = a + gtg2 (m) + g{ (l2) + Λ — -= [gig* gi Cs) + /il (a + «). 201
что доказывает первую формулу. Вычисляя с ее помощью произведение [g; I] [g~l; — g~l(l)], получаем [idz,; 0]; а эта пара представляет тождественный элемент Aff Л. Это завершает доказательство предложения и показывает, что Aff Л — полупрямое произведение. 3. Пусть теперь Gc=GL(L) — некоторая подгруппа. Множество всех элементов feAff Л, линейные части которых принадлежат G, очевидно, образуют подгруппу в Aff Л — прообраз G относительно канонического гомоморфизма AfM->GL(L). Мы будем называть ее аффинным расширением группы G. Особенно важен случай, когда ассоциированное с Л линейное пространство снабжено дополнительной структурой — скалярным произведением, a G представляет собой соответствующую группу изометрий. Так строятся две важные в приложениях группы: группа движений аффинного евклидова пространства (G = 0(fl)) и группа Пуанкаре (L — пространство Минковского, G — группа Лоренца). Изучим подробнее группу движений. 4. Определение, а) Аффинным евклидовым пространством называется пара, состоящая из аффинного конечномерного пространства А над полем вещественных чисел и метрики d на нем (в смысле определения п. 1 § 10 ч. 1), которая обладает следующим свойством: для любых точек а, Ь^А расстояние d(a, b) за- висит только от а — 6eL и совпадает с длиной вектора а — Ь в подходящей евклидовой метрике пространства L (не зависящей от а, Ь). б) Движением аффинного евклидова пространства А называется произвольное отображение f: А-+А, сохраняющее расстояния: d(/(a), f(b)) = d(ay b) для всех а, 6еА ,5. Теорема. Движения аффинного евклидова пространства А образуют группу, совпадающую с аффинным расширением группы ортогональных изометрий O(L) ассоциированного с А евклидова пространства L. Доказательство. Проверим сначала, что любое аффинное отображение /: А-+А с D/eO(L) является движением. В самом деле, согласно определениям d{f(a), f(b)) = \f(a)-f(b)\ = \Df(a-b)\ = \a-b\ = d(a, ft); в третьем равенстве мы воспользовались тем, что DfeO(L). Основная работа связана с доказательством обратного утверждения. Прежде всего, очевидно, что композиция движений есть движение. Далее, мы уже установили, что сдвиги являются движениями. Пусть а&А — произвольная фиксированная точка, / — движение. Положим g = ta-f(a) ° /. Это движение, оставляющее точку а на месте. ДостаФочно Доказать, что ойо аффинное и что DgeO(L). Отождествим Л с L, как в п. 12 § 1, с помощью отображения с тождественной линейной частью, переводящего а в 0 е L. Тогда g превратится в отображение g: L-+L со свойствами g(0) = 0 и \g0) — S(m) l = U~ m\ Для всех U m^L, и достаточно установить что такое отображение лежит в O(L). 202
Проверим прежде всего, что g сохраняет скалярные произведения. Действительно, для любых /, m e L \l?-2(ltm) + \m? = \l-m\2 = \g(l)-g(m)\2 = = \g(l)\2-2(g(0, i(m)) + lff(m)p. откуда следует требуемое, ибо \g{l) |2 = |/|2, \g(m) |2= |m|2. Теперь покажем, что g аддитивно: g(l + m) = g(l) + g(m). Положив I + /я = η и воспользовавшись предыдущим свойством, имеем 0 = | η - / - т |2 = | д |2 +1 /12 +1 т |2 - 2 (п, /) - 2 (я, т) + 2 (/, т) = = 1г(я)12 + |^(/)|2 + 1гЫР-2(я(п), г(/))-2(вг(л)>г(т)) + + 2 (*(/). £(m)) = |g(n)-g(/)--gr(m)p, откуда g (η) = g'(/) + g (m). Наконец, покажем, что £(*/) = *£(/) для всех xgR, /eL Полагая m = xlt имеем 0 = \m-xl\2 = \m\2-2x(m, /)+**|/р = = \g(m)\2-2x(g(m)t g(l)) + x2\g(l)\2 = \g(m)-xg(l)?. Итак, g— линейное отображение, сохраняющее скалярные произведения, т. е. gEO(L). Теорема доказана. 6. Теорема. Пусть f: А-+А — движение евклидова аффинного пространства с линейной частью Df. Тогда существует такой век- тор I e L, что Df(l)= l и f = ti°g, где g: A-+A — движение, имеющее неподвижную точку а^А. Доказательство. Прежде всего, выясним геометрический смысл этого утверждения. Отождествив А с L посредством аффинного отображения с тождественной линейной частью, которое переводит α в 0, мы получаем, что f является композицией ортогонального преобразования g и сдвига на вектор /, неподвижный относительно g» (ибо Df = Dg). Иными словами, это «винтовое движение», если detg = l, или винтовое движение, скомбинированное с отражением, если detg =—1. В самом деле, g вполне определяется своим ограничением go на/1 : g = g0©iclRb так что g есть вращение вокруг оси R/ (возможно, с отражением). Приступим теперь к доказательству. Положим L2 = Ker(Z)f — — idz,), Li = Li- Имеем L = L} Θ L2; ^состоит из Df-инвариант- ных векторов, пространство L\ инвариантно относительно Df— \dL (ибо Df ортогонален), и ограничение Df — idi на L\ обратимо. Выберем сначала произвольную точку а'^А и положим g'e/a'-f.a'i© f. Очевидно, g'{a')=a'. Положим f(a') — a'= = /ι + /2, где /i^Li, k^L2) тогда f = ti2ofllogf и Df(l2) = h no определению. Покажем, что g = tuog' имеет неподвижную точку а = а' + m для некоторого m ^ L\. Имеем tu°g'(a' + m) = g'(a' + m) + l]=af + Df (m) + lx. Правам часть равна α' + m тогда и только тогда, когда 803
(Df — idL)m+ l\ = 0. Но, как мы уже отмечали, на L\ оператор Df— idz, обратим и /i^Li. Поэтому т существует. Мы получили требуемое разложение f = ti2og и завершили доказательство. Движения / со свойством det/)/= 1 называются иногда собственными движениями, а остальные (с det Df ——1) — несобственными. Представим более наглядно информацию о движениях аффинных евклидовых пространств размерности п^З, содержащуюся в теореме п. 6. В следующем пункте сохранены обозначения этой теоремы. 7. Примеры, а) п=\. Поскольку 0(1)= {±1}, собственные движения состоят только из сдвигов. Если / несобственное, то £>/ = —1, и из Df(l) = l следует, что / = 0. Поэтому всякое несобственное движение прямой имеет неподвижную точку и, стало быть, является отражением относительно этой точки. б)чя=?2. Собственное движение / с Z)/ = id является сдвигом; если Df φ id и det£>/ = 1, то Df, будучи вращением, не имеет неподвижных векторов, так что снова 1 = 0 и / имеет неподвижную точку, относительно которой / является вращением. Если /—несобственное движение, то Df есть отражение плоско- •ети относительно прямой, а / есть комбинация такого отражения и сдвига вдоль этой прямой. Значит, если несобственное движение плоскости имеет неподвижную точку, то оно имеет целую прямую неподвижных точек и представляет собой отражение относительно этой прямой. в) η = 3. Если detD/= 1, то Df всегда имеет собственное значение единица и неподвижный вектор. Поэтому все собственные движения трехмерного евклидова пространства являются винтовыми движениями вдоль некоторой оси (включая сдвиги, т. е. вырожденные винтовые движения с нулевым поворотом). Это —так называемая теорема Шаля. Если движение f=tig несобственное и 1ф0, то ограничение g на плоскость, ортогональную к / и проходящую через неподвижную точку а, есть несобственное движение этой плоскости. Поэтому оно является отражением относительно прямой в этой плоскости. Обозначим через Ρ плоскость, натянутую на / и на эту прямую. Тогда tig есть комбинация отражения относительно плоскости Ρ и сдвига на вектор /, лежащий в Р. Наконец, если / = 0, т. е. f несобственное и имеет неподвижную точку, то, отождествляя ее с нулем в L, а / с Df и пользуясь существованием у f собственной прямой L0 с собственным значением минус единица,' получаем геометрическое описание f как композиции вращения в Lq и отражения относительно Lq1· Пользуясь полярным разложением линейных операторов, мы можем также разобраться в геометрической структуре любого обратимого аффинного преобразования евклидова аффинного пространства. 8. Теорема. Всякое аффинное преобразование n-мерного евклидова пространства f может быть представлено в виде композиции трех отображений: а) п растяжений {с положительными коэффи- £04
циентами) вдоль η попарно ортогональных осей, проходящих через некоторую точку а0еЛ; б) движения, оставляющего неподвижным точку а0; в) сдвига. Доказательство. Заменив / его композицией с подходящим сдвигом, как в доказательстве теоремы п. 5, мы можем считать, что уже / имеет неподвижную точку а^ Отождествив А с L и а0 с нулем, мы можем разложить f = Df в композицию положительно определенного симметрического оператора и ортогонального оператора. Приведя первый из них к главным осям и перенеся эти оси в Л, получим требуемое. Θ. Заметим в заключение, что в этом параграфе мы широко пользовались линейными подмногообразиями в А (прямыми, плоскостями), определяя их конструктивно как прообразы линейных пространств в L при разных отождествлениях А с L, зависящих от выбора начала координат. Следующий параграф посвящен более систематическому исследованию связанных с этим понятий. § 3. Аффинные подпространства 1. Определение. Пусть (Л, L) — некоторое аффинное пространство. Подмножество В а А называется аффинным подпространством в А у если оно пусто или если множество М = {ЬХ —b2(==L\bly b2<=B}czL является линейным подпространством в L и tm(B)czB для всех 2. Замечания, а) Если выполнены требования определения и В непусто, то пара (β, Λί) образует аффинное пространство, что оправдывает терминологию (подразумевается, что сдвиг В посредством вектора из Μ получается ограничением на В этого же сдвига на всем А). В самом деле, просмотр условий в определении п. 1 § 1 сразу же показывает, что они выполнены для (β, Λί). В частности, выбрав любую точку JgB, получаем В = = {b-\- m\m&M}. б) Будем называть линейное подпространство Μ = {b\ — &2 l&i, b2&B} направляющим для аффинного подпространства В. Размерностью 5 называется размерность М. Очевидно, из В\ cz B2 следует, что Л^ cz М2 и, значит, dim B\ ^ dim B2. Назовем два .аффинных подпространства одинаковой размерности с общим направляющим пространством параллельными. 3. Предложение. Аффинные подпространства одинаковой размерности Si, B2czA параллельны тогда и только тогда, когда существует такой вектор /gL, что B2 = ti(B{). Любые два вектора с таким свойством отличаются на вектор из направляющего про- странства для В\ и В2. Доказательство. Если B2=ti(B\) и М2, Μι—направляющие В2 и В] соответственно, то М2= {а - Ь\ а, Ь е= В2} = {(а' +1) - ф' + 1)\а\ Ь' е Вх) = Ми так 4χο Βχ и В2 параллельны. 205
Наоборот, пусть Μ— общее направляющее для В\ и В2. Выберем точки 6igB и Ь2(=В2. Имеем В\ = {6, + /|/ е Λί}, β2 = — {^2 + /| / е Αί}, откуда В2 = tbt-bx (В\). Наконец, легко видеть, что tix (В{) = ίι2 (В2) тогда и только тогда, когда 1Х — /2 е Λί. 4. Следствие. Аффинные подпространства в L (с аффинной структурой) — это линейные подмногообразия L в смысле определения п. 1 § 6 ч. 1, т. е. сдвиги линейных подпространств. 5. Следствие. Параллельные аффинные подпространства одинаковой размерности либо не пересекаются, либо совпадают. Доказательство. Если Ь е В\ f| В2, то по предыдущему В\ = {Ь + пг\m е Λί} = β2, где Λί — общее направляющее Si и В2. 6. Аффинные подпространства б! и В2 не обязательно одинаковой размерности называются параллельными, если одно из их направляющих содержится в другом. Слегка изменяя предыдущие доказательства, легко получить следующие факты. Пусть Βγ и В2 параллельны и dim B\ ^ dim B2. Тогда существует такой вектор /eL, что 1i(Bi)czB2> и два вектора с этим свойством отличаются на элемент из Мь Кроме того, либо Вх и В2 не пересекаются, либо Вх содержится в В2. 7. Предложение. Пусть (Ви Μι), (Β2, М2)—два аффинных подпространства в А. Тогда Вх f| B2 либо пусто, либо является аффинным подпространством с направляющим Мх Π Λί2. Доказательство. Пусть В\{\В2 непусто и 6 е В\ Π Β2. Тогда Вх= {6 + /i|/e=A4,}f В2 = {Ь + /2|/<= М2}, откуда BX(]B2 = = {& + /| / е Mi f| М2}, что доказывает требуемое. (Следствие п. 5, очевидно, вытекает отсюда.) 8. Аффинные оболочки. Пусть S а А — некоторое множество точек в аффинном пространстве А. Наименьшее аффинное подпространство, содержащее S, называется аффинной оболочкой S. Оно существует и совпадает с пересечением всех аффинных подпространств, содержащих S. Мы можем описать аффинную оболочку в терминах барицентрических линейных комбинаций (предложение п. И § 1). 9. Предложение. Аффинная оболочка множества S совпадает с множеством барицентрических комбинаций элементов из S: где {su ..., sn} cz S пробегает всевозможные конечные подмножества S. Доказательство. Покажем преже всего, что барицентрические комбинации образуют аффинное подпространство в Л. В самом деле, обозначим через Μ с L линейное подпространство, натянутое на всевозможные векторы 5 — t; 5, / е S. Любые две барицентрические комбинации точек S можно представить в виде η η Σ **Sf» Σ У&1 с одним и тем же множеством *{sb ..., sn}> взяв объединение двух исходных множеств и положив лишние коэффи- 206
ί = 1 циенты равными нулю. Поскольку Σ ** -~~ Σ #* = 0» разность этих комбинаций можно представить в виде η Σ(*ί— yi)(Si — Si) t«l и потому она лежит в М. Наоборот, любой элемент из Μ вида η η / η ч η Σ Χι (si — tt) есть разность точек Σ *isi + ( 1 — Σ χι) 5ι и Σ *Λ + + Π — Σ*Η$ι из S. Поэтому Λί = {&i — b2\bu b2EES}. Это же соображение показывает, что tm(S)cz:S для всех meAi. Следовательно, 5 является аффинным подпространством с направляющим пространством М. Ясно, что S czS. Наоборот, пусть В id S — любое аффинное подпространство, η {s\t ..., sn} a S. Тогда для любых хи ..., xn e Jif, Σ *; — 1, имеем /ι η Σ ад = $1 + Σ χι (*i — si). Λ Поскольку si, ..·, Sn&B, вектор Σ xi(si—si) лежит в направляющем пространстве В, и потому сдвиг Si на него лежит в 5. Значит, S cz В и S действительно является наименьшим аффинным подпространством, содержащим S. 10. Предложение. Пусть f: А\-+А2 — аффинное отображение двух аффинных пространств; B[CzAi и В2аА2— аффинные подпространства. Тогда f(Bi)czA2 и f~l(B2)czAi являются аффинными подпространствами. Доказательство. Пусть В{ = {Ь + /|/ <= Λίι}, где М\ — направляющее пространство для Вх. Тогда f(i?i)=* {f(b)+Df{l)\l& ^Λίι} = {f(6)+f|/'eImD/}. Следовательно, f(Bi)— аффинное подпространство с направляющим пространством Im Df. В частности, f(Aι) есть аффинное подпространство в А2у В2(] (]f(Αχ) есть аффинное подпространство и f~l(^2)==zf~l(B2(]f(Ai))ii в силу общих теоретико-множественных определений. Заменив А2 на f(A{) и В2 на β2Π/(^ι)» мы можем ограничиться случаем, когда f сюръективно. Пусть М2 — направляющее пространство для В2. Тогда B2={b + m\m<=M2} и f~l{B2)= {b' + m'\f(b') = bt Df(m')^M2}. Справа можно ограничиться одним значением &'е ^f~l(b): остальные получатся из него сдвигами на KerD/. Отсюда следует, что f~l(B2) имеет вид {У + m\m e Df-l(M2)} и потому является аффинным подпространством с направляющим подпро- странс1вом (Df)-l(M2\% 207
11. Следствие. Множество уровня любой аффинно линейной функции является аффинным подпространством. Доказательство. В самом деле, множества уровня аффинно линейной функции f: А-+Ж1 суть прообразы точек в X1. Но любая точка в аффинном пространстве является аффинным подпространством (с направляющим {0}). 12. Предложение. Пусть f\ fn — аффинно линейные функции на аффинном пространстве А. Тогда множество {аеЛ |/ι(αι) =" ™ ... =Μα/ι) = 0} является аффинным подпространством в А. Если А конечномерно, то всякое его аффинное подпространство имеет такой вид. Доказательство. Указанное множество является конечным пересечением множеств уровня аффинно линейных функций. Поэтому оно аффинное в силу следствия п. 11 и предложения п. 7. Наоборот, пусть В а А — аффинное подпространство в конечномерном аффинном пространстве Л, MaL — соответствующие линейные пространства. Если В пусто, его можно задать уравнением /=*0, где f — постоянная функция на Л с ненулевым значением (очевидно, любая такая функция аффинно линейна, Щг**0). Иначе, пусть g\ = ... = gn = 0— система линейных уравнений на L, задающая М\ в качестве gi, ..., gn можно взять, например, базис подпространства М1 с: ΖΛ Выберем точку бейи построим аффинно линейные функции /*: А-+Ж1 с условиями f/(6)«=m0, Z)f;= = giy ί = 1, ..., я. Очевидно, //(ft -f /) = gi (I). Поэтому точка Ъ + / Q А обращает в нуль все функции // тогда и только тогда, когда / е Λί, т. е. тогда и только тогда, когда b + IQ В. Это завершает доказательство. 13. Назовем конфигурацией в аффинном пространстве А конечную упорядоченную систему аффинных подпространств {Ви ... ,.., Вп}. Две конфигурации {В{, ..., βΛ} и {В\, ..., й„} назовем аффинно конгруэнтными, если существует такой аффинный автоморфизм feAfM, что /(Б/) = В\, i= 1, ..., п. Возможны варианты этого понятия, когда f разрешается выбирать лишь из некоторой подгруппы Aff Л, например, группы движений, когда А евклидово. В последнем случае будем называть конфигурации метрически конгруэнтными. Важные понятия и результаты аффинной геометрии связаны с отысканием инвариантов конфигураций относительно отношения конгруэнтности. Заметим, что оно является аффинным вариантом понятия «одинаковой расположенности», которре мы изучали в § 5 ч. 1. Докажем несколько основных результатов о конгруэнтности. Пусть А — аффинное пространство размерности п. В соответствии с результатами пп. в—11 § 1 назовем конфигурацию {а<ь ..., ап} ив л-f 1 точки в А коороинатной, если ее аффинная оболочка совпадает с Л. 14. Предложение, а)' Любые две координатные конфигурации конгруэнтны и переводятся друг в друга единственным отображением f^ All А. 909
б) Координатные конфигурации |а0 ап} и {a'Q, ..., ял} в евклидовом пространстве А метрически конгруэнтны тогда и только тогда, когда d {aiy aj) = d (а\, а,) для любых /, / е 1, ..., п. Доказательство, а) Положим ei = ai—-aQ9 e\ = a'i — a'Q. Системы {#,} и fy} образуют базисы в L. Пусть g: L-+L — линейное отображение, переводящее et в ег Построим аффиЪное отображение /: А-+А со свойством £>/ = # и /(^о)=«о· ®н0 СУ- ществует по утверждению п. 11 § 1 и лежит в АН А, ибо g обратимо. Кроме того, f(al)^f(a0) + g(ai-aQ) = ar0 + e/i = a0+(a/t-a0) = art для всех /== 1, ..., п. Эта же формула показывает, что / единственная, ибо Df должно переводить ei в е\ и /(«0)=Е=ао· б) В силу доказанного выше достаточно проверить, что / является движением тогда и только тогда, когда d(ar α^ — ά(α'υ a^ для всех i, /. В самом деле, d(ai, a/) = |a/— а/| = |е* — β/|, где ео = а0 — а0 = 0, и аналогично d (α\, αΊ) — \β\~~βΊ\- Если / — движение, то Df ортогонально и сохраняет длины векторов, так что условие необходимо. Наоборот, пусть оно выполнено. Тогда |е,| = я | е\ | для всех i = 1, ..., я и далее из равенств | et — ef |2 = | е\ — — e'i|2 получаем, что (ei9 ej) = (е\> е^ для всех i, /.Значит, матрицы Грама базисов {ej и {е[} совпадают. Но тогда отображение g9 переводящее {е^ в {е[}, является изометрией, так что / является движением. Доказательство окончено. Рассмотрим теперь конфигурации (Ь, β), состоящие из точки и аффинного подпространства. В евклидовом случае назовем расстоянием от & до β число d(b9 B) = mi{\l\\b + l^B}. 15. Предложение, а) Конфигурации (&, В) и (&', В') аффинно кднеруэнтны тогда и только тогда, когда dim В =» dim 5' и либо одновременно Ь ф.В, Ь' ф. В\ либо одновременно Ь&В, bf e В\ б) Конфигурации (&, В) и (У, В') метрически конгруэнтны тогда и только тогда, когда dim β = dim В' и d(by B)=**d(b'y B')% Доказательство, а) Сформулированные условия, очевидно, необходимы. Пусть они выполнены. Обозначим через Λί, Λί' направляющие β, β' соответственно и выберем линейныД автомоо- физм g: L-+L, для которого g(M)=M\ Если Ь& Ё и Ь'&&% построим аффинное отображение f: A-+A с условиями Df=*g Ц /(&)«=&'. Очевидно, f(b + l) = b' + g(l)9 так что f(B) = B'. Если b φ В и Ь' ф.В'у наложим на g дополнительные условия> Выберем по точке аеВ, a'geB' и потребуем, чтобы g переводил вектор Ь — а в вектор Ь' — а'. Оба вектора ненулев&е и леяс£т вне Μ, Μ' соответственно, поэтому стандартная конструкция, исходящая* из базисов L вида {базис Λί, Ь — а, дополнение} и m
{базис ЛГ, b' — α', дополнение}, показывает существование g. После этого снова построим аффинное отображение /: А-+А с Df=g и f(b) = b'. Проверим, что f(B) = B. В самом деле, прежде всего, f(a) = a', потому что f{a) = f(b-{b-a)) = f(b)-g(b-a) = b'-(br-(f) = ar. Далее, f(a +l) = f(a)-\-g(l), и условие /eAf равносильно условию g(l) e Λϊ', так что f(B) = В'. б) Необходимость условия снова очевидна. Для доказательства достаточности подчиним выборы, сделанные в предыдущем рассуждении, дополнительным требованиям. Прежде всего, отождествим А с L, выбрав начало координат в В. Тогда В отождествится с Mt b станет некоторым вектором в L. Пусть а — ортогональная проекция b на М. В линейном варианте мы уже знаем, что d(b, B) = \b — а\. Аналогично определим точку а' на Mf или в нашем отождествлении на В'. В качестве g возьмем изометрию L, переводящую Μ в М' и b в V. Она существует: дополним орто- нормированные базисы в Μ и М' соответственно до ортонормиро- ванных базисов в L, содержащих (Ь — а)/\Ь — а\ и (Ь' — а')/ /\Ь — а\> и определим g как изометрию, переводящую первый базис во второй. После этого аффинное отображение /: А-*А с Df = g и f(b) = b' будет движением, переводящим (&, В) в (&', В'). 16. Рассмотрим, наконец, конфигурации, состоящие из двух подпространств В\, В2. Полная классификация их с точностью до аффинной конгруэнтности может быть проведена с помощью соответствующего результата для линейных подпространств, доказанного в п. 5 § 5 ч. 1. Полная метрическая классификация довольно громоздка: она требует рассмотрения расстояния между В\ и В2 и серии углов. Мы ограничимся обсуждением единственного метрического инварианта — расстояния, которое, как обычно, определим формулой d (В,, В2) = inf {| Ьх - Ь211 Ь{ е В,, b2 е= β2}. Назовем общим перпендикуляром к Ви В2 такую пару точек Ь\&В\, Ь2&В2, что вектор Ь\ — Ь2 ортогонален к направляющим Βλ и В2. (Точнее было бы называть общим перпендикуляром отрезок {tbi+(l — /)62|0</< 1}.) 17. Предложение, а) Общий перпендикуляр к В{ и В2 всегда существует. Множество общих перпендикуляров биективно пере- сечению направляющих Βλ и В2. б) Расстояние между В\ и В2 равно длине любого общего перпендикуляра \Ь\ — Ь2\ к ним. Доказательство, а) Пусть Afi, M2 — направляющие В{ и В2 и пусть b\^Bv &2е ^2· Спроектируем вектор Ь\ ·— Ь2 ортогонально на Μι + М2 и представим проекцию в виде гп\ + m2, mi s sM/. Положим Ь{*=Ь[ — т{, b2 = b2 + т2. Очевидно, bi^Bi и Ьх - Ь2 = Ь\ - Ъ'{— {тх + т2) г (М{ + Afа)-"·. Значит, {&!, Ь2} есть общий перпендикуляр к Ви В2, W
Пусть {&,, b2) и [b\, Ь'2} — &ва общих перпендикуляра.Тогда b\ — b[&. Μ,, b2 — b2^ Λί2 и, кроме того, 6i_ft2e(Al1 + AI2)J-i ^-^(Μ, + Μ^. Значит, разность (Ьх — 6{) — {b2 — б^), лежит одновременно в Μι + + Λί2 и (Λίι + М2)1. Поэтому она равна нулю. Следовательно, bl—-b[ = Ъ2 — b2е Μ, ΠΛί2. Наоборот, если {bu b2} — фиксированный общий перпендикуляр и meMif|M2, то {Ь\ + т, Ь2 + т} тоже является общим перпендикуляром. Это завершает доказательство первой части Предложения. б) Пусть {&1, Ь2)— общий перпендикуляр к Bv В2 и ь\ е Ви Ь2^ В2 — любая другая пара точек. Достаточно доказать, что \Ь{ — 62|^|^ι ~" Κ\· ^ самом деле, *; - к=(*, - ь»)+(к - к)+(ь2 - к). Но (Ь\ — Ь{) + (Ь2 — &2) е Λίι + ^2» а вектор &ι— &2 ортогонален Μι 4- М2. Значит, по теореме Пифагора \К-ь'2¥=\ь,-ь2\*+\ь\-ьх + ь2-ь'2\*>\ьх-ь,\\ что завершает доказательство. Установим в заключение один полезный результат, характеризующий аффинные подпространства. 18. Предложение. Подмножество Sen А является аффинным подпространством тогда и только тогда, когда вместе с любыми двумя точками s, /eS оно содержит всю прямую, проходящую через эти точки, т. е. их аффинную оболочку. Доказательство. Прямая, проходящая через точки s, /eS, — это множество {xs -j-(l—x)t\x^X}. Поэтому необходимость условия следует из предложения п. 9. Наоборот, пусть оно выполнено. Поскольку в силу того же предложения аффинная оболочка S состоит из всевозможных барицентрических комбинаций η точек S, мы должны проверить, что такие комбинации У. χ^ι ле- жат в S. Проведем индукцию по п. При п= 1, 2 результат очевиден. Пусть β>2 и для меньших значений η результат доказан. η Представим Σ ад в виде гс-2 η νιΣτ*+* Σ τ9» /1-2 где ух = Σ *f> y2 = xn-\-l· *n (мы можем считать, что обе эти η суммы не равны нулю, иначе Σ xisie S по индуктивному ϊ = 1 211
предположению). Очевидно, л-2 η Στ- Σ £-».+*-1· ft-2 η Значит, V —5^ и V -jf-Si лежат в S, и потому их барицен- трическая комбинация с коэффициентами уи \)ч лежит в S. Это завершает доказательство. УПРАЖНЕНИЯ 1. Назовем ί-й медианой системы точек а.\ ..., ar.ei отрезок, соединяющий точку щ с центром масс остальных точек {α/// φ ι}. Доказать, что все медианы пересекаются в одной точке — центре масс аи ..., ап. 2. Угол между двумя прямыми в евклидовом аффинном пространстве А — это угол между их направляющими. Доказать, что две конфигурации из двух прямых в А метрически конгруэнтны тогда и только тогда, когда углы и расстояния между прямыми в обеих конфигурациях совпадают. 3. Угол между прямой и аффинным подпространством размерности ^ 1 — это угол между направляющей прямой и ее проекцией на направляющую подпространства. Пользуясь этим определением, обобщить результат упражнения 2 на конфигурации, состоящие из прямой и подпространства. § 4. Выпуклые многогранники и линейное программирование 1. Постановка задачи. Основная задача линейного программирования ставится следующим образом. Дано конечномерное аффинное пространство А над полем вещественных чисел R и т + 1 аффинно линейных функций/ь ···> /™; /: A-*R. Требуется отыскать точку (или точки) аеД удовлетворяющие условиям f\ (а) ^ 0, ... ..., /m(a)^0, для которых функция f принимает наибольшее возможное значение при этих ограничениях. Вариант, в котором некоторые из неравенств направлены в обратную сторону, fi(a)^. О, и/или требуется отыскать точки, в которых / принимает наименьшее возможное значение, сводится к предыдущему случаю заменой знака соответствующих функций. Условие /ί(α) = 0 равносильно совокупности условий fi{a)^0 и —Μα)Ξ^0· ^се функции ft можно считать непостоянными. 2. Мотивировка. Рассмотрим следующую математическую модель производства. Пусть имеется предприятие, использующее т видов различных ресурсов и производящее η видов различных продуктов. Ресурсы и продукты измеряются в своих единицах неотрицательными вещественными числами (случай, когда это целые числа, например, количество штук автомобилей, мы не рассматриваем; при больших объемах производства и потребления ресурсов он хорошо аппроксимируется ^непрерывной» моделью). План производства — это вектор (χι. v„'»r=R«, указывающий количество л:/ /-го продукта, которое ieofixo^nvro произвести. Принимается следующая линейная модель потребления ресурсов: 212
если на производство единицы /-го продукта расходуется количество ац единиц /-го ресурса, то для выполнения плана (х\, ... >хп) η требуется Σ ацх{ единиц /-го ресурса. Ресурсы, отпускаемые пред- /-1 приятию, определяются вектором (&ι, ..., bm): дается bt единиц /-го ресурса. Следовательно, план (Х\, ..., Хп) выполним, только, если выполняется система ограничений η fi(x\> ·*·» Xn) = bi — ΣαίιΧ^Ο, /=1, ..., т. Мы будем всегда считать, что эти неравенства совместны. Предположим, что предприятие реализует выпущенную им продукцию по цене d за единицу /-го продукта. Тогда прибыль от реализации произведенного продукта будет равна η f (Χχ9 . . ., Χη) = Χ cixi· План производства (х\, ..., хп) называется оптимальным по прибыли, если f(x) достигает наибольшего возможного значения при ограничениях //^ О, Xi^O (/= 1, ...., η) (последнее условие означает, что предприятие не добывает производимых им продуктов на стороне — для продажи или для запчастей). Мы видим, что задача составления оптимального плана является частным случаем задачи, сформулированной в п. 1. Разумеется, практические приложения линейного программирования связаны с разработкой конкретных, алгоритмов отыскания оптимального плана, которые можно применять вручную или на ЭВМ. Мы ограничимся в этом параграфе изложением геометрических аспектов задачи, лежащих, конечно, в основе всех алгоритмов. 3. Основные геометрические понятия. Фиксируем конечномерное аффинное гГространство А над полем R. Буквы f с индексами будут обозначать аффинно линейные функции на Л. Полупространством называется множество точек вида {ag ^A\f(a)^0}y где / — непостоянная аффинно линейная функция. Многогранником называется пересечение конечного числа полупространств. Напомним, что подмножество S а А выпуклое, если из а\, «2^5 и 0^л:^1 следует, что ха\ + (1 — х)а2^ 5. Поскольку f(xax + + (1—χ) α2) = xf(a\) + (1—x)f(a2), все полупространства выпуклы. Так как пересечение любого семейства выпуклых множеств выпуклое, все многогранники выпуклые. Мы будем говорить, что любая точка хах +(1 — *)fl2, 0 < χ < 1, является внутренней точкой отрезка с концами а{ и а2. - Пусть S — выпуклое множество. Выпуклое подмножество. Τ a S называется гранью S, если любой отрезок с концами в S, некоторая внyfpeнняя точка которого лежит в Г, целиком лежит в Т. 213
Все множество S является своею гранью. Грань 5, состоящая из одной точки, называется вершиной S. Читателю следует представить себе куб, октаэдр и многогранный угол в трехмерном пространстве, чтобы иметь наглядную картину основной ситуации, важной для линейного программирования. Грани этих фигур в смысле нашего определения — это грани, ребра и вершины школьной геометрии плюс сама фигура. Вершины шара — это все точки его поверхности. Важнейший результат этого параграфа будет состоять в том, что максимум аффинно линейной функции на ограниченном многограннике (в приложениях этот случай наиболее распространен) достигается на одной из его вершин; последних конечное число. Но прежде нам придется разобраться в структуре многогранников и их граней подробнее. 4. Лемма. Пересечение семейства граней и грань грани выпуклого множества S является гранью S. Доказательство, а) Пусть Т= []Tiy Ti— грани S. Любой отрезок с концами в S, внутренняя точка которого принадлежит 7\·, целиком лежит в 7V Значит, если его внутренняя точка лежит в Г, то он лежит в Т. б) Пусть T]CzT czSy T — грань S. Любой отрезок с концами в S, внутреняя точка которого лежит в 7Ί, целиком лежит в Г, ибо Τ — грань S, значит, его концы лежат в Г и потому он целиком лежит в Гь ибо Т\ — грань Г. 5. Лемма. Пусть S — многогранник, заданный неравенствами fi^Ot ί=1, ..., m. Тогда для любого i многогранник St = = S(] {a\fi(a) = 0} либо пуст, либо является гранью S. Доказательство. Пусть S, непуст, аь a2^S и внутренняя точка отрезка ха\+(\—х)а2 лежит в S/. Функция fi(xa\ + + (1 —х)а2), 0 ^ χ ^ 1, линейна по х, обращается в нуль для некоторого 0 -< хо -< 1 и, кроме того, неотрицательна при χ = 0 и х= 1. Поэтому она тождественно равна нулю, так что весь отрезок лежит в Si. 6. Лемма. Непостоянная аффинно линейная функция f на многограннике S= {β|/ί(α)Ξ^0} не может принимать максимальное значение в точке а ^ S, для которой все fi(a) > 0. Доказательство. Так как /непостоянна, Df Φ 0. Выберем в векторном пространстве L, ассоциированном с А, веТктор /eL, для которого D/(/)=t£0. Можно считать, что Df(/)>0, изменив знак / в случае нужды. Если число ε > 0 достаточно мало и agS, to fi(a + el)> 0 для всех i= 1, ..., m: достаточно взять е < min , It п\ ι - Поэтому а + ε/eS для таких ε. Но f(a + ε/) = i I uji \i)\ = f(a)+eDf(l)>f(a), так что f(a) не является максимальным значением /. Теперь мы можем доказать наш основной результат. 7. Теорема. Предположим, что аффинно линейная функция f ограничена сверху на многограннике S. Тогда она принимает свое максимальное значение во всех точках некоторой грани S, являю* 214
щейся также многогранником. Если S ограничен, f принимает свое максимальное значение в некоторой вершине S. Доказательство. Проведем индукцию по размерности А. Случай dim Л = 0 очевиден. Пусть dim Л = п и для меньших размерностей теорема доказана. Пусть S задан системой неравенств f\ Ξ^ 0, ..., fm Ξ^ 0. Так как множество S замкнуто, ограниченная сверху функция f на нем принимает максимальное значение в некоторой точке а. Если /ι(α)>0, ..., /m(a)>0, то по лемме п. 6 f может быть только константой; в частности свое единственное значение она принимает на всем S. Иначе fi(a) = 0 для некоторого L Это значит, что f принимает максимальное значение в точке непустого многогранника Si, который является гранью^ и лежит в аффинном подпространстве {a\fi(a) = 0} размерности η—1, ибо // непостоянна. По индуктивному предположению максимальное значение ограничения f на Si принимается во всех точках некоторой многогранной грани S,. По лемме п. 4 она же будет гранью S. Она будет многогранником, ибо к неравенствам, определяющим ее в Sit с левыми частями, продолженными на все Л, следует добавить равенство fi = 0. Теперь индукцией по размерности аффинной оболочки S покажем, что у любого ограниченного многогранника обязательно есть вершина. В самом деле, для размерности нуль это очевидно. Пусть размерность больше нуля. Мы можем считать, что аффинная оболочка S есть все Л. Возьмем любую непостоянную аффин- но линейную функцию на А. Она должна принимать на S максимальное значение, ибо S ограничен и замкнут. Стало быть, у S есть непустая грань, во всех точках которой это значение принимается. Она является ограниченным многогранником, аффинная оболочка которого имеет строго меньшую размерность. По индуктивному предположению у нее есть вершина, являющаяся также вершиной S по лемме п. 6. Окончательно, пусть S ограничен и Τ — многогранная грань S, на которой исходная функция / принимает свое максимальное значение. Тогда любая вершина Г, существование которой доказано, является искомой вершиной S. § 5. Аффинные квадратичные функции и квадрики 1. Определение. Квадратичной функцией Q на аффинном пространстве (AtL) над полем Ж называется отображение Q: А-*ЖУ для которого существуют такие точка а0^А, квадратичная форма q: Ь-+Ж, линейная форма I: L-^Ж и константа с&Ж, что Q(a) = q(a — α0) + / (а — α0) + с для всех а&А. Форма q называется квадратичной частью Q, а / — линейной частью Q относительно точки а0. Очевидно, c = Q(a0). Покажем прежде всего, что от выбора точки а0 квадратичность Q не зависит. То^ее, пусть g — симметричная билинейная форма на I, 216
являющаяся поляризацией q. Мы, как обычно, считаем, что характеристика Ж отлична от двух. 2. Предложение. Если Q(a) = q(a — aQ)-\- l(a — а0) + с, то для любой точки aj£i4 имеем Q(a)=:q(a-a'0) + l'(a-a'0) + c'9 где ΐ (m) = l(m) + 2g(mt a'0 - a0), c' = Q (a'0). Таким образом, переход к другой точке меняет линейную часть Q и константу. Доказательство. В самом деле, q(a-~a0)=*q((a-a'0) + (a0-a0))=* = q(a-a0) + 2g (a - a0, a0 -a0) + q (a0 - a0), /(a-a0)-/((a-a;) + K~a0)) = /(a~a;) + /(a;~a0), что доказывает требуемое. 3. Назовем трчку #о центральной для квадратичной функции Q, если линейная часть Q относительно а0 равна нулю. Объяснение этого термина состоит в замечании, что точка ао центральна тогда и только тогда, когда Q(a)=»Q(ao — (a — а0)) для всех а: действительно, разность левой и правой части в общем случае равна 21 (а — а0), ибо q(a — a0)=*q(—(а — а0)). Геометрически это значит, что после отождествления А с L, при котором ао переходит в начало координат, функция Q становится симметричной относительно отражения mi—>—m. Назовем центром функции Q множество ее центральных точек. 4. Теорема, а) Если квадратичная часть q функции Q невырождена, то центр Q состоит из единственной точки. б) Вели q вырождена, то центр Q либо пуст, либо является аффинным подпространством в А размерности dim А — rk q (rkq — это ранг q), направляющее подпространство которого совпадает с ядром q. Доказательство. Начнем с любой точки а0&А и представим Q в виде q(a — а0)+1(а — ао)+с. Согласно предложению п. 2 точка а^еЛ будет центральной для Q тогда и только тогда, когда выполнены условия l(m)*= — 2g(m, a0 — a0) для всех m&L. Когда а'0 пробегает все точки Л, вектор а'0 — а0 пробегает все элементы L, и линейная функция от meL вида — 2g(m, ao~"~ao) пробегает все элементы L*, лежащие в образе канонического отображения §: L-*~L*9 связанного с формой g. Если q невырождена, то § — изоморфизм. В частности, для функционала —1/2&L* имеется единственный векторa'Q — aQ&L со Я*
свойством ^f( ·, «ό —α0) = —-g-/(·)· Точка а'0 в этом случае и является единственной центральной точкой Q. Если q вырождена, то возможны два случая. Либо —1/2 не лежит в образе g\ тогда центральных точек нет. Либо —//2 лежит в образе §. Тогда для любых двух точек а0, а% с условием g(-> αό-αο) = #(·> <-ао) = -уИ·) имеем αό —a^eKerg, и наоборот, если g ( · ,α^ —α0)«= — γ/(·) и a^ea^+Kerff, то g(-,a"~a0)-=--j'(·)· Таким образом, центр является аффинным подпространством, а Kerg, т. е. ядро q,— его направляющим. Это завершает доказательство. Теперь мы можем доказать теорему о приведении квадратичной функции Q к каноническому виду в подходящей аффинной системе координат {ао, ей ..., еп}, {ei}—базис L, а0еЛ. Напомним, что точка аб/4 в ней представлена вектором (х\9 ..., xrt), η если α = α0+ Σ**6*· 5. Теорема. Пусть Q — квадратичная функция на аффинном пространстве Л. Тогда существует такая аффинная система координат в А, в которой Q принимает один из следующих видов. η а) Если q невырождена, то Q(xv ·.., *„)— Σ λ,·*? + с\ λί, С e «Jif. б) Если q вырождена ранга г, «о центр Q непуст, то г Q (х{,..., χη) = Σ λ^+^; V с&ж. в) £сли (7 вырождена ранга г и центр Q пуст, то г Q (х{, · · ·, *п) — ΣΙλ**? + xr+v Доказательство. Если q невырождена, выберем в качестве ао центральную точку Q. Тогда Q(a) = q(a — a0)+c. В качестве е\9 ·. ·, еп выберем базис в L, в котором q приводится к сумме квадратов с коэффициентами. Тот же прием приводит к цели всегда, если центр непуст. Если центр Q пуст, начнем с произвольной точки ао и базиса г {ей ..-ken}t в котором квадратичная часть Q имеет вид Σ λ%χ\· 217
η Пусть линейная часть имеет вид I = Σ И·/**· Мы утверждаем, что μίΦΟ для некоторого / > г. Действительно, иначе ί=ΣΜ<Λ» и тогда Q можно представить в виде ΣΜ+Σ^+β=Σ>«(*ί+ί7),+β'· г Σ Pi -ξχ- βΐ будет центральной для Q, что противоречит предположению о пустоте цейтра. Но если μ/ > 0 для некоторого / > г, то система функционалов {е\ ..., ег, 1} в L* линейно независима. Мы можем дополнить ее до базиса в L* и в двойственном базисе L получить для Q вы- г ражение вида Σ λ.χ2{-{- #г+1 + с, где „rr+i как функция на L есть просто /. Теперь ясно, что. имеется точка, в которой Q обращается в нуль, например, х\ = ... =хг = 0, хг+\ =—с, хг+2= ... =хп = = 0 в этой системе координат. Начав построение с этой точки, мы г получим представление Q в виде Σ λ£Λ;? + *Γ+ι· i — \ 6. Дополнения, а) Вопрос о единственности канонического вида сводится к уже решенной задаче о квадратичных формах. Если q невырождена и в некоторой системе координат имеет вид η %ьх\-\'Су то точка (0, ..., 0) является центром и потому определена однозначно, константа с определена однозначно как значение Q в центре, а произвол в выборе осей и коэффициентов тот же, что для квадратичных форм. В частности, над R можно считать, что λι = ±1, и полным инвариантом является сигнатура. Над С можно считать, что все λ/ = 1. В вырожденном случае с непустым центром начало координат можно выбирать в центре как угодно, но константа с все равно определяется однозначно, ибо значение Q во всех точках центра постоянно: если а, а0 лежат в центре, то 1(а—ао)= 0 и q(a—а0) = = 0, ибо а — qo лежит в ядре q. К квадратичной части применимы прежние замечания. Наконец, в вырожденном случае с пустым центром начало координат можно брать в любой точке, где Q обращается в нуль; к квадратичной части применимы прежние замечания. б) Если А — аффинное евклидово пространство, то Q приводится к каноническому виду в ортонормированном базисе. Числа λι, ..., %п определены однозначно. Произвол в выборе центра тот же, что и в аффинном случае, произвол в выборе осей тот же, что для квадратичных форм в линейном евклидовом пространстве, 218 £
6. Аффинные квадрики. Аффинной квадрикой называется множество {а е A |Q(a) = 0}, где Q—некоторая квадратичная функция на Л. Взгляд на канонические формы Q показывает, что к проблеме исследования типов квадрик применимы все результаты § 10 ч. 2. Рассмотрим вопрос о единственности функции Q, задающей данную аффинную квадрику над полем R. Прежде всего, квадрика может быть аффинным подпространством в А (возможно, пустым): г уравнение Σ*/ = 0 равносильно системе уравнений хх = ... ... = хг = 0. При г > 1 имеется много непропорциональных друг другу квадратичных функций, задающих ту же квадрику, напри- г мер S^t*i = 0 С любыми λ/> 0. Покажем, что для остальных квадрик ответ проще: 7. Предложение. Пусть аффинная квадрика X, не являющаяся аффинным подпространством, задается уравнениями Qi = 0 и Q2 = 0, где Qu Q2 — квадратичные функции. Тогда Q\ = XQ2 для подходящего скаляра λ ^ R. Доказательство. Прежде всего, X не сводится к одной точке. В силу предложения п. 18 § 3 имеются две точки аи а2^Х, аффинная оболочка которых (прямая) не лежит в X целиком. Пусть αϊ, а2^Х и прямая, проходящая через точки аи а2, не лежит в X целиком. Введем в А систему координат {а\\ е\, ..., еп}, где еп = а2 — а\. Запишем функцию Q\ в этой системе координат Q\(xi> ···> ^п) = Цт'| (*р ···> хп-\) хп*ч \χι> ···» хп-\)> где /р /[' — аффинно линейные функции, т. е. многочлены степени ^ 1 от *ι,..., хп-\. Так как прямая, проходящая через точки а1=(0, ..., 0) и Я2 = (0, ..., 0, 1), не содержится в X целиком, то λ Φ 0 и 1[ (О)2 — 4λ/'' (0) > 0. Разделив Q\ на λ, можно считать, что λ= 1. Аналогично, можно считать, что как квадратный трехчлен от хп: Q2(X\> ···> хп) = хп~Ь~ h\x\> ···» xn-\)xnm^mh\x\· ···, *Λ_ι) и 4 (О)2 — 4/" (0) > 0. Мы анаем теперь, что Q{ и Q2 имеют одинаковое множество вещественных корней, и хотим доказать, что Q, = Q2. Фиксируем вектор (си ..., c^iJeR"-1 и рассмотрим векторы (tc\9 ..., tcn-i)9 /gR. При малых по модулю значениях t дискриминанты по Хп трехчленов Q\(tc\f ..., tcn-u *n) и Q2(tcu ..., tcn-u хп) остаются положительными, и вещественные корни их, отвечающие точкам пересечения одной и той же прямой с X, совпадают. Значит, ^ — 1\ и /" = /" в таких точках (tc\9 ..., tcn~\). Поэтому ΐχ^ΐ2 и tfsslZ, и^° аффинно линейные функции, совпадающие 219
на открытом множестве, совпадают. Действительно, их разность обращается в нуль в окрестности начала координат и потому множество ее корней не может быть собственным линейным подпространством. Это завершает доказательство. § 6. Проективные пространства 1. Аффинные пространства получаются из линейных «забвением начала координат». Проективные пространства можно строить из линейных по меньшей мере двумя способами. а) Добавить к аффинному пространству «бесконечно удаленные точки». б) Реализовать проективное пространство как множество прямых в линейном пространстве. Мы выберем в качестве основного определения б): оно яснее показывает однородность проективного пространства. 2. Определение. Пусть L — линейное пространство над полем Ж. Множество P(L) прямых (т. е. одномерных линейных подпространств) в L называется проективным пространством, ассоциированным с L, а сами прямые в L называются точками P(L). Число dimL— 1 называется размерностью P(L) и обозначается dimP(L). Одномерные и двумерные проективные пространства называются соответственно проективной прямой или проективной плоскостью. Проективное пространство размерности η над полем Ж обозначается также ЖРп или Рп(Ж) или просто Р\ Смысл соглашения dimP(L)= dimL— 1 станет сейчас ясен. 3. Однородные координаты. Выберем базис {во, ..., еп) в пространстве L Каждая точка ρ е P(L) однозначно определяется любым ненулевым вектором на соответствующей прямой в L. Координаты #о, ..., Хп этого вектора называются однородными координатами точки р. Они определены с точностью до умножения на ненулевой скаляр: точка (λΛΓ0, ..., λχη) лежит на той же прямой ρ и все точки прямой получаются таким образом. Поэтому вектор однородных координат точки ρ по традиции обозначается (х0: χι: ... :*«). Таким образом, координатное п-мерное проективное пространство Р(Жп+{) есть множество орбит мультипликативной группы Ж* = Ж\{0}, действующей на множестве ненулевых векторов Жп+1\{0} по правилу λ(х0,...,хп) = (λ*ο,..., λχη); (лг0: α:ι: ... :χη) есть символ соответствующей орбиты. Пользуясь однородными координатами, можно хорошо представить себе структуру Рп как множества несколькими разными способами. а) Аффинное покрытие Рп. Положим Ui — {(xo: ... :xn)\xt ¥*0}> /==0, ..., п. η Очевидно, Pft« U^· В классе векторов проективных координат любой точки p&Ui имеется единственный вектор с 1-й координа- 220
той, равной I: (х0: ... :хг. ... :хп) =T*o/w ... :1: ... :χη/χι). Опуская эту единицу, -получаем, что Ui биективно множеству Жп, которое мы можем интерпретировать как n-мерное линейное или аффинное координатное пространство. Заметим, однако, что пока у нас нет никаких оснований считать, что на Ui имеется какая-то естественная не зависящая от выбора координат линейная или аффинная структура. Позже мы покажем, что инвариантно можно ввести на Ui лишь целый класс аффинных структур, связанных, впрочем, каноническими изоморфизмами, так что геометрия аффинных конфигураций в любой из них будет одна и та же. Назовем множество U{ ^ Жп 1-й аффинной картой Рп (в данной системе координат). Точки (у\*\ ..., #W)s£/t· и (#</>, ..., i/rt/))ef// при 1Ф\ отвечают одной и той же точке Рп, лежащей на пересечении Ui Π Uj, тогда и только тогда, когда, вставив 1 на 1-е место в векторе (^, ..., у{£) и на /-е место в (^Д ...,#<{>), мы получим пропорциональные векторы. В частности, Р1 = U0\j Uif C/0= U{ ^Ж; точка y^U0 отвечает точке \/у е U\ при у Φ 0; точка у = 0 из U0 не лежит в i/b а точка 1/у = 0 из U\ не лежит в ί/0. Естественно считать, что Р1 получается из и0^Ж добавлением одной точки с координатой у = оо. Обобщая эту конструкцию, получаем б) Клеточное разбиение Рп. Положим Vt — {(x0: ... :Χη)\*ι = 0 при /</, ΧίφΟ). η Очевидно, V0 = U0 и Рп= [} Vu но на этот раз все Vi попарно не пересекаются. В классе проективных координат любой точки ρ е Vi имеется единственный представитель с единицей на ί-м месте; опуская эту единицу и предшествующие нули, мы получаем биёкцию Vi с Жп~*. Окончательно Рпо*Жп1)Жп-11)Жп-21) ... \}Ж*&кЖп\)Рп-К Иными словами, Рп получается добавлением к f/0 = Жп бесконечно удаленного (п—1)-мерного проективного пространства, состоящего из точек (0:λ:ι: ... :хп); в свою очередь, оно получается из аффинного подпространства V\ добавлением бесконечно удаленного (относительно V\) проективного пространства Рп~2 и т. д. в) Проективные пространства и сферы. В случае Ж=К или С есть удобный способ нормировки однородных координат в РЛ, не требующий выбора ненулевой координаты и деления на нее. Именно, любую точку Рп можно представить координатами (j*o: ... η ...: Хп) с условием Σΐ*/!2™!» τ· е. точкой на л-мерной (при* Ж=К) или (2п+1)-мерной (при Ж=С) евклидовой сфере. Степень оставшейся неоднозначности такова: точка (λχ0: ... :%хп) по-прежнему лежит на единичной сфере тогда и только тогда, когда |λ|= 1, т. е. λ = ±1 при Ж = Я9 λ = *'*, 0 < φ < 2π при J?»C. 821
Иными словами, «-мерное вещественное проективное пространство RPn получается из n-мерной сферы Sn отождествлением пар ее диаметрально противоположных точек. В частности, RP1 устроена как окружность, a RP2— как лист Мёбиуса, к которому по его границе приклеен круг (рис. 1, 2). Сложнее «увидеть» СРп: в одну точку СРп склеивается целый большой круг сферы S2n+1, состоящий из точек (#oef(p, ..., xnelv) с переменным φ. Из описания СР1 в случае б) в качестве CU {°°} ясно, что СР1 можно представлять себе как двумерную сферу Ри- мана, в которой оо представлена северным полюсом, как при сте- Рис. 1 Рис. 2 Рис. 3 реографической проекции (рис. 3). Поэтому наше новое представление СР1 в виде факторпространства S3 дает замечательное отображение S3->52, слои которого являются окружностями SK Оно называется отображением Хопфа. В описании этого пункта мы совсем забыли о линейной структуре, исходной для RPn и СРП, зато нам стали ясно видны топологические свойства этих пространств, в первую очередь их компактность. (Строго говоря, в определении Рп никакая топология не фигурировала; удобнее всего вводить ее именно с помощью отображений сфер, условившись, что открытые множества в RPn и СР" это те, прообразы которых в Sn и S2n+] открыты.) Впредь мы не будем пользоваться топологией и вернемся к изучению линейной геометрии проективных пространств. Не будет, однако, преувеличением сказать, что важность RP" и СРп в значительной мере объясняется тем, что это естественные ком- пактификации Rn и Сп, позволяющие распространить основные черты линейной структуры на бесконечность. Даже над абстрактным полем Ж, не несущим никакой топологии, эта «компактность» 222
проективных пространств появляется в массе алгебраических вариантов. Типичный пример: на аффинной плоскости две разные прямые, вообще говоря, пересекаются в одной точке, но могут быть и параллельны. Это означает, что точка их пересечения «ушла в бесконечность», и при переходе.в проективную плоскость она благополучно обнаруживается: любые две проективные прямые на плоскости пересекаются. Вернемся теперь к систематическому изучению геометрии Рп 4. Проективные подпространства. Пусть MczL — любое линейное подпространство в L. Тогда P(Af)czP(L), ибо каждая прямая лежащая в Λί, является в то же время прямой, лежащей в L. Множества вида Р(М) называются проективными подпростран-, ствами в P(L). Очевидно, Ρ(Μι(]Μ2) = Ρ(Μι)(]Ρ(Μ2), и то же верно для пересечения любого семейства. Следовательно, семейство проективных подпространств замкнуто относительно пересе·» чений. Поэтому в множестве проективных подпространств P{L), содержащих данное множество SczP(L), имеется наименьшее — пересечение всех таких подпространств. Оно называется проекте^ ной оболочкой S, обозначается 5 и совпадает с Р(М), где М—г линейная оболочка всех прямых, отвечающих точкам seS, в L При переходе от пар LaM к парам P(L)czP(M) размерности, уменьшаются на единицу, так что коразмерность dimL — dim M совпадает с коразмерностью dimP(L)—dimP(Ai). Далее, как мы уже отмечали, P(Ml(]M2) = P(M{)(]P(M2)t а Р(М{ + М2) совпа-. дает с проективной оболочкой Р(М\)[} Р(М2). Пользуясь этими замечаниями, мы можем написать проективный вариант теоремы п. 3 § 5 ч. 1. Заметим лишь, что в соответствии с определением в п. 2 размерность пустого проективного пространства следует считать равной —1: этот случай вполне реален, ибо непустые подпространства могут иметь пустое пере^ сечение. 5. Теорема. Пусть Рь Р2 — два конечномерных проективных подпространства в проективном пространстве Р. Тогда dim Ργ Π Ρ2 + dim рЛТр^ = dim Px + dim P2. 6. Примеры, a) Pi, Рг — две разные точки. Тогда dimPif|P2 — = — 1, dim Pi = dim P2 = 0, откуда dim Px \] P2 = 1, т. е. проективной оболочкой двух точек является прямая. Согласно определению проективной оболочки, она является единственной проективной прямой, проходящей через две точки. б) Допустим, что dim Pi + dim P2 ^ dim P. Тогда, поскольку dim Ρχ U P2 ^ dim Ρ, имеем dim P\f\P2^ 0. Иными словами, два проективных подпространства, сумма размерностей которых больше или равна размерности объемлющего пространства, имеют непустое пересечение. В частности, в проективной плоскости нет «параллельных» прямых: любые две прямые пересекаются либо в одной точке, либо в двух и тогда (в силу примера а)) совпадают. Аналогично, две проективных плоскости в трехмерном проективном 223
пространстве обязательно пересекаются по прямой или совпадают. Проективная плоскость и прямая в трехмерном пространстве пересекаются по точке или прямая лежит в плоскости. в) Условие ΡιΠ^2 = 0 в случае Pl=^P(Mi) означает, что Μι Π Мъ = {0}, т. е. что сумма М\ + М2 прямая. 7. Задание проективных подпространств уравнениями. Линейная функция f: L-^Ж на линейном пространстве L не определяет никакую функцию на P{L) (кроме случая f es 0), ибо всегда есть прямая в 4э-на которой эта функция непостоянна, и нет возможности фиксировать ее значение в соответствующей точке P(L). Но уравнение f = 0 определяет линейное подпространство в L и потому проективное подпространство в Р(Х). Если L конечномерно, то любое подпространство в L и потому любое подпространство в P(L) можно задать системой уравнений В однородных координатах Рп этот эффект проявляется так: система линейных однородных уравнений η Т)а;/х:у = 0, /=1, ..., т, задает проективное подпространство в Рп, состоящее из точек, однородные координаты которых (х0: ...: хп) удовлетворяют этой системе. Умножение всех координат на λ не нарушает обращения в нуль левых частей. 8. Аффинные подпространства и гиперплоскости. Пусть Μ a L — линейное подпространство коразмерности единица. Тогда Р(М)а czP(L) имеет коразмерность единица, и мы будем называть такие подпространства гиперплоскостями. Мы покажем сейчас, как ввести на дополнении Ам к гиперплоскости Р(М) структуру аффинного пространства (Ам, М, +)· Выберем в L линейное многообразие М' = т' + Λ1, не проходящее через начало координат. Оно имеет естественную аффинную структуру: сдвиг на т^М в М' индуцирован сдвигом на т в L, т. е. состоит в прибавлении т. С другой стороны, Ам и М' находятся в биективном соответствии: точка Ам есть прямая, не лежащая в Λί, и она пересекается с М' в единственной точке, которую и поставим в соответствие исходной точке Лм. Так получаются все точки по одному разу. С помощью этого биективного соответствия аффинную структуру на Λί' можно перенести на Ам. Однако выбор М' не однозначен, и это приводит к неоднозначности аффинной структуры Лм._Чтобы сравнить две такие структуры, покажем, что тождественное теоретико- множественное отображение Ам в себя является аффинным изоморфизмом этих двух структур. 9. Предложение. Пусть (Ам, М, +') и (Ам, Λί, +") — две аффинные структуры на Ам, построенные с помощью описанной конструкции. Тогда тождественное отображение Ам в себя явля- 224
ется аффинным изоморфизмом, линейная часть которого есть не* которая гомотетия М. Доказательство. Пусть две структуры отвечают подмногообразиям пг' + М и т"-\-М. Классы т' + М и т" + Μ в одномерном факторпространстве L/M пропорциональны. Поэтому можно считать, что т" = ат\ а=Ж. Умножение на а в L переводит т'+ Μ в т" + Μ и индуцирует тождественное отображение P(L) в себя и потому Ам в себя. С другой" стороны, сдвиг на вектор т^М в т! + Μ при гомотетии переходит в сдвиг на вектор am е Μ в т" + Λί. Это и доказывает требуемое. 10. Следствие. Множество аффинных подпространств в Ам с их отношениями инцидентности, а также множества аффинных отображений Ам в другие аффинные пространства не зависят от произвола в выборе аффинной структуры Ам. Это оправдывает возможность рассматривать дополнение к любой гиперплоскости в проективном пространстве просто как аффинное пространство без дальнейших уточнений. Посмотрим теперь, как выглядит проективное пространство Р(М) «с точки зрения» аффинного пространства Ам. 11. Предложение. Точки Р(М) находятся в биективном соответствии с классами параллельных прямых в Ам. Иными словами, каждая точка Р(М) есть «направление ухода на бесконечность» в Ам. Доказательство. Отождествим Ам с т'-\-М. Класс параллельных прямых в т'-\-ЬЛ определяется своей направляющей в Λί, τ. е. точкой в Р(М), и это соответствие биективно. 12. На самом деле можно сказать больше: каждая прямая / в Ам однозначно определяет содержащую ее прямую в P(L) — а именно, ее проективную оболочку 7. Проективная оболочка по^ лучается добавлением к / единственной точки, которая как раз лежит в Р(М) и является «бесконечно удаленной точкой» этой прямой. Весь класс параллельных прямых в Ам имеет общую бесконечно удаленную точку в Р(М). При отождествлении Ам с т! -\-М оболочка 7 отвечает всем прямым плоскости в L, проходящей через / и направляющую /, а бесконечно удаленная точка 7— это сама направляющая. Более общо, пусть A czAm — любое аффинное подпространство. Тогда его проективная оболочка Д в P(L) обладает следующими свойствами: а) А\АаР(М): добавляются лишь точки на бесконечности. * б) dim A = dim Ά. в) А\А есть проективное подпространство в Р(М) размерности dim А — 1. (Поэтому Ά называют также проективным замыканием А.) Отождествление Ам с m'-f-M сводит проверку этих свойств к прямому применению определений. Действительно, Ά состоит из прямых, лежащих в линейной оболочке А а т' + М. Эта линейная оболочка натянута на направляющую L0 подпространства А и любой вектор из А. Поэтому ее размерность равна dimLo4-l = 2*5
«« dim A + 1, значит, dim A = dim А. Все прямые в этой линейной оболочке пересекаются с т' + Μ, τ. е. отвечают точкам Л, за исключением прямых, лежащих в направляющей L0- Последние лежат в Р(М) и образуют проективное пространство размерности dimLo— 1 = dim^ — l. § 7. Проективная двойственность и проективные квадрики 1. Пусть L — линейное пространство над полем Ж, L* — двойственное к нему пространство линейных функционалов на L. Проективное пространство P(L*) называется двойственным к проективному пространству P(L). Каждая точка P(L*) есть прямая {λ/} в пространстве линейных функционалов на L. Гиперплоскость f = 0 в P(L) не зависит от выбора функционала / на этой прямой и однозначно определяет всю прямую. Поэтому можно сказать, что точками двойственного проективного пространства являются гиперплоскости исходного проективного пространства. Если в L и L* выбраны двойственные базисы и соответствующие системы однородных координат в P(L) и P(L*), это соответствие приобретает простой вид: гиперплоскости с уравнением atxt яв О в P(L) отвечает точка с однородными координатами (ао: ...: ап) в P(L*). Канонический изоморфизм L-+L** показывает симметрию отношения двойственности между двумя проективными пространствами. Более общо, переводя результаты § 7 ч. 1 на проективный язык, мы получим следующее соответствие двойственности между системами проективных подпространств в P(L) и P(L*) (мы считаем дальше, что L конечномерно). а) Подпространству Ρ(M)czP(L) отвечает двойственное к нему подпространство P(ML)cz P(L*). При этом dim Р(М) + dim Ρ (Af J-) = dim P (L) - 1. б) Пересечению проективных подпространств отвечает проективная оболочка двойственных к ним, а проективной оболочке — пересечение. В частности, отношение инцидентности двух подпространств (т. е. включение одного в другое) переходит в отношение инцидентности. Это позволяет сформулировать следующий принцип проективной двойственности, являющийся, собственно говоря, метаматематическим, поскольку он представляет собой утверждение о языке проективной геометрии. 2. Принцип проективной двойственности. Предположим, что мы доказали теорему о конфигурациях проективных подпространств в проективных пространствах, в формулировке которой фигурируют лишь свойства размерности, инцидентности, пересечения и взятия проективной оболочки. Тогда двойственное утверждение, в котором i 226
все термины заменены на двойственные к ним по правилам предыдущего пункта, также является теоремой проективной геометрии. Простой пример: к теореме «две разные плоскости в трехмерном проективном пространстве пересекаются по одной прямой» двойственна теорема «через две разные точки в трехмерном проективном пространстве проходит одна прямая». (В § 9 мы познакомимся с гораздо более содержательными теоремами о проективных конфигурациях.) 3. Проективная двойственность и квадрики. Если линейное пространство L снабжено изоморфизмом L-+L*, то P(L*) можно отождествить с P(L), и отображение двойственности между проективными подпространствами P(L) и P(L*) превратится в отображение двойственности между подпространствами в P(L). Задание изоморфизма L-+-L* равносильно заданию невырожденного скалярного произведения g: LXL->Jif. 'Рассмотрим подробнее геометрию проективной двойственности, отвечающую случаю, когда скалярное произведение g симметрично. Как обычно, будем считать, что характеристика поля Ж отлична от двух. Тогда g однозначно восстанавливается но квадратичной форме q(l) — Уравнение q(l)=0 определяет квадрику Q0 в L. Ее образ в P(L) мы также будем называть квадрикой, а в применении к теории двойственности — полярной квадрикой. Заметим, что Q0 есть конус с центром в начале координат: если / е Q0, то вся прямая Ж1 лежит в Qo. Отождествляя P(L) с бесконечно удаленными точками L, мы можем отождествить Q с базой конуса Q0. Согласно общей теории g и q определяют отображение двойственности множества проективных подпространств P(L) в себя; гиперплоскость в P(L), двойственная точке p^P(L), называется полярной к ρ (относительно q или Q). Чтобы разобраться в геометрическом устройстве этого отображения, выведем сначала уравнение полярной гиперплоскости в однородных координатах. Мы можем работать сначала в L. Пусть уравнение Q0 имеет вид η q(x0, ..., *„)= Σ alfx{xf = Ot α4 = αμ. Точке (a;{J, ..., х°п) в L при изоморфизме L->L*, связанном с q% η отвечает линейная функция У. аих\х, от (х0у ..., jcJeL. По- этому уравнение полярной гиперплоскости имеет вид η J^ ацх*х, = 0. В частности, если (х°0: ... : я°) & Q, то полярная гиперплоскость к данной точке содержит эту точку. Более того, в этом случае ее 227
уравнение можно переписать в виде Σ-йгК <)(*/-*?)= Σ <νΉ*/-*°/)=ο· В элементарной аналитической геометрии (над R) такое уравнение определяет касательную гиперплоскость к Q0 в ее точке (*о> ·"» х°п)· Это мотивирует общее определение: 4. Определение. Касательной гиперплоскостью к невырожденной квадрике QczP(L) в точке peQ называется гиперплоскость, полярная к ρ относительно квадратичной формы qy задающей Q. Пользуясь общими свойствами проективной двойственности, мы можем теперь немедленно восстановить геометрически значительную часть отображения двойственности и получить серию красивых и неочевидных геометрических теорем, образцы которых мы приведем. Ниже Q — (невырожденная) квадрика в Р2 или Р3. а) Пусть QczP2, pu р2 — две точки на квадрике, рг — точка пересечения касательных к Q в рх и р2. Согласно общему принципу двойственности точка р3 отвечает тогда прямой ριρ2, проходящей через р\ и р2, т. е. проективной оболочке р\ и р*. Заставим точку ръ меняться вдоль прямой I; проведем из каждой точки прямой две касательные к Q и соединим пары точек касания. Тогда все получающиеся «хорды» Q пересекутся в одной точке г, которая отвечает^ I в силу двойственности. Еще раз заметим, что для доказательства мы не нуждаемся ни в каких вычислениях: это следует просто Рис. 4 из того, что по общему принципу двойственности проективная оболочка точек Рз> Ръ* Рз'> · · · полярна к пересечению двойственных к ним прямых, которые и суть соответствующие хорды. Один момент, однако, заслуживает специального упоминания. Попарные пересечения касательных к точкам Q могут не заметать всю плоскость. Например для эллипса в RP2, как на рис. 4 (у нас нарисован, конечно, лишь кусочек аффинной карты в RP2), мы получим лишь внешность эллипса. Как же узнать, какие прямые отвечают внутренним точкам эллипса? Рис. 4 подсказывает ответ: в силу симметрии двойственности следует провести через внутреннюю точку г пучок хорд- к Q, затем построить точки пересечения касательных к Q в противоположных концах этих хорд; они и заметут двойственную к точке г прямую /. Однако, таким обраэом, описание отображения двойственности становится неоднородным. У нас оказываются два рецепта для построения прямой I, полярной к точке г. до
1) Если точка г лежит вне эллипса Q (или на нем), проведите две касательные из г к Q (или одну) и соедините точки касания прямой I (или возьмите касательную /). 2) Если точка г лежит внутри эллипса Q, проведите все прямые через г, постройте точки пересечения касательных к двум точкам пересечения прямых через г с Q. Их геометрическое место и будет прямой, двойственной к г. Оказывается, все дело в том, что основное поле R здесь не является алгебраически замкнутым. Если бы мы работали в СР2, годились бы оба рецепта, и притом для всех точек г е СР2. Вещественная прямая /, лежащая целиком вне вещественного эллипса Q, на самом деле все равно пересекается с ним, но в двух комплексно сопряженных точках, и две комплексно сопряженные касательные к Q в этих точках пересекаются уже в вещественной точке г, лежащей внутри Q. Из вещественной точки г, лежащей внутри Q, все равно можно провести две комплексно сопряженные касательные к Q, через точки касания которых проходит вещественная прямая — это и есть /. В этом смысле вещественная проективная геометрия RP2 является лишь кусочком геометрии СР2, и по-настоящему простая и симметричная теория двойственности имеет место в СР2, a RP2 отражает лишь ее вещественную часть. Классическая проективная геометрия была в значительной мере посвящена выяснению деталей этого красивого мира конфигураций, состоящих из квадрик, хорд и касательных и «невидимых» комплексных точек касания и пересечения. На самом деле вся квадрика может не иметь вещественных точек, как например хо + х\ + *2= 0· Тем не менее видимая часть двойственности разыгрывается на RP2. б) Дадим еще одну иллюстрацию в трехмерном случае: рассмотрим проективную невырожденную квадрику Q в трехмерном проективном пространстве и проведем из точки г вне Q касательные плоскости к Q. Тогда все точки касания лежат в одной плоскости, а именно в плоскости, двойственной к г. Причина снова та же: пересечению касательных плоскостей двойственна проективная оболочка точек касания, и если все касательные плоскости пересекаются в точности по г (это нужно и можно доказать в случае, когда Q имеет достато