Text
                    рым"* '
<^r
tf/
ft"
yv#<


a" ГЕРМАН ВЕЙЛЬ
МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1986
БИБЛИОТЕКА ТЕОРЕТИЧЕСКОЙ ФИЗИКИ Редактор серии Д. В. ШИРКОВ
liiuuuiUMiiuiUllUllUlliULIlUUUJIIUIIUimUUIllllllilllllllllllllllimilllllli Г. ВЕЙ ЛЬ ТЕОРИЯ ГРУПП И КВАНТОВАЯ МЕХАНИКА Перевод с английского Б. И. ГАЛАЕВА и С. Г. ШЕХОВЦОВА Под редакцией Д. П. ЖЕЛОБЕНКО МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1986
ББК 22.31 HERMANN WEYL УДК 530.145 The ШеогУ of §rouPs and quantum mechanics Translated by //. P. Robertson Dover Publications, inc., 1931 Вейль Г. Теория групп и квантовая механика. Перевод с англ./ Под ред. Д. П. Желобенко.— М.: Наука. Гл. ред. физ.-мат. лит., 1986.— 496 с. Настоящее издание является переводом первой в мировой литературе монографии по теории групп в квантовой механике (первое издание вышло в 1928 г., второе — в 1931 г.). Герман Вейль одним из первых осознал фундаментальное значение симметрии для квантовой механики, поэтому в книге с теоретико-групповой точки зрения рассматривается вся структура квантовой теории. Подробно изучается группа вращений, группа Лоренца, группа перестановок и их применение к атомным спектрам и к релятивистской теории электронов и фотонов. Для студентов, преподавателей и научных работников, специализирующихся в области теоретической, математической и экспериментальной физики. Определенный интерес книга представляет также для математиков. п 1704020000-174 f лл л/ч В псо /лоч о* Ю2-86 © Издательство «Наука». UOO (Ufj-oo Главная редакция физико-математической литературы. Перевод на русский язык, 1986
ишшт1Ш11Ш1Л11Ш1Ш1ШШЦШШШЦШШ11111111111ШШ111ШШ1Н1111Ш11Ш1Ш ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Классическая монография Германа Вейля по применению теории групп в квантовой механике — первая монография такого рода в мировой литературе. Будучи написана замечательным математиком, одним из основателей теории представлений групп, принимавшим непосредственное участие в становлении квантовой механики, она отражает знаменательный исторический период взаимодействия этих двух теорий. Являясь, в этом смысле, памятником эпохи, она и в наше время не потеряла актуального значения. Напротив, можно утверждать, что ряд идей, заложенных в этой книге, был в должной мере оценен не сразу и продолжает развиваться вплоть до наших дней. Аспекты «чистой математики», затронутые в этой книге, нашли позднее более полное выражение в известной монографии Г. Вейля «Классические группы, их инварианты и представления». Результаты, изложенные в этих книгах, представляют собой основу современной теории представлений компактных групп Ли и прообраз более поздней теории представлений локально компактных групп Ли. Например, замечательные формулы Г. Вейля для характеров^ неприводимых представлений компактных групп Ли были обобщены вначале на представления дискретных серий и затем на произвольные неприводимые представления вещественных редуктивных групп Ли. Одна из основных конструкций Г. Вейля, изложенная в этой книге и основанная на двойственности представлений симметрической группы и полной линейной группы, нашла свое дальнейшее развитие в исследованиях последних лет по теории унитарных представлений классических (в том числе бесконечномерных) групп Ли. Логический анализ квантовой теории, - предпринятый Г. Вейлем с теоретико-групповой позиции, позволил ему в свое время четко выразить некоторые положения, общепринятые в современной квантовой физике. В частности,
6 ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА именно он отметил принципиальное значение «калибровочной инвариантности», играющей столь важную роль в современной квантовой теории поля. Анализируя уравнения Дирака, он впервые отметил, что эти уравнения должны описывать симметрическую пару частиц (§ 12 главы IV), т. е. «электрон — позитрон», а не «электрон — протон», как предполагалось самим Дираком. Среди других исследований Г. Вейля по квантовой теории достаточно упомянуть его известную попытку построения единой теории гравитации и электромагнетизма (1923 г.), а также первые работы по спектральной теории эрмитовых операторов. Все эти исследования вместе с последующими известными работами И. фон Неймана легли в основу математического аппарата современной квантовой теории. В процессе перевода этой книги мы старались по возможности сохранить особенности ее языка, рассчитанного на живое общение с читателем. Терминология этой книги не всегда отвечает современным нормам и порой избыточна. В порядке исключения, мы заменили авторские термины «open» и «closed» их современными значениями «некомпактный» и «компактный». Кроме того, вместо «ray representation» мы используем более стандартный термин «проективное представление» и т. п. Более детально вопросы согласования терминов вместе с краткими комментариями изложены в примечаниях, помещенных в конце книги. Там же приводится дополнительный список литературы, позволяющий до некоторой степени проследить за дальнейшим развитием идей в теории представлений групп и в квантовой теории поля. При переводе существенно использовалось предшествующее немецкое издание 1931 г. Д. Желобенко
ШИШДишшш ."...-".■■■11Н"||И1|||111111|1Шшишиин1Ш11Ш111)1Ш1ШШ1]111Ш1ШИШ11111Ш1Ш111111111111Ш111111111ШШ11 ИЗ ПРЕДИСЛОВИЯ АВТОРА К ПЕРВОМУ НЕМЕЦКОМУ ИЗДАНИЮ В последнее время становится все более очевидным, насколько важен теоретико-групповой подход при открытии общих закономерностей квантовой теории. Поскольку я в течение нескольких лет углубленно занимался теорией представлений непрерывных групп, то мне представляется и важным, и своевременным изложить сведения, добытые работающими в этой области математиками, в такой форме, которая отвечала бы потребностям квантовой физики. Меня также побуждало и то, что с чисто математической точки зрения уже непозволительно проводить в теории представлений столь резкое различие между конечными и непрерывными группами, как это делается в существующих книгах по этому предмету. Мое желание показать на некоторых весьма важных примерах, как понятия теории групп находят свое применение в физике, сделало необходимым включение краткого очерка оснований квантовой физики, поскольку в момент написания этой книги не существовало изложения этого предмета, к которому я мог бы отослать читателя. Короче говоря, эта книга, если она отвечает своему назначению, должна дать читателю возможность изучить основные аспекты и теории групп, и квантовой механики, а также взаимоотношения, существующие между этими предметами; математические части книги написаны с ориентацией на читателя-физика, и наоборот. Я особенно выделил «взаимность» между представлениями симметрической группыv перестановок и представлениями полной линейной группы; этой взаимностью зачастую незаслуженно пренебрегают в физической литературе, и это несмотря на то, что она наиболее естественно вытекает именно из концептуальной структуры квантовой механики. На мой взгляд, существует ясно усматриваемый параллелизм между наиболее современными достижениями математики и достижениями физики. Западная математика за
8 ИЗ ПРЕДИСЛОВИЯ АВТОРА К ПЕРВОМУ НЕМЕЦКОМУ ИЗДАНИЮ 1 последние столетия отвергла точку зрения древних гре- I ков и следовала курсом, который, по-видимому, зародился I в Индии и был с некоторыми дополнениями донесен до I нас арабами; так, понятие числа при таком подходе логи- I чески предшествует понятиям геометрии. В результате I этого мы применяли наше систематически разработанное 1 понятие числа ко всем разделам, независимо от того, было I ли оно самым подходящим в этих конкретных применениях. | Однако на современном этапе в математике явно просмат- 1 ривается тенденция к возврату к греческой точке зрения; JI теперь мы считаем, что каждая ветвь математики опреде- | ляется своим собственным характерным для нее множест- |1 вом величин. Алгебраист наших дней рассматривает мно- || жество вещественных или комплексных чисел просто как I одно «поле» среди многих других; современную аксиомати- 1 ку проективной геометрии можно считать геометрической | копией этого взгляда. Эта обновленная математика, вклю- I чающая современную теорию групп и «абстрактную ал- | гебру», развивается в духе, явно отличном от общего духа | «классической математики», которая нашла свое наивысшее ' выражение в теории функций комплексного переменного. Множество вещественных чисел сохранило свою древнюю | привилегию в физике для выражения физических измере- ч ний, однако совершенно законно можно утверждать, что существо новой квантовой механики Гейзенберга — Шре- дингера — Дирака должно усматриваться в том, что с каждой физической системой связываются величины, об- J разующие — в смысле математической техники — неком- Ч мутативную алгебру, элементы которой суть сами физические величины (1)*). Цюрих, август, 1928. Г. ВейЛЬ *) Здесь и далее цифры в круглых скобках означают номер ссылки на примечания редактора перевода в конце книги. (Примеч. ред.) !
... „,и....ш.....11и|||.1ии111шиишшшш1ШШ11ШШ1ШШ11ШШШ1ШШШ1ШШ1111Ш1ШШ^ ПРЕДИСЛОВИЕ АВТОРА КО ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ В течение 1928—1929 академического года я занимал должность профессора математической физики в Прин- стонском университете. Лекции, которые я читал там и в других американских институтах, дали мне замечательную возможность представить по-новому и в более доступной форме связь между группами и квантами. Накопленный таким образом опыт нашел свое выражение в этом новом издании, в котором предмет преподносится с более элементарной точки зрения. Косвенные методы, которые в теории групп основываются на исчислении групповых характеристик, имеют то преимущество, что позволяют быстро охватить предмет в целом, но истинное понимание взаимосвязей между понятиями достигается только на пути явного элементарного построения. В этой связи я могу упомянуть: вывод ряда Клебша — Гордона, который имеет фундаментальное значение для всей спектроскопии и для приложений квантовой теории в химии; параграф о теореме Жорда- на — Гёльдера и ее аналогах; и, более всего, аккуратное исследование связи между алгеброй симметрических преобразований и симметрической группой перестановок. С элементарной точки зрения преподносятся также выражающие эту связь законы взаимности, которые в первом издании доказывались трансцендентными методами, и, кроме того, теоретико-групповая задача, возникающая из существования спина. На самом деле, вся глава V — которая была, по мнению многих читателей, слишком сжатой и более трудной для понимания, чем остальная часть книги,— полностью переписана. При этом была принята алгебраическая точка зрения, что гармонирует с недавним развитием «абстрактной алгебры», которая оказалась столь полезной в упрощении и унификации общих понятий. По- видимому, невозможно избежать изложения главной части теории представлений дважды: сначала в главе III, где L
т 10 ПРЕДИСЛОВИЕ КО ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ Ж представления предполагаются заданными и исследуются Ш их свойства, а затем в главе V, где развивается метод по- I строения представлений заданной группы и одновременно I вывода их свойств. Однако я верю, что читатель сочтет | это двукратное изложение преимуществом, а не помехой, fj Что касается изменений в физической части, то в главе U IV яснее представлена роль группы виртуальных поворотов й пространства. Но главное — добавлены несколько пара- I графов, которые имеют дело с теоремой об энергии — им- 1 пульсе в квантовой физике и с квантованием волнового 1 уравнения по недавней работе Гейзенберга и Паули. Это I расширение уже так далеко уводит от главной цели этой 1 книги, что я был вынужден опустить согласующуюся с Ц требованиями теории относительности формулировку кван- 1 товых законов, развитую В. Фоком и мной, несмотря I на то, что она нужна при выводе тензора энергии — 1 импульса. Фундаментальная проблема протона и электро- I на обсуждается в связи со свойствами симметрии кванто- 1 вых законов относительно замены правого — левым, прош- I лого — будущим и положительного электричества — от- щ рицательным. В настоящее время в поле зрения нет ника- а кого подходящего решения этой проблемы; я боюсь, что 1 облака, нависшие над этой частью предмета, соберутся в я новый кризис квантовой физики. Я намеренно подробно 1 изложил наиболее трудные части этих проблем, относящие- Ц ся к спину и вторичному квантованию, так как они по боль- 1 шей части либо полностью игнорируются, либо очень по- 1 верхностно отражаются в большом числе появившихся 1 теперь книг по квантовой механике (2). Я Ходили слухи, что «групповой бич» постепенно вытес- 1 няется из квантовой физики. Это, конечно, неверно, по I крайней мере в отношении групп Лоренца и вращений, но I что касается группы перестановок, то ее, кажется, действи- I тельно можно избежать с помощью принципа запрета Паули. 1 Тем не менее эта теория должна сохранить представления Ц группы перестановок как естественное средство понимать, я что происходит при введении спина, даже если пренебречь I его специфическим динамическим эффектом. Здесь я, еле- 1 дуя тенденции нашего времени (до тех пор, пока это оп- 1 равдано), излагал теоретико-групповой материал в как 1 можно более элементарной форме. Вычисления теории воз- 1 мущений лежали далеко в стороне от этих общих рассуж- I дений; поэтому я ограничился разъяснением метода реше- 1 ния, не вдаваясь в подробности и не упоминая большинства 1
■ШШ11Ш1ШШШ1ШиШ11ШШШ11Ш11111ШШ1Ш]Ш11ШиШ111 ПРЕДИСЛОВИЕ КО ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ Ц применений, которые базируются на искусных работах Хартри, Слейтера, Дирака и других. Константы с и h (скорость света и квант действия) создают некоторое неудобство. Понимание сущности этих констант, возникшее в теории относительности, с одной стороны, и в квантовой механике, с другой, наиболее убедительно выражает то обстоятельство, что они не возникают в законах Природы как результат полностью систематического построения этих теорий. Физики предпочитают сохранять обычные единицы СГС — в основном потому, что они дают порядок физических величин, с которыми мы сталкиваемся в повседневной жизни. Между этими практическими соображениями и идеалом последовательных теоретиков возможен лишь зыбкий компромисс; я первоначально с некоторым сожалением пользовался общепринятыми в физике единицами, но в ходе главы IV теоретик взял верх. Кроме того, для удобства читателя в этом издании принята нумерация формул с учетом параграфа, к которому они относятся, наиболее важные понятия выделяются жирным шрифтом при их введении, а в конце книги приводится список условных обозначений, имеющих одно и то же значение по всей книге. Гёттинген, ноябрь 1930. Г. Вейль
Готический алфавит Печатные буквы %а ззь &с 2П &е Sf <ЭЦ \*ь S i si &t * I a»w Рукописные буквы (la M Xr tit %* <ff 99 V 3i Ь <№ %t Mm \ Название букв a 6э цэ дэ э эф гэ ха и йот ка эль эм Печатные буквы Яп bo Vv &<| Яг <ь sf S t U u St> Шго *r И* 3 a Рукописные буквы п» Off ?? Чч Яг Щ 14 \т \<ю* Ww %ч \v* [ь Название 1 букв 1 ЭН 1 О ПЭ ку 9Р эс Ti У фау вэ икс ипсилон иэг
ВВЕДЕНИЕ Квантовая теория атомных процессов была построена Нильсом Бором в 1913 году и базировалась на предложенной раньше Резерфордом модели атома. Вывод серии Бальмера для линейчатого спектра водорода и определение постоянной Ридберга из универсальных атомных констант составили ее первое убедительное подтверждение. Эта теория дала нам ключ к пониманию закономерностей, наблюдавшихся в оптическом и рентгеновском спектрах, и привела к более глубокому пониманию структуры периодической системы химических элементов. Выпуск журнала Naturwissenschaften, посвященный Бору и озаглавленный «Десять лет теории строения [атома Н и л ь с а Бора» (1923, Bd. 11, S. 535), дает краткий обзор достижений теории в ее апогее. Однако уже в это время становилось все яснее понимание того, что теория Б о pja^ является компромиссом|между старой ^«классической» физикой и новой квантовой физикой, которая находилась в процессе развития с момента введения Планком^в 1900 году квантов энергии. В статье «Атомная теория и механика» (появившейся в журнале Nature, 1925, v. 116, p. 845) Бор описал положение вещей словами: «Из этих результатов следует, по-видимому, что в общей проблеме квантовой теории приходится иметь дело не только с видоизменением механических и электродинамических теорий, которое может быть выражено при помощи обычных физических представлений, но и с существенным недостатком пространственно- временных образов, на которых было основано до сих пор описание явлений природы*)». Гейзенберг заменил это только отрицающее пророчество Бора конструктивным основополагающим принципом, и это явилось переломом, приведшим к новому этапу теории. *) Цитируется по изданию: Бор И. Избранные научные труды—М.: Наука, 1971, т. 2, с. 13.— (Классики науки). (Примеч. пер.)
14 ВВЕДЕНИЕ В этой книге будут изложены основания новой квантовой физики или, по крайней мере, ее наиболее важные теоретические аспекты. Что касается дополнительных источников по физической стороне вопросов, затронутых в книге, я назову прежде всего четвертое издание хорошо известной книги Зоммерфельда «Atombau und Spektrallinien».— Braunschweig, 1924, или английский перевод с ее третьего издания «Atomic Structure and Spectral Lines».— London, 1923, а также более свежую книгу «Wellenmechanischer Erganzungsband», 1929, или ее английский перевод «Wave Mechanics», 1930 *). Эквивалентной английской книгой является «Atoms, Molecules and Quanta».— New York, 1930, Руарка и Ури, которая вышла в серии «International Series in Physics», редактируемой Рихтмайером. Следует также порекомендовать короткий, но содержательный обзор Герлаха «Experimented Grundlagen der Quantentheorie».— Braunschweig, 1921. Спектроскопические данные, упорядоченные в соответствии с новой квантовой теорией, вместе с полной библиографией приводятся в следующих трех томах серии «Structur der Matherie», выходящей под редакцией Борна и Франка: Хунд Ф. Linienspectren und periodisches System der Ele- mente, 1927; Бак Е. и Ланде A. Zeemaneffekt und Multiplettstruktur der Spektrallinien, 1925; Гротриан В. Graphische Darstellung der Spektren von Atomen und Ionen mit ein, zwei und drei Valenzelektronen, 1928. Обсуждению спектроскопических аспектов предмета также посвящена недавняя книга Паулинга и Гоудсмита «The Structure of Line Spectra», 1930, недавно вышедшая в серии «International Series in Physics». Развитие квантовой теории стало возможным только благодаря огромному прогрессу экспериментальной техники, которая дала почти прямое проникновение в атомные процессы. Если в дальнейшем будет мало говориться об экспериментальных фактах, это не следует относить к ма- *) Имеются переводы: Зоммерфельд Л. Строение атома и спектры: Пер. со второго нем. изд.—М. —Л.: ГИЗ, 1926. —(Современные проблемы естествознания); Волновая механика.— Л. — М.: Гостех- издат, 1933. Кроме того, в 1951 году вышло расширенное издание «Atombau und Spektrallinien» в 2-х томах ^которое включает обе предыдущие книги. Имеется его перевод: Строение атома и спектры.—М.: Гостехиздат, 1956, тт. 1, 2. (Примеч. пер.)
ВВЕДЕНИЕ 15 тематическому высокомерию автора; рассказ об этих вещах выходит за рамки книги. Позвольте мне здесь выразить раз и навсегда мое глубокое почтение к работе экспериментатора и к той борьбе за значительные факты, которую он ведет с неподатливой природой, так отчетливо говорящей нашим теориям «Нет» и так нечетко «Д а». Наше поколение — свидетель такого развития физического знания, какого не было со времен Кеплера, Галилея и Ньютона, и математика едва ли когда- либо прежде переживала такую бурную эпоху. Математическая мысль, высвобождая идею из оболочки реального мира и придавая ей самостоятельную жизнь, отказывается тем самым от проникновения в тайны природы. Но в награду за это математика меньше физики связана с течением процессов в реальном мире. В то время как квантовая теория может быть прослежена только до 1900 года, истоки теории групп затеряны в прошлом, едва ли доступном истории; даже наиболее ранние работы по искусству показывают, что уже тогда были известны группы симметрии плоских фигур, хотя их теории была придана определенная форма только в последней части восемнадцатого и в девятнадцатом столетиях. Ф. К Л е й н считал понятие группы наиболее характерным для математики девятнадцатого века *). До настоящего времени наиболее важным его применением в естественных науках было описание свойств симметрии кристаллов, однако недавно было установлено, что теория групп имеет фундаментальное значение для квантовой теории; она вскрывает существенные черты, которые не являются следствием ни специальной формы динамических законов, ни специальных предположений о действующих силах. Вполне можно ожидать, что теория групп — именно та часть квантовой физики, которая займет наиболее прочное положение. Две группы, группа вращений в 3-мерном пространстве и группа перестановок, играют здесь главную роль, поскольку, во-первых, законы, которым подчиняются возможные конфигурации электронов, сосредоточенных около неподвижного ядра атома или иона, сферически симметричны по отношению к ядру, а, во-вторых, так как различные электроны, входящие в атом или- ион, тождественны, то их возможные конфигурации инвариантны относительно перестановки отдельных электронов. Теория *) См.: Клейн Ф. Лекции о развитии математики в XIX столетии.—М.—Л.: ОНТИ, 1937, ч. 1. — (Примеч. пер.)
16 ВВЕДЕНИЕ представлений групп линейными преобразованиями — первая связная и полная теория, к которой приводит исследование групп,— является в точности тем чрезвычайно ценным математическим языком, который необходим для адекватного описания соотношений квантовой механики. Все квантовые числа, за исключением так называемого главного квантового числа, являются индексами, характеризующими представления групп. Эта книга, цель которой — изложить связь между группами и квантами, состоит из пяти глав. Первая из них посвящена унитарной геометрии. Несколько прискорбно, что теорию линейных алгебр снова и снова приходится излагать с самого начала, поскольку фундаментальные понятия этой ветви математики широко используются в математике и физике и знание их должно быть так же широко распространено, как знание элементов дифференциального исчисления (3). Многие вещи в этой главе будут введены с учетом будущих приложений; несмотря на это, я надеюсь, что нить рассуждений останется легко обозримой. Вторая глава посвящена подготовке к уяснению физической стороны дела, причем дан только тот материал, который, как мне кажется, необходим для понимания смысла и методов квантовой теории. Я опустил разнообразные применения, уже полученные методами квантовой теории при описании физических явлений. В третьей главе изучаются элементарные вопросы теории представлений групп, а их применению в квантовой физике посвящена глава IV. Математика и физика, чередовавшиеся в первых четырех главах, сливаются в пятой, показывая, таким образом, как математическая теория полностью приспосабливается к требованиям квантовой физики. В этой последней главе досконально изучаются группа подстановок и ее представления вместе с группами линейных преобразований в аффинном или унитарном пространстве произвольного числа измерений.
ГЛАВА I УНИТАРНАЯ ГЕОМЕТРИЯ § 1. Векторное пространство п измерений Математическим понятием, с которым оперируют как квантовая механика, так и теория представлений групп, является понятие многомерного аффинного, или унитарного пространства. Без сомнения для построения геометрии такого пространства наиболее удобен аксиоматический метод, но ради ясности я сначала буду следовать чисто алгебраическим путем. Поэтому я начну с определения вектора j в n-мерном линейном пространстве 3ft ■■ Шп как упорядоченного набора п чисел (хи дс2, ..., хп); векторный анализ есть исчисление таких упорядоченных наборов. Двумя фундаментальными операциями векторного исчисления являются умножение вектора j на число а и сложение двух векторов j и ^. После введения обозначений J = (*i, *«, •-., *„), l) = (#i, У» ■■-.У») эти операции определяются равенствами flS = (flEif flb, .-., а&я)9 S + 9=-(*i + »i. •••. *«+Уп)- Фундаментальные правила, которым подчиняются эти операции умножения на число и сложения, приводятся в следующей таблице аксиом, где строчные готические буквы обозначают произвольные векторы, а строчные латинские буквы — произвольные числа: (а) Сложение. 1. а + Ъ = Ъ + а (закон коммутативности). 2. (а + Ь) + с = а + (6 + с) (закон ассоциативности). 3. Для любых двух векторов а и с существует один и только один вектор j такой, что а + ? = с. Он называет-
18 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ ся разностью с—а векторов с и а (возможность вычитания), (Р) Умножение. 1. (а + b) i = (aj) + (6j) (первый закон дистрибутивности). 2. a(bi) = (ab)i (закон ассоциативности). 3. lj-s. 4. а ($ -f- ц) = (aj) + (ац) (второй закон дистрибутивности). Существование вектора 0=.(0, 0, ..., 0) со свойствами S+0=0+s«j не требуется постулировать отдельно, так как это следует из аксиом. Аффинная векторная геометрия имеет дело с понятиями, которые полностью определяются в терминах двух фундаментальных операций, свойства которых задаются аксиомами (а) и (р); мы упомянем несколько наиболее важных понятий. Говорят, что несколько векторов аи а2, ... ..., аЛ являются линейно независимыми, если между ними не существует ни одного однородного линейного соотношения с1а1 + с2а2+... +chah = 0 кроме тривиального с коэффициентами Ci = 0, с2 = 0, ..., сЛ=:0. Говорят, что h таких векторов порождают h-мерное (линейное) подпространство Ш', которое состоит из всех векторов вида l = 5л + Бл + • • ■ + biflhf (1Л) где £х, ..., lh—произвольные числа. Из фундаментальной теоремы об однородных линейных уравнениях следует, что существует нетривиальное однородное соотношение между любыми А+1 векторами из Ш . Поэтому размерность h подпространства W можно характеризовать независимо от базиса: любые h + 1 векторов из 9Г линейно зависимы, но в нем существуют h линейно независимых векторов. Любую такую систему из h линейно независимых векторов cti, a2, ..., ал в подпространстве W можно использовать как систему координат или базис
§ 1. ВЕКТОРНОЕ' ПРОСТРАНСТВО п ИЗМЕРЕНИЙ 19 в Ы'\ тогда говорят, что коэффициенты \и £2, ..., %h в представлении (1.1) являются компонентами вектора j в системе координат (с^, а2, ..., аЛ). Все пространство Ш является м-мерным и векторы е1-(1, 0, 0, ...,0), е2=(0, 1, 0, ..., 0), /1 2) *я = (0, 0, 0, ..., 1) определяют в нем систему координат, в которой компоненты вектора J= (Xl9 Х2> • • • > Хп) совпадают с «абсолютными компонентами» xt\ 1^х1е1 + х2г2+ ...+хягя. Однако с точки зрения аффинной геометрии «абсолютная система координат» (1.2) не имеет никакого преимущества перед любой другой, состоящей из п независимых векторов из ffi. Теперь мы добавим к предыдущим аксиомам, которые сами по себе не имеют отношения к размерности л, аксиому размерности: (у) Максимальное число линейно независимых векторов в Ш равно п. Этих аксиом, (а), (Р) и (у), достаточно для полного построения векторного исчисления, поскольку, если tu e2, ... ..., е„ — произвольный набор из п независимых векторов и х—любой другой вектор, между ними обязательно должна существовать линейная зависимость a$-\-a1t1 + + а2е2 + ... +аяе„ = 0. Коль скоро не все коэффициенты обращаются в нуль, мы, в частности, должны иметь афО, и потому любой вектор j можно представить в виде линейной комбинации j = хггг + *2е2 + ... + хпгп (1.3) «базисных векторов» ги е2, ..., е„. Мы однозначно определяем х при помощи набора компонент (хи х2, ..., хп) в этой системе координат. Таким образом, в силу аксиом (а) и (Р) для сложения и умножения, для любых двух векторов j и 1) вида (1.3) имеем aj=(a*1)e1+ ...+(ахп)гп, ? + 9 = (*i+#1)ei+. ••+(*„ + #„) еЛ,
20 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ т. е. мы приходим к определениям, с которых начали. Единственным, но важным, различием между арифметической и аксиоматической трактовками является то, что в первой трактовке абсолютной системе координат (1.2) отдается предпочтение перед любой другой, тогда как в последней трактовке такого различия не делается. щ Пусть дана произвольная система векторов. Все векторы, которые получаются как линейные комбинации вида (1.1)|некоторого конечного числа векторов а1э а2, ... ..., аЛ этой системы, образуют (линейное) подпространство—подпространство, «натянутое» на векторы а. Говорят, что пространство Ш приводится или разлагается на два линейных подпространства ffi\ 91* (9Г = = 9Г + 90> если произвольный вектор у можно единственным образом представить в виде суммы вектора %' из Si' и вектора f из W. Система координат в $' и система координат в 9Г вместе образуют систему координат для всего пространства 91; такая система координат пространства Ш называется «согласованной» с разложением 9Г + 9Г. Сумма п' + п" размерностей подпространств 9i' и 91* равна п—размерности пространства 9?. Наоборот, если подпространства 9Г, 9Г не имеют ни одного общего вектора, кроме нулевого, и если сумма их размерностей есть л, то 91 = ffi' + 91". Пусть 91'—м'-мерное подпространство. Говорят, что два вектора j и I) конгруэнтны по модулю 91': 5 = *> (mod Г), если их разность лежит в подпространстве 9Г. Конгруэнтность удовлетворяет аксиомам, определяющим любое отношение эквивалентности: каждый вектор конгруэнтен сам себе; если j = ty (mod9t'), то i) = j (mod9i); если S = i) (mod 9i') и \) = ъ (mod9t')> то у = ъ (modST). Поэтому допустимо рассматривать векторы, конгруэнтные mod9t', как ничем не отличающиеся друг от друга; с помощью этой абстракции, которую мы называем проецированием вдоль 9t\ из n-мерного пространства 91 возникает (п—/г')-мерное пространство SWt. В самом деле, 9t также является векторным пространством, поскольку из соотношений ?1 = ?2> 9i = 92 (mod 9t') следуют соотношения aji ss aj2, й + to ■- Ь + fc (mod 9i').
§ 1. ВЕКТОРНОЕ ПРОСТРАНСТВО п ИЗМЕРЕНИЙ 21 Поэтому операции умножения на число и сложения можно рассматривать как операции, которые действуют непосредственно на векторы j из 81. Все векторы j пространства 9ft, конгруэнтные mod 9ft', определяют один и тот же вектор $ из 9fc. Если 9ft' одномерно и натянуто на е, то изложенный выше процесс подобен процессу параллельного проецирования в направлении е; ясно, что нет необходимости задавать (п—1)-мерное подпространство из 9ft, на которое производится это проецирование (5). Если а—ненулевой вектор, то говорят, что все векторы J, получаемые из а умножением на числа, лежат на том же луче, что и вектор а. Два ненулевых вектора определяют один и тот же луч тогда и только тогда, когда один является кратным другому. Если задана система координат, то вектор а полностью определяется своими компонентами а1У а2, ..., ап, тогда как луч а характеризуется отношениями компонент а^.сц:... :ап. Эти отношения имеют смысл, только когда не все компоненты вектора а равны нулю, т. е. только когда афО. Переход от одной системы координат е/ к другой г\ описывается путем выражения новых координатных векторов г\ через старые: п е* = 2 atk*i- Если #/, х\ суть компоненты произвольного вектора j соответственно в старой и новой системах координат, то S —2*А —2****. i k откуда следует закон преобразования: п */=2,«<*4- (1.4) &— 1 Условие линейной независимости новых координатных векторов t'k можно выразить арифметически как условие, что определитель из коэффициентов aik не обращается в нуль. При переходе к новой системе координат г\ компоненты векторов j, X), ... пространства 9ft подвергаются одному и tTOMy 'же преобразованию; мы будем говорить, что оця преобразуются когредиентно.
22 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ § 2. Линейные отображения. Матричное исчисление Формулу (1.4) можно интерпретировать иначе, а именно как выражение линейного или аффинного отображения пространства 9J на себя. Однако для этого, как будет видно, удобнее поменять ролями штрихованные и нештрихованные координаты. После выбора определенной системы координат е/ уравнение п *1—2 я/Л (2.1) связывает произвольный вектор $ с компонентами xt с вектором $' с компонентами х\. Это отображение ^:?—^1*' пространства 3? в себя можно характеризовать как линейное, поскольку, если векторы j, t) переходят в ?', t)\ то вектор oj переходит в aj\ а вектор j + t) переходит в вектор $' + *)'• Поэтому линейные отображения оставляют неизменными все аффинные отношения; это свойство определяет их значение в теории аффинной геометрии. Чтобы показать, что эти два условия полностью определяют линейное отображение (2.1), заметим следующее: если отображение Л, удовлетворяющее этим условиям, переводит базисный вектор tk в е* = 2^/> (2.2) t то, вследствие наложенных требований, вектор переходит в 5 =#1с1-|- ... -\- xntn- Подставив соотношение (2.2) в это равенство, мы видим, что новый 'вектор j' имеет в системе координат г{ компоненты x'i9 которые получаются из компонент л:/ вектора $ при помощи соотношений (2.1). В квантовой физике стало обычным называть линейные отображения векторного пространства 8t операторами, которые действуют на произвольный вектор $ из 9ft. Пусть Л, В—два линейных отображения, первое из которых переводит произвольный вектор j в j' = Лj, в то время как второе переводит j' в f = B$'t=B(A$). Результирующее отображение С, которое переводит j непосредственно в $", также является линейным и обозна-
§ 2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. МАТРИЧНОЕ ИСЧИСЛЕНИЕ 23 чается (В А) (читается справа налево\): (BA)i = B{Ai). Это «умножение» удовлетворяет законам, которые подобны законам умножения обыкновенных чисел; в частности, здесь справедлив закон ассоциативности С (ВЛ) = (СВ) Л, однако закон коммутативйости не выполняется, поскольку, вообще говоря, АВфВА. В этом множестве «единицей», которую здесь мы обозначим 1, является тождество, т. е. такое отображение, которое сопоставляет каждому вектору j самого себя: J —*$. Следовательно, Л1 = 1Л = Л. Отображение А обратимо тогда и только тогда, когда оно невырождено; это значит, что ни один ненулевой вектор не переводится в вектор 0 или что различные векторы переводятся в различные. Алгебраическим выражением этого является условие, что определитель | atk | = = det,4 не обращается в нуль. В этом случае существу- * ет обратное отображение Л"1: ЛЛ-1 = Л-1Л = 1. По теореме умножения для определителей det(BA).= detB.detA. Мы можем не только «умножить» два отображения, мы также можем их «сложить». Это понятие сложения возникает совершенно естественно: если произвольный вектор j переводится в ^ под действием Л и в й под действием В, то отображение, которое переводит $ в Ji + $2» также является линейным и обозначается Л + В: (A + B)i = Ai + Bi. Кроме того, мы можем ввести умножение отображения на произвольное число а, а именно, а А есть отображение, которое переводит j в а(А%). Операции сложения и умножения на число для отображений подчиняются тем же законам, что и аналогичные операции над векторами. Сложение коммутативно и в качестве своего обращения имеет вычитание. Роль нуля играет отображение 0, которое каждый вектор j преобразует в нулевой вектор 0.
24 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Сложение подчиняется закону дистрибутивности по отношению к умножению: (А + В)С = АС + ВС, (аА)С = а(АС)9 С(А + В) = СА + СВ9 С(аА) = а(СА). Прежде чем перейти к арифметическому выражению этих операций в заданной системе координат, мы рассмотрим еще одно естественное обобщение. Мы можем линейно отобразить m-мерное векторное пространство ffi в n-мерное пространство @; для этого нужно каждому вектору $ из Ш сопоставить Некоторый вектор X) из © (обозначается ?-**)) таким образом, что из jx —► ^i» &—*9« следует Так определенное отображение А: j —* I) выражается равенствами вида т #* = 2 akixi (*=1, 2, ..., п)9 (2.3) где л^, ..., хт—компоненты вектора j в некоторой системе координат, заданной в пространстве 9ft, а уи ..., уп имеют аналогичный смысл в ©. Этому отображению сопоставляется матрица I an а12... а1т «21 022 • • • #2/я Ял1 Ял2 • • • апт состоящая из п строк и т столбцов, которую мы обозначаем той же буквой А. Первый индекс указывает строку, а второй—столбец, которым принадлежит ak{. Как и прежде, мы можем складывать отображения данного пространства ffi в данное пространство @. При сложении матриц и умножении их на число каждая из их п-т компонент подвергается соответствующей операции: если л=|Ы1и в=\ьй\, ТО aA=\a-akt\\, А + В = \\аи + Ьи\\. Если имеется третье (р-мерное) векторное пространство £, то последовательное применение отображения A: j—>t) пространства Ш в © и отображения В: ц—>g простран-
§2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. МАТРИЧНОЕ ИСЧИСЛЕНИЕ 25 ства © в % приводит к возникновению отображения С = ВА: j —* 5 пространства 9ft в St. На языке матричных компонент эта композиция выражается в виде закона: 1-1. 2, ....«)• <2'4> Здесь 5 имеет р строк и п столбцов, а матрица А—п строк и т столбцов; такая композиция матриц возможна, когда у первого сомножителя В столько же столбцов, сколько у второго сомножителя А строк. Компонента или элемент cliy который располагается на пересечении /-й строки и 1-го столбца, формируется по формуле (2.4) из компонент 1-й строки матрицы В и 1-го столбца матрицы А. Важный частный случай возникает, когда % — то же самое пространство, что и 9ft, тогда А является отображением пространства 9ft в @, а В—пространства © в 9ft. Уже здесь понятия теории групп играют важную роль; в начале главы III, в которой изучается теория групп, читателю следует вернуться к материалу, изложенному здесь в качестве иллюстрации. Матричное исчисление позволяет нам выражать формулы для' линейных отображений типа (2.3) в сокращенной форме. Для этого обозначим через х такую матрицу, чей единственный столбец состоит из компонент вектора хи х2, ..., хт\ аналогично поступим в отношении у. В силу правила (2.4) для композиции матриц равенства (2.3) можно записать в виде у = Ах. (2.5) В частности, эта форма полезна при исследовании действия, которое оказывает замена первоначальной системы координат новой, на матрицу А линейного отображения пространства 9ft в пространство ©. Если эта замена координат осуществляется преобразованиями X(=^Sijx) или x = Sx' в 9ft, Уь^ЪЧнУ'н или у = Ту' в ©, h то в силу (2.5) имеем Ту' = ASx' или у' - (Г-MS) х'.
26 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Поэтому то же самое отображение в новых координатах выражается матрицей , A'^T^AS. (2.6) Давайте теперь вернемся к линейному отображению А пространства Ш в самого себя. Пусть 9Г есть л'-мерное линейное подпространство из 9с. Мы говорим, что А оставляет 9Г инвариантным, или что Ш' инвариантно относительно Л, если А переводит любой вектор из 9i' в вектор из 9Г. Если система координат выбрана так, что первые п' базисных векторов лежат в 9ft', то матрица отображения, которое оставляет 9Г инвариантным, выглядит так, как это изображено на рис. 1. Рис. 1 Рис. 2 Все элементы в прямоугольнике из п' столбцов и п—п' строк, обозначенном нулями на рис. 1, равны нулю. Отображение А определяет отображение 9Г в себя и—в то же самое время—отображение пространства 9* в себя, возникающее при проецировании ffi вдоль 9i'. Матрицы этих отображений суть матрицы в заштрихованных квадратах. Если же 91 разлагается в 9tx + 9t2 (tti + M2 — n) и если отображение А составляет оба подпространства 9?i и 9t2 инвариантными, то А полностью приводится к отображению 9ti в себя и отображению 9t2 в себя. Если система координат приспособлена к разложению 9ti + 9t2» T0 матрица А полностью приводится к двум квадратным матрицам, выстроенным вдоль главной диагонали, как показано на рис. 2. Незаштрихован- ные прямоугольники—пустые: все элементы, расположенные в этих частях, равны нулю.
§2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. МАТРИЧНОЕ ИСЧИСЛЕНИЕ 27 Пусть /i-мерное линейное пространство Ш разлагается на подпространства 3ftx + 9t2 + • • • + 9£а + - - •, имеющие размерности ма, тогда п равно сумме п1 + п2+... В этом случае любой вектор j можно единственным образом записать в виде суммы Ji + J2 + • • •, компоненты которой лежат в подпространствах Ш19 9?2> • • • Соответствие J—*?а является линейным отображением Еа пространства Ш на 8ta. Задав отображение Л: j —*j' пространства ?ft в себя, мы рассмотрим такое линейное отображение [Л]аР, которое переводит произвольный вектор j из Ш$ в компоненту j£ вектора j' из 9?а. Мы называем [Л]ар частью отображения Л, в которой dla скрещивается с Ш$. Эта терминология проистекает из матричного представления отображения Л; приспособив систему координат к разложению 3ti + 9t2+--«, мы разбиваем набор переменных х{ (или, точнее, их индексов I, которые нумеруют строки и столбцы матрицы) на сегменты длины па (а=И, 2, ...). Матрица Л разделяется таким образом на отдельные прямоугольники [Л]ар, в которых а-е множество строк скрещивается с Р-м множеством столбцов и которые состоят из па-п^ элементов. Если Л является матрицей отображения пространства Ш в себя,в заданной системе координат, а Л'—матрица этого отображения в системе координат, полученной из первой путем обратимого преобразования S, то согласно (2.6) Л'-S-MS. (2.7) Поиск инвариантного способа описания отображений можно сформулировать алгебраически: найти такие выражения от компонент произвольной матрицы, которые принимают одинаковые значения для эквивалентных матриц, т. е. для матриц Л, Л', удовлетворяющих соотношению (2.7). Путь, на котором этого можно достичь, указывается родственной задачей нахождения вектора %Ф0, который под действием отображения Л преобразуется в кратный себе вектор A,j. Столбец х из координат вектора j должен тогда удовлетворять уравнению Хх=Ах или (XI— Л)х = 0. i L
28 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Но п линейных однородных уравнений с п неизвестными имеют ненулевое решение, только если их определитель обращается в нуль; следовательно, множитель X должен быть корнем «характеристического многочлена» f(X) = det(Xl—A) (2.8) матрицы А. Этот многочлен является инвариантом в указанном выше смысле, поскольку из (2.7) или равносильного равенства SA' = AS следует, что S(Xl— A') = {X\— A)S, откуда при помощи теоремы об умножении определителей detS.det(Xl—A') = det(Xl — A).detS. Так как определитель обратимого преобразования S не может обратиться в нуль, мы можем разделить на него и получить требуемое тождество [М— А'\ = \Х1— А\. Характеристический многочлен имеет степень п по X: f(X) = X»—s1X»-1+...±sn; его коэффициенты (некоторые целые рациональные функции элементов aik) являются инвариантами отображения А. «Норма» (6) sn есть просто определитель матрицы Л. Первый коэффициент, след Si = a11 + a22+ ... + ann=*tr Л, (2.9) является более важной величиной, так как он линейно зависит от aik: tviAi + AJ^trAi + trAt. Если А—линейное отображение m-мерного векторного пространства 9t в n-мерное пространство ©, а В—напротив, линейное отображение пространства @ в 9ft, то мы можем построить отображения В А пространства Ш в себя и АВ—пространства © в себя. Эти два отображения имеют одинаковый след tr(BA)=*tr(AB)9 (2.10) поскольку в силу правила композиции (2.4) и определе-
§3. ДВОЙСТВЕННОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО 29 ния (2.9) мы имеем tr (В А) = 2 &|A*. tr (Ав) = 2 akJbiH9 t, k i, k где i меняется от 1 до m, a k—от 1 до п. Частный случай, в котором и А и В суть отображения пространства $1 в себя, естественно, заслуживает детального рассмотрения. § 3. Двойственное векторное пространство Функция L(j) произвольного вектора j, имеющая вид ал + а2х2 + ... + апхп, (3.1) называется линейной формой. Это понятие инвариантно в смысле аффинной геометрии: оно может быть определено при помощи функциональных свойств L(aj) = ocL(5), Lfe + tf-LfeJ + Lfo). Ясно, что выражение (3.1) обладает этими свойствами, и наоборот, после введения системы координат г{ и подстановки J «2*1*1 получим Мх)-2*/-(*!)=2 <w. ai=Lbi)- i i При переходе к другой системе координат, в которой компоненты xt произвольного вектора $ подвергаются преобразованию (1.4), линейная форма принимает вид 2алв2а«*Ь где коэффициенты а\ связаны с первоначальными at равенствами а£ —2 _ aik*i- Говорят, что коэффициенты а, линейной формы преобразуются контригре due нтно относительно переменных xt. Однако нет необходимости рассматривать at как константы, а х{ как переменные. Когда не все а, равны нулю, уравнение L(j)=О определяет «плоскость», т. е. (п—^-мерное подпространство; вектор j лежит в этой плоскости, если его компоненты удовлетворяют этому уравнению. Но, с другой стороны, мы можем заинтересоваться уравнением
30 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ ] всех плоскостей, которые проходят через заданный ненулевой вектор j°, тогда xl = x°i являются константами, a at — переменными. Следовательно, наиболее удобно рассматри- ] вать эти два набора (х1У х2, ..., хп) и (аи а2, ..., ая) | равноправно. Поэтому мы введем, кроме пространства 9t, второе м-мерное векторное пространство Р, называемое двойст- венным пространством. По компонентам (£1? £2, ..., 1п) вектора I из Р и (хи х2, ..., хп) вектора j из Ш мы можем j построить внутреннее или скалярное произведение Бл + 6л+---+Бл- (3.2) Это произведение по определению имеет инвариантный | смысл, поскольку если отнести пространство Э£ к новой 1 системе координат посредством преобразования перемен- | ных х1у то переменные \t из двойственного пространства Р I подвергнутся контрагредиентному преобразованию. Это 1 двойственное пространство на самом деле для того и вво- 1 дится, чтобы мы могли сопоставить каждому взаимно од- 1 нозначному преобразованию контрагредиентное ему пре- I образование. Повторим: два обратимых линейных преоб- | разования I х=*Ах\ Б-АГ (3.3) J являются контрагредиентными друг другу, если они со- I храняют форму (3.2) неизменной: I Бл + Бл+ • • • +Б,л» — К*; + К*;+ • • • +6^я- (3.4) I Говорят, что вектор j из Ш и вектор I из Р находятся 1 в инволюции, если их произведение (3.2) обращается в нуль. I Прямая из SR определяет плоскость в Р, т. е. плоскость, 1 состоящую из векторов в инволюции с данной прямой, и 1 наоборот. Двойственность является обратимым отноше- | нием *). I Матрица Л*, двойственная или транспонированная I матрице Л»||а^||, получается заменой строк матрицы А I столбцами. Поэтому Л* = |а^|| определяется равенствами! а\ь***ан и имеет т строк и п столбцов. Мы всегда будем! использовать звездочку для обозначения этого процесса.! Какова же ее геометрическая интерпретация? Пусть Ш — I m-мерное, а ©—л-мерное векторные пространства;! *) В теории относительности векторы из Ж и Р обычно называют! контравариантными и ковариантными векторами соответственно. 1
§3. ДВОЙСТВЕННОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО 31 A: J—**)—линейное отображение 91 в ©, описываемое матрицей Л в заданных системах координат пространств Ы и ©: и пусть Р, 2—соответствующие двойственные пространства. Произведение 2 ЧаУ* *= 2 я«ЧЛ ( =2 h*i). в котором т| — произвольный вектор из 2 с компонентами г]г, имеет тогда инвариантный смысл. Поэтому билинейная форма, зависящая линейно от вектора т) из 2 и вектора 2 из Ш, инвариантным образом связана с линейным отображением пространства 9? в ©, и обратное тоже верно. Как показывает данное в скобках выражение билинейной формы, это соответствие определяет отображение Ч-тБ: Ei = 2*ai4* к пространства 2 в Р, т. е. отображение Л*, двойственное отображению А, Обратимое отношение между отображением А и двойственным ему А* можно описать так: если 2—произвольный вектор в 91 и г|—произвольный вектор в 2, то произведение векторов Л2 и г\ равно произведению 2 и Л*т). Эти двойственные отображения подчиняются линейным законам (Аг + А^^А1 + А1 (аА)* — аА\ Если А—отображение 91 в @, а В—отображение © в $£, то В А отображает 9i линейно на 5£, а А*В* отображает пространство Т, двойственное к %, на пространство Р, двойственное к 91, поскольку {ВА)*±А*В*. (3.5) Мы раз и навсегда договорились рассматривать набор *i» х%9 ..., хп компонент вектора 5 как столбец; поэтому скалярное произведение вектора j из 91 на вектор £ из Р можно записать в матричном виде как Ъ*х или *•£. Следовательно, преобразования (3.3) (где х* = х'*А* согласно первому из равенств) контрагредиентны между собой при условии, что Л*А-1 или А-=(Л*)-\ (3.6) L
32 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ т. е. мы пришли к явному выражению для контрагреди- ентного преобразования. Пусть ffi'—я'-мерное подпространство из 9£ = 9£Л. Согласно простейшим теоремам о линейных однородных уравнениях все векторы из Р, которые находятся в инволюции со всеми векторами из ЭГ, очевидным образом составляют (п—м')-мерное подпространство Р' в Р. Отсюда сразу получаем: если отображение А пространства Ш в себя оставляет подпространство Ы' инвариантным, то двойственное отображение А* пространства Р в себя оставляет инвариантным подпространство Р'. Пусть 9i разлагается в сумму двух или более подпространств 9fti + $t2+--- размерностей пи л2, ..., и пусть через Рх обозначается подпространство из Р, которое состоит из всех векторов, находящихся в инволюции со всеми векторами из 9?а + 9£3+ ...; размерность такого подпространства также равна пх. Определяя аналогично Р2, Р3, ..., мы приходим к разложению Р = Рх + Р2 + • • •, ибо сумма вектора из Plt вектора из Р2 и т. д. может быть нулем только тогда, когда каждый из слагаемых векторов равен нулю. Чтобы доказать последнее утверждение, заметим, что если сумма равна 0, то первое слагаемое принадлежит как Р1э так и Р2 + Р3+...,т.е. оно находится | в инволюции с векторами как из 9ft2 + 9t3 + • • • > так и из Ыи и поэтому со всеми векторами из St. Но это возможно только тогда, когда это слагаемое, и, следовательно, любое, есть нуль. Пространство Рх можно рассматривать как двойственное с fftu поскольку для любого вектора j из 9ti и любого вектора т) из Р, который имеет компоненты т|(а) в различных Ра, произведение j и г) равно произведению X и г)(1>. Если отображение А пространства 31 в себя оставляет л'-мерное подпространство 91' инвариантным, то соответствующее (п—я')-мерное подпространство Р' инвариантно относительно двойственного отображения А* пространства Р в себя. Если 9£ разлагается в Sti + 3tt+... и если А оставляет инвариантным каждое из подпространств 9fta, то Л* оставляет инвариантным каждое из подпространств Ра. Если**Л—произвольное отображение в 9ft и [А]а&—его [часть," в которой J #ta скрещивается с 9?э, то часть [Л*]ца отображения Л*, в которой скрещиваются Р$\ и Ра, двойственна с [Л]аэ: lA*]t»-[AU (3-7
§ 4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 33 Часть [Л]ар отображает 9£э на 9ia, а [А*]&а отображает двойственное пространство Ра на Рр. Все эти результаты концептуально очевидны, но их даже легче получить просто из матриц, если выбрать в 9fti + 9^2 + • • • удобную систему координат. § 4. Унитарная геометрия и эрмитовы формы Метрика вводится в аффинную геометрию посредством нового фундаментального понятия: абсолютной величины вектора. В качестве квадрата абсолютной величины вектора £ = (#1, х2, ..., хп) в евклидовой геометрии выбирается сумма квадратов s»-*5+*8+...+*i (4.1) его компонент. Тогда единственными допустимыми системами координат, и притом в равной степени допустимыми, являются декартовы системы, т. е. системы, в которых квадрат абсолютного значения вектора % задается через компоненты xt формулой (4.1); в качестве области значений, которые в таком случае компоненты могут принимать, выбирается множество всех действительных чисел. Однако содержание предшествующих параграфов не ограничено этим случаем; в действительности единственное требование таково: область допустимых значений образует «поле», в котором выполнимы четыре фундаментальные операции, исключая деление на нуль. Ниже мы рассматриваем в качестве области значений компонент множество всех комплексных чисел. Выражение (4.1) в этом случае теряет свой определяющий характер; сумма квадратов может обращаться в нуль и тогда, когда не каждое слагаемое равно нулю. Поэтому желательно заменить квадратичную форму (4.1) на «унитарную форму Эрмита» 1с1х1 + х2х2 4 •. • 4- *„*«, (4.2) где через х обозначается комплексно сопряженное с х число. Величина j2 вида (4.2) будет принята в качестве квадрата абсолютной величины вектора ? = (л:1, х2,... ...,#„), а соответствующая билинейная форма (7) Ш — Х&1 + ХшУ1+ • ■ • +*»Уп — в качестве скалярного произведения (it)) двух век- 2 Г. Вейль
34 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ торов j и \) = (уи у2у . • -,#„)• Система координат называется нормальной, если квадрат абсолютного значения вектора у выражается через его компоненты х{ в этой системе координат формулой (4.2). В нормальной системе координат С/ эти компоненты являются скалярными произведениями *, = (e,t). (4.3) Преобразования, которые переводят одну нормальную систему координат в другую нормальную и потому оставляют форму (4.2) инвариантной, называются унитарны- ми преобразованиями*). Условия, характеризующие унитарные преобразования, полностью аналогичны условиям ортогональности преобразований, с которыми мы знакомы по аналитической геометрии. Пусть x=*Sx'—некоторое такое преобразование; под действием Я^ундаментальная метрическая форма (4.2) переходит в x'^S*Sx'. Поэтому S унитарно тогда и только тогда, когда S*S=1; тот факт, что detS^O, немедленно следует отсюда. В самом деле, матрица S и ее транспонированная S* имеют одинаковые определители, следовательно, абсолютная величина определителя унитарного преобразования равна 1, т.е. |detS|2=l. Эти условия можно сформулировать так: S* является матрицей^ S"1, обратной к S, и поэтому не только S*S=1, но и SS**=1. Первое из этих уравнений утверждает, что сумма квадратов абсолютных величин элементов любого столбца есть 1 и что сумма «смешанных» произведений 2 srisrk ДВУХ г различных столбцов {гфк) равна 0; второе уравнение содержит то же утверждение об элементах строк. Мы заимствуем терминологию, принятую в евклидовой геометрии. В частности, будем говорить, что вектор t) перпендикулярен к j, если скалярное произведение (ЭД) обращается в нуль. В силу закона симметрии *) В физической литературе для обозначения этих преобразований, использовалось название «ортогональные», но в математике необходимо иметь различные наименования для этих двух различных онятий.
§4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 35 перпендикулярность является обратимым отношением. Не существует вектора а, кроме а = 0, к которому перпендикулярны все векторы; в действительности а = 0—единственный вектор, перпендикулярный самому себе. Нормальные системы координат можно охарактеризовать условием, что скалярные произведения их базисных векторов имеют вид ( 1 (* = *). (eie*)-«u-|0 {i¥=k) При сравнений фундаментальной метрической формы (4.2). с (3.2) видно, что унитарное пространство Ш может характеризоваться тем, что комплексно сопряженное пространство совпадает с двойственным к нему пространством Р, или, более точно, вектор j, комплексно сопряженный к вектору j, можно одновременно рассматривать как двойственный к нему. Нами было обнаружено, что с отображением А унитарного m-мерного пространства 9t в м-мерное пространство © инвариантным образом связано отображение А* двойственного пространства 2 в двойственное пространство Р. Как следствие равенства P = 8f, для унитарных пространств отображение является отображением пространства © в 9J; мы называем его «эрмитово сопряженным к Л». А А является отображением ffi в себя и А А—пространства © в себя. Отображение S, которое переводит произвольный вектор j в g' = Sj, унитарно, если оно оставляет абсолютную величину вектора j неизменной: j'2 = j2. Две конфигурации, составленные из векторов, одна из которых может быть получена из другой унитарным преобразованием, являются конгруэнтными в унитарной геометрии, т. е. унитарная геометрия есть теория таких отношений, которые инвариантны при произвольном унитарном преобразовании. На языке матричного исчисления эти преобразования характеризуются одним из двух равенств SS —1, S5=l. Пусть ffi'—m-мерное линейное подпространство, натянутое на линейно независимые векторы а1э а2, . .., ат. Мы 2*
36 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ считаем, что вектор g принадлежит пространству Ы* тогда и только тогда, когда он перпендикулярен к 9i', т. е. ко всем векторам подпространства Ш', такой вектор должен поэтому удовлетворять уравнениям: (си?) = 0, (а2у) = 0, ..., (ашг) = 0. Из них следует, что Ш" имеет (п—т) измерений. Это отношение ортогональности между 9Г и Ш" обратимо: каждый вектор из 9t" перпендикулярен каждому вектору из Ш\ и наоборот. Тогда 9i = 9i' + 9t", ибо, если сумма ?' + ?" вектора j' из $V и вектора j" из dt" равна нулю, то j' = — j"—вектор, который принадлежит обоим пространствам и, следовательно, перпендикулярен самому себе, а это может произойти только при $' = 0. Унитарное отображение, которое оставляет 9Г инвариантным, будет также оставлять инвариантным Ш", так как отношение перпендикулярности не нарушается при таком преобразовании. Оперируя с унитарными отображениями или преобразованиями, всегда можно найти инвариантное подпространство Ш", связанное с данным инвариантным подпространством 91' таким образом, что Ш = 9?' + 81". Предшествующие замечания о проецировании предполагают, что здесь в унитарной геометрии мы отождествляем пространство, возникающее при проецировании 9i вдоль 9Г с подпространством 91": мы проецируем на пространство fit", перпендикулярное к 9Г. И, наконец, заметим, что множество всех векторов а из Ш, конгруэнтных mod9l', содержит вектор (а) из 9Г; следовательно, (а-а)-а(а), (a + 6) = (a) + (b). Как мы видели, с произвольным линейным отображением А t)-+t)' = A\): yi-2ailtyH (4.4) k пространства Ш в себя связана билинейная форма ik которая зависит линейно от вектора £ из Р и вектора I) из 9t. Поэтому в унитарном пространстве с отображением (4.4) мы можем связать форму Mb *)) —2*/.Л0*. ik
4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМЙТОЁЫ ФОРМЫ 3? ^аьисящую линейно от *) = (*//) и у = (#/). В действительности она является скалярным произведением вектора у на At). Частный случай Л = Л, или А(\), у) = Л(у, ^), или aHi = aik> (4.5) носит имя французского математика Эрмита. Отображение (4.4) является, следовательно, эрмитовым, если скалярное произведение у на Л1) равно комплексно сопряженному скалярному произведению вектора X) на Лу. Отождествив ty с у, мы получим «эрмитову форму* т. е. скалярное произведение 5 и Лу; в силу (4.5) она принимает действительные значения. Говорят, что эрмитова форма А невырождена, если не существует ни одного вектора у, исключая у = 0, преобразование которого Лу обращается в нуль. Эрмитова форма называется положительно определенной, если значение формы Л(у) > 0 для всех векторов у =5^0; положительно определенная форма невырождена. Л Фундаментальная метрическая форма (4.2)—пример такой положительно определенной эрмитовой формы, «унитарной формы», коэффициенты которой составляют числа /1 (*-*) После введения произвольной системы координат at (/= 1, 2, ..., п) в л-мерном пространстве абсолютное значение любого вектора задается выражением ?2« 2 £/*****, ft*-»(M*)- Выражение для у2, таким образом, всегда является положительно определенной эрмитовой формой; и наоборот, любую положительно определенную эрмитову форму G(y) можно было бы взять в качестве фундаментальной метрической формы. Чтобы это показать, мы воспользуемся соответствующей эрмитовой билинейной формой G(y, ty) и выполним следующую процедуру, которая повторяет шаг за шагом построение декартовой системы координат. Выберем любой ненулевой вектор d; поскольку G(d)>0, мы
US ?Л. I. УНИТАРНА^ ГЕОМЕТРИЙ можем, умножив гг на подходящий числовой множитель, нормировать его в соответствии с равенством G (ех) = 1. Когда наш процесс построения системы единичных ортогональных векторов t±: прошел т шагов, 1 = 1, 2, ..., m, следующий шаг осуществляется выбором некоторого решения |вея+1 системы т(<м) однородных линейных уравнений G(e/, $) = 0 (с /г неизвестными компонентами вектора 11ф0) и его нормированием согласно равенству G(tm+1) = l. После и шагов процедура завершается; окончательно мы получаем п таких векторов е1э е2, ..., ея, что G(J, ?) = *Л + %+ • ■ • +*»*». где ? = ^iCi + *2^2 Т" • • • "Т Хп^п' j Из самих этих равенств следует, что j может быть нулем I только, когда все его компоненты х( равны нулю и, еле- ] довательно, векторы е,- линейно независимы и образуют ] систему координат в 9t. I Переход от аффинной к метрической геометрии, таким 1 образом, можно осуществить введением аксиомы: I (б) Квадрат абсолютного значения вектора j есть дей- 1 ствительное число j2, которое является положительно on- 1 ределенной эрмитовой формой от компонент вектора j. I Последние рассуждения полезны и в другой связи. 1 Если Ш'—линейное подпространство в dt, мы можем при- I менить конструкцию, которой мы пользовались, чтобы I найти т векторов elf с2, ..., гт в ОТ, на которые 8¥ на- 1 тянуто и которые являются единичными взаимно ортого- I нальными в смысле равенств (е^е^) = 6ift. Продолжая по- I строение, мы можем пополнить эти т фундаментальных 1 векторов п—т дополнительными гт+1, ..., ел, так что I оба набора вместе образуют систему координат для всего I пространства $1. Следовательно, мы можем приспособить I нашу нормальную систему координат к такому выделению I dY из 31 или к разложению 9* = 9£' + ЭГ на два перпен- | дикулярных подпространства. || Поскольку отображение А пространства 9ft в себя ин- || вариантным образом связано с эрмитовой формой А в 9%, II мы можем говорить о произведении ВА двух эрмитовых || форм А, В из Ш, однако это произведение, вообще говоря, И
§4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 39 не является эрмитовым, так как ВА = АВ=АВ. След эрмитовой формы, или отображения, А действителен. Положительно определенное выражение ИЛЛ) = 2Н*12 (4-7) i, k имеет особое значение. Если 31 разлагается на взаимно перпендикулярные подпространства Ыа (а=1, 2, ...), то часть Лар отображения, или формы, Л, в которой 9ta скрещивается с 9ftp, определяется однозначно; это —отображение подпространства 91р в 9fta, а Лра, т. е. Ра-часть отображения Л, является отображением 9fta в 8Яр. Если система координат приспособлена к разложению пространства 9t, то tr (ЛаЭЛЭа) = tr (ЛЭаЛар) = 21 */* 12> <4-8) где в сумме индекс i пробегает a-й, а индекс k пробегает р-й наборы индексов. Любой ненулевой вектор а определяет луч а, который состоит из всех векторов вида Ха, где А,—произвольное комплексное число. Порождающий вектор а можно так нормировать, что его абсолютная величина станет равной единице, \а |= 1; это, однако, не определяет а с точностью до изменения знака, как в области вещественных чисел, поскольку нормировка не изменится при умножении а на произвольное комплексное число г с модулем 1. Мы будем называть совокупность всех векторов из ?ft векторным полем 9t, а совокупность всех лучей—полем лучей Ш. Любое невырожденное линейное отображение А векторного поля Ш в себя является одновременно отображением поля лучей 9ft в себя, но это последнее отображение не изменяется при умножении исходного отображения на любое отличное от нуля число. Унитарное отображение или преобразование поля лучей в себя будем коротко называть вращением. Записью S' ~S мы будем обозначать тот факт, что два преобразования S, S' векторного поля в себя отличаются только числовым множителем е с модулем 1, т. е. S' = eS, следовательно, они оба приводят к одному и тому же вращению поля лучей.
40 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ § 5. Преобразование к главным осям Фундаментальная теорема об эрмитовых формах—это теорема 6 преобразовании к главным осям. Здесь мы отметим аналогию с известной задачей нахождения главных осей эллипса или эллипсоида в обычной геометрии двух или трех измерений. Мы хотим связать с эрмитовой формой A (j) такую нормальную систему координат ги чтобы вместе с равенствами J = ХгХг + Х2Х2 + • • - 4" хпХп выполнялось также соотношение A (J) = ал*! + а2х2х2 + ... + a^cnxnt (5.2) т. е. чтобы форма А была приведена к нормальной форме (5.2) посредством унитарного преобразования. Вещественные числа alf a2, ..., ап называются собственными числами формы Л, а е19 е„ ..., е„—соответствующими собственными векторами (8). Для этого мы сперва рассмотрим отображение % —-* $'=Л;г и будем искать такие векторы j^O, которые под действием А преобразуются в кратные самим себе: $' = A,j. Отсюда получаем «вековое уравнение» /(ty = det(M— Л) = 0 для множителей А,. В силу основной теоремы алгебры это уравнение обязательно имеет корень Х = а1\ можно найти соответствующий ему ненулевой вектор у = е1э который удовлетворяет уравнению Ле1 = а1е1, и, умножив этот вектор на подходящее число, мы можем сделать его модуль единичным. Затем ех можно дополнить еще /г—1 векторами таким образом, чтобы эти п векторов составляли нормальную систему координат. В этих координатах формула k для отображения Л согласно определению ех требует, чтобы коэффициенты a21, asl, ..., ап1 были равны нулю и чтобы au = a1. В силу условий симметрии aki = aifc коэффициенты tfi2> ai3» •••» а\п также должны быть нулями. Следовательно, в этих новых координатах матрица Л принимает
f § 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 41 вид lloci 0 0 ... О О Я22 а23 • • • а2П II 0 #32 аВ8 • • • aZn II О Я/12 ЯлЗ .- «лл а эрмитова форма распадается на две части Лф-а^л + Л'й), (5.3') где Л' является эрмитовой формой, содержащей только п—1 переменных х2, х89 ..., хп. Повторяя этот процесс или сославшись на метод математической индукции, мы устанавливаем справедливость сформулированной выше фундаментальной теоремы. Характеристический многочлен формы (5.2) принимает вид det(XI — Л) = (А,—otiHA,—аа) ... (I —ап). Отсюда следует, что собственные числа аи а2, ..., ап и их кратности единственным образом определяются эрмитовой формой Л; их сумма является следом матрицы Л. Что мы можем сказать о собственных векторах? Пусть а—некоторое заданное вещественное число; векторы j, удовлетворяющие уравнению А% = щ, образуют линейное подпространство 9i (a) из Ot, так называемое собственное пространство, соответствующее а. Если нормальная система координат tt выбрана так, что А имеет нормальную форму, то уравнение Л^ = aj, переписанное в координатах, имеет вид а,*, = <**,., откуда следует, что 91(a) натянуто на такие векторы гь для которых a, = a. Если, например, три корня <хи а2, а8 равны а, в то время как другие отличны от а, то собственное пространство трехмерно. Если ни одно из собственных чисел at не равно а, то 9ft (а) состоит только из нулевого вектора. Эти соображения позволяют по-новому характеризовать собственные числа, включая их кратности, независимо от выбора системы координат, и также характеризовать соответствующие собственные подпространства 9ft (a). Таким образом, 9ft разлагается на собственные пространства 9ft(a): 9ft = 29ft(a)*> в эт°й сумме только конеч- а (5.3)
42 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ ное число слагаемых, а именно, таких, для которых а является собственным числом формы Л. Полную систему координат г19 е2, ..., гп для всего пространства $ можно получить, выбрав какую-либо нормальную систему координат в каждом ненулевом подпространстве Ш (а). Нормальная форма (5.2) не изменится, если переменные xiy соответствующие одному и тому же собственному числу а|. = а, подвергнуть произвольному унитарному преобразованию. Если, например, а—собственное число кратности 3, т. е. ах = оса = obg = <х, в то время как оставшиеся а%фау то вектор #1е1 + л;1еа+ +х3г8 является нормальной проекцией $а вектора j на Ш (а) и Еа($ = х1х1 + Х0ш + хшхш является скалярным произведением ja на себя. Кроме того, равенства (5.1) и (5.2) можно переписать в инвариантной форме: ?2 = 2Д>(?)> i*0-2a.£efe). (5.4) a a Если Ы'—подпространство из Ш, то любой вектор 5 можно однозначно представить в виде суммы j' + j0, где j' лежит в Ы', а j0 перпендикулярен к 91'. «Ортогональная проекция» j—►j'stsJS'j является линейным отображением, которое, очевидно, обладает свойством Е'Е'=Е\ (5.5) так как проекция вектора j' на ffi! есть просто сам |'. Более того, оператор Е' эрмитов, ибо скалярное произведение \) на $' равно скалярному произведению t)' на j, где \)'—проекция \) на 51'. (В связи с этим эрмитова форма £'($) является квадратом абсолютной величины вектора j\) Эрмитовы формы, которые удовлетворяют равенству (5.5), мы назовем идемпотентньши. Если два подпространства 9t' и 8Г ортогональны, то соответствующие операторы проецирования Е' и 1Г удов- ; летворяют равенствам Е'Е'ш*09 Е"Е' = 0, (5.6)k.
§ 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 43 поскольку Е' (£"j) является компонентой £"?;, лежащей в пространстве 9ft' и перпендикулярной к £"$. Идемпо- тентные операторы, удовлетворяющие (5.6), называются независимыми. Более того, второе равенство (5.6) является следствием первого: перейдя к эрмитовому сопряжению, можно увидеть, что £"£' = 0. Если 9ft разлагается на несколько взаимно ортогональных подпространств 9ft' + + 9Г+..., то j = £'$ + £"j+... (5.7) Легко показать, что обращения всех этих утверждений также справедливы. Если Е'— идемпотентный оператор и £"=1—Е\ то все векторы вида Е'% образуют линейное подпространство 9ft', а все векторы вида Е"%—подпространство 9ft". Равенство Е'ЪГ = Е'ЕГш*Е'(\—£') = 0 показывает, что скалярное произведение вектора Е'х из 9ft' на вектор Е" t) из 9ft" равно нулю: *£'£"# = 0. В связи с этим разложение вектора j на компоненту из 9ft' и компоненту, перпендикулярную к 9ft', имеет вид Если две идемпотентные формы Е' и Еп удовлетворяют равенству (5.6), то, как мы только что видели, два соответствующих собственных пространства 9ft' и 9ft" взаимно перпендикулярны. Если сумма (5.7) состоит из независимых идемпотентных форм, то в силу вышесказанного соответствующие взаимно перпендикулярные подпространства 9ft', 9ft" и т. д. исчерпывают все пространство 9ft. Таким образом, теорему о преобразовании к главным осям можно сформулировать так: Эрмитова форма А связывает с вещественными числами а взаимно независимые идемпотентные эрмитовы формы Еа, так что 1=2£а, Л = 2а-£а, (6.8) а а причем Е отлична от нуля только для конечного числа значений а. Отображение А можно применять неоднократно: ЛЛ = Л*, А*А = А*, ...
44 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Поэтому мы можем образовывать многочлены по степеням отображения А f(A) = c0l+c1A + с2А* + ... +chA* с числовыми коэффициентами с{. Повторив отображение (5.8) А— 1 раз, получаем а откуда для многочлена / общего вида f{A) = 2 f(*)Ea. (5.9) а Поэтому собственными числами отображения /(Л) являются значения многочлена / (а) для собственных значений а отображения Л. Это наводит на мысль определить эрмитову форму f(A), где /(а)—любая вещественная функция вещественной переменной а, посредством равенства (5.9). Пусть заданы две эрмитовы формы А и В. При каких условиях их можно привести одновременно к диагональному виду, т. е. когда можно найти нормальную систему координат, в которой А (?) = *&хг + а2х2х2 + ... + апл;яхп, (5 ю В (?) == Рл*! + Р2*2*2 + -.. + Р А*„? Необходимое условие таково: эти отображения должны коммутировать (ВЛ = ЛВ), так как если А и В имеют нормальный вид (5.10), то и В А и АВ—диагональные матрицы с элементами Р*а* = а,Р;. Это условие также и достаточно', чтобы это доказать, выберем нормальную систему координат, в которой А уже записывается в нормальной форме. Уравнение В А == АВ требует, чтобы матрица В = \bik\ удовлетворяла равенствам bi4ak = apik или (at—ak)bik = 0. (5.11) Мы разобьем индексы /, базисные векторы С/ и переменные Х{ на классы, считая, что I и k принадлежат одному классу, если a, = at. Уравнение (5.11) утверждает, что 6^ = 0, когда i и k принадлежат разным классам. Следовательно, матрица В распадается на меньшие матрицы В', В", ..., выстраивающиеся вдоль главной ^агонали, в соответствии с порядком, в котором а,- распределяются по классам а', а", ...; следовательно, отображение В оставляет инвариантным каждое из собственных пространств
§ 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 45 gt(a'), 9t(a"), ... отображения Л. Но тогда мы можем выбрать некую нормальную систему координат в каждом из этих собственных подпространств 9ft (a) так, чтобы эрмитовы отображения В', В", ... были в них соотнесены с главными осями; нормальная форма А при этой процедуре не меняется. Этот процесс можно непосредственно применить к любому числу эрмитовых форм: любое число эрмитовых форм можно одновременно привести к нормальному виду в том и только том случае, когда они коммутируют друг с другом. Небольшая модификация позволяет распространить эту теорему на произвольную конечную или бесконечную систему 2 эрмитовых форм. Здесь мы вкратце обсудим это, хотя рассмотрение систем форм или отображений в общем случая откладывается до гл. III. Пусть пространство 9ft разлагается на взаимно перпендикулярные подпространства 9ft', 9ft", ... так, что каждое отображение системы 2 оставляет инвариантным каждое из выделенных подпространств; если приспособить систему координат к этому разложению, то каждая эрмитова матрица Л из 2 составится из матриц А\ А", ..., выстроившихся вдоль главной диагонали. Если составляющие вида А' всех матриц системы 2 уже кратны единичной матрице 1 в 9ft' и то же относится ко всем другим составляющим А" ..., наша цель достигнута, ибо тогда каждое отображение А из этой системы преобразуют SR' в себя и является в нем простым умножением; аналогично для 9ft", ... Однако, если это не так, то пусть А есть отображение из этой системы, которое не является просто умножением в подпространстве 9ft'. После преобразования составляющей А' матрицы А к главным осям подпространство 9ft' разложится на собственные пространства 9fti + 9ftjj + • • • отображения А' в 9ft', и таких пространств не меньше двух. Для любой эрмитовой матрицы X из 2 мы имеем соотношение А'Х' = Х'А', из которого, как мы видели выше, следует, что X' преобразует каждое подпространство 9fti, 9^2» - • • в себя. Таким образом, разложение 9ft'+ 9ft"+ ... можно далее привести к разложению (ffi[ + 9fti + ...) + 9Г+ +.... Поступая таким образом, мы окончательно достигнем нашей цели после, самое большое, п шагов, доказав тем самым, что: Эрмитовы формы любой системы 2 можно одновременно привести к главным осям, если они все коммутируют друг с другом.
46 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Теория, развитая вьиие для эрмитовых отображений* остается справедливой для унитарных преобразований. Если S—унитарный оператор, то можно таким образом ввести нормальную систему координат е/, что S будет переводить каждый из базисных векторов е* в кратный вектор ofii- Собственные числа а{ преобразования S являются комплексными числами с модулем 1. В этих координатах матрица S является диагональной матрицей, у которой на главной диагонали располагаются числа о>. Доказательство совершенно аналогично. Мы снова начнем с векового уравнения det(ai— S) = 0 и рассмотрим его корень ог. Существует вектор ех с модулем 1, который под действием отображения S преобразуется в оггг. Дополним гг еще п—1 векторами е2, ..., еп так, чтобы эти векторы образовывали нормальную систему координат. В этих координатах матрица ||s^|| отображения S: k такова, что 5ц = O'i, S2\ = Ssi = . . . = Snl = U. Так как S унитарна, то сумма квадратов модулей этих элементов первого столбца должна быть единицей; следовательно, 1^1=1. Аналогично сумма квадратов модулей элементов первой строки также должна быть 1: |^l2 + |s12|2+...+|sln|2=l; но так как |<т1|2=1, получаем s12=...=sla = 0. Матрица S, как и в (5.3), распалась на одномерную ог и (п—1)-мерную S; справедливость сформулированной выше теоремы получается теперь непосредственно по индукции. Дальнейшие результаты можно получить точно таким же путем, как выше для эрмитовых форм. Собственные числа а/ и их кратности, но не их порядок, однозначно определяются отображением S, то же относится к соответствующим подпространствам. Если мы хотим найти линейно независимую систему собственных векторов, то
§6. ИНФИНИТНЗИМАЛЬНЫЁ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 47 базисные векторы каждого такого подпространства можно взять в качестве составляющих нормальной системы координат. Окончательно конечное или бесконечное множество унитарных преобразований можно одновременно привести к нормальной форме в том и только том случае, когда они друг с другом коммутируют. § в. Инфинитезимальные унитарные преобразования Твердое тело в непрерывном движении около фиксированной точки О совершает инфинитезимальное вращение за каждый интервал времени dx. Если обозначить через (dxlt dx2, dxs) инфинитезимальное смещение такой точки твердого тела, которая в момент времени т находится в точке Р(хи х2, xs), то уравнения движения этого тела должны иметь форму ^eiFeL*"**. (6Л) в которой коэффициенты с1и—константы, т. е. не зависят от конкретно рассматриваемой точки Р. Выберем декарто- ву систему координат с началом в точке О; тогда при движении сумма х\+х\+х% должна оставаться неизменной; wo приводит к соотношениям 2*'"7йГв0, или 2 *'**'**= 0' i ik Поскольку эти равенства должны выполняться тождественно по xh матрица С=|с^||, характеризующая движение, должна быть антисимметричной: cki = —c^k. После введения вектора j с началом в точке О и концом в точке Р и вектора с = (с28, с31, с1г)» уравнения (6.1) принимают вид #-м — известной фундаментальной формулы кинематики твердого тела. Квадратные скобки обозначают векторное произведение, а с—векторную угловую скорость, абсолютное значение и направление которой задают угловую скорость и направление оси вращения соответственно. Другой пример инфинитезимального линейного преобразования дает процесс непрерывного начисления сложных
48 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ процентов. Пусть норма процента с—вещественное число, тогда увеличение капитала х за время dx составит xcdx. Радиоактивный распад является процессом того же сорта с отрицательным множителем с. Капитал х, рассматриваемый как функция времени, удовлетворяет уравнению £ = сх (6.2) и, следовательно, растет экспоненциально по т. Если основной капитал имел значение х0 в момент т=0, то за время х он возрастет до х(х) = х0-ес\ Чтобы получить альтернативное решение, разделим, как в методе конечных разностей, интервал времени т на п равных элементов т/я; х будет возрастать на хсх/п на каждом таком интервале, и капитал х приумножится соответственно в (1+сх/п)п раз по истечении времени т. Известное определение экспоненциальной функции ^ = lim(l + vY И П-+со \ п J следует из сравнения этих двух результатов. Однако мы можем также решить такое дифференциальное уравнение методом последовательных приближений. Возьмем в качестве нулевого приближения начальное значение х0> т. е. х0(х) = х0. Тогда (/г + 1)-е приближение получается из п-го после подстановки последнего вместо х в правую часть (6.2) и интегрирования: т xn+i(*) = Xo + c§Xn(t)dt. ■ о Осуществляя последовательно этот процесс, находим откуда получаем известное разложение в степенной ряд е'т=1+тг+-1г-+--- (6-4> для экспоненциальной функции. Сходимость (6.3) и (6.4) и равенство этих пределов строго доказываются в элементарном анализе.
§6. ИНФИНИТЕЗИМАЛЬНЫЕ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 49 Эти примеры помогут нам в понимании идеи инфи- нитезимальногоунитарного преобразования л-мер- ного пространства Ш = 9tn, к введению которого мы теперь переходим. Чтобы избежать введения бесконечно малых, мы введем (чисто фиктивно) время т и представим себе, что инфинитезимальное линейное преобразование, которое переводит вектор j в j + dj, происходит в интервал времени d%: "SF-C?' "ST ""£*'***' (Ради краткости мы называем это просто «инфинитезимальное преобразование С».) Так как исходное преобразование унитарно, то после выбора нормальной системы координат сумма 2*/*c должна оставаться неизменной: i k После подстановки dx't _ v r y **** — V 7 7 k г левая часть (6.5) приводится к эрмитовой форме и, поскольку она должна обращаться в нуль тождественно по #/, мы имеем £/*+£*j = 0, т. е. преобразование С должно быть антисимметричным в смысле равенств *»—**#. <?=■-С. (6.6) В вещественной области не существует сколько-нибудь тесной связи между симметричными и антисимметричными матрицами, но в комплексной области ситуация иная. Действительно, после замены C = /#(/ = j/—1—мнимая единица) из (6.6) следует, что Н удовлетворяет уравнению Н = Н и, следовательно, С является произведением i на эрмитову матрицу. При инфинитезимальном унитарном вращении векторного поля скорость -£• связана с j отоб-
50 ГЛ. 1. УНИТАРНАЯ ГЕОМЕТРИЯ ражениему матрица которого равна произведению i на эрмитову матрицу. Теорема о преобразовании эрмитовых форм к главным осям является, таким образом, предельным случаем аналогичной теоремы для унитарных преобразований. Многократно применяя инфинитезимальное унитарное преобразование df = dT.Ch (6.7) мы по прошествии времени т получим J — 8(т)~1/(т)8-**ъ (6.8) где экспоненциальную функцию еА матрицы А можно определить либо как предел гт.ЫУ- либо как степенной ряд 1 + 1! ^2! + '" • Естественно, что U(<z + x') = U(t)U(t'). Следовательно, U (%) пробегает все преобразования одно- параметрической непрерывной группы унитарных преобразований, порождаемых инфинитезимальным преобразованием С; параметр т аддитивен в композиции. Степенной ряд получается методом последовательных приближений; этот метод можно также применить для получения решения в более общем случае, когда инфинитезимальное унитарное преобразование С не является одинаковым в каждом временном элементе rfr, т. е. когда С является матрицей С(т), зависящей от времени. Решение уравнения для такого случая описывается формулой Х(та)«£/(т2, T^sfa); унитарное преобразование (/(т2> xj, которое соответствует интервалу времени от тх до т2, подчиняется закону композиции U (т3, тх) = U (т3, т2) U (т2, тх).
§6. ИНФИНИТЕЗИМАЛЬНЫЕ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 51 Если $ = $0 в момент времени т = 0, то формула для последовательного приближения ^(т) имеет вид т SoW=s0; Si+iW=?e+Sc(o?i(0*; о положив U (т)=£/ (т, 0), мы получаем бесконечный ряд со 2^/(т)> B котором / = 0 т t/,(t)-l; £/J+1(T)=$ С(*)*/,(*)*■ (6.9) о Расписывая в явном виде, имеем Доказательство сходимости этого процесса легко получается с помощью величины |Л |, связанной с матрицей Л = || а/Л равенством |Л|»-1г(ЛЛ)-2|ал|». Из хорошо известного неравенства Шварца (9) \a1b1 + a2ba + ---+anbn\2< <(№ + №+■■■+№)(\Ь1\* + \Ьа\*+...+\Ьп\>) (6.10) следует, что |Л + В|<|Л| + |5| И ЧТО }АВ\^\А\\В\. Второе неравенство получается применением (6.10) к элементу г матрицы С=АВ: г г
52 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ и суммированием по индексам i и k. Аналог первого неравенства может быть записан для интегралов в виде J A(t)dt\^\A(t)\dt. Сходимость ряда 2 Ui (г) можно теперь установить с по- мощью этих вспомогательных результатов, поскольку мы можем, предполагая, что |С(0|<с (0<*<г), доказать, что Действительно, это неравенство очевидно выполняется для / = 0, а рекуррентная формула (6.9) позволяет нам заключить, что оно выполняется для Ul+1, если оно справедливо для U\. Сходимость вытекает из этой абсолютной сходимости, так как абсолютная величина каждой компоненты, конечно, не больше, чем \А\. Мы рассмотрели эти вопросы только затем, чтобы убедить читателя в законности операций с рассмотренными инфинитезимальными величинами. Для дальнейшего изложения важна только простая связь, существующая между инфинитезимальными унитарными преобразованиями и эрмитовыми формами. § 7. Замечания о оо-мерном пространстве Унитарные пространства, возникающие в квантовой механике, имеют обычно бесконечное число измерений. Такое пространство состоит из всех векторов $ = {х19 х2> ...), чьи компоненты х^ образуют бесконечную последовательность чисел, для которой ряд J = хгх± -\- х2х2 -J- • • • сходится. В этой области возможны операции сложения и умножения на число, а также построение скалярного произведения двух векторов. Выполняются все принятые до сих пор аксиомы, за исключением аксиомы размерности (у), введенной в § 1,
§ 7. ЗАМЕЧАНИЯ О оо-МЕРНОМ ПРОСТРАНСТВЕ 53 Поскольку векторные координаты хи х2, ... образуют счетное множество, то это «гильбертово пространство» (10) имеет бесконечное счетное число измерений. Вдобавок к этому существуют пространства с несчетным числом измерений. Рассмотрим, к примеру, все непрерывные комплексные функции \|)(s) вещественной переменной s с периодом 2я. При этом нам не нужно различать значения s, конгруэнтные mod2:rt, т.е. разность которых является целым кратным 2я; следовательно, удобнее рассматривать \|)(s) как функцию, определенную на окружности единичного радиуса, а не на прямой линии. Различные значения s в точках окружности играют роль индексов, значение \|?(s) в точке s будет компонентой «вектора i|)» с индексом s. Все множество таких функций i|)(s) образует поэтому линейное «функциональное пространство» континуальной размерности. Сложение этих векторов и умножение на число интерпретируются здесь как обычные операции с функциями. В качестве квадрата абсолютной величины вектора г|) введем СФ, Ф)=$ ^(s)i|)(s)ds, о а скалярное произведение двух векторов <р и я|) определим равенством 2я (ф, г|))=5 y(s)^(s)ds. о Множество функций q>i(s), q>2(s), ..., ФЛ (s) образует ортонормированную систему векторов, если 2я о На эти векторы натягивается n-мерное подпространство ffin из оо-мерного функционального пространства, т. е. подпространство, состоящее из всех векторов вида <f>(s) = x1<p1(s) + x2%(sy+ ... +хпц>п (s). Здесь хи х29 ..., хп суть компоненты вектора ф (s) из Шп в системе координат ф1? ф2, ..., фд. Кроме того, 2я (Ф, ф)=5 q>(s)<p(s) d$ = xlxl + x#t+ ... +хпхп. о
54 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Произвольный вектор л|) можно разложить на компоненту Ф из *31п и компоненту л|/, перпендикулярную к 8tn: i|) = п 2л q>(s)= 2 ЭД(«), , J 9/(s)*/(s)ds = 0. 1=1 0 Из этих равенств следует, что [ср. (4.3)] 2зт *£=$ 4>i(s)q(s)ds. Эти интегралы называются коэффициентами Фурье функции \|)(s) относительно ортогональной системы q^. Ортогональная проекция ф на Ып не может быть длиннее, т. е. иметь большее абсолютное значение, чем сам вектор г|); это—содержание так называемого неравенства Бесселя 2я J 4»(s)^(s)ds. (7.1) О Действительно, так как (ф, \|/) = 0 и (я|/, ф) = 0, то выполняется «теорема Пифагора»: (г|), г|)) = (ф, Ф) + (я|)', я|)'). Простейшая ортонормированная система в области периодических функций, с которой имеет дело теория рядов Фурье, состоит из функций -±—e(ns) [л-0, ±1, ±2, ...; е(х)=е*]. (7.2) у in Эта бесконечная система обладает свойством полноты, она является полной системой координат для всего пространства функций. Теорема о том, что любую периодическую функцию можно выразить в виде линейной комбинации функций (7.2): + 00 2Я ^(S)==TW £ хп'е(™)> х» = Уш\ e(ns)q(s)ds /l=-GD g (разложение Фурье функции i|)(s)), справедлива лишь при определенных условиях относительно дифференцируемости \p(s); однако любая непрерывная функция удовлетворяет
§ ?. ЗАМЕЧАНИЯ О л-МЕРНОМ ПРОСТРАНСТВЕ 55 равенству Парсеваля \ t|)(s)^(s)ds= 2 xnxn. (7.3) 0 л=-ов Из этого примера мы видим, что нет никакой существенной разницы между пространствами со счетным и несчетным числом измерений) мы ввели в наше пространство функций полную нормальную систему координат (7.2), состоящую из счетного бесконечного множества базисных векторов. В n-мерном унитарном пространстве система из ортонормированных векторов является полной, если их число равно п, и не является полной, если их меньше; однако такой пересчет не дает никакого критерия для оо-мерного пространства. Если мы удалим конечное число функций из системы (7.2), у нас все еще останется бесконечное множество, но разрушится полнота этой системы. Реальный критерий полноты заключается в справедливости соотношения полноты (7.3). Мы можем понимать соотношения в гильбертовом пространстве либо по аналогии, либо как предельный случай для соотношений в пространствах конечного числа измерений. Если мы рассматриваем значения произвольной периодической функции i|>(s) только в точках s = 0--—, Ь—, ...,(n—1) и полагаем ♦(■*)-«•• то мы имеем дело с n-мерным векторным пространством, в котором компонентами произвольного вектора £ являются величины £v (v = 0, 1, ..., п—1). Пусть е*—вектор в этом пространстве с компонентами уг<™) *-*• -ч; эти векторы ел (Х = 0, 1, ..., п—1) составляют нормальную систему координат в этом пространстве, и в ней вектор £ имеет компоненты х0, хи ..., хп_и которые должны вычисляться из соотношений А,= 0
56 ГЛ. I УНИТАРНАЯ ГЕОМЕТРИЯ В соответствии с (4.3) v=0 и, следовательно, /г- 1 __ я-1 2 £v?v= 2d ХЬХЬ- v=0 A,= 0 Переходя к пределу при п—>оо, получим равенство Парсеваля. Здесь мы не интересуемся дальнейшим рассмотрением, которое, быть может, необходимо для установления точного доказательства, а довольствуемся рассуждениями по аналогии. Мы рассмотрим линейное отображение или «оператор» D=j-t-, который преобразует функцию t|)(s) из множества периодических функций в -г- -АФ. Функция е (ns) является собственным вектором (функцией) этого оператора, соответствующим собственному числу п: 1 deins) , ч T-A-> = n.e(ns). Этот оператор эрмитов; скалярное произведение ф на Di\> равно комплексному сопряженному скалярному произведению if> на Оф, где ф и я|)—две любые периодические функции, ибо, интегрируя по частям, имеем 2я 2л __ j;w44?*~ J ♦•■}■**• а правая часть этого равенства является комплексно сопряженной интегралу 2я О Действительно, эрмитова форма 2л * -ds tt?#
§7. ЗАМЕЧАНИЯ О «-МЕРНОМ ПРОСТРАНСТВЕ 57 принимает нормальный вид + 00 __ 2 пхпхп (7.4) /1= —00 в нормальной системе координат, базисными векторами которой являются собственные векторы оператора D. d2 Проитерированный оператор DD = —-^ возникает в теории колебаний струны вместе с соответствующей эрмитовой формой 2я 2я _ О О которая представляет собой кинетическую энергию струны. Мы здесь имели дело с дискретным спектром собственных чисел. Однако в оо-мерном пространстве можно также строить эрмитовы формы с непрерывным спектром. Рассмотрим, к примеру, пространство всех непрерывных функций i|)(s), определенных на интервале —n<!s<;+:rt; квадрат абсолютной величины «вектора» л|) есть тогда +я (<ф, <ф)= \ \j)(s)i|)(s)ds. -я Эрмитова форма +я Л[<ф]= J s$(s)$(s)ds (7.5) -я записана уже в нормальном виде, который показывает, что она в качестве собственных чисел, имеет все числа между —я и +п. Функции (7.2) снова образуют полную нормальную систему координат, в которой 1 + QD ^(S)~7^T ^ Wins). /1= -00 Подставляя это в (7.5), мы находим ч + я А Н>] = ]Г атпхтх„, атп = -^ J se (—ms) e (ns) ds. -Я
58 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Вычисление интеграла ] se[(n—m)s]ds дает 0, когда /г = т, и (интегрированием по частям) Г еЦп-т)^ = 2п (-1Г- I i(n — m) J-я i(n—m) когда пфт* Поэтому эрмитова форма имеет в качестве собственных чисел все значения между —л; и +я. Собственный вектор я|)а, относящийся к собственному значению а(—я^а^+я) формы Л[г|э], является такой функцией, которая равна нулю во всех точках s^a, а в точке а настолько велика, что интеграл от 'фа'фа равен 1. Конечно, такой функции в действительности не существует, но мы можем приблизиться к ней сколь угодно близко. Чтобы дать математически строгую формулировку для случая непрерывного спектра, мы должны ввести в (5.4) вместо идемпотентной эрмитовой формы Еа идемпотентную форму Д£ = 2 ^я, а<А,<0 для всего интервала А = Д£ (а ^ А, <!($). Для произвольного заданного вектора $ справедливы соотношения A£(S)>0, A|£(?) + A^(S)-A^(S), (7.6) а идемпотентные формы А£, соответствующие двум непересекающимся интервалам А, взаимно независимы. В случае континуума сумма в выражении (5.4) заменяется интегралом Стилтьеса. Представим себе, что прямая линия, описываемая вещественной переменной А,, покрыта неким веществом, и пусть количество этого вещества на интервале А обозначается через Am. Тогда мы, в полной аналогии с (7.6), имеем Am > 0, Д&т + Д$т = Д£т. Если <p(s)—непрерывная функция, то мы можем построить интеграл 1 S<p(*)d*m. (7.7) о
§?. ЗАМЕЧАНИЯ О «-МЕРНОМ ПРОСТРАНСТВЕ 59 Аппроксимацию этого интеграла можно найти, разбив весь интервал 0^Я^1 на мелкие интервалы Ah выбрав точку A,j в А/ и вычислив сумму 2cP(^f)#Af/n- Эта сумма i приближается к нашему интегралу, в допущении, что Aj. стремятся к нулю. Если распределение имеет непрерывную плотность lim Ж^РМ' да, -> о АЛ 1 то этот интеграл тождествен интегралу \ <р (к) р (X) dk. Но о интеграл Стилтьеса (7.7) включает, кроме того, случай, когда не существует конечной непрерывной плотности; в частности, он допускает существование дискретных точек, в которых концентрируются конечные количества вещества. Если вещество распределяется в конечном числе точек А, = а,- в количествах mt, интеграл Стилтьеса сводится к сумме 2ф(а{)т1- i Таким образом, мы приходим к следующей более содержательной формулировке теоремы о преобразовании к главным осям: (1) Эрмитова форма А связывает с каждым интервалом А идемпотентную форму АЕ (j); (2) если два примыкающих интервала А1у Д2 складываются вместе и образуют интервал А, то АЕ = А1Е + А2Е, и идемпотентные формы, соответствующие непересекающимся интервалам, независимы', (3) можно написать (11) + 00 +00 ?= S dxE{i), Л(?)= J k-dxE®. — оо — оо В этой форме теорема пригодна и для непрерывного спектра собственных чисел и является особенно удобной для целей квантовой механики (см. гл. II, § 7). Дискретные собственные числа находятся в точках, где монотонно возрастающая по X функция А±соЕ(х) = Е(Х\ у) имеет разрывы. В нашем примере (7.5) з_ AftE№] = $i|>(s)*(s)£fe; а
60 ГЛ. 1. УНИТАРНАЯ ГЕОМЕТРИЯ здесь предполагается, что г|) должна равняться нулю вне интервала (—я, +п). Вычисление без труда проводится на языке координат хп. Рассмотрим пространство всех функций if>(s) переменной s, принимающей все значения от —оо до +оо, которые имеют конечную абсолютную величину + 0О (<ф, г|))= jj \j5(s)\|)(s)ds, — оо т. е. которые имеют «интегрируемый квадрат». Собственными функциями, связанными с линейным соответствием г|) (s) —»• -г --р , снова являются функции e(vs), но частота v может теперь принимать все вещественные значения. Компонентами функции являются величины + 0О /(v) = y=- j r|>(s)e(—vs)ds. -CO Тогда теорема об интеграле Фурье позволяет нам сделать вывод о справедливости разложения + 00 ^(s)=-l=- J e(vs)/(v)dv -00 при известных допущениях относительно дифференцируемое™ функции i|)(s); но в любом случае выполняется соотношение полноты [1] + СО +00 $ $(sH(s)ds= $ 7(v)/(v)rfv. — СО —00 Мы приходим к несколько иной задаче, когда требуем только, чтобы функции if>(s) были такими, что <i|?(s)i|)(s) обладает определенным средним значением + а Ига ±- \ ^(s)i|)(s)ds = (t, ■*); —а это приводит к теории почти периодических функций, развитой Г. Бором [2]. Здесь вновь можно установить справедливость соотношения полноты.
§ 7. ЗАМЕЧАНИЯ О «-МЕРНОМ ПР0СТ1>АНСТ6Ё 61 Теория собственных чисел эрмитовых форм бесконечного числа переменных была развита Гильбертом и Хел- лингером [3], но она применима только к ограниченным формам т. е., формам, значения которых имеют фиксированную верхнюю границу при условии f = 2I,*,<1. (7.8) i В самом деле, без этого допущения мы не можем гарантировать сходимость Л($) во всей области (7.8); в качестве примера рассмотрим форму (7.4), 2Л*Л- То, что эта п форма сходится лишь в части области (7.8), является просто другим выражением того факта, что не каждая непрерывная функция дифференцируема. Ситуация более благоприятна для унитарных форм, так как они удовлетворяют условию быть «ограниченными» вследствие их удачного определения; унитарное преобразование, таким образом, должно выбираться так, чтобы удовлетворить обоим условиям (/(7=1, 0U = 1. Теорема о главных осях была доказана строго для ограниченных эрмитовых и для унитарных отображений в оо-мерном пространстве. Метод, предложенный А. Уинт- нером [4], оказывается особенно удобным для исследования унитарных отображений; он основан на рассмотрении дискретной группы всех степеней Un заданного унитарного преобразования (/, а монотонно возрастающую функцию Е(Х\ j) вещественного переменного К (0<А,^2я) определяет равенствами 2л t/»(j)=S^4£(X; ?) (7.9) О (проблема тригонометрических моментов). И. фон Нейман [5] продвинулся дальше всех в изучении линейных операторов, для которых не постулируется ограниченность. Согласно § 6, с эрмитовой формой А связывается группа унитарных преобразований eixA = U(%), зависящих от
62 ГЛ. 1. УНИТАРНАЯ ГЕОМЕТРИЯ вещественного параметра т и удовлетворяющих равенству U(x + %')-U(x)U{%y, (7.10) изучение этой группы эквивалентно изучению формы А. Поэтому может оказаться удобным исследовать вместо формы А эту группу, поскольку для унитарных преобразований не возникает никаких трудностей со сходимостью. Мы должны, следовательно, попытаться привести операторы £/(т), которые суть непрерывные функции вещественного параметра т, удовлетворяющие (7.10), одновременно к виду £/(т;?) = $в**4£(Ь;!). (7.11) о Это осуществляется при помощи метода Уинтнера заменой дискретного параметра п в (7.9) непрерывным параметром т. Задача (7.11) так же относится к (7.9), как интеграл Фурье к рядам Фурье. Устанавливая систему аксиом для оо-мерного векторного пространства, можно сохранить аксиомы (а), ф) из § 1 и метрическую аксиому (6) из § 4; относительно подходящей замены аксиомы размерности (у) см., например, //. фон Нейман «Математические основы квантовой механики» [6]. Алгебраические и геометрические средства, развитые в этой главе, представляются естественной средой для выражения квантовой механики; эти средства занимают ведущее положение в классической физике сплошной среды. Мастерское изложение их математического содержания и применений можно найти в первой части «Методов математической физики» Куранта и Гильберта, 2-е издание.
ГЛАВА II КВАНТОВАЯ ТЕОРИЯ § 1. Физические основы [1] Магическая формула £=ftv, (1.1) которая положила начало всей квантовой теории, устанавливает универсальную взаимосвязь между частотой v колебательного процесса и связанной с этим процессом энергией Е. Квант действия h является одной из универсальных постоянных природы: /1 = 6,626хЮ-27эрг-с. Эта постоянная впервые появилась у Планка на рубеже столетия в законах излучения черного тела, т. е. излучения, заключенного в полости и находящегося в термодинамическом равновесии с веществом определенной температуры, которое посредством испускания и поглощения вызывает обмен энергией между различными частотами излучения. Так как это равновесие не зависит от конкретной природы имеющегося вещества, Планк рассмотрел, в качестве некоторого схематического вещества, систему линейных осцилляторов всевозможных частот. Заряд, совершающий колебания с частотой v, взаимодействует с электромагнитным полем посредством испускания и поглощения излучения той же самой частоты. Планк предположил, что обмен энергией происходит порциями, кратными кванту энергии е. Сначала он рассматривал это предположение просто как математическое допущение, намереваясь перейти к пределу е = 0. Чтобы получить согласие с законом смещения Вина, установленным из общих термодинамических принцицоэ, надо принять, что
64 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ энергия кванта, связанного с определенной частотой v, пропорциональна v, т.е. e = ftv. В этих предположениях Планк получил свою формулу излучения, которая находится в великолепном согласии с наблюдениями. Согласно этой формуле количество энергии, содержащееся в единичном объеме в спектральном интервале v9v + dvB условиях термодинамического равновесия при температуре 0, равняется где с—скорость света, a k—постоянная Больцмана (*/2kQ = средней энергии атома одноатомного газа при температуре 9). Переходя к пределу ft = 0, мы получаем закон излучения Рэлея—Джинса Предположение о справедливости этого закона для всего спектра противоречит действительности, поскольку тогда мы приходим к бесконечному значению для полной энергии J и (v)dv, и, следовательно, состояние равновесия для любой конечной энергии становится невозможным. Идея квантованного обмена энергией, возникающая в выводах Планка довольно схематично и только в применении к статистическим термодинамическим приложениям, была впервые применена всерьез к индивидуальным атомным процессам Эйнштейном. В 1905 году, изучая эксперименты Г. Герца, Гальвахса и Ленарда по фотоэлектрическому эффекту, он сформулировал идею о кванте света или фотоне как «эвристическую точку зрения относительно порождения и преобразования света» [2], согласно которой не только обмен энергией между веществом и излучением частоты v происходит квантами энергии fiv, но и вообще свет частоты v может существовать в эфире только в виде квантов энергии hv. Решающие эксперименты были впервые произведены Милликеном десятью годами позже. При облучении металлической пластины ультрафиолетовым или рентгеновским излучением частоты v высвобождаются электроны, кинетическая энергия которых (как было известно еще Ленарду) возрастает с увеличением жесткости (т. е. с уменьшением длин волн) падающего излучения. Однако эта энергия излучаемых электро-
§ 1. ФИЗИЧЕСКИЕ ОСНОВ Ы 65 нов не зависит от интенсивности излучения. Точное соотношение, предсказанное Эйнштейном, имеет вид где —е, т и v—заряд, масса и скорость электрона соответственно. Энергия фотона hv после вычитания из нее работы Р, необходимой, чтобы вырвать электрон с поверхности металла, преобразуется в кинетическую энергию электрона. Если разность потенциалов между поверхностью металла и пластиной, помещенной перед ней, равняется V'9 то электронный ток исчезнет, как только V превысит критическое значение V0 = hv/e. Милликен нашел, что (получаемый путем экстраполяции) потенциал, при котором исчезает ток, действительно пропорционален частоте v монохроматического света и что коэффициент пропорциональности равняется частному от деления величины А, полученной Планком для излучения черного тела, на элементарный квант электрического заряда е. Кроме того, разность средней энергии Р для двух различных металлов оказалась равной заряду е> умноженному на их контактную разность потенциалов. Следовательно, значение 7* или, по крайней мере, порядок ее величины известен, и мы находим, что для рентгеновских лучей с длиной волн в несколько ангстрем (1 А== 10~8 см) Я пренебрежимо мало по сравнению с hv. Равенство hv^^g-^eV (1.3) описывает не только порождение вторичных катодных лучей под воздействием первичных рентгеновских лучей, но также и обратный процесс: преобразование на стеклянной стенке или аноде падающих катодных лучей в импульсное излучение, наблюдавшееся впервые Рентгеном. Если электрон, прошедший разность потенциалов —V в рентгеновской трубке, потеряет при столкновении всю свою]* энергию, то появится фотон частоты v и энергии hv — eV. Однако электрон может замедлиться; следовательно, v—только верхний предел частоты импульсного излучения, которое, таким образом, состоит из непрерывного спектра с четко выделенным пределом при v=eV/h. Старая классическая теория излучения никак не могла объяснить это наиболее характерное свойство импульсного излучения. Предельная частота возрастает пропорцио- 3 Г. Бейль
66 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ нально приложенному потенциалу—и это является точной формулировкой столь знакомого каждому оператору рентгеновских установок факта, что «чем выше потенциал, тем жестче лучи». Таким образом, наблюдаемые явления подтверждают гипотезу, что излучение частоты у может поглощаться и испускаться только квантами энергии ftv. Эта гипотеза, естественно, приводит к новым следствиям в теории структуры вещества. Например, осциллятор Планка не может менять свою энергию непрерывным образом, поскольку он может испускать или поглощать только фиксированные кванты энергии, и, следовательно, прыгает вверх и вниз по энергетической лестнице, ступеньки которой расстав- > лены с одинаковыми интервалами ftv; v—частота осциллятора (постоянная величина, определяемая устройством « осциллятора). Применение существенных моментов этой j идеи к реальным атомам привело к правилу частот, сфор- I мулированному Нильсом Бором (1913): | Атом может существовать только в определенных ди- ^ скретных стационарных состояниях («квантовых состоя- I ниях»), в которых он не излучает. Излучение будет воз- | пикать при переходе из одного состояния в другое; энергия, теряемая атомом при этом переходе—разность энер- \ гий атома Ег—Е2 в двух состояниях—преобразуется в i фотон энергии ftv, частота которого определяется равен- * ством hv = Et—Er (1.4) j 4 В этом равенстве Е1у Е2 могут быть любыми дискрет- * ными уровнями энергии (Ег > Е2). И обратно, при погло- \ щении фотона атом переходит с энергетического уровня * Ег на более высокий Е2 с передачей атому энергии фотона ftv. * Согласно классической электродинамике, атом должен непрерывно излучать вследствие колебаний его электро- } нов, и частоты испускаемого излучения должны согласовываться с частотами простых колебаний, на которые может быть разложено движение системы его электронов. Сам же атом в процессе этого излучения теряет свою энергию, вследствие чего движение его электронов будет видоизменяться, а следовательно, будут смещаться и частоты. Эта точка зрения несовместима с одним из наиболее фундаментальных физических фактов—существованием резких спектральных линий. С другой стороны, предположение Бора, хотя и не предлагает никакой, детальной картины
§ 1. ФИЗИЧЕСКИЕ ОСНОВЫ 67 взаимодействия между веществом и эфиром, подобной той, которую дает классическая теория, не только находится в согласии с этим фактом, но и содержит фундаментальный комбинационный принцип Ритца—Ридберга. Если мы упорядочиваем энергетические уровни в возрастающей последовательности Е0 < Ег < Е% <..., то, в соответствии с (1.4), каждая частота v будет разностью двух «термов» vt^E{/h: v(i->k) = vi—vk (i>k). Следовательно, кроме частот v(i-+k) и v(k—+l) будет существовать' частота v(t-W) = v(f-*£) + v(£^/), (1.5) полученная из них сложением. Этот комбинационный принцип справедлив в спектроскопии всюду без исключений, как в оптической области, так и в области рентгеновских лучей, и, как оказалось, является ценным вспомогательным средством при классификации спектров; он сводит сложные спектры линий к более простым спектрам термов. К сожалению, задача становится более трудной из-за того, что не все линии, соответствующие возможным переходам i —► k, встречаются в действительности: не каждый терм Vf обязательно «комбинируется» с заданным термом vk9 поскольку условия возбуждения могут быть таковы, что некоторые линии будут иметь нулевую интенсивность. Следовательно, в правилах, определяющих интенсивности спектральных линий, будут содержаться правила отбора допустимых переходов. Комбинационный принцип или правило частот Бора определяют, так сказать, только клавиатуру спектра, а какие тона в действительности зазвучат—зависит от способа возбуждения. Но вообще, при подходящих условиях возбуждения, например, при воздействии сильных внешних электрических полей, можно выявить линии, которые не наблюдаются при обычных условиях. В тевозбужденном» или обычном состоянии атом находится в стационарном состоянии с самой низкой энергией Е0, и следовательно, при поглощении возникают только линии «серии» л—*0, с частотой v„—v0 (n=l, 2, ...). Самая низкая из этих линий 1 —*0 (т. е. с наибольшей длиной волны) или, точнее, самая низкая линия, не запрещенная правилами отбора, называется «резонансной линией». 3*
68 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Простейший атом—это атом водорода; в нем единственный электрон с зарядом —е вращается вокруг ядра с противоположным зарядом +е. Термы спектра атомарного водорода, как было обнаружено экспериментально, определяются равенством где R = 109700 см"1—постоянная Ридберга (спектроскописты привыкли вместо частоты v задавать волновое число vjc— величину, обратную длине волны). Этим частотным термам соответствуют энергетические уровни £л=—Rhc/n2. К дискретному спектру термов мы должны добавить непрерывный спектр Е^0\ аддитивная постоянная в энергии выбирается так, чтобы условие Е = 0 отделяло гиперболические орбиты электронов от эллиптических. Серия Бальмера состоит из линий п—+2 с волновыми числами *{т~к) (" = 3,4,...). Это—старейшая из известных формул серий; Бальмер получил ее в 1885 году, исходя из первых четырех линий серии, названных //а, Яр, #v, Яб и расположенных в видимой области. Линии этой серии при возрастании п стремятся к пределу с волновым числом R/i (длина волны 4/Я = 3650 А). Величина cRh/i и есть та работа, которая требуется для ионизации атома водорода, находящегося в стационарном состоянии п = 2, т. е. работа, необходимая для удаления электрона из такого атома (без придания этому электрону какой-либо кинетической энергии). Непрерывный спектр, возникающий при переходах, ионизирующих атом, присоединяется к этому пределу серии со стороны коротких волн. Кроме того, нам известны серия Лаймана и —► 1, лежащая в ультрафиолетовой части спектра и возникающая также при поглощении, серия Пашена п—>3, которая лежит в инфракрасной области, и наконец, некоторые члены серий Брекета (п —* 4) и Пфунда (п —* 5) в дальней инфракрасной области. Для ионизации водорода, находящегося в обычном состоянии, необходимо совершить работу cRh; соответствующий «потенциал ионизации» (т. е. разность потенциалов, которую должен пройти электрон, прежде чем он сможет ионизировать атом
§ 1. ФИЗИЧЕСКИЕ ОСНОВЫ 69 водорода) есть V = £^L= 13,53 вольт. Правило частот Бора выходит за рамки комбинационного принципа, полагая, что в действительности термы суть реальные уровни энергии — утверждение, чуждое спектроскопии и не проверяемое ее средствами. Это утверждение подтверждается опытами Франка и Герца по процессам столкновений [3]. В этих опытах электронам сообщается кинетическая энергия eV при прохождении ими электрического поля с известной разностью потенциалов —V, а затем они с полученной скоростью (без дальнейшего влияния внешних полей) проходят через газ, состоящий из исследуемых атомов. Электрон не может передать атому какой-либо энергии до тех пор, пока величина eV не станет больше энергии возбуждения резонансной линии Ег—Е0\ если же Ех-Е,<еУ<Ег-Е^ то электрон может претерпеть либо «упругое столкновение», при котором он не теряет никакой энергии, либо «неупругое столкновение», при котором электрон отдает атому энергию Ег—Е0. Электроны, прошедшие через газ, разделяются на два сорта: с кинетической энергией eV и с энергией eV—(Е1—Е0). Когда атомы, перешедшие при столкновении с электронами из состояния 0 в состояние 1, возвращаются в исходное состояние, они испускают резонансную линию и, при упомянутых выше условиях, только эту линию. Это полностью подтверждается экспериментом. Кинетическая энергия электронов измеряется методом наложения тормозящего потенциала V'\ электроны могут его преодолеть только тогда, когда их энергия больше eV'. Вообще, после столкновения с атомом газа электроны обладают дискретным «спектром энергий»; возможные значения энергии при этом равны eV'n = eV-(Ea-Et) (п = О, 1, 2, ... до тех пор, пока V'n положительно; здесь мы не учитываем того, что электрон может претерпевать более одного неупругого столкновения). При постепенном уменьшении тормозящего потенциала V от значения, большего У, ток электронов будет скачком уменьшаться всякий раз, когда V будет проходить через одно из значений v;, Vi ...
70 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Правило частот Бора сводит определение спектров к задаче определения, стационарных состояний и соответствующих энергетических уровней атома> т. е. механической системы с известным динамическим устройством. Пример линейного осциллятора, данный выше, и фундаментальные понятия теории колебаний приводят к следующему общему ведущему принципу (Р): частоты, определяемые энергетическими уровнями по правилу частот Бора, должны соответствовать частотам простых колебаний, на которые может быть разложено реальное движение частей атома в соответствии с законами динамики. В классической механике такое разложение на простые колебания строго достижимо не всегда, а только тогда, когда система является «кратно», или «условно периодической». В этих случаях оказалось возможным довести общий принцип (Р) до некоторого правила квантования. В 1913—25 годах применение этого квантового правила дало большой урожай результатов, и казалось, что мы обладаем ключом, который открывает тайны атомных процессов. Но замки оказались не вполне подходящими; к концу этого периода проявилась недостаточность правила, и физическая теория постепенно свелась к некоторому символическому исчислению квантовых чисел, которое надо было корректировать всякий раз, как только обнаруживался какой-либо новый факт. Сейчас мы не удивляемся тому, что теория прошла такой путь, скорее надо удивляться тому, что она была столь успешной! С самого начала квантовые правила были компромиссом. Если механическая система с одной степенью свободы совершает периодическое движение, то частоты v простых колебаний, на которые можно разложить ее движение, кратны основной частоте со. Эта частота зависит от энергии рассматриваемой орбиты, а значения энергии квантовые правила ограничивают дискретным множеством Еп. * Следовательно, частоты простых колебаний описываются формулой v = ft.©(/i), (1.7) т. е зависят от двух целых чисел п и k. По аналогии с квантовомеханическими частотами, частоту (1.7) следует приписать переходу п—+(п—k). Тот факт, что v зависит от k линейно и однородно, выражается «классическим ком* бинационным принципом» V(^_n—k) + v(n—>n—/) = v(n-+n—k— /), (1.8)
§ 1. ФИЗИЧЕСКИЕ ОСНОВЫ 71 вследствие которого будут комбинироваться частоты с од- ним и тем же начальным состоянием п. Но это не согласуется с правильным комбинационным принципом v(n—+n—k) + v(n—k—+n—k—l)=v(n—+n—k—Q. (1.9) Изменения квантовых чисел ft, / здесь такие же, как в (1.8), но конечное состояние п—k первой частоты совпадает с начальным состоянием второй; только для квантовых чисел л, больших по сравнению с k и /, классический принцип асимптотически согласуется с комбинационным принципом Ритца—Ридберга. Следовательно, если общий принцип (Р) должен удовлетворяться без всяких компромиссов, наша механика должна быть изменена таким образом, чтобы неверный комбинационный принцип (1.8) заменялся на правильный (1.9). В 1925 году Гейзен- берг открыл способ, как произвести такое изменение естественным образом; однако для этого надо было отказаться от картины атома с его электронными орбитами. Теория Гей- зенберга оперирует только с частотами и интенсивностя- ми излучения, связанного с переходами между различными состояниями атома. Следует заметить, что правильный принцип (1.9) в одном важном отношении проще неправильного (1.8). Как показывает формула v(n"_*n')-|-v(M'-->п) = у(/1"-*п), (1.10) квантовые числа служат только в качестве меток или индексов, которые не требуют введения закона композиции, тогда как классическая формула требует существования закона сложения квантовых чисел, которые, следовательно, становятся числами на некоторой определенной шкале. Другой подход к квантовой механике был найден Л.деБройлем и Э. Шредингером [4]. Этот подход кажется мне менее убедительным, но он быстрее приводит к фундаментальным принципам квантовой механики и к наиболее важным следствиям для эксперимента. Мы пойдем этим последним путем, поскольку мы заинтересованы в коротком, но всестороннем обзоре, а не в тщательном обсуждении физических основ. Физическая, существенно статистическая интерпретация теории, с которой не всегда был полностью согласен Шредингер, принадлежит в основном М. Борну.