Text
                    юр
Г. ВЕЙЛЬ
ТЕОРИЯ ГРУПП
И КВАНТОВАЯ
МЕХАНИКА
I

ГЕРМАН ВЕЙЛЬ
БИБЛИОТЕКА ТЕОРЕТИЧЕСКОЙ ФИЗИКИ Редактор серии Д. В. ШИРКОВ
Г. ВЕЙЛЬ ТЕОРИЯ ГРУПП И КВАНТОВАЯ МЕХАНИКА Перевод с английского Б. И. ГАЛАЕВА и С. Г. ШЕХОВЦОВА Под редакцией Д. П. ЖЕЛОБЕНКО МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1986
ББК 22.31 В 26 УДК 530.145 HERMANN WEYL The theory of groups and quantum mechanics Translated by H. P. Robertson Dover Publications, inc., 1931 Вейль Г. Теория групп и квантовая механика. Перевод с англ./ Под ред. Д. П. Желобенко.— М.: Наука. Гл. ред. физ.-мат. лит., 1986.— 496 с. Настоящее издание является переводом первой в мировой лите- ратуре монографии по теории групп в квантовой механике (первое издание вышло в 1928 г., второе — в 1931 г.). Герман Вейль одним из первых осознал фундаментальное значение симметрии для квантовой механики, поэтому в книге с теоретико-групповой точки зрения рас- сматривается вся структура квантовой теории. Подробно изучается группа вращений, группа Лоренца, группа перестановок и их при- менение к атомным спектрам и к релятивистской теории электронов и фотонов. Для студентов, преподавателей и научных работников, специа- лизирующихся в области теоретической, математической и экспери- ментальной физики. Определенный интерес книга представляет также для математиков. 1704020000—174 i л В 053 (02)-86 102'86 © Издательство «Наука». Главная редакция физико-математической литературы. Перевод на русский язык, 1986
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Классическая монография Германа Вейля по примене- нию теории групп в квантовой механике — первая моно- графия такого рода в мировой литературе. Будучи написа- на замечательным математиком, одним из основателей тео- рии представлений групп, принимавшим непосредственное участие в становлении квантовой механики, она отражает знаменательный исторический период взаимодействия этих двух теорий. Являясь, в этом смысле, памятником эпохи, она и в наше время не потеряла актуального значения. Напротив, можно утверждать, что ряд идей, заложенных в этой книге, был в должной мере оценен не сразу и про- должает развиваться вплоть до наших дней. Аспекты «чистой математики», затронутые в этой книге, нашли позднее более полное выражение в известной моно- графии Г. Вейля «Классические группы, их инварианты и представления». Результаты, изложенные в этих книгах, представляют собой основу современной теории представле- ний компактных групп Ли и прообраз более поздней тео- рии представлений локально компактных групп Ли. На- пример, замечательные формулы Г. Вейля для характе- ров неприводимых представлений компактных групп Ли были обобщены вначале на представления дискретных серий и затем на произвольные неприводимые представления ве- щественных редуктивных групп Ли. Одна из основных конс- трукций Г. Вейля, изложенная в этой книге и основанная на двойственности представлений симметрической группы и полной линейной группы, нашла свое дальнейшее раз- витие в исследованиях последних лет по теории унитар- ных представлений классических (в том числе бесконечно- мерных) групп Ли. Логический анализ квантовой теории, предпринятый Г. Вейлем с теоретико-групповой позиции, позволил ему в свое время четко выразить некоторые положения, обще- принятые в современной квантовой физике. В частности,
6 ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА именно он отметил принципиальное значение «калибро- вочной инвариантности», играющей столь важную роль в современной квантовой теории поля. Анализируя уравне- ния Дирака, он впервые отметил, что эти уравнения долж- ны описывать симметрическую пару частиц (§ 12 главы IV), т. е. «электрон — позитрон», а не «электрон — протон», как предполагалось самим Дираком. Среди других иссле- дований Г. Вейля по квантовой теории достаточно упомя- нуть его известную попытку построения единой теории гра- витации и электромагнетизма (1923 г.), а также первые работы по спектральной теории эрмитовых операторов. Все эти исследования вместе с последующими известными работами И. фон Неймана легли в основу математического аппарата современной квантовой теории. В процессе перевода этой книги мы старались по воз- можности сохранить особенности ее языка, рассчитанного на живое общение с читателем. Терминология этой книги не всегда отвечает современным нормам и порой избыточна. В порядке исключения, мы заменили авторские термины «open» и «closed» их современными значениями «некомпакт- ный» и «компактный». Кроме того, вместо «гау representa- tion» мы используем более стандартный термин «проектив- ное представление» и т. п. Более детально вопросы согласования терминов вместе с краткими комментариями изложены в примечаниях, помещенных в конце книги. Там же приводится допол- нительный список литературы, позволяющий до некоторой степени проследить за дальнейшим развитием идей в тео- рии представлений групп и в квантовой теории поля. При переводе существенно использовалось предшеству- ющее немецкое издание 1931 г. Д. Желобенко
ИЗ ПРЕДИСЛОВИЯ АВТОРА К ПЕРВОМУ НЕМЕЦКОМУ ИЗДАНИЮ В последнее время становится все более очевидным, насколько важен теоретико-групповой подход при откры- тии общих закономерностей квантовой теории. Поскольку я в течение нескольких лет углубленно занимался теорией представлений непрерывных групп, то мне представляется и важным, и своевременным изложить сведения, добытые работающими в этой области математиками, в такой форме, которая отвечала бы потребностям квантовой физики. Меня также побуждало и то, что с чисто математической точки зрения уже непозволительно проводить в теории представ- лений столь резкое различие между конечными и непрерыв- ными группами, как это делается в существующих книгах по этому предмету. Мое желание показать на некоторых весьма важных примерах, как понятия теории групп на- ходят свое применение в физике, сделало необходимым вклю- чение краткого очерка оснований квантовой физики, по- скольку в момент написания этой книги не существовало изложения этого предмета, к которому я мог бы отослать читателя. Короче говоря, эта книга, если она отвечает своему назначению, должна дать читателю возможность изучить основные аспекты и теории групп, и квантовой механики, а также взаимоотношения, существующие между этими предметами; математические части книги написаны с ориентацией на читателя-физика, и наоборот. Я особенно выделил «взаимность» между представлениями симметри- ческой группы перестановок и представлениями полной линейной группы; этой взаимностью зачастую незаслуженно пренебрегают в физической литературе, и это несмотря на то, что она наиболее естественно вытекает именно из кон- цептуальной структуры квантовой механики. На мой взгляд, существует ясно усматриваемый парал- лелизм между наиболее современными достижениями мате- матики и достижениями физики. Западная математика за
8 ИЗ ПРЕДИСЛОВИЯ АВТОРА К ПЕРВОМУ НЕМЕЦКОМУ ИЗДАНИЮ последние столетия отвергла точку зрения древних гре- ков и следовала курсом, который, по-видимому, зародился в Индии и был с некоторыми дополнениями донесен до нас арабами; так, понятие числа при таком подходе логи- чески предшествует понятиям геометрии. В результате этого мы применяли наше систематически разработанное понятие числа ко всем разделам, независимо от того, было ли оно самым подходящим в этих конкретных применениях. Однако на современном этапе в математике явно просмат- ривается тенденция к возврату к греческой точке зрения; теперь мы считаем, что каждая ветвь математики опреде- ляется своим собственным характерным для нее множест- вом величин. Алгебраист наших дней рассматривает мно- жество вещественных или комплексных чисел просто как одно «поле» среди многих других; современную аксиомати- ку проективной геометрии можно считать геометрической копией этого взгляда. Эта обновленная математика, вклю- чающая современную теорию групп и «абстрактную ал- гебру», развивается в духе, явно отличном от общего духа «классической математики», которая нашла свое наивысшее выражение в теории функций комплексного переменного. Множество вещественных чисел сохранило свою древнюю привилегию в физике для выражения физических измере- ний, однако совершенно законно можно утверждать, что существо новой квантовой механики Гейзенберга — Шре- дингерд — Дирака должно усматриваться в том, что с каждой физической системой связываются величины, об- разующие — в смысле математической техники — неком- мутативную алгебру, элементы которой суть .сами физи- ческие величины (1)*). Цюрих, август, 1928. Г. Вейль *) Здесь и далее цифры в круглых скобках означают номер ссылки на примечания редактора перевода в конце книги. (Примеч. ред.)
ПРЕДИСЛОВИЕ АВТОРА КО ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ В течение 1928—1929 академического года я занимал должность профессора математической физики в Прин- стонском университете. Лекции, которые я читал там и в других американских институтах, дали мне замечательную возможность представить по-новому и в более доступной форме связь между группами и квантами. Накопленный таким образом опыт нашел свое выражение в этом новом издании, в котором предмет преподносится с более элемен- тарной точки зрения. Косвенные методы, которые в теории групп основываются на исчислении групповых характерис- тик, имеют то преимущество, что позволяют быстро охва- тить предмет в целом, но истинное понимание взаимосвязей между понятиями достигается только на пути явного эле- ментарного построения. В этой связи я могу упомянуть: вывод ряда Клебила — Гордана, который имеет фундамен- тальное значение для всей спектроскопии и для приложе- ний квантовой теории в химии; параграф о теореме Жорда- на — Гёльдера и ее аналогах; и, более всего, аккуратное исследование связи между алгеброй симметрических пре- образований и симметрической группой перестановок. С элементарной точки зрения преподносятся также выра- жающие эту связь законы взаимности, которые в первом издании доказывались трансцендентными методами, и, кроме того, теоретико-групповая задача, возникающая из существования спина. На самом деле, вся глава V — кото- рая была, по мнению многих читателей, слишком сжатой и более трудной для понимания, чем остальная часть кни- ги,— полностью переписана. При этом была принята алгеб- раическая точка зрения, что гармонирует с недавним раз- витием «абстрактной алгебры», которая оказалась столь полезной в упрощении и унификации общих понятий. По- видимому, невозможно избежать изложения главной части теории представлений дважды: сначала в главе III, где
10 ПРЕДИСЛОВИЕ ко ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ представления предполагаются заданными и исследуются их свойства, а затем в главе V, где развивается метод по- строения представлений заданной группы и одновременно вывода* их свойств. Однако я верю, что читатель сочтет это двукратное изложение преимуществом, а не помехой. Что касается изменений в физической части, то в главе IV яснее представлена^роль группы виртуальных поворотов пространства. Но главное — добавлены несколько пара- графов, которые имеют дело с теоремой об энергии — им- пульсе в квантовой физике и с квантованием волнового уравнения по недавней работе Гейзенберга и Паули, Это расширение уже так далеко уводит от главной цели этой книги, что я был вынужден опустить согласующуюся с требованиями теории относительности формулировку кван- товых законов, развитую В. Фоком и мной, несмотря на то, что она нужна при выводе тензора энергии — импульса. Фундаментальная проблема протона и электро- на обсуждается в связи со свойствами симметрии кванто- вых законов относительно замены правого — левым, прош- лого — будущим и положительного электричества — от- рицательным. В настоящее время в поле зрения нет ника- кого подходящего решения этой проблемы; я боюсь, что облака, нависшие над этой частью предмета, соберутся в новый кризис квантовой физики. Я намеренно подробно изложил наиболее трудные части этих проблем, относящие- ся к спину и вторичному квантованию, так как они по боль- шей части либо полностью игнорируются, либо очень по- верхностно отражаются в большом числе появившихся теперь книг по квантовой механике (2). Ходили слухи, что «групповой бич» постепенно вытес- няется из квантовой физики. Это, конечно, неверно, по крайней мере в отношении групп Лоренца и вращений, но что касается группы перестановок, то ее, кажется, действи- тельно можно избежать с помощью принципа запрета Паули. Тем не менее эта теория должна сохранить представления группы перестановок как естественное средство понимать, что происходит при введении спина, даже если пренебречь его специфическим динамическим эффектом. Здесь я, сле- дуя тенденции нашего времени (до тех пор, пока это оп- равдано), излагал теоретико-групповой материал в как можно более элементарной форме. Вычисления теории воз- мущений лежали далеко в стороне от этих общих рассуж- дений; поэтому я ограничился разъяснением метода реше- ния, не вдаваясь в подробности и не упоминая большинства
ПРЕДИСЛОВИЕ КО ВТОРОМУ НЕМЕЦКОМУ ИЗДАНИЮ Ц применений, которые базируются на искусных работах Хартри, Слейтера, Дирака и других. Константы с и h (скорость света и квант действия) соз- дают некоторое неудобство. Понимание сущности этих кон- стант, возникшее в теории относительности, с одной сто- роны, и в квантовой механике, с другой, наиболее убеди- тельно выражает то обстоятельство, что они не возникают в законах Природы как результат полностью систематиче- ского построения этих теорий. Физики предпочитают сохра- нять обычные единицы СГС — в основном потому, что они дают порядок физических величин, с которыми мы сталки- ваемся в повседневной жизни. Между этими практическими соображениями и идеалом последовательных теоретиков возможен лишь зыбкий компромисс; я первоначально с некоторым сожалением пользовался общепринятыми в физике единицами, но в ходе главы IV теоретик взял верх. Кроме того, для удобства читателя в этом издании при- нята нумерация формул с учетом параграфа, к которому они относятся, наиболее важные понятия выделяются жир- ным шрифтом при их введении, а в конце книги приводится список условных обозначений, имеющих одно и то же зна- чение по всей книге. Гёттинген, ноябрь 1930. Г. Вейль
Готический алфавит Печатные буквы Рукопис- ные буквы Название букв Печатные буквы Ру копие* вые буквы Название букв 21а 01а а Я п я» ЭН ззь бэ b о О 0 О de 44 цэ ь ПЭ зп дэ £> q 9ч ку 6с г* э Иг эр 5 f эф G. sf тщ эс 9? гэ 1 t 14 тэ £/ ха 11 u У 3 i л и 40 фау 3 j йот Жго 1Юно вэ £1 № ка Г нкс & 1 хе эль « V ипсилон 3Rm 1Л1ш эм 3 а цэт
ВВЕДЕНИЕ Квантовая теория атомных процессов была построена Нильсом Бором в 1913 году и базировалась на предложенной раньше Резерфордом модели атома. Вывод серии Бальмера для линейчатого спектра водорода и определение постоянной Ридберга из универсальных атомных констант составили ее первое убедительное под- тверждение. Эта теория дала нам ключ к пониманию зако- номерностей, наблюдавшихся в оптическом и рентгеновском спектрах, и привела к более глубокому пониманию структу- ры периодической системы химических элементов. Выпуск журнала Naturwissenschaften, посвященный Бору и озаг- лавленный «Десять лет теории строения атома Нильса Бора» (1923, Bd. 11, S. 535), дает краткий обзор достиже- ний теории в ее апогее. Однако уже в это время станови- лось все яснее понимание того, что теория Бора являет- ся компромиссом между старой «классической» физикой и новой квантовой физикой, которая находилась в процессе развития с момента введения Планком в 1900 году кван- тов энергии. В статье «Атомная теория и механика» (поя- вившейся в журнале Nature, 1925, v. 116, р. 845) Бор опи- сал положение вещей словами: «Из этих результатов сле- дует, по-видимому, что в общей проблеме квантовой тео- рии приходится иметь дело не только с видоизменением ме- ханических и электродинамических теорий, которое может быть выражено при помощи обычных физических представ- лений, но и с существенным недостатком пространственно- временных образов, на которых было основано до сих пор описание явлений природы*)». Гейзенберг заменил это только отрицающее пророчество Бора конструктивным основополагающим принципом, и это явилось переломом, приведшим к новому этапу теории. *) Цитируется по изданию: БорН. Избранные научные труды—М.; Наука, 1971, т. 2, с. 13.— (Классики науки). (Примеч. пер.)
14 ВВЕДЕНИЕ В этой книге будут изложены основания новой кванто- вой физики или, по крайней мере, ее наиболее важные тео- ретические аспекты. Что касается дополнительных источ- ников по физической стороне вопросов, затронутых в кни- ге, я назову прежде всего четвертое издание хорошо из- вестной книги Зол/же/70ельда«А{ошЬаи undSpektrallinien».— Braunschweig, 1924, или английский перевод с ее третьего издания «Atomic Structure and Spectral Lines».— London, 1923, а также более свежую книгу «Wellenmechanischer Erganzungsband», 1929, или ее английский перевод «Wave Mechanics», 1930 *). Эквивалентной английской книгой является «Atoms, /Molecules and Quanta».— New York, 1930, Руарка и Ури, которая вышла в серии «International Se- ries in Physics», редактируемой Рихтмайером. Следует так- же порекомендовать короткий, но содержательный обзор Герлаха «Experimented Grundlagen der Quantentheorie».— Braunschweig, 1921. Спектроскопические данные, упорядо- ченные в соответствии с новой квантовой теорией, вместе с полной библиографией приводятся в следующих трех томах серии «Structur der Matherie», выходящей под ре- дакцией Борна и Франка’. Хунд Ф. Linienspectren und periodisches System der Ele- mente, 1927; Бак E. и Ланде A. Zeemaneffekt und Multiplettstruktur der Spektrallinien, 1925; Гротриан В. Graphische Darstellung der Spektren von Atomen und lonen mit ein, zwei und drei Valenzelektronen, 1928. Обсуждению спектроскопических аспектов предмета так- же посвящена недавняя книга Паулинеа и Гоудсмита «The Structure of Line Spectra», 1930, недавно вышедшая в серии «InternationalJSeries in Physics». Развитие квантовой теории стало возможным только благодаря огромному прогрессу экспериментальной тех- ники, которая дала почти прямое проникновение в атомные процессы. Если в дальнейшем будет мало говориться об экспериментальных фактах, это не следует относить к ма- *) Имеются переводы: Зоммерфельд А. Строение атома и спектры: Пер. со второго нем. изд.—М. —Л.: ГИЗ, 1926. —(Современные проблемы естествознания); Волновая механика.— Л. — М.: Гостех- издат, 1933. Кроме того, в 1951 году вышло расширенное издание «Atombau und Spektrallinien» в 2-х томах,гкоторое включает обе пре- дыдущие книги. Имеется его перевод: Строение атома и спектры.—М.; Гостехиздат, 1956, тт. 1, 2. (Примеч. пер.)
ВВЕДЕНИЕ 15 тематическому высокомерию автора; рассказ об этих ве- щах выходит за рамки книги. Позвольте мне здесь выразить раз и навсегда мое глубокое почтение к работе эксперимен- татора и к той борьбе за значительные факты, которую он ведет с неподатливой природой, так отчетливо говорящей нашим теориям «Н е т» и так нечетко «Д а». Наше поколение — свидетель такого развития физиче- ского знания, какого не было со времен Кеплера, Галилея и Ньютона, и математика едва ли когда- либо прежде переживала такую бурную эпоху. Математическая мысль, высвобождая идею из оболочки реального мира и придавая ей самостоятельную жизнь, отказывается тем самым от проникновения в тайны приро- ды. Но в награду за это математика меньше физики связа- на с течением процессов в реальном мире. В то время как квантовая теория может быть прослежена только до 1900 го- да, истоки теории групп затеряны в прошлом, едва ли до- ступном истории; даже наиболее ранние работы по искусству показывают, что уже тогда были известны группы симметрии плоских фигур, хотя их теории была придана определенная форма только в последней части восемнадцатого и в девят- надцатом столетиях. Ф. Клейн считал понятие группы наиболее характерным для математики девятнадцатого века *). До настоящего времени наиболее важным его при- менением в естественных науках было описание свойств симметрии кристаллов, однако недавно было установлено, что теория групп имеет фундаментальное значение для кван- товой теории; она вскрывает существенные черты, которые не являются следствием ни специальной формы динами- ческих законов, ни специальных предположений о дейст- вующих силах. Вполне можно ожидать, что теория групп — именно та часть квантовой физики, которая займет наибо- лее прочное положение. Две группы, группа вращений в 3-мерном пространстве и группа перестановок, играют здесь главную роль, поскольку, во-первых, законы, которым под- чиняются возможные конфигурации электронов, сосредото- ченных около неподвижного ядра атома или иона, сфери- чески симметричны по отношению к ядру, а, во-вторых, так как различные электроны, входящие в атом или ион, тождественны, то их возможные конфигурации инвариантны относительно перестановки отдельных электронов. Теория *) См.: Клейн Ф. Лекции о развитии математики в XIX столе- тии.— М.— Л.: ОНТИ, 1937, ч. 1. — (Примеч. пер.)
16 ВВЕДЕНИЕ представлений групп линейными преобразованиями — пер- вая связная и полная теория, к которой приводит исследова- ние групп,— является в точности тем чрезвычайно ценным математическим языком, который необходим для адекват- ного описания соотношений квантовой механики. Все квантовые числа, за исключением так называемого главного квантового числа, являются индексами, характеризующими представления групп. Эта книга, цель которой — изложить связь между груп- пами и квантами, состоит из пяти глав. Первая из них пос- вящена унитарной геометрии. Несколько прискорбно, что теорию линейных алгебр снова и снова приходится изла- гать с самого начала, поскольку фундаментальные понятия этой ветви математики широко используются в математике и физике и знание их должно быть так же широко распрост- ранено, как знание элементов дифференциального исчисле- ния (3). Многие вещи в этой главе будут введены с учетом бу- дущих приложений; несмотря на это, я надеюсь, что нить рассуждений останется легко обозримой. Вторая глава посвящена подготовке к уяснению физической стороны дела, причем дан только тот материал, который, как мне кажет- ся, необходим для понимания смысла и методов квантовой теории. Я опустил разнообразные применения, уже полу- ченные методами квантовой теории при описании физиче- ских явлений. В третьей главе изучаются элементарные вопросы теории представлений групп, а их применению в квантовой физике посвящена глава IV. Математика и фи- зика, чередовавшиеся в первых четырех главах, сливаются в пятой, показывая, таким образом, как математическая теория полностью приспосабливается к требованиям кван- товой физики. В этой последней главе досконально изу- чаются группа подстановок и ее представления вместе с группами линейных преобразований в аффинном или уни- тарном пространстве произвольного числа измерений.
ГЛАВА I УНИТАРНАЯ ГЕОМЕТРИЯ § 1. Векторное пространство п измерений Математическим понятием, с которым оперируют как квантовая механика, так и теория представлений групп, является понятие многомерного аффинного, или унитар- ного пространства. Без сомнения для построения геомет- рии такого пространства наиболее удобен аксиоматический метод, но ради ясности я сначала буду следовать чисто алгебраическим путем. Поэтому я начну с определения вектора у в n-мерном линейном пространстве sJt = как упорядоченного набора п чисел (хп х2, . . ., хп); векторный анализ есть исчисление таких упорядоченных наборов. Двумя фундаментальными операциями векторного исчис- ления являются умножение вектора \ на число а и сло- жение двух векторов j и i). После введения обозначений j = (xlt х2, ..х„), \; = (уг, у2, .... у„) эти операции определяются равенствами «Х = (аУ1, ау2, .. ., ау„), Х + V — (xi + Уп хп + //«)• Фундаментальные правила, которым подчиняются эти операции умножения на число и сложения, приводятся в следующей таблице аксиом, где строчные готические буквы обозначают произвольные векторы, а строчные ла- тинские буквы — произвольные числа: (а) Сложение. 1. а4-Ь = Ь + а {закон коммутативности). 2. (а+ 6) 4 с = а + (б4-с) {закон ассоциативности). 3. Для любых двух векторов а и с существует один и только один вектор у такой, что а4-у = с. Он называет-
18 ГЛ. 1. УНИТАРНАЯ ГЕОМЕТРИЯ ся разностью с—а векторов с и а (возможность вычита- ния). (р) Умножение. 1. (а 4- Ь) $ = (а%) + (&г) (первый закон дистрибутивнос- ти). 2. a(b^) = (ab)i (закон ассоциативности). з. is=4'. 4. a (j +1]) = (аг) + (al)) (второй закон дистрибутивно- сти). Существование вектора 0=-(0, О, ..., 0) со свойствами S + 0 = 0 + J = I не требуется постулировать отдельно, так как это сле- дует из аксиом. Аффинная векторная геометрия имеет дело с понятия- ми, которые полностью определяются в терминах двух фун- даментальных операций, свойства которых задаются ак- сиомами (а) и (Р); мы упомянем несколько наиболее важ- ных понятий. Говорят, что несколько векторов ах, а2, ... ..., ah являются линейно независимыми, если между ни- ми не существует ни одного однородного линейного соот- ношения CiCti + c2ct2 + ... + chah = 0 кроме тривиального с коэффициентами Ci = 0, с2 = 0, ..., сл = 0. Говорят, что h таких векторов порождают h-мерное (линейное) подпространство 9tz, которое состоит из всех векторов вида £’ = + g2a2 + ... + (1.1) где £i, ..., — произвольные числа. Из фундаменталь- ной теоремы об однородных линейных уравнениях следу- ет, что существует нетривиальное однородное соотношение, между любыми ftfl векторами из sJiz. Поэтому размер- ность h подпространства 91' можно характеризовать не- зависимо от базиса: любые h 4 1 векторов из 91' линейно зависимы, но в нем существуют h линейно независимых векторов. Любую такую систему из h линейно независи- мых векторов ах, а2, ..., ah в подпространстве 91' мож- но использовать как систему координат или базис
§ 1. ВЕКТОРНОЕ ПРОСТРАНСТВО п ИЗМЕРЕНИЙ 19 в 9iz; тогда говорят, что коэффициенты £х, g2, ..., в представлении (1.1) являются компонентами вектора j в системе координат (ах, а2, ...» аЛ). Все пространство 91 является n-мерным и векторы ех = (1, 0, 0, 0), е2 = (0, 1, 0, ..., 0), (12) .е’=(0, 0, 0,’...’, 1) определяют в нем систему координат, в которой компо- ненты вектора S = (*i, •••, *и) совпадают с «абсолютными компонентами» хр. j = xxex + x2e2 + ... +хпгп. Однако с точки зрения аффинной геометрии «абсолют- ная система координат» (1.2) не имеет никакого преиму- щества перед любой другой, состоящей из п независимых векторов из 91. Теперь мы добавим к предыдущим акси- омам, которые сами по себе не имеют отношения к раз- мерности /г, аксиому размерности: (у) Максимальное число линейно независимых векторов в 91 равно п. Этих аксиом, (а), (0) и (у), достаточно для полного по- строения векторного'исчисления, поскольку, если ех, е2, ... ..., — произвольный набор из п независимых векторов и х—любой другой вектор, между ними обязательно дол- жна существовать линейная зависимость ^j + ^iCx + + я2е2+...+а„е„==0. Коль скоро не все коэффициенты обращаются в нуль, мы, в частности, должны иметь а=#0, и потому любой вектор j можно представить в виде ли- нейной комбинации J = x1ei + x2e2+• • •+^„е„ (1-3) «базисных векторов» Ci, е2, е„. Мы однозначно опре- деляем х при помощи набора компонент (хп х2, ..., хп) в этой системе координат. Таким образом, в силу аксиом (а) и (0) для сложения и умножения, для любых двух векторов у и I) вида (1.3) имеем aj=(ax1)e1+ ... +(ах„)е„, j 9 = (%!+У1) е1 + ... + (х„ + уп) е„,
20 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ т. е. мы приходим к определениям, с которых начали. Единственным, но важным, различием между арифмети- ческой и аксиоматической трактовками является то, что в первой трактовке абсолютной системе координат (1.2) отдается предпочтение перед любой другой, тогда как в последней трактовке такого различия не делается. Пусть дана произвольная система векторов. Все век- торы, которые получаются как линейные комбинации ви- да (1.1) некоторого конечного числа векторов ап а2, ... .. ., этой системы, образуют (линейное) подпростран- ство— подпространство, «натянутое» на векторы а. Говорят, что пространство 91 приводится или разла- гается на два линейных подпространства 9?', 91" (91' = = 91' 4-91"), если произвольный вектор г можно единствен- ным образом представить в виде суммы вектора j' из 91' и вектора j" из 91". Система координат в 91' и система координат в 91" вместе образуют систему координат для всего пространства 91; такая система координат простран- ства 91 называется «согласованной» с разложением 91' + 91". Сумма п 4-п" размерностей подпространств 91' и 9£" рав- на п— размерности пространства 91. Наоборот, если под- пространства 91', 91" не имеют ни одного общего вектора, кроме нулевого, и если сумма их размерностей есть п, то 91 = 91'4-91". f Пусть 91'—n'-мерное подпространство. Говорят, что два вектора ? и I) конгруэнтны по модулю 91': 2 = 1) (mod 91'), если их разность лежит в подпространстве 91'. Конгру- энтность удовлетворяет аксиомам, определяющим любое отношение эквивалентности: каждый вектор конгруэнтен сам себе; если j = l) (mod 91'), то = (mod 91'); если j = (mod 91') и = 8 (mod9t'), то y = g (mod 91'). Поэ- тому допустимо рассматривать векторы, конгруэнтные mod 91', как ничем не отличающиеся друг от друга; с помощью этой абстракции, которую мы называем про- ецированием вдоль 91', из n-мерного пространства 91 возникает (п — м')-мерное пространство 91. В самом деле, 91 также является векторным пространством, поскольку из соотношений l)i = *)2 (mod 91') следуют соотношения = ^ + ^ = ^4-^ (rnodjR').
§ 1. ВЕКТОРНОЕ ПРОСТРАНСТВО п ИЗМЕРЕНИЙ 21 Поэтому операции умножения на число и сложения можно рассматривать как операции, которые действуют непосредственно на векторы % из Все векторы х про- странства 91, конгруэнтные mod9t', определяют один и тот же вектор % из SR. Если 9?' одномерно и натянуто на е, то изложенный выше процесс подобен процессу парал- лельного проецирования в направлении е; ясно, что нет необходимости задавать (п—1)-мерное подпространство из 91, на которое производится это проецирование (5). Если а — ненулевой вектор, то говорят, что все век- торы j, получаемые из а умножением на числа, лежат на том же луче, что и вектор а. Два ненулевых вектора определяют один и тот же луч тогда и только тогда, когда один является кратным другому. Если задана сис- тема координат, то вектор а полностью определяется своими компонентами аг, а2, ..., ап, тогда как луч а характеризуется отношениями компонент \. \ап. Эти отношения имеют смысл, только когда не все ком- поненты вектора а равны нулю, т. е. только когда а У= 0. Переход от одной системы координат ех- к другой описывается путем выражения новых координатных век- торов t'i через старые: С/г = 2 ^ik^i * i= 1 Если x'i суть компоненты произвольного вектора X со- ответственно в старой и новой системах координат, то i k откуда следует закон преобразования: (1.4) k= 1 Условие линейной независимости новых координатных векторов можно выразить арифметически как условие, что определитель из коэффициентов aik не обращается в нуль. При переходе к новой системе координат et- ком- поненты векторов £, I), ... пространства 9? подвергаются одному и тому же преобразованию; мы будем говорить, что они преобразуются когредиентно.
22 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ § 2. Линейные отображения. Матричное исчисление Формулу (1.4) можно интерпретировать иначе, а имен- но как выражение линейного или аффинного отоб- ражения пространства 91 на себя. Однако для этого, как будет видно, удобнее поменять ролями штрихованные и нештрихованные координаты. После выбора определен- ной системы координат уравнение 2 а1.х'л (2-1) Л-1 связывает произвольный вектор j с компонентами xz с вектором j' с компонентами х\. Это отображение Л:£—пространства 9? в себя можно характеризовать как линейное, поскольку, если векторы J, переходят в j', 1)', то вектор aj переходит в , а вектор j+ty пе- реходит в вектор j' + ty'. Поэтому линейные отображения оставляют неизменными все аффинные отношения; это свойство определяет их значение в теории аффинной гео- метрии. Чтобы показать, что эти два условия полностью определяют линейное отображение (2.1), заметим следу- ющее: если отображение Л, удовлетворяющее этим услови- ям, переводит базисный вектор в е* = 2а/*еп (2-2) i то, вследствие наложенных требований, вектор S = x1e1+ ... + х„е„ переходит в ?' = х1е;+ ... +х„е;. Подставив соотношение (2.2) в это равенство, мы видим, что новый ’вектор х' имеет в системе координат et ком- поненты х-, которые получаются из компонент X/ вектора j при помощи соотношений (2.1). В квантовой физике стало обычным называть линейные отображения вектор- ного пространства операторами, которые действуют на произвольный вектор j из 91. Пусть А, В—два линейных отображения, первое из которых переводит произвольный вектор £ в — Ах, в то время как второе переводит j' в j" = Вт' = В (4j). Ре- зультирующее отображение С, которое переводит j не- посредственно в j", также является линейным и обозна-
§ 2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. МАТРИЧНОЕ ИСЧИСЛЕНИЕ 23 чается (ВЛ) {читается справа налево!): (ВА)1 = В{А$). Это «умножение» удовлетворяет законам, которые подоб- ны законам умножения обыкновенных чисел; в частности, здесь справедлив закон ассоциативности С {В А) = (СВ) Л, однако закон коммутативности не выполняется, посколь- ку, вообще говоря, АВ=/=ВА. В этом множестве «едини- цей», которую здесь мы обозначим 1, является тождество, т. е. такое отображение, которое сопоставляет каждому вектору j самого себя: J—Следовательно, А1 = 1А = А. Отображение Л обратимо тогда и только тогда, когда оно невырождено; это значит, что ни один ненулевой вектор не переводится в вектор 0 или что различные векторы переводятся в различные. Алгебраическим выра- жением этого является условие, что определитель' | а^ | = = detA не обращается в нуль. В этом случае существу- ет обратное отображение Л"1: ЛЛ~1 = Л"1Л = 1. По теореме умножения для определителей det (ВЛ) = det В-det Л. Мы можем не только «умножить» два отображения, мы также можем их «сложить». Это понятие сложения возникает совершенно естественно: если произвольный вектор j переводится в под действием Л и в под действием В, то отображение, которое переводит j в ?1 + ?2, также является линейным и обозначается Л-f-B. (Л + В) j = Л j; Н - Bj. Кроме того, мы можем ввести умножение отображения на произвольное число а, а именно, аА есть отображение, которое переводит £ в а{А$. Операции сложения и умно- жения на число для отображений подчиняются тем же законам, что и аналогичные операции над векторами. Сложение коммутативно и в качестве своего обращения имеет вычитание. Роль нуля играет отображение 0, кото- рое каждый вектор j преобразует в нулевой вектор 0.
§2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ- МАТРИЧНОЕ ИСЧИСЛЕНИЕ 25 ства 2b J приводит к возникновению отображения С = ВА: г—>8 пространства 9i в X. На языке матричных компонент эта композиция выражается в виде закона: п k= 1 /7=1, 2, р\ V= 1, 2, .... tn) (2.4) Здесь В имеет р строк и п столбцов, а матрица А — п строк и т столбцов; такая композиция матриц возможна, когда у первого сомножителя В столько же столбцов, сколько у второго сомножителя А строк. Компонента или элемент cti. который располагается на пересечении /-й строки и i-го столбца, формируется по формуле (2.4) из компонент /-й строки матрицы В и f-го столбца мат- рицы А. Важный частный случай возникает, когда 3L — то же самое пространство, что и 91, тогда А является отображением пространства 91 в @, а В — пространства @ в 91. Уже здесь понятия теории групп играют важную роль; в начале главы III, в которой изучается теория групп, читателю следует вернуться к материалу, изло- женному здесь в качестве иллюстрации. Матричное исчисление позволяет нам выражать фор- мулы для линейных отображений типа (2.3) в сокращен- ной форме. Для этого обозначим через х такую матрицу, чей единственный столбец состоит из компонент вектора xlf х2. .... хт\ аналогично поступим в отношении у. В силу правила (2.4) для композиции матриц равенства (2.3) можно записать в виде у = Ах. (2.5) В частности, эта форма полезна при исследовании дей- ствия, которое оказывает замена первоначальной системы координат новой, на матрицу А линейного отображения пространства 91 в пространство Если эта замена ко- ординат осуществляется преобразованиями xiz=y\sijxi или х = $х' в 9R, ЧнУ'н или у = Ту' в ©, п то в силу (2.5) имеем Ty' = ASx' или yf = (T~1AS)xr.
26 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Поэтому то же самое отображение в новых координатах выражается матрицей A'^T^AS. (2.6) Давайте теперь вернемся к линейному отображению А пространства 94 в самого себя. Пусть 9?' есть п'-мерное линейное подпространство из 9с. Мы говорим, что А ос- тавляет 94' инвариантным, или что 94' инвариантно относительно А, если А переводит любой вектор из 94' в вектор из 91'. Если система координат выбрана так, что первые п' базисных векторов лежат в 91', то матрица отображения, которое оставляет 91' инвариантным, выг- лядит так, как это изображено на рис. 1. Рис. 2 Все элементы в прямоугольнике из п' столбцов и п—п' строк, обозначенном нулями на рис. 1, равны ну- лю. Отображение А определяет отображение 94' в себя и — в то же самое время — отображение пространства в себя, возникающее при проецировании 94 вдоль 94'. Матрицы этих отображений суть матрицы в заштрихован- ных квадратах. Если же 94 разлагается в 94х + 942 (п1 + м2 = /г) и если отображение А составляет оба под- пространства 94х и 942 инвариантными, то А полностью приводится к отображению 94х в себя и отображению 942 в себя. Если система координат приспособлена к раз- ложению 941 + 942, то матрица А полностью приводится к двум квадратным матрицам, выстроенным вдоль глав- ной диагонали, как показано на рис. 2. Незаштрихован- ные прямоугольники — пустые: все элементы, расположен- ные в этих частях, равны нулю.
§ 2. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ. МАТРИЧНОЕ ИСЧИСЛЕНИЕ 27 Пусть n-мерное линейное пространство 91 разлагается на подпространства 9ti + 3R2+ • • • + Sta + • • •, имеющие размерности па, тогда п равно сумме п14-^2+--* В этом случае любой вектор j можно единственным обра- зом записать в виде суммы Ji + y2+---, компоненты ко- торой лежат в подпространствах 9ii, Si2, ... Соответст-' вие X —>уа является линейным отображением Еа прост- ранства Si на 91а. Задав отображение А: j —* т' прост- ранства Si в себя, мы рассмотрим такое линейное отобра- жение [Д]аз, которое переводит произвольный вектор j из в компоненту Ха вектора х' из 91а. Мы называем [Л]аз частью отображения А, в которой Sia скрещивает- ся с Sip. Эга терминология проистекает из матричного представления отображения Л; приспособив систему ко- ординат к разложению S?i + Si2+ • • • , мы разбиваем на- бор переменных х{ (или, точнее, их индексов Z, которые нумеруют строки и столбцы матрицы) на сегменты длины па (a—1, 2, ...). Матрица А разделяется таким обра- зом на отдельные прямоугольники [А]ар, в которых а-е множество строк скрещивается с 0-м множеством столб- цов и которые состоят из элементов. Если А является матрицей отображения пространства 91 в себя в заданной системе координат, а Л'—матрица этого отображения в системе координат, полученной из первой путем обратимого преобразования S, то согласно (2.6) Л'=5~1Л5. (2.7) Поиск инвариантного способа описания отображений мож- но сформулировать алгебраически: найти такие выраже- ния от компонент произвольной матрицы, которые при- нимают одинаковые значения для эквивалентных матриц, т. е. для матриц Л, Л', удовлетворяющих соотношению (2.7). Путь, на котором этого можно достичь, указы- вается родственной задачей нахождения вектора ?#=0, который под действием отображения Л преобразуется в кратный себе вектор Ху. Столбец х из координат вектора j должен тогда удовлетворять уравнению Кх = Ах или (XI—Л)х = 0.
24 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Сложение подчиняется закону дистрибутивности по отно- шению к умножению: (А+В)С=АС + ВС, С(А + В) = СА + СВ, (аА)С = а (АС), С (аА) = а (СА). Прежде чем перейти к арифметическому выражению этих операций в заданной системе координат, мы рассмо- трим еще одно естественное обобщение. Мы можем ли- нейно отобразить m-мерное векторное пространство 91 в гг-мерное пространство для этого нужно каждому век- тору % из 91 сопоставить некоторый вектор 1) из G (обо- значается ? —> у) таким образом, что из > yn у2 —> у2 следует Ji+ ?2->t)i +l^- TaK определенное отображение A: И) выражается ра- венствами вида т Ук = ъ akiXi (£=1,2, .п), (2.3) i= 1 где ..., хт— компоненты вектора j в некоторой сис- теме координат, заданной в пространстве 9t, а уг, . . ., уп имеют аналогичный смысл в @. Этому отображению со- поставляется матрица tZll «12 • • • Clim «21 #22 • • • а2т йП1 &п2 • • • ^пт состоящая из п строк и т столбцов, которую мы обозна- чаем той же буквой А. Первый индекс указывает строку, а второй — столбец, которым принадлежит ан. Как и прежде, мы можем складывать отображения данного пространства 91 в данное пространство 2. При сложении матриц и умножении их на число каждая из их п-т компонент подвергается соответствующей операции: если А =|Ы1 и Я = |1М. ТО aA=\\a-aki\\, А 4- В = + М. Если имеется третье (р-мерное) векторное пространство X, то последовательное применение отображения А: х—>у пространства 9i в ® и отображения В\ у—>3 простран-
28 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Но п линейных однородных уравнений с п неизвестными имеют ненулевое решение, только если их определитель обращается в нуль; следовательно, множитель X должен быть корнем «характеристического многочлена» /(X)-det (XI—Л) (2.8) матрицы А. Этот многочлен является инвариантом в ука- занном выше смысле, поскольку из (2.7) или равносиль- ного равенства 5Л'^ЛЗ следует, что S(X1—Л') = (Х1^-Л)5, откуда при помощи теоремы об умножении определителей det S • det (XI — А') = det (XI — А) • det S. Так как определитель обратимого преобразования S не может обратиться в нуль, мы можем разделить на него и получить требуемое тождество [XI — Л'| = |Х1 — Л|. Характеристический многочлен имеет степень п по X: /(Х) = х«—sA'^+.-. + v, его коэффициенты (некоторые целые рациональные функ- ции элементов aik) являются инвариантами отображения Л. «Норма» (6) sn есть просто определитель матрицы Л. Пер- вый коэффициент, след Si = + ^22 + • • • + апп = tr Л, (2.9) является более важной величиной, так как он линейно зависит от aik\ tr (Л! + Л2) = tr Л i + tr Л2. Если Л — линейное отображение m-мерного векторного пространства Э? в п-мерное пространство а В—напро- тив, линейное отображение пространства ® в fR, то мы можем построить отображения В А пространства в себя и АВ—пространства @ в себя. Эти два отображения имеют одинаковый след 1г(ВЛ) = 1г(ЛВ), (2.10) поскольку в силу правила композиции (2.4) и определе-
§ 3. ДВОЙСТВЕННОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО 29 ния (2.9) мы имеем tr (ВЛ) = 2 blkan, tr (ЛВ) = 2 i, k i, k где i меняется от 1 до m, a k—от 1 до n. Частный слу- чай, в котором и А и В суть отображения пространства 91 в себя, естественно, заслуживает детального рассмот- рения. § 3. Двойственное векторное пространство Функция L(t) произвольного вектора т, имеющая вид ад + ад + • • • + «Д, (3.1) называется линейной формой. Эго понятие инвариантно в смысле аффинной геометрии: оно может быть опреде- лено при помощи функциональных свойств L (ar) = aL (г), L (г + 1)) = L (х) + L (р). Ясно, что выражение (3.1) обладает этими свойствами, и наоборот, после введения системы координат ez и подста- новки J=2X^/ получим L (у) = 2 xiL (£/) = 2 = L (е/)- i i При переходе к другой системе координат, в которой ком- поненты хг произвольного вектора у подвергаются преоб- разованию (1.4), линейная форма принимает вид 2 aixi=2 aix'i’ где коэффициенты а'- связаны с первоначальными ра- венствами а* = 2«>А- i Говорят, что коэффициенты az линейной формы преобра- зуются контрагредиентно относительно переменных xt. Однако нет необходимости рассматривать af как кон- станты, a Xi как переменные. Когда не все af равны нулю, уравнение L (j) = 0 определяет «плоскость», т. е. (п— ^-мер- ное подпространство; вектор у лежит в этой плоскости, если его компоненты удовлетворяют этому уравнению. Но, с другой стороны, мы можем заинтересоваться уравнением
30 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ всех плоскостей, которые проходят через заданный нену- левой вектор у0, тогда = являются константами, я а{ — переменными. Следовательно, наиболее удобно рассматри- вать эти два набора (х19 х2, .. ., хп) и (ах, а2, ..ая) равноправно. Поэтому мы введем, кроме пространства 91, второе n-мерное векторное пространство Р, называемое двойст- венным пространством. По компонентам (£п Н2, ..., £Л) вектора £ из Р и (хх, х2, ..., хп) вектора у, из 91 мы можем построить внутреннее или скалярное произведение + • • • -г 1ПХП. (3.2) Это произведение по определению имеет инвариантный смысл, поскольку если отнести пространство 9i к новой системе координат посредством преобразования перемен- ных xh то переменные из двойственного пространства Р подвергнутся контрагредиентному преобразованию. Это двойственное пространство на самом деле для того и вво- дится, чтобы мы могли сопоставить каждому взаимно од- нозначному преобразованию контрагредиентное ему пре- образование. Повторим: два обратимых линейных преоб- разования х = Ах, g = Ag' (3.3) являются контрагредиентными друг другу, если они со- храняют форму (3.2) неизменной: ^1^1 ”Ь ^2^2 ^>п%П ^2-^2 4“ • • • ~F (3’4) Говорят, что вектор у из 9t и вектор £ из Р находятся в инволюции, если их произведение (3.2) обращается в нуль. Прямая из 91 определяет плоскость в Р, т. е. плоскость, состоящую из векторов в инволюции с данной прямой, и наоборот. Двойственность является обратимым отноше- нием *). Матрица Л*, двойственная или транспонированная матрице А\\akl||, получается заменой строк матрицы А столбцами. Поэтому Л* = ||я^|] определяется равенствами a*ik = aki и имеет т строк и п столбцов. Мы всегда будем использовать звездочку для обозначения этого процесса. Какова же ее геометрическая интерпретация? Пусть 9? — m-мерное, а @—п-мерное векторные пространства; *) В теории относительности векторы из 91 и Р обычно называют контравариантными и ковариантными векторами соответственно.
§ 3. ДВОЙСТВЕННОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО 31 A: у —►1) — линейное отображение 91 в ©, описываемое матрицей А в заданных системах координат пространств 9i и <©: ^=2 ад. i и пусть Р, 2—соответствующие двойственные простран- ства. Произведение 2 =2 адл (=2 k k, i \ i / в котором т] — произвольный вектор из 2 с компонентами т]^, имеет тогда инвариантный смысл. Поэтому билинейная форма, зависящая линейно от вектора т] из 2 и вектора у из Qi, инвариантным образом связана с линейным ото- бражением пространства Э? в и обратное тоже верно. Как показывает данное в скобках выражение билинейной формы, это соответствие определяет отображение 1]^: = k пространства S в Р, т. е. отображение А*, двойственное отображению А. Обратимое отношение между отображе- нием А и двойственным ему А* можно описать так: если у—произвольный вектор в 91 и т]—произвольный вектор в 2, то произведение векторов Лу и т] равно произведе- нию у и Л*т). Эти двойственные отображения подчиняются линейным законам (л1+л2)»=л;+л;, («л)*=ал*. Если А—отображение 9i в ©, а В—отображение © в то В А отображает 91 линейно на $, а А* В* отображает пространство Т, двойственное к на пространство Р, двойственное к 91, поскольку (ВА)* = А*В*. (3.5) Мы раз и навсегда договорились рассматривать набор xlt xt, х„ компонент вектора у как столбец; поэтому скалярное произведение вектора у из^Э? на вектор £ из Р можно записать в матричном (виде как или х*|. Сле- довательно, преобразования (3.3) (где х* = х'*А* согласно первому из равенств) контрагредиентам между собой при условии, что Л*А=1 или А = (Л*)-1, (3-6)
32 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ т. е. мы пришли к явному выражению для контрагреди- ентного преобразования. Пусть Si' — n'-мерное подпространство из 91 = 9?„. Со- гласно простейшим теоремам о линейных однородных урав- нениях все векторы из Р, которые находятся в инволюции со всеми векторами из 91', очевидным образом составляют (п— п')-мерное подпространство Р' в Р. Отсюда сразу получаем: если отображение А пространства 9i в себя оставляет подпространство 91' инвариантным, то двой- ственное отображение А* пространства Р в себя остав- ляет инвариантным подпространство Р'. Пусть 9i разлагается в сумму двух или более подпро- странств Sii + sJi2+--« размерностей пг, п2, и пусть через Pj обозначается подпространство из Р, которое состоит из всех векторов, находящихся в инволюции со всеми векторами из sJt2 + 9i3 + . ..; размерность такого подпро- странства также равна п±. Определяя аналогично Р2, Р3, .. ., мы приходим к разложению Р = Рх 4- Р2 4- ..., ибо сумма вектора из Рх, вектора из Р2 и т. д. может быть нулем только тогда, когда каждый из слагаемых векторов равен нулю. Чтобы доказать последнее утверждение, за- метим, что если сумма равна 0, то первое слагаемое при- надлежит как Рп так и Р24-Р34- ..., т. е. оно находится в инволюции с векторами как из 9i24 9t3 т • • • , так и из 9tx, и поэтому со всеми векторами из 9i. Но это возможно только тогда, когда это слагаемое, и, следовательно, любое, есть нуль. Пространство Рх можно рассматривать как двойственное с 9ix, поскольку для любого вектора j из 91 х и любого вектора т] из Р, который имеет компоненты т](а) в различных Ра, произведение % и г] равно произведению J И Т](1). Если отображение А пространства 9i в себя оставляет n'-мерное подпространство 91' инвариантным, то соответ- ствующее (п — п')-мерное подпространство Р' инвариантно относительно двойственного отображения Л* простран- ства Р в себя. Если 9i разлагается в 9ix4-9i24-• • • и если А оставляет инвариантным каждое из подпространств 9ia, то А* оставляет инвариантным каждое из подпрост- ранств Ра. Если А — произвольное отображение в 9i и [Л]ар—его часть, в которой 9ia скрещивается с 91р, то часть [Л*]ра отображения А*, в которой скрещиваются Рр и Ра, двойственна с [Л]аэ: [л*]₽а=[л];э. (3.7
§ 4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 33 Часть [Л]ар отображает на 9ta, а [Л*]ра отображает двой- ственное пространство Ра на Рр. Все эти результаты концептуально очевидны, но их даже легче получить просто из матриц, если выбрать в + • • • удобную систему координат. § 4. Унитарная геометрия и эрмитовы формы Метрика вводится в аффинную геометрию посредством нового фундаментального понятия: абсолютной величины вектора. В качестве квадрата абсолютной величины век- тора j = (%i, х2, ..., хп) в евклидовой геометрии выби- рается сумма квадратов f = xl + xl+...+x2n (4.1) его компонент. Тогда единственными допустимыми систе- мами координат, и притом в равной степени допустимыми, являются декартовы системы, т. е. системы, в которых квадрат абсолютного значения вектора j задается через компоненты х{ формулой (4.1); в качестве области значе- ний, которые в таком случае компоненты могут прини- мать, выбирается множество всех действительных чисел. Однако содержание предшествующих параграфов не огра- ничено этим случаем; в действительности единственное требование таково: область допустимых значений обра- зует «поле», в котором выполнимы четыре фундаменталь- ные операции, исключая деление на нуль. Ниже мы рас- сматриваем в качестве области значений компонент мно- жество всех комплексных чисел. Выражение (4.1) в этом случае теряет свой определяющий характер; сумма квад- ратов может обращаться в нуль и тогда, когда не каждое слагаемое равно нулю. Поэтому желательно заменить квадратичную форму (4.1) на «унитарную форму Эрмита» ад + хгхг 4 • • + хпхп, (4.2) где через х обозначается комплексно сопряженное с х число. Величина уа- вида (4.2) будет принята в качестве квадрата абсолютной величины вектора j = (xn х2,... ..., х„), а соответствующая билинейная форма (7) 0$)== + х2у2 + • • • + Хпуп — в качестве скалярного произведения (эд) двух век-
34 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ торов j и V = //2> -чУп\ Система координат назы- вается нормальной, если квадрат абсолютного значения вектора у выражается через его компоненты в этой си- стеме координат формулой (4.2). В нормальной системе координат е,- эти компоненты являются скалярными про- изведениями xf = (etr). (4.3) Преобразования, которые переводят одну нормальную систему координат в другую нормальную и потому остав- ляют форму (4.2) инвариантной, называются унитарны- ми преобразованиями*). Условия, характеризующие унитарные преобразования, полностью аналогичны условиям ортогональности преоб- разований, с которыми мы знакомы по аналитической гео- метрии. Пусть x — Sx'— некоторое такое преобразование; под действием S фундаментальная метрическая форма (4.2) переходит в x'^S*Sx'. Поэтому S унитарно тогда и только тогда, когда S*S=1; тот факт, что det S =/= 0, немедленно следует отсюда. В самом деле, матрица S и ее транспо- нированная S* имеют одинаковые определители, следова- тельно, абсолютная величина определителя унитарного преобразования равна 1, т. е. | det S |2 = 1. Эти условия можно сформулировать так: S* является матрицей S~x, обратной к S, и поэтому не только S*S=1, но и SS*=1. Первое из этих уравнений утверждает, что сумма квад- ратов абсолютных величин элементов любого столбца есть 1 и что сумма «смешанных» произведений 2 srisrk ДВУХ Г различных столбцов (i=/=k) равна 0; второе уравнение содержит то же утверждение об элементах строк. Мы заимствуем терминологию, принятую в евклидовой геометрии. В частности, будем говорить, что вектор 1) перпендикулярен к j, если скалярное произведение (тц) обращается в нуль. В силу закона симметрии *) В физической литературе для обозначения этих преобразова- ний использовалось название «ортогональные», но в математике не- обходимо иметь различные наименования для этих двух различных понятий.
§4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 35 перпендикулярность является обратимым отношением. Не существует вектора а, кроме а = 0, к которому перпенди- кулярны все векторы; в действительности а = 0—единст- венный вектор, перпендикулярный самому себе. Нормаль- ные системы координат можно охарактеризовать условием, что скалярные произведения их базисных векторов имеют вид I 1 = (e/eft) = 6u = |0 При сравнении фундаментальной метрической формы (4.2) с (3.2) видно, что унитарное пространство 9i может характеризоваться тем, что комплексно сопряженное про- странство совпадает с двойственным к нему пространст- вом Р, или, более точно, вектор j, комплексно сопряжен- ный к вектору J, можно одновременно рассматривать как двойственный к нему. Нами было обнаружено, что с ото- бражением А унитарного m-мерного пространства 9i в n-мерное пространство @ инвариантным образом связано отображение А* двойственного пространства S в двойст- венное пространство Р. Как следствие равенства Р = 9?, для унитарных пространств отображение Л*= Д является отображением пространства в в 9i; мы называем его «эрмитово сопряженным к Л». А А является ото- бражением 91 в себя и А А—пространства @ в себя. Ото- бражение S, которое переводит произвольный вектор £ в = унитарно, если оно оставляет абсолютную ве- личину вектора j неизменной: j'2==j;2. Две конфигурации, составленные из векторов, одна из которых может быть получена из другой унитарным пре- образованием, являются конгруэнтными в унитарной гео- метрии, т. е. унитарная геометрия есть теория таких от- ношений, которые инвариантны при произвольном уни- тарном преобразовании. На языке матричного исчисления эти преобразования характеризуются одним из двух ра- венств SS = 1, SS=1. Пусть 9i'— m-мерное линейное подпространство, натя- нутое на линейно независимые векторы ап п2, . . ат. Мы
36 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ считаем, что вектор у принадлежит пространству 94" тогда и только тогда, когда он перпендикулярен к 94', т. е. ко всем векторам подпространства 91', такой вектор должен поэтому удовлетворять уравнениям: (axj) = O, (a2y) = 0, ..., (a„r) = 0. Из них следует, что 9?" имеет (п—т) измерений. Это от- ношение ортогональности между 94' и 9t" обратимо: каж- дый вектор из 91" перпендикулярен каждому вектору из 94', и наоборот. Тогда 94 ==94'4-94", ибо, если сумма j' + j" вектора j' из 94' и вектора j" из 94" равна нулю, то j' =— — вектор, который принадлежит обоим простран- ствам и, следовательно, перпендикулярен самому себе, а это может произойти только при j' = 0. Унитарное ото- бражение, которое оставляет 94' инвариантным, будет также оставлять инвариантным 94", так как отношение перпен- дикулярности не нарушается при таком преобразовании. Оперируя с унитарными отображениями или преобразова- ниями, всегда можно найти инвариантное подпростран- ство 94", связанное с данным инвариантным подпростран- ством 94' таким образом, что 94 = 94'4 94". Предшествую- щие замечания о проецировании предполагают, что здесь в унитарной геометрии мы отождествляем пространство, возникающее при проецировании 94 вдоль 94' с подпро- странством 94": мы проецируем на пространство 94", пер- пендикулярное к 94'. И, наконец, заметим, что множество всех векторов а из 91, конгруэнтных mod9t', содержит вектор (а) из 94"; следовательно, (а • а) = а (а), (а 4- Ь) = (а) + (£>)• Как мы видели, с произвольным линейным отображе- нием А = yi = ^atkyk (4.4) k пространства 94 в себя связана билинейная форма ik которая зависит линейно от вектора из Р и вектора 1) из 94. Поэтому в унитарном пространстве с отображением (4.4) мы можем связать форму ik
4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМЙТоЁЫ ФО£>МЫ 3? зависящую линейно от !) = («//) и у = (х,). В действитель- ности она является скалярным произведением вектора у на Лг>. Частный случай А=*А, или A(i), у) = 4 (у, t))> или аы — aiky (4-5) носит имя французского математика Эрмита. Отображе- ние (4.4) является, следовательно, эрмитовым, если скалярное произведение у на 4l) равно комплексно сопря- женному скалярному произведению вектора I) на Ах. Отож- дествив 1) с у, мы получим «эрмитову форму» Л(у) = Л(у, (4.6) т. е. скалярное произведение у и Лу; в силу (4.5) она принимает действительные значения. Говорят, что эрмитова форма Л невырождена, если не существует ни одного век- тора у, исключая у = 0, преобразование которого Лу об- ращается в нуль. Эрмитова форма называется положи- тельно определенной, если значение формы Л(у) > 0 для всех векторов у=И=О; положительно определенная форма невырождена. Фундаментальная метрическая форма (4.2)—пример такой положительно определенной эрмитовой формы, «уни- тарной формы», коэффициенты которой составляют числа И (М) ik~ I 0 После введения произвольной системы координат at (i= 1, 2, ..., п) в n-мерном пространстве абсолютное значение любого вектора у=х1а1 +х2а2+ • • • +х„ап задается выражением Выражение для J2, таким образом, всегда является поло- жительно определенной эрмитовой формой; и наоборот, любую положительно определенную эрмитову форму G(j) можно было бы взять в качестве фундаментальной метри- ческой формы. Чтобы это показать, мы воспользуемся соответствующей эрмитовой билинейной формой G(j, ty) и выполним следующую процедуру, которая повторяет шаг за шагом построение декартовой системы координат. Выбе- рем любой ненулевой вектор ех; поскольку G(ex)>0, мы
38 ГЛ. I. УНИТАРНАЯ ГЁОМЕТРИЯ можем, умножив на подходящий числовой множитель, нормировать его в соответствии с равенством G (ех) = 1. Когда наш процесс построения системы единичных орто- гональных векторов Ci: G(e/, = прошел т шагов, t = l, 2, ..., m, следующий шаг осу- ществляется выбором некоторого решения ;’ = ew+1 системы т(</г) однородных линейных уравнений G(e/, $) = 0 (с п неизвестными компонентами вектора £=#0) и его нор- мированием согласно равенству G (еот+1) = 1. После п шагов процедура завершается; окончательно мы получаем п таких векторов еп е2, ..., еп, что $ = x1x1+x2xi + +хпхп, где J = ^ei + x2e2+ ... +х„еп. Из самих этих равенств следует, что х может быть нулем только, когда все его компоненты равны нулю и, сле- довательно, векторы et- линейно независимы и образуют систему координат в 91. Переход от аффинной к метрической геометрии, таким образом, можно осуществить введением аксиомы: (6) Квадрат абсолютного значения вектора j есть дей- ствительное число j2, которое является положительно оп- ределенной. эрмитовой формой от компонент вектора у. Последние рассуждения полезны и в другой связи. Если 9Г—линейное подпространство в SR, мы можем при- менить конструкцию, которой мы пользовались, чтобы найти т векторов ех, е2, ..., ет в 91', на которые 91' на- тянуто и которые являются единичными взаимно ортого- нальными в смысле равенств (efeA) = 6ife. Продолжая по- строение, мы можем пополнить эти т фундаментальных векторов п—т дополнительными е^+1, ..., ед, так что оба набора вместе образуют систему координат для всего пространства 91. Следовательно, мы можем приспособить нашу нормальную систему координат к такому выделению 91' из 91 или к разложению 9i = 9i'4 9i" на два перпен- дикулярных подпространства. Поскольку отображение А пространства 91 в себя ин- вариантным образом связано с эрмитовой формой А в 91, мы можем говорить о произведении ВА двух эрмитовых форм Л, В из 9?, однако это произведение, вообще говоря,
§4. УНИТАРНАЯ ГЕОМЕТРИЯ И ЭРМИТОВЫ ФОРМЫ 39 не является эрмитовым, так как ВА~АВ=АВ. След эрмитовой формы, или отображения, А действителен. Положительно определенное выражение tr(XX) = 2|aZft|2 (4.7) i, k имеет особое значение. Если 91 разлагается на взаимно перпендикулярные подпространства 91а (a=l, 2, ...), то часть Аар отображения, или формы, Л, в которой 91а скрещивается с 91р, определяется однозначно; это —отобра- жение подпространства 9Jp в 9ia, а Лра, т. е. Ра-часть отображения Л, является отображением 91а в 9tp. Если система координат приспособлена к разложению прост- ранства 91, то fr (^арДза) = tr (ЛраЛар) = | aik |2, (4-8) где в сумме индекс / пробегает а-й, а индекс k пробега- ет Р-й наборы индексов. Любой ненулевой вектор а определяет луч а, который состоит из всех векторов вида Ха, где X—произвольное комплексное число. Порождающий вектор а можно так нормировать, что его абсолютная величина станет равной единице, | a | = 1; это, однако, не определяет а с точностью до изменения знака, как в области вещественных чисел, поскольку нормировка не изменится при умножении а на произвольное комплексное число 8 с модулем 1. Мы будем называть совокупность всех векторов из 91 векторным полем 91, а совокупность всех лучей — полем лучей 91. Любое невырожденное линейное отображение Л векторно- го поля 91 в себя является одновременно отображением поля лучей 91 в себя, но это последнее отображение не изменяется при умножении исходного отображения на любое отличное от нуля число. Унитарное отображение или преобразование поля лучей в себя будем коротко на- зывать вращением. Записью S' c^S мы будем обозначать тот факт, что два преобразования S, ’S' векторного поля в себя отличаются только числовым множителем 8 с мо- дулем 1, т. е. S'^ eS, следовательно, они оба приводят к одному и тому же вращению поля лучей.
40 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ § 5. Преобразование к главным осям Фундаментальная теорема об эрмитовых формах—это теорема о преобразовании к главным осям. Здесь мы отме- тим аналогию с известной задачей нахождения главных осей эллипса или эллипсоида в обычной геометрии двух или трех измерений. Мы хотим связать с эрмитовой фор- мой A (?) такую нормальную систему координат е{, чтобы вместе с равенствами = х1е1-\-х2е2-\- хпеп, (5 1) j2 = XjXj + х2х2 + ... + ~хпх„ выполнялось также соотношение А (?) = + a2x2x2 + ... + a„x„x„, (5.2) т. е. чтобы форма А была приведена к нормальной форме (5.2) посредством унитарного преобразования. Веществен- ные числа an a2, ..., a„ называются собственными числами формы А, а е2, е„—соответствующими собственными векторами (8). Для этого мы сперва рассмотрим отображение ? —> ?'=Д? и будем искать такие векторы ?=И=0, которые под дейст- вием А преобразуются в кратные самим себе: ?' = X?. Отсюда получаем «вековое уравнение» f(X) = det(M — Л) = 0 для множителей X. В силу основной теоремы алгебры это уравнение обязательно имеет корень X = af, можно найти соответствующий ему ненулевой вектор ? = еп который удовлетворяет уравнению Де1 = а1е1, и, умножив этот вектор на подходящее число, мы можем сделать его мо- дуль единичным. Затем ej можно дополнить еще п— 1 векторами таким образом, чтобы эти п векторов составляли нормальную систему координат. В этих координатах фор- мула k для отображения А согласно определению Ci требует, чтобы коэффициенты a2I, а31, ..., ап1 были равны нулю и чтобы an = ai- В силу условий симметрии aki = atk коэффициенты aI2, а13, ..., а1п также должны быть нулями. Следова- тельно, в этих новых координатах матрица А принимает
§ 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 41 ВИД «10 о ... о О «22 «23 • • • «2П О #32 «33 • • • а3п » О ап2 «пз ••• апп (5-3) а эрмитова форма распадается на две части 4(х) = ед-|-Л'(г), (5-3') где А' является эрмитовой формой, содержащей только n—1 переменных х2, х3, ..., хп. Повторяя этот процесс или сославшись на метод математической индукции, мы устанавливаем справедливость сформулированной выше фундаментальной теоремы. Характеристический многочлен формы (5.2) принимает вид det(Xl-X) = (X-a1)(Z~aa) ... (X-a„). Отсюда следует, что собственные числа an а2, ..., an и их кратности единственным образом определяются эрмито- вой формой Д; их сумма является следом матрицы А. Что мы можем сказать о собственных векторах? Пусть а —некоторое заданное вещественное число; векторы у, удовлетворяющие уравнению Д^ = ау, образуют линейное подпространство 9? (а) из 9i, так называемое собствен- ное пространство, соответствующее а. Если нормаль- ная система координат ez выбрана так, что А имеет нор- мальную форму, то уравнение А^ = aj, переписанное в коор- динатах, имеет вид azxz = axz, откуда следует, что 91 (а) натянуто на такие векторы ez, для которых az = a. Если, например, три корня ах, а2, а3 равны а, в то время как другие отличны от а, то собст- венное пространство трехмерно. Если ни одно из собст- венных чисел az не равно а, то 91(a) состоит только из нулевого вектора. Эти соображения позволяют по-новому характеризовать собственные числа, включая их кратности, независимо от выбора системы координат, и также харак- теризовать соответствующие собственные подпространства 91(a). Таким образом, 9t разлагается на собственные про- странства 9t(a): 9t = 29t(a); в этой сумме только конеч-. a
42 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ ное число слагаемых, а именно, таких, для которых а является собственным числом формы А. Полную систему координат Сц е2, ..., е„ для всего пространства $ можно по- лучить, выбрав какую-либо нормальную систему координат в каждом ненулевом подпространстве SR(a). Нормальная форма (5.2) не изменится, если переменные х(, соот- ветствующие одному и тому же собственному числу a( = a, подвергнуть произвольному унитарному преобразо- ванию. Если, например, а—собственное число кратности 3, т. е. ах = аа = а, = а, в то время как оставшиеся ar=/»a, то вектор х^ + х^А- +%3е3 является нормальной проекцией jo вектора J на SR (а) и является скалярным произведением ja на себя. Кроме того, равенства (5.1) и (5.2) можно переписать в инвариантной форме: S2 = 2£a(S), ^(?) = 2a,£a(?)- (5.4) a a Если SR'— подпространство из SR, то любой вектор J можно однозначно представить в виде суммы j' + Jo> где лежит в SR', а перпендикулярен к SR'. «Ортогональная проекция» = Е'£ является линейным отображением, которое, очевидно, обладает свойством Е’Е' = Е’, (5.5) так как проекция вектора х' на SR' есть просто сам j'. Более того, оператор Е' эрмитов, ибо скалярное произве- дение I) на равно скалярному произведению if на j, где V'—проекция 1) на SR'. (В связи с этим эрмитова форма Е' (j) является квадратом абсолютной величины вектора $'.) Эрмитовы формы, которые удовлетворяют равенству (5.5), мы назовем идемпотентными. Если два подпространства 9t' и SR" ортогональны, то соответствующие операторы проецирования Е' и Е" удов- летворяют равенствам Е'Е" = 0, Е"Е' = 0, (5.6)
§ 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 43 поскольку Е' (E"j) является компонентой Е'Т, лежащей в пространстве 9(' и перпендикулярной к Идемпо- тентные операторы, удовлетворяющие (5.6), называются независимыми. Более того, второе равенство (5.6) является следствием первого: перейдя к эрмитовому сопряжению, можно увидеть, что Е"Е' = 0. Если 91 разлагается на не- сколько взаимно ортогональных подпространств 91' + + 91"+ • •., то S = E'S + E"?+... (5.7) Легко показать, что обращения всех этих утверждений также справедливы. Если Е’ — идемпотентный оператор и Е" — \—Е', то все векторы вида E'j образуют линейное подпространство 91', а все векторы вида Е"г—подпрост- ранство 9t". Равенство Ё'Ё' = Е'Е" = Е' (1 — Е') = 0 показывает, что скалярное произведение вектора Е'х из 9i' на вектор Е" \) из 9?" равно нулю: хЁ’Е”у — 0. В связи с этим разложение вектора j на компоненту из 9i' и ком- поненту, перпендикулярную к 91', имеет вид j = E'j + (1— E')j. Если две идемпотентные формы Е’ и Е" удовлетворяют равенству (5.6), то, как мы только что видели, два соот- ветствующих собственных пространства 91' и 9i" взаимно перпендикулярны. Если сумма (5.7) состоит из независи- мых идемпотентных форм, то в силу вышесказанного соот- ветствующие взаимно перпендикулярные подпространства 9Г, 9t" и т. д. исчерпывают все пространство 9t. Таким образом, теорему о преобразовании к главным осям можно сформулировать так: Эрмитова форма А связывает с вещественными числами а взаимно независимые идемпотентные эрмитовы формы Еа, так что 1=2^а. Л = (5.8) а а причем Еа отлична от нуля только для конечного числа значений а. Отображение А можно применять неоднократно: АА = А2, АгА = А3, ...
44 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ Поэтому мы можем образовывать многочлены по степеням отображения А f (Л) = с01 + + • • • + ch^h с числовыми коэффициентами с{. Повторив отображение (5.8) h—1 раз, получаем Л*=2аА£а, а откуда для многочлена f общего вида f(A) = ^f(a)Ea. (5.9) а Поэтому собственными числами отображения f(A) явля- ются значения многочлена /(а) для собственных значений а отображения А. Это наводит на мысль определить эрми- тову форму /(Л), где /(а)—любая вещественная функция вещественной переменной а, посредством равенства (5.9). Пусть заданы две эрмитовы формы А и В. При каких условиях их можно привести одновременно к диагональ- ному виду, т. е. когда можно найти нормальную систему координат, в которой Д (?) = + aJ2x2 + ... + а„х„хп, 5 ю В (?) = РхЗД + р2х2х2 + ... + Р„х„хп? Необходимое условие таково', эти отображения должны коммутировать (ВА = АВ), так как если А и В имеют нормальный вид (5.10), то и В А и АВ—диагональные матрицы с элементами Это условие также и достаточно-, чтобы это доказать, выберем нормальную систему координат, в которой А уже записывается в нор- мальной форме. Уравнение ВА = АВ требует, чтобы мат- рица В = ||61л|| удовлетворяла равенствам blltak = a/>{k или (ar—aft) btlt= 0. (5.11) Мы разобьем индексы i, базисные векторы е, и перемен- ные X/ на классы, считая, что i и k принадлежат одному классу, если а, = а6. Уравнение (5.11) утверждает, что b{/t = 0, когда i и k принадлежат разным классам. Сле- довательно, матрица В распадается на меньшие матрицы В', В”, ..., выстраивающиеся вдоль главной диагонали, в соответствии с порядком, в котором af распределяются по классам а', а", ...; следовательно, отображение В ос- тавляет инвариантным каждое из собственных пространств
§ 5. ПРЕОБРАЗОВАНИЕ К ГЛАВНЫМ ОСЯМ 45 9ft (a'), 8ft (а"), • •• отображения А, Но тогда мы можем выбрать некую нормальную систему координат в каждом из этих собственных подпространств 9ft (а) так, чтобы эрми- товы отображения В', В”, ... были в них соотнесены с главными осями; нормальная форма А при этой процедуре не меняется. Этот процесс можно непосредственно применить к лю- бому числу эрмитовых форм: любое число эрмитовых форм можно одновременно привести к нормальному виду в том и только том случае, когда они коммутируют друг с другом. Небольшая модификация позволяет распростра- нить эту теорему на произвольную конечную или бесконеч- ную систему 2 эрмитовых форм. Здесь мы вкратце обсу- дим это, хотя рассмотрение систем форм или отображе- ний в общем случая откладывается до гл. IIL Пусть пространство 9ft разлагается на взаимно перпендикулярные подпространства 9ft', 9ft", ... так, что каждое отображение системы 2 оставляет инвариантным каждое из выделенных подпространств; если приспособить систему координат к этому разложению, то каждая эрмитова матрица А из 2 составится из матриц Л', Л", ..., выстроившихся вдоль главной диагонали. Если составляющие вида Л' всех мат- риц системы 2 уже кратны единичной матрице 1 в 9ft' и то же относится ко всем другим составляющим Л" ..., наша цель достигнута, ибо тогда каждое отображение Л из этой системы преобразуют 9ft' в себя и является в нем простым умножением; аналогично для 9ft", ... Однако, если это не так, то пусть Л есть отображение из этой системы, которое не является просто умножением в под- пространстве 9ft'. После преобразования составляющей Л' матрицы Л к главным осям подпространство 9ft' разло- жится на собственные пространства 9^^+9fta+ • - • отобра- жения Л' в 9ft', и таких пространств не меньше двух. Для любой эрмитовой матрицы X из 2 мы имеем соот- ношение Л'Х' = Х'Л', из которого, как мы видели выше, следует, что X' преобразует каждое подпространство 9fti, 9ft 2» . • • в себя. Таким образом, разложение 9ft' + 9ft"+ ... можно далее привести к разложению (9ft { + 9fta+...) + 9ft"+ +.... Поступая таким образом, мы окончательно достигнем нашей цели после, самое большое, и шагов, доказав тем самым, что: Эрмитовы формы любой системы 2 можно одновременно привести к главным осям, если они все коммутируют, друг с другом,,
46 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ Теория, развитая выше для эрмитовых отображений* остается справедливой для унитарных преобразований. Если S—унитарный оператор, то можно таким образом ввести нормальную систему координат что S будет переводить каждый из базисных векторов в кратный вектор oze(. Собственные числа о; преобразования S явля- ются комплексными числами с модулем 1. В этих коор- динатах матрица S является диагональной матрицей, у которой на главной диагонали располагаются числа oz. Доказательство совершенно аналогично. Мы снова нач- нем с векового уравнения det (ol —S) = 0 и рассмотрим его корень Существует вектор ех с мо- дулем 1, который под действием отображения S преобра- зуется в о^. Дополним еще п—1 векторами е2, .еп так, чтобы эти векторы образовывали нормальную систему координат. В этих координатах матрица || sik |] отображе- ния S: = 2 Skftk k такова, что $1! = ^, s2l = s31 = ... = snl = 0. Так как S унитарна, то сумма квадратов модулей этих элементов первого столбца должна быть единицей; следо- вательно, |aj=l. Аналогично сумма квадратов модулей элементов первой строки также должна быть 1: 1^|2 + |*12|2+ • • • +1 sln|2= 1; ' но так как | о\ |2 = 1, получаем si2 — • • • — sln = 0. Матрица S, как и в (5.3), распалась на одномерную ох и (п—1)-мерную S; справедливость сформулированной выше теоремы получается теперь непосредственно по ин- дукции. Дальнейшие результаты можно получить точно таким же путем, как выше для эрмитовых форм. Собственные числа oz и их кратности, но не их порядок, однозначно определяются отображением S, то же относится к соответ- ствующим подпространствам. Если мы хотим найти ли- нейно независимую систему собственных векторов, то
§6. ИНФИНИТЕЗИМАЛЬНЫЕ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 47 базисные векторы каждого такого подпространства можно взять в качестве составляющих нормальной системы коор- динат. Окончательно конечное или бесконечное множество унитарных преобразований можно одновременно привести к нормальной форме в том и только том случае, когда они друг с другом коммутируют. § 6. Инфинитезимальные унитарные преобразования Твердое тело в непрерывном движении около фикси- рованной точки О совершает инфинитезимальное вращение за каждый интервал времени dr. Если обозначить через (dxlt dx2, dx3) инфинитезимальное смещение такой точки твердого тела, которая в момент времени т находится в точке Р (*ь х2, хз)> то уравнения движения этого тела должны иметь форму (61) » в которой коэффициенты ctk—константы, т. е. не зависят от конкретно рассматриваемой точки Р. Выберем декарто- ву систему координат с началом в точке О; тогда при движении сумма xf + х2 4-хз должна оставаться неизменной; это приводит к соотношениям £xi-^F=°- или Цадхл = °- i ik Поскольку эти равенства должны выполняться тождест- венно по хг, матрица C = jcZfe||, характеризующая движе- ние, должна быть антисимметричной: ск( =—ctk. После введения вектора j с началом в точке О и концом в точке Р и вектора с = (с23, с31, с12), уравнения (6.1) принимают вид — известной фундаментальной формулы кинематики твер- дого тела. Квадратные скобки обозначают векторное про- изведение, а с—векторную угловую скорость, абсолютное значение и направление которой задают угловую скорость и направление оси вращения соответственно. Другой пример инфинитезимального линейного преоб- разования дает процесс непрерывного начисления сложных
48 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ процентов. Пусть норма процента с — вещественное число, тогда увеличение капитала х за время dx составит xcdx. Радиоактивный распад является процессом того же сорта с отрицательным множителем с. Капитал х, рассматри- ваемый как функция времени, удовлетворяет уравнению /7 у = ™ (6.2) и, следовательно, растет экспоненциально по т. Если основной капитал имел значение х0 в момент т=0, то за время т он возрастет до х(т) = х0-гсТ. Чтобы получить альтернативное решение, разделим, как в методе конечных разностей, интервал времени т на и равных элементов т/n; х будет возрастать на хсх/п на каждом таком интервале, и капитал х приумножится соот- ветственно в (1+гг/п)п раз по истечении времени т. Изве- стное определение экспоненциальной функции eCT=lim (1 + — Y (6.3) следует из сравнения этих двух результатов. Однако мы можем также решить такое дифференциальное уравнение методом последовательных приближений. Возьмем в каче- стве нулевого приближения начальное значение х0, т. е. х0(т)==х0. Тогда (п+1)-е приближение получается из п-го после подстановки последнего вместо х в правую часть (6.2) и интегрирования: т *n+i(T) = *o + c и о Осуществляя последовательно этот процесс, находим откуда получаем известное разложение в степенной ряд еет=1 + ^- + -(^-+... (6.4) для экспоненциальной функции. Сходимость (6.3) и (6.4) и равенство этих пределов строго доказываются в элемен- тарном анализе.
§6. ИНФИНИТЕЗИМАЛЬНЫЕ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 49 Эти примеры помогут нам в понимании идеи инфи- нитезимального унитарного преобразования и-мер- ного пространства £R = 9tn, к введению которого мы теперь переходим. Чтобы избежать введения бесконечно малых, мы введем (чисто фиктивно) время т и представим себе, что инфинитезимальное линейное преобразование, которое переводит вектор у в y + d}’, происходит в интервал вре- мени с/т: dr = = X ClkX,t' k (Ради краткости мы называем это просто «инфинитези- мальное преобразование С».) Так как исходное преобра- зование унитарно, то после выбора нормальной системы координат сумма 2х РЧ Должна оставаться неизменной: с i k После подстановки dxi йхь ~ “ dx —^C(kX'{’ ~dx~^CkiX‘ k i левая часть (6.5) приводится к эрмитовой форме i, k и, поскольку она должна обращаться в нуль тождествен- но по xh мы имеем £^ + ^ = 0, т. е. преобразование С должно быть антисимметричным в смысле равенств = —С = — С. (6.6) В вещественной области не существует сколько-нибудь тесной связи между симметричными и антисимметричными матрицами, но в комплексной области ситуация иная. Действительно, после замены С = iH (i — — 1 —мнимая единица) из (6.6) следует, что //удовлетворяет уравнению H=zH и, следовательно, С является произведением i на эрмитову матрицу. При инфинитезимальном унитарном вращении векторного поля скорость связана с у отоб-
50 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ ражением, матрица которого равна произведению i на эрмитову матрицу. Теорема о преобразовании эрмитовых форм к главным осям является, таким образом, предель- ным случаем аналогичной теоремы для унитарных пре- образований. Многократно применяя инфинитезимальное унитарное преобразование dy = dx»C^, (6.7) мы по прошествии времени х получим = (6.8) где экспоненциальную функцию еА матрицы А можно оп- ределить либо как предел либо как степенной ряд Естественно, что С/(т + т') = Щт)С7(т'). Следовательно, U (х) пробегает все преобразования одно- параметрической непрерывной группы унитарных преоб- разований, порождаемых инфинитезимальным преобразо- ванием С; параметр х аддитивен в композиции. Степенной ряд получается методом последовательных приближений; этот метод можно также применить для получения реше- ния в более общем случае, когда инфинитезимальное уни- тарное преобразование С не является одинаковым в каж- дом временном элементе dx, т. е. когда С является мат- рицей С (х), зависящей от времени. Решение уравнения для такого случая описывается формулой ?(т2)-£/(т2, уйитарное преобразование U (т2, xj, которое соответствует интервалу времени от хх до т2, подчиняется закону ком- позиции U (х3, Xj)= U (т,, х2) U (х2, tJ.
§6. ИНФИНИТЕЗИМАЛЬНЫЕ УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 51 Если j = в момент времени т = 0, то формула для по- следовательного приближения jz(t) имеет вид ?о(т)= iz+i (т)= So 4 $ с (0 Jz (0 .0 положив U (т) = U (т, 0), мы получаем бесконечный ряд 00 2^Л(т), в котором / = 0 t/.0(x) = l; t/z+1(T)=$C(OZ/z(Odt (-6.9) о Расписывая в явном виде, имеем t/z(r)= $$...$ ..Ctt^dt'dt,. ..dtt. О < /i C- t% +> т» Доказательство сходимости этого процесса легко по- лучается с помощью величины | А |, связанной с матрицей А = || aik || равенством |Лр=к(ЛЛ)=2|а/Ар. ik Из хорошо известного неравенства Шварца^) |аД + аД + ...+аЛ12< С(И1 12 + К12 + • • • +1«„ |2)(1 М2 + 1М2 + ...+1М2) (6.10) следует, что |Л + В|^| А 1 + 1 В| и что |ЛВ|<|Л||В|. Второе неравенство получается применением (6.10) к эле- менту cik = 2 air^rk г матрицы С=ЛВ: к» 12<2к.>12-2|^|2 г г
52 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ и суммированием по индексам i и k. Аналог первого не- равенства может быть записан для интегралов в виде $ А (/) dt О О Сходимость ряда 2 U i (т) можно теперь установить с по- i мощью этих вспомогательных результатов, поскольку мы можем, предполагая, что |С(/)|<с (0</<т), доказать, что Действительно, это неравенство очевидно выполняется для / = 0, а рекуррентная формула (6.9) позволяет нам заключить, что оно выполняется для t/z+1, если оно справедливо для Ut. Сходимость вытекает из этой абсо- лютной сходимости, так как абсолютная величина каж- дой компоненты, конечно, не больше, чем [ А |. Мы рассмотрели эти вопросы только затем, чтобы убедить читателя в законности операций с рассмотрен- ными инфинитезимальными величинами. Для дальней- шего изложения важна только простая связь, существую- щая между инфинитезимальными унитарными преобразо- ваниями и эрмитовыми формами. § 7. Замечания о оо-мерном пространстве Унитарные пространства, возникающие в квантовой механике, имеют обычно бесконечное число измерений. Такое пространство состоит из всех векторов J = (*1> -^2» • ♦ • )> чьи компоненты X/ образуют бесконечную последователь- ность чисел, для которой ряд j2 = x1x1H -x2x2+ ... сходится. В этой области возможны операции сложения и умножения на число, а также построение скалярного произведения двух векторов. Выполняются все принятые до сих пор аксиомы, за исключением аксиомы размерно- сти (-у), введенной в § 1,
§7. ЗАМЕЧАНИЯ О оо-МЕРНОМ ПРОСТРАНСТВЕ 53 Поскольку векторные координаты х19 х2, ... образуют счетное множество, то это «гильбертово пространство» (10) имеет бесконечное счетное число измерений. Вдобавок к это- му существуют пространства с несчетным числом измерений. Рассмотрим, к примеру, все непрерывные комплексные функции ф (s) вещественной переменной s с периодом 2л. При этом нам не нужно различать значения s, конгруэнт- ные mod 2л, т. е. разность которых является целым кратным 2л; следовательно, удобнее рассматривать ф(з) как функцию, определенную на окружности единичного радиуса, а не на прямой линии. Различные значения s в точках окружности играют роль индексов, значение ф($) в точке s будет компонентой «вектора ф» с индек- сом s. Все множество таких функций ф(з) образует по- этому линейное «функциональное пространство» контину- альной размерности. Сложение этих векторов и умноже- ние на число интерпретируются здесь как обычные операции с функциями. В качестве квадрата абсолютной величины вектора ф введем 2л (ф, Ф)=5 ф($)ф($)б/$, 0 а скалярное произведение двух векторов (риф опреде- лим равенством 2л (ф. 4>) = 5 9(s)^(s)ds. о Множество функций cpi(s), ф2($), • ••, ф„ (s) образует ортонормированную систему векторов, если 2Л S T<(s)<Pft(s)ds = 6tA. о На эти векторы натягивается n-мерное подпространство из oo-мерного функционального пространства, т. е. подпространство, состоящее из всех векторов вида Ф (s) = (s) + х2ф2 (s) + • • • + х„Ч>„ (s)- Здесь *1, х2.....хп суть компоненты вектора ф(з) из в системе координат фп ф2, ..ф„. Кроме того, 2л (ф, ф) = $ Ф(s) Ф (S) ds = XjXi + х3х2 + • • • + Хпхп. о
54 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ Произвольный вектор ф можно разложить на компоненту Ф из и компоненту ф', перпендикулярную к ф = = Ф + Ф', ф (s) = 2 xi<?i (s), $ ф/ (s) ф' (s) ds = 0. i= 1 0 Из этих равенств следует, что [ср. (4.3)] 2Л х(= J Tt-(s) ф (s) cZs. о Эти интегралы называются коэффициентами Фурье функ- ции ф (s) относительно ортогональной системы фг Орто- гональная проекция ф на не может быть длиннее, т. е. иметь большее абсолютное значение, чем сам вектор ф; это — содержание так называемого неравенства Бесселя 2л х1х1 + х2х2 + ... 5 ij’(s)Ap(s)ds. (7.1) о Действительно, так как (ф, ф') = 0 и (ф', ф) = 0, то вы- полняется «теорема Пифагора»: (Ф. ф) = (<р, <р) + (Ф', ф'). Простейшая ортонормированная система в области пе- риодических функций, с которой имеет дело теория ря- дов Фурье, состоит из функций - 1 e(ns) [п = 0, ±1, ±2, ...; е(х) = е1х]. (7.2) У 2тс Эта бесконечная система обладает свойством полно- ты, она является полной системой координат для всего пространства функций. Теорема о том, что любую перио- дическую функцию можно выразить в виде линейной ком- бинации функций (7.2): 1 + 00 1 2л x„ = y^-f^(«s)4l’(s)ds «=-» о (разложение Фурье функции ф (s)), справедлива лишь при определенных условиях относительно дифференцируемости ф(«); однако любая непрерывная функция удовлетворяет
$ 7. ЗАМЕЧАНИЯ о оо-МЕРНОМ ПРОСТРАНСТВЕ 55 равенству Парсеваля 2 Л да $ ip(s)x|>(s)ds= 2 хпх„. (7.3) О /2= -СО Из этого примера мы видим, что нет никакой существен- ной разницы между пространствами со счетным и не- счетным числом измерений; мы ввели в наше простран- ство функций полную нормальную систему координат (7.2), состоящую из счетного бесконечного множества базисных векторов. В n-мерном унитарном пространстве система из ортонормированных векторов является полной, если их число равно п, и не является полной, если их меньше; однако такой пересчет не дает никакого критерия для оо-мерного пространства. Если мы удалим конечное число функций из системы (7.2), у нас все еще останется бес- конечное множество, но разрушится полнота этой си- стемы. Реальный критерий полноты заключается в спра- ведливости соотношения полноты (7.3). Мы можем понимать соотношения в гильбертовом пространстве либо по аналогии, либо как предельный случай для соотношений в пространствах конечного числа измерений. Если мы рассматриваем значения произволь- ной периодической функции ф (s) только в точках s = 0- — , 1.—, ...,(n—1).— п ’ п ’ ’ ' 7 п и полагаем то мы имеем дело с n-мерным векторным пространством, в котором компонентами произвольного вектора £ яв- ляются величины (v = 0, 1, ..п — 1). Пусть е*—век- тор в этом пространстве с компонентами эти векторы е% (Х==0, 1, ..п — 1) составляют нормаль- ную систему координат в этом пространстве, и в ней вектор I имеет компоненты х0, xlt ..., хп_1У которые должны вычисляться из соотношений
56 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ В соответствии с (4.3) 1 «Д,1 /— 2лЬ\ fc v=0 и, следовательно, п - 1 _ н “ 1 _ 2 ^v?v= 2 v=0 Л=0 Переходя к пределу при п —> оо, получим равенство Парсеваля. Здесь мы не интересуемся дальнейшим рас- смотрением, которое, быть может, необходимо для уста- новления точного доказательства, а довольствуемся рас- суждениями по аналогии. Мы рассмотрим линейное отображение или «оператор» D=-j--j^-, который преобразует функцию ф($) из множе- ства периодических функций в у . Функция е (ns) яв- ляется собственным вектором (функцией) этого опера- тора, соответствующим собственному числу п: 1 de (ns) t к -—~=*n-e(ns). i ds v } Этот оператор эрмитов; скалярное произведение ср на Dip равно комплексному сопряженному скалярному произве- дению ф на Dtp, где <р и ф—две любые периодические функции, ибо, интегрируя по частям, имеем 2л 2л _ о о а правая часть этого равенства является комплексно сопряженной интегралу 2л С т 1 й < \ ^'-r—T-as. J Y i ds о Действительно, эрмитова форма 2л 1 С т л — \ ф-~-Л5 I J ч ds О
§7. ЗАМЕЧАНИЯ О оо-МЕРНОМ ПРОСТРАНСТВЕ 57 принимает нормальный вид + 00 _ 2 пхпхп (1А) п— - 00 в нормальной системе координат, базисными векторами которой являются собственные векторы оператора D. d1 2 Проитерированный оператор DD = —возникает в тео- рии колебаний струны вместе с соответствующей эрми- товой формой 2л 2л _ о о которая представляет собой кинетическую энергию струны. Мы здесь имели дело с дискретным спектром собст- венных чисел. Однако в oo-мерном пространстве можно также строить эрмитовы формы с непрерывным спектром. Рассмотрим, к примеру, пространство всех непрерывных функций ф($), определенных на интервале — квадрат абсолютной величины «вектора» ф есть тогда + л (ф, Ф)= ф(£)ф($)б(8. -л Эрмитова форма + л А [ф] = J зф (з) ф (s) ds ’ (7.5) -Л записана уже в нормальном виде, который показывает, что она в качестве собственных чисел имеет все числа между —л и +л. Функции (7.2) снова образуют полную нормальную систему координат, в которой 1 +” 't’(s)~VS7 £ v(rts)- п= - 00 Подставляя это в (7.5), мы находим + л А [ф] = У, атпхтх„, атп - J se (—ms) е (ns) ds. -Л
58 гл. I. УНИТАРНАЯ ГЕОМЕТРИЯ Вычисление интеграла + л se[(n—tri)s]ds -л дает 0, когда n = и (интегрированием по частям) Г е[(п-т)з]1+л (—1)”-™ I .i(n — т) J-л ’ когда п^т. Поэтому эрмитова форма 1V г i п-т т п пФт имеет в качестве собственных чисел все значения между —л и +л. Собственный вектор фа, относящийся к соб- ственному значению а(—л^а^+л) формы А[ф], яв- ляется такой функцией, которая равна нулю во всех точках s=/=a, а в точке а настолько велика, что интег- рал от фафа равен 1. Конечно, такой функции в дейст- вительности не существует, но мы можем приблизиться к ней сколь угодно близко. Чтобы дать математически строгую формулировку для случая непрерывного спектра, мы должны ввести в (5.4) вместо идемпотентной эрмито- вой формы Еа идемпотентную форму ДЕ = 2 а<Л<|3 для всего интервала Д = Д£ (а^Х^Р). Для произволь- ного заданного вектора j справедливы соотношения Д£(?)>0, Л££(?) + А£Е(Е)~А?Е(Е), (7.6) а идемпотентные формы ДЕ, соответствующие двум непе- ресекающимся интервалам Д, взаимно независимы. В случае континуума сумма в выражении (5.4) заме- няется интегралом Стилтьеса. Представим себе, что пря- мая линия, описываемая вещественной переменной X, по- крыта неким веществом, и пусть количество этого вещества на интервале Д обозначается через Дт. Тогда мы, в пол- ной аналогии с (7.6), имеем Дт > О, ДР т + Д^т = Д£т. Если <p(s) — непрерывная функция, то мы можем по- строить интеграл 1 (7.7) О
§7. ЗАМЕЧАНИЯ О оо-МЕРНОМ ПРОСТРАНСТВЕ 59 Аппроксимацию этого интеграла можно найти, разбив весь интервал на мелкие интервалы Az, выбрав точку в Af- и вычислив сумму 2(Р(^'),М- Эта сумма i приближается к нашему интегралу, в допущении, что Af стремятся к нулю. Если распределение имеет непре- рывную плотность 1 то этот интеграл тождествен интегралу J ф (X) р (X) dX. Но о интеграл Стилтьеса (7.7) включает, кроме того, случай, когда не существует конечной непрерывной плотности; в частности, он допускает существование дискретных то- чек, в которых концентрируются конечные количества вещества. Если вещество распределяется в конечном числе точек X = at- в количествах mh интеграл Стилтьеса сво- дится к сумме 2 Ф (ai) mi- i Таким образом, мы приходим к следующей более со- держательной формулировке теоремы о преобразовании к главным осям: (1) Эрмитова форма А связывает' с каж- дым интервалом к идемпотентную форму АЕ (у); (2) если два примыкающих интервала Ап Д2 складываются вместе и образуют интервал А, то \Е = АгЕ А2Е, и идемпотентные формы, соответствующие непересекаю- щимся интервалам, независимы', (3) можно написать (11) + оо +оо $ dxE(y), А(у)^ 5 l-dKE^. В этой форме теорема пригодна и для непрерывного спектра собственных чисел и является особенно удобной для целей квантовой механики (см. гл. II, § 7). Дискрет- ные собственные числа находятся в точках, где монотон- но возрастающая по X функция A^WE (r) = Е (X; у) имеет разрывы. В нашем примере (7.5) А§Е [ф] = ф($) гр (s) ds; a
60 ГЛ. 1. УНИТАРНАЯ ГЁОМЁТЁИЯ здесь предполагается, что ф должна равняться нулю вне интервала (—л, 4-я). Вычисление без труда проводится на языке координат хп. Рассмотрим пространство всех функций ф($) перемен- ной s, принимающей все значения от —оо до 4-°°> ко- торые имеют конечную абсолютную величину 4- со (ф, ф) = J ф (s) ф (s) ds, — 00 т. е. которые имеют «интегрируемый квадрат». Собствен- ными функциями, связанными с линейным соответствием ф(з)—, снова являются функции e(ys), но частота v может теперь принимать все вещественные значения. Ком- понентами функции являются величины + 00 Hv)=y=- S vs)ds. — 00 Тогда теорема об интеграле Фурье позволяет нам сделать вывод о справедливости разложения + 00 S e(vs)t(y)dv — СО при известных допущениях относительно дифференцируе- мости функции ф (s); но в любом случае выполняется соотношение полноты [1] Ч-оо + оо 5 ф(8)ф(в)& = — 00 — 00 Мы приходим к несколько иной задаче, когда требуем только, чтобы функции ф (s) были такими, что ф(з)ф(з) обладает определенным средним значением + а lim i ? ф (s) ф (s) </s = (ф, Ф); 4- оо J -а это приводит к теории почти периодических функций, раз- витой Г. Бором [2]. Здесь вновь можно установить спра- ведливость соотношения полноты.
§ 7. ЗАМЕЧАНИЯ О «-МЕРНОМ ПРОСТРАНСТВЕ 61 Теория собственных чисел эрмитовых форм бесконеч- ного числа переменных была развита Г ильбертом и Хел- лингером [3], но она применима только к ограниченным формам i, k т. е. формам, значения которых имеют фиксированную верхнюю границу при условии = (7.8) i В самом деле, без этого допущения мы не можем гаран- тировать сходимость Д($) во всей области (7.8); в качестве примера рассмотрим форму (7.4), То, что эта форма сходится лишь в части области (7.8), является просто другим выражением того факта, что не каждая непрерыв- ная функция дифференцируема. Ситуация более благо- приятна для унитарных форм, так как они удовлетворяют условию быть «ограниченными» вследствие их удачного определения; унитарное преобразование, таким образом, должно выбираться так, чтобы удовлетворить обоим условиям W=l, UU=1. Теорема о главных осях была доказана строго для огра- ниченных эрмитовых и для унитарных отображений в oo-мерном пространстве. Метод, предложенный А. Уиниг- нером [4], оказывается особенно удобным для исследова- ния унитарных отображений; он основан на рассмотрении дискретной группы всех степеней Un заданного унитар- ного преобразования 6/, а монотонно возрастающую функ- цию £(Х; j) вещественного переменного X (0^Х^2л) определяет равенствами 2л e^dKE{\- j) (7.9) О (проблема тригонометрических моментов). И. фон Нейман [5] продвинулся дальше всех в изучении линейных опе- раторов, для которых не постулируется ограниченность. Согласно § 6, с эрмитовой формой А связывается группа унитарных преобразований е*тЛ = Щт), зависящих от
62 ГЛ. I. УНИТАРНАЯ ГЕОМЕТРИЯ вещественного параметра т и удовлетворяющих равенству С/(т + т')==С/(т)С/(т'); (7.10) изучение этой группы эквивалентно изучению формы А. Поэтому может оказаться удобным исследовать вместо формы А эту группу, поскольку для унитарных преобра- зований не возникает никаких трудностей со сходимостью. Мы должны, следовательно, попытаться привести опера- торы С/(т), которые суть непрерывные функции вещест- венного параметра т, удовлетворяющие (7.10), одновременно к виду 2л Щг- S) = $ e^dKEfr ?). (7.11) о Это осуществляется при помощи метода Уинтнера заменой дискретного параметра п в (7.9) непрерывным парамет- ром т. Задача (7.11) так же относится к (7.9), как интеграл Фурье к рядам Фурье. Устанавливая систему аксиом для oo-мерного вектор- ного пространства, можно сохранить аксиомы (а), (Р) из § 1 и метрическую аксиому (6) из § 4; относительно под- ходящей замены аксиомы размерности (у) см., например, И. фон Нейман «Математические основы квантовой меха- ники» [6]. Алгебраические и геометрические средства, развитые в этой главе, представляются естественной средой для выражения квантовой механики; эти средства занимают ведущее положение в классической физике сплошной среды. Мастерское изложение их математического содержания и применений можно найти в первой части «Методов мате- матической физики» Куранта и Гильберта, 2-е издание.
ГЛАВА II КВАНТОВАЯ ТЕОРИЯ § 1. Физические основы [1] Магическая формула E = hv, (1.1) которая положила начало всей квантовой теории, уста- навливает универсальную взаимосвязь между частотой v колебательного процесса и связанной с этим процессом энергией Е. Квант действия h является одной из универ- сальных постоянных природы: h = 6,626 х 10~27 эрг-с. Эта постоянная впервые появилась у Планка на рубеже столетия в законах излучения черного тела, т. е. излуче- ния, заключенного в полости и находящегося в термоди- намическом равновесии с веществом определенной темпе- ратуры, которое посредством испускания и поглощения вызывает обмен энергией между различными частотами излучения. Так как это равновесие не зависит от кон- кретной природы имеющегося вещества, Планк рассмотрел, в качестве некоторого схематического вещества, систему линейных осцилляторов всевозможных частот. Заряд, со- вершающий колебания с частотой г, взаимодействует с электромагнитным полем посредством испускания и по- глощения излучения той же самой частоты. Планк пред- положил, что обмен энергией происходит порциями, крат- ными кванту энергии 8. Сначала он рассматривал это предположение просто как математическое допущение, намереваясь перейти к пределу 8 = 0. Чтобы получить согласие с законом смещения Вина, установленным из общих термодинамических принципов, надо принять, что
64 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ энергия кванта, связанного с определенной частотой v, пропорциональна v, т. е. в — hv. В этих предположениях Планк получил свою формулу излучения, которая нахо- дится в великолепном согласии с наблюдениями. Согласно этой формуле количество энергии, содержащееся в единич- ном объеме в спектральном интервале v, v 4- dv в условиях термодинамического равновесия при температуре 0, рав- няется и (v) dv = 8nhv3 dv C3(^v/ke_iy > (1-2) где с—скорость света, a k—постоянная Больцмана (3/2&0 = средней энергии атома одноатомного газа при тем- пературе 0). Переходя к пределу h = 0, мы получаем закон излучения Рэлея—Джинса и(у) = 8n;v2 с3 -Ж. Предположение о справедливости этого закона для всего спектра противоречит действительности, поскольку тогда мы приходим к бесконечному значению для полной энер- гии J u(y)dv, и, следовательно, состояние равновесия для любой конечной энергии становится невозможным. Идея квантованного обмена энергией, возникающая в выводах Планка довольно схематично и только в при- менении к статистическим термодинамическим приложе- ниям, была впервые применена всерьез к индивидуальным атомным процессам Эйнштейном. В 1905 году, изучая эксперименты Г. Герца, Гальвахса и Ленарда по фото- электрическому эффекту, он сформулировал идею о кванте света или фотоне как «эвристическую точку зрения отно- сительно порождения и преобразования света» [2], согласно которой не только обмен энергией между веществом и излучением частоты v происходит квантами энергии hv, но и вообще свет частоты v может существовать в эфире только в виде квантов энергии hv. Решающие экспери- менты были впервые произведены Милликеном десятью годами позже. При облучении металлической пластины ультрафиолетовым или рентгеновским излучением частоты v высвобождаются электроны, кинетическая энергия которых (как было известно еще Ленарду) возрастает с увеличе- нием жесткости (т. е. с уменьшением длин волн) падаю- щего излучения. Однако эта энергия излучаемых электро-
§ I. ФИЗИЧЕСКИЕ ОСНОВ Ы 65 нов не зависит от интенсивности излучения. Точное соот- ношение, предсказанное Эйнштейном, имеет вид где —е, т и v—заряд, масса и скорость электрона соот- ветственно. Энергия фотона hv после вычитания из нее работы Р, необходимой, чтобы вырвать электрон с поверх- ности металла, преобразуется в кинетическую энергию электрона. Если разность потенциалов между поверхностью металла и пластиной, помещенной перед ней, равняется V', то электронный ток исчезнет, как только V' превысит критическое значение VQ = hv/e. Милликен нашел, что (получаемый путем экстраполяции) потенциал, при кото- ром исчезает ток, действительно пропорционален частоте v монохроматического света и что коэффициент пропорци- ональности равняется частному от деления величины h, полученной Планком для излучения черного тела, на эле- ментарный квант электрического заряда е. Кроме того, разность средней энергии Р для двух различных метал- лов оказалась равной заряду е, умноженному на их кон- тактную разность потенциалов. Следовательно, значение Р или, по крайней мере, порядок ее величины известен, и мы находим, что для рентгеновских лучей с длиной волн в несколько ангстрем (1 А = 10“8 см) Р пренебрежимо мало по сравнению с hv. Равенство hv = ^ = eV (1.3) описывает не только порождение вторичных катодных лучей под воздействием первичных рентгеновских лучей, но также* и обратный процесс: преобразование на стек- лянной стенке или аноде падающих катодных лучей в им- пульсное излучение, наблюдавшееся впервые Рентгеном. Если электрон, прошедший разность потенциалов —V в рентгеновской трубке, потеряет при столкновении всю cboioJ энергию, то появится фотон частоты у*и энергии hv = eV. Однако электрон может замедлиться; следова- тельно, v—только верхний предел частоты импульсного излучения, которое, таким образом, состоит из непрерыв- ного спектра с четко выделенным пределом при v=eVlh. Старая классическая теория излучения никак не могла объяснить это наиболее характерное свойство импульсного излучения. Предельная частота возрастает пропорцио-
66 гл. II. КВАНТОВАЯ ТЕОРИЯ нально приложенному потенциалу — и это является точной формулировкой столь знакомого каждому оператору рент- геновских установок факта, что «чем выше потенциал, тем жестче лучи». Таким образом, наблюдаемые явления подтверждают гипотезу, что излучение частоты v может поглощаться и испускаться только квантами энергии hv. Эта гипотеза, естественно, приводит к новым следствиям в теории струк- туры вещества. Например, осциллятор Планка не может менять свою энергию непрерывным образом, поскольку он может испускать или поглощать только фиксированные кванты энергии, и, следовательно, прыгает вверх и вниз по энергетической лестнице, ступеньки которой расстав- лены с одинаковыми интервалами hv, v — частота осцил- лятора (постоянная величина, определяемая устройством осциллятора). Применение существенных моментов этой идеи к реальным атомам привело к правилу частот, сфор- мулированному Нильсом Бором (1913): Атом может существовать только в определенных ди- скретных стационарных состояниях («квантовых состоя- ниях»), в которых он не излучает. Излучение будет воз- никать при переходе из одного состояния в другое; энер- гия, теряемая атомом при этом переходе—разность энер- гий атома Ег—Е2 в двух состояниях—преобразуется в фотон энергии hv, частота которого определяется равен- ством hv^Et—E^. (1.4) В этом равенстве Е1У Е2 могут быть любыми дискрет- ными уровнями энергии (Ег > Е2). И обратно, при погло- щении фотона атом переходит с энергетического уровня Е± на более высокий Е2 с передачей атому энергии фотона hv. Согласно классической электродинамике, атом должен непрерывно излучать вследствие колебаний его электро- нов, и частоты испускаемого излучения должны согласо- вываться с частотами простых колебаний, на которые может быть разложено движение системы его электронов. Сам же атом в процессе этого излучения теряет свою энергию, вследствие чего движение его электронов будет видоиз- меняться, а следовательно, будут смещаться и частоты. Эта точка зрения несовместима с одним из наиболее фун- даментальных физических фактов—существованием резких спектральных линий. С другой стороны, предположение Бора, хотя и не предлагает никакой детальной картины
§ 1. ФИЗИЧЕСКИЕ ОСНОВЫ 67 взаимодействия между веществом и эфиром, подобной той, которую дает классическая теория, не только находится в согласии с этим фактом, но и содержит фундаменталь- ный комбинационный принцип Ритца—Ридберга. Если мы упорядочиваем энергетические уровни в возрастающей последовательности Ео < Ег < Е2 < ..., то, в соответствии с (1.4), каждая частота v будет разностью двух «термов» •у^Е^Ьл Следовательно, кроме частот v(i-+k) и v(k-^ I) будет существовать частота = у (i _> k) + v (k —> /), (1.5) полученная из них сложением. Этот комбинационный прин- цип справедлив в спектроскопии всюду без исключений, как в оптической области, так и в области рентгеновских лучей, и, как оказалось, является ценным вспомогатель- ным средством при классификации спектров; он сво- дит сложные спектры линий к более простым спектрам термов. К сожалению, задача становится более трудной из-за того, что не все линии, соответствующие возможным переходам i—+k, встречаются в действительности: не каж- дый терм Vj- обязательно «комбинируется» с заданным тер- мом vk, поскольку условия возбуждения могут быть та- ковы, что некоторые линии будут иметь нулевую интен- сивность. Следовательно, в правилах, определяющих ин- тенсивности спектральных линий, будут содержаться пра- вила отбора допустимых переходов. Комбинационный принцип или правило частот Бора определяют, так сказать, только клавиатуру спектра, а какие тона в. действитель- ности зазвучат—зависит от способа возбуждения. Но вообще, при подходящих условиях возбуждения, например, при воздействии сильных внешних электрических полей, можно выявить линии, которые не наблюдаются при обыч- ных условиях. В «невозбужденном» или обычном состоянии атом на- ходится в стационарном состоянии с самой низкой энер- гией Eq, и следовательно, при поглощении возникают только линии «серии» п—+0, с частотой vn—v0 (n=l, 2, ...). Самая низкая из этих линий 1 —>0 (т. е. с наи- большей длиной волны) или, точнее, самая низкая линия, не запрещенная правилами отбора, называется «резонанс- ной линией».
68 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Простейший атом—это атом водорода; в нем единст- венный электрон с зарядом —е вращается вокруг ядра с противоположным зарядом Термы спектра атомар- ного водорода, как было обнаружено экспериментально, определяются равенством где R = 109700 см-1—постоянная Ридберга (спектроско- писты привыкли вместо частоты v задавать волновое число v/c—величину, обратную длине волны). Этим частотным термам соответствуют энергетические уровни Еп——Rhc/n2. К дискретному спектру термов мы должны добавить не- прерывный спектр Е 3: 0; аддитивная постоянная в энер- гии выбирается так, чтобы условие Е — 0 отделяло гипер- болические орбиты электронов от эллиптических. Серия Бальмера состоит из линий п —* 2 с волновыми числами я(т-у) (» = 3.4. ...). Это—старейшая из известных формул серий; Бальмер получил ее в 1885 году, исходя из первых четырех линий серии, названных На, Нъ Н& и расположенных в ви- димой области. Линии этой серии при возрастании п стре- мятся к пределу с волновым числом R/4 (длина волны 4/R = 3650 А). Величина cRhjk и есть та работа, которая требуется для ионизации атома водорода, находящегося в стационарном состоянии п = 2, т. е. работа, необходимая для удаления электрона из такого атома (без придания этому электрону какой-либо кинетической энергии). Непре- рывный спектр, возникающий при переходах, ионизирую- щих атом, присоединяется к этому пределу серии со сто- роны коротких волн. Кроме того, нам известны серия Лаймана п —> 1, лежащая в ультрафиолетовой части спектра и возникающая также при поглощении, серия Пашена п—+3, которая лежит в инфракрасной области, и наконец, некоторые члены серий Б рекета (п —+ 4) и Пфунда (п —> 5) в дальней инфракрасной области. Для ионизации водо- рода, находящегося в обычном состоянии, необходимо совершить работу cRh\ соответствующий «потенциал иони- зации» (т. е. разность потенциалов, которую должен пройти электрон, прежде чем он сможет ионизировать атом
§ 1. ФИЗИЧЕСКИЕ ОСНОВЫ 69 водорода) есть V =-^5-= 13,53 вольт. Правило частот Бора выходит за рамки комбинационного принципа, полагая, что в действительности термы суть реальные уровни энергии — утверждение, чуждое спект- роскопии и не проверяемое ее средствами. Это утвер- ждение подтверждается опытами Франка и Герца по процессам столкновений [3]. В этих опытах электронам сообщается кинетическая энергия eV при прохождении ими электрического поля с известной разностью потенциа- лов —У, а затем они с полученной скоростью (без даль- нейшего влияния внешних полей) проходят через газ, состоящий из исследуемых атомов. Электрон не может передать атому какой-либо энергии до тех пор, пока вели- чина eV не станет больше энергии возбуждения резонанс- ной линии —£0; если же Ео eV < Е2 Е„ то электрон может претерпеть либо «упругое столкнове- ние», при котором он не теряет никакой энергии, либо «неупругое столкновение», при котором электрон отдает атому энергию Е±—Ео. Электроны, прошедшие через газ, разделяются на два сорта: с кинетической энергией eV и с энергией eV—(Е± — £0). Когда атомы, перешедшие при столкновении с электронами из состояния 0 в состояние 1, возвращаются в исходное состояние, они испускают ре- зонансную линию и, при упомянутых выше условиях, только эту линию. Это полностью подтверждается экспе- риментом. Кинетическая энергия электронов измеряется методом наложения тормозящего потенциала V'; электроны могут его преодолеть только тогда, когда их энергия больше eV'. Вообще, после столкновения с атомом газа электроны обладают дискретным «спектром энергий»; воз- можные значения энергии при этом равны eV^eV-(En-E0) (n = 0, 1, 2, ... до тех пор, пока V'n положительно; здесь мы не учитываем того, что электрон может претерпевать более одного неупругого столкновения). При постепенном уменьшении тормозящего потенциала V' от значения, боль- шего V, ток электронов будет скачком уменьшаться вся- кий раз, когда V' будет проходить через одно из значе- ний Vq, V{, ...
70 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Правило частот Бора сводит определение спектров к задаче определения стационарных состояний и соответ- ствующих энергетических уровней атома, т. е. механиче- ской системы с известным динамическим устройством. Пример линейного осциллятора, данный выше, и фунда- ментальные понятия теории колебаний приводят к следую- щему общему ведущему принципу (Р): частоты, опре- деляемые энергетическими уровнями по правилу частот Бора, должны соответствовать частотам простых колебаний, на которые может быть разложено реальное движение частей атома в соответствии с законами динамики. В клас- сической механике такое разложение на простые колебания строго достижимо не всегда, а только тогда, когда система является «кратно» или «условно периодической». В этих, случаях оказалось возможным довести общий принцип (Р) до некоторого' правила квантования. В 1913—25 годах применение этого квантового правила дало большой уро- жай результатов, и казалось, что мы обладаем ключом, который открывает тайны атомных процессов. Но замки оказались не вполне подходящими; к концу этого периода проявилась недостаточность правила, и физическая теория постепенно свелась к некоторому символическому исчис- лению квантовых чисел, которое надо было корректировать всякий раз, как только обнаруживался какой-либо новый факт. Сейчас мы не удивляемся тому, что теория прошла такой путь, скорее надо удивляться тому, что она была столь успешной! С самого начала квантовые правила были компромис- сом. Если механическая система с одной степенью свободы совершает периодическое движение, то частоты v простых колебаний, на которые можно разложить ее движение, кратны основной частоте со. Эта частота зависит от энер- гии рассматриваемой орбиты, а значения энергии кванто- вые правила ограничивают дискретным множеством Еп. Следовательно, частоты простых колебаний описываются формулой v = ^.(o(n), (1.7) т. е зависят от двух целых чисел п и k. По аналогии с квантовомеханическими частотами, частоту (1.7) следует приписать переходу и—>(п—k). Тот факт, что v зависит от k линейно и однородно, выражается «классическим ком- бинационным принципом» v (п —+п—k) v (п —> п—Г) = у(п—+ п—k— I), (1.8)
§ 1. ФИЗИЧЕСКИЕ основы 71 вследствие которого будут комбинироваться частоты с од- ним и тем же начальным состоянием п. Но это не согла- суется с правильным комбинационным принципом v(n——k)-\~v(n—k—^n—k—l) — v(n—»-n—k—t). (1.9) Изменения квантовых чисел k, I здесь такие же, как в (1.8), но конечное состояние п—k первой частоты совпа- дает с начальным состоянием второй; только для кванто- вых чисел п, больших по сравнению с k и I, классичес- кий принцип асимптотически согласуется с комбинацион- ным принципом Ритца — Ридберга. Следовательно, если общий принцип (Р) должен удовлетворяться без всяких компромиссов, наша механика должна быть изменена та- ким образом, чтобы неверный комбинационный принцип (1.8) заменялся на правильный (1.9). В 1925 году Гейзен- берг открыл способ, как произвести такое изменение есте- ственным образом; однако для этого надо было отказаться от картины атома с его электронными орбитами. Теория Гей- зенберга оперирует только с частотами и интенсивностя- ми излучения, связанного с переходами между различными состояниями атома. Следует заметить, что правильный принцип (1.9) в од- ном важном отношении проще неправильного (1.8). Как показывает формула v (п* —> п') + v (п'—> п) = v (п"—t-n), (1-Ю) квантовые числа служат только в качестве меток или индексов, которые не требуют введения закона компози- ции, тогда как классическая формула требует существо- вания закона сложения квантовых чисел, которые, следо- вательно, становятся числами на некоторой определенной шкале. Другой подход к квантовой механике был найден Л. де Бройлем и Э. Шредингером [4]. Этот подход кажет- ся мне менее убедительным, но он быстрее приводит к фундаментальным принципам квантовой механики и к наи- более важным следствиям для эксперимента. Мы пойдем этим последним путем, поскольку мы заинтересованы в коротком, но всестороннем обзоре, а не в тщательном обсуждении физических основ. Физическая, существенно статистическая интерпретация теории, с которой не всегда был полностью согласен Шредингер, принадлежит в ос- новном М. Борну.
72 гл. II. КВАНТОВАЯ ТЕОРИЯ § 2. Волны де Бройля для частиц Заключение о волновом характере света мы обычно делаем, исходя из явлений дифракции и интерференции. Существенно, что в этих явлениях мы сталкиваемся с ли- нейной суперпозицией волн при произвольных разностях фаз. С математической точки зрения эти явления харак- теризуются тем, что они связаны с операциями сложения и умножения на комплексные числа, и, следовательно, мы имеем дело с векторами в комплексном пространстве. Действительно, мы можем рассматривать комплексную функцию ф(/; х, у, г), используемую при описании явле- ний и определенную во времени и пространстве, в каче- стве такого вектора, где каждая точка пространства- времени представляет одно измерение этого комплексного векторного пространства; дифференциальные законы для такой волновой функции ф или нескольких таких функ- ций одновременно, например, компонент напряженностей электрического и магнитного полей, линейны и однород- ны. Но, с другой стороны, приведенные нами выше кван- товые явления прямо говорят в пользу корпускулярной природы света. Интенсивность монохроматического излу- чения, использованного в исследованиях фотоэлектричес- кого эффекта, нисколько не влияет на скорость, с которой электроны покидают металл; она влияет только на частоту этого явления. Фотоэффект проявляется даже при столь малых интенсивностях, что в соответствии с классической теорией потребовались бы часы, прежде чем электромаг- нитная энергия, подводимая к данному атому, достигла бы величины энергии фотона. Точки, в которых наблю- дается этот эффект, распределены по всей пластине метал- ла нерегулярным образом. Это является не менее прямым доказательством существования фотонов, чем доказатель- ство корпускулярной природы а-частиц при наблюдении сцинтилляций, вызываемых ими при ударе о чувствитель- ный экран. Далее, если при выводе законов излучения черного тела рассмотреть, кроме обмена энергией, также и обмен импульсом, то конфликт с гипотезой Планка относительно квантов энергии может быть устранен только предположением, что кроме испускания кванта энергии hv испускается и квант импульса hv/c, и притом в опреде- ленном направлении, что приводит к эквивалентной реак- ции на атом [5]. Таким образом, мы заменяем непрерыв- ное излучение сферической волны прерывистым испусканием
§ 2. ВОЛНЫ ДЕ БРОЙЛЯ ДЛЯ ЧАСТИЦ 73 фотонов в определенных направлениях, нерегулярно рас- пределенных по кругу. Мы объединяем обе точки зрения, сохраняя линейное волновое уравнение, но рассматривая интенсивность фф в качестве относительной вероятности того, что фотон оказывается в точке (х, у, г) в момент времени или, более строго, что tyfydxdydz (2.1) является вероятностью того, что в момент времени t фотон будет находиться внутри малого параллелепипеда со сто- ронами длиной dx, dy, dz около точки (х, у, г) *). Но мы можем только надеяться, что придем к рациональной тео- рии, если обращаемся с материальными частицами как с фотонами. Эта точка зрения была развита в работах Бозе и Эйнштейна, посвященных атомарным газам, которые ис- пользовали методы, аналогичные методам теории излуче- ния черного тела («легкий квантовый газ») [6]. Исследо- вания же Шредингера имели в качестве отправной точки гамильтонову теорию механики, которая сама первона- чально разрабатывалась Гамильтоном по аналогии с гео- метрической оптикой. Шредингер утверждал, что посколь- ку мы заменяем геометрическую оптику, в которой нельзя исследовать интерференцию и дифракцию, на волновую оптику, постольку разумно попытаться сделать аналогич- ный переход в механике. Результаты вполне оправдали эту попытку. Исследования Дэвисона и Джермера, кото- рые доказали существование интерференции в электрон- ных пучках, отражаемых кристаллической решеткой, про- водились в то время, когда де Бройль уже опубликовал свою теорию. Экспериментальное доказательство того, что движущиеся материальные частицы ведут себя в этих явлениях в основном так же, как пучок света, было по- лучено в серии дальнейших исследований тех же авторов, а также Дж. П. Томсоном, Ф. Раппом и др. [7] с не мень- шей степенью определенности, чем для рентгеновских лучей. Реальное различие между «светоподобным» и «элект- ♦) Подобно тому, как в классической волновой теории, кроме плотности энергии, вводится выражение для потока энергии, в более утонченной формулировке квантовой теории мы, в дополнение к вы- ражению для вероятности того, что фотон находится в заданном эле- менте объема («плотность вероятности»), будем использовать выраже- ние для вероятности того, что он проходит через заданный элемент поверхности («ток вероятности»).
74 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ ронноподобным» пучками состоит в том, что частицы по- следнего обладают зарядом и собственной массой, и, сле- довательно, могут отклоняться электрическими и магнит- ными полями. Простым колебанием называется колебание, при кото- ром функция ф, определяющая состояние системы, зави- сит от времени по закону ty(f)=a-e~M, (2.2) где а и v не зависят от времени t. (Мы выбираем такую единицу угловой меры, которая дает для основной триго- нометрической функции е'*==е(х) простое соотношение Сумма углов вокруг точки при этом равняется 2л; воз- можно, с интегральной точки зрения было бы правильнее принять эту сумму за 1, но тогда в дифференциальном соотношении появился бы множитель 2л. Выражение у/2л определяет число колебаний за единицу времени; однако мы не колеблясь будем называть v «частотой». Основная формула (1.1) все еще остается справедливой в новых обо- значениях, если мы подразумеваем под постоянной дейст- вия Планка не h, а Л/2л, что мы и делаем всюду в этой книге.) В соответствии с (2.3) простые колебания (2.2) описываются собственными функциями линейного эрмитова оператора, переводящего ф в —т- ; соответствующи- ми собственными числами являются энергии Е — hv. Если зависимость состояния системы от времени выражается в виде суперпозиции простых колебаний ф (0 = a1e-iv*z + ate-ivJ (2.4) то энергия может принимать только одно из значений hvlt hva.....и мы примем интенсивность агаг = |а*| колеба- бания частоты vr в выражении для ф за относительную вероятность того, что наблюдаемая энергия равняется hvr. Соответственно следует интерпретировать соотношение Е = hv: если значение v неопределенно (поскольку в колеба- тельном процессе содержится целый спектр частот v), то и энергия неопределенна в этом же смысле', интенсивнос- ти, с которыми отдельные простые колебания участвуют в общем процессе колебаний, дают меру вероятностей со-
§ 2. ВОЛНЫ ДЕ БРОЙЛЯ ДЛЯ ЧАСТИЦ 75 ответствующих энергий. Оператор —hli^d/dt представ- ляет энергию Н~~ Т31 М в следующем смысле: собственная функция оператора (2.5) описывает состояние, в котором энергия с полной досто- верностью принимает определенное значение Е. Это зна- чение является соответствующим собственным числом-, в произвольном состоянии компоненты а из (2.4), соответ- ствующие этим собственным функциям, определяют отно- сительные вероятности аа этих значений Е. Согласно теории относительности, энергию следует рас- сматривать как временную компоненту 4-вектора, прост- ранственные составляющие которого образуют импульс p = (px, р р2). Фундаментальным метрическим инвариан- том двух векторов, идущих из начала координат к точ- кам (t, х, у, z), (/', х', у', г'), является скалярное произ- ведение c2tt'—(хх' + уу' 4~zz'). Под воздействием преобразования Лоренца, которое пере- водит одну систему координат в другую, величины c2t, —х, —у, —г должны преобразовываться контрагредиентно с t\ х, у, z; следовательно, они являются компонентами вектора, свя- занного с (/; х, у, z), в пространстве, двойственном к 4-мерному пространственно-временному миру. Таким двой- ственным вектором и является н, —рх, ~Ру, ~Pz или, что то же самое, выражение Н dt—(pxdx + pudy-\-Pzdz) инвариантно относительно преобразования Лоренца. То же самое справедливо для оператора полной производной л д л \ ( д л . д . . д < \ d = dt + ч- dx 4- 3- du+3- dz] . dt ' \dx ' ду v ' dz J применяемого к произвольной функции от /; х, г/, г. По- этому соотношение (2.5) с необходимостью приводит к со-
76 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ ответствиям h д h д h д /п ~ рх~~' I дх' Ру—* i ду' Р*—*?дг' которые интерпретируются аналогично. Однородная плоская волна ^ — a.ei(-vf+<xx+^y+vz) (2.7) одновременно является собственной функцией четырех взаимно коммутирующих операторов (2.5), (2.6) с собст- венными числами H = hv, px = ha, pv = h$, pz = hy. (2.8) Функция ф описывает состояние, в котором энергия и импульс кванта обладают достоверно определенными зна- чениями. В классической механике законы движения частицы становятся известными, как только мы выразили ее энер- гию Н через «канонические переменные» х, у, г; рх, ру, рг. !В ньютоновой механике функцией Гамильтона для свободной материальной частицы т является 2 2 2 Я=-Х+2^±Р'; (2.9) применив приведенную выше схему перехода, мы полу- чаем соответствующее волновое уравнение (к & л.9* \ дх? + д^+дг« ) • Функция (2.7) является решением этого уравнения, если значения энергии и импульса (2.8) удовлетворяют уравнению (2.9); в этом смысле (2.9) и (2.10) эквивалент- ны. Но уравнение (2.10) линейно и имеет в качестве наи- более общего решения линейную суперпозицию простых волн (2.7); такая суперпозиция соответствует состоянию, в котором энергия и импульс принимают различные до- пустимые значения «с некоторой вероятностью». Пространственный вектор (а, Р, у) в (2.7) определяет направление распространения плоской волны, а модуль этого вектора равен волновому числу р (числу волн, со- держащихся в 2л единицах длины: 2л/р—длина волны Л).
$ 2. ВОЛНЫ ДЕ БРОЙЛЯ ДЛЯ ЧАСТИЦ 77 Отсюда по формулам (2.8) получаем, что абсолютное зна- чение импульса р равно /гр = 2л/г/Х. Величина v/p есть фазовая скорость волны; в соответствии с (2.9) или с формулой она равняется Лр/2/n = hn/Ът и зависит от длины волны или частоты (дисперсия). Но р = ти, где v—скорость частицы, поэтому «групповая скорость» dvldp = hpltn — v совпадает со скоростью частицы. Эксперименты по дифрак- ции и интерференции в электронных пучках сделали воз- можной прямую проверку этих соотношений, установлен- ных де Бройлем. В релятивистской механике мы вместо (2.9) имеем уравнение, утверждающее, что квадрат абсолютного зна- чения 4-вектора энергии-импульса постоянен и равняется т№: ^-(Я + р2у + р1) = "г’<?, (2.11) ИЛИ_____________________________________ н=с //п2с2+(р2 + р2+р2). Для перехода к волновому уравнению удобнее применить рациональную форму выражения (2.11): -^ + Аф = ^-ф. (2-12) Здесь снова групповая скорость равняется скорости час- тицы о, но фазовая скорость равна с2/о; первая из них всегда меньше, а вторая всегда больше скорости света. Чтобы вернуться от релятивистской к «обычной» или нью- тоновой механике в пределе с—+оо, мы должны сначала заменить Н на тс2-\-Н, т. е. ф нужно заменить на Дифференциальное уравнение для световых волн мо- жет быть получено из (2.11) приравниванием нулю члена в правой части. С корпускулярной точки зрения отсюда следует, что свет состоит из фотонов—частиц с собствен- ной массой 0: В соответствии с выражением (2.1) для плотности веро- ятности, мы должны рассматривать в качестве вектора в уни-
78 ГЛ, II. КВАНТОВАЯ ТЕОРИЯ тарном пространстве, описывающего состояния системы, именно ф как функцию от пространственных координат х, у, г. Интеграл от выражения (2.1) по пространственным ко- ординатам дает вероятность того, что частицы будут нахо- диться «в объеме V в момент времени /». Пространство и время должны быть отделены друг от друга; система имеет в каждый момент времени t определенное состоя- ние ф(х, у, г), которое, вообще говоря, будет изменяться со временем t. Следовательно, операторами, представляю- щими физические величины, должны быть такие операто- ры, которые действуют на произвольные функции прост- ранственных координат. Это требование удовлетворяется для операторов (2.6), соответствующих координатам им- пульса, но не для оператора дифференцирования по вре- мени, который мы связываем с энергией. В последнем случае мы поступаем следующим образом: выражая энергию через канонические переменные рх, ру, р2, мы получаем оператор Н, представляющий энергию и действующий на функции ф (х, у, z). Тогда уравнение является динамическим законом, определяющим изменение состояния ф во времени. Разделение пространства и времени приводит к опре- деленным трудностям при развитии квантовой теории с релятивистской точки зрения; исходя из этого, в данный момент мы ограничиваем наше исследование ньютоновской механикой. Наша процедура в дальнейшем должна быть изменена и в другом важном отношении: до этого мы молчаливо предполагали (для простоты математического изложения, но без физического подтверждения), что волновое поле материальной частицы описывается скалярной величиной ф. Изменение, необходимое для адекватного описания спектро- с опических фактов, будет введено в гл. IV. § 3. Волновое уравнение Шредингера. Гармонический осциллятор Когда частица движется под воздействием каких-либо сил, кинематическая часть энергии (2.9) увеличивается за счет потенциальной энергии, зависящей обычно только от координат и не зависящей от импульсов. Следовательно,
§ 3. ВОЛНОВОЕ УРАВНЕНИЕ ШРЕДИНГЕРА 79 мы должны знать, какой эрмитов оператор, действующий на ф, соответствует координате х. Я утверждаю, что этот оператор есть умножение на х; данный оператор уже при- веден к главным осям, его собственные значения—это все действительные числа х, и наконец, ф(х), или, точнее, ф(х))/^х является компонентой «вектора», отвечающего собственному числу х (здесь мы не рассматриваем другие координаты у, z). В соответствии со статистической интер- претацией связи между физическими величинами и опера- торами, наше утверждение состоит в следующем: вероят- ность того, что х имеет значение между хг и х2, равна ффг/х; это согласуется с выражением (2.1) для плотнос- ти вероятности. Если функция V (х, у, z), например, по- тенциальная энергия, является функцией положения в 3-мерном пространстве, то физическая величина V пред- ставляется оператором ф—> V(x, у, г)-ф, так как вероятность того, что V лежит между Vi и У2, дается интегралом $$$ ФФ^хdydz, взятым по той части пространства, в которой (х, У, z) < У8. Операторы, соответствующие х, у, г, коммутируют друг с другом, но оператор Q, соответствующий х, и оператор Р, соответствующий рх, не коммутируют. В самом деле, A[xi|?(x)]—х^(х) = ч|)(х) ИЛИ PQ-QP = |1, где 1 в правой части является тождественным операто- ром: ip (х)—>ip(x). Ввиду этой неперестановочности опера- торов Р и Q импульс рх не может с достоверностью при- нимать определенное значение, когда координата х при- нимает определенное значение, и обратно. Действительно, если известно, что рх имеет с достоверностью значение ha, то зависимость от х определяется множителем eiax; вследст- вие этого положение частицы х полностью неопределенно,
80 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ так как вероятность локализации, фф, одинакова для всех точек х. Если V (х, у, z)—потенциальная энергия поля, в ко- тором движется частица, то ее полная энергия равняется Н = -х ' 2m--~ + V(x> У> г)- V3-1) Вместе с Шредингером мы принимаем, что, несмотря на некоммутируемость всех переменных, все еще можно при- менять наши правила формирования волнового уравнения; таким образом, мы получаем дифференциальное уравнение Шредингера Мы понимаем под «стационарными» или «квантовыми» состояниями ф те состояния, в которых энергия Е имеет определенное значение; их можно охарактеризовать как решения волнового уравнения, которые, кроме того, удов- летворяют уравнению (см. (2.5)): После подстановки E = hv функция ф будет иметь вид где новая функция, также обозначенная через ф, не зависит от /. Эта функция ф(х, у, г), зависящая от пространственных координат, удовлетворяет приведенному уравнению L2 — Аф + [Е—У(х, у, ?)]ф = 0. Задача, таким образом, сводится к нахождению таких зна- чений Е и функций положения (т. е. функций простран- ственных координат) ф=^0, которые удовлетворяют этому уравнению и для которых интеграл от фф по всему про- странству конечен. Эти значения и функции являются собственными числами и собственными векторами связанно- го с энергией (3.1) эрмитова оператора Я, действующего в функциональном пространстве всех функций положения ф. Собственные числа Е являются возможными энергетичес- кими уровнями частиц. Прежде чем переходить к осмыслению развитой нами теории, хорошо было бы убедиться в том, что она приво-
J 3 ВОЛНОВОЕ УРАВНЕНИЕ ШРЕДИНГЕРА 81 дит к энергетическим уровням, согласующимся с факти- ческими данными. Простейшим примером является линей- ный осциллятор', в этом случае мы имеем дело только с одной координатой х. Потенциальная энергия равняется У(х)=ух2, а общая энергия выражается равенством // = 4(т+ах2)- (3,2) При этом уравнение для определения собственных зна- чений Е и соответствующих собственных функций ф имеет вид ёгтЗ-+(в--Н*Ю=°- <3-3> Полиномы Эрмита. Решения этого уравнения выражаются через поли- номы Эрмита. Полином Эрмита n-го порядка т]л(х) опре- деляется уравнением 2 / = (— 1)"е 2 -4» (*); (3-4) он имеет п-ю степень и старший его член в точности равен хп. Полиномы т}„(х) (n = 0, 1, 2, ...) образуют ортогональную систему функций с «функцией плот- ности» е~*г/2; $ e-x!/2T]„(x)T]m(x)dx=0, m=£n; (3.5) — 00 следовательно, функции <РВ(*) = «"Х‘/4 •»)»(*) ортогональны в обычном смысле. Для доказательства этого нам нужно просто заметить, что + 00 (-1)" j -£-(e-^2)-tlfflWdx — 00 превращается, в результате n-кратного интегрирования по частям, в С е-*«/2. dx — 00
82 гл. II. КВАНТОВАЯ ТЕОРИЯ и подынтегральное выражение равняется нулю при т < п. Для т = п мы получаем n! J e~x‘/2dx, — со так что уравнения (3.5) могут быть дополнены равенством Yn= е~ x2/2rtf (x)dx = n! — 00 Из уравнения (3.4) мы имеем е~ • т]п+1 (х) = - (-1 у ££ (е~ *’/*), и мы можем записать d"+1/dx"+1 либо как (dn/dxn) (d/dx), либо как (d/dx) (dnldxn). Поскольку — ^(e-j;S/2) = x.e-x>/2 И r/n Ял (in~l 2- (хе~ х/2) = х£-(е- *2/2) + п (е~ х2'2), dxn\ > dxn / I dxn 1 v то первый из этих вариантов дает рекуррентную формулу W = (3-6) Из второго мы получаем ~Тх Iе" *’/2 ‘Ч* Wl=е~xt,,i • +i W ИЛИ n„+i(x) = -^ + xi)„(x). (3.7) Подставив рекуррентную формулу (3.7) в (3.6), мы находим простую связь (3-8) Дифференцируя выражение (3.7) и подставляя (п Н1)т]„ вместо производной от т)п+1 (в соответствии с (3.8)), мы получаем дифференциальное уравнение
§ 3. ВОЛНОВОЕ УРАВНЕНИЕ ШРЕДИНГЕРА 83 Следовательно, функции <р„(£) удовлетворяют уравнению ^-^-фп + (п + 4)<Р„ = 0. (3.9) Для того чтобы при переходе к новой единице длины, т. е. при подстановке х = а£, левая часть (3.3) стала равной левой части (3.9), умноженной на h2/2ma2, должны выполняться равенства W 1 __ асе2 h2 ( J \ _ F 2та2'4~ 2 ’ 2та? + 2 J £" Пусть о) = Ка//п обозначает классическую частоту осцил- лятора. Первое из этих условий определяет новую еди- ницу длины а: 2_ h h — 2 fam ~ ’ а второе требует, чтобы £ = £„&Лш(п + 1/2). (3.10) Можно показать, что функции <р„(|) образуют полную ортогональную систему [8], и, следовательно, не может существовать никаких других собственных чисел и функ- ций. Осциллятор обладает дискретными уровнями энер- гии (3.10) с расстоянием /г® между ними. То, что самый нижний уровень энергии оказывается равным 1/аЛсо, а не 0, само по себе не имеет никакого значения, поскольку мы всегда могли бы ввести в энергию аддитивную константу, хотя стоит отметить, что наименьшее возможное значение величины Н из (3.2) равняется 1/2/г<о. Однако волновое уравнение не только позволяет опре- делить уровни энергии через собственные значения, но и дает нам вероятность локализации через собственные функции. Для удобства мы принимаем в качестве еди- ницы длины величину а= j/". Когда осциллятор на- ходится в состоянии, описываемом п-пл энергетическим уровнем, вероятность того, что колеблющаяся частица находится на расстоянии х от своего положения равно- весия, дается выражением е_*г/2-т]п(х). Эти вероятности следует понимать как относительные, они соответствуют равным бесконечно малым интервалам около точек срав- нения х. В частности, для низшего уровня энергии п = 0 плотность вероятности равняется e-x’/2; следовательно,
84 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ мы не можем более говорить о том, что точечная масса в состоянии покоя находится в положении равновесия. Вместо этого можно сказать, что вероятность ее смеще- ния из этого положения дается кривой ошибок Гаусса. Нормированные собственные функции (3.3) определяются формулой tW=7<P,W. Хп Если функция положения ф(х) выражается через этот набор функций ф(х)~ 2 х„ф,(х), п=0 + оо $ Ф(х)ф„(х)ах, — со то оператор Н, отвечающий энергии, как мы уже видели ранее, выражается в координатах ф„ следующим образом: xn-+h&(n + 1l2')'Xu. Чтобы найти оператор, отвечающий координате х, мы должны выразить хф„(х) линейным образом через эти собственные функции; из выражения (3.6) мы имеем Хф„= ф„+1 + «Ф.-i. откуда ^в = ^^п+1+^^г|>в_1=Кл+Т’|>„+1+1/Гл’ Хп Хп Поэтому отображение ф (х) —► хф (х) выражается через коэффициенты Фурье так: х„ PTx„_i + /п+1 х„+1; матрица отображения Ц<7„ет|| содержит только элементы дп,п+1 = /мй’*). (3.11) (При возвращении к исходной единице длины правые части должны быть умножены на а.) Применив оператор d/dx к срп, мы получим, в соответствии с (3.8) и (3.6), d<pn 1 -^ = уЯфп-1-фя+1, *) Остальные элементы матрицы равны нулю. (Приме*, пер.)
§ 4. СФЕРИЧЕСКИЕ ГАРМОНИКИ 85 откуда ^г=ву(Кп't-i-Км W„+1). Линейным эрмитовым отображением, относящимся к импульсу p = yd/dx, является отображение хп 4" х“~1 + ^п+1 в матрице || рпт || отличны от нуля только элементы с т = п ± 1: Ри.„-1 =---Р».«+1 = 4’,/Лп+1- (312) (При возвращении к исходной единице длины эти эле- менты надо умножить на 1/а. Члены с индексом п—1 исчезают при п = 0; они автоматически выпадают из при- веденных выше формул.) § 4. Сферические гармоники Прежде чем обсуждать вопрос об уровнях энергии электрона в сферически-симметричном электростатическом поле, мы должны рассмотреть сферические гармоники и их основные свойства. 1. Определение.— Пусть г обозначает расстояние от начала координат в 3-мерном пространстве с координа- тами х, у, г, и пусть г, 0, <р являются полярными коор- динатами с полярной осью вдоль положительного направ- ления оси г: x-[-iy = r sin 0егф, z = г cos 0. Полагая однородный многочлен и степени I от х, у, z равным rl-Yt, мы замечаем, что Yt зависит только от координат 0, ф и является функцией положения на еди- ничной сфере. Если и—гармоническая функция, т. е. если и удовлетворяет уравнению Ди = 0, то говорят, что Yt является сферической гармоникой порядка I, а сама гармоническая функция и называется шаровой (или объ- емной) гармоникой порядка I. Поскольку в полярных координатах имеет место соотношение А 1 д ( , ди \ . 1 * Дм~ г» дг V аН+тГ Аы’
86 ГЛ. II. КВАНТОВАЯ. ТЕОРИЯ где А 1 | д Л . ади\ . 1 д2и ) /л 1\ sinO^ + —х-гт? , (4.1) sin 0 | дО \ д0 J 1 sin 0 дер? J ’ v ' то сферическая гармоника Yt удовлетворяет дифферен- циальному уравнению ЛУг+/(/+1)Уг=0. (4.2) 2. Ортогональность.—Применив формулу Грина к сфе- рическим гармоникам u = rkYk, v = rlYt для единичной сферы, мы получаем соотношения ортогональности $yftKzdco = O, k=£l, (4.3) в которых do) = sin 0 dQ d<p—элемент поверхности единич- ной сферы. Поскольку комплексно сопряженная ~Yk сфе- рической гармоники также является сферической гармо- никой, первый множитель в (4.3) может быть заменен на Yk. 3. Базис.— Заменой l = x + iy, f\ = x—iy дифференциальное уравнение Ам = 0 обращается в Л . д2и . сРи „ Аи = 4 -4- -з-г = 0; dgdr) 1 dz2 мы видим, что однородный многочлен и порядка / от т], г разбивается на гармонические полиномы ы('я): й = 2«<»’ (т = — I, — 1, I), где и{т) состоит из всех членов, в которых показатели при В и т] имеют фиксированную разность т. Рекуррент- ная формула для коэффициентов полиномов м<Я1), которая получается из дифференциального уравнения Au = 0, пока- зывает далее, что существует одна и (с точностью до постоянного множителя) только одна такая гармоника и1т). Следовательно, существует ровно 21 +1 линейно независимых сферических гармоник порядка /; мы можем принять их за У';т>, определяемые формулой и1т> rl . Записывая полиномы в виде «<«>’ = (х—iy)~m • Р = (х 4- iy)m • Р*
§ 4. СФЕРИЧЕСКИЕ ГАРМОНИКИ 87 и заменяя (x-\-iy)(x—iy) на г2—z2, получаем, что Р и Р, зависят только от г2 и г. Отсюда, полагая г = 1, мы имеем уст) =etmq> (sine)-«-.P<W (cos 0). (4.4) Для tn — — I мы принимаем Р = 1, а для т = +/ возьмем Р, = 1; в последнем случае P(z) = (l—z2)z. Поскольку У)'”’ зависит от ср только через множитель eim4>, то полу- чаем $ У<"” У<т’> do) = 0, /п' #= т. (4.5) Следовательно, базис yjm), в котором ось z занимает при- вилегированное положение, является унитарно ортого- нальным. 4. Полнота.— То, что совокупность сферических гар- моник образует полную ортогональную систему на еди- ничной сфере, можно доказать, если показать, что любой многочлен от х, у, z на сфере может быть записан как сумма сферических гармоник. Вообще, многочлен степени I содержит (J + l) + ^ + G—1) + • • • + 1 коэффициентов. Это в точности совпадает с числом ли- нейно независимых однородных многочленов, содержа- щихся в выражении Г1 (У; + +...)[ =ut + (х2 + У2 + г2) и^2 + ... ], (4.6) так как многочлены вида rlYt, rlYl„2i ... являются ли- нейно независимыми в силу ортогональности сферических гармоник. Выражение rlYt содержит в точности 2/4-1 = = (/4-1)4-/ линейно независимых функций; поэтому в выражении (4.6) содержится ровно [(/+1)+ /] + [(/-1) + (/-2)]+ • • • функций, что и утверждалось выше. 5. Замкнутые выражения для сферических гармоник.— Подставив (4.4) в (4.2), мы получаем для полинома Р=Р<р" при z = cos0 следующее дифференциальное уравнение: (l-22)^+2(/n-l)z-g- + [/(/+l)-m(m-l)]./’=0. Из него мы находим, что функция dPldz удовлетворяет тому же уравнению при замене т на т—1; таким
88 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ образом, мы получаем рекуррентную формулу и выражение (Z) = £H(1—2»у. v ' dz‘~m ' 6. Другие формулы.— Если I—&=#±1, то мы имеем $xyftKzd® = 0. (4.7) Поскольку функция x-rkYk является многочленом степени fc+1 и, в соответствии с п. 4, может быть представлена в виде суммы ^+1(n+1 + ^-x+...), то на единичной сфере будет выполняться равенство xYk = Yk+1 + Y^1+,..J (4.8) и единственным значением l^k, для которого интеграл (4.7) может иметь ненулевое значение, является Z = 1. От- сюда следует наше утверждение (4.7); из сказанного выше следует также, что в (4.8) остаются только два первых члена. В дальнейшем мы иногда будем пользоваться поляр- ными координатами для дифференциальных выражений L*u = Lx (Lxu) + Lv {Lv и) + Lz (L2u). Подставив в равенство , du , . du , . du . приращения dx, dy, dz, полученные при увеличении <p на dq> и фиксированных г, 0, мы сразу же получаем (4.10)
$6. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 89 Подобным же образом L 4-iL — et4(-4-i Lx-\-iLy—e ^0-t-t sin0 j, iLy — e эд +1 sin 0 dqj ’ IA^ — Л (cm. (4.1)). (4.1 O') § 5. Электрон в сферически-симметричном поле. Пространственное квантование Вернемся к физике! Рассмотрим электрон с зарядом — е, вращающийся вокруг фиксированного ядра с заря- дом Ze, расположенного в начале координат. Для Z=1 мы имеем атом водорода, для Z = 2—однократно ионизо- ванный гелий Не+, для Z = 3—дважды ионизованный литий Li + + и т. д. Потенциальная энергия выражается равенством V = — Zeilr\ однако в дальнейшем для боль- шей общности мы возьмем в качестве V (г) произвольную функцию радиуса г. Тогда волновым уравнением для определения энергетических уровней является уравнение ^-Дф + [Д-У(г)]ф=0. (5.1) При разложении по сферическим гармоникам функция ф превращается в сумму членов fi(r)Yl (/ = 0,1,2,...). Дифференциальный оператор в левой части уравнения (5.1) переводит /-й член суммы в функцию Уг, умноженную на } + [£-v «1 f‘ <') <6-2> Следовательно, и каждый член в отдельности должен удовлетворять дифференциальному уравнению; таким об- разом, мы получаем полный набор собственных функций вида Множитель ft(r), зависящий только от г, должен быть таким, чтобы выражение (5.2) равнялось нулю и интеграл $ (г) fi (г) dr сходился. Обозначая собственные числа и собственные функции этого дифференциального уравнения через Enl, fndr) (и = 0, 1,2, ...),
90 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ заметим, что Еп1 есть (2/+1)-кратный уровень энергии, так. как выражение fnl (г) Yt содержит 21 + 1 линейно не- зависимых собственных функций, связанных с данным собственным значением; мы можем выбрать в качестве базиса функции W = fnl(r).Y<r> (т = —1, ...,1-1,1). Таким образом, мы приходим к трем целым квантовым числам: «радиальное квантовое число» п, «.азимутальное квантовое число» I и «магнитное квантовое число» т. Уровень энергии зависит только от первых двух. Для подтверждения разумности этой терминологии мы найдем угловой момент электрона с компонентами hLx = ypx—zpy, ... В квантовой механике Lx, Ly, Lz являются операторами (4.9). Отсюда для функции = fni (г) ¥}т> = eimlf • (функция г и 0) (5.3) в соответствии с формулой (4.10) имеем и для собственной функции ^fm(r)Yt (5.4) будет выполняться равенство Л2ф = /(/ф- 1)ф, где I — азимутальное квантовое число. Таким образом, в состоянии, описываемом формулой (5.4), определенное значение имеет не только энергия Еп1, но и абсолютная величина момента импульса 22 = /(/+ 1) (5.5) Значение азимутального числа и состоит в том, что оно определяет эту величину. Причем существуют состояния / = 0, n = 0, 1, 2, ... со сферически-симметричными собст- венными функциями ф = /п0(г), для которых момент им- пульса равен 0. В состояниях, описываемых функциями (5.3), определенные значения имеют не только энергия и абсолютная величина момента импульса, но и z-cocmae-
5 5. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 91 ляющая момента импульса, которая также принимает вполне определенное значение, и выполняется равенство L2 — т (5-6) Так как магнитный дипольный момент связан с угловым моментом /г£ вращающегося электрона (масса электрона обозначается через р, если есть опас- ность смешения с магнитным квантовым числом т), то зависимость от 2 будет проявляться при воздействии на атом магнитного поля. Именно этим можно объяснить возникновение эффекта Зеемана. Основополагающий опыт по непосредственному обнаружению магнитного момента электрона принадлежит Штерну и Герлаху. Пусть пучок одноэлектронных атомов, двигающихся в направлении оси х и находящихся в состоянии (п, /) с уровнем энер- гии Еп1, подвергается воздействию неоднородного маг- нитного поля в направлении оси z. Пусть х- и (/-компо- ненты магнитного поля в плоскости (х—z) движения пучка равны нулю, и пусть z-компонента является функ- цией только от z. Тогда на магнитный диполь, г-состав- ляющая момента которого равна sz, действует сила в положительном г-направлении. Вследствие ра- венства (5.6) пучок, атомов разобьется на 21 +1 меньших пучков под воздействием силы в z-направлении, соответ- ствующих различным значениям т — 1, I — 1.....—I маг- нитного квантового числа. В эксперименте с атомами се- ребра, находившимися в нормальном состоянии, наблю- дались два пучка, соответствующих т= ± 1; было найдено, что значение «магнетона Бора» (элементарного магнитного момента, соответствующего единичному угловому моменту) согласуется с величиной eh/2pc, получаемой из формул (5.6) и (5.7). Почему при таких условиях не проявился невозмущенный пучок, соответствующий т — 0, осталось невыясненным. Старая квантовая теория, применявшая квантовое число k = I + 1 со значениями 1, 2, ... , допускала, что т принимает целые значения от —k до +&; казалось правдоподобным исключение случая 6 = 0, хотя при этом
92 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ возникали трудности, вызванные применением так назы- ваемой «адиабатической гипотезы» для описания поведе- ния атома, находящегося под воздействием поперечных электрических и магнитных полей. В новой квантовой теории не требуется никаких ad hoc*) гипотез, поскольку I может принимать только значения 0, 1,2, ... Однако согласно и старой, и данной скалярной волновой теории, для каждого k или I должно существовать нечетное чис- ло допустимых значений т; исключение случая /п = 0, требуемое экспериментом Штерна—Герлаха, не может быть объяснено ни в одной из этих теорий. Мы также не можем объяснить аналогичный факт, что, в зависимо- сти от природы наблюдаемого атома, в аномальном эф- фекте Зеемана величина т может принимать как четное, так и нечетное число значений. Очевидно, что в нашей скалярной волновой теории, как и в старой, есть еще нерешенные вопросы; мы вернемся к этому в главе IV, § 4. Старая квантовая теория описывала встреченную нами выше ситуацию как «пространственное квантование»-, так как абсолютная величина момента импульса равнялась hk, а составляющая вдоль оси z была равна Кт, то де- лался вывод, что магнитная ось атома может принимать только положения, описываемые отклонением 0 от оси г по формуле cos 0 = -у (т = 0, ±1, ±2......±k). Таким образом, в случаев—1 нам следовало ожидать, что существуют только три возможные ориентации маг- нитной оси: параллельно и антипараллельно полю, взя- тому нами в направлении z-оси, и перпендикулярно к нему (если мы не исключаем эту последнюю возможность (т = 0) ввиду эксперимента Штерна—Герлаха, где есть только две ориентации). В любом случае мы сталкиваемся с серьезной дилеммой, поскольку направление оси z про- извольно в пространстве. Для устранения этой дилеммы предполагали, что квантование вызывается воздействием магнитного поля, и поэтому предпочтительное направле- ние г принимается за направление магнитного поля. Но даже и на этом пути не удается обойти трудность в пре- дельном случае нулевого магнитного поля, так как про- странственное квантование должно сохраняться и при *) ad hoc—к этому случаю (лат.) (Примеч. пер.)
§5. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 93 произвольно слабых полях. Г оворя более физическим языком—такой радиационный механизм ориентации ато- мов, первоначально имевших случайные ориентации и прецессии относительно оси г, требует в эффекте Штер- на—Герлаха времени, приблизительно в 108 раз большего, чем наибольшее время, согласующееся с наблюдениями. Новая квантовая механика занимает в этом вопросе в корне отличную позицию. Возможные состояния атома (п, /) описываются функциями ф из (21 + 1)-мерного ли- нейного семейства ^ = fnl(r)Yt= 2 т= -I или векторами из (2/4-1)-мерного пространства с ком- понентами хт. При этом z-составляющая момента им- пульса, так же как и составляющая в любом другом на- правлении, может принимать только дискретные значе- ния hm (m = l, I—1, —/). Но существует только некоторая вероятность того, что в состоянии, в котором, например, г-компонента с достоверностью принимает зна- чение hm, любая другая компонента примет определенное значение из ее возможных значений: Л-0, Л-(±1), ••• ..., Л-(±/). Название «пространственное квантование» едва ли подходит для описания этой ситуации [9]. Если электростатическая центральная сила удовлет- воряет закону Кулона и имеет центр в ядре с зарядом +Ze, то дифференциальное уравнение (5.2) для «радиаль- ной собственной функции» f = fn[(r) принимает вид Характер этого уравнения не изменяется при переходе к новой зависимой переменной v, определяемой формулой rf = e~ar-v: d*v 2adv I I 2mE\ I 2mZg2 0 dr? Za dr +(\,a + rh2. r2 fv — V- Мы выбираем константу a так, чтобы постоянный член в коэффициенте при v обращался в нуль, т. е. h2a2 =—2тЕ. (5.8) Из общей теории линейных дифференциальных уравне- ний [10] мы знаем, что в окрестности (регулярной) осо-
94 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ бой точки г = 0 существуют решения этого уравнения в виде степенных рядов в которых показатель р имеет начальное значение р0, не обязательно целое, и пробегает значения р0, р0 +1» р0 + 2, ... При подстановке этого степенного ряда в уравнение мы находим для коэффициентов рекуррент- ную формулу {р (р + 1)—I (I + 1)} ag+1 = 2ац (ар. —• (5.9) Чтобы она была верна для р+1 = р0 (Яц = 0, %+i=H=0), должно выполняться равенство Но(Но-1) = /(/+1). Таким образом, мы получаем, что либо р0 = I + 1, либо |л0=—/. Рассматривая первую возможность и принимая коэффициент а1+1 при низшей степени равным единице, видим, что все остальные коэффициенты могут быть по- лучены путем последовательного применения рекуррент- ной формулы (5.9), поскольку знаменатель р(р+1) — — Z(Z-[- 1) не обращается в нуль; обозначим полученное таким образом решение через v. Вторая возможность не приводит к какому-либо решению, поскольку знаменатель в рекуррентной формуле равен нулю при р = / (второе решение дифференциального уравнения может быть полу- чено квадратурами из первого решения и включает лога- рифмические члены). Степенной ряд для v обрывается, если для некоторого показателя p, = p,0~fn имеет место равенство Zme2 ИЛИ и _ Ztne? Ла_Л(и + /+1)- В этом случае f имеет вид произведения е~аг- г1 • (многочлен порядка п от г); функция f конечна при г = 0 и интеграл 5 r2l(r)f(r)dr (5.10) (5.U)
§5. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 95 существует, что и требовалось доказать. Соответствующие собственные значения Е являются уровнями энергии; обозначая п + ^+1 через п и разрешая (5.8), (5.9) отно- сительно Е, находим = <5-12) Целое п, главное (или полное) квантовое число, подчинено условию n > I. Не существует никаких других решений, для которых сходится интеграл (5.11) [8]. Уровни энергии зависят только от главного кванто- вого числа п\ термы, для которых п—фиксированное чис- ло, а Z = О, 1, ..., п—1, складываются в один вырожден- ный терм Еп кратности и- 1 2 (2/+1) = ^. /=0 Этот теоретический результат согласуется с эмпириче- скими формулами для серий Бальмера, Пашена, Лаймана и т. д. Для термов, измеренных в волновых числах (у/2пс== E/2nch), мы находим формулу Z2/? л г> . те* ГДе “ 4nhsc ‘ Значение постоянной Ридберга R, выраженной через фун- даментальные константы (заряд и масса электрона, ско- рость света и элементарный квант действия), численно согласуется с ее эмпирическим значением. Все термы, а следовательно, и все реальные частоты линий v зависят от целого числа Z, отвечающего заряду ядра, причем Kv возрастает пропорционально Z. Так как рентгенов- ские термы вызываются самыми внутренними электронами, на которые внешние электроны воздействуют слабо, нам следует ожидать, что самые жесткие рентгеновские ли- нии, расположенные в порядке возрастания атомного чис- ла Z, следуют этому закону. Это явление было обнару- жено Мозли и дало убедительное доказательство того, что при прохождении по элементам периодической таб- лицы заряд ядра возрастает на е от элемента к элемен- ту. Полученный Мозли закон с непогрешимой определен- ностью указывает дыры, все еще остающиеся в системе известных элементов; в настоящее время у нас нет только 2 (или 3) элементов в ряду, начинающемся с водорода, Z=l, и кончающемся ураном, Z = 92.
96 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ Собственные функции, соответствующие энергетическим уровням и определяющие относительные вероятности раз- личных положений электрона, могут быть выражены в замкнутом виде через так называемые полиномы Лагерра. Собственная функция, соответствующая нормальному со- стоянию га=1, / = 0, является сферически-симметричной *) L-.g-r/a; (5.13) V па3 для водорода а = = 0,532 А. (5.14) (Согласно старой теории Бора а есть радиус самой внут- ренней электронной орбиты.) Число а определяет поря- док величины атомных размеров. В нормальном состоя- нии атом водорода обладает сферической симметрией (со- гласно скалярной волновой теории, но см. гл. IV, § 8). Однако радиальные собственные функции r-fnl(r) при заданном I не образуют полной ортогональной системы для всей рассматриваемой области: кроме дискретного спектра термов (5.12), мы имеем непрерывный спектр, по- крывающий всю область £^0. Мы не будем далее уг- лубляться в этот вопрос [11]. § 6. Процессы столкновений Оптические явления показывают, что квантовая тео- рия приводит к правильным уровням энергии, но они не позволяют интерпретировать вектор ф в пространстве со- стояний как вероятность. Этой цели отвечают процессы столкновений, связанные с отклонением электронов или а-частиц под воздействием других материальных тел. Их изучению посвящены фундаментальные эксперименты Франка и Герца, а также эксперименты Дэвиссона и Джермера. Если пренебречь реакцией движущейся частицы на возмущающее тело, то потенциальную энергию, обуслов- ленную воздействием этого тела, можно считать заданной функцией положения V (х, у, г). Если рассматривать од- *) Нормировочный множитель Х/Ула3 вычисляется из равенства J e”2r^ dxdy dz*=fat \ е 2г!а г2 dr = ла8.
§6. ПРОЦЕССЫ СТОЛКНОВЕНИЙ 97 номерную задачу, то энергия движущейся частицы рав- няется Мы можем представить себе кривую y = V(x) в виде кон- тура горки, на которую взбегает частица. Волновое урав- нение для состояния с данной энергией Е имеет вид -£-gL+[£~m'i’-o- (6.1) Пренебрегая на время возмущающим полем 7, мы полу- чаем в качестве решений уравнения (6.1) обычные волны де Бройля: функция ф является линейной комбинацией волн eiax и e~iax, распространяющихся в положительном и отрицательном направлениях вдоль х оси, причем их волновое число а определяется формулой (Ла)2 = 2тЕ или ha = р. Если ввести обозначение ^-V(x) =(/(%), то уравнение (6.1) запишется в виде ^ + [а2_(7(х)И=0. (6.2) Здесь мы принимаем, что при х-^±оо функция U (х) + со принимает такие значения, что интеграл | U(x)\dx схо- — 00 дится; уравнение (6.2) имеет тогда решения, одно из ко- торых при Х-+4-ОО асимптотически ведет себя как eiax, а второе, линейно независимое от первого, в той же об- ласти ведет себя как e~iax. Это наиболее четко можно проследить, решая уравне- ние (6.2) методом последовательных приближений. Пусть = ) ti h--4- • • • ’> (6-3) возьмем в качестве нулевого приближения функцию eiax. Функция ф„ + 1 определяется через ф„ при интегрировании уравнения + <*%+1 = и (.х) 1|>я. Отсюда 00 sin а (х—£).{/(!) я|>„(£)4£. (6.4)
ГЛ. Л. КВАНТОВАЯ ТЕОРИЯ 98 Ограничимся на время такой областью х^х0, что 00 ±-^\U(x)\dx = g<\. Если неравенство |4>п(х)|<:ап выполняется для всехх, то интеграл (6.4) сходится и 00 I Ф«+1 (х) | С ап ” УI (I) I dfc, X следовательно, если принять а0 — 1, an+1 = gan, то ап = = £", или | ф„ (х) I для Вследствие этого ряд для ф сходится по крайней мере так же быстро, как гео- метрическая прогрессия со знаменателем g. Его сумма удовлетворяет интегральному уравнению 00 ФW—Я’о(•*) = —Уsin“(x-D-U(I)If(£)dl (6.5) X и поэтому является решением уравнения (6.2). Так как 1(х) | < 1 +g+g2+ • • • =тг>' то уравнение (6.5) приводит к оценке оо I W—Фо (х) К a(1Lg) • У I и (В) ] (%, X из которой следует, что функция ф (х) при х —> + оо асимптотически подобна ф0(х) = е*ах. При этом, поскольку уравнение S—=~Уcos а ® •и ® ® X дает в качестве верхней границы абсолютного значения разности в левой части величину оо X стремящуюся к 0 при х —* +00» то не только но и dtydx d^Jdx.
§6- процессы столкновений gg Решение ф(х), найденное нами в области х^х0, мо- жет быть естественным образом аналитически продолжено на всю вещественную ось. Поскольку наши выкладки применимы точно так же и к случаю х——оо, мы по* лучаем, что функция ф(х) удовлетворяет асимптотиче- скому равенству вида ф (х) ~ beiaxjr b'e~iax при х—> — оо. Кроме того, должно выполняться соотношение ~ ia (beiax — b'e~iax). Если ф(х) является решением дифференциального урав- нения, то ф(х) также является решением этого уравнения: S + [«2-^W]4’=0, g+[a2_f/W]^=o. Умножим первое уравнение на ф, второе на ф и вычтем одно из другого; мы находим dx\ r dx T dx / ИЛИ ф —ф = const. (6.6) r dx r dx х 7 Определитель (6.6) при х—> + оо имеет предельное зна- чение 2кх, а при х—> — оо предельное значение 2кх (bb—b'b'), откуда _ bb —b'b' = 1. (6.7) Из этого равенства следует, что b^=Q. Умножив функ- цию ф(х) на l/Ь, мы получаем решение ф, асимптотиче- ское поведение которого описывается равенствами ф(х) ~ eiax + a'e~iax при х—> — оо, ty(x)~aeiax при х—>4-оо, ' ’ ' где а=\/Ь, а' — b'lb. Формула (6.7) превращается теперь в равенство |пр + |п'|2=1. (6/9)
tOO ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Итак, пусть некая частица определенной энергии взби- рается на холм потенциальной энергии слева, т. е. из х =— оо. В то время как в классической механике части- ца определенно либо преодолевает холм, либо отбрасыва- ется назад, согласно тому, больше или меньше максимума V (х) ее начальная кинетическая энергия, квантовая меха- ника утверждает, что имеется вероятность |я|2 того, что она преодолеет холм, и вероятность \а' |2 того, что сна будет отброшена назад. Более того, эти вероятности являются непрерывными функциями энергии частицы; раз- рывность классической теории полностью исчезает. Если мы проводим эксперимент последовательно с большим чис- лом частиц, то мы находим, что они разделяются на два потока, идущих, согласно равенствам (6.8), в положитель- ном и отрицательном направлениях вдоль оси х; их отно- сительные интенсивности равны соответственно 1 и |я'|2 при х—> — оо, в то время как при х—>4-00 существует только положительный поток интенсивности |я|2. Таким образом, уравнение (6.9) выражает закон сохранения чис- ла частиц и показывает, что мы должны рассматривать квад- рат абсолютного значения амплитуды |я|2 как относи- тельную интенсивность или вероятность. Если выполняется неравенство + 00 1. у I U(x)\dx< 1, то решение ф во всем пространстве дается формулой (6.3). В теории возмущений обычно довольствуются первым чле- ном ф^. Подобным же образом Вентцель разработал теорию опытов Резерфорда, в которых а-частицы пролетают в заданном направлении с заданным импульсом и отклоня- ются полем атома [12]. Влиянием а-частицы на атом при этом пренебрегают; если учесть это влияние, мы получим теорию опытов Франка и Герца, дающую формулы для рассеивающихся частиц, отличающихся кинетическими энергиями и направлениями. Такой расчет был проведен для водорода Борном и Эльзассером [13]. Очень важное применение картины «просачивания» корпускулярных волн через потенциальный холм—теория радиоактивного рас- пада Г. Гамова, Р. В. Гурни и Е. У. Кондона [14].
§7. КОНЦЕПТУАЛЬНАЯ СТРУКТУРА КВАНТОВОЙ МЕХАНИКИ Ц)1 § 7. Концептуальная структура квантовой механики Теперь плодотворность нашей теории уже достаточно хорошо доказана, и приведенные примеры служат хоро- шей ее иллюстрацией с физической стороны; по-видимому, настало время перейти к ее абстрактной формулировке. Рассмотрим физическую систему известного строения. Каждое частное состояние, каждый отдельный случай та- кой системы представляется вектором у с единичным мо- дулем в унитарном пространстве системы. Каждая физи- ческая величина, связанная с системой, представляется в этом пространстве эрмитовой формой. Фундаментальный вопрос, который мы ставим перед теорией,— это не вопрос классической физики «Какое значение имеет эта физичес- кая величина в этом частном случае?», а вопрос «Каковы возможные значения физической величины А, и какова ве- роятность того, что она принимает одно определенное значение из них в данном случае?» Вот ответ на этот во- прос: Вероятность того, что величина А принимает зна- чение а, равна значению Еа(& формы Еа для А (см. (5.8), гл. I), связанной с собственным значением а, где вектор у представляет исследуемый случай, а величина А описыва- ется эрмитовой формой А в пространстве системы. Вели- чина, представленная формой А, может принимать толь- ко те значения а, которые являются собственными значе- ниями формы А. В соответствии с равенствами ?2 = 2 (?) , а а сумма вероятностей равна 1 и значение А (у) формы А является средним значением, или математическим ожида- нием, величины А в состоянии у. Так как все соотноше- ния для вероятностей в данном состоянии % не изменя- ются численно при замене у на еу, где е— произвольное комплексное число с единичным модулем, то мы не можем различить эти два случая. Следовательно, чистый случай или состояние правильнее представлять не вектором у, а лучом у, и мы должны вместо векторного поля ввести поле лучей в пространстве состояний. Значение вероятностей для экспериментальной науки состоит в том, что они определяют относительную часто-
162 Г'Л. И. КВАНТОВАЯ ТЕОРИЯ ту появления какого-либо наблюдения в серии повторяю- щихся наблюдений. Согласно классической механике, в принципе можно создать условия, при которых каждая величина, связанная с данной физической системой, при- нимает некоторое значение, определяемое с произвольной степенью точности, и это значение воспроизводится оди- наково при одинаковых условиях. Квантовая физика от- вергает такую возможность. Мы можем проиллюстрировать это на примере пространственного квантования. Мы знаем условия, при которых можно практически гарантировать, что атомы водорода находятся в нормальном состоянии. По- этому давайте предположим, что можно создать условия, гарантирующие, что наблюдаемые атомы находятся в кван- товом состоянии (п, /) с азимутальным квантовым числом /=1 и энергией Е. С каждым направлением г в прост- ранстве связывается некоторая величина Lz, которая при этих условиях может принимать только значения +1,0 или —1. Штерн и Герлах показали, как уточнить усло- вия, при которых Lz принимает только одно определен- ное значение из трех допустимых, скажем, Lz = +1. В этом случае, согласно теории, достижим крайний пре- дел точности. Если х—другое направление в простран- стве, то при условиях, определяющих Lz и Е, можно найти только относительную вероятность того, что Lx принимает одно из значений +1,0, —1. Почему нельзя пойти дальше и создать условия, при которых Lx также принимает достоверно какое-либо одно значение, скажем, 0? Это связано с тем, что «измерение» Lx (осуществляемое раз- делением атомов на три класса: Ех = + 1, 0, —1) возмож- но лишь при условиях, разрушающих однородность, уже существующую по отношению к Lz. Очевидно, процесс пространственного квантования для атомов в чем-то по- ходит на процесс поляризации фотонов. Условия получе- ния монохроматического пучка света в определенном на- правлении определяют энергию и импульс фотонов. Каж- дой ориентации s призмы Николя соответствует опреде- ленная величина способная принимать только значе- ния ±1; если Х,= +1, то свет проходит через призму, если же Х5=х—1, свет не проходит. С помощью такой призмы мы разделяем фотоны, для которых Х5=1, не возмущая их энергию и импульс. В этом случае достижим крайний предел точности; монохроматический пучок поля- ризованного света является наиболее однородным светом из всех возможных. Если мы теперь поместим на пути
§7. КОНЦЕПТУАЛЬНАЯ СТРУКТУРА КВАНТОВОЙ МЕХАНИКИ ЮЗ этого пучка вторую призму Николя ориентации о, то через нее, естественно, могут проходить только те фото- ны, которые имеют Ха=+1. Однако свет, получаемый нами таким образом, имеет такое же строение, как в слу- чае, если бы первая призма Николя ориентации s совсем не использовалась; условие равенства -|-1 величины для всех фотонов, очевидно, разрушается второй призмой Николя. Естественные науки имеют конструктивный характер. Их рабочие понятия не являются свойствами или атри- бутами, которые можно получить из объективного мира непосредственным созерцанием. Их можно вывести только косвенными методами, путем наблюдения взаимодействия данного тела с другими телами, т. е. они определяются неявно благодаря определенным законам природы, управ- ляющим взаимодействиями [15]. Рассмотрим, например, формулировку галилеева понятия массы, которая по су- ществу равнозначна следующему косвенному определению: «Каждое тело обладает импульсом, т. е. вектором mt), имеющим то же направление, что и его скорость; скаляр- ный множитель т называется его массой. Импульс замк- нутой системы сохраняется, т. е. сумма импульсов набора взаимодействующих тел остается одной и той же перед взаимодействием и после него». Применяя этот закон к наблюдаемым процессам столкновений, мы получаем дан- ные, позволяющие определить относительные массы раз- личных тел. Ученые долго придерживались мнения, что такие конструктивные понятия тем не менее являются внутренне присущими свойствами «вещи в себе» (нашего объекта), даже когда не проводятся эксперименты, необхо- димые для их определения. В квантовой теории мы стал- киваемся с фундаментальными ограничениями этой мета- физической точки зрения [16]. Мы уже видели в начале этой главы, что координата х и связанный с ней импульс р находятся в особом отно- шении друг к другу: точное определение одной из этих величин мешает точному определению другой. В состоя- / + оо нии, описываемом волновой функцией ф(х) I \ = = 11, средние значения х„ = <х> и р9 — <р> определяются
104 ГЛ. 11. КВАНТОВАЯ ТЕОРИЯ выражениями У хг|) (х) гр (х) dx и 4- J ip^dx. — ОО —со Без потери общности можно принять эти средние значе- ния равными нулю; первое среднее может быть обращено в нуль заменой х на х—х0 или гр(х) на гр(х + х0), а вто- рое—заменой гр(х) на —^)-г|?(х). Средние значения (Ах)2, (Ар)2 величин (х—х0)2, (р—р0)2 даются тогда выра- жениями (Ах)2= $ х2 гр (х) гр (х) dx, — 00 (Ар)2 = —/г2 С гр(х) dx =/г2 С ^^dx. fj 1ЛЛ fj (ЛЛ 1ЛЛ' — 00 —00 Из этих соотношений легко можно получить общее нера- венство Ар-Ах ^4- (я благодарен В. Паули за это замечание); чем меньше неопределенность в х, тем больше неопределенность в р, и обратно (см. дополнение 1 в конце книги). Вообще говоря, условия эксперимента не гарантируют даже того, что все объекты, составляющие рассматривае- мую систему, находятся в одинаковом «состоянии», кото- рое представляется в квантовой теории лучом в простран- стве состояний. Таков, например, случай, когда мы забо- тимся только о том, чтобы все атомы находились в кван- товом состоянии (и, /), не разделяя их по т посредством эффекта Штерна—Герлаха. Поэтому для применения кван- товой механики и в данном случае необходимо установить критерий, который позволял бы нам определять, достаточ- ны ли заданные условия для обеспечения «чистого состоя- ния». Мъ\ говорим, что условия 6' дают большую одно- родность, чем условия (S, если: (1) каждая величина, имеющая точное воспроизводимое значение при условиях имеет то же самое определенное значение при условиях (£', и если (2) существует какая-либо величина, точно опре- деленная при условиях (£', но не определенная условия-
§ 7. КОНЦЕПТУАЛЬНАЯ СТРУКТУРА КВАНТОВОЙ МЕХАНИКИ ]05 ми 6. Очевидно, что искомый критерий таков: Условия гарантируют чистое состояние, если получить дальней- шее увеличение однородности невозможно. (Этот максимум однородности получался в классической физике только тогда, когда все величины, связанные с системой, приоб- ретали определенные значения.) В чистом состоянии, описываемом вектором а = (я.), величина Q, представленная эрмитовой матрицей Q = ||^||, имеет математическое ожидание, или среднее значение «2> = 2^<7^- i, k Числа nzr-=nz^ (7.1) являются компонентами положительно определенной эрми- товой формы А со следом 1, т. е. |(a?) |2 = 2 aixr 2 aixi- i i (Положительную определенность здесь следует понимать в ослабленном смысле A(j)^O.) Следует заметить, что величина <Q> зависит линейно и однородно от рассматри- ваемой величины ||<7Zfc||: <Q> = tr(AQ). (7.2) Если статистический ансамбль А создается путем при- ведения большого числа объектов наблюдаемой физичес- кой системы к условиям 6, то среднее значение физичес- кой величины Q будет выражаться формулой (7.2), где А — положительно определенная эрмитова форма со сле- дом 1, конкретизированная для этого ансамбля, даже если условия (S не гарантируют максимальной однородности. Это вызвано тем, что равенство (7.2) остается справедливым, когда мы смешиваем в произвольных пропорциях статисти- ческие ансамбли, каждый из которых обладает макси- мальной однородностью; в действительности любой стати- стический случай может быть рассмотрен как смесь чистых состояний. Как отметил И. фон Нейман, формула (7.2) может быть получена из простых аксиом [17]: 1. Если Р, Q—физические величины, а X — действи- тельное число, то <ХР> = Х<Л>, <Р + Q> = <Р> + <Q>. 2. Если величина Q может принимать только положи- тельйые значения (т. е. форма Q является положительно определенной), то <Q> 0.
106 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ 3. Если Q является просто числом, т. е. если она не зависит ни от каких физических условий, то <Q> = Q. Если допустить, что не только любая физическая ве- личина Q представляется эрмитовой формой, но и обрат- но, что любая эрмитова форма представляет некоторую величину, связанную с системой, то из формулы (7.1) следует, что <Q> = 2 akt Quo i. k где коэффициенты aKi не зависят от Q. (Мы вернемся к этому предположению в гл. IV, § 9.) Матрица А = (| й/Л || должна быть эрмитовой, так как среднее <Q> всегда ве- щественно. Приведя матрицу А к нормальному виду 2 а,*,-4, получаем, что условие (2) требует для специаль- ных эрмитовых форм вида Q = 2<7ixiAT выполнения усло- вия 2а(7/^0 ПРИ произвольных неотрицательных зна- чениях qt\ следовательно, а/>0 и матрица А положитель- но определена. Вероятность того, что в статистическом ансамбле А величина Q принимает значение х, равна a> = tr(AEx), (7.3) где Еи есть идемпотентная форма, соответствующая собст- венному числу х. Можно также выделять «чистые состояния» из общих статистических ансамблей—«смешанных состояний»—на основании того, что они не могут быть получены смеше- нием двух или более различных статистических ансамблей. Это соответствует теореме о том, что эрмитову матрицу А вида (7.1) нельзя выразить в виде суммы В + С двух положительно определенных эрмитовых форм В и С, не являющихся просто кратными форме А. Теорему можно легко доказать, если взять вектор a = (a(-) за одну из координатных осей в пространстве состояний. Положитель- но определенные эрмитовы формы А с единичным следом, т. е. статистические ансамбли, образуют выпуклую область @ в том смысле, что вместе с формами А и В к области © принадлежит и их «центр масс» лА + цВ (X, р— произ» вольные положительные числа, сумма которых равняется единице). Точка области которая не может быть пред- ставлена как такой центр масс двух точек из @, отличных от этой точки, называется, согласно Минковскому, «.край-
§8. ДИНАМИЧЕСКИЙ ЗАКОН. ВЕРОЯТНОСТИ ПЕРЕХОДОВ Ц)7 ней точкой» [18]. Множество © является «выпуклой обо- лочкой» класса 6 всех крайних точек, т. е. наименьшей выпуклой областью, включающей все точки множества Мы не можем исключить ни одну крайнюю точку из ©; если мы удаляем хотя бы одну точку из 6, то вместе с этим сжимается вся выпуклая оболочка. В связи с этим мы можем охарактеризовать чистые состояния как «край- ние точки» среди всех возможных статистических ан- самблей. Часто бывает удобно обходиться без нормировки tr А = = 1; тогда (7.3) дает вместо абсолютных относительные вероятности. Простейшим является статистический ан- самбль, который характеризуется единичной эрмитовой формой с матрицей 1; он представляет полное незнание. В термодинамике важную роль играет канонический ан- самбль A=e~H/kQ', здесь Н [является эрмитовой формой, представляющей энергию, k—постоянная Больцмана, а число 0 есть температура [19] (12). § 8. Динамический закон. Вероятности переходов Рассмотрев общие вероятностные законы квантовой теории, мы теперь вернемся к динамическому закону, опи- сывающему изменение состояния j физической системы за интервал времени dt. Динамический закон утверждает, что это изменение вызывается действием инфинитезималь- idt и гг ного унитарного оператора —^-•/7, где ™—эрмитова форма, представляющая энергию: 1-Й+Яе-О . (8.1) Особая роль энергии в квантовой механике вызвана ее появлением в динамическом законе. Мы рассматриваем этот закон как фундаментальную аксиому квантовой тео- рии, справедливость которой универсальна. В соответст- вии с (8.1) и вследствие того, что оператор Н—эрмитов, мы получаем уравнение ~^- = ХН—НХ (8.2) для матрицы -X с элементами Xl^XiXk,
108 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ которая характеризует статистический ансамбль чистого состояния, описываемого вектором $ = (xt-) (см. (7.2)). То же самое уравнение управляет изменениями во времени статистического ансамбля X для смешанного состояния [20]. При интегрировании уравнения (8.1) удобно выбрать систему координат, составленную из собственных векто- ров Н\ соответствующие собственные числа Еп являются уровнями энергии. Мы называем такую конкретную систе- му координат координатной системой Гейзенберга, поскольку Гейзенберг применял ее неявным образом в своей основополагающей работе по квантовой механике. Эта координатная система Гейзенберга, вообще говоря, не является однозначно определенной; она существенно зави- сит от разложения пространства состояний на собст- венные подпространства = sJi (£'), Di" = sJt(£"), ..., от- носящиеся к различным собственным числам Е', Е", ... Состояния, представленные векторами $ в таком собствен- ном пространстве, называются квантовыми или ста- ционарными состояниями', в них энергия имеет точно определенное значение. Одной из ситуаций, в которых оператор Н обладает только дискретными собственными числами, является случай «условно периодического движе- ния», который только и допускался в формулировке старой квантовой теории. Применяемые в дальнейшем термины и обозначения рассчитаны на случай дискретных собственных спектров, но это никоим образом не исключает того, что спектр может быть полностью или частично непрерывным. Уравнение (8.1), если разрешить его относительно компо- нент в координатной системе Гейзенберга, превращается в уравнение с решением xn(t) = xn.e~iVnt (En — hvn). (8.3) Это выражение представляет собой явную формулировку унитарного преобразования у —>- у (/) = U (/) г, которому под- вергается вектор состояния за время t. Поскольку вели- чина | хп (t) |2 постоянна, то вероятности различных значений энергии не изменяются во времени. Конечный закон X(t) = U(t)XU-'(t) (8.4) зависимости статистического состояния X (/) от времени t полностью эквивалентен дифференциальному закону (8.2).
§8. ДИНАМИЧЕСКИЙ ЗАКОН. ВЕРОЯТНОСТИ ПЕРЕХОДОВ Ю9 Среднее значение q = q(t) физической величины, пред- ставленной фиксированным эрмитовым оператором Q: может быть записано, с учетом свойств симметрии следа матрицы, в форме где Q(t) = U~^t) QU (t), (8.5) Следовательно, существуют два способа описания: либо мы рассматриваем Q как фиксированную в течение всего времени величину, а статистическое состояние Х(/)как меняющееся во времени в соответствии с законом (8.4), что является фундаментальной позицией, занимаемой кван- товой механикой; либо мы принимаем, что начальное состоя- ние X представляет состояние системы в течение всего времени, а оператор Q (t) описывает изменение величины во времени в соответствии с (8.5). Эта вторая интерпретация удобна для сравнения с классической механикой. Урав- нение (8.5) эквивалентно дифференциальному закону = (8.6) так как в силу (8.2) и (8.6) В частности, величина Q постоянна во времени (т. е. свя- занные с ней вероятности не меняются во времени), если эрмитова форма Q, представляющая ее, коммутирует с Н. В координатной системе Гейзенберга уравнение (8.5) превращается в равенства ^n(0 = <7mn^-Z(v”-v“)z. (8.7) Таким образом, матрица Q(/) выражается через составля- ющие, совершающие простые колебания с частотами vm—vn. Соответствующей амплитудой тогда будет qmn. При пере- ходе из m-го в n-е стационарное состояние система теряет количество энергии h(yrn— v„); если эта энергия излучается в виде света, то его частота определяется выражением •утп = чт—Уп. (8.8)
ПО гл. II. КВАНТОВАЯ ТЕОРИЯ Классическая механика собирает вместе все переходы с фик- сированного уровня т на всевозможные уровни п= 1,2, ... в одно состояние движения (движение системы в m-м кван- товом состоянии), гармонические составляющие которого имеют соответствующие частоты переходов vwl, vm2, ... Следовательно, для любой величины А она связывает с переходом т~+п постоянную амплитуду атп. В класси- ческой же механике (для систем с одной степенью свободы) мы имеем вместо (8.8) выражение vmn = k-<s)(n), k~m—п. Перемножив два ряда Фурье Л, В: 2 я* • eik(dt и 2 k k мы получаем ряд Фурье С с коэффициентами с* = 2аА (r + s=^). Классическая механика связывает с величиной С = АВ амплитуды т~s (r~\S = m П), (8*9) тогда как квантовая механика приписывает ей амплитуды ^тп т-rп’ (8.10) t г Различие этих двух результатов состоит в том, что в (8.9) оба сомножителя а и b имеют общий первый индекс т, в то время как в (8.10) первый индекс у b совпадает с последним индексом у а. Это соответствует различию между «классическим» и правильным комбинационным прин- ципом Ритца—Ридберга. Данное различие явилось для Гейзенберга отправной точкой; правильный комбинацион- ный принцип указывает на то, что правило (8.9) для умно- жения амплитуд должно быть заменено на (8.10). В ре- зультате такое умножение некоммутативно и собирает вместе амплитуды, которые старая модель относила к разным «орбитам». Примем | атп |2 за интенсивность величины А при переходе т—+п. Если уровни энергии являются кратными («вырождение»), то инвариантное значение имеет лишь сумма 5 \ атп I2» распространенная на все индексы т, для которых Ет~Е', и все индексы п, для которых в данном
§8. ДИНАМИЧЕСКИЙ ЗАКОН. ВЕРОЯТНОСТИ ПЕРЕХОДОВ Щ случае мы принимаем эту сумму за интенсивность А при переходе Е' —> Е". Если А*—та часть А, в которой 9i (£') скрещивается с 9? (Е")> то определенная выше сумма яв- ляется следом Л,А». Рассмотрим атом с одним или более электронами и обо- значим через г вектор, направленный от ядра к какому- либо представляемому электрону. Тогда величина q = er (или, если имеется более одного электрона, сумма q = У ег по различным электронам) является дипольным моментом атома. В классической электродинамике интенсивность испускаемого атомом света частоты v вычисляется по ампли- туде q(v) гармонических составляющих суммы q с одина- ковой частотой v следующим образом*). Интенсивность, с которой энергия протекает через элемент поверхности do в точке Р, расстояние которой от атома в точке О велико по сравнению с длиной волны, определяется выражением где q-1-—составляющая q, перпендикулярная к OP, a da есть телесный угол, описываемый элементом do, с верши- ной в точке О. Мы предполагаем далее, что рассматривае- мая длина волны больше радиуса атома. Так как каждый фотон частоты v несет энергию hv, то мы делаем вывод, что этот закон следует ввести в квантовую теорию в следую- щей формулировке: вероятность того, что находящийся в состоянии п атом перейдет за единицу времени в состо- яние п' и испустит фотон частоты v, направление которого лежит в пределах телесного угла da, определяется выра- жением (8-11) Таким образом, мы пришли к правилу для расчета интенсивностей испускаемых атомом линий. То, что мы можем сделать такой расчет, указывает на явное превос- ходство новой теории над старой. В частности, переход п—-» п' не существует, если соответствующий коэффициент в эрмитовой форме для q равен нулю. Это составляет общее правило отбора. В квантовую теорию переносится также связь между состоянием поляризации испускаемого света ♦) Это значит, что в представление Фурье для величины q входят слагаемые q (v) eivt -|-q (v) e~ivt.
112 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ и направлением осцилляций электрического момента. Но реальное доказательство нашего правила интенсивностей, естественно, может быть получено лишь при рассмотрении вопроса о взаимодействии между атомом и эфиром (см. § 13). Примеры. 1. Осциллятор. В координатной системе Гейзенберга, в которой энергия приводится к ее главным осям, эрмитова форма + 00 xip (х) i|) (х) dx, — 00 представляющая координату х колеблющейся частицы, имеет, как мы уже нашли [см. (3.11)], коэффициенты = 0, если п #=п ± 1; ) -в Г hn Zi(n-|-1) } (8.12) Яп,п~1— У 2mco ’ ~2т(д ' ) Таким образом, правила отбора имеют вид: п—*п±\\ квантовое число п может изменяться только на ± 1, осцил- лятор при этом поглощает или испускает фотон частоты v = со и энергии ha), в согласии с (3.10). Правило отбора объясняет, почему в простом осцилляторе не возбуждается никаких высших гармоник. Мы также нашли, что матрица || рпп, ||, представляющая импульс в координатной системе Гейзенберга, согласно (3.12), имеет вид: __ 1 -iZ* hm(j)n _ 1 hmd)(n-\-l) Pn.n-i— l у 2~~ ’Pn>n + i — ~T у 2 рпП' = 0 для n'=#'n±l. 2. Электрон в сферически-симметричном поле. Уравнение (4.7) для сферических гармоник дает правила отбора для азимутального квантового числа 1~+1±Ц (8.14) в случае 1 = 0 возможен только переход 0 —► 1. Если ввести магнитное квантовое число т так, как это делалось в § 4, то собственные функции будут зависеть от полярного угла ф относительно оси z только через множитель eim<₽; здесь х ± iy— г sin0-e±f(P, z = rcos0. Для того чтобы получить зависимость матриц qx-\-iqy, qx— iqy, qz от перехода m —> m', мы должны вычислить (8.13)
§8. ДИНАМИЧЕСКИЙ ЗАКОН. ВЕРОЯТНОСТИ ПЕРЕХОДОВ ИЗ интеграл 2Л е (аф) е (— тф) е (т'ф) dy, о где а=1, —1, 0 соответственно. Интеграл обращается в нуль всегда, кроме случая т' + a=^tn. Ненулевыми ком- понентами qx+iqy являются только те, которые соответ- ствуют переходам т—>т— 1, т. е. те, в которых магнит- ное квантовое число уменьшается на 1; для qx — iqy мы имеем т—+ т +1; для qz получаем т-+т. Эти последние правила отбора не могут быть получены из самих спектров до тех пор, пока термы, соответствую- щие различным значениям совпадают. Однако при наложении однородного магнитного поля в направле- нии оси z (эффект Зеемана) эти термы разбиваются на отдельные компоненты. При «продольном» наблюдении света, испущенного в z-направлении, вместо одной линии (п, I) — —> (п', /') мы получаем несколько компонент с левой и пра- вой круговой поляризацией, первые из которых возникают при переходах т-+т—1, а вторые при т—+т-[-1. При «поперечном» наблюдении, например, вдоль оси у, мы обна- руживаем две линейно поляризованные линии, возникаю- щие при переходах т~^ ги±1, и, кроме того, продольно (т. е. вдоль оси z) поляризованную линию, соответствую- щую переходу т т. (Под поляризацией здесь понимается направление колебаний электрического диполя, а, следо- вательно, и направление напряженности электрического поля.) В спектре термов щелочных элементов, который, однако, типичен в этом отношении и для более сложных спектров других элементов, мы выделяем несколько серий, обозна- чаемых буквами s, р, d, f, g, ... Каждая серия состоит из бесконечного множества термов, нумеруемых нами в на- правлении увеличения частоты целым числом п. В s-серии п начинается с 1, в р-серии с 2, в d-серии с 3 и т. д. Значения термов ns, пр, nd, ... определяются тогда «водо- родоподобной» формулой R (п + х)2’ в которой х = х5, хр, %d, ... —это слабо зависящий от п поправочный член, численное значение которого редко превышает 1/2 и весьма близко к 0 для высших серий
114 гл. II. КВАНТОВАЯ ТЕОРИЯ (/, g, ...). К линиям спектра приводят только переходы между термами, лежащими в соседних сериях, т. е. s-терм комбинируется только с р-термом, р-терм только с s и d, d—с р и f и т. д. В частности, переходы np-^ls опре- деляют главную серию, возникающую также и при погло- щении света, nd—>2р— диффузную серию, ns->-2p—рез- кую серию, a nf - > 3d—серию Бергмана [21]. Щелочные элементы А являются одновалентными, т. е. в химических реакциях играет роль только один электрон, называемый валентным электроном; остальные электроны в совокупности образуют инертную замкнутую оболочку. Поэтому разумно предположить, что оптические спектры щелочных металлов обусловлены квантовыми переходами, относящимися только к этому валентному электрону, в то время как остаток А + находится в нормальном состоянии. Выше мы показали, что водород в нормальном состоянии описывается сферически-симметричной волновой функ- цией ф; поэтому мы можем предположить (пренебрегая реакцией валентного электрона на Л+), что свойство «замк- нутости» оболочки А+ заложено в ее сферической симмет- рии*). При этом мы приходим к задаче об электроне в сферически-симметричном поле, которую уже обсудили выше. В соответствии с эмпирическим комбинационным принципом и теоретическими правилами отбора для ази- мутального квантового числа I следует принять, что для s-, р-, d-, f-, ..., -термов / = 0, 1, 2, 3, ..., соответст- венно. Тогда в серии с азимутальным квантовым числом I отсчет п начинается, как и в случае с водородом, с 1 **). § 9. Теория возмущений Задача, решаемая теорией возмущений, состоит в сле- дующем. Пусть энергия Н состоит из двух членов Н = = Н-}-г№, второй из которых, а именно, возмущающий член eW, мал по сравнению с первым; мы выражаем это условие при помощи «бесконечно малой» числовой посто- янной е, степенями которой выше первой следует пре- небречь. Предположим, что квантовая задача для «невоз- мущенной системы» с энергией Н уже решена и эрмитова ♦) Для того чтобы показать, почему гелий, а не водород, яв- ляется первым замкнутым атомом, мы должны подвергнуть волновую механику серьезным модификациям; см. гл. IV. ♦*) Относительно введения «истинного квантового числа» для эле- ментов, отличных от водорода, см. гл. IV, § 10.
§ 9. ТЕОРИЯ ВОЗМУЩЕНИЙ 115 форма Н уже приведена к нормальному (диагональному) виду; пусть 9t', 91", • .. —собственные пространства для Н, соответствующие собственным значениям Е', Е", ... Задача состоит в том, чтобы найти решения уравнений для «воз- мущенной системы» с энергией Н. Для того чтобы проиллюстрировать коренное различие между вырожденными и невырожденными системами, мы сначала рассмотрим вместо oo-мерного пространства со- стояний 2-мерное; тогда н = |о,Ц + ей7- Если Е± =£ Е2, то унитарное преобразование, приводящее Н к диагональному виду, отличается от тождественного только на члены порядка в. Следовательно, вероятности lxil2, |^2|2 того, что в чистом состоянии j оператор Н имеет значения Е1У Е2, изменяются лишь на величины того же относительного порядка е; они остаются постоян- ными с точностью до того же приближения, в котором можно пренебречь &W по сравнению с Н. Эта ситуация, однако, в корне меняется в случае вырожденной системы, где Е± = Е2 = Е, поскольку теперь главные оси оператора Н неопределимы, что приводит к «нестабильности» системы при воздействии возмущения. Зафиксируем нормальную систему координат е^, в которой W принимает диаго- нальный вид; так как Ег = Е2, то векторы координат в этом случае выступают в роли собственных векторов энергии Н. Однако эти векторы, по-видимому, могут произвольно сильно отличаться от исходных векторов координат ех, е2, в то время как энергии /ivx, hv2 могут отличаться от Е только на член порядка 8. Возвращаясь к исходной си- стеме координат, мы имеем = а1± • е (— viO + а12 -е (— v'Z), х2 = а21 • е (— v^) + а22 • е (— v'/), где а1 = (а11, а21), а2 = (а12, а22)—два взаимно перпендику- лярных вектора, направления которых совпадают с направ- лениями ex', е2. Вероятности обоих состояний еп е2 перио- дически изменяются во времени с малой частотой биений v2—vx (резонанс между состояниями ех, е2). Следовательно, квантовые состояния с одинаковой энергией резонируют друг с другом. Абсолютные значения компонент $ в собст- венных пространствах 91', 9Г, . .., т. е. вероятности разных численно отличающихся значений Н, остаются приблизи-
116 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ тельно постоянными при малых возмущениях, но это не так для абсолютных значений | хп | отдельных компонент хп по осям произвольной координатной системы Гейзенберга для невозмущенной системы. В соответствии с предыдущим мы можем двояко сфор- мулировать задачу о возмущениях: I. Определить вызван- ные возмущениями изменения в тех состояниях, в которых энергия Н невозмущенной системы определена. Эта фор- мулировка получает разумную физическую интерпретацию, если рассмотреть возмущение, действующее в течение интер- вала времени t2. В данном случае мы можем найти изменения вероятностей различных квантовых состояний под воздействием возмущения [22]. II. Определить кван- товые состояния и уровни энергии возмущенной системы, т. е. собственные значения и собственные пространства для Н. В частности, мы должны ответить на вопрос, каким образом расщепляются и смещаются термы под воз- действием возмущения. Сначала рассмотрим формули- ровку II. Разобьем эрмитову форму W на две части: К первой из них относятся те порции W, в которых собст- венные пространства fR', Э?", ... энергии Н скрещиваются сами с собой, а ко второй (V) — те порции, в которых скрещиваются два различных собственных -пространства. Если собственные значения Н имеют только конечную кратность, то задача приведения W' (той части W, в кото- рой 9t' скрещивается с собой) к диагональному виду имеет дело только с пространством 9t' конечного числа измере- ний. Если не одномерно, то появятся указанные выше резонансные явления. Система координат, состоящая из собственных векторов Н, теперь определяется более точно, так как в этом случае 1Г0 также становится диагональной матрицей; пусть Е„— собственные значения матрицы Н + + еГ0 = Н0, полученной таким способом. Единичное зна- чение терма Е', связанного с fR', вообще говоря, расщеп- ляется на столько различных собственных значений Еп оператора Но, сколько измерений имеет подпространство fR'. Остальная часть матрицы, т. е. V = [| vnm ||, такова, что vww = 0, если собственные значения Ет, Еп матрицы Н совпадают. Бесконечно малое унитарное вращение 6х = 8.Сх, C = ||cnJ, порядка е преобразует оператор Н в Н + 6Н, где §Н = 8(НС—СН) ~8(ЯС—СЯ).
§ 9. ТЕОРИЯ ВОЗМУЩЕНИЙ 117 Для того чтобы выполнялось равенство 6Н = — &V и мат- рица H = H04-eV переходила при этом преобразовании в Но, матрица С должна иметь компоненты стп = 0 при Ет = Еп и Г — Vmn ьтп р ___р в противном случае. Следовательно, если мы пренебрегаем членами порядка 82, то собственные значения Еп матрицы Но становятся уровнями энергии возмущенной системы с энер- гией Н. Величина 1Г0 может рассматриваться как среднее по времени от возмущающих членов, усредненное также по движениям невозмущенной системы. Действительно, из (8.7) следует, что среднее значение элемента amn(t) мат- рицы A (t), представляющей произвольную физическую величину системы, равняется атп при = и 0 в про- тивном случае. В статистике часто используются угловые скобки для обозначения среднего значения величины; по- этому мы можем записать г0=<г>, н0=<н>. Решение задачи II, очевидно, дает и решение задачи I. Для расчета влияния возмущения в течение ограниченного интервала времени удобно применить метод вариации постоянных—чем меньше 8, тем больший интервал мы можем выбрать. Предположим, что в момент времени / = 0 система находится в квантовом состоянии 0 и в этот момент начи- нает действовать возмущение; мы хотим определить веро- ятность того, что в момент времени t система будет обна- ружена в состоянии п. Таким образом, мы ищем решение уравнений = + (n = 0, 1, 2, ...), т которые в момент времени t = 0 сводятся к условиям х0 = 1, х1 = х2 = ... = 0. Если записать xn = ln-e(— v„t), то уравнения для принимают вид
118 ГЛ. И. КВАНТОВАЯ ТЕОРИЯ для 8 = 0 имеем = Пренебрегая членами порядка 82, мы можем взять в качестве нулевого приближения началь- ные условия ^=1, |1 = g2=...=0; подставив эти значения в уравнение, мы получим в ка- честве первого приближения равенства S" h vt — vn (v„¥=v0). При подстановке v0—vn = v требуемым выражением для вероятности будет [х„I2 (I)21 -c°s (vZ) I Wn0p = ==2ll-^(v/)1|H0np. (9.1) Следует заметить, что в соответствии с этим резуль- татом вероятность перехода из состояния 0 в состояние п определяется величиной | НОл |2. В случае резонанса (уп = v0) вероятность перехода вначале возрастает квад- ратично по t: § 10. Задача двух тел. Пространство-произведение Физическая система, состоящая из двух частиц с мас- сами т, т', координатами х, у, г; х', у', г' и импульса- ми р,- р', имеет гамильтонову функцию вида (Р2 + Ру + (Рх + Р? + Рг) + + V(x, у, г; х’, у’, z'), (10.1) где V—потенциальная энергия. Как и в старой физике центральных сил, мы принимаем, что имеем дело с дейст- вием на расстоянии, так что потенциальная энергия зависит только от мгновенных положений двух частиц. Очевидно, это предположение нарушается, если в соот- ветствии с теорией относительности мы принимаем в рас- чет конечную скорость распространения возмущения, что требует введения поля. Волновая функция системы ф бу- дет зависеть, кроме t9 от всех шести координат х, у,
$10. ЗАДАЧА ДВУХ ТЕЛ. ПРОСТРАНСТВО-ПРОИЗВЕДЕНИЕ 1 Щ х', у', z'; этим координатам соответствуют операторы, действующие на х|), а именно, операторы умножения на х, х', ..., а импульсам соответствуют производные (h/i) (d/dx), (Л//)(д/дх')> ... Из (10.1) мы получаем волновое уравнение —4-5- + ^-Лф + ^Д'ф-У.ф = 0. (10.2) I dt ‘ 2т т 2т т т \ / Мы должны определить вероятность одновременного по- падания первой частицы в точку Р и второй—в точку Р'. Соответственно плотность вероятности должна вычи- сляться для 6-мерного пространства с координатами х, у, z; х', у', г'. Действительно, волновое поле требуется не для того, чтобы явным образом описывать явления, имеющие место в физическом пространстве, а для того, чтобы определять вероятность появления частиц в опре- деленных положениях или с определенными энергиями или импульсами; следовательно, нет ничего абсурдного в том, что сферой действия этого волнового поля явля- ется такое абстрактное 6-мерное конфигурационное про- странство. Чтобы не зависеть в дальнейшем от этой специальной процедуры, посредством которой скалярная волновая ме- ханика собирает две системы я, Ь в одну систему с (как подсказывается этим примером с эрмитовыми формами, представляющими координаты и импульсы двух систем), мы сначала должны с чисто математической точки зрения рассмотреть умножение пространств. С каждым вектором j = (x/) в m-мерном пространстве и каждым вектором = в n-мерном пространстве © связан вектор j = jxt) с компонентами (10.3) в пг.ц-мерном пространстве $ = 9ix ©, называемом прост- ранством-произведением пространств 9t и © (13). Компоненты нумеруются здесь посредством индексной пары (i, k)=l. Совокупность векторов 3 = £ХЦ сама по себе не образует линейного многообразия, но их линейные комбина- ции заполняют все пространство S. С линейными отобра- жениями А в 91 и В в ©: 4 = Ук’ = ^Ьк,кук i k
120 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ связано линейное отображение С = ЛхВ в Зл x'i’y'k’ = 3 «i'A-Лг/л. i, k ИЛИ 4 = 2cnzz> = B=(G k), = £')]• / Этому закону умножения, очевидно, соответствует закон композиции (Л х В) (Л х х Вх) = (ААг х BBJ, где Л, Аг—отображения 91 в себя, а В, Вх— отображе- ния в ©. Системы координат в 9ft и © в совокупности определяют систему координат в если система коор- динат в 9i подвергается преобразованию Л, а система координат в © — преобразованию В, то система коорди- нат, связанная с ними в £, претерпевает преобразование Ах В. В соответствии с уравнением d(xiyk) = dxryk + xrdyk, инфинитезимальным отображениям Н в 9ft и J в © отве- чает инфинитезимальное отображение (Bxh) + (lzxJ) (10.4) в где через 1г, обозначены единичные матрицы в 9ft, © соответственно. Все предыдущее изложение применимо к произвольным векторным пространствам. Если простран- ства 9ft и © унитарны, то это имеет место и для поскольку согласно (10.3) выражение . 2zzzz=2^-2^ инвариантно, если инвариантны суммы ^УкУ^ Ах В унитарно, если унитарны Л и В. Соответственно две физические системы а и Б объеди- няются в общую систему с следующим образом. Прост- ранство состояний $ для с совпадает с 9ix©, где 9ft есть пространство состояний для системы а, а ©—для ь. Пусть произвольная физическая величина а в 9i пред- ставляется эрмитовой формой Л; при замене всех форм Л на Лх15, где —единичная форма в произвольном про- странстве ©, между полученными формами возникают в точности те же отношения, что и между формами вида Л, так что из решения квантовой задачи в 9ft получается и
§ 10. ЗАДАЧА ДВУХ ТЕЛ. ПРОСТРАНСТВО-ПРОИЗВЕДЕНИЕ 121 решение для соответствующей задачи в 9}х$, и между этими двумя решениями нет никакого реального отличия. Следовательно, в системе с, полученной путем композиции, мы должны связывать эрмитову форму Дх15 с величи- ной а из й, а 1гхВ—с |3 из Ь, где Д, В—формы, свя- занные с а, р в sJi, @ соответственно. Совокупность ве- личин составной системы с можно получить, если вели- чины, принадлежащие составляющим системам а и Ь, перемножить и сложить всеми возможными способами. Величины а из системы а коммутируют с величинами |3 из Ь, так как (Л х 1J (1гхВ) = ЛхВ = (1гх В) (Ах 1J. Мы выразим смысл этих двух последних предложений вкратце, если скажем, что с состоит из двух кинемати- чески независимых частей а и Ь. Две системы являются динамически независимыми, ес- ли энергия составной системы Н равна сумме энергий 7/(п, 7/(2) составляющих систем: Н = (Н^х\) + (\хН^. Инфинитезимальным унитарным отображением в полном пространстве состояний является тогда такое ото- бражение, которое возникает в результате действия ин- финитезимальных отображений ^--Я(1), в двух ис- ходных пространствах состояний [(10.4)]. Если Н{1) и Н{2) имеют диагональный вид, то и Н имеет диагональный вид, причем собственные числа определяются выражением Et == Ер 4 Ер или 4“Ч2) [/ = (Л &)]. Если полная система обладает чистым состоянием, представляемым вектором с с абсолютной величиной 1 и компонентами cik, и если Q = ||ga-,||— произвольная вели- чина в а, то математическое ожидание Q в чистом состо- янии с определяется по формуле <Q> = 2 Я H'&kk'CtkPi 'k' • Это выражение совпадает по виду с (7.2), если ввести Л II П I Д = || а ц / = । 2" и
122 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ Тогда A (j) является эрмитовой формой 212 cikxi |2 k I i I в пространстве 91. Но отсюда видно, что в а мы не по- лучаем чистого состояния, поскольку компоненты аа, в общем случае не будут иметь вид a{aif. Условия, гаран- тирующие максимум однородности в системе с, не тре- буют в этом отношении максимума для составляющей системы а. Более того: если состояние а и состояние b из- вестны, состояние системы с, вообще говоря, не определяется единственным образом, так как положительно определен- ная эрмитова форма ||а^, ^,|| в пространстве-произведе- нии, описывающая статистический ансамбль состояний с, не определяется единственным образом по эрмитовым формам O'ikti'k't 2^/Л, i к которым она приводится в пространствах 91, @. В этом важном вопросе квантовая теория разделяет точку зрения, что «целое является большим, чем сумма его частей», ко- торая недавно выдвигалась виталистами и гештальт-пси- хологами в качестве философского кредо. Кинематически независимые части, на которые может быть разбита система, не обязательно разделены в прост- ранстве и даже не обязательно относятся к разным час- тицам. Мы можем, например, разделить1 отдельную час- тицу, все физические величины которой выражаются через х, У> z\ РХу Ру, Pz> на ТРИ составляющие системы с фун- даментальными величинами х, рх\у, Py\z, pz, так как величины, принадлежащие разным составляющим системам, например, величины, выражающиеся только через х, рх и только через у, ру, коммутируют между собой в смысле матричного умножения. В теории возмущений мы обычно рассматриваем сис- тему, состоящую из двух кинематически независимых частей, которые являются почти независимыми и динами- чески. Пренебрегая на время взаимодействием eW, до- пустим, что hvn и hpr—уровни энергии этих двух частей, так что h(vn-i~pr) — уровни энергии полной невозмущен- ной системы. Записав в уравнении (9.1) s = (n, г) вместо
§ И. ПЕРЕСТАНОВОЧНЫЕ СООТНОШЕНИЯ 123 О и s' = (n', г') вместо п, так что V = (v„ + рг) — (v„< + pr,) = Vnn' + Ргг'\ Упп- = ^п—Уп', Ргг' = Рг— Рг'. мы находим вероятность того, что полная система пере- ходит за время t из состояния s в состояние s': 2 / 8 у 1 -c°s (V„n>+Prrz.I Ц7 (ПГ П7') 12. (Ю.5) (vnn' + Prr')2 1 л ' Если полная система первоначально находилась в состо- янии s=(n, г), то вероятность того, что через время t первая система будет найдена в состоянии п', получается из (10.5) суммированием по г'. § 11. Перестановочные соотношения. Канонические преобразования Построение волновой механики в §§ 1—3 выходит за рамки общей схемы § 7 и 8, так как в нем применялись некоторые конкретные эрмитовы формы для представле- ния координат и импульсов частицы. Теперь мы должны выяснить, как можно переформулировать эти общие по- строения инвариантным образом, без помощи какой-либо специальной системы координат в пространстве состояний. Для эрмитовых форм q, р, представляющих координа- ту в прямоугольной системе координат и связанный с ней импульс, мы определяем следующие перестановоч- ные соотношения’. pq—qp = ^\. (11.1) Если система имеет только одну степень свободы, то р и q выступают в классической механике как канонические переменные. Тогда все физические величины системы яв- ляются функциями р и q\ во избежание усложнений, мы ограничиваемся полиномами / от р и </, и принимаем, в частности, что гамильтонова функция Н также является полиномом. Что нам следует понимать под производными fp u fq or f по р и q теперь, когда р и q не коммутиру- ют при умножении? В любом случае нам следует тре- бовать, чтобы дифференцирование по q подчин ялос-
124 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ следующим правилам: (1) Pq = ®> <lq=b (2) (f + g)q = fq + gq и (af)q = a-fq, где а—число; (3) <Jg)q = fq-g + f-gr Сразу видно, что эти условия единственным образом опре- делят производную полинома /, если случайно не приведут к противоречиям. Но то, что они не приводят к противоре- чиям следует хотя бы из того, что этим условиям удовлет- воряет определение ih-fq = fp-p[. (П.2) Правило (1) следует непосредственно из перестановочных соотношений (11.1), а линейность (2) очевидна из постро- ения. Правило (3) доказывается формулой (fg) р—р (fg)=f (gp—pg) + (fp—pf) g, использующей только дистрибутивный и ассоциативный характер матричного умножения. Подобным же образом мы можем показать, что —ih-fp = fq—qf. (11.2') Из основного динамического закона для любой эрми- товой формы f следует, что выполняется уравнение (8:6): тзЬ Применив это уравнение к р и q (чего, очевидно, доста- точно для установления соответствующего результата для любого полинома f от р и q) и сравнив его с формулой (11.2), примененной к функции Н, мы приходим к обыч- ным гамильтоновым уравнениям классической механики: %=И„ (Ч-З) Универсальной чертой квантовой теории как раз и явля- ется сохранение всех соотношений классической механики; но в то время как последняя интерпретировала эти со- отношения как условия, которым в каждом отдельном случае подчиняются значения физических величин, первая интерпретирует их как условия на сами величины, а то- чнее на эрмитовы матрицы, представляющие их. Это —
§ 11. ПЕРЕСТАНОВОЧНЫЕ СООТНОШЕНИЯ 125 наиболее важная формулировка принципа соответствия Бора, которую дала новая квантовая теория. Перестановочные соотношения (11.1) достаточно при- мечательны. Они не могут выполняться для матриц в пространстве конечного числа измерений, и полностью исключают возможность того, чтобы в бесконечномерном пространстве форма q (или р) имела только дискретный спектр собственных чисел, поскольку при приведении q к его главным осям Р = \\Ртп II левая часть перестановочных соотношений имеет компо- ненты pmn{qn — qmy, следовательно, главная диагональ состоит только из нулей! Возникает вопрос, следует ли из (11.1), что формам, представляющим величины q и р9 можно всегда придать вид + со J хф (х) ф (х) dx, — 00 — 00 где ф — вектор с компонентами ф(х) в соответствующей системе координат в пространстве состояний системы. Мы увидим в гл. IV, § 15, что при некотором условии не- приводимости это действительно имеет место. Приняв во внимание наличие трех пространственных координат qa и связанных с ними импульсов ра (а=1, 2, 3), мы получим вместо одного перестановочного соотно- шения (Н.1) следующие [23]: РаРр—PfiPa. = 0. —<7р<7а = 0 для всех а, Р;' h (1 (а = Р), РаЯа Ч^Ра = —^а^ (а=#Р). (П-4) Эти же перестановочные соотношения применимы для случая нескольких частиц, причем единственным отличием является то, что а пробегает не 3, а 6, 9, ... значений, в соответствии с числом частиц. Эти правила являются необходимым и достаточным условием того, что динами- ческий закон, управляющий скоростью изменения во вре-
126 ГЛ. It. КЙАНТобАЯ ТЁОРИЯ мени вектора состояния х в пространстве состояний сис- темы, приводит к гамильтоновым уравнениям для «кано- нических переменных» qa, ра. представляющих координа- ты и связанные с ними импульсы различных частиц, составляющих физическую систему, — всякий раз, когда может иметь место зависимость гамильтоновой функции Н от этих величин. В классической механике гамильтоновы уравнения ин- вариантны относительно канонических преобразований [24]. В системе с f степенями свободы переход от набора переменных q^, pa, описывающих состояние, к набору 7а, Ра (а== 1, 2, ...,/) является каноническим пре- образованием. если разность ^P'adq'a — ^padqa (11.5) есть полный дифференциал. Например, если qrjC/ подверга- ются преобразованию qa=<(M, • ••, <?/)> не содержащему р'а, то для того, чтобы преобразование в целом было каноническим, величины ра должны пре- образовываться как компоненты «ковариантного вектора» в ^-пространстве («расширенное точечное преобразова- ние»): , V Ч Ра ₽ <VP₽' Вероятно, простейшим каноническим преобразованием яв- ляется такое, в котором q и р меняются ролями: Ра= 7а, 7а “Ра- Канонические преобразования образуют группу (см. гл. III, § 1), так как тождественное преобразование, т. е. пере- ход от (р, q) к (р, q)y является каноническим; обратное преобразование (/?', 7')—>(р, q) для канонического пре- образования (р, 7)—>(р', 7') является каноническим; а для канонических преобразований (р, q) (р', q'), (pf, q')—+(p”, q") результирующее преобразование (р, q) —> (р", q") также является каноническим, поскольку если сумма 2 Ра ^7а 2 Ра ^7а> 2 Ра ^7а 2 Ра ^Яа
§ II. ПЕРЕСТАНОВОЧНЫЕ СООТНОШЕНИЯ 127 образуют полные дифференциалы, то и их сумма 2 Ра dtfa 2 р<* также является полным дифференциалом. Инфинитезимальным каноническим преобразованием называется такое преобразование, в котором р', q' отли- чаются от р, q бесконечно мало. Мы будем рассматривать его как бесконечно малую деформацию 2/-мерного (р, <?)- пространства, происходящую за бесконечно малый интер- вал времени 8 = 8t. Введем компоненты бр, 8q вектора смещения посредст- вом равенств Ра —= —<7а = 8-6<7а. Поскольку выражение (11.5) должно быть полным диф- ференциалом, то выражение + S qadpa=dT (11.6) также должно быть полным дифференциалом; в нашем случае Т должно отличаться от 2Ах?а только на беско- нечно малую величину. Следовательно, мы можем записать т = PaQa—^S; а если рассматривать S как функцию ра и q^, то в согла- сии с (П.6) мы имеем dS , dS ра-ра qa-qa ИЛИ (И.7) Так как мы можем с полным основанием пренебречь чле- нами порядка в2, то члены q'a, qa в правой части этих равенств оказываются тождественными. Величину S мы называем производящей функцией инфинитезимального канонического преобразования. В соответствии с гамильтоновыми уравнениями состоя- ние системы, представленное точкой (р, q) в (р, ^-прост- ранстве, переходит в состояние (р + ^р, q + dq) за время dt. Если мы осуществляем этот переход для всех допусти- мых начальных состояний (р, q), то получаем бесконечно
128 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ малую деформацию пространства, точки которого пред- ставляют состояние системы. Гамильтоновы уравнения утверждают, что эта деформация является инфините- зимальным каноническим преобразованием с производящей функцией H-dt. Из этого без каких-либо вычислений сле- дует, что гамильтоновы уравнения имеют смысл, не зави- сящий от какого-либо частного выбора канонических пере- менных. Итак, в квантовой теории гамильтоновы уравнения (11.3) показывают, что вектор состояния j в пространстве состояний претерпевает бесконечно малое унитарное вра- щение dx=-^-Hb (8.1) следовательно, инфинитезимальное каноническое преобра- зование р, q получается здесь путем бесконечно малого вращения аргумента j в представляющих р и q эрмито- вых формах: Мы находим, что приращения величин ра, qa имеют вид е • (Sqa—qaS), е • 8ра = (Spa—paS), и это в точности согласуется с (11.7) в силу перестано- вочных соотношений (11.4). Производя конечное канони- ческое преобразование путем последовательного примене- ния бесконечного числа инфинитезимальных канонических преобразований, мы получаем, что унитарные отображе- ния пространства состояний на себя в квантовой теории’. = £4 отвечают каноническим преобразованиям классической ме- ханики. Точнее, этот результат применим только для тех отображений, в которых матрица U выражается через матрицы р и q, но в настоящее время мы можем обойти вопрос, любую ли матрицу U можно получить, точно или хотя бы приближенно, таким способом. Так как переста- новочные соотношения (11.4) остаются неизменными при вращениях нормальной системы координат, то они спра- ведливы и для произвольного набора канонических пере- менных. Это следует также из того, что перестановочные соотношения выражают условия приводимости динамиче-
§ 12. ДВИЖЕНИЕ ЧАСТИЦЫ В ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 129 ского закона (8.1) к гамильтоновым уравнениям dqa _ дН dpa _ дН dt ~дра ’ dt дра • 1 ’ Слабым звеном общего метода квантовомеханического рассмотрения физической системы является то, что выра- жение для энергии через канонические переменные должно быть взято из классической модели, и, кроме того, даже в этом случае переход к квантовой механике не является однозначным, так как модель не дает ответа на вопрос, следует ли интерпретировать одночлены типа p2q как p*q, pqp, qp* или как линейную комбинацию этих трех выражений (см. гл. IV, § 14). Очевиден предварительный характер нашей процедуры, но результаты, достигнутые до сих пор, по-видимому, укрепляют надежду на то, что путь, которым мы идем, приведет к однозначной форму- лировке законов для реальных физических явлений. Далее нам следует подробнее заняться общемеханическими пост- роениями (14). § 12. Движение частицы в электромагнитном поле. Эффект Зеемана и эффект Штарка Пусть теперь пространственные координаты х, у, г обозначаются через xlt х3, х3, а время t—через х0. Если Ф—скалярный, а —векторный потенциал электромаг- нитного поля, то в теории относительности они являются компонентами вектора в пространстве, двойственном к 4-мерному миру: (—Ф, 91х, Яг) = (Фо, Ф1, Ф», Ф8). Пусть р д<рз Эфа . “Р ~ дха дхе ’ величины F10, Fg0, FM—это компоненты напряженности электрического поля 6, a c(FM, F31, Fit)—компоненты напряженности магнитного поля •£). Если обозначить компоненты скорости частицы через их, v3, v3, то ее соб- ственное время определяется выражением ds = / dt*—(dxt 4- dxf4-dxl)/c*= = dt К1 —u4/c2 (О? = v\ 4- vl 4-щ).
130 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ С мировым вектором иа == dxjds связан двойственный вектор иа с компонентами иг-=-иг (г=1, 2, 3), и0 =—с2и°. Инвариантные уравнения движения для частицы массы т и заряда — е имеют вид |3=о или + (t- = l, 2, 3). (12.1) X /?=i / Правая часть этого выражения является фактически пондеромоторной силой [»,$]). Уравнения (12.1) получаются из гамильтоновой функции Я = е<Ро + с]/ + 2 (Р/ + еф1)\ (12.2) F /=1 в которой х2, x3; plt р2, р3—канонические переменные. Из гамильтоновых уравнений __ dxi ___дн __ c(pi + e^i) ut — dt dPi ~ у----------- следуют равенства Pi + e^i^tnu^ в остальных уравнениях ( 8 1 б/р/ _ _ <9ф0 . у Pk+^k di ~~ dxi “ | дх^ ”r 6 дх{ у--------j левая часть имеет вид _ d (тщ) I I у dw n 1 dt дф0 dxk ’ ‘ Но это и есть требуемое уравнение (12.1):
§ 12. ДВИЖЕНИЕ ЧАСТИЦЫ В ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 131 Энергия со знаком минус —Н представляет собой временную компоненту р0 двойственного вектора, пространственными составляющими которого являются компоненты импульса p = (Px, pt, pt), так что уравнение (12.2) может быть записано в более простом виде 3 (Ро + вфо)3—X (pi + e<Pz)2 = т*сг- i = 1 Из этого уравнения мы получаем простое правило: влия- ние электромагнитного поля на частицу заряда —е может быть выражено путем замены величины ра на ра -f- е<ра в уравнениях движения для свободной частицы. При переходе к квантовой теории ра превращается в оператор 4- д!дха и становится контрагредиентным к 4-мерному смещению dxa, как видно из равенства а Теперь наше правило формулируется следующим образом: при введении поля потенциала фа в волновом уравнении частицы оператор зД- должен заменяться на Д- + -т-фа. (12.3) дха дха h ' 7 Только произведение фф имеет простой физический смысл; поэтому следует принять, что законы, управляющие ве- личинами ф, остаются инвариантными при замене ф на еА-ф, где X—любая вещественная функция положения в пространстве—времени. С другой стороны, в классиче- ской теории электромагнитного поля только напряжен- ности полей, а не их потенциалы, имеют объективный смысл, т. е. законы инвариантны при замене фа на Фа—др/дха, где р—также произвольная функция ха. Проверив наше волновое уравнение по отношению к этим свойствам инвариантности, мы находим, что между X и р должна существовать определенная связь. Полевые уравне- ния для потенциалов ф и ф материальных и электромаг- нитных волн инвариантны при одновременной замене ip на и а на
132 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ здесь. А.—произвольная функция пространственно-временных координат. Этот «принцип калибровочной инвариант- ности» полностью аналогичен принципу, ранее установ- ленному автором путем умозаключений при рассмотрении вопроса о переходе к единой теории гравитации и элект- ричества [25]. Теперь же я полагаю, что эта калибровоч- ная инвариантность связывает вместе не электричество и гравитацию, а электричество и вещество способом, опи- санным выше. Мы обсудим этот принцип более тщательно в гл. IV; тогда его значение и толкование станут более понятными. Перейдя в (12.2) к пределу с—> оо и выделив множи- тель тс2, мы приходим к обычной механике: Н = е<Ро + 2^Ц(р/ + еф‘)2’ i Пренебрегая членами, квадратичными по фг, мы обнару- живаем кроме члена, соответствующего кинетической энергии SPi/2w, еще и член, соответствующий потен- i циальной энергии V = -e <12-4) Мы уже использовали в § 5 правую часть, относящуюся к электрическому полю. Если кроме поля, порожденного ядром, мы имеем однородное электростатическое поле в направлении оси г с напряженностью F, для которого <р = —F-г, то оно добавляет к энергии возмущающий член W = eF-z. Однородное статическое магнитное поле <£) получается при векторном потенциале с91=у[$г], где г = (х, у, г); оно добавляет к энергии член возмущения т. е. * <12-5> Эффект Зеемана. — Если напряженность однородного магнитного поля величины |,’о| направлена по оси г, то
$ 12. ДВИЖЕНИЕ ЧАСТИЦЫ В ЭЛЕКТРОМАГНИТНОМ ПОЛЕ 133 возмущающий член равен W = ho-Lz, о = (12.6) При выборе собственных функций ф$’ в качестве нашей системы координат в пространстве состояний функций ф величина W, так же как и энергия невозмущенного атома, приобретает диагональный вид; в состоянии, определяемом числами п, I, т, член W имеет значение ho-rn. (12.7) Согласованные с правилами отбора для т компоненты (n, I, т)—+(п', V, т'), на которые расщепляется линия частоты v = — (E„i—Еп,1Г), сводятся только к трем ли- ниям: первая линия, соответствующая всем переходам т —► т, линейно поляризована в направлении оси г и не смещена; другая—с круговой поляризацией, перпендику- лярной к оси z, ее частота смещена на -|-о (т —>-т—1); третья линия поляризована по кругу в противоположном направлении и имеет частоту v—о, а не v (т—*-т+1). Этот нормальный эффект Зеемана обнаруживается только в так называемых синглетных линиях. Эффект Штарка.—В соответствии с общей теорией возмущений смещение и разрешение термов в присутствии однородного электрического поля определяется, до членов первого порядка, матрицей eF-<z>. Вследствие правила отбора I —+1 ± 1 имеем <z> = 0, если случайно не совпадут все уровни энергии, азимутальные квантовые числа которых различаются на 1. Игнорируя этот исключительный случай, мы не обнаружим никакого эффекта возмущения первого порядка, возрастающего ли- нейно с увеличением напряженности поля F (линейный эффект Штарка), а найдем только гораздо более слабый квадратичный эффект. Это находится в согласии с экспе- риментальными данными для щелочных атомов. Водород, однако, соответствует вырожденному случаю, так как для него уровни энергии с одинаковым главным квантовым числом и /=0, 1......п—1 совпадают. Расчеты для этого случая были проведены Шредингером и сравнивались с экспериментом [26].
134 гл. п квантовая Теория § 13. Взаимодействие атома с излучением Если следовать Джинсу, то излучение черного тела математически эквивалентно излучению системы бесконеч- ного числа осцилляторов. Уравнения Максвелла для сво- бодного эфира имеют вид div.!o = 0, rot© + — -^- = 0; ’ 1 с dt ’ div(£ = 0, rot.б— — 4^- = 0. ’ ° с dt Для того чтобы упростить эти соотношения, мы предпо- лагаем, что стенки излучающей полости объема V — отра- жающие-, напряженность @ при этом перпендикулярна стенкам на границах полости. Так как черное тело покоится, то нет никакой необходимости проводить расчеты реляти- вистски инвариантным образом; поэтому мы можем нор- мировать векторный потенциал с81 таким образом, чтобы скалярный потенциал обратился в нуль. Тогда мы полу- чим равенство @=—4^-, причем уравнения первой стро- ки удовлетворяются при <§ = c-rot8I, а уравнения второй строки превращаются в равенства div8l = 0, Д81-±^=0. На границе потенциал 81 нормален к стенкам. Пусть собст- венные числа и собственные функции уравнений да+^-а=о, div§i=o с граничным условием нормальности потенциала §1 к гра- нице обозначаются через v = pa ОО), 81а [а=1,2, 3, ...] и нормированы в соответствии с условием J (О1р) сП/ = 4л6а(3. Полагая 81 = 2>-8О
§ 13. ВЗАИМОДЕЙСТВИЕ АТОМА С ИЗЛУЧЕНИЕМ 135 где коэффициенты qa зависят от времени, но не от поло- жения, мы находим для них уравнения d2qa р^“ = о. При введении, помимо ср, величин dcp/dt = ра это уравне- ние превращается в уравнение для осциллятора с гамиль- тоновой функцией #а = 4(/’“)2 + 4-Р“^“)2; ПОЛОЖИВ а а мы непосредственно получаем, что энергия поля излуче- ния определяется выражением V а при этом доказана теорема Джинса. Для высоких частот р в интервале (р, p + dp) имеется приблизительно мод колебаний [27]. Наибольший интерес для нас пред- ставляет случай бесконечно большой полости; там спектр становится непрерывным, и наша формула для плотности частот оказывается точной. При квантовании этой механической системы бесконеч- ного числа осцилляторов [28] в соответствии с теорией осциллятора (§ 3) и процессом композиции (§ 10—но см. замечание на стр. 142) мы находим возможные квантовые состояния s, для каждого из которых существует некото- рое целое число па 0, связанное с каждым индексом а. В этом квантовом состоянии справедливо равенство = (па + 1/2), а при выборе такой аддитивной постоянной в формуле для энергии, при которой низшее значение энергии излу- чения черного тела равняется 0, это уравнение превра- щается в равенства //% = na-/ipz, Н = а
136 гл. II. КВАНТОВАЯ ТЕОРИЯ На языке фотонов это означает, что полость в состоянии s содержит па фотонов каждого типа а. Матричный эле- мент [$ = пъ п2, .па, s'=n[, п'2, .... п’а, ...] равен нулю, если только не выполняются все равенства = п2 = п2, п'3 = п„, ..., за исключением равенства па = па, которое следует заме- нить на zia = na+l или п„ = па—1. В первом случае в соответствии с (8.12) мы имеем (fa, = 1/"~ Чт;4'"'' (испускание), (13.2) а во втором— (fa, = 1Л~ (поглощение). (13.2') ' zPa Первый переход s —> s' состоит в том, что возникает фо- тон типа а, второй состоит в исчезновении одного такого фотона. Из изложенного выше следует, что в переходе, для которого (fa.^O, все другие де., должны равняться нулю. Пусть атом с фиксированным ядром и электрическим дипольным моментом q взаимодействует с полем излуче- ния. Будем различать квантовые состояния атома посред- ством индекса п и обозначим соответствующие энергии через ftv„; тогда q = || q„n, ||. Квантовое состояние полной системы, состоящей из атома и излучения, характеризу- ется квантовыми числами п; пь п2, ..., па, ... В соответствии с уравнением (12.4) предыдущего па- раграфа, воздействие излучения на атом задается в пер- вом приближении возмущающим членом = (<$). Можно показать, что добавление такого члена к гамиль- тоновой функции полной системы, согласно классической теории, не только укажет,’ на влияние, оказываемое на атом полем излучения, но также видоизменит уравнения Максвелла таким образом, что они будут учитывать влия- ние движения электронов в атоме на поле излучения. При
$ J3. ВЗАИМОДЕЙСТВИЕ АТОМА С ИЗЛУЧЕНИЕМ 137 этом возмущающий член будет вызывать как испускание, так и поглощение. Если мы ограничимся излучением, дли- на волны которого велика по сравнению с размерами ато- ма, то с достаточной степенью точности мы можем для потенциала 31 брать его значение в точке, занимаемой ядром. Тогда мы имеем равенство аМЙШ (13.3) а Стсюда следует, что элемент e-Wns>n,s, может отличаться от 0 только в случае таких s и s', что все — а принимает значение, равное па ± 1. При этом в сумме (13.3) фигурирует только а-й член, и мы имеем e^ns, n's' = (qnn'3la)-<7ss'- (13.4) В данном случае может не удовлетворяться правило час- тот Бора, утверждающее, что испускание или поглощение фотона в состоянии а с энергией Лра связано с кванто- вым переходом атома, в котором теряется или приобре- тается энергия ±/i(vn—vn,) = hpa. Конечная полость имеет свои собственные частоты, и поэтому частоты полной сис- темы могут не соответствовать частотам, связанным с кван- товыми переходами атома. Это в принципе верно, но по существу, как мы видели, условие частот Бора выпол- няется с очень хорошей точностью в подавляющем боль- шинстве всех переходов-, и это тем более справедливо, чем больше полость. Пусть атом находится в состоянии п, а излучение — в состоянии s={na}. Мы полагаем 2Кй.=М/(р)ф, (13.5) где сумма в левой части распространяется на те индек- сы а, для которых ра лежит между р и р + Ф‘. отсюда величина U (р) dp является плотностью энергии излучения, содержащегося в области частот р, р + ф. В соответствии с (10.5) вероятность того, что атом окажется через вре- мя i в состоянии п', определяется выражением S' Излучение фотонов, в соответствии с уравнениями (13.2),
138 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ (13.4), дает следующий вклад в эту сумму: 2 1 — cos {ynnf ра) t h (па + 1) | w W /и с \ Zi2 2L (vnnz_pa)2 * 2ра I I ’ <13-Ьи) а а поглощение— 2 1 cos (упгт + ра) t hna |Qf \ |2 riQ£ \ 7? 2-----(v„„; + paP—-2^-K<U'Az)|. (I3.6n) а Рассмотрим вначале случай, когда уровень терма vn, выше vn; тогда величина vnn, — vn—vn, = — v становится отрицательной. Сгруппируем все члены а из суммы (13.6П), для которых ра лежат между р и р + ф. Так как вслед- ствие изменений, вызванных испусканием фотонов, поло- жение атома точно определить нельзя, то для малых длин волн мы можем заменить член на его среднее значе- ние 4n/V, вычисляемое из условия нормировки J dV = — 4п, и принять, что все направления для 31а равноверо- ятны. Среднее значение квадрата | (2laq) | скалярного про- изведения с фиксированным вектором q тогда равняется -^••|q|2 и (13.6П) приобретает вид 1 — cos (р—v) t 4л | qnn< |2 Pa (р—v)2 3 V 2р« Введя приближение (13.5), можно с хорошей точностью заменить сумму (13.6П) на интеграл 4л |qnn-|2 С 1 — cos(p — v)t U (р) dp 3 й2 J (р-v)2 * р2 ' Так как время t велико по сравнению с длительностью колебания 1/v, то, по существу, в значение этого инте- грала вносят вклад лишь те элементы, для которых р лежит вблизи частоты v. При разложении и (р) =. и (у) , Р2 V2 Т • • ' по степеням разности р—v первый член разложения дает следующий вклад в интеграл: L^ldx = nt.^. (13.7) — oo
§ 13. ВЗАИМОДЕЙСТВИЕ АТОМА С ИЗЛУЧЕНИЕМ 139 всеми остальными членами следует пренебречь. Подобным же образом мы пренебрегаем всем выражением (13.6И), поскольку знаменатель (p + v)2 никогда не равен нулю. Это означает, что данный переход почти неизменно связан с поглощением фотона, частота которого лежит очень близко к v. Вероятность того, что по прохождении вре- мени t атом будет находиться в более высоком состоя- нии п', возрастает пропорционально t\ вероятность то- го, что имеет место переход п—+п за единицу времени, выражается множителем \2=^.U(v)\a 12 3 (Av)2 l4rw 1 З/i2 V^IOnn'l • Эта формула была получена для случая, когда состоя- ние п' обладает большей энергией, чем п. В противопо- ложном случае существенна лишь сумма (13.6И), соответ- ствующая испусканию. Здесь мы полагаем vnn, = vn—vn,= = v и получаем аналогичную формулу с единственным различием: вместо па мы теперь имеем na+ 1, или вместо суммы (13.5) сумму 2М«а + 1)Ра= 2Л«аРа+ 2^Ра • а Первая сумма равна V • U (р) dp, а вторую мы обозначаем через V-u(p)dp. Эта вторая сумма принимает значение, равное (ftp), умноженному на число мод колебаний по- лости в интервале частот р, p4~dp; отсюда, с учетом (13.1), имеем V-u(p)dp==V-^g-, и (V) = 75^3- Вероятность того, что за единицу времени атом, пе- рейдет из состояния п в более низкое состояние п.’, опре- деляется по формуле 4тг2 —_.[4/(Т)+ы(у)]|Ппп,|2ф Дополнительный член и (v) характерен для спонтан- ного излучения. В том случае, когда излучение не вклю-
140 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ чено в черное тело, т. е. не существует плотности излу- чения U (v), вероятность того, что за единицу времени атом перейдет из состояния п в более низкое состояние п' при испускании фотона, частота которого лежит непосред- ственно в окрестности v = v„—vn,, равняется 3ftc® ’I Qnn' I2 Это согласуется с формулой, полученной интегрированием (8.11) по всем направлениям. Вероятность того, что атом перейдет с уровня п на более высокий уровень п' (уп, > > v„) при тех же самых условиях равна нулю. В энергетическом поле излучения черного тела мы находим не только поглощение, но также и «вынужденное излучение», причем оба процесса пропорциональны плот- ности энергии U (v). При подстановке а тгЭТ । |2 = "за*” ’ ^ntv । (13.8) вероятность перехода из состояния п в более высокое состояние п' за единицу времени записывается в виде (y = vn,— v„), (13.9) а вероятность обратного перехода, т. е. падения из п' в п, в виде ®n-n = ^n'n[^(v)4-«(v)] (13.9') Так как ЦЦпп'11 является эрмитовой матрицей, то мы имеем (13.10) Если в поле излучения находится несколько атомов, а система в целом находится в стационарном состоянии, то
§ 13. ВЗАИМОДЕЙСТВИЕ АТОМА С ИЗЛУЧЕНИЕМ. 141 в среднем количество атомов, переходящих из л в л', равно числу атомов, переходящих обратно из л' в л. Если обозначить число атомов в состоянии л через Nn, эти рассуждения выражаются условием Am,-N„U (v) = An,n-Mn, [(/ (v) + и (v)] или 'Vn_1 , и (v) Nn,'~'U (v) • (13.11) Коэффициенты вероятностей Апп, = Ап,п полностью исчезли или, точнее, почти полностью исчезли, поскольку урав- нение справедливо лишь в предположении, что Апп. =£0 или qnn, =/= 0, т. е. переход пт^.п' не должен быть за- прещен правилами отбора. Но для подобных систем, на- ходящихся в тепловом равновесии, как показал Больцман, Nn должно быть пропорционально величине g—EnlkQ —— £— hVn/kQ где 0—температура, a k—постоянная Больцмана. Урав- нение (13.11) тогда превращается в формулу: , t и (у) е ~ + и (V) ’ или в формулу излучения Планка: U(y) =___“(v) • и ehv/k9 _ । ’ эта формула справедлива для всех частот v, энергиями которых могут обмениваться поглощающие или испускаю- щие атомы в соответствии с условием частот Бора [29]. Таким образом, в конце мы вернулись к историческим истокам квантовой теории. Теперь мы должны сделать три замечания к этому (принадлежащему Дираку) иссле- дованию обмена энергией между веществом и излучением. Во-первых, оно способно объяснить то, что спектральные линии не являются резкими, а обладают естественной шириной [30]. Во-вторых, мы должны выяснить, чем вызвано это различие между поглощением и испусканием, процес- сами, которые преобразуются друг в друга при изменении направления времени. Действительно, ведь фундаменталь- ные законы механики и теории поля инвариантны отно- сительно преобразования t-+— Л Ответом является сле- дующее: это различие возникает, цз-зд появления пред-
142 ГЛ. II. КВАНТОВАЯ ТЕОРИЯ почтительного направления во времени при применении теории вероятности', мы выбираем фиксированное началь- ное состояние и рассчитываем, с помощью вероятностей переходов, распределение по различным состояниям в бо- лее позднее время, а не распределение, которое возникло бы из уравнений для более раннего времени. Если не де- лать никаких предположений относительно этого пред- почтительного направления, то величину t следует заме- нить на |/| в (13.7). Наконец, допустимость использова- ния уравнений Максвелла как классических уравнений движения и их квантования может вызвать серьезные сомнения, поскольку в нашей общей формулировке урав- нения Максвелла уже являются квантовомеханическими волновыми уравнениями для фотона! Однако в гл. IV, § И мы увидим, что этот метод применим при переходе от одной корпускулы к неопределенному числу корпускул. Вследствие того, что число фотонов должно оставаться неопределенным—так как фотон, в отличие от электрона, может появляться и исчезать, — метод композиции, описан- ный в § 10, к фотонам не применим.
ГЛАВА III ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ § 1. Группы преобразований К понятию группы—одному из старейших и наиболее глубоких математических понятий—пришли путем абстра- гирования понятия группы преобразований [1]. В основе теории преобразований лежит понятие точеч- ного многообразия, т. е. множества элементов, называе- мых нами точками, на которые действуют эти преобра- зования. Такое точечное многообразие может быть как совокупностью конечного числа различных элементов, так и бесконечным множеством—в частности, континуумом, таким как пространство или время. Отображение S точечного многообразия на себя определяется законом, который связывает с каждой точкой р многообразия точку р', называемую образом: р --> р' —Sp\ два отобра- жения S и Т тождественны, если для всех точек р оба образа Sp и Тр совпадают. Если точечное многообразие содержит конечное число элементов, то отображение S можно определить явно, задавая образ для каждой точ- ки р; однако для бесконечных множеств установить такую связь можно только заданием закона для функции S. Среди множества таких отображений имеется, в част- ности, одно, которое связывает с каждой точкой р ее саму: р—+р-, оно называется тождественным отобра- жением I. Два отображения можно применять после- довательно: если первое переводит произвольную точку р в р' = Sp, а второе—точку р' в р" = Тр', тогда отобра- жение, получающееся композицией этих двух, определя- ется как соответствие p-+p” = T(Sp) и обозначается TS (читать справа налево!). Это результирующее отображение зависит от порядка двух сомножителей S и Т. Для того чтобы такая композиция была возможна, существенно,
144 гл. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ что рассмотренные отображения отображают точечное многообразие на себя, а не на другое точечное много- образие. Мы будем рассматривать только взаимно однозначные отображения S: т. е. образы р' = Sp, соответствующие различным точкам р, всегда будут различны, и каждая данная точка р' будет возникать как образ одной (и только одной) точки р. Следовательно, такое взаимно однозначное отображение S: р—+р' определяет второе, обратное к S, преобразование S'=S-1: р' ->-р, которое в точности сокращается с ним: S'(Sp) = p, S(S'p') = p' или S-!S = /, Обращение отображения S-1 есть снова S, а тождествен- ное отображение / является своим собственным обраще- нием. Результирующее отображение TS двух взаимно однозначных отображений S и Т взаимно однозначно, а его обращение есть (ТS)-1 = S~1T~1, ибо обращение це- почки р—>~р'—* р" дает р" —>р' —р. Впредь мы будем рассматривать только такие отображения, называемые также преобразованиями или подстановками, которые являются взаимно однозначными. Согласно сказанному выше в этом случае имеются две фундаментальные опе- рации: обращение и композиция. Примеры. — 1. Пусть точечное многообразие состоит из отдельных элементов; приведем их в определенный порядок, пронумеровав целыми числами 1, 2, ..., п. (1.1) Эта нумерация выражается взаимно однозначным обрати- мым отношением между элементами точечного многообра- зия и целыми числами или различными «положениями» q в ряде (1.1). Перестановка заключается в переходе от одного такого упорядочения к другому. Если мы желаем действовать в пространстве, мы можем считать положения фиксированными ячейками, в которые могут помещаться подвижные элементы, или, наоборот, мы можем считать элементы фиксированными и сдвигать относительно них подвижные числа. С каждой перестановкой можно свя- зать взаимно однозначное отображение р—* р', которое показывает, какой элемент р' занимает после замены по- ложение, ранее занятое элементом р. Поскольку метод нумерации является условным, то данная перестановка есть не что иное, как это взаимно однозначное отображе-
§ 1. ГРУППЫ ПРЕОБРАЗОВАНИЙ 145 ние. Это понятие должно пониматься именно таким обра- зом, когда мы имеем дело с композицией или последова- тельным применением перестановок. 2. Кинематический пример группы дают движения материи, заполняющей пространство, в частности, движе- ния твердого тела. Положения или числа из предыду- щего примера здесь представляются материальными точ- ками, а точечное многообразие есть само пространство. Взаимно однозначное отображение р—гр' связывает на- чальное состояние с конечным: та материальная точка, которая первоначально покрывала пространственную точ- ку р, перемещается движением в точку р'. Конгруэнтные отображения пространства на самого себя мы также бу- дем коротко называть «движениями» в геометрическом смысле. Теперь нетрудно сформулировать понятие группы преобразований. Мы понимаем под этим любую сис- тему @ преобразований некоторого заданного точечного многообразия, которая является замкнутой в смысле сле- дующих условий: 1. Она содержит тождественное преобразование; 2. Если S принадлежит ®, то его обращение S-1 так- же принадлежит ®; 3. Результирующее преобразование TS двух любых преобразований S и Т из ® также принадлежит @. В качестве примеров мы назовем: группу всех п! пе- рестановок п предметов, множество конгруэнтных отобра- жений или «движений» трехмерного евклидова простран- ства, множество однородных линейных преобразований п переменных с отличными от нуля определителями (аффин- ные отображения «-мерного векторного пространства) и группу всех унитарных преобразований в п измерениях. Если точка р переходит в р' под действием преобра- зования из группы ®, то говорят, что р' эквивалентна р (относительно группы ®). То же самое понятие применя- ется, когда мы рассматриваем не точку р, а фигуру, со- стоящую из точек. Выраженные на этом языке три усло- вия, определяющие группу, представляют собой не что иное, как три аксиомы эквивалентности: 1. р эквивалентно р; 2. Если р' эквивалентно р, то р эквивалентно р'\ 3. Если р' эквивалентно р, а р" эквивалентно р', то р" эквивалентно р.
146 ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Согласно Эрлангенской программе Ф. Клейна [2] лю- бая геометрия точечного многообразия базируется на не- которой конкретной группе преобразований @ этого много- образия; фигуры, эквивалентные относительно ®, которые поэтому можно переводить одну в другую преобразованием из ®, должны рассматриваться как одинаковые. В евкли- довой геометрии эту роль играет группа преобразо- ваний конгруэнтности, состоящая из движений, упомя- нутых выше, а в аффинной геометрии — группа аффинных преобразований и т. д. Такая группа выражает спе- цифическую изотропность или однородность пространства; она состоит из всех взаимно однозначных «изоморфных отображений» пространства на себя, т. е. преобразований, которые не затрагивают такие объективные отношения между точками пространства, которые можно выразить геометрически. Симметрия конкретной фигуры в таком пространстве описывается подгруппой из ®, состоящей из всех преобразований группы ®, которые переводят эту фигуру в себя. Искусство орнаментальной фрески, созданное египтянами, явно содержит значительные зна- ния о теоретико-групповой природе; здесь мы находим, возможно, старейшие в человеческой культуре фрагменты математики. Но лишь недавно мы сумели ясно сформу- лировать формальные принципы этого искусства; попытки в этом направлении делались уже Леонардо да Винчи, который пытался дать общий и систематический обзор различных типов симметрий, возможных в строительстве. Однако наиболее замечательные симметричные структуры проявляются в кристаллах, симметрия которых описыва- ется теми преобразованиями конгруэнтности евклидова пространства, которые переводят атомные решетки кри- сталлов в совпадающие с ними. Прежде именно в этой области было самое важное применение теории групп в естественных науках. К настоящему обсуждению естественным образом при- мыкают следующие рассуждения. Пусть точечное много- образие М, на котором действуют преобразования S группы ®, отображается на точечное многообразие N, посредством взаимно однозначного отображения Л: p—+q\ особенно важным является случай, когда это отображение служит для введения новой нумерации или новых коор- динат. Посредством отображения А многообразия М на N преобразование S, действующее на М, становится преоб- разованием Т многообразия N; в упомянутом выше част-
§2. АБСТРАКТНЫЕ ГРУППЫ И ИХ РЕАЛИЗАЦИЯ 147 ном случае Т — просто описание преобразования S в но- вых координатах. Очевидно, что композиции преобразо- ваний S соответствует композиция преобразований Т мно- гообразия N и что группа ® преобразований S переходит в группу преобразований Т. Связь между этими дву- мя преобразованиями имеет вид Т = Л5Л"1, (1.2) ибо, если мы обозначим преобразование S через р—>р' и если q и q'— точки N, связанные с точками р и р' отображением Л, то преобразование q—> qr многообра- зия N осуществляется по цепочке q—>р-^р' -+q'. Мы можем также написать $ — Л®Л~Т. В частности, эти рассуждения применяются, когда N и М являются одним и тем же точечным многообразием. § 2. Абстрактные группы и их реализация Любое число преобразований данного точечного мно- гообразия можно применять последовательно. Конечно, мы обязаны не ограничиваться лишь двумя преобразова- ниями, но когда мы шаг за шагом совершаем этот про- цесс, он автоматически сводится к последовательности композиций одновременно двух преобразований: АВС... = А[В (С...)]. Эта возможность выполнения расширенной композиции по шагам, включающим только два преобразования одновре- менно, показывает, что выполняется закон ассоциативности (АВ)С = А (ВС) для любых трех преобразований Л, В, С. Структура группы преобразований получается отсюда абстрагированием, т. е. когда мы позволяем самим преоб- разованиям превратиться в элементы произвольной при- роды, сохраняя лишь их индивидуальность и правила, согласно которым два данных преобразования составля- ются в некотором заданном порядке, чтобы образовать третье. Согласно сказанному выше такая композиция с не- обходимостью подчиняется закону ассоциативности. Воз- можно, она, кроме того, подчиняется другим универсаль- ным законам, но поскольку мы в настоящий момент не
148 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ имеем никаких признаков этого, мы предпримем форму- лировку абстрактной структуры такой группы в виде следующих определений: Абстрактная группа есть система элементов, в ко- торой закон композиции задается так, что с его помощью из любых двух одинаковых или различных элементов этой группы а и Ь, взятых в данном порядке, возникает эле- мент Ьа. При этом должны выполняться следующие ус- ловия: 1. Закон ассоциативности c(ba) = (cb)a. 2. Должен существовать элемент I (единичный эле- мент), который оставляет неизменным любой элемент а в композиции с ним: Ja — al =а. 3. Для каждого элемента а должен существовать об- ратный элемент а~\ который в композиции с ним дает единичный элемент I: аа~1=а~1а = \. Такая абстрактная группа не должна смешиваться со своей реализацией преобразованиями, т. е. взаимно одно- значными отображениями заданного точечного многообра- зия. Реализация состоит в сопоставлении каждому эле- менту а из абстрактной группы преобразования Т (а) точечного многообразия таким образом, что композиции элементов группы соответствует композиция соответст- вующих преобразований: Т (Ьа) — Т (Ь)Т (а). (2.1) Из этого следует, что единичному элементу I соответст- вует тождественное преобразование /, а обратным элемен- там отвечают обратные преобразования: Т(а-1) = Т-1(а). (2.2) Первое утверждение следует из частного случая равен- ства (2.1) Т (а)Т (1) = Т (а) при помощи левой композиции с обращением преобразо- вания Т (а): соотношение (2.2) содержится тогда в (2.1) как частный случай 6 = а_д. Говорят, что реализация является точнрй, когда различным элементам группы соответствуют
§ 2. АБСТРАКТНЫЕ ГРУППЫ И ИХ РЕАЛИЗАЦИЯ 149 различные преобразования: Т (а) =/= Т (Ь) при а =£ Ь. Согласно фундаментальному равенству (2.1) необходимым и достаточным условием «точности» является то, что пре- образование Т (а) будет тождественным только, если а — единичный элемент. В самом деле, если а и Ь—два эле- мента группы, то из Т (а)=Т (Ь), т. е. Т (а) Т-1 (Ь) = Т(а)Т (1г1) = Т (air1) = /, следует, что при этих условиях = т. е. а = Ь. Если абстрактная группа получается из группы преобразова- ний ® абстрагированием, то ®, напротив, является точ- ной ее реализацией. При изучении групп преобразований мы всегда имеем дело с двумя многообразиями: бесструктурным точечным многообразием и многообразием элементов группы, струк- тура которого выражается законом композиции. Таким образом, первоначальная задача сама распадается на две: исследование возможных различных групповых структур и исследование возможности получения реализаций дан- ной абстрактной группы с помощью преобразований дан- ного точечного многообразия. Историческое развитие этого предмета показало, что такое разделение на две задачи полезно, поскольку они имеют принципиально различный характер и требуют принципиально различных математи- ческих средств для их исследования. Понятие абстрактной группы (впредь мы будем назы- вать ее просто группой) уже в силу самого способа ее введения служит исключительно для осознания групповой структуры; природа же ее элементов несущественна. Это абстрагирование от природы элементов математически вы- ражается понятием изоморфизма. Если у нас есть две группы g, fl' и с каждым элементом а из g связывается элемент а' из д' взаимно однозначным образом: a~^Za', причем (Ьа)'=Ь'а', (2.3) то говорят, что эти две группы являются просто изо- морфными. Просто изоморфные абстрактные группы не дают возможности отличить одну от другой. Ясно, что понятие изоморфизма можно применять к группам преоб- разований. Две изоморфные группы преобразований можно рассматривать как точные представления одной и той же
150 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ абстрактной группы. Группа может быть изоморфна сама себе, тогда говорят, что она автоморфна. Такой автомор- физм возникает, когда g и д' совпадают, т. е. когда между элементами группы g осуществляется взаимно однознач- ная обратимая связь удовлетворяющая усло- вию (2.3). Возникает вопрос: обладает или нет каждая абстракт- ная группа точной реализацией? Если бы это было не так, то понятие абстрактной группы в развитом выше виде было бы слишком широким—существовали бы, в добавление к закону ассоциативности, другие чисто формальные законы для композиции преобразований, которые выполнялись бы в каждой группе преобразований. Наоборот, доказатель- ство реализуемости любой абстрактной группы говорило бы нам, что все то, что можно сказать о формальных за- конах композиции преобразований, содержится в наших определениях (1) — (3). Действительно, мы можем построить точную реализацию любой абстрактной группы д, выбрав в качестве точечного многообразия само групповое много- образие и поставив в соответствие каждому элементу а группы преобразование s —► s' — as группового многообразия на себя. Эта «левая трансляция» ta есть, очевидно, взаимно однозначное обратимое преоб- разование, которое имеет в качестве обращения преобра- зование s = a“1s'. Если а и b—различные элементы, то соответствующие преобразования ta и tb различны, ибо они переводят единичный элемент I в различные элементы: а и b соответственно. Если мы выполняем последовательно две левые трансляции s —> s' — as, s' —* s" = bs , то результирующее преобразование, в силу закона ассо- циативности, имеет вид s —> s = b (as) = (ba) s. Следовательно, левая трансляция действительно образует точную реализацию абстрактной группы. Однако правые трансляции ведут себя иначе. В самом деле, если мы обо- значим отображение s—>s' = sa группового многообразия на себя через t* (а), мы вместо (2.1) получим равенство f(ta) = f(a) t*(b).
§ 3. ПОДГРУППЫ И КЛАССЫ СОПРЯЖЕННЫХ ЭЛЕМЕНТОВ 15! § 3. Подгруппы и классы сопряженных элементов Подгруппой д' данной абстрактной группы g является множество элементов, содержащихся в д, которое само удовлетворяет условиям группы: единичный элемент I принадлежит д', вместе с а ему также принадлежит а"1, а вместе с а и b—элемент Ьа. Эти три условия можно свести к одному: если а и b — любые два элемента д', то ta-1 также принадлежит д'. Обычно мы предполагаем, что выделяемая система содержит не только элемент I, однако другой предельный случай, когда д' совпадает с д, будет включаться в понятие подгруппы. Примеры найти нетрудно. В группе евклидовых дви- жений содержится, например, группа вращений (которая оставляет неподвижной одну точку — центр) и группа перемещений. Унитарные преобразования образуют под- группу полной группы всех однородных линейных пре- образований; четные перестановки — подгруппу группы всех перестановок. Если мы имеем дело с группой преобразо- ваний ®, то все преобразования из ®, которые оставляют неподвижной точку р (т. е. которые переводят р в себя), составляют подгруппу ®р. Вместо точки р неподвижным элементом может быть любая составленная из точек фигура; преобразования подгруппы либо должны оставлять непод- вижной фигуру в целом (т. е. они должны переводить каждую точку этой фигуры в какую-либо другую точку этой же фигуры), либо, что является более жестким огра- ничением, они оставляют неподвижными все точки фигуры. Кроме того, можно получать подгруппы группы ®, исполь- зуя инвариантные функции вместо инвариантных фигур. Если ф(р)— произвольная функция положения на точеч- ном многообразии с элементами р, мы с преобразованием S: р—* р' связываем функцию ф', определяемую равен- ством ф' (/?') = ф(р), и мы говорим, что она получается из ф преобразованием S. Если р’ = Spt р" = Тр‘, то ра- венства 1|)(р) = 1|>' (/) = (/) показывают, что композиция переходов ф —> ф' и ф' —> ф", соответствующих S и Т, образует переход ф —> ф*, соот- ветствующий TS. Теперь рассмотрим все преобразования S из ®, которые переводят ф(р) в себя, т. е. для которых равенство ф(5р) = ф(р) выполняется тождественно по р; они образуют подгруппу группы ®, а ф(р) является
1Б2 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ инвариантом группы $. Таким способом’мы можем вы- делить вращения из однородных линейных преобразова- ний, потребовав^ инвариантности единичной квадратичной формы. Подгруппы, содержащиеся в конечной группе g, которая описывается заданием каждого ее элемента -и явным заданием результата композиции каждых двух элементов, можно получить путем последовательного про- смотра. Каждому элементу а группы g соответствует цикличе- ская подгруппа, обозначаемая (а): ..., а~я, а~\ а° = 1, а, а\ ..., (3.1) элементы ап которой определяются по индукции из ра- венств а° = 1, а"+х = а"а. Эти элементы действительно образуют группу, ибо для целых показателей п и т мы имеем ап+т = апаЛ. При этом (а) является наименьшей подгруппой, содержа- щей а, т. е. ее элементы являются общими для всех под- групп группы g, которые содержат а. Элементы множества (3.1) могут быть либо различными, либо—что должно быть в случае, если g конечная группа,— должны цикли- чески повторяться через h членов: элементы I, а, ая, ... ..., о*-1 различны, а аА=I. Число h называется порядком элемента а. Порядком конечной группы называется число ее эле- ментов; порядок элемента а соответственно совпадает с порядком циклической подгруппы (а), порожденной эле- ментом а. Говорят, что группа коммутативна или абелева, если композиция ее элементов подчиняется пра- вилу ba — ab. Так, циклические группы—абелевы. Если а пробегает подгруппу I) группы g, соответст- вующие (левые) трансляции ta образуют группу преобра- зований, просто изоморфную I), точечным многообразием которой является групповое многообразие. Мы говорим, что два элемента s и s', эквивалентные относительно этой группы преобразований, (лево-) эквивалентны относитель- но I), и отражаем эту ситуацию записью «' = s относи- тельно 1)»; это условие выражается так: s'— as, где а — некоторый элемент I).
§3. ПОДГРУППЫ И КЛАССЫ СОПРЯЖЕННЫХ ЭЛЕМЕНТОВ 153 Таким способом элементы группы g разделяются на множества элементов, эквивалентных относительно I). Если число таких множеств конечно, оно называется индексом подгруппы Ij в группе д. Если g—конечная группа, то число элементов в каждом из этих множеств задается порядком подгруппы I), так как различные трансляции ia переводят s в различные элементы: as=/=bs, если а^Ь. Следовательно, порядок подгруппы f) является делителем по- рядка'группы д, а частное от деления этих двух чисел равной индексу I). Рассуждения в конце § 2, развитые для групп пре- образований, подсказывают вторую реализацию абстракт- ной группы д. Мы ставим в соответствие элементу а ото- бражение s—*-s, — asa~1 (3.2) группового многообразия на себя. Это отображение, кото- рое мы называем «сопряжением» £а, является обратимым, взаимно однозначным и имеет в качестве обратного ото- бражение s = a-1s'«. Закон композиции выполняется, так как из s—►s'^asa-1, s' —<- s’ = bs'b~1 мы получаем произведение s* = basa~1b~1 = (ba) s Говорят, что элементы s и s' группы g сопряжены, если они эквивалентны относительно группы всех сопряжений. Таким образом, вся группа разделяется на классы, причем каждый элемент одного из классов сопряжен с любым другим элементом того же самого класса. Когда мы гово- рим о некоторых классах внутри группы, не определяя их точнее, мы подразумеваем под ними классы сопряжен- ных элементов. Реализация группы g группой сопряжений является, вообще говоря, «суженной» больше, чем точная реализа- ция. В частности, сопряжение fe совпадает с тождеством, если а коммутирует со всеми элементами s группы. Сово- купность всех таких элементов «"называется центром группы; он, ^очевидно, является абелевой подгруппой группы д. Но этот недостаток сопряжения*перед транс- ляцией компенсируется одним преимуществом: сопряжение есть изоморфное отображение группы на себя, которое оставляет инвариантным единичный элемент и которое сопоставляет каждой подгруппе I) группы g другую, со-
154 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ пряженную подгруппу я!)#-1. Эти факты, выражающиеся равенством a (st) а'1 = (asar1) (ata'1), уже содержались неявно в конце § 1. Говорят, что I) есть самосопряженная или инвариантная подгруппа, если она совпадает со всеми своими сопряженными под- группами. Важность этого последнего понятия лучше всего ил- люстрирует следующая Теорема. Если I) — инвариантная подгруппа, и = озна- чает эквивалентность относительно I), то из s' = s, l' = t следует, что s't' ==st. (3.3) Чтобы доказать это, мы заметим, что равенства s' = as, t' —bt (а и b принадлежат l)) дают st' = asbt = (ac) (st), (3.4) где f = sbs-1 принадлежит l) вместе c b. Поскольку ас лежит в I), наше утверждение доказано. Легко видеть, что инвариантная природа подгруппы I) является как не- обходимой, так и достаточной для справедливости (3.3). Имея дело с инвариантной подгруппой I), нам не надо различать правую и левую эквивалентность относительно I) — в самом деле, на этом основывалось приведенное выше доказательство. Мы можем, если пожелаем, считать эквивалентные эле- менты не отличающимися друг от друга, применяя прин- цип определения путем абстрагирования, однако, позволив, таким образом, объединиться эквивалентным элементам вместе, мы, вообще говоря, лишаемся группового свойства. Тем не менее согласно доказанной выше теореме оно все еще сохраняется, если I) —инвариантная подгруппа. Группа, получающаяся из g отождествлением всех эквивалентных относительно I) элементов, называется фактор-группой g/I); ее порядок есть индекс инвариантной подгруппы I) группы д. Эти понятия являются вспомогательными при иссле- довании способа, которым группу можно «сузить» при построении реализации. Пусть преобразование Т (а) задан- ного точечного многообразия на себя соответствует эле- менту а абстрактной группы g в рассматриваемой реали- зации. При этом Т (а) = Т (а') тогда и только тогда, когда
М. ПРЕДСТАВЛЕНИЯ ГРУПП 155 а получается из а композицией с элементом е (т. е. а'~еа), для которого Т (е) является тождеством. Такие элементы е, очевидно, образуют подгруппу I) группы д, поскольку из Т(е) — 1, Т(е') = 1 следует, что Т (ее) = Т (е) Т (е) --= /. В действительности I) является инвариантной подгруппой, ибо если Т (е) — тождество, то же справедливо и для Т (аеа~г) — Т (а) Т (е)Т~2 (а) = Т (а) Т"1 (а). В любой реализации абстрактной группы g группой преобразований элементы некоторой инвариантной под- группы 1) группы g соответствуют тождественному пре- образованию; два различных элемента сопоставляются од- ному и тому же преобразованию тогда и только тогда, когда они эквивалентны относительно I). Эта группа пре- образований является, следовательно, точной реализацией фактор-группы g/f). § 4. Представления групп линейными преобразованиями Потребовав, чтобы преобразования, реализующие эле- менты данной абстрактной группы д, были линейными и однородными, мы приходим к задаче, которая является наиболее плодотворной с математической точки зрения и в то же самое время чрезвычайно ценной для квантовой механики; в таком случае мы говорим о представлении группы, а не о реализации [3]. Любое n-мерное представ- ление группы g, или представление степени п, состоит в сопоставлении каждому элементу группы s аффинного преобразования U(s) n-мерного векторного пространства Dt = Dt„ таким образом, чтобы эти преобразования подчи- нялись закону композиции U(s)U(t) = U(st). (4.1) В таком случае мы говорим, что s индуцирует преобра- зование U(s) в пространстве представления DI. После вы- бора определенной системы координат в Di каждое пре- образование U(s) представляется квадратной матрицей из п строк и столбцов, определитель которой не равен нулю. После замены первоначальной системы координат другой, получаемой при помощи преобразования А, отображение, которое сперва представлялось матрицей U(s), теперь пред- ставляется матрицей AU(s)A~l Следовательно, если соот-
156 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ ветствие s —<- U(s) является представлением, то соответствие s—+AU(s)A~l, очевидно, является им тоже; говорят, что это последнее представление эквивалентно первому. По существу они одинаковы, отличие заключается только в выборе системы координат, посредством которой они описываются. Примеры.— Одномерное представление заключается в приписывании каждому элементу s из группы отличного от нуля числа %(s) таким образом, чтобы Х(*О = Х(«)Х(О- (4.2) В частности, %(1) = 1. Самое тривиальное одномерное представление получается приписыванием каждому s зна- чения 1, т. е. % (s) = 1. Этот частный случай называется тождественным представлением. Рассмотрим следующий пример так называемой сим- метрической группы, т. е. группы всех fl пере- становок f предметов. Соответствие s->6,=i± 1, согласно которому s есть либо четная, либо нечетная пе- рестановка, определяет одномерное представление, так называемое «знакопеременное» представление группы л. В самом деле, характер 65, устанавливающий различие между четными и нечетными перестановками, удовлетво- ряет равенству 8st = 8s’8t- Пусть g— конечная циклическая группа порядка h; тогда ее элементами s являются 1, а, а2, ..., а*-1, причем аА=1. Рассмотрим одномерное представление s—*x(s)» в котором х(а) = е. Тогда условие (4.2), опре- деляющее представление, говорит нам, что элементам s этого ряда соответствуют числа 1, 8, 82, . . ., 8*-1 и что а* соответствует 8й. Следовательно, 8й = 1; поэтому г должно быть корнем /i-й степени из единицы, и закон, опреде- ляющий представление, имеет вид аг --&г (г = 0,1,2, ...). Наоборот, когда 8 является произвольным корнем Л-й сте- пени единицы, это соответствие определяет одномерное
§ 4. ПРЕДСТАВЛЕНИЯ ГРУПП 157 представление группы д. Таким образом, мы получили полный перечень всех возможных одномерных представле- ний циклической группы. Единственным примером многомерного представления, который мы предлагаем в настоящий момент, является следующий тривиальный случай. Если g сама является группой линейных преобразований n-мерного векторного пространства 91, то соответствие s —>s определяет п-мер- ное представление группы д. Этот пример более содержа- телен, чем может показаться на первый взгляд. Действи- тельно, нам приходится делать следующее: сперва мы выводим структуру группы д, абстрагируясь от группы линейных преобразований, а затем возвращаемся к перво- начальной реализации посредством соответствия s —► s между элементами s абстрактной группы, с одной стороны, и линейными преобразованиями s—с другой. Понятие эквивалентности имеет более общий смысл, чем тот, который обсуждался выше. Можно обратиться к произвольной системе S линейных отображений U на п-мерном векторном пространстве 91. Нам не нужно пред- полагать, что эти отображения имеют обратные, т. е. что они имеют отличные от нуля определители и что они соот- ветствуют элементам s некоторой группы, как в случае представлений. При выражении этого множества отобра- жений U в новой системе координат каждая матрица U переходит в матрицу U' = AUA~1-, таким образом систе- ма 2 преобразуется в эквивалентную систему 2', состоя- щую из элементов U'. Здесь А — некоторая фиксированная несингулярная мат- рица. Рассмотрим отображение U пространства 91 на себя. Говорят, что линейное подпространство 91' из 91 инва^ риантно относительно U, если векторы из 91' преобра- зуются под действием U в векторы из 91'. Если 91'—ин- вариантно, то пространство 91 (mod 91'), получаемое проеци- рованием 91 вдоль 91', также является инвариантным (ср. гл. I, § 2, в частности, рис. 1). Если 91' инвариантно, то U порождает отображение U' пространства 91' на себя; при этом мы говорим, что U индуцирует U' на 91'. То же относится к пространству, полученному проецирова- нием. Теперь мы переходим от отдельного отображения U к системе отображений 2. Говорят, что подпространство 91' инвариантно относительно 2, если оно инвариантно относительно каждого преобразования U из 2. Описание
158 гл. 111. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ пространства 0? посредством системы координат, приспособ- ленной к инвариантному подпространству 31', приводит одновременно все матрицы U системы 2 к виду, изобра- женному на рис. 1, стр. 26. Система 2 называется непри- водимой, если 31 не содержит инвариантных относительно нее подпространств, кроме самого 3i и пространства О, состоящего только из вектора 0. Далее нам представится случай привести пространство 31 таким образом, чтобы каждая отделившаяся составляющая была неприводимой относительно заданной системы 2. Это требует построения последовательности подпространств 0, 3i\, 3i2, 3i\-3i, (4.3) начинающейся с 0 и заканчивающейся пространством 31, в которой каждый член содержится в последующем, и про- странства 3lz (mod 3i /_ 0 неприводимы. Естественно, 3i । должно быть на самом деле больше, чем Э?/_ г, а не просто совпадать с ним. Смысл этого приведения проще всего увидеть при помощи матриц отображений системы 2, если приспособить систему координат к «композиционному ряду» (4.3), т. е. выбрать сперва систему координат в 3i\ и, пополняя ее дополнительными базисными векторами, полу- чать поочередно координатные системы в 3f2, 3i3, ... и т. д. Говорят, что система 2 вполне приводима, если 31 можно разложить на два подпространства 3i' + 3i", каж- дое из которых инвариантно относительно 2, причем ни одно из них не содержит только нулевой вектор. Это понятие полной приводимости глубже понятия простой приводимости. Если описывать 3t в подходящей системе координат, то каждая матрица U из 2 принимает вид, изображенный на рис. 2, стр. 26. Таким образом, мы сталкиваемся с задачей разложения 31 (или 2) на составляю- щие, ни одна из которых не является вполне приводимой, т. е. с задачей разложения 3i = Зц + • • • + 3^ на инва- риантные подпространства, ни одно из которых не яв- ляется вполне приводимым. Часто оказывается, что из приводимости следует пол- ная приводимость, т. е. что во многих случаях справед- лива теорема: Если 31'—инвариантное подпространство в 31, то можно найти второе инвариантное подпростран- ство 31" такое, что 31 полностью приводится (относительно 2) к 31'+ 31". Мы скоро увидим, что это в самом деле так в случае, когда 31 — унитарное пространство, а 2—система унитарных преобразований
§ 5. ФОРМАЛЬНЫЕ ПРОЦЕССЫ. РЯД КЛЕБША — ГОРДАНА 159 В гл. I, § 3 было показано, что если система 2 при- водима, то система 2* «транспонированных» отображений двойственного пространства на себя тоже приводима. Если <!р: s —*- U (s) есть n-мерное представление группы д, то транспонированные отображения U* ($) не образуют пред- ставления; однако нетрудно увидеть, что, перейдя к контра- гредиентным преобразованиям й (s) — [U* (s)]"1, мы получаем представление s —* U (s) в двойственном век- торном пространстве, называемое контригре диентным представлением § 5. Формальные процессы. Ряд Клебша— Гордана Непрерывные группы являются, возможно, простей- шими примерами в теории групп преобразований. В част- ности, мы рассмотрим группу с = с;! всех линейных одно- родных преобразований s набора п переменных х$, ... ,х„ с неравными нулю определителями; мы считаем каждый набор величин х( вектором в n-мерном векторном про- странстве г = г„. Классическая теория инвариантов, перво- начально развитая в Англии примерно в середине прош- лого столетия, занималась, в частности, представлениями группы с, индуцированными на коэффициентах произволь- ных форм переменных х,-. Квадратичная форма этих пере- менных является линейной комбинацией п(п+ 1)/2 линейно независимых произведений под действием линейного преобразования s переменных х{ эти произведения под- вергаются линейному преобразованию [s]2, а соответствие s —> [s]2 есть, очевидно, п (п+ 1)/2-мерное представление [с]2 группы с. Преобразование s переменных х{ переводит про- извольную квадратичную форму в квадратичную форму от новых переменных, где коэффициенты a'ik получаются из aik при помощи некоторого линейного преобразова- ния s2, связанного с s; очевидно, s2 является контрагре- диентным к [s]2. Поэтому квадратичную форму, описывае- мую фиксированным набором п(п-[-1)/2 коэффициентов aik,
160 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ можно рассматривать как вектор в пространстве соответ- ствующего числа измерений, а преобразование s перемен- ных х{ индуцирует в этом пространстве преобразование s2. Следовательно, пространство, определенное как совокуп- ность n-арных квадратичных форм, является точечным многообразием группы линейных однородных преобразова- ний, которые поэтому образуют представление группы с. Так же мы можем поступить с кубическими, квадрати- ческими, ..., f-ическими формами. Совокупность одночле- нов порядка f полностью описывается формулой • • • Хпп, (5.1) где f{—неотрицательные целые числа, сумма которых равна f: /1 + f2 + ••• + fn — f- Они образуют субстрат представления [с/ с числом из- мерений Г п j_п («+1) ... (п 4-/—1) L f J П2Т777 • Мы, однако, можем показать, что существуют представ- ления, которые формально даже проще представлений, возникающих из теории форм. Пусть (хг) и (у{)—два про- извольных вектора в нашем n-мерном пространстве г; рассмотрим произведения xtyk. Если х{ и у,- подвергаются одному и тому же преобразованию s из с (переход к новой системе координат), то п2 произведений претерпевают опре- деленное линейное преобразование s х s, соответствующее s, а отображение s—»-sxs является «’-мерным представле- нием (с)2 группы с. Далее: говорят, что система чисел F (t, k), зависящих от двух индексов i, k, которые пробегают значения 1, 2, ..., п, является тензором второго порядка, если под действием преобразования s пространства г числа F (i, k) преобразуются точно так же, как произведения xtyk координат двух произвольных векторов j, у из г. Следовательно, тензоры порядка 2 являются субстратом представления (с)2 группы с. Представление (с)2 включает представление [с]2, которое индуцируется в подпростран- стве симметрических тензоров порядка 2; тензор с компо- нентами F (t, k) называется симметрическим, если F(i, A) = F(Z>, i).
§ 5. ФОРМАЛЬНЫЕ ПРОЦЕССЫ. РЯД КЛЕВ1ПА - ГОРДАНА 161 В геометрии антисимметрические тензоры, т. е. тен- зоры, компоненты которых удовлетворяют условию F (i, fe)= = —F(k, I), играют более важную роль, чем симметри- ческие. В частности, два произвольных вектора (xt) и (у{~) определяют элемент поверхности с компонентами x{i, k}=x{yk—xkyt. Однако лишь п(п —1)/2 из этих величин являются линейно независимыми, например те, для которых i < k. Если ком- поненты Х( вектора j и компоненты yt вектора подверг- нуть одному и тому же преобразованию s, то компоненты элемента поверхности, образуемого ими, подвергнутся п(п—1)/2-мерному линейному преобразованию {s}2. Ото- бражение s —► {s}2 есть представление {с}2, субстратом которого является совокупность антисимметрических тен- зоров порядка 2. Следовательно, представление (с)2 при- водится к представлениям [с]2 и {с}2, так как любой тен- зор F(i, k) можно, очевидно, записать в виде F(i, fe) = |[F(i, k) + F(k, 0] +4l^(‘. k)—F(k, 0], т. e. единственным образом представить как сумму его симметрической и антисимметрической частей. То, что эта редукция корректна, подтверждается еще тем, что размер- ности удовлетворяют соотношению 2_п(п + 1) п(п—1) П " 2'2 Аналогично три произвольных вектора J, 1), 3 опре- деляют трехмерный элемент объема с компонентами x(i, k, /) = Xi Xk Xi У1 Ук У1 (5-2) Эти элементы образуют субстрат представления {с}8 с чис- лом измерений п ) _ п (п— 1) (п— 2) з / “ ПГз • Поступая таким образом, мы можем построить 4-, 5-, ... ..., п-мерные элементы; этот процесс должен закончиться «-строчными определителями, так как определитель вида (5.2) с более чем п строками обязательно тождественно равен нулю.
162 ГЛ. in. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Мы увидим, что представления группы с, субстратами которых являются симметрические и антисимметрические тензоры порядка /, неприводимы, и фактически решим общую задачу: осуществим полное приведение представле- ния (с/, индуцированного группой с в пространстве всех тензоров порядка /, на его неприводимые составляющие (гл. V). На самом деле, понятие тензора базируется на х -умно- жении, введенном в гл. II, § 10. Если т переменных подвергнуть преобразованию Л, а п переменных — пре- образованию В, то тп произведений х$к подвергнутся преобразованию Ах В. Считая xt компонентами произволь- ного вектора $ из m-мерного пространства аук— ком- понентами вектора I) из 9in, произведения xryk можнд рассматривать как компоненты вектора $ х I) в /пп-мерном векторном пространстве Э^х^л. Следовательно, из двух представлений группы g & s-+U(s), s—+U'(s) (5.3) /пип измерений, соответственно, возникает новое, /пп-мер- ное представление, которое мы обозначим через s —> U (s)x Uf (s). (5.4) Эта процедура представляет собой общий метод получения нового представления $x$z из двух данных представле- ний $ и Если представление s —> s линейной группы с ненадолго обозначить через (с), то представлениями группы с, суб- стратами которых являются тензоры 2, 3, .. . порядков, будут (с)х(с) = (с)2, (с)х(с)х(с) — (с)3, ... Возможно, нам следовало бы обсудить сложение+^вух представлений прежде умножения х. Рассмотрим пере- менные Xi и yk как компоненты одного вектора $ в (/п + ^)- мерном векторном пространстве; если подвергаются преобразованию Л, а ук — преобразованию В, то эти т-\~п переменных претерпевают некоторое преобразование (Л, В), Следовательно, из (5.3) мы получаем представление £ + £': s-^[U(s), U'(s)] т-\~п измерений. Обращением этого процесса является полное приведение, так как описанное выше представле- ние <§ + £/ вполне приводимо к двум компонентам £) и Другой важный формальный метод заключается в сле- дующем: любое У-мерное представление Г n-мерной линей-
§ 5. ФОРМАЛЬНЫЕ ПРОЦЕССЫ. РЯД КЛЕБША - ГОРДА НА 163 ной группы можно использовать для построения Димер- ного представления любой абстрактной группы g из ее n-мерного представления Представление Г связывает линейное преобразование U пространства N измерений с линейным преобразованием и, действующим в п-мерном пространстве, поэтому, если «!р: $—+ и есть n-мерное пред- ставление группы g с элементами s, то s —> и —> U является Димерным представлением s —> U группы д, кото- рое мы можем обозначить через Г(£>). Благодаря этому обстоятельству представления линейной группы имеют боль- шое значение для общей теории представлений. Возьмем в качестве Г представление группы с, субстратом котброго может, например, являться двойственное векторное про- странство, пространство всех тензоров порядка 2, про- странство симметрических или антисимметрических тензо- ров порядка 2; тогда из представления Ад абстрактной группы g мы получим контрагредиентное представление $ в первом случае и соответственно представления [$х$], {£ X <§} в остальных. Итак, имеются три важнейших формальных процесса: (1) сложение, (2) х-умножение и (3) Г-процесс. Первые два из них образуют новое представление из одного или двух заданных, а третий порождает новое представление из одного заданного. Первые два процесса очерчены полностью, тогда как третий содержит общий метод, по- скольку Г может быть любым представлением линейной группы сп. Если д' — подгруппа группы д, то любое представление s—группы g содержит представление группы д'; нам нужно лишь, чтобы элемент s пробегал подгруппу д'! Это, в свою очередь, можно считать формальным процес- сом (4), который порождает представление группы д' из данного представления группы д. Рассмотренное х -умножение встречается также в иной связи. Пусть заданы две группы д, д'. Пары (s, s'), пер- вый член s которых является элементом группы д, а вто- рой s' — элементом группы д', мы можем рассматривать как элементы новой группы дхд', называемой прямым произведением групп д и д', если задать закон умно- жения (s, s')(/, /') = (s/, s'/').
164 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Порядок группы gxg' равен произведению порядков групп g и д'. Если s —> U (s) есть n-мерное представление группы д, а s' —> U' (s') есть n'-мерное представление группы д', то соответствие (s, s') -> U (s) х U' (s') (5.5) является, очевидно, n-n'-мерным представлением группы дх д'; мы обозначим его (с жирным X)- Это построе- ние можно разбить на два этапа. Сначала вводится пред- ставление (s, s') и (S) группы gxg'; нет причины, по которой нам нельзя было бы обозначить его той же буквой что и представление s —* U (s) группы g,— в самом деле, мы привыкли обозна- чать функцию /(х), рассматриваемую как функцию двух переменных х, у, той же буквой, что и функцию f(x) одного переменного х. Таким образом, U (s) и V (s') должны рассматриваться как функции одной и той же переменной—пары (s, s'), и, следовательно, представление X группы gxg' можно получить обычным х -умно- жением из представлений $ и Соответственно это раз- личение жирного X и обычного х является чисто фор- мальным. Примеры. Унимодулярная группа в двух измерениях. Пусть g = с = с2 состоит из всех линейных преобразо- ваний s двух переменных х, у: х' = ах + Ьу, у' =cx + dy, (5.6) определитель которых ad—be — 1 («унимодулярные» линей- ные преобразования) *). Однородный многочлен переменных х и у порядка f является линейной комбинацией f+1 одночленов xf, xf~xy, ..., xyf~\ yf. (5.7) Под действием s эти одночлены подвергаются линейному преобразованию, которое мы обозначали выше как [s]/; они образуют субстрат (/+1)-мерного представления [с]Л s —► [s] f, которое теперь мы обозначим через <£/. Пред. *) Символ сп будет обычно обозначать группу всех несингуляр- ных линейных преобразований в п измерениях; тем не менее он иногда будет использоваться для обозначения более узкой унимодулярной группы, и в таком случае это ограничение будет явно оговариваться
§5. ФОРМАЛЬНЫЕ ПРОЦЕССЫ. РЯД КЛЁБША — ГОРДАНА 165 ставление (£/ неприводимо, хотя это нам еще нужно доказать. Мы можем в пределах группы с ограничиться подгруп- пой Cj «главных» преобразований, которые действуют на каждую переменную в отдельности: х' = ах, у' = ~У, (5.8) где а =4= 0—произвольная константа. Группа Cj является абелевой. Преобразование (5.8) умножает одночлены систе- мы (5.7) соответственно на числа af, af~2, ..., а~</-2), a~f. Связав число аг с элементом (5.8) группы сь мы получим одномерное представление, которое временно обозначим (S<r ’; здесь г может быть любым фиксированным целым показа- телем. Мы только что видели, что если ограничиться под- группой сь неприводимое представление б/ группы с2 полностью приводится к сумме/4-1 одномерных представ- лений ®(г) с r — f, f—2, ...,—f. Это есть пример про- цесса (4). В качестве примера умножения и сложения мы рас- смотрим задачу разложения произведения двух представлений и группы с на неприводимые компо- ненты. Решение этой задачи дает формула = , (5-9) V где v без повторений принимает значения из ряда v = f + g, f + g-2, \f-g\ , (5.10) уменьшаясь при этом на 2 от члена к члену. Это равен- ство, в сущности, тождественно ряду Клебша—Гордана, который играет столь важную роль в теории инвариантов бинарных форм. В следующих главах мы увидим, что правомочно считать его основополагающей математической формулой для классификации атомных спектров и для тео- рии валентной связи. Для доказательства нужно показать, что справедливо равенство (^х^^-Н^-хХ^). (511)
166 ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ поскольку тогда (5.9) следует из математической индукции и из того очевидного факта, что Новая система координат в пространстве представления (£/ получается заменой базиса (5.7) семейства однородных многочленов степени f другим базисом. В этом смысле мы можем сказать, что многочлены степени f образуют субст- рат представления Тогда субстратом представления (£fx($,g является совокупность многочленов Ф = Ф(х, у; Т]), зависящих от компонент двух произвольных векторов (х, у), (|, л), причем однородных степени f по первому аргументу и однородных, но степени g,— по второму; тогда полная степень f + g = h. Таким образом, многочлены Ф являются линейными комбинациями (/+ 1) (gf-4- 1) одночленов xQ/fe.£lr)x, где = i-\-n = g. (5.12) Оба вектора преобразуются когредиентно под действием одного и того же преобразования s вида (5.6). Задача заключается в полном приведении пространства многочле- нов Ф к двум подпространствам (Ф)о и (Ф)', которые яв- ляются субстратами представлений и соот- ветственно. Изучим сначала структуру этих двух под- пространств. (Ф)о. Разложим по степеням неопределенных коэффи- циентов а, р выражение (ах + Ру)/(а^ + Рт])г = = ал-Ф0 + ( j )аА-1₽-Ф1+ • • • + ₽*-ФА- (5.13) Выражения ф{ = ф{(х, у, I, т|) СУТЬ определенные много- члены вида Ф, и на них натягивается подпространство (Ф)о. Теперь мы должны показать, что это подпространство инвариантно относительно преобразования (5.6) наших переменных, т. е. что ф£ = Ф4(х', у'", £', т]') является ли- нейной комбинацией выражений фДх, у, t, л)- Ясно, что если это так, то с индуцирует представление в (Ф)о, так как при отождествлении двух векторов 1 = х, У] = у (5.14) Ф,- принимает вид Ф,-(х, у, х, =
§ 5. ФОРМАЛЬНЫЕ ПРОЦЕССЫ. РЯД КЛЕБША - ГОРДАНА 167 Следовательно, мы априори уверены, что h + 1 функций <р(- являются линейно независимыми. Чтобы закончить доказательство, мы заменим х, у в (5.13) на x' — ax + by, y'=cx + dy и аналогично |, г] выражениями g' = a| + frr), т]' = + dt). Теперь заметим, что ах' + Ру' является линейной формой по х и у. (аа + Р0 х + (ab + pd) у = Ах + By; поэтому имеем (ax' + Py')/(ag' + PrfX = (Ах + ВуУ(А% + Вг\У, и в силу (5.13) X ( (Л ) aA-'Pz • = X ( i ) ^-‘В1' фр Заменив А, В в правой части этого равенства на А = аа-\-$с, В=а&4~Р^ и приравняв коэффициенты при ал“'Р', мы получаем ф^ как линейную комбинацию фа. (Ф)'. Субстрат представления состоит из многочленов Чг = Т(х,уЛ, т]) степени f—1 по (х, у) и степени g—1 по (£, tj). Они не являются многочленами типа Ф; чтобы увеличить на 1 степень компонент каждого вектора, мы заменим каж- дый многочлен Т на Ф=(хт)—у1)-Ч. Введенный таким образом множитель никак не влияет на представление. На последнем этапе доказательства нужно показать, что все пространство многочленов Ф вполне приводимо к этим двум подпространствам, т. е. что любой много- член Ф можно записать единственным образом в виде Ф = (а0Фо + а1Ф1+ • +<2л(Рл) + (^т1—(5.15)
168 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ с постоянными коэффициентами Разложение по сте- пеням определителя rq—получающееся отсюда по индукции, есть ряд Клебша — Гордана. Во-первых, заме- тим, что с размерностями все в порядке, так как (Z+i)te+i)=(H-g+i)+fe. Следовательно, достаточно показать, что различные члены в (5.15) являются линейно независимыми, т. е. что выражение вида (5.15), в котором ¥—многочлен степени f—1 по (х, у) и степени g—1 по (£, т]), может быть нулем, только если ¥ тождественно обращается в нуль и если все коэффициенты а(—нули. Доказательство пре- дельно простое. Мы сперва положим, как и в (5.14), (^, т])= (х, у), тогда равенство Ф = 0 принимает вид тож- дества по х и у aoxf‘ + a1x/t~1y+ ... +ahyfl = 0. Следовательно, at — 0. Установив это, мы возвращаемся к двум наборам переменных х, у\ т) и получаем урав- нение (xT)-f/g)¥=O, из которого следует, что ¥ = 0—в алгебраическом тож- дестве для многочленов мы всегда можем убрать множи- тель, такой как хт)—у^, отличный от тождественного нуля. Наша формула (5.9) справедлива также для группы с всех линейных преобразований переменных х, у с нерав- ным нулю определителем. Тогда мы должны интерпрети- ровать ©j,, v — h—21, в (5.9) как такое представление, субстратом которого является совокупность однородных многочленов степени v по х и у, умноженных на хт)— Другими словами, новое представление (&v отличается от старого тем, что преобразование (v-\- 1)-мерного простран- ства представления, соответствующее s в представлении должно умножаться на l-ю степень определителя ad—be. есть представление группы с2Хс2> состоящей из пар (s, s'), члены которых s и s' независимо пробе- гают всю группу с2. Если ограничить s' элементами s, полученными из s заменой коэффициентов линейного преобразования s их комплексно сопряженными, то@уХ®£ становится пред- ставлением группы с2, в качестве субстрата
§ 6. ТЕОРЕМА ЖОРДАНА — ГЕЛЬДЕРА И ЕЕ АНАЛОГИ 169 которого можно взять одночлены xly*Ъу* (i + k = f, I + X = g) степени f по (%, у) и степени g по (х, у). Можно пока- зать, что также неприводимо. § 6. Теорема Жордана—Гёльдера и ее аналоги Возможно, самой фундаментальной теоремой матема- тики является теорема, на которой основывается понятие кардинального числа. Пусть элементы конечного множества предметов, помеченных буквами а, Ь, с, ..., выстроены по отдельности в этом порядке и сопоставлены с символами 1,2, ..., п. Тогда эта теорема утверждает, что «число» п не зависит от порядка, в котором выстроены эти пред- меты. Доказательство этой теоремы имеет значительный математический интерес и дает простейший пример рас- суждения того же рода, что применяется при доказа- тельстве теоремы Жордана — Гёльдера. Новая нумерация состоит в сопоставлении символу 1 какого-либо одного из этих предметов, символу 2—какого-либо из оставшихся, и т. д. до тех пор, пока не будет исчерпано все множе- ство, после чего последний предмет получает символ nz. Мы утверждаем, что п' = п. Доказательство разделяется на два этапа. (1) Если в новой нумерации символ 1 сопоставлен с тем же самым предметом а, что и в старой, наша теорема для ряда от 1 до п превращается в теорему для ряда от 1 до п—1. Это сразу видно, если удалить пред- мет а и символы, сопоставляемые с предметами &, с. ... как в новой, так и в старой нумерациях, сдвинуть на один. (2) С другой стороны, если символ 1 сопоставляется с одним из других предметов 6, с, ..., то в новой нуме- рации объект а сопоставляется с некоторым символом i из ряда 2, 3, ..., и'. Теперь мы вводим третью нумера- цию, которая позволяет нам сделать переход между пер- вой и второй нумерациями, меняя местами символы 1 и i во второй нумерации. Этот процесс, очевидно, не меняет числа nz. Мы, однако, ввели некую эквивалентную нуме- рацию, в которой предмету а соответствует тот же сим- вол 1, что и вначале, и тем самым свели общий случай к случаю (1), рассмотренному выше. Таким образом,
170 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ доказательство теоремы получается непосредственно мето- дом математической индукции. В качестве дополнительного результата этих осново- полагающих рассуждений мы имеем теорему о том, что любую перестановку можно получить последовательным применением транспозиций. Теорема Жордана—Гёльдера имеет дело с абстрактной группой д. Говорят, что инвариантная подгруппа д' группы д, не совпадающая с самой д, является макси- мальной, если не существует ни одной инвариантной подгруппы группы g— за исключением д' и д, содержа- щей д'. Тогда фактор-группа д/д' является простой, т. е. не содержит других подгрупп, кроме себя, и той, что состоит из единственного элемента I. Как установил Галуа, так называемый композиционный ряд 0о = 0, 01» 02» • • •> 0,-1, 0г=1 (6.1) имеет фундаментальное значение для решения алгебраи- ческих уравнений. Этот ряд начинается с группы g и кончается I, а каждый член является максимальной инвариантной подгруппой предшествующего члена. Мы предполагаем, что композиционный ряд конечен; это, в сущности, случай конечных групп, так как порядок с необходимостью убывает от члена к члену. Следующие друг за другом фактор-группы 0/01, 01/02, • • •> Sr-i/0r = 0r-i (6-2) простые. Теорема Жордана — Гёльдера утверждает, что структура этих фактор-групп, не считая порядка, в ко- тором они возникают, определяется единственным обра- зом группой g. Рассмотрим в этой связи второй композиционный ряд Йо “ Й> Йп Й2, • • • той же группы д; его нужно сравнить со «стандартным рядом» (6.1). Доказательство того факта, что этот новый ряд содержит ровно г +1 членов и что соответствующие фактор-группы, с точностью до порядка в котором они появляются, изоморфны фактор-группам (6.2), снова осуществляется в два этапа. (1) Если два вторых члена д^ и дг совпадают, теорема для группы д, чей стандартный ряд содержит г +1 чле- нов, сводится к соответствующей теореме для группы gn стандартный ряд которой содержит только г членов.
$ 6. ТЕОРЕМА ЖОРДАНА — ГЕЛЬДЕРА И ЕЕ АНАЛОГИ 171 (2) Если cjj и gi не совпадают, мы строим пересече- ние групп tjj и д{, т. е. множество, состоящее из всех общих элементов обеих групп. Тогда Ij является инва- риантной подгруппой группы gi и, как мы докажем, д{/1) изоморфна g/gv То, что два элемента s и t группы g эквивалентны относительно д1( т. е. что они принадлежат одному и тому же «классу», выражается равенством t=ars, где принадлежит gv Если s и t в то же самое время суть элементы подгруппы gi, то а± также принадлежит gj и, следовательно, является элементом I). Поэтому мы можем рассмотреть в качестве элементов gi/I> те классы в д, которые включают какой-либо элемент из д^. Тогда элементы, содержащиеся в этих классах, образуют инва- риантную подгруппу <£> группы д, содержащую и д1( и 91» а й!/е просто изоморфна §/gi. Но так как gi мак- симальна, то либо 4)= д, либо = д+ Второй случай означает, что gj содержится в д^, а так как она макси- мальна, она должна совпадать с gj, что противоречит предположению. Следовательно, I) совпадает с д, и наше утверждение доказано. Пересечение I) подгрупп gt и gj симметрично зависит от них обеих, поэтому g/g£ и gj/f) также просто изоморфны. Теперь мы поступим следующим образом. Д1ы построим композиционный ряд для который обозначим просто I), ..., и сравним следующие четыре композиционных ряда группы д: Й> 91» Йа» • • • > Й> 91» *1........ Й> й!» I), •••. Й. й!» Й2, • • • Сравнение первого и второго рядов сводится к случаю (1). Второй и третий ряды совпадают, начиная с члена J), а две предыдущие фактор-группы 9/91» йА как мы видели, просто изоморфны группам 9/9£» МЪ при изменении их порядка. Сравнение третьего и четвер- того рядов снова сводится к случаю (1). Таким образом, доказательство теоремы для композиционного ряда, содер- жащего гф-1 членов, сводится к доказательству соответ-
172 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ ствующей теоремы для ряда с г членами, а так как она, очевидно, выполняется для г = 2, т. е. для простых групп, метод математической индукции устанавливает ее общую справедливость. Легко просматривается тесное методологическое род- ство между построениями, привлеченными для доказа- тельства этой теоремы и для доказательства теоремы о независимости кардинального числа множества от порядка, в котором нумеруются элементы. Э. Нетер [4] дала ценное для нас обобщение теоремы Жордана—Гёльдера. Говорят, что отображение s—*s'=Xs группы на себя является автоморфным, если умноже- ние инвариантно относительно него, т. е. если (st)' = s't' (мы здесь не предполагаем ни то, что различные эле- менты s порождают различные элементы s', ни то, что для данного элемента s' имеется элемент s такой, что s—*-s' посредством этого автоморфизма). Пусть S—си- стема таких автоморфных отображений группы д. Огра- ничимся теперь только теми подгруппами группы д, кото- рые инвариантны относительно S, т. е. подгруппами, элементы которых все операции системы S переводят в элементы тех же подгрупп. Мы говорим, что такие «дозволенные» подгруппы gt и д2 имеют одинаковую струк- туру, если можно установить взаимно однозначное просто изоморфное соответствие между элементами одной и эле- ментами другой подгрупп таким образом, что каждая операция А системы S переводит соответственные элементы двух подгрупп в соответственные же элементы. При такой модификации теорема Жордана—Гёльдера еще справед- лива, причем ее доказательство можно получить без изме- нения. Векторы «-мерного векторного пространства 9ft обра- зуют абелеву группу, умножением в которой является сложение векторов. Но в данном случае мы должны дополнить сложение операцией умножения вектора на произвольное число; поэтому понятия и теоремы, приме- нимые к векторному пространству, не являются в точности конкретизациями понятий и теорем для абелевых групп, однако между ними существует прямая аналогия. Обозна- чив эту аналогию между группой (слева) и векторным пространством (справа) символом мы, к примеру, имеем: подгруппа ~ линейное подпространство, автомор- физм ~ линейное отображение.!^ В самом деле, линейное подпространство является системой 9t' векторов, таких
§ 6. ТЕОРЕМА ЖОРДАНА — ГЕЛЬДЕРА И ЕЕ АНАЛОГИ 173 что вместе с { и подпространству 91' также принадле- жит их сумма j + 9 и произведение на произвольное число X, а отображение j—= линейно, если оно переводит J 4- V и Хх соответственно в j' + р' и Хх'. В этом случаз каждая «подгруппа» инвариантна, так как мы имеем дело с абелевыми группами. Если Sft' — подпрост- ранство из Ж, то пространство 91 (mod 91'), полученное проецированием 9? вдоль 9i', является точной аналогией фактор-группы. Композиционный ряд состоит из последо- вательности пространств, каждый член которой есть ли- нейное подпространство предыдущего члена и имеет одним измерением меньше. Последний член является простран- ством 0, состоящим из одного вектора 0, а число членов в этом ряде на 1 больше, чем размерность п. Теорема Жордана—Гёльдера здесь справедлива, но тривиальна. С другой стороны, эта теорема имеет значительную ценность, если перейти к обобщению Нётер. Рассмотрим систему 2 линейных отображений векторного простран- ства 91 на себя; ниже термины «инвариантный», «эквива- лентный», «приведение» будут относиться к этой системе. Два инвариантных подпространства 91г и 912 подобны или эквивалентны, если можно установить взаимно однознач- ное линейное соответствие & х2 между векторами одного и векторами другого таким образом, что любая операция А системы 2 переводит соответственные векторы в соот- ветственные векторы. Читая в обратном направлении ряд (4.3), образованный ранее в § 4, мы обнаруживаем точную аналогию композиционного ряда: каждый член ряда возникает из максимального подпространства, инва- риантного относительно 2. Построение композиционного ряда как в возрастающем, так и в убывающем порядке возможно благодаря тому, что сложение векторов комму- тативно. Кроме того, понятия и теоремы, относящиеся к системе отображений 2, можно получить как настоя- щие частные случаи, а не просто аналоги понятий и теорем теории групп, если пополнить систему 2 преоб- разованиями подобия, т. е. отображениями вида х—*т' = =Xj, представляющими собой умножение на произволь- ное число X. Итак, теорема Жордана—Гёльдера—Нётер утверждает: пусть дан второй композиционный ряд О, 9i;, 9t;, . ..,9t, тогда соответствующие пространства проекций 9t;, 9t; (mod 9£i), 9t; (mod 9t$), ..,
174 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ эквивалентны пространствам проекций (4.3) 9ii, 342 (mod9fi), З43 (mod3i2), ... первоначального ряда, взятых в подходящем порядке. Число членов, конечно, одинаково. Читателю рекомендуется построить доказательство этой теоремы, пройдя для этого случая шаг за шагом доказательство теоремы Жордана — Гёльдера. В частности, если система S состоит из преобразова- ний U (з), соответствующих различным элементам s некой группы в представлении <£>: s —► U (s), наш результат дает теорему единственности-. Неприводимые представления, выделенные из <!р последовательным приведением, полностью определяются представлением за исключением порядка, в котором они возникают, если считать эквивалентные представления одинаковыми. В частности,, полное приве- дение S) на неприводимые компоненты единственно, если рассматривать эквивалентные представления как равные. § 7. Унитарные представления В случае, когда пространство представления 34 уни- тарно, а также унитарны отображения U (s) пространства 31 на себя, соответствующие элементу s рассматриваемой группы, некоторые введенные выше понятия следует соот- ветственным образом модифицировать. Два представления s —*• 4/(s), s—>~U'(s) = AU(s)A~1 должны рассматриваться как эквивалентные, только если А унитарно, т. е. если оно является преобразованием от одной нормальной системы координат в пространстве 34 к другой нормальной. Если 34' — подпространство в 34, то в нем можно простроить унитарно ортогональную си- стему координат и дополнить ее базисными векторами до полной унитарно ортогональной системы координат всего пространства 34: каждое подпространство унитарного прост- ранства унитарно само по себе. Понятия инвариантности и приведения сохраняют свой прежний смысл, но мы допускаем только такие разложения пространства 34 на два подпространства 341 + 34а, в которых 341 и З43 перпен- дикулярны. Для системы унитарных отображений приво- димость означает полную приводимость, и справедлива теорема: Если 34' инвариантно относительно S, то 34 можно разбить на сумму 34' -f- 34' таким образом, что 34*
$ 7. УНИТАРНЫЕ ПРЕДСТАВЛЕНИЯ 175 тоже инвариантно относительно 2. Нам нужно всего лишь определить 91" как пространство, заполненное всеми векторами, перпендикулярными к 9J'. Естественно, эта теорема справедлива и в случае, когда 2 есть система инфинитезимальных унитарных отображений, или, что то же, система эрмитовых форм. Теорема, изученная в предыдущем параграфе, доказывает, что эти неприводи- мые компоненты определяются с точностью до переста- новки единственным образом в смысле унитарной эквива- лентности. Примеры. (1) Унитарная группа в двух измерениях. Группа с = с, линейных преобразований в двух изме- рениях содержит подгруппу ц = ц2 унитарных преобразо- ваний. Следовательно, представление группы с, полу- ченное в § 5, есть также представление группы и. Это представление не является унитарным, как хотелось бы, однако небольшим изменением его легко можно сделать унитарным. Преобразование из 6/, соответствующее уни- тарному преобразованию s [координат х и у, есть пре- образование, которое s индуцирует на одночленах xn = xlyk (i + k = f). (7.1) Ради симметрии мы будем помечать эти координаты индек- сом n — i—k, который пробегает значения f, f—2, ..., —f. Кроме того, это удобно еще потому, что если ограни- читься подгруппой «главных преобразований» х—+гх, У~~У, х„ умножается на множитель в". Далее, мы выбираем — вместо (7.1)—переменные х!у* " Vi! й! полученные из прежних умножением на константу. Тогда, как следует из равенства тг +у у) 1= L пйг=Е х~х-' представление группы и будет унитарным. Мы назы- ваем (£у четным или нечетным, согласно тому, четно f или нечетно. Четные представления с отражением х' = — х, у' —— у
176 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ связывают тождественное преобразование 1, а нечетные — преобразование —1. Кроме того, представления ($,f непри- водимы как представления подгруппы и, а если заставить f принимать значения 0, 1,2, ..., они образуют полную систему неэквивалентных представлений группы ц. Дока- зательство этих утверждений, которые мы принимаем далее как эвристические, будет дано в гл. V. Если запи- сать однородный многочлен степени f переменных х, у в виде 5 «Л. то коэффициенты ап под действием унитарного преобразо- вания s преобразуются подобно компонентам вектора в пространстве представления Полное приведение (6/х6г) = 6/+г + (6/_1х®г_1) было получено расчленением пространства «многочленов Ф» на два инвариантных пространства: (Ф)о и (Ф)'. Теперь мы должны удостовериться, что эти два подпространства взаимно ортогональны в унитарном смысле. Произволь- ный многочлен Ф можно записать в виде (n = f, f—2, .... — f \ 2 anvxnlv = где хп задаются формулой (7.2), a —соответствующие одночлены вида (‘ |х=г. Два таких многочлена Ф с коэффициентами anv, bnv орто- гональны, если 2 ^nv^nv = 0 • Многочлен xf%gi старший коэффициент которого afg=l, в то время как все другие — нули, есть, с точностью до постоянного множителя, х? и потому перпендику- лярен ко всем многочленам (Ф)', так как во всех них коэффициент при x^g равен нулю. Однако при унитар- ном преобразовании $: х' = ах + Рг/, у'=— $х-\-ау, (7.3)
УНИТАРНЫЕ ПРЕДСТАВЛЕНИЯ 177 где аа + рр = 1, х^8 переходит в (ах + ₽z/)f (а£ + Рп)г- (7.4) Поскольку и множество (Ф)', и ортогональность много- членов инвариантны относительно унитарного преобразо- вания s, то многочлен (7.4) тоже ортогонален к (Ф)', а отсюда, в силу определения (5.12) подпространства (Ф)о, вытекает, что все многочлены из (Ф)о унитарно орто- гональны к многочленам из (Ф)'. Выражение (7.3) определяет самое общее унитарное преобразование. Оно выводится таким же способом, как известная формула для ортогональных преобразований двух переменных с равным единице определителем в ана- литической геометрии на плоскости. Записав коэффициенты a = x-+iX, р= — p + *v (75) через их действительные и мнимые части, мы видим, что каждое такое преобразование характеризуется четырьмя параметрами х, X, р, v, сумма квадратов которых равна 1. Композиция двух преобразований s: (х, X, р, v) осуществ- ляется на языке этих параметров как умножение кватер- нионов Гамильтона^ это последнее обстоятельство при- вело к векторному исчислению. (2) Унитарные группы в п измерениях. Совокупность тензоров порядка f является субстратом п^-мерного унитарного представления (и/ группы и==и„, ибо 2 1^19 ••• 9)12 (7.6) 0’1» • • I’/) является унитарным инвариантом, где F ... if) — компоненты произвольного тензора. Рассматривая ^-мер- ное линейное многообразие антисимметрических тензоров, мы выбираем в качестве переменных в тензорном прост- ранстве те компоненты F (i1i2 ... if), для которых < i2 < < .. . < if. Сумма вида (7.6) только этих компонент равна, тем не менее, полной сумме (7.6), поделенной на /!; следовательно, представление {ц}7 группы и, субстрат которого состоит из всех антисимметрических тензоров, является унитарным. В случае симметрических тензоров ситуация несколько иная. Самый общий симметрический тензор порядка f преобразуется как произведение и х и х ...
t?8 ГЛ. Ill. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ ...xu (f членов), т. е. на данном этапе мы можем по- ложить ^(1^... i/) = xlxli ... xlf. (7.7) Как и прежде, мы записываем одночлен, стоящий справа, в виде Х1Х1 ... Х„. (5.1) Здесь fr—число повторений индекса г в ряде i2i ... В этом смысле мы записываем компоненты симметриче- ского тензора как F(h4 ... i/)«<P(Л,/2, Сумма (7.6) в этом случае принимает вид где суммирование производится по всем целым числам fr 0, для которых /1 + /з 4- • • • + fn = Л Здесь коэффи- циент показывает, как часто член | F. ,if) |2 появляется в сумме, с учетом, что его значение не меняется при пе- рестановке индексов. Поэтому для того чтобы получить унитарное представление [ц]Л нам следует величины ф(Л. /а. fn) /W fn\ рассматривать как независимые компоненты произволь- ного симметрического тензора порядка f. Истинность этого утверждения вытекает из того факта, что для част- ного случая тензора (7.7) справедливо равенство . yft yfnZfi. ~Zfn 4to+...+x„7,)^ = £ ’'-4.! P-8) В гл. I, § 5 мы уже видели, что нормальную систему координат можно выбрать так, что коммутативная систе- ма S унитарных отображений полностью приведется к на- бору одномерных систем. Соответственно, единственными неприводимыми унитарными представлениями абелевой группы являются одномерные. В самом деле, из U (s) U (/) = U (st) (4.1) и коммутативности группы следует, что унитарные ма- трицы U (s), соответствующие элементам s, коммутативны.
§ 8. ГРУППА ВРАЩЕНИЙ И ГРУППА ЛОРЕНЦА 179 Если и — унитарные представления, то <£) + <&' и тоже унитарны. Первая фундамента л ьная задача для заданной группы д—-это найти полную систему не- эквивалентных неприводимых унитарных представлений группы д, ибо тогда любое унитарное представление груп- пы g можно получить сложением этих неприводимых представлений. Вторая фундаментальная задача такова: привести произведение двух неприводимых представ- лений^, $ группы g к его неприводимым компонентам; или больше (после решения первой задачи)—определить, как часто каждое из неприводимых представлений появ- ляется в этом произведении. Мы проиллюстрируем эти задачи на примере групп вращений, которые особенно важны в квантовой физике. § 8. Группа вращений и группа Лоренца (а) Группа вращений на плоскости Мы описываем 2-мерную плоскость комплексной коор- динатой х. Тогда вращения плоскости задаются как х—>х' = 8х, (8.1) где 8 = —константа с единичным модулем. (Таким об- разом, вращения действительной 2-мерной плоскости сов- падают с унитарными преобразованиями одного комплек- сного переменного.) Угол поворота <р полностью опреде- ляет вращение, но вращение определяет его, конечно, только mod 2л. Угол поворота ведет себя аддитивно в ком- позиции: поворот ф и последующий поворот ф' приводят к повороту Ф + ф'- Соответственно эта группа вращений является однопараметрической абелевой группой. Мы по- лучим 1-мерное представление ®(от) нашей группы Ь = Ь2, если с элементом 8 из (8.1) свяжем линейное отображение х —> х' = ът • х = в"™? -х, (8.2) где т—любое фиксированное целое число. Я утверждаю, что если т пробегает все целые значения, то представле- ния ®(/п) образуют полную систему неприводимых уни- тарных представлений группы Ь2. В этом можно убедиться следующим образом. Любое неприводимое представление с необходимостью одномерно: оно повороту ф сопоставляет число %(ф), рав- ное 1 по абсолютной величине, причем % (<р + <р') = Х(ф)’Х (<₽')•
180 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Мы предполагаем, что наше представление непрерывно; тогда % (ф) является непрерывной периодической функ- цией от <р с периодом 2л. Во-первых, % (0) = 1. Мы пи- шем х(ф) = еа и определяем %(ф) единственным образом из условия X (0) = 0 и того, что X (ф) должна быть непре- рывной функцией от ф. Таким образом, мы имеем Х(ф + <р') = Х(ф) + Х((р'), (8.3) где правая и левая части этого уравнения, в общем, могли бы отличаться на целое кратное 2л; однако в том виде, как это записано, обе части совпадают в случае ф/ = 0 и меняются непрерывно с ф'. Уравнение (8.3) удовлетворяет условию % (0) = 0, и мы выводим из него следующие равенства: Х(—ф) = — %(ф), Х(/гф) = Я-Х(ф), (8.4) где h — произвольное целое число. Заменив ф в последнем из этих равенств на ф/Zi, мы получаем <8’5> Из (8.4) и (8.5) немедленно следует, что для каждого рационального числа k/h (k, h—целые) Ч-НЧ’-м- <8-б> Согласно нашим допущениям %(2л) является целым крат- ным 2л, т. е. равно 2/пл. Положив ф=2л в (8.6), мы получаем равенство Х(ф) = /пф для всех ф, которые яв- ляются рациональными дробями 2л; далее, требование непрерывности позволяет нам утверждать справедливость этого равенства для всех вещественных значений аргу- мента ф. В нашем случае справедливо простое равенство J)(m) х ф(т') __ <^(т + т')л Рассмотрим функцию /(р) на единичной окружности в комплексной х-плоскости. Если при повороте 8 точка р переходит в точку р', функция f переходит в функцию которая определяется равенством Г (/)=/(₽)•. Переход /—>/' есть линейное отображение в оо-мерном пространстве функций f(p) и соответствует вращению в;
$ 8. ГРУППА ВРАЩЕНИЙ И ГРУППА ЛОРЕНЦА 181 очевидно, что это определяет oo-мерное представление группы вращений Ь2, которое мы обозначаем $?. Пред- ставление будет унитарным, если мы возьмем в качестве квадрата абсолютной величины «вектора» f интеграл от | f (р) |2 по элементу дуги dp единичной окружности. Тот факт, что любую функцию, удовлетворяющую подходящим условиям на единичной окружности, можно разложить в ряд Фурье, означает, что в приведении к неприво- димым компонентам каждое 1-мерное представление ®(т> появляется один и только один раз. Более точно, эту редукцию следует интерпретировать в смысле соотноше- ния полноты (15). (б) Группа вращений в 3-мерном пространстве Будем рассматривать функции f = f (Р) на единичной сфере как векторы в oo-мерном унитарном пространстве, метрика которого задается в виде J | f (Р) |2 da; da—эле- мент поверхности сферы, по которой должно проводиться интегрирование. Если при повороте $ точка Р переходит в точку Р' = sP, то функция f переходит в определяе- мую условием /'(Р') = /(Р). Сферические гармоники Yt степени I [см. гл. II, § 4], очевидно, порождают (21+1)- мерное подпространство которое инвариантно отно- сительно совокупности переходов f'. индуцированных .в пространстве функций различными элементами s группы вращений b = bs,— здесь мы снова говорим об этом пред- ставлении, как о Я. Следовательно, они являются суб- стратом некоторого представления 2), группы Ь, которое b индуцирует в $t. Выбрав определенное направление в ка- честве оси z, мы можем, как и в гл. II, § 4, взять набор УГ (tn — l, I— 1, .... — /) в качестве базиса для сферических гармоник степени I. Тогда мы будем иметь унитарное представление, а под- пространства соответствующие различным значениям О, 1, 2, ... параметра I, взаимно перпендикулярны в унитарном смысле (свойства ортогональности сфериче- ских гармоник). Группа b включает 2-мерную группу вращений Ь2,—например, как подгруппу вращений около оси z. Структура Y^'показывает, что, если сузить Ь8 до этой подгруппы Ь2, то^представления сведутся^ 1-мер- ным представлениям ©°”’, для которых m = l, I—1,
132 ГЛ. ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ ..., —I. Тот факт, что любая функция на единичной сфере обладает единственным разложением по сферическим гармоникам, означает, что при приведении й к его не- приводимым компонентам каждое из представлений 2)r(/ = 0, 1, 2, ...) встречается в точности один раз. Это проясняет истинную значимость сферических гармоник; они характеризуются исследованными здесь фундаменталь- ными свойствами симметрии, а решение уравнения потен- циала в полярных координатах является просто второ- степенным подходом к их теории (16). Вращения суть ортогональные преобразования трех переменных х, у, z. Если мы хотим вместе с собственными вращениями с определителем +1 включить в рассмотре- ние также несобственные вращения с определителем —1 («расширенная группа вращений У»), то это можно сде- лать введением отражения i: х'=—х, //' = — у, z'— — z (8.7) относительно начала координат. Его двукратное повторе рение Н есть тождество, и оно коммутирует со всеми поворотами. Соответствующая ему матрица в представле- нии, определенном сферическими гармониками степени Z, является (2/Ц-1)-мерной матрицей (—l)z, поскольку сфе- рические гармоники степени Z суть однородные многочлены степени I от х, у,_г. Таким образом, мы можем получить два представления ©z+ и ©f расширенной группы вра- щений, исходя из представления ©z собственных враще- ний; эти два представления совпадают с ©z для собст- венных поворотов, но в первом матрица, соответствующая отражению Z, есть +1, тогда как во втором она равна —1. Эту величину ±1 мы называем сигнатурой представ- ления. Поэтому в oo-мерном представлении $ расширен- ной группы Ь’ каждое ©z встречается один раз с сигна- турой (—1)х, но не с противоположной сигнатурой. Хотя мы еще не в состоянии доказать это, представления ©z (Z = 0, 1, 2, ...) образуют полную систему неэкви- валентных неприводимых (однозначных) представлений группы вращений b, a ©z+ и ©z“ вместе образуют такую систему для расширенной группы вращений Ь’. Теперь рассмотрим унитарное функциональное про- странство всех функций f(P) в 3-мерном пространстве, для которых конечен интеграл от | f |2 по всему простран- ству. Пусть представление, индуцированное в этом про- странстве вращениями s, при котором переход от f к пре-
§8. ГРУППА ВРАЩЕНИЙ И ГРУППА ЛОРЕНЦА 183 образованной функции /' = sf соответствует s, обозначается как (£. Каждую функцию f (Р) можно разложить в ряд с членами вида ф(г)-УР Выберем полную ортогональную систему Ф1(г), Ф2(г), • • • на множестве функций ф(г) ра- диуса г в смысле равенств 00 $ /-2ФИ (г) (г) dr = 6МП. О Тогда функции вида ф„(г) К/ образуют (2/+ 1)-мерное подпространство инвариантное относительно враще- ний, в котором 6 индуцирует представление Различ- ные взаимно ортогональны. Тогда каждое представ- ление появляется в ® бесконечно часто, эти появле- ния различаются с помощью «радиального квантового числа» п. Рассмотрим в свете этих математических ре- зультатов анализ одноэлектронных спектров, данный в главе II, § 5. Теперь мы видим, что азимутальное кван- товое число / имеет чисто теоретико-групповое значение, тогда как радиальное квантовое число п отвечает дина- мической ситуации, поскольку способ, которым следует выбирать ортогональную систему фя (г), диктуется динами- ческим дифференциальным уравнением. Собственные вращение 3-мерного евклидова простран- ства около начала декартовой системы координат х, у, z, т. е.- действительные ортогональные преобразования с опре- делителем + 1, наиболее просто представляются при по- мощи стереографической проекции единичной сферы с цент- ром в начале координат на экваториальную плоскость г = 0, где южный полюс сферы есть центр проекции. Если точка (%', у', 0) — образ точки (х, у, z) сферы и х' iy', то формулы проекции принимают вид x+ty = —*=-, X — iy =-----^=7, Z = . , . Однако предпочтительнее ввести две однородные комплек- сные координаты £, т] вместо £ при помощи равенства С = Л/£; тогда в рассмотрение включается и южный полюс ^:т| = 0:1. Таким образом, мы имеем xAiy : х — iy : z : 1 = = 2т]В : 2£т) : 5^—тщ : + тръ
184 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Поэтому каждое унитарное преобразование о: В' = аЦ-Рт), т)' = yB4-6i] координат | и т] соответствует некоторому вращению $ сферы, точки которой представляются лучами |: т] дву- мерного унитарного пространства. Поскольку, как не- трудно видеть, любую точку на сфере и касательное направление через нее можно перевести в любую другую такую конфигурацию на сфере при помощи этих враще- ний, то таким путем мы получаем все повороты. Так как мы имеем дело только с отношениями коэффициентов а, Р, у, б, можно выбрать коэффициент пропорциональности таким образом, чтобы определитель преобразования стал равным 1. Тем не менее такая нормировка отчасти искусст- венна, ибо наше отображение все еще двузначно, поскольку при умножении коэффициентов унитарного преобразова- ния на —1, т. е. при переходе от о к —о, нормировка не затрагивается. Поэтому каждому элементу о (7.4) унимодулярной унитарной группы соответствует поворот s: а—>s, при .котором координаты x-\-iy, х—iy, z пре- образуются как 2£п, г)Т], (8.8) ИЛИ У Bn), гщ. (8.9) (Символ ~, которым мы здесь воспользовались, означает, что выражение слева преобразуется как выражение справа.) Таким способом мы получаем все вращения, причем каж- дое встречается дважды. Повороты вокруг оси z полу- чаются из «главных преобразований» |' = е|, т»' = -^т] группы п. Действительно, если положить 8 = е*й) = г (со), то угол поворота вокруг оси гесть<р = — 2со. Благодаря соответствию о—>s вращения в 3-х измерениях образуют представление группы п; и наоборот, связь s—появляется представлением группы 3-мерных вращений b = b3 груп- пой и, хотя это представление является двузначным. Посредством этого соответствия s—>сг любое представле- ние U (о) группы и дает представление группы Ь3 («Г-про- цесс», § 5);j таким образом, можно рассматривать как представление группы Ь3, в этом случае мы обозначаем
§ 8. ГРУППА ВРАЩЕНИЙ И ГРУППА ЛОРЕНЦА 185 его ©у, где / = х/2^- («Четные») ©у с целым j однозначны, ®У с полуцелым (т. е. половиной от нечетного числа) j двузначны. Если сузить группу Ь3 до подгруппы Ь2 вра- щений около оси г, представление ©у сводится к (2/4-1) одномерным представлениям j — 1, —j). Чтобы это показать, мы, во-первых, заметим, что субстрат нашего представления £)у состоит из одночленов (7.2): (i-\-k = 2j, i—k = 2m), где т пробегает значения /, /— 1, ..., —/. Соответст- венно преобразование, индуцированное на этих перемен- ных поворотом ср вокруг оси z, есть х(т)—>е(— /пф)’Х(т). Само представление о—>s группы и содержится в по- строенных выше представлениях ®у группы и; в самом деле, это S)x. Действительно, если (£, т]) и (£' rf) под- вергаются одному и тому же преобразованию а группы и, то и определитель — т]£', и выражение ££4~ ЛЛ являются инвариантными. Следовательно, (£, г|) преобразуются как (т)', —^') или как (т), —£), поэтому %4~Ч/~Л2, х—iy~ — l2, (8.10) Представления 2)у с целыми / тождественны полученным выше представлениям, индуцированным на сферических гармониках порядка /, так как каждый многочлен пере- менных х, у, z степени / эквивалентен, в силу (8.10), некоторой форме степени 2/ переменных тр Если мы желаем расширить группу ц = п2 подобно расширению группы b = b3 за счет несобственного пово- рота i (отражения относительно начала), мы должны рас- сматривать ее как абстрактную группу, а не как группу линейных преобразований двух переменных. Обозначим элемент, соответствующий f, через i, а элементы исходной группы ц, как и прежде, через а. Мы определяем рас- ширенную группу п’ как совокупность элементов типа о и icr; естественно, i должно подчиняться законам умно- жения to=ai? ii = I. Тогда и суть такие представления группы и’, которые совпадают с (£v для элементов ограниченной
186 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ группы и и сопоставляют с элементом i единичную ма- трицу + 1 и отрицательную к ней —I соответственно. Знак ± снова называется сигнатурой. Представление (£2 связывает расширенную группу вращений с группой и’. (в) Группа Лоренца Пусть 3-мерное евклидово пространство соотнесено с однородными проективными координатами ха (а=0,1,2,3), которые определены соотношениями *0 *0 Тогда уравнение единичной сферы имеет вид 4 4-4 4~4~~ 0, (8.11) а формулы для рассмотренной выше стереографической проекции принимают вид 1 /5 -ох - Н (8.12) = —W *з==^—Ф1- J Если £ и г] подвергаются произвольному линейному пре- образованию о, то претерпевают соответствующее дей- ствительное линейное преобразование s, которое оставляет равенство (8.11) инвариантным. Если абсолютная величина определителя преобразования о равна 1, то мы без труда можем показать, что форма — 4 4" 4 4" 4 + 4 (8.13) сама является инвариантной относительно соответствую- щего преобразования s и что определитель этого преобра- зования есть 4-1. Пусть теперь = хг, х2, х3— координаты простран- ства-времени; тогда (8.11) является уравнением светового конуса, образующие которого суть возможные траектории лучей света. В специальной теории относительности нор- мальные системы координат для пространства-времени связаны друг с другом преобразованиями Лоренца, т. е. действительным линейным преобразованием, которое остав- ляет форму (8.13) инвариантной и не меняет местами прошлого и будущего. Преобразования Лоренца образуют группу, «полную группу Лореица», и эта группа описи-
§ 8. ГРУППА ЁРАЩЁНИЙ И ГРУППА ЛОРЁНЦА 187 вает однородность, присущую 4-мерному миру. Эта группа состоит из «положительных» и «отрицательных» преобра- зований, т. е. преобразований с определителями +1 и—1 соответственно. Первые составляют «сокращенную группу Лоренца», из которой полная группа получается добав- лением пространственного отражения Хо—**0, ха~~*—ха (а=1, 2, 3). (8.14) Для сокращенной группы правое и левое, так же как прошлое и будущее, принципиально различны. Поскольку выражение для х0 в (8.12) положительно определенное, мы можем сформулировать полученный выше результат в виде: любое линейное преобразование переменных £ и т] с определителем, равным по абсолютной величине единице, индуцирует положительное преобразование Лоренца s пе- ременных ха. Преобразования о, которые различаются только множителем еа с абсолютной величиной, равной единице, приводят к одному и тому же $. Отображение о—>s является, естественно, представлением. Немедленно возникает вопрос: можно ли каждое поло- жительное преобразование Лоренца получить таким путем? То, что это действительно так, можно увидеть из общих топологических соображений, ибо положительные преобра- зования Лоренца образуют отдельный связный континуум. А кроме того, это легко доказывается элементарными методами. Поскольку выше в разделе (б) мы видели, что повороты пространства s получаются из унитарных пре- образований о, нам нужно изучить только преобразования Лоренца (%о Ч хз} * (*о ~h (*о *з) («^о хз), —>Хх, х2—> х2, действующие на ось времени, где а — вещественная отлич- ная от нуля константа. Но эти преобразования получаются из унимодулярного преобразования т]~— Возвращаясь к общему случаю, получаем, что отображе- ние s—есть 2-мерное представление сокращенной группы Лоренца. Кроме того, о определяется преобразованием s с точностью до произвольного «калибровочного множителя» eiKt, поэтому мы можем нормировать его согласно требо-
18g ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ ванию, чтобы определитель преобразования о равнялся единице сам, а не только по абсолютной величине. Даже после этого о остается двузначным, поскольку—ст также удовлетворяет этому условию нормировки. Это представ- ление s—превращается в представление рассмотренной в разделе (б) группы вращений, если s пробегает под- группу пространственных поворотов, содержащихся в со- кращенной группе Лоренца. Выражения в (8.12) являются эрмитовыми формами с матрицами ПИ' ИИ' ПГо|' Н4 (8.15) Поэтому, если через j обозначить матрицу—столбец с эле- ментами 5, т], соотношения (8.12) можно записать в виде xa = lSax. (8.16) При замене £, т) на т), —% величины ха подвергаются пространственному отражению (8.14). Это — один способ включения отрицательных преобразований Лоренца. Од- нако, если требуется, чтобы соответствующие преобразо- вания переменных g, л были линейны, нужно вдобавок к j = I]) ввести вторую пару переменных j'==(£', rf), которая подвергается преобразованию о', контрагредиент- ному относительно о. Тогда (т), —|)~(|', tf) с точностью до множителя d, (Л, —В) ~(£', л') с точностью до множителя d, где d—определитель преобразования а. Если положить S^S0, Sa = -Sa (а= 1,2,3), то величины будут подвергаться тому же преобразованию s, что и выра- жение (8.16), если только абсолютное значение определи- теля преобразования о есть 1. То же верно для любой линейной комбинации этих двух величин, например, xa + %a- Таким образом, величины xa=lsax -f-j'S;?' (8.17)
§ 8. группа вращений и группа лоренна 189 претерпевают данное положительное преобразование Ло- ренца s, когда £, т] подвергаются некоторому преобразова- нию ст, а f]'—одновременно преобразованию ст', контра- гредиентному относительно ст. Кроме того, они подвер- гаются преобразованию (8.14), если поменять местами две пары j и т. е. если четыре переменные подвергнуть преобразованию Т: В~>£', п—(8-18) Выражение W+nn' инвариантно в силу определенного выше закона преобра- зования В' и г/. Чтобы получить выражение, инвариант- ное также относительно замены (8.18), следует добавить выражение, которое получается из него при такой замене: + Ф1') + (1'В + ?П)’ (8-19) Как будет видно, столбец, состоящий из четырех эле- ментов (В, т); В', 'П'), удобно обозначать одной буквой j. Пусть такое линейное преобразование этих четырех пере- менных, которое трансформирует В, Л согласно Sa, а В\ т)'—согласно S^, обозначается просто Sa; тогда выраже- ние (8.17) принимает вид Xa = jSaT. (8.16') Теперь мы должны узнать: в какой • мере линейное преобразование о четырех переменных j определяется тре- бованием, чтобы оно индуцировало некое данное положи- тельное или отрицательное преобразование Лоренца s эрмитовых форм ха? Для этого достаточно выяснить, какие преобразования набора j индуцируют тождество на пере- менных ха. Единственными преобразованиями такого типа являются те, что умножают В и т] на одинаковый множи- тель eiK, равный единице по абсолютной величине, а пере- менные В' и г)' в то же самое время — на произвольный множитель eiK' (независимый от первого) с абсолютной величиной, равной единице. Но о можно более точно описать также требованием, чтобы выражение (8.19), т. е. $Tj, было инвариантным. Два произвольных «калибровоч- ных множителя» eiK, eiK' должны тогда совпадать: таким образом, замена переменных о определяется с точностью до множителя eiK.
190 ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Наш анализ свел задачу о представлениях группы Ло- ренца к соответствующей задаче для линейной унимоду- лярной группы с2. § 9. Характер представления След линейного отображения А, т. е. сумма элементов главной диагонали матрицы А, является инвариантом относительно преобразований координат, который имеет особое значение. След /(s) отображения U(s), соответствую- щего элементу s группы g в представлении $ этой группы, называется групповой характеристикой, или, во избе- жание приписывания еще одного значения слову «харак- теристика», которое уже возникало в другой важной связи в квантовой механике,— престо характером представ- ления Эквивалентные представления имеют одинаковый характер', такое название выбирается потому, что обраще- ние этой теоремы верно в широких пределах. Поскольку (7(1)= 1, величина характера %(1) для единичного элемента равна размерности представления. Из равенств U (asa~1)^=U (a) U (s) U (a~1)=U (a) U (s) (7-1 (я) следует, что матрицы U (s) и U (asa"1) различаются только своими ориентациями и, следовательно, имеют одинаковый след: X(asfl-1) = x(s)- Далее, s и asa~1 являются двумя сопряженными элемен- тами группы д, т, е. они принадлежат одному классу сопряженных элементов в смысле § 3. О функции /(s) на групповом многообразии, которая принимает одно и то же значение на всех элементах s одного и того же класса, мы говорим как о функции класса', такая функция самое большее может позволить нам различать разные классы, но не элементы одного и того же класса. Кроме того, отличительную черту функций класса можно выразить равенством f(st) = f(ts). Справедливость этого равенства для /=% следует из U (st) = U(s)U (t), U (is) = U(t)U (s) и того факта, что след матрицы АВ равен следу мат- рицы В А.
§9. ХАРАКТЕР ПРЕДСТАВЛЕНИЯ 191 Характер х (s) унитарного представления U (s’1) = U*(s) удовлетворяет равенству Z(s-1) = x(s). (9.1) Мы будем говорить, что характеры неприводимых пред- ставлений являются примитивными. Любое унитарное представление § можно привести к его неприводимым компонентам, а нормальные системы координат в соответ- ствующих подпространствах можно выбрать так, что две неприводимые составляющие будут равны, если они экви- валентны. Если в этом смысле $ = пг§ + т'1)' (9.2) где I), I)' — неэквивалентные неприводимые представления, а т, т', .. . —кратности, с которыми они встречаются в «!р, тогда характер X представления $ выражается через характеры %, %', ... представлений I), I)' равенством X(s) = /n%(s) + m'x'(s)4-... (9.3) Из n-мерного представления s—> U (s) с характером %(s) и п'-мерного s—>U' (s) характера %'(s) мы можем построить (пп')-мерное представление «f)X<§'. Элементы главной диагонали матрицы U (s)xU'(s) получаются пере- множением всех элементов главной диагонали матрицы U (s) со всеми элементами главной диагонали U' ($): харак- тер представления $х& есть, следовательно, x(s)x' (s). С другой стороны, если $— представление группы g, fy' — представление группы д', то представление <£) группы gxg' имеет характер £, определяемый выражением £(s. s') = % (s)%' (s'), (9.4) где s пробегает элементы группы g, a s'—группы д'. Нам нет необходимости различать 1-мерное представле- ние и его характер; характер удовлетворяет простому уравнению (4.2). Оно выполняется, например, для харак- теров е(т<р) (равенство (8.2)) группы вращений Ь2. В силу теоремы о преобразовании унитарных отобра- жений к главным осям, каждый элемент группы U = U2 сопряжен с главным элементом, т. е. элементом вида И-1. (9.5)
192 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Собственные значения е и 1/8 определяются с точностью до порядка, в котором они появляются. Если ввести угол со посредством равенства s = e(co), то со характеризует класс сопряженных элементов группы п; мы имеем дело только с со mod 2л, и к тому же класс (— со) совпадает с классом со. Так как для любого представления 6 группы и характер %(s) зависит только от класса элемента s, то достаточно вычислить %(s) для элементов вида (9.5). Он должен быть периодической функцией угла со с периодом 2л и, кроме того, должен быть четной функцией со; его значение для выражается формулой Xz = e/ + ez-2+ . + 8~z = g/+1-g-r+1> • (9.6) Характеры представлений, рассмотренных в других примерах предыдущего параграфа, точно так же легко вычисляются. § 10. Лемма Шура и теорема Бернсайда Лемма (10.1) [5]. Допущение. Пусть S—неприводимая система линейных отображений m-мерного векторного пространства г на себя, a Q—аналогичная система отобра- жений n-мерного векторного пространства Пусть, далее, линейное отображение А удовлетворяет равенству 2А = Ай (10.2) в следующем двойном смысле: для каждого U из 2 сущест- вует некоторое V из Q, такое что UA — AV, (10.3) и наоборот, для каждого V из Q найдется такое U из 2, что выполняется это соотношение. Утверждение. Тогда либо А = 0, либо т = п и det А =#0; в последнем случае 2 и Q эквивалентны. Доказательство. Сперва мы воспользуемся допущением о неприводимости системы 2 в связи с равенством (10.2) в первом смысле. Если рассматривать &-й столбец ^2ft> • • • > ^mk матрицы А как вектор а</г), то равенство (10.3) означает, что вектор Ua{k\ связанный с alfc) отображением U, является
§10. ЛЕММА ШУРА И ТЕОРЕМА БЕРНСАЙДА 193 линейной комбинацией векторов а(Л), а именно, h Следовательно, подпространство из г, натянутое на п век- торов а°”, инвариантно относительно S. Но в силу пред- положения о неприводимости системы S либо aU) = 0 и А = 0, либо векторы охватывают все пространство г, и в таком случае т из них линейно независимы; послед- нее возможно только, если п^т. То обстоятельство, что наше заключение содержит две возможности, возникает из-за того, что подобную альтернативу содержит понятие неприводимости. Второй части нашего допущения можно придать прос- тую геометрическую форму, если перейти к транспониро- ванным матрицам: система Q* неприводима, и для каж- дого V* из й* найдется U* из S* такое, что V*A* = A*U*. Рассуждения, привлеченные в первой части теоремы, позво- ляют нам заключить: либо Л* = 0, либо т^п. Подытожим полученные к этому моменту результаты в утверждении: либо А = 0, либо т = п; в последнем случае т (= п) столб- цов матрицы А линейно независимы, т. е. определитель матрицы А не равен нулю. Но тогда U и V единственным образом определяются из соотношения (10.3), и, следова- тельно, системы 2 и й эквивалентны. Формулируя эти результаты, желательно рассмотреть случай эквивалентности отдельно: I. Если две неприводимые системы S и й неэквива- лентны, то (10.2) может выполняться только при Л = 0. II. Если ^ — неприводимая система, то отображение А коммутирует со всеми отображениями U системы S: UA = AU (10.4) тогда и только тогда, когда матрица А кратна единич- ной матрице 1. Утверждение II следует из леммы, доказанной выше элементарными методами, и основной теоремы алгебры. Так как в силу последней существует число а, такое что det (Л—al) —0, и поскольку А' —А—al удовлетворяет (10.4) для всех U, если это верно для А, мы заключаем, что ввиду det Л'= 0 мы имеем Л' = 0 (17).
194 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Применительно к представлениям наши результаты таковы: Основная теорема (10.5). I. Если s—*U (s), s—*V(s) — два неэквивалентных неприводимых представления группы д, то равенству U(s)A = AV(s) не может удовлетворять ни одна матрица А, не завися- щая от s, за исключением Д = 0. II. Матрица, которая не зависит от s и удовлетво- ряет равенству U (s)A=*AU (s) для всех s, с необходимостью является кратной единичной матрице 1. Если существует матрица А, которая удовлетворяет соотношению U (s) А»AU (s) тождественно по s и не является просто кратной единичной матрице 1, то исполь- зованное выше рассуждение дает нам конструктивный процесс приведения представления s—+U (s) при помо- щи А. Теперь мы рассмотрим применение этих важных резуль- татов, которые являются фундаментом всей теории пред- ставлений, для доказательства теоремы, установленной Бернсайдом. Пусть S есть мультипликативная система (18), т. е. если U, U' суть два отображения из S, то их произ- ведение UU'—также отображение из S. Это понятие несколько шире, чем понятие группы; нам не нужно тре- бовать, чтобы U имело обращение—его определитель может быть нулем. Теорема Бернсайда (10.6) [6]. В неприводимой муль- типликативной системе S линейных отображений U = = || uik ||, действующих в п-мерном векторном пространстве, компоненты uik линейно независимы. Это означает, что единственная матрица L, которая удовлетворяет равенству 1Г({/Л)в5/Л=о i, k для всех матриц U из нашей системы, если матрица А = 0. Допустим противное: существуют ненулевые матрицы, удовлетворяющие этому равенству; такие матрицы мы будем называть L-матрицами. Конечно, возможно, что
§ 10. ЛЕММА ШУРА И ТЕОРЕМА БЕРНСАЙДА 195 любая L-матрица, первой столбец которой 41» •••» 41 равен нулю, должна сама равняться нулю. Но в любом случае мы можем найти определенный номер h, обладаю- щий следующими свойствами: существуют ненулевые L-мат- рицы, чьи первые h—1 столбцов равны нулю, и есть такие, что, если й-й столбец также равен нулю, то с необ- ходимостью L = 0. Мы назовем L-матрицы, первые h—1 столбцов которых равны нулю, специальными L-матри- цами. Они составляют линейное семейство т^п измере- ний; обозначим базис этого семейства через L(1), L(2), ..., й-й столбец специальной L-матрицы будем обозначать бук- вой I. Так как ’система 2 мультипликативна, для каждой L-матрицы выполняется равенство tr (17'C/L) = O, где U, U' суть произвольные отображения из системы S. Матрица UL, как и L, является L-матрицей; очевидно, что UL—специальная L-матрица, если L является специаль- ной. Поэтому каждая из матриц UL™, UL™, ..., ULM есть линейная комбинация матриц Lll), :.L(m\ а каж- дый из векторов U\™, ..., —линейная комбинация векторов 1(1), . .., 1<я”. Соответственно векторы 1(1), ..., 1(от) порождают некоторое ненулевое подпространство, инва- риантное относительно всех отображений U, а из-за допу- щения неприводимости следует, что т = п и векторы Iй’, ..., Iм охватывают все n-мерное пространство. Базис L(1), ..., LM семейства специальных L-матриц можно выбрать таким образом, что 1(1)....Iм будут базисными векторами пространства; тогда [(1) имеет вид (1, 0, 0, ... •.., 0) и т. д. Так как к тому же Wrt = B1,I“'+. • • +«ЛД(">, (Ю.7) мы должны иметь t/Lw = MlrL<l>+ ... + unrU*\ (10.8) Теперь мы рассмотрим произвольный, скажем й-й, столбец матрицы L. (Конечно, не представляет интереса
196 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ случай k < h, так как h—1 первых столбцов нулевые.) Далее, опуская второй индекс k, мы обозначаем через 1 = (/ъ • • •» 1п) k-й столбец матрицы L. Тогда в силу (10.8) для такого I (т. е. для £-го, а не /i-го столбца матрицы L) справедливо равенство (10.7). Вводя теперь матрицу 1^ ... 1Г /<1> /<«> • • • •'П состоящую из k-x столбцов матриц LU), ..., Lin\ мы можем записать (10.7) в виде матричного равенства ик^ки. Но из него следует, что А должна быть кратным единич- ной матрицы, т. е. или, возвращаясь к прежней записи (восстановив индекс столбца), Здесь, как видно из предыдущего, мы имеем Хх = ... = — ^л-1 — 0, ХА = 1. Равенство tr((/L<r,) = O принимает вид 2«аЛ=0 (г=1, ...,п), (Ю.9) £= 1 т. е. все отображения системы 2* переводят вектор X с ком- понентами (Хх, %2....Хв) в нуль-вектор. В силу неприво- димости системы S этот вектор % должен быть нулевым, что противоречит равенству Хл = 1; теорема Бернсайда получается, таким образом, при помощи reductio ad absur- dum *). Если мы знаем, что единичная матрица содержится в системе 2, как это имеет место в случае представления, мы можем заключить, что л4- = 0, взяв в качестве U в (10.9) единичную матрицу. Приводимость требует, чтобы при выборе подходящей системы координат все матрицы U системы 2 содержали ♦) Доказательство от противного. (Примеч. пер.)
§ 10. ЛЕММА ШУРА И ТЕОРЕМА БЕРНСАЙДА 197 некоторый прямоугольник, целиком заполненный нулями, и, следовательно, подразумевает систему однородных ли- нейных соотношений весьма специального вида между ком- понентами Uik. Теорема Бернсайда устанавливает, что если не существует системы однородных линейных отношений этого специального вида, то вообще не существует линей- ной зависимости. Подлинная причина этого замечательного факта кроется, конечно, в предположении о замкнутости 2 относительно умножения. Если наша система 2 совпадает с неприводимым пред- ставлением, которое элементам s группы g ставит в соот- ветствие матрицы U (s), то из теоремы Бернсайда следует, что компоненты матриц U (s) линейно независимы. Разви- тый выше метод можно без труда распространить на доказательство того же утверждения относительно компо- нент двух и более неэквивалентных неприводимых пред- ставлений U(s), U'(s), ... [7]. В частности, отсюда следует, что не может существовать никакой линейной зависимости между характерами % (s), х' (s), ... этих представлений. Любое унитарное представление можно привести к непри- водимым компонентам; характер выражается через характеры этих неприводимых представлений формулой (9.3). Так как % (s), (s) линейно независимы, коэффи- циенты т, т', ..., т. е. кратности, с которыми неприво- димые представления I), I)', ... встречаются в «§, опреде- ляются единственным образом. Это дает новое косвенное доказательство следующего результата, который уже был доказан в § 6 более общим и более элементарным способом: Неприводимые представления, к которым можно привести fo, а также их кратности определяются единственным обра- зом представлением fy, если не делать различия между эквивалентными представлениями. Очевидно, что два уни- тарных представления и $2 эквивалентны, если каждое неприводимое представление, которое содержится в одном, такое же число раз содержится и в другом. Отсюда, если Sji и неэквивалентны, характер не может быть таким же, как и характер $2 из-за линейной независи- мости примитивных характеров, поэтому унитарное пред- ставление единственным образом определяется своим харак- тером, и, следовательно, его характер можно использовать как единственное наименование самого представления. Здесь мы не пойдем дальше к расширениям теоремы Бернсайда, которыми мы обязаны Фробениусу и И. Шуру, так как мы получим те же результаты более глубоким методом
198 ™ nI- ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ в следующем параграфе, в предположениях более ограничи- тельных, но достаточных для наших целей. Мы упомянем только одно следствие. Если «£), $— неприводимые представления групп g, g' соответственно, то «Ь X & является неприводимым представлением группы gxg'. В самом деле, не может существовать никакого однородного линейного соотношения с постоянными коэф- фициентами cikttH между компонентами uik (s) u{K(s) мат- рицы U (s)x U' (s'), кроме тривиального с =0. Поскольку, применив теорему Бернсайда к неприводимой системе мы имеем 2 ^ik, IX^IX ($ ) = 0, I, X а применив ее снова к ф', мы получим 1х = 0. § 11. Свойства ортогональности характеров групп Если абстрактная группа g конечна, то любое пред- ставление s—+U(s) эквивалентно некоторому унитар- ному. Чтобы показать это, возьмем любую положительно определенную эрмитову форму, например, единичную форму, подвергнем ее всем преобразованиям U (s) из § и просуммируем по s. Таким образом, мы получаем положи- тельно определенную эрмитову форму Н, которая инва- риантна относительно каждого из преобразований U (s). Далее, выбираем систему координат таким образом, что Н принимает единичную форму; тогда матрица преобразова- ния U (s), выраженная в этих координатах, унитарна. Этот же метод суммирования по всем элементам группы приводит к фундаментальным соотношениям ортогональ- ности. Пусть S-->£/(s), <£)': s—> Z7' (s)—два неэквивалент- ных неприводимых представления конечной группы g, при- чем первое g-мерно, а второе g'-мерно. Положим ^(s) = ll«u(s)ll. ^'(s) = Kx(< ^'-1(s) = ll»l'x(s)||. Для унитарного представления <£)' ($) = ^ix ($)• Если А—произвольная матрица из g строк и g' столбцов, то сумма ^U(t) AU'-1 = (11.1)
$ И. СВОЙСТВА ОРТОГОНАЛЬНОСТИ ХАРАКТЕРОВ ГРУПП 199 взятая по всем элементам t группы д, является, очевидно, инвариантной в том смысле, что U (s)BU'-'(s) = B. (11.2) Действительно, в силу того обстоятельства, что s—>U(s) есть представление, левая часть (11.2) принимает вид т где % —st, s фиксирован, a t пробегает все элементы группы. Таким образом, мы получаем равенство (11.2) или U(s)B = BU'(s). Согласно основной теореме (10.5), из этого равенства сле- дует, что В —0, т. е. 2 2 ^ik (0 (0 = 0. t k, X Написав s вместо t и помня, что суть’ произвольные числа, мы получаем g2-g'* уравнений 2«Zfe (8)^(5) = 0, S или, ввиду унитарности представлений, 2«Zfe(s)«vx(s) = 0- (11.3) S Если взять одно неприводимое представление s —> U (s) вместо двух неэквивалентных представлений <!р, <!р', то с помощью того же рассуждения находим, что квадратная матрица U(s)AU^{s) = B, полученная из произвольной квадратной матрицы А, должна удовлетворять равенству Но это равносильно требованию, чтобы матрица В была кратным единичной матрицы 1, т. е. 22« ik (s)a*xM«i(s) = a.6a. S fe.X Число a зависит от матрицы Л; эта зависимость, разу- меется, линейна и однородна. Взяв в качестве А такую
200 гл. HI. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ матрицу, которая имеет единственный ненулевой элемент akK= 1, мы получаем уравнение 2«ife(s)“xi(s) = axfe-6n. (11.4) S Здесь ||«lx (s) || является матрицей, обратной к || ut>c (s) ||: 2«xi(s)«Zft(s) = 6xft. i Полагая i = i в (11.4) и суммируя по /==1,2, на- ходим, что h • Sx/e == > где h есть порядок группы д. Выражая эту сумму в терминах среднего значения 0^ можно записать наши результаты в форме s SK{«/ft(s)Hlx(s)}=l 7 дая 1 = 4 k==H’ (11.5) | 0 в остальных случаях для любого неприводимого унитарного представления ft: s—>t/(s), а также 9»{«tt(s)«ix(s)} = 0 (11.6) для любых двух неэквивалентных неприводимых унитар- ных представлений s —► {/ (s), s—+U' (s). Компоненты од- ного или более неэквивалентных неприводимых унитарных представлений образуют ортонормированное семейство функций на групповом многообразии. Из этих фундаментальных соотношений ортогональ- ности следует, что компоненты ulk (s), (s), ... линейно независимы. Число линейно независимых функций аргу- мента s, который принимает лишь h значений, не может быть больше, чем h, поэтому мы должны иметь g2 + g'*+--- <h. В левой части этого соотношения стоят квадраты степе- ней любого неэквивалентного неприводимого представле- ния группы д. Свойства ортогональности характеров мы получим, положив в (Н.5) и (11.6) k — i, x = i и просуммировав по этим индексам.
§11. СВОЙСТВА ОРТОГОНАЛЬНОСТИ ХАРАКТЕРОВ ГРУПП 201 Любой примитивный характер удовлетворяет равенству ®4x(s)%(s)l = l, (11.7) а характеры х (s), х' (s) двух любых неэквивалентных не- приводимых представлений—равенству 9»{x'(s)x(s)} = 0. (11.7') Примитивные характеры неэквивалентных представлений образуют нормальную ортогональную систему функций. Следовательно, они линейно независимы, и из этого вы- текают все следствия, обсуждавшиеся в предыдущем па- раграфе. В частности, представление группы g можно однозначно описывать его характером, если не различать эквивалентные представления. Краткость т, с которой неприводимый характер х встречается в представлении X, в силу (9.3) вычисляется по формуле m = a»{X(s)x(s)}, (11.8) и, следовательно, 9W {X (s) X ($)} = m2 + m'* 4- ... Это последнее равенство дает простой критерий неприво- димости данного представления на языке его характеров %: необходимо и достаточно, чтобы среднее значение функ- ции %х==|%|2—которое в любом случае целое—было еди- ницей. Поскольку характеры суть функции классов, то ра- ботая с ними, мы имеем дело с аргументом, который про- бегает К различных классов группы д; поэтому не суще- ствует больше чем Д линейно независимых функций класса. Следовательно, конечная группа не может иметь неэквивалентных неприводимых представлений больше, чем она имеет классов. Если вначале казалось,- будто введение общего поня- тия о представлениях открывает безграничные возмож- ности, то теперь мы видим, что все представления строятся из примитивных и что число возможных примитивных представлений ограничено узкими пределами. Дальнейшее содержание общей теории представлений можно сформу- лировать в виде теоремы о том, что множества функций, ортогональность которых мы только что показали выше, являются полными ортогональными системами. При- митивные характеры образуют полную ортогональную
202 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ систему на множестве функций классов, т. е. существует ровно Д неэквивалентных неприводимых представлений. Компоненты полной системы из Д неэквивалентных не- приводимых представлений образуют полную ортогональ- ную систему на множестве функций, определенных на групповом многообразии, следовательно, А = ^ + Я'*+--- , где сумма в правой части распространяется на такую полную систему, a g, g', ... суть размерности отдель- ных неприводимых представлений. § 12. Развитие теории для компактных непрерывных групп Развитую выше теорию нельзя распространить на про- извольные группы, однако она применима mutatis mutan- dis*) к группе, элементы которой образуют конечномер- ный компактный континуум. Подобно тому как ближайшее окружение точки на поверхности образует плоскость, так ближайшее окружение точки рь на r-мерном непрерывном многообразии образует r-мерное линейное многообразие, а линейные элементы, исходящие из р0 в соседние точки р, определяют r-мерное линейное векторное пространство. Мы предполагаем, что бесконечно малые элементы нашей группы g (т. е. элементы в окрестности единичного эле- мента I), или точнее, бесконечно малые векторы, идущие к ним из I, образуют r-мерное векторное пространство, так называемое «касательное пространство» к g в точке I. Из кинематики твердого тела читателю знакомо понятие бесконечно малого вращения и тот факт, что эти беско- нечно малые повороты образуют 3-мерное линейное се- мейство в 3-мерном пространстве и [п(п—1)/2]-мерное семейство в n-мерном пространстве. Умножение двух бес- конечно малых элементов группы выражается тогда с помощью сложения соответствующих векторных линейных элементов в касательном пространстве. Параллелепипед, который будет служить элементом объема в окрестности I, определяется г линейно незави- симыми линейными элементами, а его объем, как обычно, равен абсолютному значению определителя из компонент этих г векторов. Конечно, этот элемент объема не яв- *) После соответствующих изменений. (Примеч. пер.)
§12. РАЗВИТИЕ ТЕОРИИ 203 ляется полностью независимым от выбора системы коор- динат в касательном пространстве, но преобразование к новой системе координат лишь умножает величины всех таких элементов объема в окрестности элемента I на по- стоянный числовой множитель. Поэтому такие объемы определяются с точностью до выбора единицы меры; едва ли мы можем требовать большего. При перенесении теории, развитой в предыдущих раз- делах, на непрерывные группы суммирование заменяется интегрированием, и поэтому необходимо иметь, возмож- ность измерять объемы на всем групповом многообразии группы g. С помощью предшествующих рассуждений можно измерять и сразу сравнивать друг с другом эле- менты объема в окрестности I, то же самое верно для элементов объема в любой другой точке группового мно- гообразия. Единственная трудность состоит в переносе единицы измерения из точки I в любую другую точку а. Анализ рассуждения, которым мы воспользовались в § 11, показывает, что измерение объема должно обладать сле- дующими свойствами инвариантности: объем произвольного элемента не должен меняться при левой трансляции груп- пового многообразия, преобразующей произвольный эле- мент группы t в x = at. Но такого требования как раз достаточно, чтобы задать этот процесс единственным об- разом. Рассмотрим элемент объема в точке а, который получается из элементарного объема в точке I левой трансляцией, переносящей I в а; по определению, объемы этих двух элементов будут одинаковы. Перенесем элемент объема из а в b с помощью трансляции Г = (to-1) t, тогда равенство Г = &(а~Ч) показывает, что при выбранном определении объема объемы полученных таким образом элементов в точках а и Ь равны. Далее, мы предполагаем, что наше непрерывное груп- повое многообразие компактно—например, в том смысле, в каком поверхность сферы является компактным много- образием по сравнению с евклидовой плоскостью, которая некомпактна. Это обеспечивает возможность интегрировать непрерывные функции положения на групповом многооб- разии по всему многообразию. Теперь мы выберем еди- ницу объема так, чтобы объем всего многообразия g равнялся 1; интегралы в этом случае являются средними значениями. Мы, конечно, требуем, чтобы компоненты матриц U (s) в представлении s —► U (s) были непрерыв- ными функциями элемента s группы д. Тогда законы
204 ГЛ. HI. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ (11.5), (11.6), (11.7), (11.7') и все полученные из них в § 11 следствия справедливы для неприводимых представлений непрерывной группы g и их характеров [8]. Наша теория необычайно сузилась бы, если бы мера объема, которую мы ввели так, что она инвариантна относительно левых трансляций, не была автоматически инвариантной относительно: (1) правосторонних транс- ляций: s->-s' = sa и (2) инверсии: s—>~s' = s~1. Первое из этих свойств будет установлено, если показать, что величина элемента объема в I не изменится при перене- сении его в а путем левой трансляции и возвращении в 1 с помощью правой. Тогда, очевидно, каждый ’ беско- нечно малый элемент 6s группы подвергается линейному преобразованию А: 6s —> d's — a’8s*a~1, т. е. сопряжению 1а, которое соответствует элементу а. Такие линейные преобразования в г-мерном векторном пространстве бесконечно малых элементов нашей группы образуют представление а —► А абстрактной группы д. Поскольку д компактна, каждое преобразование А должно быть «абсолютно унимодулярно», т. е. определитель отоб- ражения А должен быть равен 1 по абсолютной величине, а это в свою очередь позволяет нам заключить, что оп- ределение перенесения объемов как левыми, так и пра- выми трансляциями приводит к одинаковому результату. Чтобы это доказать, рассмотрим элемент а и его степени а2, а3, ... Так как групповое многообразие g компактно, бесконечное множество а, а3, а3, ... обладает на g точ- кой накопления Ь, т. е. можно найти такую бесконечную последовательность показателей п, что, когда п пробе- гает эту последовательность, ап сходится к Ь. Элементам ап и b соответствуют сопряжения Ап и В соответственно, и в силу предположенной выше непрерывности det (Л") стремится к det (В) при п, пробегающем выбранную по- следовательность. Далее, поскольку det (В) есть конечное число, отличное от нуля, и в силу того, что, если бы абсолютное значение определителя матрицы А было от- лично от 1, то det (Л") стремился бы либо к 0, либо к оо, мы можем заключить истинность сделанного выше ут- верждения. Кроме того, это позволяет нам доказать спра- ведливость свойства (2) инвариантности относительно ин- версии. Ибо инверсия переводит элемент 6s в точке I в —6s, а это преобразование абсолютно унимодулярно.
<12. РАЗВИТИЕ ТЕОРИИ 205 Теперь перенесем один из двух инверсных элементов из I в точку а левой трансляцией, а другой—в точку а~1 правой трансляцией; таким образом мы получаем эле- менты объема в точках а и а-1, которые переходят друг в друга при инверсии s—>-s' = s_I. Так как и левые, и правые трансляции сохраняют объемы, эти два элемента объема имеют одинаковую величину. Примеры свойств ортогональности. Мы уже нашли примитивные характеры для группы вращений Ь2 окружности'. е(т<р), т = 0, ±1, ±2, ..., где Ф—угол поворота. Они, действительно, образуют унитар- но ортогональную систему функций! 5 e>v)7(m'<p)d<p = | “ = Если бы существовали другие неприводимые представле- ния, их характеры с необходимостью были бы ортого- нальны всем этим; однако это невозможно, так как функ- ции*е(/иф), где т принимают все целые значения, уже составляют полную ортогональную систему. К тому же мы уже показали более прямым методом (§ 8), который не использовал равенства Парсеваля *), что система при- митивных характеров е(шф) полна. Поэтому равенство Парсеваля естественно считать простейшим случаем об- щей теоремы о теоретико-групповой полноте, упомянутой в §11. Характер представления двумерной унитарной унимодулярной группы U = U2 дает выражение (9.6). По- ложив 8 = е(®), А = 8—8-I = 2isin®, ДА dot = da, мы имеем 0 (12.1) Это приводит нас к предположению, что do есть объем части группового многообразия, занятой теми элементами группы а, углы поворота которых лежат между со и со + + dco. [Тогда полный объем группового многообразия ♦)См. гл. I, § 7. (Примеч. пер.)
206 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ есть л о Если это так, то (12.1) суть соотношения ортогональ- ности, предсказываемые общей теорией, и равенство da—fr- АД d© определяет плотность различных классов группы. Дейст- вительно, в последней главе мы завершим определение объема и подтвердим эти результаты. Если бы было еще другое неприводимое представле- ние, с характером %, то £=-А-% была бы нечетной пе- риодической функцией со с периодом 2л, которая была бы ортогональна всем функциям ^*=А.%у, т. е. функциям sin®, sin2со, sin3(о, ... Но последние уже образуют полный ортогональный на- бор в семействе нечетных периодических функций, и, следовательно, представления 6/ (/ = 0, 1, ...) составляют полную систему неприводимых представлений группы U. Прямое доказательство, не пользующееся равенством Пар- севаля, также будет получено в гл. V, § 16—на самом деле оно там проводится для группы ц„ при произволь- ном числе измерений п. Легко проверить наличие ряда Клебша—Гор дана X/XgeX/+g + X/+g-2 + •••+%! f-g| (12.2) для характеров X/. Если мы из общих соображений зна- ем, что характер представления задает его единственным образом, то это равенство можно использовать в качестве доказательства приводимости @/Х(5г к неприводимым компонентам с характерами, вычисленными справа. По- скольку обращаться с характерами много легче, чем с представлениями, этот принцип дает очень мощный ме- тод получения различных утверждений относительно пред- ставлений. Пусть f~^g, умножим равенство (12.2), кото- рое следует проверить, на А: 5/Х,-=2& (v*=/ + ^ f + g—2, • •f—g). V
$ 12. РАЗВИТИЕ ТЕОРИИ 207 Произведение двух чисел В/ = 8>'+1—8“ (/+1) И Хг = 8*+е*~2-|- . . . 4-8~« есть разность двух сумм, в первой из которых . Ц_8/+1-£ степень уменьшается от члена к члену на 2, а вторая получается из первой заменой знаков у всех показателей степеней на противоположные. Следовательно, это произ- ведение на самом деле равно 2{82г,+1—8~ <2’+1>}, v=f + g, f + g—2, ..., f—g. Представления 6j+, (/ = 0, 1, 2, ...) образуют пол- ный набор неэквивалентных неприводимых представлений присоединенной группы U2- Для того чтобы это устано- вить, мы, во-первых, заметим, что в неприводимом пред- ставлении группы U’ матрица, соответствующая элементу I, должна быть кратной единичной матрице, так как она коммутирует с данной неприводимой системой матриц, образующих представление. Кроме того, и = 1, потому эта матрица может быть равна лишь +1 либо —1. Так как матрица, соответствующая i, кратна единичной, и поскольку расширение группы ц до it’ заключается в до- бавлении одного элемента t, то представление должно оставаться неприводимым при сужении группы и’ до груп- пы и. Отсюда следует, что каждое неприводимое пред- ставление группы Иг получается пополнением неприводи- мых представлений группы ц2 с помощью соответствия I—►+! или i —►—1. Если <§, !$' пробегают независимо полные системы неэквивалентных неприводимых представлений двух (ко- нечных или компактных непрерывных) групп д, д' соответст- венно, то образуют полную систему неэквивалентных неприводимых представлений для прямого произведения д х х д'. Чтобы это доказать, мы заметим, что поскольку прими- тивные характеры %(s) группы д образуют полную орто- гональную систему для функций класса по элементу s, который пробегает группу д, и то же относится к при- митивным характерам %' (s') группы д', то совокупность произведений x(s)>x'(s') образует полную ортогональную систему для функций класса по элементу (s, s'), пробе- гающего группу дхд'.
208 ГЛ. Ill. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Представления &f,g, введенные § 5, образуют полную систему неприводимых представлений группы с2, когда f и g независимо принимают значения 0, 1,2, ... ; здесь мы только упомянем этот факт без дальнейшего изучения. § 13. Групповая алгебра Возвратимся теперь к конечным группам. Чтобы иметь возможность сформулировать теорему полноты, мы каж- дой функции x(s) на групповом многообразии конечной группы g поставим в соответствие «матрицу ее коэффици- ентов Фурье», так называемую групповую матрицу X = '2lx(s)U (s), (13.1) 9 где fa: s —> U (s) — представление группы д. След матри- цы X, l = 2*(s)x(s), (13.2) S есть коэффициент Фурье функции x(s) относительно ха- рактера х (s) представления <£). Здесь желательно рас- сматривать функцию x(s) как самостоятельную величину х в групповом множестве', каждый элемент s группы оп- ределяет одно измерение в «групповом пространстве», а число х($) есть s-компонента величины х. Символически мы можем выразить сами эти величины в виде jr=2^(s)-s. (13.3) S В представлении $ матрица X ставится в соответствие величине х: х —>- X относительно <§. Сложение «.группо- вых величин-» и умножение их на числа вводятся обычным путем: дг+З’ имеет компоненты x(s) + z/(s), а ах—ком- поненты a-x(s). Следовательно, групповые величины ве- дут себя, как векторы в й-мерном пространстве, где h — порядок группы. Равенство (13.3) подсказывает следующее определение умножения двух произвольных групповых ве- личин х и у: z = xy = '£t x(t)y(f) tt' = 2z(s)-s, V s где z(s)= 2 x(t)y(t'). (13.4) tt' = s
§ 13. ГРУППОВАЯ АЛГЕБРА 209 Это последнее равенство, где суммирование проводится по всем парам элементов /, произведение которых равно s, определяет произведение z двух величин х и у. Мы обозначаем это произведение ху, а его компоненты — xy(s)\ последнее обозначение не следует путать с x(s)« • z/(s)— обычным произведением двух чисел x(s), y(s). Сложение и умножение групповых величин соответствует сложению и умножению групповых матриц, связанных с ними равенством (13.1). В самом деле, произведение матриц X«S%(s)t/(s), r«Sy(s)t/(s) s s представляется в виде Z=XF= 2 x(t)y(f) t, V s где z(s) определяется в (13.4). Операции, которым можно подвергать групповые ве- личины: (1) сложение, (2) умножение на число и (3) ум- ножение на другую групповую величину, удовлетворяют привычным законам обыкновенной алгебры с двумя важ- ными исключениями: умножение не является коммута- тивным, а деление, вообще говоря, невозможно, т. е. урав- нение ах = Ь для заданных групповых величин а=£0 и Ь может не иметь единственного решения или даже}’не иметь решения вовсе. Однако всегда существует величина 1, обладающая свойством единицы: ta = al=a для каж- дой величины а; ее компоненты все равны нулю, за иск- лючением одной, соответствующей s= I, которая равна 1. Множество описанных выше величин называется алгеб- рой [9], а «групповые величины» суть элементы алгеб- ры', надо быть осторожными и не путать их с элементами группы (см. гл. V, § 5). Соответствие х —в представ- лении удовлетворяет условиям: 1. 1 —1, элементу 1 соответствует единичная мат- рица 1; 2. если х—* X, у —>-Y и а—число, то Ж __► X 4- Y, ах —► аХ, ху —* XY. Представление нашей группы в равной мере является реализацией, или «представлением» групповой алгебры матрицами, при котором выполняются эти условия. Дей- ствительно, единственное, что мы здесь сделали, это
210 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ перешли от матриц U (s), соответствующих отдельным эле- ментам группы, к линейному многообразию матриц, для которого матрицы U (s) образуют базис. Чем характерен элемент а нашей алгебры, компоненты которого a (s) определяют функцию класса? В общем слу- чае мы имеем соотношения ах (s) — ^a (st) х (t~'), ха (s) = ^a (ts) x (t-1), t t а функция класса удовлетворяет равенству a (st) — a(ts). Поэтому такой элемент а характеризуется тем фактом, что он коммутирует со всеми элементами х алгебры: ах = ха. Применяя термин, перенесенный из теории грумп в алгебру, мы можем сказать: те элементы, чьи компо- ненты зависят только от класса сопряженных элементов группы, содержащего аргументе, образуют центр алгебры. Нас интересуют только унитарные представления s—> U (s). Для такого представления эрмитово сопряжение выражения (13.1) имеет вид X = 2 х (s) 0 (s) — 2 х (s) U (s-1) = 2 х (s-1) (s). s s s Отсюда, если определить сопряжение х элемента х равен- ством x(s) — x(s~1), то в унитарном представлении эрми- тово сопряженные матрицы будут соответствовать сопря- женным элементам; это и отличает унитарные представле- ния. Будем говорить, что элемент является действитель- ным, если он совпадает со своим сопряженным. Мы видели, что характер % (s) унитарного представления удовлетворяет этому условию %(s) = x(s-1). Пусть —g-мерное неприводимое унитарное представ- ление группы g. Если С = ||с/й||—некая данная g-мерная матрица, то элемент с алгебры, определяемый компонен- тами с (s) = 2 (s) = f tr [Сй (s)], tk является таким, что с—>-С относительно это легко проверяется с помощью отношений ортогональности. Таким образом, в отображении х—*Х матрица X пробегает все g-мерные матрицы. Величину с компонентами g/h-Uy^s)
f IS. ГРУППОВАЯ АЛГЕБРА 211 будем обозначать е/к. Множество Н всех элементов вида clkelk, it k где коэффициенты с1к произвольны, является, естественно, замкнутым относительно операций сложения и умножения на число. Кроме того, произведение двух элементов из Н есть снова элемент Н; в самом деле, евяи с лежит в Н, а х есть произвольный элемент алгебры, то СХ и хс также лежат в Н. Здесь мы будем пользоваться терминологией, аналогичной терминологии теории групп: Н есть инва- риантная подалгебра алгебры Г всех групповых величин. Чтобы доказать эти утверждения, мы, во-первых, заметим, что определение (13.1) вместе с условием, что соответствие s —► U (s) является представлением, позволяют написать равенство XU (s^)^x(t)U (is'1), которое после замены U (s”1) на 0 (s) принимает вид X&(s) = 3(7(s/-1)x(/). (13.5) Умножив его слева на C=|c/fe|| и выделив след, мы находим f tr [(СХ) U (s)]« У с (st-1) х (t) = сх (s), t откуда следует, что у = сх принадлежит Н, т. е. сх=^у1ке1к (13.6) it k и (13.7) Таким же способом мы можем показать, что если с при- надлежит Н, то хс также принадлежит Н. Если х —> X = || х(к || относительно представления мы называем величину 2*^ компонентой х в Н. Согласно (13.6), (13.7) эта компонен- та есть произведение х е элементом 8 — ^11 + ^28 + ... + Cgg
212 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ и равна гх = хг. Здесь е есть действительный элемент, принадлежащий центру групповой алгебры Г, с компо- нентами -!-'X(s); он является «.идемпотентным», т. е. удов- летворяет равенству 88 = 8. В частности, произведение двух элементов а = 2а<йе/ъ b = %btkelk из Н с матрицами, коэффициентов А, В есть величина ab из Н с матрицей коэффициентов АВ. Элемент в есть так называемый «модуль» или «главная единица» 1 подалгебры Н, так как гх = хг = х для всех х из Н. Алгебра Н тождественна алгебре всех g-мерных матриц («простой матричной алгебре»). «Единицы» е{к удовлетворяют равен- ствам e{rerk = e{k, etresk=0 (r^s). (13.8) Центр подалгебры Н состоит только из элементов, крат- ных ее модулю 8. Неприводимое представление <£/: s —> U' (s) = ||u'w (s) || размерности g', неэквивалентное представлению <§, порож- дает другую инвариантную подалгебру Н', состоящую изо всех элементов вида С = 2^ix^ix> ||cix[| = £ • I. X Компоненты элементов е'м суть ~-u(H(s). Из соотношений ортогональности между неэквивалентными представлениями следует, что с’—>0 в представлении Если с лежит в Н, то, применяя (13.6) с х = с', имеем также сс' =у, но так как тогда Х = 0, соотношение (13.7) дает _у = 0; обе эти подалгебры являются независимыми в том смысле, что произведение элемента из одной с элементом из другой всегда равно 0. Поэтому «единицы» удовлетворяют соот- ношениям e/fce;x = 0. (13.9) Модуль »' = 2 eh L подалгебры Н' вдобавок к свойству е'е'= в'удовлетворяет соотношениям ге' = г'е = 0. Если a(s) есть функция класса, то а принадлежит центру алгебры Г, и если а —> А относительно g-мерного
§ 13. ГРУППОВАЯ АЛГЕБРА 213 неприводимого представления то матрица А коммути- рует со всеми матрицами X. Поэтому А есть кратное единичной матрицы'. С помощью (13.2) мы на- ходим, что след а матрицы А есть*) а = 2 a (s) %(s). s Таким образом, всю теорию представлений можно пе- ревести на язык современной алгебры. Это приводит к большей свободе действий и удобно при формулировке теоремы полноты. Соотношения ортогональности между ulk (s), u(x (s), ... приводят к неравенству Бесселя g.tr(XX)+... </i-2x(s)x(s), (13.10) s где X в сумме, стоящей слева, есть матрица (13.1), соот- ветствующая х (s) в g-мерном неприводимом представлении а сумма берется по любому набору неэквивалентных неприводимых представлений $, ... Это неравенство по- лучается как выражение того обстоятельства, что среднее значение функции z(s)z(s) неотрицательно (см. гл. I, § 7), где г—элемент, получающийся вычитанием из х его ком- понент в Н, ...: z = x—CPlx{ketk+ .. .) = х—(Х8+ • • •)• Поскольку характеры образуют ортогональную систему, то мы, кроме того, имеем неравенство Бесселя К + ...<ft.Sx(s)7(s), (13.11) S где 5 определяется выражением (13.2). Теорема полноты утверждает, что знак равенства имеет место тогда, когда сумма распространяется на полную систему неэкви- валентных неприводимых представлений как в случае (13.10), где x(s)—любая функция на групповом многооб- разии, так и в случае (13.11), где х($)—любая функция класса. Второе соотношение есть частный случай первого, так как для функций класса X = 1. Если в качестве абстрактной группы g взята непрерыв- ная конечнопараметрическая группа, компактная в смысле •) См. также приложение 2 в конце книги.
214 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ § 12, вместо конечной группы, рассмотренной выше, то суммы следует заменить интегралами; мера объема на груп- повом многообразии вводится при этом, как в § 12. Таким образом, вместо (13.1) и (13.4) мы имеем: X = х (s) U (s) ds, ху (s) = $ х (st-1) y(t)dt = ^x (t) у (t-1s) dt. Модуль 1 алгебры в качестве своих компонент должен иметь значения функции 1 (s), которая равна нулю всюду на групповом многообразии, за исключением точки $=!, и должна быть настолько велика, что J 1 (s)ds = 1. Такой функции не существует, однако мы можем построить функ- ции, аппроксимирующие эти условия сколь угодно точно. Соотношения полноты утверждают, что для конечной группы g любой элемент х алгебры есть сумма его ком- понент из совокупности подалгебр, соответствующих пол- ной системе неэквивалентных представлений. Групповая алгебра Г приводится, таким образом, к набору незави- симых простых матричных алгебр. Эту теорему достаточно доказать для х = 1: 1 =8-|-в* + ... = (eu-J-... -\-egg) + • • • > (13.12) поскольку при умножении этого равенства на х получаем ее справедливость для х. Эти утверждения в данной здесь форме нельзя перенести на непрерывные группы; мы должны придерживаться формулировки соотношения полноты в виде (13.10) (вместо берем =), написанном для произ- вольной функции x(s). Мы рассмотрим доказательство этих результатов в гл. V, где все результаты этого пара- графа выводятся заново и детально обсуждаются с другой, более глубокой точки зрения. § 14. Инварианты и коварианты Сначала мы кратко обсудим классическую концепцию инварианта. Рассмотрим, например, группу с = с2 одно- родных линейных преобразований двух переменных £, т] с равным единице определителем. Пусть + 2£>^г) 4- ст]2 — произвольная квадратичная форма двух переменных. «Дискриминант» ас—Ь3 является инвариантом, поскольку
$ 14. ИНВАРИАНТЫ И КОВАРИАНТЫ 215 дискриминанты двух форм, таких, что одна из них пере- ходит в другую при преобразовании переменных I и ц некоторым элементом группы с, имеют одинаковую вели- чину. Таким образом, вместо одной произвольной квадра- тичной формы мы можем иметь одну или несколько про- извольных форм /, <р, ... заданных порядков: п, v, ... Инвариант есть рациональная целая функция коэффициен- тов этих форм, однородная по коэффициентам каждой формы /, ф, ... и имеющая одинаковую величину при замене этих коэффициентов коэффициентами форм/', ф', ..., в которые преобразуются формы /, ф, ... при произволь- ном преобразовании о переменных т) из с. Коэффициенты а0, а1г ..., ап произвольной формы по- рядка п переменных £, т] претерпевают некоторое преоб- разование, если подвергнуть эти переменные преобразова- нию а группы с, а соответствие между а и этим преобра- зованием образует представление группы с. То же верно для совокупности одночленов с?а? • • • апп ('•o + G +•.•+/•„ = г) степени г по этим коэффициентам. Однородный многочлен / степени г по переменным а{ есть линейная комбинация таких одночленов. Таким образом, мы видим, что если I имеет заданные степени г, р, ... по коэффициентам про- извольных форм /, ф, ..., он является линейной комби- нацией величин, образующих субстрат некоторого пред- ставления группы с; это представление становится опре- деленным, как только мы задали порядки п, v, ... форм /, Ф, ... по переменным £ и ц, а также степени г, р, ... инварианта / по произвольным коэффициентам форм /, Ф, ... Отбрасывая все слишком специальные формально алгебраические предположения, принимаемые в «классиче- ской» концепции инварианта, от которых теория инва- риантов с самого начала пыталась отделаться путем обоб- щений в различных направлениях, мы можем выразить понятие инварианта на современном теоретико-групповом языке следующим образом: Пусть «£): s —> U (s) есть заданное представление абст- рактной группы g в п-мерном пространстве представления эт с переменными хр, говорят, что линейная форма пере- менных Xi является инвариантом в пространстве 91 пред- ставления $, если она остается неизменной относительно всех преобразований U (s). Если 1и /2, ... суть инварианты в пространстве представления <§, то любая их линейная
216 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ комбинация + а2/2 + . • • с постоянными коэффициен- тами а2, ... также инвариант. Одной из самых важ- ных задач, возникающих здесь, является, естественно, задача, о числе т линейно независимых инвариантов. Если г/i, у2, . образуют такой полный набор линейно независимых инвариантов и если мы выберем в качестве координат в 91 эти tn величин и еще п—т линейных форм ут+1, ...» уп, таких, что оба набора вместе образуют полную систему линейно независимых линейных форм в 9v, то преобразование U (s) на языке переменных у имеет вид У'1 = У1, • • •» Ут = Ут\ Ут+1 = «да+1, 1 (S) У1 + • • • + «м + 1, „ (S) уп, Уп = ип1 (s)y1 + ...+u„n(s)ya. Если мы имеем дело с унитарным представлением, вели- чины у можно выбрать так, что они будут определять нормальную систему координат; представление таким образом, приводится т раз к 1-мерному тождественному представлению у'=у и к (п—/п)-мерному представлению. Поэтому задача нахождения числа линейно независимых инвариантов в пространстве представления 9? сводится к выяснению, сколько раз тождественное представление с характером 1 содержится в данном представлении <£). Но в силу формулы (11.8) решение этой задачи дает выражение m = (14.1) или: среднее значение характера % представления .£), ко- торое всегда является неотрицательным целым числом, дает число линейно независимых инвариантов в простран- стве представления Формула (14.1) отвечает на главный вопрос, возникаю- щий в теории линейных инвариантов, поэтому теперь мы переходим к сжатому обсуждению теории алгебраических инвариантов. Пусть ®, 4?, • • • суть представления одной и той же абстрактной группы g в пространствах с пере- менными xb yk, .... Мы рассматриваем рациональные целые функции / (х/, yk, ...), которые однородны и по переменным х/, и по переменным ук и т. д. Если величина I остается неизменной при воздействии на х, у, ... ли- нейных преобразований, соответствующих в представле- ниях ... одному и тому же произвольному элемен-
§ 14. ИНВАРИАНТЫ И КОВАРИАНТЫ 217 ту группы s, то говорят, что она является рациональным целым инвариантом системы представлений [®, $, Если заданы порядки р, q, ... функции / по переменным xt, У^ • • •» задача сводится к задаче, рассмотренной выше; ибо одночлены от этих переменных, однородные степени р по X/, однородные степени q по ук, ..., образуют суб- страт представления, получаемого известным путем из ®, Q, ... Однако, если мы рассмотрим одновременно инва- риаты всех возможных порядков, принадлежащие системе [®, •£), ... ], мы столкнемся с новыми проблемами. Наиболее важной из них, которую положительно решает так назы- ваемая основная теорема теории инвариантов, является следующая задача: существует ли конечное число таких инвариантов, что все другие можно выразить через них как рациональные и целые функции? Это приводит к воп- росу об алгебраической, а не линейной, зависимости между инвариантами. Мы только упоминаем об этой более высо- кой области теории инвариантов, не углубляясь в нее, так как она не имеет непосредственного отношения к кванто- вой механике [10]. Вдобавок к инвариантам или скалярам, важную роль в физике играют ковариантные линейные величины, такие как векторы и тензоры. Пусть g есть группа всех линейных преобразований, связывающих нормальные сис- темы координат в пространстве или в пространстве-време- ни, например, 3-мерная группа евкливодых вращений или группа преобразований Лоренца, и пусть <£j: s~>U(s) есть n-мерное представление группы д. Ковариантной ве- личиной типа является объект, имеющий п компонент alt а2, ..., ап относительно любой заданной системы координат для переменных группы преобразований д, и такой, что при переходе к новой системе координат путем преобразования s группы д новые компоненты а,- получа- ются из старых соответствующим преобразованием U (s) представления .Ъ- Если .‘р неприводимо, говорят, что такая величина является примитивной или простой. Физические величины по большей части простые. Так, например, объ- ект, компоненты которого суть напряженности электромаг- нитного поля в 4-мерном мире, описывается как «антисим- метрический тензор второго порядка», а не просто как «тензор второго порядка»; в гл. V, § 4 мы увидим, что поэтому он является простой величиной. Приведение пред- ставления к его неприводимым составляющим означает приведение величин соответствующего типа к простым
218 гл. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ величинам. По-видимому, единственными простыми вели- чинами, с которыми мы имели дело, являются тензоры, характеризующиеся — помимо их порядка—определенными условиями симметрии. Мы докажем эту теорему в гл. V для полной линейной группы с и для ее унитарной под- группы U; она утверждает, что все представления группы с (или и) можно получить путем приведения из степеней с, (с)2, (с)3, ... и что неприводимые составляющие пред- ставлений (с)/ получаются наложением определенных усло- вий симметрии. Соответственно мы должны обобщить задачу линейной теории инвариантов следующим образом. Рассмотрим два унитарных представления I): a—»s, <§: о —► S абстрактной группы g с элементами а; пусть их размерности будут п, N, и пусть I) будет неприводимым. Мы хотим опреде- лить все ковариантные величины типа I) в пространстве представления Если обозначать через х, переменные в этом пространстве, которые подвергаются преобразованию S под действием элемента о, то такая величина / имеет п компонент 11г /2, ..., которые суть линейно неза- висимые линейные формы переменных х^. Когда xt под- вергаются преобразованию S, эти п линейных форм 1а переходят в новые, получающиеся из /а (в которых пере- менные Х[ уже преобразованы согласно S) при помощи преобразования s из f). Если существуют две или больше ковариантных величин /=(л, /4, ...» /„), /'•»(/;, .... I-), ... типа I) в пространстве представления то любая линей- ная комбинация а/ + а'Г + • • • с постоянными коэффи- циентами а есть снова величина того же типа. Мы спра- шиваем: каково число т линейно независимых величин этого типа! Ответ таков: т равно числу возникновений непри- водимого представления I) при приведении ,£>. Следователь- но, если %, X — характеры представлений I), ф, мы имеем /n=9W{X(s) x(s)}. (14.2) Чтобы доказать это утверждение, мы выберем систему координат Xj в пространстве представления так, что матрицы представления ® приводятся к их неприводимым составляющим подматрицам, причем сначала выделяются т представлений I): = ... =1)('в, = 1). Оставшиеся составляющие 1)(я’+1>, ... неэквивалентны I). Переменные в соответствующих инвариантных подпространствах обозна-
§ 15. ЗАМЕЧАНИЯ О ТЕОРИИ ЛИ 219 чим через У** у* у"' * yitn) • л1> • • • > лп, , Ап, . . . , Л} , • . • , лп , ... Матрица S полностью приводится к подматрицам s' — s, ... ..., $(лг) = s; s(M+1), ..., выстроенным вдоль главной диа- гонали. Пусть У1 — а11х1 + • • + alNxNi | Уп = ап1х1 + • • • + anNxN J есть ковариантная величина типа I). Обозначив через х столбец N переменных xh через у—столбец п переменных уа, через А—матрицу ||аа;||, мы можем записать эти соот- ношения в виде у = Ах. Требование, чтобы / была вели- чиной типа I), означает, что, когда х заменяется на х’ = Sx, тогда у переходит в y' — sy, или sy = ASx, sAx = ASx, зЛ = Л5. (14.3) В соответствии с приведением х-пространства к непри- водимым подпространствам матрица А отображения х-про- странства в {/-пространство распадается на матрицы А', .... Л(я,); Л<Я!+1), ..., которые состоят соответственно из первых п строк матрицы Л, ..., п строк матрицы Л из /n-го набора, ... Таким образом, равенства (14.3) при- нимают вид зЛ' = Л'а, ..., «Л(га) = Л^’з; $Л('в+1) = Л(яг+1)з('й+1), ... Из основной теоремы (10.5) о представлениях следует, что Л', ..., Ам все являются кратными n-мерной единичной матрице и что оставшиеся Л<т+1), ... все суть нули. Но это как раз и есть наше утверждение о том, что у = — (Уъ Уъ> • • •. Уп) есть линейная комбинация т величин X — (Xj, Xg, • • •, хпР х^'~ (хГ," х^», ’. ,х<т>) типа 1). § 15. Замечания о теории Ли непрерывных групп преобразований В § 12 мы пользовались понятием инфинитезимальных элементов группы, чтобы узаконить метод измерения объема на многообразии непрерывной группы. Здесь мы подробно
220 ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ обсудим это понятие для 3-мерной группы Ь вращений в евклидовом пространстве [11]. Эта группа служит для описания возможных движений в евклидовом пространстве тела, одна точка О которого фиксирована в пространстве. Каждое возможное положение тела можно считать полу- чающимся из любого заданного начального положения посредством некоторой операции из Ь. Вещество, распре- деленное в пространстве, или любая его часть движется, как твердое тело около точки О, если положение каждого его элемента в данный момент времени связано с его на- чальным положением отображением, принадлежащим Ь. При этом мы описываем движение твердого тела, сравни- вая положение в произвольный момент времени непосред- ственно с начальным положением и игнорируя промежу- точные состояния, которые, по предположению, непрерывно переходят друг в друга. Однако оказалось, что более естественно описывать движение твердого тела как непре- рывное, при котором положение тела претерпевает инфи- нитезимальный поворот от одного момента времени к дру- гому, так что движение в целом есть интеграция ряда инфинитезимальных операций из Ь. Если применить вспо- могательную переменную t с целью избежать использова- ния бесконечно малых и рассматривать этот параметр как время, то поле скоростей dx = x, dy = y, dz = z инфините- зимального поворота определяется выражениями [ср. гл. I, § 6]: dx = bz — су, dy*=cx—az, dz = ay—bx, (15.1) где константы а, Ь, с не зависят от положения (х, у, Z). Эти поля скоростей, которые, очевидно, образуют 3-мер- ное линейное многообразие, суть инфинитезимальные эле- менты из Ь; они являются «векторами», определяющими линейное пространство, касательное к групповому много- образию в точке, которая представляет единичный элемент I. Непрерывное движение твердого тела около точки О ха- рактеризуется тем обстоятельством, что в каждый момент времени его поле скоростей принадлежит 3-параметриче- скому линейному семейству (15.1). Мы можем взять в ка- честве базиса этого семейства три элемента Dx, Dy, Dz, полученные следующим выбором констант: а= 1, 6=0, с = 0; а = 0; b = 1, с=0; а = 0, 6 = 0, с = 1.
§ 15. ЗАМЕЧАНИЯ О ТЕОРИИ ЛИ 221 Мы называем их «инфинитезимальными поворотами вокруг х-, у- и z-осей». С. Ли первым предпринял систематическое изучение строения групп преобразований, исходя из их инфинитезимальных элементов. Действительно, как только они известны, все преобразования непрерывной группы можно образовать интегрированием, т. е. последователь- ным применением таких инфинитезимальных элементов — по крайней мере, всех тех, которые принадлежат тому же связному «листу», что и тождество. (Пример: собствен- ные ортогональные преобразования можно получить из инфинитезимальных, а несобственные преобразования с определителем—1 получить нельзя.) Рассмотрим в общих чертах непрерывную г-параметри- ческую группу преобразований ®, и пусть групповое мно- гообразие описывается параметрами sn s2, ..., sr в окрест- ности единичной точки, в которой они обращаются в нуль. Благодаря этому часть группового многообразия отобра- жается взаимно однозначным непрерывным способом на окрестность начала координат r-мерного координатного пространства параметров s. Пусть п-мерное точечное мно- гообразие описывается в окрестности рассматриваемой точки координатами х19 х2, ..., хп, и пусть отображение х—>х': х; = (р((зд..лп; s„ s,) ставится в соответствие элементу (sn s2, ..., sr) абстракт- ной группы в ее реализации группой преобразований. Бесконечно малое преобразование х —> х + dx, полученное приданием бесконечно малого приращения ds параметрам s в окрестности точки s = 0, задается выражением скобки указывают, что дифференциальные отношения должны вычисляться при Si = 0, ..., sr = 0. Мы постули- руем существование материальной среды, которая запол- няет это точечное многообразие и способна выполнять те и только те движения, при которых положения ее элемен- тов в произвольный момент t' получаются из их положе- ний во время t применением преобразования из группы ®. С другой стороны, проще ее движение можно описать как результат последовательных деформаций, соответствующих инфинитезимальным операциям (15.2) нашей группы; в любой момент времени поле скоростей должно иметь
222 ГЛ. П1. ГР УППЫ И ИХ ПРЕДСТАВЛЕНИЯ ВИД (1М> где ах, ...» аг суть константы, не зависящие от положе- ния. Это г-мерное линейное семейство образует инфини- тезимальную группу движений нашей среды. Следует за- метить, что применение этих инфинитезимальных процес- сов предполагает, что функции <р/ дифференцируемы по s в точке s = 0. В теории абстрактных групп точечным многообразием является само групповое многообразие, и мы в качестве реализации берем (левые) трансляции. В окрестности единичного элемента s = 0, t = 0 в качестве закона композиции мы имеем (sOa = %(Si....S,; tlt .... tr) [a = 1.....г]. Введение меры объема в § 12 предполагает, что функ- ции % при достаточно малых t дифференцируемы по s в точке s = 0 и что при достаточно малых s они дифферецируемы по t в / = 0. Композиция инфинитезимальных элементов группы вы- ражается в виде сложения параметров а, введенных ра- венством (15.3). Поэтому могло бы показаться, будто инфинитезимальные элементы г-параметрической непре- рывной группы не должны удовлетворять никаким другим условиям, кроме того, что они образуют линейное семей- ство. Тем не менее, это не так: должны выполняться другие «условия интегрируемости». Пример шара, который ка- тится без скольжения по горизонтальному столу, пока- зывает, что возможные положения тела, инфинитезималь- ные движения которого имеют лишь три степени свободы, могут, тем не менее, образовывать 5-мерное многообразие. Условия интегрируемости, которые мы ищем и которые используют вторые производные, гарантируют, что такой ситуации не возникает. Эти условия мы получаем как выражение того факта, что коммутатор двух ин- финитезимальных элементов s, t группы также есть эле- мент группы. Этот коммутатор стремится к I, когда s приближается к единичному элементу I, каким бы ни был t, и аналогично, когда t—>1 при произвольном s. Коммутатор двух инфинитезимальных линейных отобра- жений А и В: dx = Ах, d'x = Вх
§ 15. ЗАМЕЧАНИЯ О ТЕОРИИ ЛИ 223 есть инфинитезимальное отображение АВ—БД; чтобы это показать, мы замечаем, что равенство A (s) В (/)- Г (s, /)B(/)A(s), если положить А(0) = 1, Ил, = 5 s*t as at Js, t=o приводит к равенству С=АВ—ВА. Наша главная цель при рассмотрении этих вопросов состоит в подготовке почвы для осознания, исходя из общих принципов, правил коммутации, которым подчи- няются три инфинитезимальных поворота Dx. Dy, D*. 0 0 0 0 0—1 0 1 о ООН 0 0 0 о о II 0 —1 Oil 1 0 0 • О О ОII (15.4) Как нетрудно показать, ими являются DD —-D = D D„—D9D = D„ X y y X X’ у X X y XI D2DX—DXD, — D,.. Z Л tX z у (15.5) Конечно, мы могли бы вместо группы Ь8 вращений взять в качестве основной унимодулярную унитарную группу и2 двух измерений. Две переменные, которые под- вергаются преобразованиям а этой унитарной группы, мы, как и в § 8, обозначаем через т]. Вследствие отобра- жения a—>s, которое там было построено с помощью стереографической проекции, 3-мерная группа вращений теперь возникает как представление группы ца. В качестве базиса для 3-параметрического линейного многообразия инфинитезимальных операторов группы ца мы можем взять три специальных оператора: "2Г = *2Г т1> ^Л = ~2i Sy'- dt, = у Л’ ^Л = у -2( Sz. = dr\= л; (15.6)
224 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ здесь, согласно (8.15), МГ«1' Это—инфинитезимальные преобразования группы и2, свя- занные с тремя инфинитезимальными преобразованиями Dy, Dz группы b3 в силу отображения о—>s; то, что это действительно так, нетрудно увидеть из (8.10): х~ — В2 + т]2, #~Д-(£2 + т)2)» г~2&1. Для любого заданного представления о—>-U(°) груп- пы п2 его инфинитезимальные операторы с матрицами Д-(Л4_, Ми, М.), J \ Л > у7 Z/ ' соответствующими инфинитезимальным операторам (15.6) в lt2, удовлетворяют тем же равенствам (15.5), что и Dx, Dy, D- = ... (15.7) Конечно, матрицы Мх, Му, М2 эрмитовы. По причинам, которые прояснятся в следующей главе, мы называем их компонентами момента импульса (или углового момента) ЭЛ представления а 2Л2 = М2 = Л12 + Л12 + М2 — квадратом величины момента импульса. Если ф, суть два представления с угловыми моментами ЭЛ, ЭЛ', тогда, согласно общей формуле (10.4), в гл. II, которая определяет композицию инфинитезимальных операторов посредством х-умножения, представление .бх.р имеет в качестве момента импульса величину (ЭЛх 1) + (1 хЭЛ'). Ниже мы вычисляем момент импульса ЭЛ/ неприводи- мого представления (£, = ©.• (/ = /’/2) группы и2. Как будет J 1 J 1 видно, удобнее вместо -^7-S пользоваться преобра- зованиями T(Sx + fSy): <£ = т], с?т] = О. ' T(SX —tS9): dg = O, dxi = Z. Поскольку d (S'V)= rio‘~li]sdl + (15.8)
§ 15. ЗАМЕЧАНИЯ О ТЕОРИИ ЛИ 225 то, подставляя в это выражение элементы ф) = ^(Н-5=2/, г—s = 2/n) пространства представления ©/, мы находим, что три инфинитезимальных преобразования группы ц2, опреде- ленные соотношениями (15.6), (15.8), индуцируют в этом пространстве преобразования 72 ($х + iSy) ' dx(tri) = /r(s+l)x(m—1) = = K(/ + ffl)(/—l)x(/n—1), 1/ASx—iSyY- dx(m) = yrs(r+ l)x(m+ 1) = = K(/—m) (i + m + 1) x (tn + 1), S2: dx (tri) = ryS- x (tri) = mx (tri). Следовательно, (Afx 4 iMy) (m, tn—1) = /(j + tri) (/—m + D, (Mx—iMy)(m, m+ !) = ]/(/—m) (j + tn+V), M2(tn, tri) = tn. (15.9) Все другие компоненты (m, m) обращаются в нуль. 7И2 есть кратное единичной матрицы в Л4’₽/(/4-1); в самом деле, из (Мх + iMy) (Mx—iMy) = M2x + M2-i (МхМу—МуМх) = следует, что М* = (Мх + 1Му) (Mx—iMy)—Mz 4- М2, а отсюда и из (15.9) получаем, что М2 (т, т) = (/ 4 tri) (j—tn + 1)—tn + tn2 = / (j + 1). Если при приведении произвольного представления обнаруживается, что неприводимое представление ©у встре- чается точно gj раз, то значение /(/4-1) является [(2/+ l)g/]-кратным собственным числом оператора М2, а Мг имеет собственное число т с кратностью Sg; (/-|m|, |m|4-l, •••)•
226 ГЛ. III. ГРУППЫ и ИХ ПРЕДСТАВЛЕНИЯ Отсюда мы снова видим, что кратность gj, с которой встречается при приведении представления <б, определяется единственным образом представлением^. С помощью этих бесконечно малых операций можно получить относительно простое конструктивное доказательство того, что единст- венными неприводимыми представлениями группы н2 яв- ляются представления ©у [12]. §16. Представление вращениями пространства лучей В квантовой теории встречаются представления в про- странстве состояний системы; но последнее надо рассмат- ривать как пространство лучей, а не векторов, ибо чистое состояние представляется лучом, а не вектором. Два унитарных преобразования U и et7, отличающиеся только числовым множителем, равным по модулю 1, должны, следовательно, считаться одинаковыми, U ~ в(7, так как они определяют один и тот же поворот поля лучей. В проективном (лучевом) представлении, которое связы- рает с каждым элементом s абстрактной группы g уни- тарный поворот U (s) лучей п -мерного пространства пред- ставления, калибровочный множитель e(s) можно выби- рать произвольно для каждой унитарной матрицы U (s); однако, если g является непрерывной группой, мы выби- раем его так, чтобы U (s) непрерывно зависело от s. В таком случае представление характеризует лишь условие U (s) U (t) ~ U (st), (16.1) т. е. U (s) U (t) = 6 (s, t)U(st), (16.2) где 6(s, t)—числовой множитель с единичным модулем, зависящий от s и t. Если при изменении калибровки U (s) заменяется на е (s) U (s), то 6(s, t) заменяется выражением 8 (st) 8-1 (s) 8”1 (t) 6 (s, t). В равенстве X = 2 * (s) U (s), s связывающем компоненты x(s) элемента x групповой ал- гебры с представляющей его групповой матрицей X, ве- личины x(s) тоже зависят от калибровки и переходят в e(s)x(s) при ее замене (7(s)—>-s(s) £/(s). Для того чтобы закон умножения двух элементов х, у соответство-
§ 16. ПРЕДСТАВЛЕНИЕ ВРАЩЕНИЯМИ 227 вал, как нам требуется, умножению представляющих их матриц, мы должны для заданной калибровки положить xr/(s)= 2 6(/, (16.3) tt' = s Для действительного элемента х подходит только условие x(s~1) = x(s), если калибровка выбрана так, что U (s-1) есть матрица, обратная к U ($). Таким путем групповую алгебру следует приспособить к рассматриваемому проективному представ- лению, тогда как в случае «векторных представлений» она единственным образом определяется одним только законом композиции в группе [13]. Примеры. I. Одномерные представления теперь совершенно не- интересны, поскольку любая одномерная матрица ~1. Но при определенных обстоятельствах абелевы группы могут обладать многомерными унитарными проективными представлениями, тогда как любое неприводимое унитар- ное векторное представление абелевой группы обязательно имеет степень 1. Сначала мы исследуем простейший пример—конечную циклическую группу (а) порядка h, состоящую из элементов I, а, о2, . .., afl~1 • (ah = I). Пусть элемент а соответствует унитарной матрице А в проективном представлении; тогда Ал = а1 с необходи- мостью кратна единичной матрице. Так как а по модулю равно 1, мы можем выбрать калибровку таким образом, что А перейдет в A/j/a, тогда Ал=1 и отображение ak~> Доесть векторное представление циклической группы. Поэтому подходящим изменением калибровки проективное представление можно превратить в векторное, кроме того, 6(s, t) будет равно 1. II. Следовательно, простейшим примером абелевой группы, приводящей к неприводимому проективному пред- ставлению, должна быть нециклическая группа. Рассмот- рим группу, состоящую из четырех элементов I, а, Ь, с, с таблицей умножения a2 = b2 = c2 = I, /тих , , / л < (16.4) bc — cb — a, ca = ac = b, ab = ba = c. ’
228 ГЛ. III. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Проективное представление 33 задается выражениями (16.5) Нормировка здесь выбрана таким образом, чтобы U*(a) = U (a)U(a~1) = l, и аналогично для I, Ь, с. Алгебра, определяемая соотно- шением (16.3) для этого представления, некоммутативна, несмотря на абелеву природу группы; это—алгебра комп- лексных кватернионов. • Если обозначить элементы этой алгебры через х = х! -|- р& -|~ vc, то «единицы» I, а, Ь, с имеют ту же таблицу умножения, что и соответствующие матрицы: 1 а b c I I а b c (Произведение xy находится а а I ic —ib на пересечении строки x co столбцом у.) b b —ic I ia с с ib —ta I «Вещественные» величины таковы, что все их компо- ненты х, X, р, v вещественны. Поскольку в исчислении кватернионов в качестве главных единиц выбираются I, ia, ib, ic, то у вещественных величин скалярная ком- понента х вещественна, а векторные компоненты X/i, p/t, v/i—чисто мнимые. Ш. Группа ц=ц2 унитарных преобразований а в двух- мерном пространстве с определителем 1. Рассмотрим пред- ставление ст—>(/(ст) поворотами в n-мерном пространстве лучей. Если изменить калибровку таким образом, что (/(ст) превращается в (/(ст): /det (/(ст), (16.6) то определитель новой матрицы U (ст) равен 1. Единствен- ная трудность, возникающая здесь, это то, что n-й корень е(ст) =/det (/(ст) (16.7)
§ 16. ПРЕДСТАВЛЕНИЕ ВРАЩЕНИЯМИ 229 есть многозначное число. Он является «локально» одно- значным, т. е. если мы выбрали определенный корень е0 из возможных п значений для точки а = а0, мы можем определить единственным образом корень е(а) в доста- точно малой окрестности а0 так, чтобы он зависел непре- рывно от а и превращался в ев при а=а0. Поэтому мы можем продолжить определение корня при о —а0 единст- венным образом вдоль траектории на групповом много- образии, начинающейся в а0. Остается единственный во- прос: вернется ли е (о) к своему начальному значению, если о опишет замкнутую траекторию? На это следует ответить утвердительно, потому что групповое много- образие группы и односвязно, в том смысле, что любую замкнутую траекторию можно стянуть в точку некоторой непрерывной деформацией. В самом деле, согласно равен- ству (7.5) элементы этой группы отображаются взаимно однозначным непрерывным образом на четверки (х, А, р, v) вещественных чисел, которые подчиняются условию х2 + А.2 + р2 + v2 = 1. Следовательно, групповое многообразие обладает такими же топологическими свойствами, что и 3-мерная сфера в 4-мерном пространстве. Таким образом, эти рассужде- ния показывают, что корень n-й степени (16.7) распадается на п однозначных непрерывных функций на всем группо- вом многообразии. Метод доказательства, примененный здесь и имеющий фундаментальную важность для мате- матики в целом, по-видимому, лучше всего знаком чита- телю по доказательству теоремы об интеграле Коши, ко- торое опирается на тот факт, что интеграл от аналити- ческой функции является локально однозначным и что он однозначен в целом, если область, в которой мы дейст- вуем, односвязна. Результат наших топологических рассуждений показал, что формула (16.6) определяет п однозначных непрерыв- ных функций U (а). Для одной из них U (I) есть единич- ная матрица; впредь мы только ее будем обозначать че- рез U (а). Подставив в равенство U (о) U (т) = 6 (о, т) U (ат) (16.8) значение т=1 и учтя то, что {/(!) = 1, мы находим 6(s, 1)=1. Взяв определители от обеих частей равен- ства (16.8), получаем уравнение 1 = [6(а, т)]“.
230 ГЛ. Ш. ГРУППЫ И ИХ ПРЕДСТАВЛЕНИЯ Следовательно, 6 (а, т) есть корень n-й степени из еди- ницы, который зависит непрерывно от т при фиксирован- ном а и сводится к 1 при т = 1; поэтому он тождественно равен 1, а (16.8) принимает вид U (о) U (т) = U (от). Следовательно, все проективные представления группы и2 являются векторными представлениями, и наши рассуж- дения показывают, что эта теорема верна для любой непрерывной группы, элементы которой образуют одно- связное многообразие. Если перейти к 3-мерной группе вращений Ь3 с помощью стереографической проекции, все даже с полуцелыми / однозначны, когда рассматриваются как проективные представления. «Любое однозначное не- прерывное проективное представление группы Ь3 приво- дится к неприводимым составляющим, а единственные неприводимые проективные представления суть ©Д/ = 0, 1/2, 1, 3/2, ...), полученные ранее в этой главе. Однако группа Ь3 не является односвязной; мы должны прибегнуть к двулистной покрывающей поверхности, по- добной римановой поверхности, но без разрезов и точек ветвления, которая является односвязной. Это связано с тем, что существуют неприводимые проективные представ- ления группы Ь3, которые могут быть одно- или двузнач- ными векторными представлениями, однако не может существовать многозначных представлений более высокой степени. Мне удалось доказать аналогичную теорему для n-мерной группы вращений (nZ>3) [14]. Это означает, что существуют два замкнутых непрерывных движения (т. е. движения, которые приводят назад к начальному состоя- нию) твердого тела, которое может свободно вращаться около фиксированной точки О, причем таких, что любое другое замкнутое движение можно непрерывно деформи- ровать к одному из этих двух. В качестве одного из них можно взять состояние покоя, а другое таково, что его нельзя превратить в состояние покоя непрерывной дефор- мацией.
ГЛАВА IV ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП К КВАНТОВОЙ МЕХАНИКЕ А. ГРУППА ВРАЩЕНИЙ § 1. Представление группы вращений в пространстве состояний В согласии с гл. III, § 8 мы можем следующим обра- зом интерпретировать развитую в гл. II, § 5 теорию элек- трона в сферически-симметричном электростатическом поле. Вращение в физическом пространстве, т. е. ортогональное преобразование декартовых координат от х, у, z к х', у’, г’, порождает в пространстве 91 состояний электрона (векто- рами которого являются описывающие состояние этого электрона волновые функции ф(х, у, z)) унитарное пре- образование U (s): ф—>-ф', определяемое формулой ф'« у’, г') = ф(х, у, z). (1.1) Отображение s —► U (s) является некоторым бесконечно- мерным представлением (£ группы вращений Ь3. Это пред- ставление (5 может быть разложено на неприводимые состав- ляющие ©z, и можно показать, что каждое ©z с целым I встречается в нем бесконечное число раз. Соответственно все пространство состояний разлагается на попарно ортогональные подпространства Z); sJt(n, Z) имеет размерность 2/ Ц-1, и группа вращений определяет в нем представление ©z. Если, кроме того, мы рассматриваем несобственные вращения (Ь3), то ©z всегда будет иметь в ® сигнатуру (—I)4. Бесконечномерные подпространства Z), связанные с различными значениями Z, опре- деляются однозначно, но их последующее разложение на составляющие 9i (n, I) полностью произвольно. В частно-
232 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП сти, разложение может быть выполнено так, что энергия состояний, составляющих 91 (п, I), будет иметь определен- ное значение Е (n, I). Вычислим теперь операторы, определяемые в простран- стве состояний бесконечно малыми вращениями физического пространства. Обозначая разность ф' (х, у, z)—ф(х, у, г) через t/ф, получаем, что уравнение (1.1) превращается в равенство dx + -g-dy+ dz\ = ° для бесконечно малого вращения s, которое переводит х, У, z в x' — x^dx, y'=y-\-dy, z' = z-\-dz. Взяв в качестве s три бесконечно малых вращения Dx, Dy, Dz по очереди (гл. III, (15.4)) и записав соответст- вующие инфинитезимальные унитарные операторы в виде =7 Lz) ф, мы находим т I ( д д \ /1 — • • • (1-2) Соответственно Л2 является моментом импульса (ср. гл. II, (4-9)). При переходе от одного электрона к двум векторами пространства состояний становятся функции ф(хп у1г zx; х2, Уг, za) от Декартовых координат обоих электронов. Унитарное преобразование U: ф —индуцированное в пространстве состояний вращением s, теперь определяется уравнением Ф'(*1. У1, г'1, хг, Уз, г^) —ф(Хх, у г, Zi, х2, у2, г2), где ху, y'lt zi и х2, у'2, г2 получаются из xlt ylt zx и х2, у2, г2 посредством одного и того же ортогонального пре- образования s. Эта ситуация может быть описана следую- щим образом: пространством состояний 912 системы, состоя- щей из двух электронов, является 91 х 9t, а индуцирован- ное в нем представление есть (£х®. Это представление, как мы видим, определяется только кинетическим строением системы и никоим образом не зависит от динамических соотношений; правило х-умно-
§ i. ПРЕДСТАВЛЕНИЕ ГРУППЫ ВРАЩЕНИЙ 233 жения для представления, индуцированного на произведе- нии частных систем, предполагает только кинематическую, но не динамическую независимость частных систем. Теперь мы можем, наконец, определить рассмотренную выше ситуацию, исходя из общей схемы квантовой меха- ники, способом, не зависящим от частных допущений ска- лярной волновой теории Шредингера. Это особенно важно, поскольку весьма сомнительно, чтобы материальные волны описывались только одной функцией состояния ф. Мы обнаруживаем аналогию между действительным смещением состояния системы во времени и виртуальным изменением, производимым в результате произвольного вращения пространства. Переход от времени t к времени t' заменяет (произвольные) состояния j в момент времени t. на состояния j' в момент времени t’, получаемые из j посредством унитарного преобразования U, которое соот- ветствует смещению оси времени, переводящему t в V. Смещения вдоль оси времени образуют однопараметри- ческую непрерывную группу, которая изоморфна группе связанных с ними преобразований в пространстве состоя- ний. Первая из указанных групп порождается бесконечно малым смещением t —+ t + dt, и поэтому достаточно задать соответствующий этому смещению в пространстве состоя- ний инфинитезимальный унитарный оператор ^=4-^- Как и ранее, назовем полученный эрмитов оператор Н энергией. При воздействии на физическую систему (или систему пространственных координат, в которой она описывается) виртуального вращения s состояние j переходит в другое состояние j'. Поскольку никаких изменений внутри системы не происходит, а пространство состояний линейно и уни- тарно, оператор перехода U (s): связанный с s, также должен быть линейным и унитарным. Так же как и в случае группы действительных смещений во времени, эта группа виртуальных вращений должна индуцировать в пространстве состояний 91 определенное представление 91; это представление скорее должно рассматриваться как проективное, а не как векторное представление. Если же мы переходим от группы вращений к унимодулярной уни- тарной группе и2 (или uj) посредством стереографической проекции (гл. III, § 8) и берем эту вторую группу в
234 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП качестве основной, то в соответствии с гл. III, § 16, мы не должны делать различия между проективными и вектор- ными представлениями. Группа собственных вращений может порождаться инфинитезимальными операторами, и мы в качестве их базиса можем взять операторы бес- конечно малых вращений Dx, Dyf Dz относительно осей х, у и z. В этом случае достаточно получить инфинитези- мальные унитарные преобразования му, м2п, которые эти вращения индуцируют в пространстве состоя- ний. Мы называем реальные физические величины системы, которые представляются эрмитовыми операторами Мх, М., М2, х-, у- и z-компонентами момента импульса шс. Для того чтобы выразить эти величины в обычных едини- цах, их надо, как и в случае энергии, умножить на квант действия h. Момент импульса играет по отношению к вир- туальным вращениям пространства ту же роль, что и энер- гия по отношению к действительному смещению во времени. Одним из доводов в пользу нашего определения момента импульса является то, что в применении к теории Шре- дингера оно приводит к обычным формулам классической механики. В качестве другого подтверждения его правиль- ности мы доказываем общую теорему о том, что момент, определенный таким образом, постоянен во времени. Мы видели в гл. II, § 8, что необходимым и достаточным условием постоянства во времени физической величины, представленной эрмитовым оператором А, является ком- мутативность А с эрмитовым оператором Н, индуцирован- ным бесконечно малым смещением времени. Точно таким же образом мы можем показать, что коммутативность А с операторами Мх, Му, М2 образует необходимое и доста- точное условие того, что величина, представленная А, остается неизменной при виртуальных собственных вра- щениях пространства, т. е. что А—скаляр по отношению к этим вращениям. Итак, энергия является скаляром, следовательно, НМХ—МХН = О, ... Но, с другой стороны, эти уравнения утверждают, что и Мх, Му, М2 постоянны во времени. Бесконечно малые вращения порождают только группу собственных вращений; для того чтобы получить полную
§ 1. ПРЕДСТАВЛЕНИЕ ГРУППЫ ВРАЩЕНИЙ 235 ортогональную группу, мы должны дополнить ее отраже- нием i относительно начала или расширить группу на до группы и2 посредством добавления элемента i (гл. III, § 8). Элемент i индуцирует в пространстве состояний унитарный оператор /, который коммутирует со всеми операторами U (s) и, в частности, с моментом импульса 9Jl=(Mx, М , Мг), и удовлетворяет уравнению //=1; это уравнение показы- вает, что оператор / является одновременно эрмитовым и унитарным. Величина А, которая не изменяется при отражении, должна коммутировать с. /; отсюда следует, в частности, что оператор энергии также должен коммути- ровать с I. Физическая величина, называемая четностью и представляемая оператором I, постоянна во времени, так как этот оператор коммутирует с Н. Как и все дру- гие, появляющиеся в теории групп величины, не связан- ные с инфинитезимальными операторами, она не имеет никакого аналога в классической механике. Мы приводим общее пространство состояний к под- пространствам, инвариантным по отношению к группе сме- щений по времени; такое инвариантное подпространство переходит само в себя при порождающем бесконечно малом воздействии dx = -^-Hy. Поскольку мы имеем здесь дело с однопараметрической абелевой группой или с единствен- ным (порождающим) оператором Н, приведение может быть доведено до того, что все составляющие подпространства станут одномерными. Состояния, содержащиеся в одном из этих инвариантных подпространств, мы называем кван- товыми состояниями. Точно таким же образом мы переходим к разложению представления 91, индуцированного в пространстве состоя- ний группой вращений, на его неприводимые составляю- щие ©у. Мы используем тот факт, что они известны нам априори; от частного представления 9? зависит только кратность, с которой они встречаются в 9?. (Правда, мы еще не выяснили, что элементы £); действительно образуют полную систему неприводимых представлений Ь8, и может показаться рискованным применять процесс приведения к бесконечномерному представлению 91. Эта процедура, однако, может быть оправдана тем, что Ь8—замкнутая группа. В окончательной же формулировке квантовой меха- ники не будет необходимости основывать наши заключения на столь общих положениях, поскольку приведение к ©у будет получаться элементарно.) Таким образом, все
236 rjl. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП пространство состояний 9ft разлагается на подпространства fRy, 9i/z, ...» такие, что имеет размерность 2/4-1, и группа и2 порождает в нем представление В резуль- тате приспособления системы координат в пространстве состояний к этому разложению переменные разделятся на классы х(т) (tn =j, —j); х'(т') (m' — j', j'—l, —ГУ, . . . , под воздействием произвольного образования о из ц2, при- мененного к переменным т|, координаты пространства состояний преобразуются в согласии с законом х(т)~у^== (i + k = 2j, i—k = 2tri). С приведением пространств Э? или Я? связано приведение момента импульса ЯЛ; в пространстве Э?у компоненты ЯЛ задаются формулой гл. III (15.9), из которой следует, что квадрат момента импульса Л12 имеет теперь фиксированное значение / (/ + 1). (Из общих соображений очевидно, что квадрат момента импульса М* должен быть кратным еди- ничной матрице в пространстве Лу, так как он является скаляром и поэтому должен коммутировать со всеми опе- раторами неприводимого представления ©у.) Если состоя- ние системы представляется вектором, расположенным в Лу, то z-компонента его момента импульса может принимать значения m = j, j—I, ...,—/; естественно, z-компонента лишь случайно имеет предпочтительный статус, вследствие того, что координаты в Лубыли выбраны так, чтобы выде- лить ось z из остальных. То, что Мг, М2 могут априори принимать только дискретные значения т, j (j +1), по существу связано с тем, что группа вращений компактна; поскольку группа смещений во времени некомпактна, анало- гичный результат для энергии, вообще говоря, не является справедливым. В этой связи мы вновь хотим подчеркнуть, что оператор Н зависит от динамических соотношений, имеющих место в системе, тогда как представление Я1, индуцированное группой вращений, определяется только кинематической ситуацией (числом элементарных частиц и т. д.). Четность / также принимает одно определенное значение из ±1 в каждом подпространстве Лу. Так как лучшего названия нет, то мы назовем состояния, распо-
§ I. ПРЕДСТАВЛЕНИЕ ГРУППЫ ВРАЩЕНИЙ 237 ложенные в пространстве Siy, которое инвариантно отно- сительно группы вращений, «простыми» состояниями с внутренним квантовым числом j. Мы должны быть готовы к тому, что / в данном случае, в отличие от тео- рии Ш редингера, может принимать как целые, так и полу- целые значения. Объединив две кинематически независимые системы с пространствами состояний Si, Si', в которых группа вра- щений индуцирует представления 9i, 9Г, мы получаем систему, имеющую в качестве пространства состояний про- странство Six Si', в котором индуцируется представление Six Si'. Тогда момент импульса общей системы равен (ЭЛх 1) + (1 хЭЛ'), где ЭЛ и ЭЛ'—угловые моменты составляющих систем. Теорема о том, что момент импульса ведет себя адди- тивно по отношению к композиции, опирается только на предположение, что части кинематически независимы, тогда как соответствующая теорема для энергии применима только в случае, когда они динамически независимы, т. е. при отсутствии взаимодействия между частями. Это отличие связано с тем, что в то время как энергия представляет реальное изменение состояния, связанное со временем, мо- мент импульса представляет виртуальное изменение, свя- занное с вращением системы координат. Мы приводим Si, Si' к инвариантным неприводимым подпространствам Si/, Si/, соответственно, т. е. к простым состояниям двух состав- ляющих систем, имеющих внутренние квантовые числа /, Тогда уравнение Клебша — Гордана (гл. III, § 5), имею- щее вид: S)/X ©/. = £>/+/, 4-©/+/._i-Т ... + ®|/-/'[, (1.3) говорит нам следующее: если две составляющие системы находятся в простых состояниях с внутренними кванто- выми числами j, j', то полная система обладает всеми простыми состояниями с внутренними квантовыми числами i+i'-i.......I/—/'I. (1-4) приписываемыми этим состояниям, причем каждое состоя- ние встречается точно один раз. Включая в рассмотрение четность, мы должны к этому добавить следующее: если парциальные системы имеют четности б, б' (б=±1), то четность полной системы принимает значение бб'.
238 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Сравним результаты, которые мы получили, с соответ- ствующими результатами, получаемыми методами класси- ческой механики. И здесь, и там момент импульса постоя- нен во времени, а момент импульса целого равен сумме моментов импульсов частей. Поскольку для двух векторов величины /, j' результирующим является вектор с вели- чиной J, расположенной между этими значениями, то обо- значив величину момента импульса в классической теории через /, мы, в согласии с (1.4), имеем Квантовая механика отклоняется от классической в сле- дующих трех отношениях: 1. В квантовой механике квадрат момента импульса равен /(/ + 1). в классической механике он равен р. 2. Квантовый j может принимать только дискретные значения 0, 1/2, 1, 3/2, классический может прини- мать любые неотрицательные значения. 3. Квантовый J, полученный при сложении двух пар- циальных систем, может принимать только те значения между |/—/'|, / + /', которые отличаются друг от друга на целое число', классический может принимать любое зна- чение между этими пределами. Еще до возникновения новой квантовой механики было дано полуэмпирическое описание закономерностей, наблю- давшихся в спектрах, с помощью векторной модели, содер- жащей векторные моменты импульсов отдельных электро- нов и атома в целом; наблюдения, которым сопутствовала старая квантовая механика, уже привели к этим трем видоизменениям классической теории [1]. Читатель будет, вероятно, удивлен, что мы рассматри- ваем 'только виртуальные вращения пространства, а не переносы, которые также следует учитывать для получения полного описания однородности пространства. Дело в том, что при изучении атомов или ионов мы исследуем в каче- стве частиц только электроны, приняв ядро за фиксиро- ванный силовой центр, расположенный в начале коорди- нат. Это справедливо, по крайней мере приближенно, так как масса ядер во много раз больше массы электронов. Вследствие этого пространство преобразуется из однород- ного в пространство с центром; такая процедура, естест- венно, позволяет нам рассматривать лишь те атомы или ионы, которые имеют только одно ядро. Двухатомные же молекулы описываются не с помощью полной трехпара-
§ 2. ПРОСТЫЕ СОСТОЯНИЯ И АНАЛИЗ ТЕРМОВ 239 метрической группы вращений пространства, а посредством однопараметрической группы вращений относительно оси, соединяющей два ядра; если два ядра физически эквива- лентны, мы должны еще добавить отражение в плоскости, делящей ось пополам [2]. В случае трех или более фикси- рованных ядер симметрия либо полностью исчезает, либо она сводится, самое большее, к конечной группе враще- ний [3]. § 2. Простые состояния и анализ термов. Примеры Каждому собственному значению Е' энергии Н соот- ветствует определенное подпространство 91' из 91—под- пространство квантовых состояний с уровнем энергии Е’; оно включает все состояния х, которые преобразуются под действием Н в £'•?, и, следовательно, является собствен- ным пространством 91 (Е'), связанным с собственным зна- чением Е' оператора Н. Так как энергия—скаляр, то к 9i' могут быть применены те же выкладки, которые проводи- лись в предыдущем параграфе для пространства 91: под- пространство 9t' инвариантно относительно операторов, индуцированных в пространстве состояний группой вра- щений, и следовательно, является носителем определенного представления этой группы, которое может быть приведено к неприводимым составляющим. Если уровни энергии имеют конечную кратность, мы сталкиваемся с проблемой приведения представлений только конечного порядка. Сле- довательно, 91 разлагается на «простые пространства» Oiy, связанные с группой вращений таким образом, что в них не только квадрат углового момента и четность имеют определенные значения, но и энергия также имеет точно определенное значение Ej. Этот энергетический уровень Ej обязательно (2/4-1)-кратно вырожден; мы говорим о слу- чайном вырождении, когда равны уровни энергии различ- ных простых подпространств 9iy. Величины I, М2, М2 и Н все одновременно имеют диагональную форму; это воз- можно потому, что эти четыре оператора коммутируют между собой. Таким образом, в анализе термов можно применять приведение к простым состояниям: каждый энергетический уровень Ej обладает внутренним квантовым числом /, которое придает терму естественную кратность 2j-f-1. В результате воздействия на атом возмущающего поля, которое уничтожает его естественную сферическую сим-
240 ГЛ. IV. ПР ИМЕНЕНИЕ ТЕОРИИ ГРУПП метрик», этот (2/4-1 )-кратный терм разлагается на 2/4-1 тер- мов. Пусть возмущение, точнее, его гамильтонова функ- ция W, обладает аксиальной симметрией относительно оси z; если уровень Ej не имеет случайного вырождения, то в согласии с теорией возмущений возмущенные уровни энергии определяются в первом приближении той частью эрмитова оператора W, в которой скрещивается само с собой: х(т) —»- У W (т, т')х(т') (т' = j, j—1, • • •, — /). Вращение вокруг оси z на полярный угол <р преобразует х(т) в е(—ту)-х(т), и, так как мы предполагали, что W симметрично, это отображение на себя также должно выражаться формулой е(—/пф)-х(/и) = 2 (m> /п')-е(—т'ф)х(т'), или W (т, т')е[(т—m')q>] = W (т, т'). Но это означает, что все элементы W (т, т'), кроме эле- ментов на главной диагонали, обращаются в нуль, отсюда числа Ej + W(m, т) (2.1) представляют собой 2/4-1 возмущенных терма. Квантовое число т, принимающее значения /, /—1, ..., —/, служит, таким образом, для перенумерования этих компонент. Вероятно, наиболее важным аксиально-симметричным воз- мущением является возмущение, возникающее от однород- ного магнитного поля в направлении оси z (эффект Зее- мана)-, поэтому т называется магнитным квантовым числом. Внутреннее квантовое число / терма можно опре- делить спектроскопически при подсчете числа термов, воз- никающих при эффекте Зеемана. Зоммерфельд был первым, кто на основании спектроскопических данных заключил, что /, так же как и т, может принимать полуцелые значения. Если бы мы хотели описать эффект Зеемана по аналогии с классической формулой гл. II (12.5), то полу- чили бы формулу 0-^1, (2.2) и матрица W имела бы строго диагональный вид: W (т, tri) = horn. (2.3)
§ 2. ПРОСТЫЕ СОСТОЯНИЯ И АНАЛИЗ ТЕРМОВ 241 Наш анализ показывает, что расщепление энергетических уровней, вызванное аксиально-симметричным возмущением, походит на приведение неприводимого представления группы вращения Ь3, ограниченного группой Ьа вращений вокруг оси z; при этом приводится к сумме 2/4-1 одномерных представлений, которые мы ранее обозначали как х (т) —► е (— тер) • х (т). Если две кинематически независимые части, находя- щиеся в простых состояниях 9iy, складываются вместе, то состояние полученной системы располагается в (2/ 4- 1)х х (2/'+ 1)-мерном пространстве-произведении ^,==8^ х Э?/,. Если части системы имеют энергии Ej, Ер, то система в целом приобретает энергию Ej + E'p, при условии, что нет никакого взаимодействия между частями. Вводя сла- бое взаимодействие между двумя составляющими системами и предполагая, что отсутствует случайное вырождение, т. е. что остальные энергетические уровни невозмущенной системы отличаются от получаем, что в первом при- ближении достаточно рассматривать сечение <#> оператора энергии Н, для которого 9t/j' скрещивается с самим собой; это есть эрмитово отображение пространства на себя. Мы можем применить выкладки, сделанные выше для общего пространства состояний 9ixfR', к каждому из этих раскладывается на подпространства, соответст- вующие численно различным собственным значениям <//>. Группа вращений индуцирует в каждом из этих подпро- странств определенное представление, которое, в свою очередь, может быть разложено на неприводимые состав- ляющие. В результате произведение Э1/х91р, в согласии с рядом Клебша — Гордана, приводится к простым про- странствам J = j + j', /4 j'—1, ..., |/—j'|, таким образом, что в каждом из них энергия <//> имеет опре- деленное значение Ej. Различные Ej только «случайно» могут иметь одинаковое численное значение. Следова- тельно, терм Ejp разлагается при возмущении на термы Ej точно таким же образом, как представление £)ух®// приводится к неприводимым представлениям Это, однако, справедливо только в приближении, принятом в теории возмущений. Как было показано выше, внутрен- нее квантовое число J можно строго приписать терму Е; в принятом нами приближении наряду с этим числом вводятся связанные с ним внутренние квантовые числа /, /'
242 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП частей (в предыдущем анализе—электронов): энергети- ческий уровень Е возникает из определенного терма Ец, невозмущенной системы при взаимодействии двух ее частей. Хотя такая связь возможна, строго говоря, только для «простых» состояний, принципы, положенные в ее основу, в косвенной и приближенной форме приводят к анализу термов [4]. Примеры. Если скалярная волновая теория Шредингера спра- ведлива для электронов, то простое состояние электрона в поле ядра характеризуется главным -квантовым числом п и азимутальным *) квантовым числом I. Такой терм яв- ляется (2/ +1)-кратно вырожденным, и мы предполагаем, что здесь отсутствует случайное вырождение. Угловой момент представляется оператором 2, взятым из класси- ческой теории; квадрат его абсолютной величины равен 1(1 + 1), а четность имеет значение (—I)1. Если собираются вместе f электронов и образуется атом, то пренебрегая взаимодействием между электронами, мы получаем терм Е (ni> 4) + Е (п2,1г) + ... + Е (rif, If) (2-4) кратности (2/х4-1) ... (2/j-|-l). Квантовые числа п и I относятся к отдельным электронам. Взаимодействие вызы- вает расщепление этого терма, напоминающее полное приведение с помощью ряда Клебша—Гордана представ- ления ®Z1x£)z2x ...x£)Zf (2.5) к его неприводимым составляющим ©д, где L—общее азимутальное квантовое число. Каждый такой терм свя- зывается с квантовыми числами • • •, L). (2.6) Если /^3, то некоторое представление будет появ- ляться в (2.5) более одного раза, и мы поэтому сможем получить несколько (2L +1)-кратных термов, связанных с одним и тем же набором (2.6); эти термы должны раз- личаться между собой посредством некоторого дополни- тельного индекса. Квадрат их общего углового момента равен L(L + 1), а четность дается числом (—1)/,+/»+- ••+,д *) Мы здесь используем вместо слова «внутреннее» слово «азиму- тальное».
§ 2. ПРОСТЫЕ СОСТОЯНИЯ И АНАЛИЗ ТЕРМОВ 243 В спектроскопии обычно значениям 1 = 0, 1, 2, 3, 4, ... ставят в соответствие строчные латинские буквы s, р, d, f, g, ..., а значениям L = 0, 1, 2, 3, ...—прописные буквы S, Р, D, F, ... Мы не можем полагаться на то, что скалярная волно- вая теория приведет нас к достоверным результатам, и должны быть готовы описать состояние волнового поля посредством величины -ф с несколькими, скажем а, ком- понентами ('Ф1, "фя, • • • , ty0), т. е. посредством ковариант- ной величины определенного типа 31. Каждая ее компо- нента является функцией пространственных координат х, у, г; компоненты будут зависеть от выбора декартовых координат таким образом, что в результате перехода к но- вой системе координат при вращении s компоненты будут претерпевать такое преобразование A (s), которое соот- ветствует s в представлении 91. Рассмотрим вновь в ка- честве фундаментальной группы и2. Общая компонента фа(х,«/, г) «вектора» ф имеет два индекса: индекс а, про- бегающий значения от 1 до а, и индекс (х, у, г), пробе- гающий все точки пространства. Пусть —векторное пространство функций ф(х, у, z), а есть «-мерное век- торное пространство; пространством состояний электрона будет тогда произведение Под влиянием враще- ния s, которое переводит х, у, г в х', у', г', состояние ф переходит в состояние ф', определяемое уравнением ф; (х' , у', г') = 2 Me (х, у, г), [ аар || = A (s); ₽ при этом в пространстве состояний будет индуцироваться представление 9? = 91х®. Момент импульса электрона 2R состоит из двух частей: 9И=(©х1) + (1хй), (2.7) первая из которых относится к «-мерному «спиновому пространству» а вторая к «пространству переносов» Величина (IxLJ или просто Lx—это оператор Т\Удг—zdyr КОТ°РЫЙ деиствУет на каждую из а ком- понент одинаково; он воздействует только на индекс (х, у, г), оставляя индекс а неизменным. Оператор -j-Sx есть унитарное преобразование, соответствующее беско- нечно малому вращению вокруг оси х в представлении 91; оператор (<5лх1), или просто Sx, следовательно, воз-
244 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП действует только на индекс а и оставляет индекс (х, у, z) неизменным. В классической механике фигурирует только 2; эту часть момента импульса мы называем орбитальным моментом импульса, а остальную его часть ©—спи- новым моментом импульса или просто спином. Появление последнего неизбежно, если волновая вели- чина ф не является просто скаляром или набором скаляров. Каждая из этих двух частей в отдельности удовлетворяет правилам коммутации гл. III (15.7), но в целом только полный момент импульса удовлетворяет закону сохранения. Если величина ф—простого типа, т. е. если 51 является неприводимым представлением то а — 2s 4-1 и спин © равен моменту импульса 90^, свя- занному с представлением Поскольку теория Шредингера оказалась по крайней мере приближенно правильной, следует предположить, что в первом приближении каждая из компонент фа удовлет- воряет скалярному волновому уравнению Шредингера. До тех пор, пока мы принимаем это приближение, един- ственным проявлением существования а компонент яв- ляется умножение кратности каждого уровня на а. Но в действительности правильное дифференциальное уравне- ние должно содержать некоторый член, «спиновое возму- щение», который вводит связь между разными компонен- тами фа. Таким образом, электрон абстрактно можно рассматривать как составную систему, состоящую из электронного переноса с пространством состояний 9tf и электронного спина с пространством Э?а; спиновое возмущение является слабым взаимодействием между ними. Здесь можно, следовательно, применить метод композиции. Пусть 51 = 3\. Разложим пространство переносов Я?# на (2/ + 1)-мерные подпространства Э?(п, /); соответствующий энергетический терм Е(п, I) с азимутальным кван- товым числом I имеет, если пренебречь'* спиновым возмущением, кратность а(2/ -|-1), и его собственным пространством является пространство 9lex9i(n, Z) той же размерности. При учете первого порядка спинового воз- мущения этот терм’расщепляется на термы Ej с внутрен- ними квантовыми числами / и кратностями (2/ -ф 1) спо- собом, аналогичным разложению представления на его неприводимые составляющие с помощью рядов Клебша—Г ордана'^ / = s + Z, S4-/-1, ..., |/-s|. (2.8)
$ 3. ПРАВИЛА ОТБОРА И ПРАВИЛА ИНТЕНСИВНОСТЕЙ 245 Следует строго различать азимутальное (/) и внутреннее (/) квантовые числа. Внутреннее квантовое число может принимать значения, заданные в (2.8); всякий раз, когда I s, количество различных термов в таком чмулыпиплете» равно 2s +1. Величина L2 приближенно равна постоянной 1(1величина S2 приближенно равна постоянной s(s4~l)> а М2 строго постоянна и точно равна j (/ + 1). Таким образом, мы можем говорить об азимутальном квантовом числе реального энергетического терма только в приближении теории возмущений. Заранее изложив эти соображения и хорошенько их запомнив, мы можем теперь перейти к анализу спектроскопических данных, что мы и сделаем в § 4. § 3. Правила отбора и правила интенсивностей Мы возвращаемся к рассмотрению нашей системы в целом, без разделения ее на отдельные электроны, и вновь обозначаем общее внутреннее квантовое число через /. Пусть А — произвольная физическая величина системы, и пусть она представляется эрмитовой формой Л; мы записываем ту часть этой формы, в которой скре- щивается с в виде 2«(яг> т')х(т)х' (т'), (3.1) где индексы т, т' пробегают значения т = /, /—1, = /' —1, (3.2) Если величина А—скаляр, то оператор А коммутирует с операторами (7 (s), индуцированными в пространстве состояний вращениями s. В результате разложения на неприводимые подпространства 3L, вследствие фунда- ментальной теоремы гл. Ш (10.5) теории представлений, сечение(3.1) формы А, соответствующее переходу обращается в нуль при j' j и кратно (2/ + \)-мерной единичной форме ^х(т) х' (т), т если j' = ) Аналогичная ситуация имеет место для группы Ь, вращений вокруг оси г. По отношению к ней общее про- странство состояний системы разлагается на одномерные инвариантные подпространства 91(я,), в которых вращение на угол ф индуцирует представления Ф<я>: х (/«)—►
246 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП —>с(—/шр)х(/п). Если мы предполагаем, что физическая величина А обладает аксиальной симметрией относительно оси z, то коэффициент а (т, т') обращается в нуль всякий раз, когда магнитные квантовые числа тит' начального и конечного состояний различны. Рассмотрим теперь вместо скалярной величины А век- торную величину q с тремя компонентами qx, qy, qz. Этот случай представляет особый интерес, поскольку величина такого типа, а именно электрический дипольный момент атома q, определяет взаимодействие между атомом и из- лучением—в том приближении, в котором линейными размерами атома можно пренебречь по сравнению с дли- ной волны испускаемого света. Если вырождение энерге- тического уровня Ej нарушается внешним аксиально- симметричным возмущением, например, однородным магнит- ным полем, направленным по оси г, то спектральная линия, вызванная переходом 8lj—»jft.j, от терма Ej к терму Ej,, разделяется на линии, связанные со всеми возможными переходами (Шу, т)—>(Ш)„ т'). Вычислив часть эрмитовой формы, соответствующей электрическому дипольному моменту, для которой пространство Шу скре- щивается с Ш/,: Jq(m, m')x(m)x'(m'), (3.3) получаем, что отношения квадратов | q (т, иг) |2 абсолют- ных значений ее коэффициентов определяют относитель- ные интенсивности этих (2/ +1)(2/' +1) линий. Так как компонента q2 аксиально-симметрична относительно оси г, то qz (т, т') = 0 при т' =/= т; таким образом, для z-й ком- поненты электрического момента мы имеем правило отбора qz: т->т. (3.4) При вращении на угол <р вокруг оси z величины х(т), qxA-iqy, qx—iqy умножаются на е(—/п<р), е(<р), е(—<р) соответственно. Следовательно, выражение х (т) х' (nt) умножается на е[(т—т')(р], откуда мы получаем правила отбора для х- и у-компонент величины q <7x + i<7y: т^т— 1; qx — iqy: m — m+l. (3.4') Для магнитного квантового числа допустимы только переходы т—+т—1, т, /п+1, (3.5)
§ 3. ПРАВИЛА ОТБОРА И ПРАВИЛА ИНТЕНСИВНОСТЕЙ 247 причем первый и последний переходы порождают две волны с круговой поляризацией в плоскости ху в противополож- ных направлениях, а оставшийся переход т-»-т порож- дает волну с линейной поляризацией в направлении оси г. Если уравнения (2.3) для эффекта Зеемана выполняются, то волновое число компоненты т —> т' отличается от своего невозмущенного значения на величину о(т—т'). Таким образом, в «нормальном эффекте Зеемана» мы получаем вместо (2/ + 1)(2/' + 1) компонент только три, поляризации которых описаны выше, а волновые числа оказываются смещенными на величину 0, ±о. Разрешение двух тер- мов Ej, E'j, скрыто почти полностью, так как множитель пропорциональности ho в (2.3) имеет одно и то же зна- чение для обоих термов. К счастью, в большинстве наблю- давшихся в действительности случаев проявляется «ано- мальный эффект Зеемана», в котором явно можно увидеть разрешение термов; чтобы объяснить это явление, мы должны изменить выражение (2.2) для возмущения, вызван- ного магнитным полем. Однако указанное выше правило отбора для магнитного квантового числа, полученное из фундаментальных принципов теории групп, справедливо в любых случаях. Правило отбора для внутреннего квантового числа j получается аналогичным образом. Три компоненты qx, qy, q2 вектора q подвергаются преобразованию s в самих себя, когда х(т), х' (т') подвергаются преобразованиям, отве- чающим s в представлениях фу, соответственно. При переходе от группы Ьа к группе на преобразование s свя- зывается с элементом а из и, в представлении Сказан- ное является просто проявлением того факта, что q—век- тор. В согласии с терминологией, введенной в гл. III, § 14, сумма из (3.3) является векторной величиной в пространстве представлений для ©уХ©/.. Интересно определить, сколько вообще имеется линейно независимых величин этого типа. Их число определяется тем, сколько раз ©j встречается в 2)yX©z. или ©/Х©/. в качестве неприводимой составляющей. Но, в соответствии с (1.3), ©1 встречается в ©уХ©/. точно один раз, при /" = j—1, или /, или /4-1, и вообще отсутствует в противном случае; кроме того, мы должны исключить случай 7 = 0, /' = 0. Таким образом,
248 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП мы получаем правило отбора /-*/ —1. /> / + 1 (3.6) с той оговоркой, что случая 0—>-0 не бывает. Поскольку существует только одна линейно независимая векторная величина в пространстве представлений для ®/Х®/,, то в случаях, для которых удовлетворяется правило отбора, компоненты q (т, т') определяются путем теоретико-груп- повых выкладок с точностью до постоянного множителя пропорциональности. Чтобы вычислить векторную величину (3.3) для /' = j—1, мы поступаем следующим образом. Пусть £, тр, £', т]'—две произвольные точки на единичной сфере, которые преобразуются контрагредиентно относительно и. Тогда величина gg'-f-туг)' является фундаментальным ин- вариантом, и три формы, получаемые из ^-(W+nnr (3.7) умножением на -I2, П2. (3.8) преобразуются таким же образом, как (x + it/)-, (х—iy)-, z-компоненты вектора соответственно. Они являются ли- нейными по одночленам степени k 4- 2 = 2/ и одно- членам £'r'rfs' степени k — 2j'. Вводя в качестве координат в пространствах представлений £)/, S)/. переменные X(m) /-ТЫ’ ( } /717! (2/ = r + s = ^ + 2, 2m = r—s; 2j' — r'-}-s' = k 2т' = г'—s'), мы находим, что три упомянутые выше формы являются выражениями типа (3.3) с j' — j—1. Например, для (х-|-^-компоненты мы получаем _ v (1ё')г~8(ппУ к,__________v , к (г—2)!s! *s /ris| /(r-2)!s! (r —2) + s=ft ' ' ' x Vr (r— 1) = — 2K(/ + tn) (j + tn— l)x(m)x'(m—\). m В соответствии с правилом отбора т—> т—1, в этом выражении встречаются только те члены, для которых т' = т—1. Вычисляя таким же способом (х—iy)-, z-ком-
§ 3. ПРАВИЛА ОТБОРА И ПРАВИЛА ИНТЕНСИВНОСТЕЙ 249 поненты, мы находим для перехода (Ях + Чу)(т, /п—1) = — ]/(/+/») (/+/»—О. (qx—4v)(tn, от 4-!) = /(/ —от) (/—от—1), (3.9) qz(m, m) = V(i— Чтобы вычислить компоненты для перехода / = /', мы должны заменить (3.8) на 2£'т], £'Г—т)Ч которые также преобразуются подобно (x + iy)-, (х—iy)- и z-компонентам вектора. И, наконец, для перехода /" = /4-1 мы должны заменить (3.8) на т)'2, —?'2, £'т|'. Так как момент импульса ЯЛ—вектор, то формулы для перехода / —► j должнь/ естественно согласовываться с ра- нее полученной для ЯЛ формулой гл. III (15.9), а по- скольку оператор q—эрмитов, формулы для перехода / —► j 4-1 должны получаться при эрмитовом сопряжении компонент векторов в формулах для перехода / —► j — 1; (Ях + Ч„) (т, т—1) = V(j+m) (J—m+1), (qx — iq!J)(tn, от+1) = /(/—от)(/4-т4-1), (3.9') qz (m, tn) = m\ (Ях + iqv) (tn, tn—A) — /(/•—OT4-1)(/—OT4-2), (Ях~4y)(tn, от 4-1) = —V(/+ot+ l)(/4-ffl4-2), (39„ qz(m, m) = y(j + m+l)(i—m + l). В каждом из этих трех наборов формул правые части определяются только с точностью до общего коэффициен- та пропорциональности, который не зависит от т и не может быть полностью определен с помощью теории групп; он может быть найден только при интегрировании волно- вого уравнения для динамической модели атома. Все ко- эффициенты, не входящие непосредственно в выписанные выше формулы, равны нулю. Квадраты абсолютных зна- чений коэффициентов дают (относительные)) отношения интенсивностей компонент, на которые расщепляются линии при возмущении.
250 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Уже до того, как возникла новая механика, формулы (3.9) для интенсивностей компонент линии, испускаемой под воздействием магнитного поля, были получены из экспериментальных данных при помощи принципа соответ- ствия [5]. В новой квантовой механике, как мы видели, они следуют из наиболее общих принципов, и мы нахо- дились бы в серьезном затруднении, если бы эти форму- лы оказались неправильными. Тем не менее, следует по- мнить, что они могут оказаться неверными, если: (1) сферическая симметрия системы нарушается внешними возмущающими полями, или (2) для коротких длин волн взаимодействие между веществом и излучением определя- ется не только электрическим дипольным моментом. Так как дипольный момент является истинным векто- ром, т. е. компоненты qx, qy, qz переходят в —qx, —qy, — qz при отражении i относительно начала координат, представление ©!, индуцированное на них группой и2, имеет четность —1. Если четности для 91/, 9t}, равны 6, 6', то под воздействием отражения i выражение (3.3) умно- жается на 66'. Соответственно должны обращаться в нуль все коэффициенты q (m, /и'), для которых не выполняется условие 66' = —1; правило отбора для четности имеет вид\ б^-б. Если отдельные электроны описываются с помощью скалярной волновой теории, то полное азимутальное кван- товое число L атома может принимать только значения L—1, L, L+1, тогда как сумма азимутальных кванто- вых чисел отдельных электронов /1 + /2+•••+(/ может изменяться только на нечетное целое число (правило Лапорта). В случае одного электрона, / = 1, с этими правилами согласуются только переходы I —> I ± 1; этот результат уже был получен в гл. II, § 5 в теории сфери- ческих гармоник. Теперь мы рассмотрим некоторую физическую задачу, решение которой получается с помощью формул (3.9) и будет нами использоваться в дальнейших выкладках. Пусть некая система в простом состоянии 91/ связыва- ется со второй такой же системой, находящейся в про- стом состоянии 91/,, и вместе они образуют одну полную систему. В пространстве = X 91/, группа п2 инду- цирует представление ® = Ф/х!Р/,; пусть соответствую- щий момент импульса есть 9л. В результате приспособ-
§ 3. ПРАВИЛА ОТБОРА И ПРАВИЛА ИНТЕНСИВНОСТЕЙ 251 ления нормальной системы координат в пространстве Луу, к полному разложению представления © на неприводи- мые составляющие матрица разбивается на квад- ратные подматрицы SJlj длины 2J +1, расположенные вдоль главной диагонали, соответственно разложению на подпространства Л/. То же самое, однако, не верно для момента импульса ?0iy- х 1 первой составляющей сис- темы, и нам нужно поэтому определить часть матрицы, в которой продпространство скрещивается само с со- бой. Т. е., выражаясь физическим языком, мы должны опре- делить среднее по времени значение момента импуль- са первой системы в состоянии, определяемом квантовы- ми числами /, j"; J обеих частей и целого. Мы принимаем, в соответствии с теорией возмущений, что взаимодействие между частями расщепляет уровень энергии Ejj, на раз- личные уровни Ej. Так как —вектор, то, применяя те же самые рассуждения, что и для электрического ди- польного момента, мы приходим к выводу, что его часть, соответствующая переходу J —> J, должна быть крат- ной ЭЛ/: <(/xl>j = zrW (3.10) Для того чтобы вычислить коэффициент пропорциональ- ности х, мы образуем скалярное произведение матриц X 1) и SQ1; поскольку 9Л = (9ЛУ х 1) + (1 х 9ЛУ,), то эти матрицы коммутируют, и мы получаем + X I)2—2Ш1(9Лу х 1), или 2ЭП(9ЛуХ 1) = /(/ + 1)-/'(/' + 1) + Ж (3.11) причем, так как в первоначальной системе координат вы- ражение (9Лу х I)2 равнялось /(/+1), умноженному на единичную матрицу, то равенство (3.11) остается неизмен- ным и в новых координатах. С другой стороны, выраже- ние 9Л(9Лу X 1) равняется xj-«/(/ + l), умноженному на единичную матрицу в подпространстве что следует из (3.10). Следовательно, из (3.11) мы имеем 2х7 J (J + 1) = / (/ + 1)-/'//' + 1) + J (J + 1), х 1 । /(/ + 1)—/'(/' +О (3 |2)
252 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП § 4. Вращающийся электрон, мультиплетная структура и аномальный эффект Зеемана До сих пор мы игнорировали тот факт, что термы щелочных спектров, характеризуемые двумя квантовыми числами n, I, в действительности не являются простыми. Каждый из них—за исключением s-термов (/=0)—в дей- ствительности состоит из тонкого дублета. Из § 2 мы знаем, что (п, /)-терм в магнитном поле должен расще- питься на 2/4-1 компоненту; вместо этого мы обнаружи- ваем, что один из дублетных термов расщепляется на 2/ компонент, а другой—на 2/+ 2. Следовательно, мы долж- ны приписать им внутренние квантовые числа j=*l—1/2, /4-1/2 соответственно. Наши общие рассмотрения уже позволяют объяснить это несоответствие. Величина ф, описывающая волновое по- ле, является не скаляром, а ковариантной величиной ти- па ©i/2, имеющей две компоненты (фх, ф2). Об этом гово- рит теория дублетных явлений, развитая В. Паули [б]. Этот вывод кажется простым после того, как вас к нему подготовили предыдущими параграфами, однако истори- чески сложилось так, что это систематическое обоснова- ние было развито только после открытия Паули. Совер- шенно не важно, связываем ли мы с элементом i в пред- ставлении ©1/2 группы ц2 матрицу 4-1 или матрицу —1. Если принять первую из этих альтернатив, то четность в квантовом состоянии (n, I, j) приобретает значение (—1)г; следовательно, правило Лапорта остается верным и при учете спина. Далее, мы получаем, что правила от- бора, относящиеся к полному внутреннему и полному магнитному квантовым числам, также верны. В представ- лении ©1/2 преобразование ст соответствует элементу ст из группы ц2 и, согласно гл. III, (15.6), спиновый момент импульса равен 1/2<S, где S—определенный ранее вектор с компонентами Н-l' HUI- До сих пор мы не пытались отразить в волновом урав- нении специфический эффект спинового возмущения. Перво- начально изображали электрон как малую материальную сферу, вращение которой приводит к возникновению спи- на; таким образом, Уленбеком и Гоудсмитом [7] был вве- ден добавочный момент импульса, требуемый спектроско-
§ 4. ВРАЩАЮЩИЙСЯ ЭЛЕКТРОН 253 ническими данными. Так как компонента Зг принимает лишь значения ±1, то может показаться, что ось спина квантуется только вдоль положительной и отрицательной оси z. Мы сделаем ошибку, если поймем это утверждение буквально. Возмущение спином должно появляться при переходе от классической к релятивистской механике. В соответствии со скалярной нерелятивистской волновой механикой, термы атома водорода зависят только от глав- ного квантового числа п; теория относительности вводит поправку: термы, соответствующие различным значениям I, расщепляются и образуют так называемую тонкую струк- туру. Следовательно, мы должны были бы наблюдать одинаковую схему термов в•водороде и щелочах, однако эксперимент показывает, что при дублетном разделении /-терма на две части с / = /±1/2 два терма с одним и тем же j, но различными /=/±1/2, в точности совпада- ют. Таким образом, спиновое возмущение в водороде ко- личественно согласуется с разделением, вызванным этой релятивистской поправкой. Аномальный эффект Зеемана лучше всего проявляется в дублетах щелочей. Другие элементы, такие как щелоч- ноземельные металлы, имеют (кроме триплетов) систему синглетных термов, и в синглетных термах всегда имеет место нормальный эффект Зеемана (в магнитном поле). Поэтому можно предположить, что аномалии в эффекте Зеемана полностью связаны со спином. Магнитное расщеп- ление щелочного металла совершенно не зависит от глав- ного квантового числа п; все термы серии ведут себя одинаковым образом. Терм (/, /) расщепляется на 2/ ± 1 эквидистантные компоненты, характеризуемые магнитным квантовым числом т, но их разделение равняется hog, а не ho, где g—рациональная функция / и j («g-фактор Ланде», «множитель Ланде»). Следовательно, значение энергии компоненты т смещается от ее невозмущенного значения на величину hog-m (m = i, j—1, ..., —j). (4.1) Эмпирическая формула для g-фактора, полученная Ланде, имеет вид «=Ж <4-2) Эта формула выполняется для слабых магнитных полей, в которых магнитное разделение имеет меньший порядок
254 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП величины по сравнению с дублетным расщеплением. Если 1 = 0, j = 1/2, то мы, в частности, имеем g = 2. Этот последний факт подсказывает решение загадки: если бы полный момент импульса состоял только из спи- на (2 = 0), то магнитный эффект был бы в два раза боль- ше, чем в случае, когда момент импульса состоит только из 2. Следовательно, мы принимаем, что магнитный эффект от спина V2 © в два раза больше эффекта от орбиталь- ного углового момента £; поэтому возмущение внешним магнитным полем & можно записать в виде s + s) = ^(.6,® + ls). (4.3) Именно спин дает нам объяснение, почему луч в экспери- менте Штерна—Герлаха разделяется на две части. Ва- лентный электрон одновалентного атома серебра находит- ся в нормальном состоянии на s-орбите (/ = 0); отсюда следует, что / = 1/2, а т может принимать только значе- ния ±1/2. Хотя компонента механического момента им- пульса в направлении магнитного поля может иметь толь- ко значения ± й/2, эксперимент показывает, что величина магнитного момента атома равна целому магнетону Бора, а не его половине; но теперь мы знаем, что, поскольку механический момент импульса состоит только из спина, он должен приводить к возникновению двойного ожидае- мого магнитного момента. Связь между магнитным момен- том и механическим моментом импульса еще сильнее проявляется в магнитно-механическом эффекте', размагни- чивание вертикально подвешенного стержня из мягкого железа должно приводить к приобретению им углового момента. Ожидалось, что отношение между приращением магнитного момента и приращением момента импульса должно равняться е/2рс, но эксперимент, который был выполнен с ферромагнитными телами, дал удвоенное зна- чение. Если мы принимаем, что механический момент им- пульса в ферромагнитных веществах полностью определя- ется электронным спином, то следует считать, что на этот результат повлияло аномальное поведение спина в магнит- ном поле [8]. Объясняет ли эта гипотеза также и общую формулу Ланде? Ответ на это дает полученная в конце § 3 формула (3.12), при применении которой к составной системе спина электрона и его переноса вместо величин /, J следует подставить значения 1/2,/,/. Мы находим, что в состоянии
5 4. ВРАЩАЮЩИЙСЯ ЭЛЕКТРОН 255 (//) среднее по времени значение спина J/2 © равно значе- нию ЯЛ, умноженному на коэффициент а ]_ 1 д. 3/4—Z(Z + 1) ё 2^ 2/(/+1) ’ ИЛИ g—1 = ± 2ГП ДЛЯ i,== 1 ± 4 • <4-4) Отсюда и из (4.3) мы имеем <w>^c-g-m=hOg.Mz. » До тех пор, пока магнитное расщепление мало по сравне- нию со спиновым возмущением, расщепление Зеемана тер- ма (//) определяется в основном величиной <№>; равен- ство (4.4) приводит нас тогда, согласно эмпирическим данным, к уравнению (4.2). Если атом состоит из нескольких, скажем f, электро- нов, то возникающая ситуация может быть понята при помощи общего правила композиции. Если электроны на- ходятся в квантовых состояниях с внутренними кванто- выми числами jr и уровнями энергии Е (jr~) (г = 1, 2, ... ..., f), то пренебрегая взаимодействием между электро- нами, мы получаем, что полная система имеет (2/7 + 1)... .. .(2/7+1)-кратный уровень энергии Е (/\) + ...+ Е (jf). Если этот уровень не совпадает ни с одним другим уров- нем, то он расщепляется малым возмущением на термы с полными квантовыми числами J аналогично тому, как произведение Ф/, х £/г х ... х Ф;/ = 2 ©j (4.5) приводится к его неприводимым составляющим (ряд Клеб- ша— Гордана). Очевидно, что для того, чтобы эта (//)-связь привела к адекватному описанию, взаимодействие между электронами должно быть мало по сравнению со спиновым возмущением. Однако обычно встречается ситуация, противополож- ная той, которая описана выше: нормальный порядок тер- мов соответствует (§/)-связи или связи Рассела—Саундерса. Пренебрегая на мгновение как взаимодействием между электронами, так и спиновым возмущением, мы приходим к 2/(2/г + 1)- • (2Z/+ 1)-кратному уровню энергии (2.4), в собственном пространстве которого группа вращений
256 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП индуцирует представление X (©,, X ©4 X ... X ©/у). (4.6) Благодаря взаимодействию между электронными перено- сами второй сомножитель приводится к неприводимым составляющим аналогично (4.5); единичный терм с азиму- тальным квантовым числом L теперь имеет кратность V (2L+1). Затем мы приводим представление «.-3».. (47) и на последнем этапе мы делаем приведение ©5x©l==2®J (J==L + s, L-}-s — 1, ..., |Л —s|), (4.8) возникающее благодаря взаимодействию между спиновым и орбитальным моментами импульса. Термы, которые воз- никают в результате этого приведения, формируют вместе мультиплет. Каждый мультиплет связан с определен- ным азимутальным квантовым числом L и спиновым кван- товым числом s; отдельные члены мультиплета различа- ются внутренним квантовым числом J. Мы называем число 2s +1 кратностью, хотя количество термов в муль- типлете действительно равно этому числу только при L^s, поскольку из (4.8) следует, что их число меньше, если L<s. Здесь 2^-мерное представление ©{,8 является четным или нечетным согласно тому, четно f или нечетно. Приведение (4.7) к неприводимым составляющим, следова- тельно, дает только целые значения для s при четном f или только полуцелые значения, когда f нечетно: когда мы проходим атомную таблицу в порядке возрастания атомного числа (Н —нечетное атомное число, Не—четное, Li — нечетное и т. д.—«.закон альтернации-»), кратности термов тоже регулярно изменяются от четных к нечет- ным. Для f — 2 мы, например, имеем ©?/2 = ©» + ©!• Эмпирически найдено, что двухвалентные щелочноземельные металлы в действительности имеют синглетную и три- плетную систему термов. Но S-термы, для которых L — О, в"5 триплетной системе оказываются простыми, и только Р-, D-, .. .-термы имеют в самом деле кратность, равную трем.
§ 4. ВРАЩАЮЩИЙСЯ ЭЛЕКТРОН 257 Вместо того чтобы рассматривать все электроны сразу, как в (4.6), мы можем построить атом путем последова- тельного добавления одного электрона за другим. При добавлении следующего, скажем, f-ro электрона к атому или иону А+, мультиплет атома Л + , характеризуемый азимутальным квантовым числом L и спином s, разбива- ется на все те мультиплеты, которые содержатся в пред- ставлении (2), х ©1/2)х (£)д х £\), где lf = l—азимуталь- ное квантовое число добавленного электрона. Так как S\X 3)j/2 = ®j + l/2 4" <£l х = L* = L + l, L + l-1, ... , |L —/|, это приводит к мультиплетам (s*, L*), по одному для каяедой из пар s* = s±l/2, L* = L + l, L + l—1, ..., |L—/| (4.9) («правило ветвления»). В первом из вышеприведенных уравнений вновь содержится закон альтернации. Следует, однако, заметить, что принцип исключения Паули для эквивалентных орбит, который будет рассмотрен в части В настоящей главы, существенно ограничивает массив муль- типлетов, допускаемых этим правилом [9]. Вновь применяя формулу (3.12) к композиции спина и орбитального момента импульса, мы находим, что 2J + 4-1 компонент, на которые разбивается J-терм мульти- плета (s, L) слабым магнитным полем, смещаются из не- возмущенных положений на величины hog-m (m = J, J—1, ..., —J), (4.10) где множитель g дается выражением а_ 1 . /(J4-l)-L(L4-l)4-s(s4-l) (л 1 п 8—2J(J4-1) ’ ' ' Это—точно та же формула, которая была получена эмпи- рически Ланде, на этом примере мы видим значение того факта, что квадрат абсолютной величины момента импуль- са ЭЛ (или S, или <©) определяется квантовым числом J (или L, или s) по формуле J(J-|-1) и т. д., а не и т. д., как в старой квантовой механике. Когда магнитное поле возрастает до такой степени, что магнитное расщепление становится сравнимым с рас- щеплением между термами мультиплета, мы должны одно- временно учитывать возмущение, вызывающее расщепле-
258 ГЛ. IV- ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП ние мультиплета, и магнитное возмущение. Чтобы выра- зить малость члена в гамильтоновой функции, вызываю- щего это первое возмущение, мы вводим коэффициент р, который будет фигурировать там так же, как множитель о в магнитном члене; случай слабого магнитного поля можно тогда выразить, говоря, что о мало по сравнению с р. Мы можем рассматривать о и р как переменные, ко- торые постепенно возрастают от 0 до их действительных значений, и исследовать зависимость расщепления от их отношения. Следовательно, мы пишем возмущающий член в гамильтоновой функции в виде W^=pWf + oW\ Поскольку для решения текущих задач нет нужды выражать разложение (4.8) на языке его мельчайших составляющих—отдельных электронов, мы можем здесь обозначать азимутальное и внутреннее квантовые числа через I и j. Пусть пространствами представлений для S)z являются т5, 91 z с координатами £(m5), x(mz) соот- ветственно. Обозначим моменты импульса 3)lz этих двух представлений через §, 2 соответственно; если маг- нитное поле имеет направление вдоль оси г, мы имеем W" = h(Lz + 2sz). (4.12) Система координат снова выбирается так, чтобы вращения вокруг оси z появлялись в приведенной форме; такому вращению на угол <р соответствует преобразование £ (/и,) — е (—т/р) • £ (т,), х е (—т z<p) • х (tnt); область значений квантовых чисел tns и mz имеет вид m5~s, s—1, ..., —s; I—1, ..., —/. (4.13) Переменные в пространстве r5x9iz ведут себя подобно (2s+1) (2Z + 1) произведениям (4.14) и умножаются на е(—тер) при вращении на угол ф во- круг оси z, где т,. Затем мы приводим представление 2)sxS)z к неприводи- мым составляющим Пусть координаты (2/+ ^-мер- ного неприводимого подпространства tJx9iz, в котором
§4- ВРАЩАЮЩИЙСЯ ЭЛЕКТРОН 259 действует представление ©у, обозначаются через х(/; т) (m = j, j —1, ..—/). Здесь tn—это магнитное квантовое число. При вращении на угол ф вокруг оси z координата х(/; т) умножается на е(—тф). Преобразование координат, которое обуслов- ливает полное приведение ®5х ©z к его составляющим ©у, очевидно, таково, что х(/‘; ш) является линейной комби- нацией тех переменных (4.14), для которых msJrml имеет значение т. Если невозмущенная система не обладает никаким случайным вырождением, расщепление определяется той частью матрицы (4.12), в которой подпространство rsx$tz из 91^ скрещивается с самим собой. Следовательно, мы должны решать вековое уравнение 6 порядка (2s-j- 1)х х(2/+ 1); но задача существенно упрощается ввиду того, что возмущающий член обладает вращательной симмет- рией относительно оси г, так как ненулевыми элемен- тами матрицы W являются только те, для которых tn—► ~^т. Следовательно, одно вековое уравнение G разбива- ется на 2 (/ + s) + 1 вековых уравнений Gm, соответствую- щих допустимым значениям т — I s, I -j- s — 1, .. ., — (Z -I- s). Степень Gm определяется числом возможных разбиений значения т на два слагаемых ms + которые пробегают области (4.13). В одноэлектронном приближении, /=1, мы имеем только уравнения первого и второго порядка, и поэтому вычисление для этого случая может быть про- ведено полностью [10]. Корни векового уравнения Gm являются смещениями энергий термов, вызванными возмущением. Так как след матрицы — инвариант, сумма смещений термов, связанных с определенным значением т магнитного квантового числа (сумма корней векового уравнения Grn), равна сумме чле- нов на главной диагонали этой W, т. е. равна (ms+'nl = m) Следовательно, эта сумма является однородной линейной функцией р и о («правило сумм»). При подстановке р = 0 мы получаем член, соответствующий магнитному полю; в соответствии с (4.12) он равняется oW" (nistnn nisin^ = ho (tn^Znis).
260 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП С другой стороны, формулы (4.10), (4.11) определяют смещения термов в случае, когда о мало по сравнению с р. Вследствие правила сумм эти два результата должны согласовываться между собой. Если /из раз и навсегда фиксированы, то, обозначая g-фактор Ланде (4.11) через g(j), мы получаем равенство 2 (тх + 2т,) = т-££(/). Сумма в левой части распространяется на все разбиения т = mt + ms для данного т, а сумма в правой части — на все значения /, которые согласуются с условиями j = |m|, |т| +1, ...; j = l+ з, /4-s—1, ..., |/—s|. Из этого равенства можно непосредственно определить g(j). При m = обе суммы сводятся к единственному члену; мы имеем равенство / + 2s = (/4-s)-^(/ + s). Так как m = l + s—1, то для (ms, пг^ и для j сущест- вуют две возможности: m^l, ms = s — 1 или mt — l—1, ms = s; j = I + s или / = I -j- s—1. Следовательно, мы имеем 2/ + 4s-3 = (/ + s-l){fir(/+s)+g(/4-s-l)}. Итак, мы получили рекуррентные формулы для последо- вательного вычисления g(l + s), g(I + s — 1), ... Чита- тель может непосредственно проверить, что результат первых нескольких этапов согласуется с (4.11). Следует заметить, что при последующем переходе от слабого магнитного поля к сильному термы, рассматри- ваемые как функции монотонно возрастающего параметра о/p, пересекаться не могут; «сингулярные элементы», т. е. те элементы, для которых два или более собственных значений совпадают, образуют многообразие не одного, а трех измерений [11]. Б. ГРУППА ЛОРЕНЦА § 5. Релятивистски инвариантные уравнения движения электрона Мы до сих пор не получили никакого особого выра- жения для спинового возмущения; выражение для маг- нитного эффекта под воздействием внешнего поля было
§5. РЕЛЯТИВИСТСКИ ИНВАРИАНТНЫЕ УРАВНЕНИЯ 261 получено с помощью экспериментальных данных. Оче- видно, что мы сможем прийти к удовлетворительной тео- рии электрона только в том случае, если выразим ее фундаментальные законы движения: в форме, инвариант- ной относительно преобразований Лоренца, как этого требует специальная теория относительности. Решение этой проблемы принадлежит Дираку [12]. Мы знаем из гл. III, § 8, как можно распространить на группу поло- жительных преобразований Лоренца двумерное представ- ление ©1/2 группы вращений, которое, согласно Паули, характеризуется ковариантной величиной ф = (ф1? ф2), описывающей волновое поле. Компоненты ф1? ф2 играют ту же роль, что и переменные I, т), введенные в связи с представлением ©1/2. Следуя де Бройлю, мы приняли в качестве волнового уравнения частицы массы т в свободном от полей про- странстве уравнение / а2 , а2 , a2 i а2 \ , 2, / ст \ \ дх2 + ду2 + дг2 с2 dt2 — [то ~ h J ' (5.1) Но это уравнение не согласуется с общей концепцией квантовой механики, которая требует наличия производ- ных по времени только первого порядка. Формулировка релятивистски инвариантного дифференциального уравне- ния, удовлетворяющего этому требованию, становится воз- можной, как обнаружил Дирак, при переходе от скаляр- ной волновой функции ф к функциям с двумя компонен- тами. Мы попытаемся получить эти динамические урав- нения из гамильтонова принципа. Пусть х0 = с/, хг = х, х2 = у, x3 = z образуют нормальную систему координат в нашем четы- рехмерном пространстве-времени. Если величина со того же типа, что и ф, то произведения ф5а(со) ведут себя, согласно гл. III, (8.16), подобно четырем компонентам 4-вектора; Sa — матрицы, определенные в гл. III, (8.15). Отсюда, в частности, следует, что величины.
262 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП являются компонентами бесконечно малого вектора dsa; здесь мы имеем дело с линейным отображением, которое не зависит от применяемой системы координат и перево- дит вектор dx в ds. Его след ,5-2> а соответственно является скаляром, а интеграл следа, взя- тый по любой конечной части мира и умноженный на 1/i: Л1 = 4 (dx = dx0dx1dxsdx3), (5.3) а не зависит от системы координат. (Букву М, используе- мую для обозначения материальной части действия, не следует путать с моментом импульса.) Хотя величина М может не быть вещественной (т. е. может быть комплексной), она практически вещественна, в том смысле, что разность М—М является интегралом от полной дивергенции. Поскольку Sa — эрмитовы мат- рицы, имеем а и разность —Л4 есть интеграл от суммы i Zu дха а Используя М в качестве действия, мы интересуемся не самой величиной М, а только ее вариациями 6Л4, вызван- ными произвольными бесконечно малыми вариациями б-ф величины ф = (ф1, ф2), которые исчезают вне заданной конечной части мира. (Интеграл тогда распространяется на весь мир, или, что то же самое, на эту конечную часть.) Обстоятельства, упомянутые выше, гарантируют вещественность 6Л4; записав эту вариацию в виде 6Л4 = J (6ф • со + со • 6ф) dx и сравнивая это выражение с (5.3), мы находим, что вы- полняется равенство (X,
§5. РЕЛЯТИВИСТСКИ ИНВАРИАНТНЫЕ УРАВНЕНИЯ 263 Таким образом, мы приходим к дифференциальному опе- ратору первого порядка (5.4) Из инвариантности (5.2) следует, что этот оператор пре- образует ф = (фп ф2) в величину ф' = (ф^, ф2), кото- рая под воздействием произвольного положительного преобразования Лоренца преобразуется контрагредиентно к ф = (фх, ф2). Если мы хотим гарантировать веществен- ность 7И, мы должны первоначальное определение пе- реписать в следующем виде: М= (5'5) В гл. III, § 8 мы показали, что для того, чтобы иметь возможность расширить ограниченную группу Ло- ренца до полной группы, необходимо ввести величины ip2, которые преобразуются контрагредиентно к if»!, 4>2. Точно так же, как оператор V, примененный к -ф, по- рождает величину типа ф', так и «сопряженный» оператор v'=?s;^ преобразует ф' в величину типа ф. Выражение V'V, как легко проверить, является оператором вида д2/ d2 d2 . д2 \ дхц \ dxf dxi dxi / Следовательно, вводя дополнительную пару компонент ф', можем записать уравнение (5.1) для фп ф2 в виде yV’I’ + 'M' =0> yVV + moi|) = O. (5.6) Теперь мы будем обозначать через ф столбец из четырех компонент фп ф2; фх, ф2 и применяем Sa для обозначе- ния преобразований этих четырех компонент, как и в по- следней части гл. III; при таких обозначениях диффе- ренциальные уравнения (5.6) получаются из интеграла действия, составленного из суммы величины М (см. (5.3))
264 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП и инварианта (см. гл. III, (8.19)) М' = т0 tyTty-dx. Величины М и ЛГ инвариантны также относительно пере- становки правого и левого и относительно пространствен- ного отражения в начале координат. В соответствии с общей концепцией квантовой меха- ники дифференциальные уравнения для ф должны, как уже отмечалось, содержать только первую производную ф по времени, но тогда дополнительное требование, что они должны быть релятивистски инвариантными, приводит к выводу, что и по пространственным координатам они могут содержать только первые производные. Мы смогли соблюсти эти требования без изменения реального содер- жания уравнения де Бройля (для компонент фп ф2); по- лученные таким образом уравнения следует принять в качестве уравнений для свободной частицы. Этот фор- мальный переход к уравнениям первого порядка приоб- ретает физический смысл только после того, как мы перейдем к получению уравнений движения в электро- магнитном поле с помощью принципа калибровочной инвариантности, рассмотренного в гл. II, § 12. Если ве- личина — ф0—скалярный, а фп ф2, ф3 — векторный по- тенциалы, то, согласно этому принципу, мы должны за- менить 1 д 1 д . & /г* Та^ на + <5-7> Для дальнейших выкладок удобно ввести величины fa, получаемые при умножении потенциалов фа на e/hc. Тогда в равенстве М == у J ф. \7ф-^.г (5.8) оператор V будет определяться формулой 7’-ЕЧт£+/“)- *5'9> а В силу калибровочной инвариантности, величины М, М' не изменяются при одновременной замене яр на Ар и /аНа/а —(5.10)
§5. РЕЛЯТИВИСТСКИ ИНВАРИАНТНЫЕ УРАВНЕНИЯ 265 где X—произвольная функция положения в простран- стве-времени. Можно принять, что X является бесконечно малой функцией, которая обращается в нуль вне опре- деленной конечной части мира; тогда 6М и 6Л4' должны автоматически обращаться в нуль при вариациях = б/а=-Д. (5.11) Если предположить, что справедливы законы движения материи (5.6), т. е. что, то из полного выражения для вариации 6(М + ЛГ) =Л [(6ф-со +(o-S'i|)) + 2saS/a] dx а автоматически следует, что 8(M + M') = \^sa8fa.dx. а Отсюда, в качестве следствия из уравнений (5.6), мы получаем равенство - f • *4 J “ дха J “ дха т. е. уравнение непрерывности а Уже беглый взгляд на явное выражение для М показы- вает, что $а==фЗаф; (5.13) sa — эт0 те самые величины, которые были исходным пунктом в теории преобразований ф, рассмотренной в гл. III, § 8, и мы уже знаем, что они образуют ком- поненты 4-вектора, который не зависит от частного вида применяемых координат пространства-времени. Временная компонента s° = фф = (фхфх+ф2ф2) + (ф;ф;+ф'ф;) (5.14) является плотностью вероятности, а величину с% = ~c(s\ s2, s3) назовем током вероятности: чтобы опреде- лить среднее количество частиц, проходящих через эле-
266 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП мент поверхности do за единицу времени, надо умножить полное число присутствующих частиц на площадь do и нормальную компоненту вектора eg. Проинтегрировав уравнение (5.12) по объему V, мы находим, что прирост среднего числа частиц в V за единицу времени равен среднему числу частиц, входящих в V через его поверх- ность за то же время. В противоположность прежней скалярной теории, теория Дирака приводит к выраже- ниям для плотности и тока вероятности, зависящим лишь от ф, самым простым путем. Проинтегрировав выражение s° dxr dxi dx3 по всему пространству, мы находим, что полученный ин- теграл не зависит от времени, и, в соответствии со ста- тистической интерпретацией ф, должен быть отнормиро- ван так, чтобы его величина равнялась 1. Следовательно, в динамическом законе энергия H/h является эрмитовым оператором, как это и должно быть. Отныне мы принимаем h за единицу дей- ствия, с соответствующими единицами для импульса и момента импульса. В результате величина h полностью исчезает из законов квантовой механики. При обычных , 1 9 обозначениях ра=— -з— имеем ' i дха 1 з 4^ = /о+£ Sr(pr^fr) + m9T. (5.15) г= 1 В формуле (5.9) учитывается воздействие электромаг- нитного поля на вещество, но, с другой стороны, вещест- во само порождает электромагнитное поле в соответствии с уравнениями Максвелла. Чтобы выразить это явным образом, мы должны добавить к M-j-M' максвелловское действие F = + + + + (5.16)
§5. РЕЛЯТИВИСТСКИ ИНВАРИАНТНЫЕ УРАВНЕНИЯ 267 электромагнитного поля, где /ар дха дх$ — напряженности поля, не изменяющиеся при изменении калибровки (5.10). Действие F получается из выражения j (5.17) при умножении на c(elhc)2 — e2lch2. Величина (5.17) — это действие, выраженное в единицах Хевисайда, которые лучше всего подходят для теории электромагнитного поля. Поскольку мы приняли h за единицу действия, то полным действием нашей системы, состоящей из двух частей: ве- щества и поля, является величина W-^M + M' + ^F (а = 4)- <5-18) Вещественное число а/4л называется постоянной тон- кой структуры. Обстоятельства, в силу которых оно так названо, будут изложены нами позднее. В то время как вариация ф в гамильтоновом интеграле W-dx дает уравнения для вещества, вариация fa приводит к уравне- ниям для электромагнитного поля с выражением — e-sa =— е- ф5аф, (5.19) полевых уравнениях выступают являющимся 4-вектором заряда и плотности тока, честве констант в две комбинации В ка- только ст б2 а = —т- ch (5.20) фундаментальных атомных констант; первая имеет раз- мерность обратной длины, вторая — просто число. Шредингер в своих основополагающих статьях по вол- новой механике полагал, что он сможет объяснить кван- товое поведение вещества и излучения «классически» пу- тем установления замкнутой системы полевых уравнений, таких, как мы получили выше. В частности, он полагал, что заряд электрона действительно «размазан» по всему пространству с плотностью —е-s0. Однако теперь не мо- жет быть никакого сомнения в том, что интерпретировать полевые уравнения таким классическим способом нельзя;
268 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП скорее всего их следует объяснять в соответствии со ста- тистической точкой зрения, развитой в гл. II. Формула (5.14) для плотности вероятности дает подтверждение ато- мистической структуры электричества. Чтобы показать это, мы сначала заметим, что заряд в объеме V представ- ляется как —е, помноженное на эрмитову форму J §ФФ dXi dxa dx3. (Ю Но эта форма является «идемпотентной» по отношению к «вектору» ф; ее собственными значениями являются 1 и О, а соответствующими собственными функциями будут такие ф, которые обращаются в нуль соответственно вне и внут- ри V. Следовательно, заряд, содержащийся в V, способен принимать только значения —е и 0, соответственно тому, находится электрон в V или нет. Предположение об атом- ности электричества требует, чтобы плотность электри- ческого заряда равнялась произведению —е и плот- ности вероятности. Если же мы строим нашу теорию на основании волнового уравнения де Бройля, модифициро- ванного введением электромагнитных потенциалов в соот- ветствии с правилом (5.7), мы находим для плотности за- ряда выражение, включающее, кроме ф, еще и производ- ную по времени дф/д/; это выражение не имеет ничего общего с плотностью вероятности и даже не является идемпотентной формой. Согласно Дираку, это несоответ- ствие является наиболее убедительным аргументом в пользу того, что дифференциальные уравнения движения элект- рона в электромагнитном поле должны содержать произ- водные только первого порядка по времени [13]. Посколь- ку невозможно получить такое уравнение со скалярной волновой функцией, которое в то же время удовлетворяло бы требованию релятивистской инвариантности, через тео- рию относительности мы приходим к такому явлению, как спин. Как мы видели, теорема сохранения электрического заряда (5.12) следует из уравнения вещества, но в то же самое время она получается из электромагнитных уравне- ний. Тот факт, что (5.12) является следствием обеих сис- тем полевых законов, означает, что эти системы не неза- висимы, т. е. что в них присутствует какое-то тождество. Истинное основание для этого тождества следует искать в свойстве калибровочной инвариантности, гласящем, что
§ 6. ЭНЕРГИЯ и ИМПУЛЬС 269 тождественно обращается в нуль, когда гр и fa под- вергаются вариациям вида (5.11). Мы имеем 61F = | (бф. со о». бф) -|- 2 La 6fa| dx, где <о = 0 является уравнением Дирака (5.6), a L“ = 0 — уравнениями Максвелла. При подстановке вариаций из (5.11) и интегрировании последнего члена, стоящего под интегралом, по частям мы получаем уравнение |(ф®-®ф)+Е^=о. В силу произвольности калибровки, число независимых уравнений должно быть на единицу меньше числа неиз- вестных функций ф и fa (19). § 6. Энергия и импульс. Замечания о перестановке прошлого и будущего I. Энергия и импульс. Полные полевые уравнения имеют вид ^-‘5“(таГ + ^)г1’+/По’7’'ф = О; ' а 4 а ' div@ + p = o, — rot£>=a§. (6.1) Здесь @ и $—напряженности электрического и магнит- ного полей: £ e_L .... 1 a \dx! дхв/ ’ ’ * ’ ’ jj_____L f ^2____\ 1 а \дх2 дх3) * ‘ ‘ ’ (6-2) величина р— плотность заряда фф, а компоненты Sj, ... тока § определяются выражениями 81 = ф51ф, ... (6.3) Кроме дифференциального закона сохранения электри- ческого заряда g + <iivS = o, м
270 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП мы имеем векторный закон сохранения энергии и импуль- са. Точное выражение для тензора, представляющего плот- ность и поток энергии и импульса, получается только в общей теории относительности. Здесь мы даем только ре- зультат для плотности энергии —£•/{[ и импульса (/?, /$); поступая так, мы разделяем материальную и электро- магнитную части. Для части тензора, относящейся к ве- ществу, мы имеем 21 — (^—‘Л) Ф- -М} /о 1 1 ... 1 2t\Tdxj дхг Y) 1 4 \dxs дх*) 'J . (6.5) J Здесь мы ввели, кроме оператора Sp, оператор Sp (р=1, 2, 3), который действует на все четыре компоненты век- тора гр; в то время как первый оператор осуществляет над ф2 двумерное преобразование Sp (гл. III, (8.15)), а над Фь Фа—преобразование —Sp, второй выполняет то же самое двумерное преобразование Sp над обеими парами компонент. Соответственно sp = ipSpip. Плотность энергии и импульса, соответствующая электро- магнитному полю, определяется обычными максвелловскими выражениями -/•= +) + (Я?+ +)}; j (б 6) /? = а(Е2Я3 —£3Я2),... ) Из полевых уравнений следуют законы сохранения'. 3 3 £^=0; £^=0, ... (6.7) „ дха дх 4 ' а=0 а=0 а Кроме того, оказывается, что тензор t симметричен вслед- ствие полевых уравнений, т. е. мы имеем равенства (р-1,2,3); = (р, <7= 1,2,3). (6.8)
§6. ЭНЕРГИЯ И ИМПУЛЬС 271 Скомбинировав эти равенства с (6.7), мы получаем усло- вия в виде дивергенций У, =о, ...; (6.9) а=0 а 3 У д^ + х^ . (6.10) а=0 ”Х« Все эти результаты можно проверить непосредственно, однако более глубокое их значение может быть понято, как уже упоминалось выше, только при переходе к общей теории относительности. Как теорема сохранения элект- рического заряда следует из калибровочной инвариант- ности уравнений, так и теоремы сохранения импульса- энергии следуют из того обстоятельства, что интеграл действия, сформированный в соответствии с общей тео- рией относительности, инвариантен относительно произ- вольного (инфинитезимального) преобразования координат. Руководствуясь этой общерелятивистской формулировкой, мы далее должны в каждой точке Р пространства-времени построить нормальную систему координатных осей, состоя- щую из четырех взаимно перпендикулярных направлений в Р («ортогональный репер»), с тем чтобы иметь возмож- ность зафиксировать метрику в Р и описать волновую величину ф через ее компоненты; все допустимые ортого- нальные реперы в точке Р получаются друг из друга при помощи локальных преобразований Лоренца, которые ос- тавляют точку Р неизменной. Но вращения этих локаль- ных реперов могут производиться в различных точках Р совершенно независимо—величины в различных точках не связываются друг с другом, как в специальной теории относительности. Симметрия тензора энергии-импульса может быть выведена из его инвариантности по отноше- нию к таким вращениям. Можно фактически принять за общее правило, что каждое свойство инвариантности типа, встречающегося в общей теории относительности, относя- щееся к произвольной функции, приводит к появлению дифференциальной теоремы сохранения. В частности, ка- либровочную инвариантность следует понимать только с этой точки зрения. Из законов преобразования величины ф следует, что ее четыре компоненты фр> отнесенные к локальному реперу, определяются только с точностью до общего коэффициента пропорциональности е‘\ показатель
272 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП к которого зависит произвольным образом от положения в пространстве-времени; поэтому для получения единст- венного ковариантного дифференциала для ф необходимо ввести линейную форму ^fadxa, связанную с содержа- а щимся в ф калибровочным множителем способом, тре- буемым принципом калибровочной инвариантности [14]. Интегральные законы сохранения мы получаем путем интегрирования дифференциальных. Мы берем интеграл J <1У — Ja (dV = dxt dxa) по сечению пространства-времени x0 = const и находим, что он не зависит от этого х0. Выражение —cJ0 — H является энергией, а вектор (Jlt /2, J3)—импульсом. Мате- риальная часть при простом интегрировании по частям представляется в виде (3 Л IX (те+7,)* Д'; Р=1 4 р 7 ) ••• Эти выражения суть не что иное, как эрмитовы формы по «вектору» ф. Они вновь заставляют нас связать операторы Т ’ дх ’ дх~) с компонентами импульса (Ju Jt, J3), т. е. приводят к предположениям, с которых мы начинали, следуя де Бройлю и Шредингеру. Для энергии мы полу- чаем (при делении на с) оператор з р= 1 р без добавочного члена из (5.15); следовательно, диф- ференциальные уравнения вещества (Дирака) принимают вид Кроме того, мы не должны забывать, что к части, отно сящейся к веществу, надо добавить еще часть, соответст- вующую электромагнитному полю.
§6. ЭНЕРГИЯ и ИМПУЛЬС 273 Величины ТИ1 = 5 (х2*з—XstydV, .... (6.11) которые согласно (6.9) постоянны, являются компонентами момента импульса. Из (6.5) мы находим, что часть этого момента импульса, относящаяся к материи, имеет вид 7 (Х*дх3~Хвдх^) +1/г51}1М1/> ••• В соответствии с нашими предыдущими предположениями здесь мы получаем оператор, который составлен из суммы .^-компоненты (1/1)(х3д/дх3—х3д/дх3) орбитального мо- мента импульса и спинового момента импульса1/^. Вектор ч,®'=*/Asi si si) действительно является спином, так как, в соответствии с законом преобразования обеих величин ip, пары я|?2) и (“Фх. ФО подвергаются такому же преобразованию о, как компоненты спина в теории Паули под воздействием пре- образования о (пространственное вращение) из группы и,. Проинтегрировав уравнения (6.10) по пространствен- ному сечению хЛ — const, мы получаем выражение А = — diT0 ^x^dV, ..., которое можно рассматривать как закон инерции энергии. Интеграл можно переписать в виде -£1( где 5i> -2* £з—координаты «центра энергии»; предыдущие уравнения тогда будут иметь вид J _ И ’ • • • Таким образом, мы получаем обычный закон механики: Импульс равен массе, умноженной на скорость, где за скорость следует принять скорость центра энергии, а за массу—энергию поля, умноженную на число 1/с2. Тем не менее при определении центра энергии целесообразно не делить компоненты импульса на Н, поскольку плотность энергии —Zo здесь более не является положительно опре- деленной, и мы не можем быть уверены в том, что энер- гия Н окажется положительной.
274 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Наша теория приняла вид классической полевой тео- рии, где квантовые характеристики получают лишь статис- тическую интерпретацию. При такой интерпретации поле- вые законы описывают поведение отдельного электрона. На данном этапе нашего исследования мы можем мани- пулировать дополнительными величинами, соответствую- щими электромагнитному полю, только при заданном внеш- нем поле, воздействующем на движение частицы, без учета реакции частицы на поле; мы должны отказаться от наших максвелловских уравнений. Истинные законы, управляющие взаимодействием между электронами и квантами, могут быть получены, по аналогии с гл. II, § 13, только путем применения к системе полевых уравнений процесса кван- тования, точно так же, как это было выполнено Гейзен- бергом в случае системы классических механических диф- ференциальных уравнений. Мы вернулись к нашим первоначальным предположе- ниям относительно операторов, представляющих положе- ние и импульс, лишь благодаря тому, что выбрали для действия указанные выше конкретные выражения, из ко- торых получаются полевые уравнения; в действительности все полностью определяется выбором части М. Следова- тельно, наши исходные постулаты квантовой теории имеют меньший интерес с точки зрения общих принципов, чем мы предполагали сначала. Но, с другой стороны, эта связь, по-видимому, указывает на то, что М нельзя заме- нить в ее роли представителя действия, соответствующего веществу. Величина М служит также для того, чтобы плотности заряда и вероятности согласовывались друг с другом,— что, безусловно, необходимо для подтверждения атомистической структуры электрического заряда. Эти согласования с наиболее фундаментальными физическими наблюдениями, таким образом, приводят к представлению действия в виде некоторой суммы М и других членов, которые инвариантны не только относительно изменения калибровки (5.10), как М, но также и относительно за- мены ф на еЛ-ф и fa на fa—др/дха, где К и р—две не- зависимые произвольные функции в пространстве-времени. Величина М’ и максвелловское действие F действительно имеют этот тип инвариантности. Другие релятивистски инвариантные скаляры, удовлетворяющие этим условиям, находятся непосредственно—в самом деле, из величин, находящихся в нашем распоряжении, нетрудно построить наиболее общее возможное действие. Но предварительно
§6. ЭНЕРГИЯ и ИМПУЛЬС 275 мы еще должны убедиться в физических наблюдениях в том, что трех фигурировавших здесь величин Af, АГ, F еще недостаточно. //. Электрические и магнитные спиновые возмущения. Для того чтобы иметь возможность сравнивать теорию Дирака с фактами, мы исключаем ф^ ф^ таким же обра- зом, как мы это делали в отсутствие электромагнитного поля. Мы получаем уравнение —?'?ф = /и|ф, где V и V' определяются из (5.9). Преобразования Sa над двумя переменными удовлетворяют уравнениям SqSj == SA == Sx; S2S3 —— S3S2 = iS1‘f следовательно, величины, обозначаемые теми же буквами, но действующие на все четыре переменные, подчиняются уравнениям SoSi = S1S0 = Sj; S2S3 = — S3S2 = IS x. Выражение V'V содержит члены следующих четырех типов: Мы собираем вместе члены типов (1) и (2) и образуем «регулярный член», в котором компоненты ф не связаны друг с другом: (Переход от нижних к верхним индексам, т. е. от «кова- риантных» компонент к «контравариантным», произво- дится в соответствии с уравнениями /° =— f0, (ря= 1,2,3).) Нерегулярный член состоит из электриче- ской части (Д”-иг) + + "т(ад- + +)
27Q ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП и магнитной части + + -<%.++) Они превращаются, при умножении на ft и записи напря- женностей электрического и магнитного полей 6 и § в обычных единицах, в величины Мы уже вычисляли (гл. II, § 12) регулярный член для однородного магнитного поля и нашли, что он равен (е/с) (<£>£). Сложив регулярный и нерегулярный члены и пренебрегая квадратами в потенциалах, мы получаем выражение 4-(£.2 + ©’). Оно приводит к следствию, которое уже было получено в § 4 на основе спектроскопических данных: спину 1/2^ следует приписать в два раза больший магнитный момент, чем такому же по величине орбитальному моменту им- пульса; мы получили здесь убедительное теоретическое обоснование этой процедуры. Законы, управляющие взаимо- действием общего неоднородного магнитного поля с орби- тальным и спиновым моментами, подчеркивают еще более существенное различие между S и Нерегулярный электрический член, рассчитанный для центрально-сим- метричного поля ядра, является спиновым возмущением. Данное ранее описание электрона, согласно которому он имел сложную структуру, т. е. состоял из двух кине- матически независимых частей—электронного переноса, с бесконечномерным пространством состояний, и элект- ронного спина, с двумерным пространством состояний, для теории Дирака уже не годится. Но классификация спектров, данная ранее, не менее справедлива и здесь, поскольку для ее справедливости необходимо только то, чтобы в полном пространстве состояний группе вращений физического пространства соответствовало представление ©1/2 X®. Из полевых уравнений (6.1), как мы их теперь пони- маем, т. е. из законов движения электрона во внешнем магнитном поле, могут быть (приближенно) рассчитан» дисперсионные соотношениям они говорят нам, как сказы-
§6. ЭНЕРГИЯ и ИМПУЛЬС 277 вается на движении электрона в нормальном или других квантовых состояниях воздействие падающей световой волны. Из возмущенной функции ф мы с помощью урав- нений Максвелла определяем интенсивность рассеянного света; к этому классу явлений, в частности, принадлежат эффекты Комптона и Рамана *) [15]. Подобным же об- разом может быть исследовано спонтанное излучение, если дополнить выкладки гл. II, § 13 следующей про- цедурой: величину поляризации и интенсивность света, испускаемого при квантовом переходе п—атома, сле- дует вычислять посредством интегрирования уравнений Максвелла, в которых под выражениями фф и ф@ф для плотности заряда и тока должны пониматься значения ф^ф^'), ф(я)©ф('10, где фи) — собственная функция для атома в n-м квантовом состоянии. ///. Перестановка прошлого и будущего. Пусть действие строится инвариантно относительно перестановки правого и левого; этому соответствует замена л0 *^0» Л'р ^Р' fP^~fP (р= 1,2,3); 'Фг-’-'Фг; Ф; — Ф1, (6.12) Справедлив ли аналогичный результат для перестановки прошлого и будущего? Принципы теории дают основания надеяться, что можно будет учесть столь очевидное в При- роде существенное различие между двумя направлениями времени. Но Дирак заметил, что под влиянием замены %а.> fa fa. (ос= 0, 1, 2, 3); ) . , , , г (6.13) — Ф1->—Ф1, Фа-*— ф2 ) величины М, М' переходят в —М, —М'. Отсюда, если при исследовании движения электрона во внешнем электро- магнитном поле мы получаем решение тр, содержащее время в сомножителе e~ivt, то путем этой замены мы при- ходим к новому решению, которое содержит время в со- множителе еы\. или, более строго, к решению, получен- ному при замене f на —f. Но того же добиться, если внешнее поле с потенциалами <р оставить прежними, а заряд е заменить на —е. Такую частицу, масса кото- *) В отечественной литературе этот эффект называется эффектом Рамана—Мандельштама (комбинационного рассеяния). (Примеч. пер.)
278 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП рой совпадает с массой электрона, а заряд равен е, а не — е, мы называем «положительным электроном»; в при- роде она не наблюдается *)! Из сказанного выше следует, что уровни энергии такой частицы равны —hv, где hv — энергия отрицательного электрона. Если не обращать внимания на это различие в знаке, обе частицы ведут себя как одна. Электрон будет обладать, кроме положи- тельных уровней энергии, еще и отрицательными, причем последние возникают из положительных уровней энергии положительного электрона при вышеупомянутой замене знаков. Ясно, что здесь что-то неправильно; нам надо научиться избавляться от этих отрицательных уровней энергии электрона. Это кажется невозможным, поскольку под воздействием поля излучения должны происходить переходы между положительными и отрицательными тер- мами. Тот факт, что мы в данном случае имеем в два раза большее число термов, мы, очевидно, должны свя- зывать с тем, что наша величина ф вместо двух компо- нент имеет четыре (удовлетворяющие дифференциальным уравнениям первого порядка). Решение этой проблемы, по-видимому **), состояло бы во включении в наши четыре дифференциальные уравнения вместе с электроном еще и протона. Замена (6.13) преобразует члены М, М' в действии в величины —М, —М', а максвелловский член F остав- ляет неизменным. Следовательно, наши полевые уравне- ния в целом, т. е. с учетом реакции частицы на поле излучения, являются не инвариантными относительно этой замены. Однако существует замена, которая обращает направление времени и в то же самое время оставляет все члены в действии инвариантными. Мы указывали в гл. III, § 8, что выражение (5.13), образованное из ф с двумя компонентами при переходе от фп ф2 к ф2, —ф1, приобретает знак ба, где 60=1, 8р =—1 (р= 1,2,3). Отсюда, если величина со преобразуется таким же обра- зом, что и ф, мы имеем ф5асо —► 6а-со5аф; *) «Положительный электрон», или позитрон, был открыть 1932 п в космических лучах Андерсоном. (Прймеч. пер.) **) До открытия позитрона. (Примеч, пер.)
§7. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 279 применив это к ® = находим *U6 Y дх$ a дх$ ar Если мы, кроме того, делаем замену %0 * *^0> %р * %р (Р 1 » 2, 3), то получаем 3 •М. з a = 0 и, следовательно, по формуле (5.5) член М остается инва- риантным. В присутствии электромагнитного поля его компоненты должны изменять знаки в соответствии с пра- вилом /«-/о. (/>=1.2,3). Таким образом, мы получили, что члены М, М' и F остаются инвариантными при замене *° ~Xp^f Хр' } (р = 1, 2, 3); 1 '0~Ч” гР-+ тР_ > I (614) фа-> — ifc; Ф1- ' Это показывает, что прошлое и будущее входят в нашу полевую теорию одинаковым образом—несмотря на то, что знак экспоненты временного фактора e~Cv* решения квантовой задачи при замене (6.14) не изменяется. Мы отложим решение вопроса о том, позволяют ли нам за- коны взаимодействия между фотонами и электронами про- вести различие между этими двумя направлениями вре- мени, до тех пор, пока не перейдем к квантованию (§ 12). § 7. Электрон в сферически-симметричном поле Мы переходим к рассмотрению теории Дирака о пове- дении электрона в сферически-симметричном электроста- тическом поле.
280 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП I. Теорема сохранения Дирака. Из определений непосредственно следуют перестано- вочные соотношения SpT = -TSp, SPT = TS’P (p= 1, 2, 3). Нам в дальнейшем будут необходимы результаты s;s;=i, s^=—sis’ = is; и перестановочные соотношения Lxpx рДх — 0, (р2) = рДг + р2Л2 + ptL9 = 0, ^iPi Pa^l ~ ^Рз> L^Px рДг — ipa для компонент импульса и углового момента р2, Рз) и 2 = (М, L2, L9). В сферически-симметричном электростатическом поле выполняется равенство = f2s=f3s=0, а (а = Ф является функцией только расстояния г от центра. С помощью приведенных выше формул легко показать, что величина коммутирует с Ф, Т, (©’р) и, следовательно, с каждым членом в выражении для энергии 1я = Ф + (ед + /п,Т. (7.1) Действительно, этот закон сохранения для полного мо- мента импульса Ш? = 24-1/2©’ уже был нам известен из общих положений. Далее мы находим, что величина (©’2) коммутирует с Ф и Т, но (©’2)(©’р)4- (©’р) (©’2) = —2 (©» или (©’Р) {(©’2) +1} + {(@’2) + 1} (<£’Р) = о. Отсюда следует, что величина (©’2) + 1 антикоммутирует с (©’р) и, следовательно, с (©р); таким образом, комму- тационные свойства этой величины относительно трех членов (7.1) те же, что у Т. Таким образом, если поло- жить, что выполняется равенство (©’2)4-1 =kT (7.2)
$ 7. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 281 то величина k оказывается скаляром, который коммути- рует с энергией Н (под скаляром мы подразумеваем инва- риант относительно группы вращений пространства). Следовательно, мы можем разложить пространство состоя- ний электрона на неприводимые подпространства sJtA, связанные с группой вращений так, что величина k, кото- рую мы называем дополнительным квантовым чис- лом, так же как и энергия Н, обладает в каждом из подпространств определенным значением. Далее, (©’2)2»{Ц + + } + {S2Ss (L2L3—L3L2) + +} = = 22—(S^L, + +) = 2«—(g’g) и, следовательно, {(©’2)2 +1}2 = 22 + (©’2) +1 = (2 + 72©’)2 + 74 = Ж2 + 74, Ж2 = £2—1/4. Это согласуется с формулой ап2=/(/ + 1)=(/+72)2-1/4, (7.3) если мы полагаем, что / = Н|-72, И = / + 72. (7.4) Следовательно, дополнительное квантовое число является ненулевым целым числом. Теорема сохранения (7.2) идет дальше формулы (7.3), так как она дает нам знак k. Для заданного полуцелого / возможны оба значения k = = ±(/ + 1/2); они должны соответствовать двум возможно- стям / = j ± 72 в наших предыдущих обозначениях. Одно квантовое число k заменяет два: I, j. II. Дифференциальное уравнение для определения соб- ственных значений. Поскольку поле является сферически-симметричным, достаточно провести расчет, например, для точки х = 0, у = 0, z — r. В этой точке и закон сохранения Дирака (7.2) превращается в сово- купность из четырех равенств, два из которых имеют вид: ( д • д\ , . ,, , ьг , (7-5)
282 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП а два других получаются из этих выражений при пере- становке двух пар компонент фп ф2 и ф^, ф^. Дифферен- циальное уравнение (6.1) для собственного вектора ф, содержащего время только в сомножителе e~ivt, в каче- стве своих четырех компонент имеет две компоненты вйда и еще две —аналогичной структуры; мы здесь ввели обо- значения Е, Е—Ф=и. С ’ Производные по х и у, которые появляются в (7.6), могут быть удалены с помощью равенств (7.5); в результате получаем уравнения ^4v+£)]Hm-+v)e-o. 1 Г,, -f1 • -l( A_ik\ f n (7'7) где f = x|>i(O, 0, r), g«=^(0, 0, r). Остальные два уравнения получаются путем записи (ф^, ф2) вместо (фп фх). В произвольной точке Р = Р (х, у, г) вра- щающейся системы координат, положительная ось z кото- рой проходит через Р, первая и третья компоненты ф удовлетворяют уравнениям (7.7). Удобно ввести в каче- стве переменных вместо f и g величины rf и rg, так как 1 d(rf) / 1 , f г dr \ г ' dr J i' Если мы хотим удалить из уравнений г, то можем записать rf = v-]-iw, rg~v—iw, и получим в итоге фундаментальные уравнения Т7 dw k Л uv— m.v w = 0, * ' (7.8) (7ги + ^+тода—у о —0.
§7. ЭЛЕКТРОН В СФЕРИЧЕСКИ-СИММЕТРИЧНОМ ПОЛЕ 283 ///. Сферические гармоники со спином. Пусть /(г), g(r)— решение уравнений (7.7); тогда во вращающейся системе координат имеем Ф1 = Тр, ^=g-p; i|?2=g-T, где сомножители р, т являются величинами, не завися- щими от г. При возврате к исходной системе координат каждая из пар ф2; 44, претерпевает преобразова- ние о, связанное с вращением s. Следовательно, ^1 = fpl + ёч =gpl+hl = /Р2 + ёЪ ^2 = £р2 + hi , где f и g зависят только от г, а сомножители р, т — только от направления, т. е. сферических координат 0, ф, вводимых подстановкой х 4- iy = г sin 0е1ф, z == г cos 0; коэф- фициенты в (7.9) должны, далее, удовлетворять условиям Pi(l — COS0)—р2 sin 0«?-£<p = О, тх(1 4-cos 0) 4-т2 sin 0^"f(p = 0. ' ’ Заменив S в законе сохранения Дирака на выражение в полярных координатах (гл. II, (4.10)), мы приходим с помощью (7.9) и (7.10) к дифференциальным уравнениям sin 0 Др- 4- i Др- 4-^(1 4 cos 0) тх = 0, до 1 д(р 1 ' 1 71 Л Э (7-п) sin0 4§-——&(1—cos0)p1= 0. д9 дф v /ri Таким образом, мы совершили преобразование волнового уравнения Дирака к полярным координатам. Формулы (7.9) соответствуют замене ф = /(г)Уг скалярной теории; вместо одного множителя /, зависящего только от рас- стояния г, мы получаем здесь пару /, g, а вместо поверх- ностной гармоники Yz, зависящей только от направления, мы имеем матрицу IIP1 T1II. II Р2 Т2 || Уравнения (7.11) вместе с условиями (7.10) определяют товерхностные гармоники со спином порядка k»\ они совершенно не зависят от потенциала Ф. Собственные значения Е уравнений (7.7) и (7.8) представляют собой уровни энергии, связанные с квантовььм числом k.
284 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Как и в теории обычных сферических гармоник, мы здесь снова отыскиваем те сферические гармоники со спином, которые содержат полярный угол только в со- множителе ^тф: рх e (sjn 0) -л. р, Т1 = gfmv (sjn 0)-л. Q. (7.12) Подставляя эти выражения в (7.11) и принимая z = cos0 за независимую переменную, находим (l-z)-g- = -mP + ^Q, dQ (7.13) (14-z)-g- = /nQ-feP. Более строго мы обозначим решения Р, Q этих урав- нений, приводящие к несингулярным функциям р, т на сфере, через Pg"*, Q‘fcm). Достаточно рассмотреть случай k > 0, поскольку пара (—Р, (?) является решением урав- нений, полученных при замене k на — Р<д> (2) = -РГ (г), (г) = Qr (z). (7.14) Более того, dz ’ dz 4 ’ так как производные Р(я,), Q<m) удовлетворяют дифферен- циальным уравнениям (7.13) при подстановке т—1 вместо т. Для т=—k пара (Р, Q): Р—1, Q=—1 яв- ляется решением, которое удовлетворяет всем требова- ниям непрерывности на сфере, поскольку сомножитель (sin 0) ~а е?т'» = (х—iy)~m для отрицательных т конечен. Следовательно, мы нахо- дим полиномиальные решения (7.13), степени которых равны 0, 1, ..., 2k—1, соответственно значениям т= —k, —&Н-1, ..., k—1. Тогда для случая m = k—1 получаем решение Р (z) = (1 —z)*-* (1 + z)ft, Q (z) = (1 + z)*"1 (1 —z)*. Таким образом, мы в итоге получили следующие явные выражения для сферических гармоник со спином: 7>r(z) = ^-{(1-z)«-1(1+z)^, de <7-15)
§ 8. ПРАВИЛА ОТБОРА. ТОНКАЯ СТРУКТУРА 285 где р = &—1—т. Они ведут себя как обычные сфери- ческие гармоники. Важны также следующие уравнения: РГ (-г) = (-1)'-<2Г (г), <2Г (-г) = (-Vy-P^ У). (7.16) § 8. Правила отбора. Тонкая структура /. Правила отбора. В решении гр, определенном формулами (7.9), (7.12), компонента ipj (подобно рг и Tj) содержит угол <р только в множителе еГт<₽, а компонента ф2 (подобно р2 и т2)— только в множителе еС(т+1)ч>; то же самое имеет место для фа- Отсюда =т +4 +4) ~2 — (т 2 ) ^2' Соответственно z-компонента момента импульса в состоя- нии (k, т) равна тЦ-1/2. Следует отметить изменение в значении квантового числа т: как и ожидалось, т+ 1/2 пробегает значения k—1/2, 6—3/2, ..., —6+1/2 = /, /—1, ..., — /. Для того чтобы получить правила отбора для воз- можных переходов (6, т) —> (k', т') и соответствующие интенсивности, мы должны рассчитать матрицу, представ- ляющую энергию взаимодействия между атомом и излуче- нием, в системе координат, определяемых собственными функциями ф<п), которые в свою очередь определяют со- стояния п атома. Производя выкладки, как в гл. II, § 13, мы из (5.15) находим, что эта матрица имеет вид з е 2 Sp^p- Р=1 Вектор здесь играет ту же роль, что и вектор q в гл. II. Интенсивности по существу определяются элемен- тами матрицы @(п, п'), три компоненты которой равны Sp(n, п') = $ Правила отбора являются просто следствиями того, что © — вектор. Сначала, рассматривая только собственные
286 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП вращения пространства, мы получаем известный ранее результат для tn и j. Правило для / утверждает, что до- полнительное квантовое число k может переходить в ± (k—1), ±k, ±(&4-1). (8-1) Отражению i соответствует перестановка Т двух пар (фг, Фг), (Фь Фз)- В полярных координатах это отраже- ние состоит в переходе от (0, <р) к (л—0, лЦ-ф); таким образом, z = cosO переходит в —г, а множитель eirn(? при- обретает знак (—I)"1. В согласии с (7.15) и выражениями для рп ту, р2, т2 оно приводит к перестановке рх, rt с возможным изменением знака, что определяется подста- новкой О 1 1 О (_1)^ + лл = (—о|; то же самое справедливо и для р2, т2. Для ф с дополни- тельным квантовым числом k получаем из (7.9) равенство ГфН, —у. — ?) = (—l)*~^(x, у, z). Подпространство таким образом, имеет четность S = = (—I)*’1; этот результат был получен в предположении, что k > 0. Заменив k на —k и применив (7.14), мы на- ходим вместо (7.16) решение (-z) = (-1К+1 QLT (г), Q(-T (-г) = (-1Н1 РЩ (г). Четность, соответствующая дополнительному квантовому числу —k (k > 0), равняется, следовательно, величине (—1)*. При подстановке / = —k, когда k — отрицательное (/ =—k—= 1—1/2), 1 l = k—1, когда k — положительное (j = k — 1/2 = 1 + х/2), I (8.2) оба варианта сводятся к формуле 6 = (—l)z или 6 = = sgn k • (—l)ft-1. В собственном векторе встречаются только коэффициенты, соответствующие переходам с из- менением четности на обратную. Таким образом, наше правило отбора для k сужается до k ^k— 1, —k, k+\. (8.3) Следующая таблица дает значение дополнительного кван- тового числа k, отвечающего каждой возможной комбина- ции I и j:
§ 8. ПРАВИЛА ОТБОРА. ТОНКАЯ СТРУКТУРА 287 1 i 0 1 2 3 4 —1 —2 —3 —4 1 2 3 4 5 II. Переход к пределу с-^оо. Для того чтобы вернуться от релятивистской механи- ки к обычной, мы должны перейти к пределу с—>оо. Прежде чем применить этот предельный переход к урав- нениям (7.8), мы должны заменить U, v на m^U/c, сс, тогда, пренебрегая t//c2 по сравнению с 2m//i, мы полу- чаем уравнения: у„_(4 + А)ш, 2mw =—h (4-----v- Сокращая w, мы получаем или -Т“2--~2~ - \V+UV=O. 2m \ dr2 r2 / 1 Введя число l из (8.2), мы в обоих случаях имеем k(k—1) = /(/+1). Отсюда в пределе термы с одинаковым /, а, следовательно, с дополнительными квантовыми чис- лами k и —k — 1 совпадают с термом, относящимся к азимутальному квантовому числу I в скалярной теории гл. II. Следовательно, дублет, найденный в спектрах ще- лочей,— и вообще мультиплетная структура спектраль- ных линий—объясняется как релятивистский эффект. III. Н, Неь, ... Применяя единицы Хевисайда, наиболее подходящие для теоретико-полевых выкладок, мы для кулоновского поля с зарядом ядра Ze получаем потенциал вида _ф = 4лг В последующих расчетах мы обозначим число Za/4n, крат- ное постоянной тонкой структуры а/4л, просто через а,
288 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП и будем полагать, что moc = vo. Для того чтобы проин- тегрировать уравнения (7.8), мы выполняем замену v=e~Pr-F, w = e~^r-G, где р—положительная константа. При этом мы прихо- дим к уравнениям (4+7-)e-7-f-(7-^)'’+fW- ,84, Наш метод приведет к решению, если мы выберем кон- станту Р таким образом, чтобы определитель линейных комбинаций F и G в правой части (8.4) обращался в нуль: (т)2-(^)2 + Р2 = 0’ (8.5) Мы будем искать решение в виде степенного ряда F = 2 ЯцГц, G = 2 ЬцГ11, где показатель р имеет начальное значение р0 и пробе- гает значения р0, р0 + 1, р0 + 2, ••• Подставив эти ряды в (8.4), мы получаем рекуррентные формулы (р + *)5ц—a^+pfcn-i, V /v v (8.6) + (Ц—= Рам-1 — (у + ^7-J 5М_1. Начальный показатель, р = р0, определяется из условия, чтобы определитель коэффициентов а^, Ьц, стоящий в ле- вой части, для этого значения индекса обращался в нуль: р2—&24а2 = 0; р0 = К&2—а2. Из определения числа р в (8.5) видно, что существует линейное соотношение между правыми частями (8.6) с коэффициентами v/c + vjc, р, которое удовлетворяется тождественно по яц_|, 5ц_ь Отсюда для всех р имеем (7-4—) [(р 4- k) аяц] 4- Р [а5ц 4- (р—5) яц] = О, ИЛИ 5ц [(т’ + 'т) (lx4-5)4-®pj 4- 4-Яц[р(ц-А)-(|4-^-)а] = 0. (8.7)
5 8. ПРАВИЛА ОТБОРА. ТОНКАЯ СТРУКТУРА 289 Степенные ряды будут обрываться на члене с некоторым показателем ц, если при замене ag_i, на ац, пра- вая часть (8.6) обращается в нуль. Это произойдет, если выполнится равенство Р^+(т—(8.8) оно удовлетворяется, в силу (8.7), если определитель коэффициентов в предыдущих двух уравнениях равен нулю: или ввиду (8.5): а.*_Ри=о, 4=Д-. с eft а Поскольку показатель р, при котором ряды обрываются, должен иметь вид ц„ + п, где п—положительное целое число, мы получаем формулу тонкой структуры V _ Е = — (п 4- ]/" k? — а2). V Vo —V2 Vml—Е2 ф у»*- 1 у w у. Мы находим, что решение ф наших дифференциальных уравнений для собственных значений v = cE, определяе- мых из (8.9), имеет вид е-Рг.г^«. (многочлен порядка п по г) и удовлетворяет условию сходимости пространственного интеграла |ф|2 в окрестности особых точек г —0, оо. Сле- довательно, эти Е образуют дискретный спектр термов иона с ядерным зарядом Ze и только одним электроном вне ядра. Если пренебречь малой константой а по^срав- нению с k, то энергия будет зависеть только от п +1£ |. Далее, эта формула тонкой структуры говорит нам, что два терма с (дополнительными квантовыми’числами k и —k или два терма с одинаковым /, для которых / = = / ± 1/2, в точности совпадают. То, что это действи- тельно имеет место, уже было показано в § 4. Уравнение (8.9) имеет замечательную историю. Впервые оно было
290 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП получено на базе старой квантовой теории Зоммерфельдом и примерно в то же время было подтверждено экспери- ментально Пашеном-, возможно, оно было самым большим триумфом этой теории, вслед за объяснением Бора серии Бальмера и его вычислением числа Ридберга из универ- сальных атомных констант. Новая квантовая теория сна- чала разрушила это прекрасное согласие, поскольку в скалярной форме оно приводит к формуле (8.9) с полу- целым квантовым числом / вместо целого | k |. Первона- чальная формула Зоммерфельда была полностью восста- новлена только с появлением рассмотренной здесь теории Дирака. Восстанавливается также квантовое число k, ко- торое использовалось в старой квантовой теории вместо I и которое может принимать значение 0, но теперь оно снабжено еще и знаком. Однако, с другой стороны, число компонент в тонкой структуре теперь больше, чем в тео- рии Зоммерфельда, так как, кроме переходов k—>~k — 1, k +1, мы можем также иметь k —> —k\ это дополнение тоже согласуется с экспериментом. Наше заключение о том, что условие (8.8) должно удовлетворяться в силу уравнения (8.7) для неизвестных ац, &ц, если принять, что определитель двух уравнений равен нулю, несправедливо, когда оба коэффициента уравнения (8.6) равны нулю: v-)-Vo _ а ______ ц— k cf р + & а * Из этих равенств следует, что р = ]/&2—а2 или п = 0 и что р 4- k < 0 или k < 0. В действительности не сущест- вует никаких термов n = 0, k — —1,—2,—3, ..., по- скольку тогда коэффициенты а^, для начального члена в соответствующем решении (который в то же самое вре- мя является и конечным членом), ввиду равенств (8.6), (8.8), с необходимостью удовлетворяли бы уравнениям (р + £)&ц—аац = 0, а6ц + (р—&)ац = 0, или __ Ьц \ а р —6 v — Vo «ц ) р + й а ёр ’ а это невозможно ввиду условия | v | < | v01 [16]. В соответствии с предыдущим мы можем описать нор- мальное состояние атома водорода и = 0, 6=1 (/ = 0) еле-
§ й. РЕЗОНАНС МЕ>КДУ ЭКВИВАЛЕНТНЫМИ ОБЪЕКТАМИ 291 дующим образом. Мы берем квантовое число /и, которое может принимать одно из значений 0, —1, равным 0. Пусть а = 0,532 А — радиус первой орбиты Бора, а а = = 7,29-10~3—постоянная тонкой структуры. Компоненты фп Фг‘> Фп Фг получаются при умножении радиальной функции на множители (1 + К1—a2) + iacos0, iasin0e1’’) i|)i, i|)2, (1 + /T=a2)—fa cos 0, —fasin0ef(p | ф^, фз. Из этих выражений мы находим, что плотность вероят- ности фф обладает сферической симметрией и законом распределения р = [Х(г)]2. Здесь мы не стремились к такой нормировке, при кото- рой интеграл от р по всему пространству равняется еди- нице; в действительности этот интеграл равен 4л (у)‘+2ГТТ“5-Г(1 +2 КТ—а2). Мы уже видели, что плотность вероятности, умножен- ная на —е, представляет собой (в определенном смысле) распределение заряда в атоме. Предполагая, что ток ве- роятности определяет конвекцию этого непрерывного рас- пределения заряда р, находим, что ток вероятности опи- сывает вращение электрона вокруг оси z со скоростью ac sin 0 (ас—скорость электрона на первой воровской орбите в старой теории). При прохождении осью враще- ния всех возможных направлений ф пробегает двухпара- метрическое семейство собственных решений, для которых п = 0, 6=1; мы можем принять за базис этого семейства решения с т=0 и т =—1, которые представляют вра- щения в противоположных направлениях. В. ГРУППА ПЕРЕСТАНОВОК § 9. Резонанс между эквивалентными объектами Эрмитовы формы Q, представляющие в пространстве состояний все возможные физические величины данной системы, образуют множество 2, на котором определены
292 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП сложение и умножение. Если бы 2 было приводимым, мы могли бы выбрать нашу систему координат в простран- стве состояний так, чтобы все Q одновременно полностью приводились; те отдельные части, на которые разделялось бы целое, являлись бы тогда решениями квантовой за- дачи, которые чисто случайным образом объединялись бы вместе и давали нужное решение. В соответствии с фун- даментальным постулатом Аристотеля «nihil frustra» *) Природа, по-видимому, вряд^ли потворствовала бы такой излишней роскоши. Таким образом, мы принимаем тезис, что 2 является неприводимой системой. Если в качестве фундаментальных величин принять канонические перемен- ные из гл. II, § 11, то это предположение будет утверж- дать следующее: невозможно выбрать координаты в про- странстве состояний таким образом, чтобы 2f матриц • • •» Ч/’ Ри • • • > Р/ одновременно полностью приводи- лись. Этот постулат следует как существенное дополне- ние добавить к перестановочным соотношениям Гейзен- берга. В соответствии с теоремой Бернсайда (гл. III, § 10), которую мы без колебаний переносим из пространств с конечным числом измерений в бесконечномерные прост- ранства, постулат неприводимости позволяет нам утверж- дать, что между компонентами Q не может существовать никакого линейного однородного соотношения tr (AQ) = 0, которое удовлетворялось бы для всех Q. Поскольку в множестве форм Q возможно не только умножение—как предполагается в теореме Бернсайда, — но и сложение, мы приходим к заключению, что в 2 содержатся все эр- митовы матрицы, имеющиеся в пространстве состояний. Вероятно, наше требование следует выразить непосредст- венно в виде: любая эрмитова форма представляет физи- ческую величину системы. В соответствии с гл. II, § 7, с каждым статистическим ансамблем связывается положи- тельно определенная эрмитова форма А такая, что tr(AQ) является математическим ожиданием величины, представ- ляемой формой Q. Теорема Бернсайда утверждает, что уравнение tr(AQ) = tr(A'Q) может быть удовлетворено для всех Q только в случае, если А = А', или что различие между двумя статисти- ♦)Ничто не зря (лат.). (Примеч. пер.)
§9. РЕЗОНАНС МЕЖДУ ЭКВИВАЛЕНТНЫМИ ОБЪЕКТАМИ 293 ческами ансамблями, представленными положительно оп- ределенными эрмитовыми формами, невозможно произвести только при А—А'. В частности, из этого следует, что состояния, представленные двумя лучами в пространстве состояний, являются физически различными, если раз- личны эти два луча; этого следовало ожидать или даже требовать с самого начала. Эти следствия показывают естественность и убедительность постулата неприводимости, из которого они все могут быть выведены. Состояния полностью эквивалентных физических объек- тов I таких, например, как электроны в атоме, должны представляться векторами ? = (хг) или лучами в одном и том же пространстве состояний 91. Если два таких объек- та объединяются и образуют единую физическую систему /2, то векторы соответствующего пространства состояний 9ix9i = 9i2 являются, в соответствии с общим правилом х-умножения, тензорами (х№) второго порядка. Но со- гласно гл. III, § 5 пространство 912 приводится к двум независимым подпространствам {9t2} и [9(2], т. е. к про- странству антисимметричных и пространству симметрич- ных тензоров второго порядка. Физические величины Q системы /2 имеют объективный физический смысл только тогда, когда они симметрично зависят от обоих объектов. Это требование выражается через элементы эрмитовой формы Q Я ik, i'k' условием симметрии 4ki,k’t’=qik,i’k’ (9.1) При приведении к его антисимметрической и сим- метрической частям х1к — х {№} + х (Ik) (9.2) форма Q приводится, в силу (9.1), к двум эрмитовым формам от х {ik} и х (ik) соответственно, так как при подстановке (9.2) в Q мы получаем четыре члена—два, в которых {9(2}, [912] пересекаются сами с собой, и два, в которых {9i2} скрещивается с [912], или обратно. Эти два последних члена исчезают, так как при перестановке фиктивных индексов i и k, i’ и k’ в формуле {Q] = ^qik.i*~x{ik}x(i'k')
294 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП и последующей замене х {ki}. x(k'i') на qikfi^9 —х{й}, x(i'k') мы находим, что [Q] = —[Q] или [Q] = 0. Следовательно, совокупность эрмитовых форм Q, которые представляют величины системы I2, зависящие симметрично от двух объектов, не является неприводимой; она может быть приведена в соответствие с разложением = {№} + [Э?а] (9.3) пространства 3t2. В частности, любое возможное взаимодействие между двумя объектами зависит от них симметрично, даже ког- да вовлекаются другие физические элементы, такие, нап- ример, как поле излучения. Отсюда, если система I2 на- ходится какое-либо время в состояннии, содержащемся в одном из подпространств {9i2} или [9t2J, то никогда и ни при каком воздействии невозможно перевести ее из этого подпространства. Мы снова надеемся, что При- рода использует только одно из этих подпространств, но постулат неприводимости не предлагает нам никакого ключа, чтобы узнать, в пользу какого из подпространств она вынесла решение. Возьмем в качестве координат в пространстве состоя- ний Э? объекта I главные оси е; энергии, соответствую- щие собственным значениям Е{. Если пренебречь на вре- мя взаимодействием между объектами, то система I2 имеет в качестве уровней энергии значения E( + Eft с соответ- ствующими собственными векторами е,-хей = е^; каждое собственное значение типа Ej-j-Eg появляется дважды, и соответствующее собственное пространство покрывается векторами е12 и e2i- При введении взаимодействия как малого возмущения два состояния е12 и е21 оказываются в резонансе друг с другом. Если обозначить компоненты полной гамильтоновой функции через Н (i, k", i', k’), то преобразование подматрицы ||Я (1,2; 1,2) Н (1,2; 2,1)11 II Я (2,1; 1,2) //(2,1; 2,1) || к главным осям, требуемое теорией возмущений, может быть в данном случае выполнено, причем универсальным способом; нам нужно только заменить фундаментальные
§9. РЕЗОНАНС МЕЖДУ ЭКВИВАЛЕНТНЫМИ ОБЪЕКТАМИ 295 векторы ei2, е21 на (^12 ^21)> j/'g- (^12 T ^21)* (9-4) Если обозначить /7(1,2; 1,2) = 77(2,1; 2,1) через hv, а числа Н (1,2; 2,1) = // (2,1; 1,2), которые должны быть вещественными в силу условия эрмитовой симметрии /7(1,2; 2,1) = Н (2,1; 1,2), через ha, то уравнения резо- нанса принимают вид + (^12 + ах21) = 0, Т + <ах’2 + VX2l)= °’ откуда следует, что = -< (v-a) (х12-х21), d^+x^^-i(v + a)(x12 + x21). Принимая за начальные условия х12 = 1, х21 *= 0 при t = 0, мы находим решения *12—*21 = е-1 х12 + х21 = е~{ <v+a> ; (9.5) | |2 = cos2 a/, | x2112 — sin2 at. Отсюда мы находим, что два состояния е12, ?е21 чередуются друг с другом с периодом биений 2л/а, тогда как компо- ненты (9.5) вдоль осей (9.4) всегда имеют одни и те же постоянные абсолютные значения. С пространством состояний {Э12} связаны только соб- ственные значения типа E1-[-E2i каждое из которых по- является точно один раз, в то время как подпространство [SR2] имеет кроме них еще и простые собственные значе- ния типа 2EJ. Отсюда, если Природа выносит решение в пользу {Э12}, то оба объекта никогда не могут одно- временно находиться в одном и том же квантовом состо- янии с энергией Elt если предположить, что этот энерге- тический уровень для отдельной системы является невы- рожденным. То, что значения Е1-]-Е2 встречаются в про- странствах {Э?2}, [Я?2] только по одному разу, означает следующее: вероятность того, что один из близнецов — Майк и Айк — находится в квантовом состоянии Еъ а другой — в квантовом состоянии Е2, не меняется от
296 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП перестановки Майка и Айка, т. е. невозможно сохранить определенность каждого из этих объектов так, чтобы об одном из них всегда можно было сказать: «Это Майк», а о другом: «Это Айк». От электрона даже в принципе нельзя требовать алиби! Таким образом, в квантовой ме- ханике выполняется лейбницевский принцип coincidentia indiscernibilium*} [17]. При переходе от двух к f эквивалентным объектам I приведение представления (с)7 полной линейной или уни- тарной группы в пространстве ЭТ к его неприводимым составляющим становится достаточно сложным; мы рас- смотрим этот процесс в последней главе. Тем не менее, из гл. III, § 5 мы знаем, что антисимметричные и сим- метричные тензоры порядка f с компонентами х {kjt2 ... kf}, х (krk2 ... kj) соответственно дают такое неприводимое представление. Физическая величина Q полной системы которая за- висит симметрично от всех f объектов, будет представ- ляться эрмитовым оператором Q, коэффициенты которого q (krk2... kf\ k[k2 ... kf) не изменяются при одновремен- ном воздействии на krk2 ... kf и k^k.'. ... kf одной и той же перестановки. Очевидно, что такой оператор всегда переводит антисимметричный тензор х {kYk2 ... kf] в анти- симметричный тензор х'\ х’ {кгк2 ... k;} = 2 Я (&А • • • k[k2 ... k'f) х {k'Jz'z ... kf]. k' Таким образом, подпространство {9V} антисимметричных тензоров выделяется из пространства состояний 9V систе- мы If (которое определено по общему правилу х -умноже- ния), благодаря тому свойству, что если система в не- который момент оказалась в пространстве {9V}, то она остается в нем навсегда, каким бы воздействиям она не подвергалась. Подобным же образом можно выделить из 9iz подпространство всех симметричных тензоров х (k) порядка /. Энергетический уровень ; Е2-|- ... I Ef, ко- торый является /!-кратно вырожденным в 9V, появляется в {9V} как простой уровень. В пространстве {9tz} появляются собственные значения только такого типа, в то время как собственными числами в [9V] являются все числа, которые могут быть получены при суммировании f раз- личных или одинаковых энергий Е. *) Неразличимая тождественность (лат.). (Примеч. пер.)
§10. ПРИНЦИП ЗАПРЕТА ПАУЛИ 297 Если пространство состояний является n-мерным, то {9V} возможно только при f^n. Если Е является некрат- ным энергетическим уровнем объекта, то квантовые сос- тояния с энергией Е образуют n-мерное подпространство Э1(Е). Если в Природе реализуется только {sJiz}, то в си- лу предыдущего изложения было бы невозможно иметь более п объектов системы If в квантовом состоянии Е. Приведение к {Э?Д или [9tz] вызывает такие ассо- циации, которые расстраивают любую попытку описать этот процесс на языке наших старых интуитивных картин с их орбитами и бильярдными шарами — электронами. Кроме того, появляются затруднения с применением об- щего правила композиции, согласно которому многообра- зие возможных чистых состояний системы, составленной из двух частей, гораздо больше многообразия комбина- ций, в которых каждая из частных систем сама находит- ся в чистом состоянии. § 10. Принцип запрета Паули и структура периодической системы элементов Один из наиболее фундаментальных фактов Природы, упорядочение физических элементов в периодической систе- ме элементов, может быть понят только с помощью на- ших предыдущих построений. Мы переходим от одного атома к следующему, который мы обозначим через А, в два шага: первый является подготовительным и состоит в повышении заряда ядра на 1, а второй (и окончатель- ный) шаг состоит в добавлении к полученному иону А + электрона. Для того чтобы состояние атома А было нор- мальным, этот дополнительный электрон должен быть связан с А+ наиболее тесным образом, т. е. энергия пол- ной системы А должна иметь минимум. Если бы мы на время пренебрегли взаимными возмущениями электронов, хотя они могут быть очень значительными, мы могли бы ожидать, что обнаружим все электроны в невозбужденном атоме на уровне с низшей энергией, т. е. с главным квантовым числом п = 1. Но вместо этого мы обнаружи- ваем следующее: один электрон Н и два электрона Не находятся на ls-орбите, т. е. в квантовом состоянии п=1, / = 0. Следующие два электрона, которые добавля- ются при переходе к Li, Be, находятся на 25-орбите, а дополнительные шесть электронов, прибавление каждо- го из которых приводит к возникновению одного из
298 РЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП элементов от В до Ne, входят в 2р-орбиту. Затем следуют Na и Mg, каждый с новым электроном в Зе-состоянии, элементы от А1 до Аг с добавочными электронами, вхо- дящими в Зр-орбиту, и т. д. Эти закономерности можно проследить также, записав волновое число низшего S-тер- ма в виде —Rln1\ в элементах Н, Не и Li «эффективное квантовое число» п» имеет значения 1,00; 0,74; 1,59 соответственно. То, что п, падает при переходе от Н к Не, можно интерпретировать как эффект экранирования первоначальным электроном нового электрона. Мы долж- ны были бы ожидать, что при попадании следующего электрона на орбиту п= 1 соответствующее значение п, было бы около 0,59, но мы обнаруживаем вместо этого число, которое больше указанного на единицу. То же самое происходит и при переходе от Be к В или от Mg к А1; нормальные состояния этих атомов образуются ва- лентными электронами, входящими в 2р- или Зр-орбиты, так как 2s- и Зз-орбиты уже «заняты», и поэтому вален- тный электрон при возбуждении может перейти только в такое s-состояние, для которого nj>3 или п^4*). Очевидно, что существенные признаки- закономерностей, выраженных в периодической системе элементов, зависят от этого таинственного numerus clausus**) для различных состояний с главными квантовыми числами п — 1, 2, ... и от того, что, вследствие этого, электроны в атоме груп- пируются в определенные слои или «оболочки». Говоря более строго, в ns-орбите (n = 1, 2, ...) имеется место только для двух электронов, в пр-орбите (п = 2, 3, ...) — для шести. Эта ситуация полностью описывается правилом Стонера: в состоянии с квантовыми числами п, I может находиться не более 2(2/+1) электронов. Мы видим, что с учетом удвоения, вызванного спином, это число в точности равно размерности подпространства 31 (п/) в пространстве состояний электрона. Если пренеб- речь спиновым возмущением, которое действительно го- раздо меньше, чем взаимные возмущения электронов, то ♦) Из этих соображений вытекает физический смысл «истинного квантового числа» п: мы подразумеваем, что член в гамильтоновой функции, который представляет энергию взаимодействия между раз- личными электронами, умножается на численный множитель X, и за- ставляем К уменьшаться от 1 до 0; этот виртуальный адиабатический процесс переводит каждый электрон на определенную водородную орбиту с главным квантовым числом п, «истинным квантовым числом» электрона. ♦♦) Чередование чисел (лат.) (Примеч. пер.)
§ 10. ПРИНЦИП ЗАПРЕТА ПАУЛИ 299 уровень энергии, связанный с этим подпространством, оказывается 2 (2/ + 1)-кратно вырожденным. Это вырожде- ние может быть устранено при введении спинового воз- мущения и слабого магнитного поля; уровень энергии тогда расщепляется на 2(2/+1) простых компонент, различа- ющихся квантовыми числами j = /±+ т = /> /— !> •••> —/• Правило Стонера привело Паули к правилу исключения эквивалентных орбит: два электрона в атоме не могут одновременно находиться в одном и том же квантовом состоянии (n, I, j, т). Это правило показывает, что пространством состояний физической системы И, в кото- рой f электронов вращаются вокруг фиксированного ядра, является, очевидно, не ЗУ, а {О?7}: Природа приняла ре- шение в пользу приведения к пространству антисиммет- ричных 'тензоров, по крайней мере гв случае электронов. В силу выкладок, приведенных в предыдущем параграфе, этот принцип, в свою очередь, приводит нас обратно к правилу Стонера [18]. Если бы образование последующего атома из пред- шествующего было полностью регулярным процессом, то при переходе от одного атома к другому имела бы место следующая таблица чередования различных состояний (в которой нижняя строка указывает число захваченных электронов на орбите, записанной в верхней строке): Is; 2s, 2р; 3s, Зр, 3d; 4s, 4р, 4d, 4f; ... 2; 2+6] 2 + 6+10; 2+6+10 + 14; 77Г Это действительно имело бы место, если бы можно было повысить заряд ядра до некоторого большого фиксиро- ванного значения, так как при этом взаимные возмуще- ния электронов оказались бы сколь угодно малыми по сравнению с кулоновским отталкиванием ядра. Но даже грубый расчет показывает, что эти возмущения в дейст- вительности слишком значительны и приводят к измене- ниям в таблице, приведенной выше (к изменению в по- рядке заполнения различных оболочек). Например, после заполнения Зр-оболочки, которое завершается на Аг, сле- дующие два электрона попадают в 45-состоянияи обра- зуют К и Са, и только затем при образовании Sc, Ti, ... мы находим электроны, входящие в Зй-орбиты. Более подробно эти вопросы рассматриваются в книгах Хунда,
300 ГЛ. Iv- ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Паулинга и Гоудсмита или Руарка и Ури, указанных во введении. В этой книге мы не будем обсуждать многочисленные эмпирические данные спектроскопии и процесс формиро- вания на их основе двух основных принципов, которые продвинули общие положения квантовой механики по интерпретации спектров; я имею здесь в виду введение в дополнение к азимутальному квантовому числу I еще и внутреннего квантового числа / или введение вращаю- щегося электрона, с одной стороны, и приведение к {9?/} посредством принципа запрета Паули—с другой. Милликен начал свой доклад в Американском философс- ком обществе на встрече «Последние достижения в спект- роскопии»*) со слов: «Никогда в истории науки не было скачка в представлениях, совершенного так внезапно из состояния полной неясности и невразумительности к ус- ловиям полной ясности и предсказуемости, как это было в области спектроскопии в 1913 году». Теория групп предлагает подходящий математический инструмент для описания завоеванного таким образом порядка. Линии оптического спектра определяются квантовыми переходами электронов, связанных с атомом наиболее слабо. В щелочных элементах Li, Na, К, ... такой электрон находится в состоянии 2s, 3s, 4s, ... соответст- венно. Мы можем теперь понять, почему ионы этих эле- ментов Li+, Na+, К+, • • • обладают сферической симмет- рией, и следовательно, почему их спектры могут быть приближенно рассчитаны при решении задачи о движении электрона в сферически-симметричном поле; действитель- ная 'причина’’этого состоит в следующем. Тот факт, что электрон имеет квантовые числа n, I, означает, что его состояние лежит в подпространстве с числом измере- ний X = 2 (21 + 1). Подпространство {Э?гх Я?,х ... х с %-множителями, получаемое при антисимметричном при- ведении 9?/', является*5 одномерным, и группа вращений индуцирует в нем одномерное тождественное представле- ние; т. е. оболочка, состоящая'из X электронов в состоя- нии п, I, обладает сферической симметрией. Ее присут- ствие не увеличивает многообразия термов. Отсюда про- исходит представление о «замкнутости» тех элементов, для которых оболочки завершены; элементами этого типа яв- ляются 'инертные ’газы, предшествующие щелочным эле- *) Proc. Am. Phil. Soc., 1927, v. 66, р. 211.
§ 10. ПРИНЦИП ЗАПРЕТА ПАУЛИ 301 ментам. Но мы должны ожидать, что Си, Ag, Аи также будут обладать щелочеподобными спектрами, так как только один из их электронов находится в s-состоянии, тогда как все другие элементы ближе к «замкнутой» кон- фигурации со сферически-симметричным полем. Очевидно, этим и должна объясняться валентность элементов; ведь именно она дала ключи, которые привели к открытию периодической системы элементов. Однако только в пос- леднее время мы смогли прибегнуть к помощи спектров, понятых и классифицированных с помощью атомной тео- рии Бора и других, и спектры подтвердили главные ха- рактерные признаки периодической системы видоизменяя, дополняя и улучшая ее детали. Следствия из принципа Паули для анализа термов атомных спектров будут обсуждаться детально в гл. V, особенно в § 15. Здесь мы вкратце укажем результаты для случая двуэлектронных спектров, f — 2. Точно так же, как щелочные элементы можно иссле- довать просто как одноэлектронные атомы, так и при исследовании щелочноземельных металлов нам нужно об- ращать внимание только на два наиболее слабо связан- ных электрона, которые занимают s-орбиту вне сферичес- ки-симметричной замкнутой оболочки. Если предполо- жить, что два квантовых состояния (л, /), («', Г) отдель- ных электронов различны, то, как и прежде, мы получаем один синглетный и один триплетный терм (п/, п'Г; L), полное азимутальное квантовое число L которого прини- мает значения L = l + l', l + l' — 1, ..., Р—/'|. Единственным отличием теперь является то, что такой терм появляется только один раз, тогда как прежде он появлялся дважды, соответственно перестановке электро- нов. Ситуация, однако, усложняется, если- ’(пГ) = (n'V). Синглетными те омами (nt; nt; L) оказываются только термы с четными £ = 0, 2, ..., 2Ь а триплетными являются только термы с нечетными Л=1, 3, ..., 21—1. Это правило полностью согласуется с эмпирическими данными.
302 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Наиболее известными спектральными линиями являют* ся линии, возникающие от переходов, в которых только один электрон находится вне нормального состояния и совершает переход между высшими энергетическими уров- нями. Отсюда, если один из двух электронов (не гово- рим который!) находится в нормальном состоянии п' = п0. Г — 0 (па— 1, 2, 3, 4, ... для Не, Be, Mg, Са, ...), то мы имеем L = l, и для определения синглетов или трип- летов достаточно двух квантовых чисел (га, /). Низший S-терм (Л = 0) синглетной системы имеет главное кван- товое число п = п0, но в триплетной системе нет такого терма; она начинается с п = л0+1. Мы находим, что низший S-терм в такой триплетной системе (который, как мы знаем, является простым), например, в спектре Mg, в действительности должен лежать не в окрестности са- мого низкого, а вблизи второго низшего S-терма синглет- ной системы. § 11. Задача многих тел и квантование волнового уравнения В этом параграфе мы отступаем от нашей традицион- ной терминологии и обозначаем число объектов через п вместо f. Сначала мы рассматриваем более полно приве- дение 9?" к [9%"], поскольку найдем, что (хотя оно не- пригодно в случае электронов) оно имеет место в слу- чае фотонов. Пусть Н = ||/7ар|| —гамильтонова функция объекта. Переменные ф(/гц п2, ...) в унитарном прост- ранстве [9^и] ведут себя подобно одночленам хп‘ порядка п, которые образуются из компонент ха произ- вольного вектора в 91; мы обозначим одночлен из (11.1) без знаменателя через <р(/гц п2, ...). Нам придется ис- пользовать формулу дифференцирования d (х?‘х,! ...) = (П1Х?‘_ 1х2г ... dXj) + -Ь (/i2Xi*x2’ 1 ... dx2) +... В отсутствие взаимодействия между объектами мы из равенства + <112) 3
§ 11. ЗАДАЧА МНОГИХ ТЕЛ И КВАНТОВАНИЕ 303 получаем уравнение —j<f(nltn2, = .... /1р+1,...) + ₽ + n22//2₽<P(»l, «2—h •••> ««+1, ...) + э + ................................... В сумме, стоящей в правой части, величину Ф («1 — 1, п2, ..., «р +1, ...) следует интерпретировать как ф(И1, п2, ...) для Р=1; аналогичный смысл имеет член с р = 2 и т. д. Мы можем записать это уравнение также в виде — Лф(П1, п2, ...)=^па//аа.ф(п1, п2, ...) + а + 2 /1а^ар,ф(---> па.— Г •••» Яр + 1» •••)• а¥=₽ Введя биномиальные коэффициенты в согласии с (11.1), мы получаем уравнения движения —4 ^_(щ,^2, • • •) = паНао,-^ (tlt, П2, ...) + а + 2 Киа(Пр+ 1)^ар-ф(..., Па— 1, Пр +1, ...). (11.3) Эти уравнения имеют вид 1^ + Нф = 0, Н = £ЯарПар, (11.4) а, 3 где матрицы т)ар определяются формулами па, если n[—nlt п2—п2, ..., О в противном случае, (П.5) а для ...) = { причем первая альтернатива выполняется, когда все п‘ « п, за ис ключением = па — 1, Ир = nB + 1, а другая—во всех Чаа (Hi, ^2» • • • > Hi, П2, . . .) —
304 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП остальных случаях. Матрица Н, как и предполагалось, является эрмитовой. Если Н имеет диагональный вид, то фундаментальные векторы, образующие нашу систему коор- динат, являются квантовыми состояниями различных объ- ектов; величина п2, . ..)|2 ПРИ этом представляет собой вероятность того, что в первом квантовом состоянии одновременно находятся п± объектов, во втором п2 и т. д. При приведении 91" к [9i"] становится невозможным раз- личить объекты в качестве Майка, Айка, и мы не можем поэтому узнать, какова вероятность того, что Майк находится в а-м состоянии, Айк — в 0-м, ... Если мы, кроме Н, имеем возмущение elF, воздействующее на объ- екты (симметричное по этим объектам), то уравнение (11.3) устанавливает изменение вероятностей |ф(/г1, п2, ...) |2 во времени. Гамильтонова функция Н напоминает нам ту функцию, которую мы получили в гл. II, § 13 при квантовании уравнений Максвелла; объектами там были фотоны. Урав- нения Максвелла следует рассматривать как квантово- теоретические волновые уравнения для отдельного фотона. Если мы заменяем фотон на объект, состояние которого (ха) меняется согласно уравнениям (11.2), то мы приходим к новому способу исследования задачи нескольких тел, который мы называем «методом вторичного квантования», в противоположность «методу композиции» или «х-умно- жению», рассмотренному в гл. II, § 10. При этом мы рассматриваем (11.2) как классические уравнения движения некоторой физической системы, каноническими перемен- ными которой являются вещественная и мнимая части ?а, Ра компоненты ха, и как таковые они подвергаются процессу квантования [19]. В этом месте мы обращаемся к построению, проведенному в гл. II, § 11. Введем в гамиль- тонову функцию Н в качестве независимых переменных вместо qat ра комплексные величины гамильтоновы уравнения тогда примут вид dxa = j дН (116) dt дха ’ dt дха Чтобы можно было рассматривать уравнения (11.2) как клас- сические уравнения движения системы с бесконечно мно-
§ 11. ЗАДАЧА МНОГИХ ТЁЛ И КВАНТОВАНИЕ 305 гими степенями свободы, в соответствии с нашей програм- мой они должны иметь вид (11.6). Но этой на самом деле имеет место; гамильтоновой функцией теперь является функция Н 2 НafiXaXfi* а, 0 При квантовании величины ха заменяются на эр- митово сопряженные матрицы ха, ха, которые удовлетво- ряют перестановочным соотношениям: •Яа-Яр ХрЛ7а = 0, I /1 1 74 - J 1 (ас=Р), | XaX|3 XpXa — Оар — J Гамильтонова функция Н превращается в матрицу Н = 2 (11*8) a, р если Н имеет диагональный вид, то получаем Н == 2 ^'a^'a^a* a Здесь мы имеем дело с бесконечной системой осцилляторов, отдельные члены которой различаются индексом а; энер- гия а-го члена определяется через комплексные координаты ха, ха выражением Еахаха. Квантовая теория одного осциллятора, развитая в гл. II, § 3, дает нам в качестве неприводимого решения уравнения XX — хх = 1 (где х, х—две эрмитово сопряженные матрицы, норми- рованные таким образом, что энергия хх имеет диагональ- ный вид) матрицы с компонентами: x(n, n-| l) — Vn-\ 1, х(п, п — 1) = ]/”/?; хх(п, п) = п, причем все остальные компоненты равны нулю; кванто- вое число п принимает значения 0, 1, 2, ... Из этих
306 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП выражений мы путем композиции получаем решение (11.7): Х(Х, (^1> Ц}.? ^2» ’ ' • ) “ ( К«а + 1» если все п' = п, кроме Ла = /1а+1, ( 0 в противном случае; Ха («I. п„, ...; П[, П2, ...)== ( И/га> если все п’ = п, кроме п'а = па—1, — \ 0 в противном случае. Произведения хаха, естественно, имеют диагональный вид; хах& является матрицей т]ар, введенной выше, а (11.8) совпадает с (П.4): метод вторичного квантования приво- дит к тому же результату, что и метод композиции, дополненный «.симметрическим приведением» к [&("]. Но теперь число объектов «1 + «2+ •••=« не фиксируется; однако Н приводится к подматрицам, соответствующим различным значениям п, поскольку равны нулю все компоненты Н(пхп2...; п[п'2..для которых ni + п» + • • • ¥= гц + «а + • • • Полное число фотонов не со- храняется, и в этом аспекте уравнения Максвелла не пол- ностью подходят для квантово-теоретической картины, если мы не хотим рассматривать «несуществование» как частное квантовое состояние фотона. Метод композиции применим также, если существует такая взаимосвязь между объектами, что мгновенное взаи- модействие на расстоянии определяется мгновенными зна- чениями канонических переменных различных объектов. Но он нарушается, когда, как в теории относительности, принимается во внимание конечная скорость распростра- нения, приводящая в классических теориях к введению непрерывных полей. Трудность возникает из-за того, что волновая функция ф, помимо пространственных координат каждой частицы, должна содержать в качестве аргумента одно время t, тогда как теория относительности требует, чтобы в качестве аргумента в ф, кроме пространственных координат, появлялось и собственное время каждой ча- стицы. Метод вторичного квантования доказывает свое превосходство в исследовании таких проблем. Как мы видели, метод вторичного квантования, соот- ветствующий соотношениям Гейзенберга, эквивалентен при-
§ 11. ЗАДАЧА МНОГИХ ТЕЛ И КВАНТОВАНИЕ 307 ведению пространства состояний 91" к [91"]. Поскольку, как мы видели в гл. II, § 13, он приводит к верной трактовке радиационных явлений, мы должны заключить, что пове- дение фотонов соответствует этому приведению. Однако в случае электронов имеет место приведение к простран- ству {91"}, и теперь мы должны исследовать вопрос, какому типу квантования это соответствует [20]. Векторами уни- тарного пространства {9i"} являются антисимметричные тензоры с компонентами х{ап а2, ..., aj ~ |%а1, ха2, . . .,ха„| (11.9) в пространстве 91, где одна строка из определителя в правой части соответствует п строкам, образованным аналогичным образом из п векторов j = j(1), j(2), ..., j(,z) пространства 91. Мы можем получить совокупность линейно независимых компонент, ограничив индексы условием < а2 < ... < ап. (11.10) Обозначим величины (11.9) через ф(п1, п2, ...), где /га= 1 или 0 в зависимости от того, появляется а в наборе ин- дексов а19 а2, . .., ап или нет; эти квантовые числа па, таким образом, могут принимать только одно из гдвух значений. При замене aj = a в (11.9) на индекс Р=/=а определитель (11.9) обращается в нуль, если р равен одному из оставшихся индексов а2, . .., ал; если же Р отличается от а2, ..., ап, определитель (11.9) превращается в вели- чину х{Ра2.. .а„} = ±г|)(/11, na—1, п₽ + 1, ...), причем знак ± 1 равен (— 1)г, где г—число индексов в наборе а2, ..ап, лежащих между аир: а сумма распространяется на все индексы % между а и р. Мы снова получаем уравнение вида (11.4); тогда выраже- ние (11.5) справедливо, но (11.5') должно быть заменено на выражение ^2, •••; ••<) = +! или 0, где первая альтернатива применяется к случаю, в котором все // = и, кроме па = 1, п'а = 0; == 0, = 1 (причем знак вновь определяется в соответствии с правилом, указанным
308 ГЛ. IV- ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП выше). Записывая произвольную матрицу ||а(шг')|| в виде 1|а(0 0) а (0 1)11 h(l 0) а(1 1)|| и вводя сокращения 0 1 Ji 1 0 мы получаем. Т]аа= 1 Х1Х . . . х(° J|x 1 х lx .. Т)ар=1 xlx ... x|J 2|xl'x ... X l'x|° ;|xl X ... (a¥=₽), где матрица, выписанная явно в первом уравнении, нахо- дится на a-м месте, а матрицы во втором уравнении — на a-м и р-м местах соответственно. Теперь мы должны по- пытаться записать эти матрицы в виде хах^ это дейст- вительно можно сделать, если принять, что ха—ГхГх ... X 1'х||® J ,, ,, ., II о о ха=1 х1 х ... хТхЦ] 0 X 1 X 1 х ..., I } (11.11) X 1 X 1 X . . ., J где малые матрицы, выписанные явно, находятся на а-м месте. Матрицы ха, ха являются эрмитово сопряженными, и теперь'Н можно'"записать с их помощью в требуемом виде (11.8). Вместо "перестановочных соотношений (11.7) мы получаем правила 0, ХаХ^ХрХа0, ХаХр ' ХрХа — 6ар. (11.12) Одночлен (11.1) является неприводимым решением этих уравнений для пары эрмитово сопряженных матриц ха, ха, которые нормируются так, чтобы матрица xaxa была диа- гональной. Чтобы показать, что уравнения (11.4) для вектора ф в пространстве состояний дают гамильтоновы уравнения (11.6) для форм Ха = 2 ха(п', »') ф(м)ф(п') и ха, nt п'
§12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 309 мы должны доказать, что в данном случае справедлива формула хС(ННх, = ^Д, дха применявшаяся в гл. II, § 11. Мы находим, что она не выполняется для произвольного многочлена Н от ха, ха, но выполняется для четных полиномов, и следовательно, для эрмитовой формы (11.8); при этом мы имеем равенства откуда х1 • хаХр — xax3• Xi = 6laXp, XjH—Hx, = 2 H1&x&. 3 Введя вещественные величины, т. е. эрмитовы формы Рау Уау посредством соотношений Ха = г/г ^Уа И' ^Ра) у 1-АУа'~ ^Ра) и обозначив набор q^ р2, q2, . единообразно через Piy Pzy Рзу Р±у - у мы получаем соотношения /^a=l. PaPpi J?PPa = 0 (а=£0). (11.13) Операторы /?а являются не только эрмитовыми, но и уни- тарными, как можно увидеть из первого из этих уравне- ний или непосредственно. Здесь мы вновь встречаемся с матрицами 11° Ч 11° -*! |1о|’ п 0:|’ которые возникали ранее в связи с обсуждением теории вращающегося электрона. Таким образом, мы обнаружили корректный способ квантования полевых уравнений, определяющих электрон- ные волны и волны вещества. Здесь мы вновь находим, как и в случае вращающегося электрона, что квантовая кинематика не должна ограничиваться предположением о специальных перестановочных соотношениях Гейзенберга. § 12. Квантование полевых уравнений Максвелла — Дирака [21] Полевые законы выводятся из гамильтонова принципа, который аналогичен гамильтонову принципу классической механики. Этот последний принцип выражается на языке
310 гл. IV. ПРИМЕНЕНИЕ 1 ЕОРИИ ГРУПП лагранжевых функций L, зависящих от координат поло- жения qt и их производных qt по времени, и утверждает, что первая вариация интеграла $L(qt,q{)dt (12.1) обращается в нуль, когда координатам qt присваиваются произвольные бесконечно малые приращения 8qb равные нулю вне определенного конечного временного интервала. При интегрировании по частям этот принцип приводит к дифференциальным уравнениям ^-LL'=o '’<=->• L‘=^- <12-2’ Полагая /7 = Л + 2 4iPi i и замечая, что 51 = 2^* 8qt — 'ZpiSqi, i i мы получаем выражение для дифференциала Н; 8Н = '%jLi 8qt + 2 $Pi- i i Выразив H как функцию от qt и обобщенных импуль- сов р/, связанных с ними, мы получаем уравнения дН т дН • dqt h dpi которые согласно (12.2) и являются каноническими гамиль- тоновыми уравнениями dq; дН dp; _ _ дН dt др; ’ dt dqt ' В квантовой теории величины qt, Pi представляют собой операторы, удовлетворяющие перестановочным соотноше- ниям Гейзенберга. Мы можем без труда применить эти рассуждения к случаю континуума, что мы и делаем в полевых теориях. Заменяя временно трехмерное пространство одномерным интервалом 0 х 1, описываемым координатой х, и пред- полагая, для простоты, что существует только одна функ- ция состояния q=q_(x,^i), мы вместо интеграла (12.1)
§ 12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 311 получаем выражение 1 L(q, q) dxdt. о Естественно, функция L может зависеть, кроме q, еще и от пространственных производных dqjdx или даже от производных более высокого порядка. В этом случае непре- рывная переменная х займет место индекса I, а лагран- жевой функцией, в смысле (12.1), вместо L будет интеграл по пространственной переменной 1 J L (</, q) dx. о Сначала мы заменяем континуум на дискретное множество эквидистантных точек, определяемых формулой x^iin (f=0, 1, ..п—1). Дифференциальные производные пох при этом заменяются на разностные производные с раз- ностью Дх=1/п, а интегралы превращаются в суммы. В соответствии с изложенным выше мы теперь должны положить п dL(<bti\Y Pt~------w (с вычислением значений в точке x=i/n). Аналогично для континуума мы полагаем _ dL(q,q) dq и Н определяется по формуле 1 Н = L + J qp dx. о Перестановочные соотношения, которые выполняются для q, р в квантовой механике, вызывают некоторые труд- ности. Когда мы применяем вместо континуума дискрет- ную систему точек, эти правила приобретают вид Я W Р (х')—р (х') q (х) = . 8ХХ„ где х, х' пробегают независимо набор точек i/п, а 8ХХ, равно 1 или 0 в зависимости от того, совпадает х' с х
312 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП или нет. Для фиксированного xf равенство • ^хх> == б (X X ) определяет функцию х, исчезающую для всех значений аргумента, кроме х', а там она настолько велика, что сумма ^д(х-х'у\х оказывается равной единице, (ле- .V дователыю, при работе с континуумом мы вводим, как это делал Дирак, функцию б(х—х'), которая исчезает во всех точках х^=х' и настолько велика в точке х', что ее интеграл имеет значение, равное 1 (ср. гл. I, § 7). В действительности такой функции не существует, но она может быть «произвольно близко аппроксимирована» функ- цией, которая исчезает всюду, кроме очень малого интер- вала около х', и принимает на этом интервале очень боль- шие значения. Только в этом смысле мы можем произвести переход к пределу Дх = 0 и записать перестановочные соотношения символически в виде q (х) р (х') — р (х') q (х) = /б (х—х'). (12.3) Хорошая иллюстрация математической интерпретации этой патологической функции б(х—х') возникает в теории ортогональных систем функций (х), где с ее помощью формулируется условие полноты системы 2ф.(*)Ф/ (х') = 6(х—х'). i Это условие корректно, когда х пробегает только дискрет- ное множество точек, строгая же математическая форму- лировка для случая континуума имеет вид 1 1 п __ 1 _ lim § $ 2 Ф/ <Х) Ф| (х')-и (х) v (х’) dx dx' =Д и (х) v (х) dx, л -> оо 0 0 1 О где и(х), v (х)—любые непрерывные функции на интер- вале (0, 1). Отсюда, более строго, (12.3) должно быть заменено на уравнение I 1 1 $ ^и (х) {q (х) p(x,)—p(x')q(x)}v(xf)dxdx'=i u(x)v(x)dx, оо о содержащее две произвольные функции и(х), v(x); кроме того, следует заметить, что р, q в скобках сначала нужно
§12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 313 заменить на приближения р{н\ q{fl} — например, на п-ю частную сумму их разложения по ортогональным функ- циям, и переход к пределу п —* оо должен иметь место после, а не до интегрирования. Эта интерпретация дает корректный математический метод исследования соотно- шения (12.3). Следует подчеркнуть, что (12.3) относится к двум точкам пространства х, х' в один и тот же момент времени /, т. е. к сечению мира, в котором t = const; q и р следует более строго записывать как q(x, /), p(xf, t) соответственно. Применив эту общую схему к действию W = M + M'^Xf, (5.18) из которого получаются полевые уравнения для электрона и электромагнитного поля, мы сталкиваемся с той труд- ностью, что лагранжева функция не содержит производ- ную по времени от скалярного потенциала fQ, поскольку при этом обобщенный импульс, связанный с /0, тождест- венно равен нулю и перестановочное соотношение (12.3) не удовлетворяется. Мы устраняем эту трудность, исполь- зуя временно принцип калибровочной инвариантности, и удаляем член /0 из выражения для лагранжевой функции, полагая его равным 0; этот способ уже применялся в гл. II, § 13. Тогда состояние электрона описывается системой независимых функций вида Ч’=('Ф1. Ч’а» Ч’з. f=(A, /2. /з), где вместо ф4, ф^ мы записываем ф3, ф4. Импульсами, свя- занными с этими величинами, как можно найти, являются тогда: гфр для фр и —Ер для fp. Перестановочные соот- ношения, которые должны применяться при квантовании полевых уравнений, соответственно имеют вид % (р) 'Ь (Р') \ Я’О (Р') % (Р) = = 6ро.б(Р- Р') [(>, о = 1, 2, 3, 4], (12.4') /ДР) Eq(P')—Eq(P')fp(P) — = X8pq-8(P-P') [р, 7=1, 2,3], (12.4") где Р и Р'— любые две точки одного и того же прост- ранственного сечения t = const. Мы учли тот факт, что величины ф, описывающие вещество, удовлетворяют не перестановочным соотношениям Гейзенберга, а перестало-
314 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП вочным соотношениям, полученным при замене знака минус в соотношениях Гейзенберга на знак плюс. Эти правила должны быть дополнены также следующими утверждениями; фр удовлетворяют, кроме того, уравнениям % (Р) Фа (^') + Фа (Рг) % (Р) = 0, (12.5) и то же самое имеет место для -фр; функции fp в любых двух точках Р, Р' являются коммутативными, и то же справедливо для Ер\ и наконец, материальные величины ф, ф, с одной стороны, и электромагнитные величины fp, Ер— с другой, кинематически независимы, и каждая вели- чина первого типа в точке Р коммутирует с каждой вели- чиной второго типа в любой точке Р' (в том же самом сечении мира t = const). Как и в гл. II, § 13, мы снова предполагаем, что си- стема в целом помещена в изолированную и полностью отражающую полость, находящуюся в состоянии покоя. Для того чтобы описать электромагнитные потенциалы, мы используем полную ортогональную систему решений уравнений Af + v2f=0 (12.6) в области, удовлетворяющей условиям div f = 0, f нормально на поверхности границы. Построение такой системы осу- ществляется непосредственно при помощи гауссовой тео- ремы о дивергенции (rot f • rot g + div f • div g -j- f • Ag) dV = = S (If. rotg]„ + f„divg)do (n обозначает нормальную компоненту) для вектора [f, rot g] + f- div g, где f и g—два произвольных векторных поля [22]. Сна- чала мы определяем функции ф = <Рл> удовлетворяющие уравнению Дер + ^2ф = 0 и равные нулю на санках, и на их основе строим век- торные поля fa, = grad ера;
(12.7; § 12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 315 эти векторы автоматически удовлетворяют приведенным выше условиям, являются, естественно, взаимно ортого- нальными и могут быть отнормированы в соответствии с уравнением J (fr h') dV = 6U, [ dv]. Мы определяем также в области полную ортонормиро- ванную систему fv решений (12.6), которые нормальны к стенкам и удовлетворяют условию div fv — 0 не только на стенках, но и всюду. Векторы fx ортогональны к fv и образуют вместе с ними полную ортогональную систему векторных полей в полости. В сечении t = const, следо- вательно, выполняются равенства t=2<7vfv+2/Mx. v X ® — 2 Pvfv 2 ?xfx* v X . Величины fx, fv—это векторные функции положения в про- странстве, имеющие в качестве значений обычные числа, тогда как р, q являются скалярными квантовомеханиче- скими матрицами, которые не зависят от положения, и удовлетворяют перестановочным соотношениям ?vpv—PvQv = *, QkPk—РкЯх^ i; все q коммутируют между собой и все р—между собой, и любая р коммутирует с любой q, если их индексы не совпадают. (Эти правила, вероятно, наиболее явно полу- чаются при решении (12.7) для «фурье-компонент» р, q посредством интегрирования скалярных произведений f, 6 с fx, fv и применения перестановочных соотношений (12.4).) Энергия электромагнитного поля превращается в сумму X 4 (“/’v + т ?*) + т v 4 ' X Мы уже знаем решение коммутационных уравнений, которое приводит это выражение для энергии к диаго- нальному виду. Отдельные компоненты вектора, на кото- рый действуют р, д, различаются посредством квантовых
316 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП чисел Л\., соответствующих v, и значений непрерывных переменных qx, соответствующих X. При подстановке qv = —]fa-Qv Qv-onepaTop воздействует только на индекс Nv в соответствии с уравнениями QV(NV, Л\,---1) = / , QV(NV, | 1)= У ^±1; все остальные компоненты, соответствующие переходам Nv —+ N'v, в которых Ny не равно Nv ± 1, обращаются в нуль. Величина Nv принимает целые значения 0,1,2, ... и может рассматриваться как число фотонов типа v. Им- пульс связанный с непрерывной переменной qx, пред- ставляется, согласно Шредингеру, оператором (l/i)-(d/d<7X). Электромагнитная энергия тогда находится в диагональ- ной форме и, если пренебречь (бесконечной!) энергией нулевой точки, умножает компоненту вектора (Л\,; q-fj на + (12.8) v Л Теперь мы видим, каким образом электростатическая часть, описываемая непрерывной переменной qx, отделяется от части, которая соответствует излучению и описывается дискретной величиной Nv, дающей число фотонов типа v. Величина ф появляется в части энергии, соответствую- щей веществу, только в комбинациях вида фрф0. Поэтому при рассмотрении электронов предпочтителен метод ком- позиции с последующим антисимметричным приведением; мы показали выше, что эта процедура эквивалентна кван- тованию в соответствии с правилами (12.4). Так как электро- магнитные величины коммутируют с фр, фр, то они могут здесь рассматриваться как обычные числа. Квантованное волновое уравнение относится тогда к «вектору» J с ком- понентами гр1 ••• рп (^i • • • Nv', q^), где Plt ..., Рп—положения п электронов, а рп ..., р„— их спиновые переменные, каждая из которых пробегает четыре значения: 1, 2, 3, 4. Мы записываем zP1...Pn в виде столбца, состоящего из 4" членов; вектор z антисиммет- ричен по отношению к перестановке, действующей на Рг и рг одинаковым образом. Величина <2(г) = (S'/1, S(2r), S<ar>) является спин-вектором (Slt S2, Ss), действующим только на г-й индекс рг; Т<г} подобным же образом является one-
§12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 317 рацией над r-м индексом рг, которая переставляет 4^ -ф2 с г])3, x|)4, a grad(r) —градиент по Рг. Частью эрмитова опе- ратора энергии —JQ в уравнении T~dx^—(х0 = с/, Н = зависящей только от вещества, является величина п Е (&г', 4-grad*'> ^/aXQvfv^r) !- r= 1 ' v п +pXgrad<p?.(/)r)-^-)+moLr<r). <12-9) % 4^' r = l и к ней надо добавить-электромагнитную часть (12.8). Поскольку мы всюду принимали, что скалярный потен- циал /о = О, т0 мы потеряли уравнение div@ + p = 0, (12.10) возникающее при вариации fQ. Это уравнение не содер- жит никаких производных по времени, и, следовательно, представляет собой ограничение на состояние поля в мо- мент / = const; мы, естественно, должны принимать его во внимание. Подставив значение @ из (12.7), мы получаем 2 як дфя+р=о, а при умножении на <рл и интегрировании по рассматри- ваемому пространству находим Як— $рФл<ЯИ = О. С точки зрения квантовой механики, левая часть этого уравнения является оператором Dk, и смысл уравнения DK = 0 состоит в том, что допускаются только такие век- торы §, которые удовлетворяют уравнению Z)zj = O. Опе- ратор DK также состоит из электрической части qK и ма- териальной части $ РФх dv = J ' ф2ф2 I- ф8ф3 4 ф4ф4) фл dV. Соответственно, к вектору 3 должен применяться опера- тор D}, вида п DK=qK— 2 Фл(Рг). г= 1
318 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Из уравнений = 0 следует тогда, что все компоненты z(Pr; Nv\ q^) вектора g, кроме тех, для которых qK = п = 2фНЛ-)> равны нулю; мы можем поэтому записать г= 1 ненулевые компоненты в виде п ^(Рт\ (Vv) = z Pr\ JVv; 2 Фх(^г) • Г= 1 Но тогда величина grad(r> ф = grad1'’1 z + 2 grad фл (Pr) • в точности соответствует комбинации, полученной в (12.9). Величина 2^1 теперь определяется выражением л п п 2 2фл(^)Фх(^) = 2 Г, 5 = 1 Л Г, 5=1 где G(P, р') = 2фх(/’)фН^') а. является обычной функцией Грина для полости. Следова- тельно, мы получаем квантовое уравнение для ф: в котором оператор —Jo имеет вид п г -/, = £ grad^) +Е G(Pr, ^) + r= 1 ' r,s=l п + 2>Л\, + /а££ fv (/>))•&}. (12.11) V V г = 1 В теории Дирака сумма 4-(®, grad) + m0T является оператором энергии для свободной частицы. Ве- личина aG(P, Р')—это классический потенциал, соответ- ствующий электростатическому отталкиванию двух элект- ронов, расположенных в Р и Р'. Следующий член пред- ставляет собой сумму энергий (v) фотонов в различных
§ 12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 319 частотных состояниях v, и, наконец, последний член опре- деляет взаимодействие между фотонами и электронами при испускании и поглощении. Таким образом, выяснен смысл каждого из членов, из которых построен оператор энергии (12.11). Квантовая теория первоначально оперировала с полем, связывающим электрон с ядром в водороде, и полем испущенного излучения совершенно разными спо- собами; первое определялось классически и чисто электро- статически как действие на расстоянии, описываемое ку- лоновским потенциалом, тогда как второе расщеплялось на дискретные фотоны с помощью условия частот Бора. Теперь мы получили теоретическое подтверждение этой процедуры, которая приводит к хорошему согласию с экс- периментом. Наше описание имеет е классической электродинамикой тот общий недостаток, что оно содержит член G(Pr, Рг), представляющий бесконечно большую реакцию r-го элект- рона на самого себя, поскольку, если мы устремляем Р' к Р, то величина G (Р, Р') стремится к бесконечности с той же скоростью, что и обратная величина от расстоя- ния РР'. Для того чтобы удалить из Jo бесконечно боль- шую аддитивную константу, нам следует заменить G (Р, Р') на конечную величину Г(Р, Р'), где Г(Р, P') — G(P, Р')-----1=-. V V ’ 4л.РР' Величина Г(Р, Р) характеризует воздействие поля на элек- трон в точке Р, получаемое при отражении поля в Р от стенок полости. Выражение (12.11) показывает ясно, как различные члены Jo зависят от значения постоянной тон- кой структуры а; разлагая решение в ряд по степеням а, мы снова и снова сталкиваемся с бесконечно большими членами того же типа, что и G(Pr, Рг). Особенности опе- ратора Jo не позволяют на данном этапе довести теорию до конца. Мы можем заключить вместе с П. Йорданом, что задача существования электрона решается, но решение задачи о его строении все еще ускользает от нас. Далее, наши уравнения страдают от того основного недостатка теории Дирака, что отдельные спиновые переменные при- нимают четыре, а не два различных значения [23]. В сущности, ничто не мешает нам проквантовать ма- териальные волны способом, аналогичным тому, который применялся при квантовании электромагнитных волн. Для
320 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП этого мы должны разложить наши величины, описываю- щие материальное поле, в ряд по собственным функциям 'ф==ф(^) (с четырьмя компонентами) уравнения Дирака grad) -'г тот| х|?-}- = 0, (12.12) которые образуют при выборе подходящих граничных условий полную ортогональную систему. Общая компо- нента z вектора 3, на который действует энергия —с<70, будет тогда зависеть от квантового числа Пц, соответст- вующего собственным значениям р и принимающего только значения 0 и 1, от чисел фотонов различных частот v и от непрерывных переменных Но тогда операторы £^, которые коммутируют друг с другом и с Jo, не являются диагональными, и поэтому мы не можем избавиться от qK указанным выше способом. Вместо введения полости, как в приведенном выше рассмотрении, мы можем применить прямоугольный па- раллелепипед с «граничным условием»: все функции должны быть периодическими с периодами, равными длинам сто- рон параллелепипеда. Мы можем также ввести в качестве собственных функций для электромагнитного поля не стоя- чие, а бегущие волны; это приведет к лучшему согласию с физической картиной, в которой фотон соответствует однородной плоской волне. Если мы пренебрегаем взаимо- действием между веществом и светом, то энергия и им- пульсы также оказываются диагональными. Однако при этом возникает некоторое затруднение с уравнением (12.10), поскольку для того, чтобы стало возможным периодиче- ское решение, его правая часть 0 должна быть заменена на постоянное среднее значение заряда во всем простран- стве. При учете же протонов это автоматически коррек- тируется, так как полный заряд тогда будет равен 0. Динамический закон допускает только такие кванто- вые переходы частиц, в которых одно п(1 уменьшается с 1 до 0, а другое п^ в то же время увеличивается с 0 до 1. Следовательно, полное число частиц равняется и ц заряд остается фиксированным; отсюда та часть динами- ческих законов,в которой полное число равно заданному конечному п, отделяется от остальной части, и не возни- кает взаимных комбинаций между частями. Дирак пред- ложил интерпретировать присутствие или отсутствие про- тона в состоянии с положительной энергией р как отсут-
§ 12. КВАНТОВАНИЕ ПОЛЕВЫХ УРАВНЕНИЙ 321 ствие или присутствие электрона в соответствующем состоя- нии с отрицательной энергией —р; наши законы тогда относятся как к протонам, так и к электронам [24]. Вспо- миная, что числа — 0, 1 были сначала введены просто как произвольные индексы, указывающие на строки ма- трицы, мы не обнаруживаем ничего, что препятствовало бы нам заменить числа для отрицательных —р на Пц = 1—П-ц при сохранении для положительных р обо- значений Пц==Пц. Теорема сохранения заряда тогда при- мет вид S —S "й=const (Ц > 0). Однако при этом мы изменяем не только обозначения, но и содержание теории; мы занимаемся той частью динами- ческих уравнений, в которой только конечное число Пц с положительными р. отличается от 0 и только конечное число п» с отрицательными р отличается от 1! Квантовый переход электрона между положительным и отрицательным энергетическими уровнями, который был так нежелателен в теории Дирака, сформулированной в предыдущем пара- графе, ныне проявляется как процесс, в котором электрон и протон одновременно уничтожаются или рождаются. Предположение о существовании такого процесса давно принимается в астрофизике, поскольку, по-видимому, дру- гим способом крайне трудно было бы объяснить источник энергии, испускаемой звездами. Однако привлекательной эта идея может показаться только с первого взгляда, так как для того, чтобы полу- чить соответствие нашей теории наблюдаемым данным, в теории необходимо произвести некоторые глубокие из- менения. Действительно, согласно нашей теории масса протона должна быть той же, что и масса электрона; более того, эта гипотеза при всех обстоятельствах независимо от выбора действия (пока оно инвариантно относительно перестановки правого и левого) приводит к существенной эквивалентности положительного и отрицательного элект- ричества—даже без строгого учета взаимодействия между веществом и излучением. Теперь, 'имея квантованные полевые уравнения, мы должны вернуться к вопросу о том, как компоненты дей- ствия М, М', F ведут себя при заменах (6.12), (6.13), (6.14).' Первые две замены, которые мы можем назвать (а) и (б), дают в точности тот же эффект, что и раньше. Но третья замена (в), которая переводит компоненты ф в ком-
322 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП поненты ± ф, теперь действует на М и ЛГ разным образом, поскольку фиф больше не коммутативны по отношению к умножению,— в действительности они почти антикоммута- тивны. Из этого следует, что М\ F ведут себя при усло- вии (в) точно таким же образом, как и при (б), т. е. они умно- жаются на знаки —, —,4- соответственно. Отсюда мы получаем, что прошлое и будущее играют существенно различные роли в квантованных полевых уравнениях; нет никакой подстановки, которая оставила бы эти уравнения инвариантными при изменении направления времени. Мне кажется, что таким образом мы пришли к выводу, необык- новенно важному для физики. Мы можем получить замену (а = 0, 1, 2, 3),_ _ 1|)4, \|)2-Ч’з —^2. Фх, 1 комбинируя (а), (б), (в); эта подстановка не воздействует на координаты и не возмущает квантованные волновые уравнения. В отношении теории протона Дирака это означает, что положительное и отрицательное электриче- ство имеют, по существу, одинаковые свойства в том смысле, что законы, управляющие ими, инвариантны от- носительно определенной замены, которая переставляет квантовые числа электронов с квантовыми числами про- тонов. Различие этих двух типов электричества, по-види- мому, составляет секрет Природы, который лежит даже глубже, чем различие прошлого и будущего. § 13. Законы для энергии и импульса в квантовой физике. Релятивистская инвариантность При квантовании волновых уравнений пространствен- ные и временная компоненты исследовались настолько разными способами, что вывод о релятивистской инвари- антности полученных законов может показаться весьма сомнительным. Однако тщательное исследование, ^принад- лежащее Гейзенбергу и Паули, вселяет в нас уверенность в этом вопросе [25]. Мы переносим их аргументацию на наш принцип действия—но так, чтобы непосредственно можно было увидеть всеобщую справедливость доказа- тельства. В то же самое время нам представляется удобный случай "более'подробно, чем мы делали это до сих пор, обсудить смысл процесса квантования.
§ 13. законы для Энергии и импульса 323 1. Законы для энергии и импульса в квантовой физике. Мы начинаем изложение с десятью (4 + 3 + 3) опера- торами фр, fp, Ер, которые являются в трехмерном про- странстве функциями, удовлетворяющими перестановочным соотношениям (12.4) и дополнительным условиям, изла- гавшимся ранее. Существует одно, и с точностью до эквивалентности только одно, неприводимое решение для этих условий. Из него мы получаем плотность энергии определенную в (6.5), (6.6), и интегрируем ее по всему пространству: K = (13.1) Затем мы строим «коммутатор» 6Ф=[^О, ф]=1(^ф_ф^0) произвольного оператора Ф с ^0. Рассмотрим частные операторы Ф = фр, Ер\ должна существовать возмож- ность вычисления этих коммутаторов только при помощи (12.4) и дополнительных правил; если одна из данных величин появляется в производной по пространственной координате, она должна быть преобразована путем инте- грирования (13.1) по частям или путем вывода для нее правил коммутации из (12.4), через определенные подхо- дящим образом производные 6-функции. Если процесс д/дх0 включает только дифференцирование по пространственным переменным и в силу полевых уравнений Максгелла — Дирака совпадает с производной по времени, то мы мо- жем записать равенства or dfp dfv р op дЕр 'Р дхо дХр Р' Р dxQ (13.2) Здесь мы отбрасываем нормировку Из этих уравнений следует, что величина 6Ф для любого калибро- вочно инвариантного оператора Ф совпадает с его произ- водной по времени, которая определяется через простран- ственные производные этого оператора из полевых зако- нов. Поэтому мы можем заменить полевые уравнения Максвелла—Дирака квантово-механическим динамическим законом < dxQ гоб’ (13.3)
324 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП где величина g представляет вероятность состояния физи- ческой системы (чистого состояния!) в момент времени х0; 3 является вектором в нашехМ векторном пространстве. Используемые здесь фундаментальные понятия содержатся в общей программе квантовой механики, изложенной в гл. II, § 7. «Плотность электричества в точке Р», на- пример, представляется оператором р = ф1ф1+ + -^, ко- торый не зависит от времени. Изменения распределения вероятности для этой физической величины с течением времени вызываются изменениями в состоянии g, а не изменениями самого р; правила расчета этого вероятност- ного распределения иерез р и g даются в указанной выше общей программе. Эти правила применимы к любой кали- бровочно инвариантной величине Ф. Однако желательно рассматривать «плотность электричества» (не определяя времени и положения) как фиксированную физическую величину, представленную определенным оператором р, и приписывать изменения ее вероятностного распределения во времени и пространстве изменениям вероятности со- стояния з, которая рассматривается как функция про- странственных координат х19 х2, х3 и времени х0. Вместо (13.3) мы должны получить четыре уравнения (» = 0. 1.2, 3), а (13.4) в которых операторы, представляющие энергию и импульс, определяются по формуле ^а = \HdV. Только теперь мы можем считать сформулированную нами общую схему квантовой физики полным описанием, по- скольку кона теперь удовлетворяет требованиям теории относительности, т. е. сформулирована способом, симмет- ричным Fno отношению к пространственной и временной координатам. Для определения среднего значения плот- ности электричества р мы должны приписать пространст- венным координатам х19 х2, х3, от которых зависит опе- ратор р, любые определенные значения хр (например, 0). Пространственные компоненты уравнения (13.4) пока- зывают, что замена (хр) на соседнюю точку (xp + dxp) равносильна воздействию на нормальную систему коорди- нат в пространстве состояний, к которому относятся век-
§ 13. ЗАКОНЫ ДЛЯ ЭНЕРГИИ И ИМПУЛЬСА 325 торы j, бесконечно малого вращения i (^ dxj_ + ft dx2 + ft dx3). Нам не следует забывать, что уравнение (13.3) не эквивалентно полному набору полевых уравнений, так как мы опустили уравнение ст (Р) == div + р = О, не включающее дифференцирования по времени. Поэтому мы должны ограничиться векторами j, которые удовлет- воряют всем уравнениям ст(Р)8=0. (13.5) Эти уравнения определяют линейное подпространство исходного пространства состояний 9%. Операторы ст(Р), о(Р'), относящиеся к любым двум точкам Р, Р' прост- ранства, коммутируют: о(Р)о(Р')—ст(Р')ст(Р) = 0. Особое значение имеет тот факт, что о(Р) коммутирует с ft, т. е. что 6ст=1(^ост—ст^о) = О; справедливость этого соотношения вытекает .из того, что уравнение да/дхо — О является следствием остальных по- левых уравнений классической полевой теории, и, следо- вательно, независимо от наших полевых уравнений, мы можем заключить, что калибровочно инвариантный опера- тор ст удовлетворяет уравнению 6ст=0. Коммутативность ст (Р) с ft является гарантией того, что бесконечно малое вращение i^odx3 пространства состояний за интервал времени dxQ не выводит из пространства лежащий в нем вектор §. Продолжая нашу программу, мы полагаем ft = $ tldV и исследуем «коммутатор» 6®=[ft, Ф] оператора Ф с ft; мы будем обозначать этот коммутатор 6j всякий раз, когда может возникнуть путаница между
326 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП ним и коммутатором б«=б0 с ^0. Мы находим уравнения*): «A-о, Из этих уравнений следует, что для любой калибровочно инвариантной величины Ф мы имеем 6Ф = дФ/дхх с учетом уравнения о=0. Отсюда, зависимость калибровочно инва- риантных величин от пространственных координат дейст- вительно описывается предсказанным нами образом; опе- раторы, представляющие эти величины, постоянны, но век- тор j, представляющий вероятности состояний, изменяется в пространстве в соответствии с уравнениями (13.4) для а=1, 2, 3. Из этих рассмотрений также следует самосогласован- ность уравнений (13.4). Прежде всего во всем простран- стве St мы имеем 6^ = 0 или o(P)^i—'^1о(Р) = 0; это следует из (13.6). В классической полевой теории дифференциальная теорема сохранения dtj , / dtl dtj dtl Y _ Q d*o ” \ ‘ dx2 ‘ dx3 / является следствием полевых уравнений. Поскольку — калибровочный инвариант, из этой теоремы следует, что после квантования операторы должны удовлетворять в пространстве 9?а, определенном в (13.5), соотношению Oil , ^3iV0 дх2 дх3 J Интегрируя его по пространству х0 = const, мы получаем уравнения **): 6op?dV = O или ^оЛ-«о = О- (13.7) *) В отличие от (6.2), мы теперь пишем fo вместо rot f, а не. (l/a)-rotf. ** ) Уравнением, которое замещает (13.7) для всего пространства 9?, является следующее: ъъ-dv-
§ 13. ЗАКОНЫ ДЛЯ ЭНЕРГИИ И ИМПУЛЬСА 327 Более того, в пространстве выполняется равенство проинтегрировав которое по всему пространству, мы на- ходим 6,p8°dV=d или «з-«2 = О- Таким образом, мы видим, что операторы коммута- тивны в 9ia, и, следовательно, если начальное значение § (т. е. значение в начале системы координат пространства- времени) является заданным вектором в то уравне- ния (13.4) обладают одним и только одним решением j. II. Релятивистская инвариантность. При переходе от нормальной системы координат ха в пространстве-времени к другой ха посредством преобра- зования Лоренца з Л- ^-а ~ 2 ^ар-^р р=о решение уравнений (13Л'> как мы далее покажем, получается из решения (13.4) пу- тем унитарного преобразования U, индуцированного в пространстве состояний этим Л. Т. е. существует уни- тарное преобразование U такое, что уравнение удовлетворяется в силу уравнения (13.4): • 2 У a,dxa = dx^. и, а р или ^а=2о₽аЬ-^ (13.8) Мы могли бы также считать, что уравнения (13.4') имеют то же решение з, что и (13.4), а нормальная система ко- ординат в пространстве состояний претерпевает унитарное вращение И, так как вектор t/g имеет в новой системе координат те же самые компоненты, что и 4 в старой.
328 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Мы можем получить преобразование U в явном виде только для инфинитезимального Л: IIM=i+P<wll; ^=1+4-6^. Уравнения (13.8), подлежащие проверке, превращаются тогда в равенства Бесконечно малым вращениям .в физическом пространстве, как мы хорошо знаем, соответствуют операторы в про- странстве состояний, представляющие момент импульса; так, оператор 6Л4, соответствующий бесконечно малому вращению Dx: бхо=О, = 0, 6х2 = —х3, 6х3=*х2 (13.9) относительно Xi-оси, является ^-компонентой момента импульса: (M1==)M23 = J(x2/3°-x3^)dK (13.10) Инфинитезимальные преобразования Лоренца, характери- зующие в действительности перераспределения мира на новые пространство и время, изучаются точно таким же образом; достаточно рассмотреть такое типичное преобра- зование, как 6x0 = %!, 6^ = ^, 6х2 = 0, 6х3 = 0. Вариация 8М, связанная с этим преобразованием, опреде- ляется формулой Л41о = ^x^dV+^x^dV; второй член, исчезающий при л'о = О, может быть опущен, так как мы уже показали, что коммутирует со всеми ^а. Этот член не вписывается в рамки данной схемы, в ко- торой все операторы являются функциями только от xlf х2, х3. Таким образом, наша задача сводится к доказа- тельству следующих равенств в [«,«. M-о. о. -7„ 1 ЗУ = -У„-Л. о. о | (1311> для а = 0, 1, 2,3. (13.12)
§ 13. ЗАКОНЫ ДЛЯ ЭНЕРГИИ И ИМПУЛЬСА 329 Кроме того, если показать, что уравнения [M2S, а] = 0, [М1о, а] = 0 (13.13) выполняются во всем пространстве то этим самым бу- дет доказана инвариантность уравнений (13.5), определяю- щих подпространство Для доказательства (13.11) мы используем тождества 1 дЦт^) у . j 3 J дха L ’ ’ J Если ввести символ Кронекера 8tk, то подынтегральное выражение можно записать в виде (6<Х2^ — базФ + ^2^ Хздхг) ' Вследствие того, что о=0, a t = являются кали- бровочно инвариантными, операции могут быть заменены на Sa/ = [^a, /], откуда («з-МУ + Sa J (x2t*-xstydV = G или SaAf23=[fa, A423] = W2-Ws [«=1, 2, 3]. В классической полевой теории из полевых уравнений выводится закон сохранения у д(х2/?-х3#)_0 дха ’ a =0 который при квантовании приводит к следующему тож- деству в пространстве з 60(x2^-xs^) + £ Э(Х217Х3^)==0- Интегрируя по всему пространству, мы получаем Ш3 = [К М23] = 0; таким образом, равенства (13.11) полностью доказаны, т. е. [М28, ^a] = 6a3^3-6a8^2 [a=0, 1, 2, 3].
330 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП Аналогично соотношения (13.12) получаются из тож- дества (для а= 1,2,3) и уравнения НбоМ) I t»}dV=O, которое соответствует теореме сохранения С д (х1?о-}-Хо/1) _ q J дхл ~ классической полевой теории. Если мы связываем с бесконечно малым вращением пространственной системы координат соответствующее линейное преобразование компонент % и векторных ком- понент fp, Ер и в то же самое время воздействуем на нормальную систему координат в пространстве состояний соответствующим унитарным преобразованием, то мы вправе ожидать, что операторные функции, выраженные через величины фр, fp, Ер и зависящие от пространст- венных координат, остаются инвариантными. Говоря дру- гими словами, мы надеемся, что процесс 6Ф = [МИ, Ф] дает уравнения —^-з;ф, 6^=67^+(W»-W.)« ЬЕр = 8'Ер + (8р2Е3 — 8р2Е2), где введено обозначение я'гТк ЭФ ЭФ О Ф = Х2 -------X. -5— . 2 дх3 3 дх2 Однако при прямом вычислении мы получаем, что бФ = б'ф + i (х2/3—x3f2) ф—~ ф, б/i = х2Н2 -|- х^Н^ 6/^-хЛп б/3 = -х,Я1, 6£р «= 6 Ер + бра (Е3 + х8о)—6^5 (Еа + atjCf)•
§ 14. КВАНТОВАЯ КИНЕМАТИКА КАК АБЕЛЕВА ГРУППА 331 Сначала мы находим, что эти уравнения дают равенство 6os=[M28, о] = 0 независимо от условия о = 0. Введя условие а=0, мы из этих уравнений получаем, что калибровочно инвари- антные величины Ф ведут себя предсказанным ранее об- разом. Второе из уравнений (13.13) может быть получено аналогичным путем. Г. КВАНТОВАЯ КИНЕМАТИКА § 14. Квантовая кинематика как абелева группа вращений Если мы рассматриваем операторы ip, iq как беско- нечно малые унитарные вращения лучевых полей в про- странстве состояний, то из перестановочных соотношений Гейзенберга (гл. II, (11.4)) следует, что эти вращения коммутативны; следовательно, они порождают 2/-параме- трическую абелеву группу, где /—число степеней свободы. Давайте поэтому исследуем свойства абелевых групп уни- тарных вращений в лучевом поле n-мерного пространства! При введении калибровки, как в гл. III, § 16, каждому такому «вращению» соответствует преобразование вектор- ного пространства с матрицей А, и для любых двух ма- триц А, В выполняется равенство вида АВ = еВА. (14.1) Это равенство возможно только, если 8 является n-м кор- нем единицы, так как при расчете определителя обеих частей мы получаем 8"=1. Из (14.1) мы при помощи математической индукции находим АВг = е1В1А, ( <14-2) где k, /«al, 2, 3, ... Комбинируя эти два уравнения, т. е. применяя второе к Л* и В вместо А и В, мы нахо- дим общее правило = (14.3) ПринявЖв (14.2) k = n, мы приходим к уравнению АпВя»ВАп', если абелева группа вращений неприводима, то фундаментальная лемма Шура позволяет нам ааклю-
332 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП чить, что, поскольку Ап коммутирует со всеми элемен- тами В группы, то она должна быть кратна единичной матрице: Ап~ \. Следовательно, порядок любого элемента неприводимой абелевой группы вращений в пространстве п измерений является делителем п. Непрерывная /-параметрическая группа вращений по- рождается /-мерным линейным семейством g инфинитези- мальных унитарных отображений П1^14“ОГ2^2+ • • • (1^-4) с базисом, образованным любыми / независимыми элемен- тами Сп С2, ..., Cf семейства. Числовые параметры о2, ..., оу могут принимать все вещественные значения. Полагая = и повторяя инфинитезимальное преоб- разование (14.4) много раз, мы находим, что в момент «времени» т результирующее преобразование имеет вид С/(стх, ст2, 0/)=еа,с,+0гСг+---+о/с/, (14.5) где мы заменили а;т на ст{. Здесь U пробегает всю группу, которая теперь выражается на языке параметров ст. Если группа унитарных преобразований векторного пространства является абелевой, то элементы Cv должны удовлетворять условиям СЦСУ-С^СЦ = О. (14.6) Из этого условия следует, что все элементы группы (14.5) являются взаимно коммутативными, поскольку при АВ— — ВА = § мы, как и для обычных чисел, имеем равенства еА*ев — еА+в. Параметры ст в (14.5) складываются в композиции: {/(CTj, ..., <jf)U(ст;, ..., ст,)=:/(ст1+ст;, ....оу+ст;). Если, однако, коммутативны только вращения проектив- ного пространства, то вместо (14.6) мы получаем условие вида СрСу CVC^ = ЮцдЛ, где образуют антисимметричную систему вещественных чисел. Коммутатор инфинитезимальных преобразований с матрицами А = о1С1 4~ • • • ' i = 4^1 + • • • +
§14. КВАНТОВАЯ КИНЕМАТИКА КАК АБЕЛЕВА ГРУППА 333 равняется АВ—BA — i Ц, V Мы будем называть антисимметричную форму Ц, V коммутаторной формой; она инвариантна относительно изменения базиса. Заменив А, В в (14.3) на 1+Х/т, 1+В/т и допустив, что /?==/ = /п—> оо, мы находим, что коммутатор любых двух элементов U (07, а2, ..., оу) = U (о) и U (т) из группы равен (У(о)/7(т)/7-1(о')[/-1(т)=е[Л(о, т)]-1. (14.7) Если группа вращений неприводима, то фиксированное преобразование U (о) может коммутировать со всеми U (т) только в случае, если оно кратно единичной матрице, т. е. если все его параметры о равны нулю. Из этого сле- дует, что коммутаторная форма является невырожденной, т. е. что для фиксированного набора переменных 07 она не может обращаться в нуль тождественно по 17, кроме случая, когда все 07 = 0, что также соответствует условию 167/41’#= 0. ^Такая форма существует только, когда число переменных f четно, и потому ее можно при подходящем выборе базиса (т. е. при когредиентном преобразовании переменных 07 и 17 под воздействием соответствующего преобразования) привести к каноническому виду, в котором матрица ||с^|| разлагается на двустрочные подматрицы вида Ш1' расположенные вдоль главной диагонали (см. дополнение 3). Тогда желательно вместо f писать 2/ и обозначать получен- ный таким образом «канонический базис» через iPv, iQv (v = 1, 2, ...» f), а соответствующие параметры через ov, tv. Множитель i был введен для того, чтобы выразить результаты через эрмитовы операторы Pv, Qv. Базисные элементы удовлет- воряют правилам коммутации !(PyQv Qv^*v)= 1 1(^nQv—
334 гл. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП ДЛЯ |1=#V И Q^Qv QvQh — О для всех |л, V. Элементы t/ (о) = е (о1Р1 + о2Р2 + ... + 0fPf) [е (х) = eix] составляют тогда /-параметрическую абелеву группу уни- тарных (векторных) отображений, что справедливо также и для V (т) = е (TjQj 4- t2Q2 + ... + T/Q/)- Коммутатор же элементов U (а), V(т), принадлежащих соответственно этим двум системам, равен U (о) V (т) (7-1 (а) V-1 (т) = е . + o/rz)• 1. Мы довели исследование до момента, когда полезно вернуться к вопросам, рассматривавшимся в гл. II, § 11. В классической механике в случае системы с одной сте- пенью свободы любая физическая величина, связанная с системой, выражается математически как функция f (р, q) канонических переменных р, q. Делая переход к кванто- вой механике, мы первоначально ограничивались полино- мами от р, q. Однако представление Фурье функции f f(p, q) = ^e(cp + rq)l(a, x)dodx (14.8) — 00 применимо к гораздо большему классу функций; этот интеграл не следует интерпретировать буквально; сущест- венно лишь то, что он представляет собой линейную ком- бинацию простых функций е(ор + т<7)- Если мы рассматри- ваем ip, iq как инфинитезимальные унитарные отображения в пространстве лучей, удовлетворяющие соотношениям коммутации i(pq—qp) = \, (14.9) то функция e{ap-\-xq) пробегает порожденную ими группу. Если мы теперь рассматриваем величины е(а, т) как ком- поненты элемента в возникающей (групповой алгебре, то в представлении, получаемом связыванием (а, т) с унитар- ным преобразованием e(csp + xq), групповая матрица этого элемента имеет вид (14.8). Эта групповая матрица является эрмитовой, если элемент принимает вещественное значение,
§ 14. КВАНТОВАЯ КИНЕМАТИКА КАК АБЕЛЕВА ГРУППА 335 т. е. если ^(а, т)=4(— а, —т). Следовательно, величина f переходит из классической механики в квантовую в соответствии с правилом: заме- няем р и q в разложении Фурье (14.8) функции f на эрми- товы операторы, представляющие их в квантовой механике. В частности, производные f представляются тогда в виде + 00 fp = i $ $ е(стр4-т^)-ст^(о, х) do dx, — 00 + 00 f9=I’Пе(стр + Т9)-Т?(ст, x)dodx. — 00 Положив U (т) в (14.7) снова инфинитезимальным, мы с помощью перестановочных соотношений (14.9) находим p-e(op + xq)—e(op + xq)>p = x-e(op + xq), q-е (ар-\-xq) — e(ap + xq)-q = — а-е (ар -ф xq). Следовательно, в общем случае мы имеем что и требуется для того, чтобы гамильтоновы уравнения _____________________и dp______ т, dt ~ Р' dt ~ ч были эквивалентны квантово-теоретическим уравнениям движения для векторов пространства состояний. Таким образом, мы получили очень простое описание квантовой кинематики с помощью перестановочных соот- ношений. Кинематическая структура физической системы выражается неприводимой абелевой группой унитарных проективных преобразований в пространстве состояний. Вещественные элементы алгебры [этой группы являются физическими величинами системы; представление абст- рактной группы вращениями пространства состояний связывает с каждой такой величиной определенную эрми- тову форму, которая ее «представляет». Если группа является непрерывной, то эта процедура автоматически приводит к формулировке Гейзенберга-, мы видели, в част- ности, как из требования неприводимости возникали пары канонических переменных, следовательно, число параметров
336 ГЛ. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП в такой неприводимой абелевой группе должно быть чет- ным [26]. Если одна из канонических координат, скажем, q, является циклической с периодом 2л, то все величины физической системы представляются периодическими функ- циями с периодом 2л. Следовательно, параметр т, связан- ный с q выражением (14.8), принимает только значения, кратные 2л, и интеграл заменяется на сумму. В таком случае мы имеем дело не с непрерывной, а со смешанной (непрерывно-дискретной) группой. Наш общий принцип допускает возможность того, что абелева группа вращений является полностью дискретной, или даже конечной группой. Так, в гл. III, § 16 мы рас- сматривали группу порядка 4 и ее неприводимое проек- тивное представление 53 двух измерений. Такая группа действительно имеет место в Природе,— она характеризует кинематику электронного спина, обсуждавшуюся в § 4. Можно непосредственно показать, что 53 является непри- водимым представлением этой группы и что она является в действительности единственной неприводимой двумерной группой унитарных вращений в пространстве лучей. Эти результаты подчеркивают значение этого простейшего слу- чая. Задача квантования для случая нескольких электро- нов, рассмотренная нами в § 11, также подчиняется нашей общей схеме. При ее решении нас интересует та абелева группа, все базисные элементы которой ра (а =1,2, ... ..., 2/) имеют порядок 2; такая группа состоит из сово- купности 4/ различных элементов Pi'Pz’ p"ff (па=1 или 0). Калибровка может быть выбрана так, чтобы соответствую- щие унитарные матрицы ра в неприводимом проективном представлении с 2? измерениями удовлетворяли уравнениям Ра=1. Р₽Ах = —АхР₽ (а=#Р)- (14.10) Кинематика вращающегося электрона описывается простей- шим случаем (/=1) этого представления. Эти результаты убеждают меня в том, что мы пра- вильно сформулировали общую схему квантовой кинема- тики. Но область дискретных групп предлагает много возможностей, которых мы не видим в Природе; возможно, эти дыры будут заполнены ядерной физикой. Однако кажется более вероятным, что схема квантовой кинематики
§ 15. ВЫВОД ВОЛНОВОГО УРАВНЕНИЯ 337 разделит участь общей схемы квантовой механики: она будет включена в конкретные физические законы един- ственной существующей физической структуры реального мира. § 15. Вывод волнового уравнения из перестановочных соотношений Здесь мы показываем путем прямого построения, что существует только одно неприводимое проективное пред- ставление (исключая тождественное представление) двух- параметрической непрерывной абелевой группы: а именно, то представление, которое приводит к волновому урав- нению. Мы получаем нашу непрерывную двухпараметрическую группу как предельный случай конечной группы с двумя базисными элементами; наше доказательство является стро- гим только в допущении справедливости этого предельного процесса. Пусть Л, В являются двумя коммутативными вращениями п-мерного унитарного пространства. Введя калибровку, мы получаем уравнение для их матриц АВ^гВА. (14.1) где, как мы уже знаем, 8—это n-й корень из единицы. Система, состоящая из двух матриц А и В, должна быть неприводимой. Пусть их коммутатор, число 8, представляет собой примитивный т-й корень из единицы, т. е. —это низшая степень 8, равная 1; тогда т является для и дели- телем. Порядки вращений А и В также являются делите- лями для и: Ап~\, Впс±\, поэтому калибровку можно выбрать так, чтобы Л"=1, В'2=1. Пусть В приводится к диагональному виду при соответствующем выборе нашей нормальной системы координат; элементы на главной диагонали тогда представляют собой корни n-й степени из единицы. Уравнение (14.1) накладывает на элементы Л = Ца/л|| следующие условия: ^-alk = &atk. (15.1) Мы разбиваем индексы i и соответствующие перемен- ные Х( на классы в согласии с правилом, что i и k' при- надлежат одному и тому же классу, если частное b{/bk является m-м корнем из единицы, т. е. степенью 8. То, что этот процесс действительно приводит к делению на классы,
338 гл.. IV. ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП доказывается следующим образом: если bt/bk и bktbt являются степенями е, то bilbl также является степенью е. Из (15.1) следует, что а1к — 0, если i и k принадлежат к различным классам; тогда матрица А приводится в соответствии с делением индексов на классы. Но в силу того предположения, что сис- тема {Л, В] является непри- водимой, может существовать только один такой класс. Установив этот результат, мы теперь переходим к более тонкому делению на классы: i и k будут теперь рассмат- риваться как принадлежащие одному и тому же классу, если Ь{ = Ьк. Мы произволь- ным образом выбираем за пер- вый из этих классов тот, Рис. 3 для которого bt = b, второй состоит из тех&/, для которых Ь{=ъЬ, третий —из Ь^&Ь, ... ..., т-и—из bl = s”‘~1b; это исчерпывает множество, по- скольку (т+1)-й класс Ь[ = е,тЬ ^совпадает с первым. Пусть переменные располагаются и нумеруются в таком порядке. Тогда из уравнения (15.1) следует, что все под- матрицы (t, k) матрицы А являются пустыми, т. е. а1к = О, если индекс строки I и индекс столбца k не принадлежат к соседним классам. Матрица А имеет тогда вид, показан- ный на рис. 3, где все элементы в незаштрихованных частях равны нулю (мы взяли /п=4). Заштрихованные части занимаются подматрицами Л(1), Ли), ..., Л(я”. Так как матрица А унитарна, сумма квадратов абсолютных значений элементов строки и столбца равна 1; следова- тельно, то же самое должно выполняться для строк и столбцов каждой подматрицы. Сумма абсолютных значений квадратов всех элементов в Л(1) должна равняться, с одной стороны, числу строк, а с другой стороны—числу столб- цов; следовательно, матрица Aw квадратна, и число индексов во втором классе равно числу индексов в первом классе, скажем, d. С помощью тех же аргументов мы находим, что число объектов в каждом из т классов равно d, •i отсюда n=smd. Соответственно должен быть исправлен и рисунок; каждая из заштрихованных матриц теперь является унитарной. Подействовав на переменные первого класса унитарным преобразованием с матрицей Л(1)*, мы
§ 15. ВЫВОД ВОЛНОВОГО УРАВНЕНИЯ 339 находим, что подматрица Л(1) приводится к d-мерной единичной матрице. Этот нормальный вид не нарушается при унитарном преобразовании, воздействующем аналогич- ным образом на переменные первого и второго множества; следовательно, мы сводим вторую подматрицу к кратной d-мерной единичной матрице и так далее до (т—1)-й. Полученная таким образом нормальная форма не изменяется под воздействием на переменные каждого класса одного и того же d-мерного унитарного преобразования; следова- тельно, мы можем выбрать в качестве такого преобразо- вания то, которое приводит А{т) к диагональному виду. При этом матрица А разлагается на d-подматрицы, что можно увидеть, перенумеровав переменные следующим образом: сначала берутся первые члены в каждом мно- жестве, затем вторые и т. д. Предположение о неприво- димости говорит нам тогда, что в каждом множестве может быть только по одному члену: ds= 1, п~т. Наши матрицы имеют теперь нормальный вид: еп+г-1 причем все элементы, не выписанные явно, равны нулю Показатели в матрице В—это п последовательных целых чисел, а е является примитивным п-м корнем из единицы. И, наконец, уравнение Л''==1 дает а=1. Мы нумеруем переменные, начиная с г и принимая индексы, конгруэнт- ные mod п, за равные; тогда эти два отображения имеют вид A: хк — хк+1, В: х'к = ъ*хк. Повторив этот процесс многократно, мы находим As-. xk^xk+s, В*: x'k = sktxk. (15.2) Переход к непрерывной группе теперь выполняется в пределе п —> оо. Пусть базис iP, IQ непрерывной двухпа- раметрической группы вращений нормируется в соответ- ствии с (14.9). Мы отождествляем матрицу А из приведен- ных выше уравнений с величиной е(£Р), а В—с е (t]Q), где £ и т] — вещественные бесконечно малые константы. Тогда в пределе s£—>0, /т]—>т выполняются равенства е(аР)==Л’, e(xQ)»=Bf. Величина е теперь равняется в (|т|) и е*'₽е(|Лт). Здесь e(xQ) представляет с<Х5ой физи-
340 ГЛ. 1V- ПРИМЕНЕНИЕ ТЕОРИИ ГРУПП ческую величину е1"7; значения, которые она может при- нимать, задаются в виде elT$k, где т вещественно, a k пробегает все целые значения. Другими словами, вели- чина q может принимать значения ki,-, q может принимать все действительные значения от —оо до 4-со. (Конечно, k следует рассматривать как число mod п, a kt,—как число modn£, но nt кратно 2л/т) и, следовательно, в пределе может быть бесконечным.) Поэтому мы можем заменить kt, на q, где q следует понимать как переменную, которая пробегает все возможные значения физической величины q, и вместо xk записать V £-ф(?). Величина ty(q) представ- ляет собой произвольную функцию, значения которой являются комплексными числами и которая удовлетворяет условию нормировки Перейдя к пределу во втором' уравнении (15.2), мы находим, что величина е‘Х1> представляется линейным опе- ратором ф(<7) —-ф (<?). Подобным же образом мы находим из первого уравне- ния (15.2), что величина eiap определяется оператором Ф (<7)-*Ф (? + <*) • Возвратившись от конечных к инфинитезимальным унитар- ным преобразованиям, мы находим <Г- бФ(<7) = <7*Ф(<7). Р- бФ(<7) = т--^- (15.3) Таким образом, мы окончательно подтвердили предполо- жение, с которого начинали в главе II. Эти результаты можно легко распространить на системы с несколькими степенями свободы. Следовательно, кинема- тика системы, которая выражается с помощью абелевой группы вращений, ‘определяется единственным образом числом степеней свободы f этой системы. Постулат непри- водимости позволяет нам заключить, что специальные операторы (15.3) теории Шредингера являются следствиями перестановочных соотношений Гейзенберга [27] (20). П. Иордан и Е. Вигнер [28] дали очень элегантное теоретико-групповое доказательство того, что существует только одно неприводимое матричное решение уравнений (14.10), а именно, то решение порядка 2f, которое упоми- налось здесь и исследовалось более детально в конце §11.
ГЛАВА V СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК И АЛГЕБРА СИММЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ А. ОБЩАЯ ТЕОРИЯ § 1. Группа, индуцированная в тензорном пространстве, и алгебра симметрических преобразований Главная задача, которую мы собираемся решить в этой главе,— провести теоретико-групповую классификацию ли- нейчатых спектров атома, содержащего произвольное число (например, f) электронов, причем эта классификация должна учитывать приведение пространства 9У к {9?z}, как того требуют принцип запрета Паули и вращающий- ся электрон. Для решения поставленной задачи необхо- димо детально рассмотреть представления симметрической группы, т. е. группы всех fl перестановок f предметов. Такие представления самым тесным образом связаны с представлениями группы п всех унитарных преобразова- ний или с представлениями группы с всех однородных линейных преобразований пространства 9i„. Эту связь мы уже затрагивали в гл. III, § 5: в самом деле, субстрат представления группы с или группы и представляет собой линейное многообразие всех тензоров порядка f в Э1„, которые удовлетворяют определенным условиям симметрии, а свойства симметрии тензора выражаются линейными соотношениями между ним и тензорами, получающимися из него при fl перестановках. Тензор F порядка f в n-мерном векторном пространстве = определяется своими п/ компонентами или, как мы предпочитаем говорить, «коэффициентами» F (ip*.. л^у, каждый из индексов i изменяется от 1 до п. Тен- зоры можно 'складывать и умножать на произвольные числа; поэтому совокупность таких тензоров F образует
342 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК ^/-мерное линейное «векторное пространство» 94Л Далее, можно все / индексов тензора F подвергнуть произволь- ной перестановке s, которую можно воспринимать как перестановку f номеров 1,2, ...,/, приписанных к индек- сам в общем выражении компоненты тензора; если s—пе- рестановка 1->Г, 2->2', ..., /->/', то тензор sF, полученный применением s к индексам F, есть, по определению, такой тензор, компонентами кото- рого являются s/7OiA* • • */)= F(Ч' Ч'• • •Ч')" 0*1) Из этого определения следует, что для любых двух пере- становок s и t справедливо равенство t (sF) == (ts) F. Говорят, что линейное отображение F—^F,\ F' (i1.. .if)^^ia(i1.. .if; k±.. .kf) F (k^ . .kf) (1.2) (k) является симметричным, если любой коэффициент a . .ip kr.. .kf) не изменяется при воздействии на номера 1, 2, ..., f обеих групп индексов i и k одной и той же произволь- ной перестановки s. Применительно к тензорам процессы сложения, умножения на число и перестановки в том смысле, как это было определено выше, инвариантны от- носительно симметричных линейных преобразований; и наоборот, любое преобразование тензорного пространства, относительно которого эти процессы инвариантны, линейно и симметрично. Совокупность всех симметричных отобра- жений образует алгебру 2, а именно: если А и В—эле- менты 2, то Л + В, АВ и сА (с—произвольное число) также являются элементами 2. Задача, которой мы будем заниматься, состоит в приведении пространства тензоров к линейным подпространствам которые инвариант- ны относительно 2, т. е. относительно всех симметричных линейных преобразований. Где бы впоследствии мы ни пользовались терминами «инвариантный», «неприводимый» и т. д. в применении к тензорному пространству 94/, их все следует понимать относительно алгебры 2.
§ I. АЛГЕБРА СИММЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 343 Дадим краткий обзор нашей терминологии. Мы имеем дело с векторным пространством 3i и системой линейных отображений 2: пространства 31 в себя; мы часто допускаем использова- ние термина «линейная проекция» (21) вместо «линейное отображение (оператор)» для того, чтобы сделать яснее обстоятельство, что отображение не обязано быть взаимно однозначным. Линейное подпространство из 31 инвари- антно, если произвольная проекция А системы 2 перево- дит каждый, вектор £ из $ в вектор из подпростран- ство sp неприводимо, если оно не содержит других инва- риантных подпространств, кроме себя самого и простран- ства 0, состоящего только из нулевого вектора. Мы всегда будем понимать под полным приведением $ = $i + ^a ин" вариантного подпространства $Р полное приведение к двум линейно независимым инвариантным подпространствам даже когда это не утверждается явным образом. Линейная проекция инвариантного подпространства sp на инвариантное подпространство называется подо- бием (22), если два вектора £ и I) из sp, связанные отображе- нием А из нашей системы: = всегда проецируются на два вектора $' и tf из связанные тем же самым отображением A: = Подпространства $ и $Р' на- зываются подобными или эквивалентными-. spz~sp, если можно построить взаимно однозначное линейное отобра- жение подобия между $ и $Р'. В частности, эти поня- тия следует применять в случае, когда векторное прост- ранство является тензорным пространством 31/=(п/- измерений), а 2—совокупностью симметричных преобра- зований. В квантовой теории состояние системы, состоящей из f одинаковых объектов (электронов) с пространством со- стояний 31, описывается тензором порядка f в простран- стве 3?. Энергия такой системы зависит от каждого из f объектов в точности одинаковым образом; поэтому эрми- тов оператор, представляющий энергию, с необходимостью является симметричным в нашем смысле. Следовательно, фундаментальный динамический закон позволяет нам за- ключить, что инвариантное подпространство $ из 3?/ обладает тем свойством, что если тензор, описывающий состояние системы, в некоторый момент времени лежит в $, то никакое воздействие не сможет вывести его из sp.
344 гл. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Полное приведение 9?/ к инвариантным подпространствам $ означает соответствующее приведение оператора, пред- ставляющего энергию; следовательно, спектр термов рас- падается на классы термов, принадлежащих различным таким образом, что члены одного класса ни при каких условиях не могут комбинироваться с членами другого класса. Естественно, что это разделение на некомбини- рующиеся классы надо продолжать до тех пор, пока это возможно. Но эта задача в точности совпадает с задачей, предложенной выше,— единственным различием является то, что здесь мы имеем дело только с совокупностью 2(Л) симметричных эрмитовых операторов. Однако это ограни- чение совершенно несущественно, так как любой симмет- ричный оператор может быть записан в виде А = Лх + 1А2, где Л=4(Л + Л), Л2=±(Л-Л) оба являются эрмитовыми. При переходе к новой' системе координат в главном векторном пространстве Si с помощью несингулярного преобразования »= 2 ° ** О-3) k-\ коэффициенты тензора F преобразуются согласно формуле F' .г7) = 2й0’Л)а (^2)• • -a^ifkfyF^k^.. .kf). (1.4) (/?) Таким образом, преобразование (1.3) в векторном прост- ранстве индуцирует симметричное преобразование (1.4) в пространстве тензоров. Эти индуцированные преобразо- вания, которые мы будем называть «специальными сим- метричными преобразованиями», образуют группу 20, изо- морфную полной линейной группе с = сп; это представле- ние группы с ранее обозначалось (с)/. Группа 20 содер- жится в алгебре S. Поэтому подпространство $ из инвариантное относительно алгебры 2, является a.fortiori *) инвариантным относительно группы 20. То, что вдобавок справедливо обращение этого результата, не является само- очевидным. Тем не менее во всех случаях, где используется *) Тем более (лат.). (Примеч. пер.)
§ 1. АЛГЕБРА СИММЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 345 только линейность, группу 20 можно заменить на более широкую 2, поскольку 2 есть то, что мы могли бы на- звать обертывающей алгеброй для группы 20; под этим мы подразумеваем, что любые симметричные преобразова- ния можно выразить в виде линейной комбинации надле- жащим образом подобранных специальных симметричных преобразований [1]. Чтобы показать это, докажем теорему: Однородное линейное соотношение 2 c(i1. . .if\ kr.. .fe/)x(i1.. .if, kr. . .kf) =0 (1.5) (t; k) тождественно выполняется для всех симметричных преоб- разований . .if-, kr.. если оно справедливо для всех специальных симметричных преобразований, т. е. если уравнение 2 c(i’i- • - ip, kr. . .kd xiijiy').. ,x(ifkf) = Q (1.6) (i; k) выполняется для всех значений п2 переменных x(ik) таких, что определитель | х (ik) | =Н= 0. Доказательство. Обозначим пару индексов (ik) через / и перенумеруем п2 = т значений j числами 1,2, ...,т. Тогда левая часть (1.6) является однородным многочле- ном порядка f от т переменных x(ik) = Xj-: <р(х,х2 xm) = ^ib(fl, f2, fm)%Ы2• • • (f) где Л + А+ • • • +fm = f\b(К, f2, ..., f,„) есть /!/(А!/2!...fmV), умноженное на такой коэффициент с (ji/2. .. jf), индексы которого раз содержат /==1, /2 раз /=2 и т. д. Если обозначить через y(f19 f2, ..., fm) такую переменную x(/i/*2-• •//)’ в которой индексы /==1,2, ...,т встреча- ются Д, /2, . fm раз, то левая часть (1.5) принимает вид •••. Гт)У(Л> f» Jm)- (D Определитель из переменных x(ik) является некоторым многочленом D(xxx2.. .х^ по переменным Xj. Наше утверж- дение, таким образом, сводится к хорошо известной тео- реме алгебры: пусть ср(х) и £)(х)—два многочлена пере- менных хп х2, . . х^, второй из которых не равен нулю
346 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК алгебраически, т. е. его коэффициенты не все равны нулю. Если ф(х) равен нулю для всех значений переменных, для которых значение D (х) =# О, то ср (х) равен нулю ал- гебраически. Для одной переменной х эта теорема доказывается следующим образом. Если ф(х) алгебраически не равен нулю, он имеет определенную степень пусть q — степень О(х). Тогда имеется самое большее p + q значе- ний переменной х, при которых <р(х) или D(x) равны нулю; для любого из оставшейся бесконечности значений х ни ф(х), ни D(x) не могут обратиться в нуль, что про- тиворечит предположению. Эта теорема легко распрост- раняется на многочлены любого числа переменных при помощи математической индукции. Главным пунктом в ней является то, что аналитическое обращение в нуль много- члена для всех значений независимых переменных озна- чает, что он равен нулю алгебраически. В квантовой теории векторное пространство уни- тарно: переход от одной нормальной системы координат к другой выполняется с помощью некоторого унитарного преобразования (1-3). Введенные таким образом преобра- зования образуют подгруппу из So, которая’ изоморф- на унитарной группе ц„, т. е. является представлением (п/ унитарной группы. Я утверждаю, что подпространство $ из Э?/, которое инвариантно и неприводимо относитель- но S, остается неприводимым не только для группы 20, но также и для более узкой группы Чтобы это дока- зать, мы должны показать, что тождество (1.5) остается верным, даже когда мы допускаем, что (1.6) справедливо только для значений переменных x(t&) из произвольной унитарной матрицы. Одно из наиболее естественных доказательств сформу- лированной выше теоремы о формальном обращении в нуль формы ф порядка f основывается на процессе «по- ляризации»: мы придаем произвольные бесконечно малые приращения dxj значениям переменных х/, тогда тождест- венное обращение в нуль формы ф позволяет нам утверж- дать, что дифференциал V yr-dx» 4-L Ох,- 1 i обращается в нуль для произвольных значений х}- и dxj. Этот процесс приводит нас к нужному заключению и в рассматриваемом случае. Обозначив через Ф матрицу, по-
§ 1. АЛГЕБРА СИММЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 347 лученную транспонированием строк и столбцов в можно написать tr (<D[dX) = О, где X, X 4 dX—две произвольные, расположенные по со- седству унитарные матрицы. В таком случае мы должны иметь dX = iX-8X, где 8Х—произвольная эрмитова матрица: в самом деле, «поворот» X 4- dX получается при последовательном осу- ществлении поворота X и инфинитезимального поворота 1 4-1- 8Х. Но уравнение tr(OX.6X) = 0 означает, что матрица ФХ равна нулю. Это непосредст- венно следует из того, что линейная форма переменных yik = ^x(ik) обращается тождественно в нуль, если она равна нулю для всех значений, удовлетворяю- щих условию yizi = yfz'. в самом деле, любую матрицу ны можно записать в виде ^ + ^2, где Yx и У2—эрмитовы матрицы. Умножив ФХ = 0 справа на X"1, мы находим, что Ф = 0; таким образом, все производные dqldx (ik) равны нулю в том же смысле, что и сама ф, т. е. для произвольных значений переменных x(ik), матрица из которых унитарна. Но эти производные являются формами порядка f—Г, следовательно, истин- ность нашего утверждения доказывается математической индукцией. Каждое инвариантное подпространство из яв- ляется пространством представления для представлений группы с и группы и, которые содержатся в (c)z и (u)z соответственно. Поэтому полученные результаты доказы- вают, что если неприводимо, то эти представления так- же неприводимы.
348 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК § 2. Классы симметрии тензоров Один из наиболее естественных методов получения инвариантных многообразий тензоров F состоит в наложе- нии на F линейных условий симметрии вида 2a(s)«sF=0. (2.1) S Это приводит к введению оператора симметрии a==2fl(s)*s. (2.2) S Такие операторы можно складывать и умножать на про- извольные числа, а два оператора а, b можно применять последовательно с таким же результатом, что и результат применения оператора с = Ьа, который определяется ра- венством c(s)=^ (2.3) tt' = s Другими словами, мы здесь наиболее естественным обра- зом приходим к алгебре р симметрической группы я = всех перестановок s. Элементы этой алгебры, образующие /!-мерное линейное пространство т, возникают как опера- торы, которые можно применять к тензорам порядка f. Числа 6z(s), проявляющиеся в&(2.2), мы вправе называть компонентами элемента а. В частности, а есть эрмитов оператор в тензорном пространстве Э1Л если он является вещественным элементом, т. е. если он совпадает с эрми- тово сопряженным оператором а, который определяется равенством 5(s) = a(s-1). (2.4) Следовательно, эти вещественные операторы симметрии представляют некоторые физические величины физической системы, состоящей из f одинаковых объектов, полным пространством состояний которой является 9^; величины такого рода неизвестны классической физике и, следова- тельно, не могут быть описаны на языке обычных прост- ранственных и временных моделей [2]. Соотношение (2.1) или 2^(5) % (s) = 0 является ли- s нейным условием, которое налагается на элемент X—F, определенный равенством x(s)=sF. Класс симметрии
§ 2. КЛАССЫ СИММЕТРИИ ТЕНЗОРОВ 349 определяется одним или большим числом уравнений это- го типа; таким образом, мы приходим к определению: Каждое линейное подпространство р из г определяет класс симметрии тензоров. Тензор F принадлежит когда соответствующая величина или элемент симметрии F находится в р. Оказывается, этот процесс, с помощью которого класс порождается подпространством р, удобно обозначать каким-нибудь-символом; мы будем писать $р = #р. • Если читатель обнаружит, что трудно оперировать с элементом F, компоненты которого sF являются тензора- ми, а не числами, он может заменить этот тензор сово- купностью его коэффициентов F . л’у), а элемент F—эле- ментами х =* F (1хг2• • • i/), соответствующими каждому определенному множеству индексов (G*2...iz); такой элемент х определяется равен- ством x(s) = sF(i1i2. . .if). Условие, что F принадлежит р, означает, что F(m2. . .if) принадлежит р для всех nJ возможных комбинаций индек- сов i. То, что класс симметрии $ = #р инвариантен относительно всех симметричных преобразований (1.2), следует из того, что (2.1) подразумевает соответствующее равенство для элементов F, F'. В самом деле, элемент F' (м2.. .if) есть линейная комбинация элементов Fik^. - - kf), соответствующих различным комбинациям (kjz2.. .kf) индексов k. Если F принадлежит р, то a -F также принадлежит р, где а — любой элемент из нашей алгебры. Чтобы убе- диться в этом, мы заметим, что s-компоненту выражения H(i1...if) = a-F(i1...if) дает равенство ^atf^-rsF^.. л‘/) = 2<7(г~1)’^(^1- • •£/)» г г где kly . . ., kf получаются из . .., if перестановкой г. Следовательно, И (iu ..., if) есть линейная комбинация тех F(/?x. . -kf), индексы k которых получаются некоторой перестановкой индексов i.
360 F-л v. симметрическая группа перестановок Главный вопрос теперь таков: может ли каждое инва- риантное подпространство порождаться процессом # из некоторого р, и кроме того, единственно ли или до какой степени единственно это порождающее £ опреде- ляется подпространством По-видимому, ответ на этот вопрос наилучшим образом выражается с помощью обрат- ного процесса ti, который порождает некоторое р по за- данному Возможно, в понимании ситуации, с которой мы имеем дело, читателю окажется полезной следующая геометрическая аналогия. Пусть точки х плоскости с не- которым фиксированным центром соответствуют элементам алгебры р, а линейные отрезки F, идущие из этого центра, соответствуют тензорам. При сжатии всей плоскости с фиксированным отношением т (0 1), так что центр остается неподвижным, точка х переходит в точку тх, а отрезок F—в отрезок tF; это сжатие отрезков будет аналогией симметричных преобразований тензоров. Буква $ теперь будет обозначать «инвариантное» множество отрезков, т. е. такое множество, что, если оно содержит отрезок F, оно также содержит все сжатые отрезки xF. Так же, как мы сопоставляли элементы симметрии F(f1...f/) с тензором F, мы теперь сопоставляем с от- резком F множество точек F(t) из F; здесь F(x) —конеч- ная точка отрезка xF. Пусть р—любое множество точек; отрезок F будет включаться в множество $ = #р тогда и только тогда, когда все его точки F(t) находятся в р. Очевидно, что таким способом можно получить только инвариантные множества отрезков ^3, и обратно: все такие инвариантные множества получаются этим способом. В этом построении является существенным только «ядро» р0 нашего множества точек р; множество р0 состоит только из тех точек х, для которых хх принадлежит р при всех х (из интервала Ядро р0 инвариантно в том смысле, что вместе с х ему принадлежат все хх. То, что существенно только ядро р0, означает, что наше построение дает то же самое множество отрезков $ для двух точечных множеств р, р', если эти множества имеют одинаковое ядро; поэтому мы можем ab initio*) ограни- читься рассмотрением инвариантных точечных множеств р=р0. Чрезвычайно просто найти множество р, которое дает данное множество отрезков ф: мы включаем в р те !) С самого начала (лат.). (Примеч. перев.)
§ 2. КЛАССЫ СИММЕТРИИ ТЕНЗОРОВ 351 и только те точки, которые лежат на отрезках и это £ автоматически является инвариантным. Если читатель обдумает геометрическую иллюстрацию, которую мы здесь столь педантично изложили, у него не возникнет никаких затруднений с пониманием аналогич- ной ситуации для тензоров и элементов симметрии. Ли- нейное подпространство р из г следует называть инва- риантным, если все элементы ах лежат в р, где х— произвольный элемент из р и а — вообще любой эле- мент-*). Следовательно, такое р инвариантно относительно совокупности отображений вида (а): лг—> х' = ах. (2.5) Сопоставляя этому отображению (а) пространства г в себя элемент а, мы, очевидно, получаем представление алгеб- ры р (и, следовательно, группы лЛ; оно называется ре- гулярным представлением. (Множество г появляется здесь дважды: один раз как пространство представления и затем как алгебра р, представленная в этом простран- стве; первое будет обозначаться готической буквой г, второе—греческой р. Мы здесь имеем дело с таким же объектом, как и в гл. III, § 2, где мы получили реали- зацию группы g при помощи сопоставления элементу а из g отображения $-->$' = as группового многообразия на себя.) Это регулярное представление обеспечивает нас материалом, из которого мы можем построить все—и, в частности, неэквивалентные неприводимые — представ- ления алгебры р. Когда мы, имея дело с т, пользуемся терминами «инвариантный», «неприводимый» и т. д., они всегда будут относиться к алгебре всех отображений (а) пространства т в себя, которая просто изоморфна алгебре р всех элементов симметрии а. Если р—инвариантное под- пространство из г, то представление, индуцированное в регулярным представлением, мы всегда будем называть просто регулярным представлением в оно связывает с каждым элементом а отображение (2.5) подпростран- ства £ в себя. Уравнение х' = ах, выписанное в компо- нентах, имеет вид х' (s) = 2a(r’1)x(rs). ♦) Это «инвариантное подпространство» не то же самое, что «инвариантная подалгебра», определенная в гл. III, § 13; для со- гласования с нашей предыдущей терминологией его следовало бы назвать «левоинвариантной подалгеброй».
352 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Пусть х—-произвольный элемент из р, а г — любая фик- сированная перестановка; условие, что р инвариантно, позволяет нам заключить, что элемент х', определенный равенством х' (s) = x(rs), также лежит в р. Пусть р—произвольное подпространство из г; мы го- ворим, что х принадлежит ядру р0 подпространства р тогда и только тогда, когда все величины вида ах при- надлежат р; это'множество р0 инвариантно. Таким обра- зом, мы имеем теорему о том, что два линейных подпро- странства р, р' порождают один и тот же класс симмет- рии $р = #р = $р' тензоров, если они имеют одно и то же ядро. Поэтому мы можем с самого начала ограничиться рассмотрением инвариантных подпространств р. Может оказаться, что некоторые соотношения (2.1) будут выполняться для всех тензоров. Обозначим через т0 наименьшее подпространство из г, которое содержит эле- менты FliJ^- • if), соответствующие всем тензорам F и всевозможным значениям индексов (i^.. .if). Тогда р по- рождает то же $ = #р, что и пересечение р с т0; поэтому в дальнейшем естественно ограничиться рассмотрением инвариантных подпространств р из т0. Эти замечания неприменимы, если размерность n^f, так как /I коэф- фициентов sF(l, 2, ..., /) = Г(Г, 2', .... Л произвольного тензора F, без сомнения, независимы. Однако в случае п ситуация иная: пусть, например, 6^=±1 в зависимости от того, является s четной или нечетной перестановкой; тогда 2^ — антисимметричный тензор, и поэтому он должен быть равен нулю в случае, когда размерность п меньше, чем порядок f. Итак, самое большее, на что мы можем на- деяться, это на то, что р определяется единственным образом через если ограничиться инвариантными под- пространствами р, содержащимися в г0. Чтобы доказать, что это действительно так, мы попытаемся найти обрат- ный процесс, который приводит от ^3 к р, следуя про- грамме, которую мы набросали выше при помощи гео- метрической’аналогии. В случае n^f это легко делается следующим образом: если F—любой тензор в ^3, мы полагаем, что ему соответствует элемент x = F(l,2, ...f) из г; £ состоит из всех полученных таким образом эле-
§ 3. ПОДПРОСТРАНСТВА В ГРУППОВОМ ПРОСТРАНСТВЕ 353 ментов х. Но, чтобы получить метод, который применим также в случае n < f, ’мы должны изменить процедуру. Мы понимаем под р = h $ наименьшее линейное многообра- зие, содержащее всю совокупность элементов Fiji, i2,.. соответствующих всевозможным тензорам"'F из $ и все- возможным комбинациям индексов . .if). Если тензо- ры Еа образуют базис в ф, то подпространство $ состоит из всех элементов вида ж = 22• if)*Еa(ii• • -if). (2.6) « (О То, что такое р инвариантно, уже было показано выше, поскольку, если X — Fily^.. .lf), элемент х', определен- ный выражением х' (s) = x(rs), равен F (kfa.. .kf), где ku k2, ..., kf получаются из i\, i2, ..if фиксированной перестановкой г. Теперь введенное выше г0 мы обозначим через h оно совпадает со всем пространством г, когда n^f. Пусть символ а означает «содержится в»; тогда непо- средственно из определений вытекают следующие резуль- таты. Если р—линейное подпространство из г и $ = #р, то h$<=p. Если $—любое линейное подпространство из 9V и р= цф, то, наоборот, $<=#р. Мы можем самое большее рассчитывать на то, что символ с можно заменить на = , если в первой теореме р есть инвариантное подпро- странство из т0, а во второй—если $ является инва- риантным подпространством из То, что эти обратные теоремы действительно верны при данных ограничениях, будет доказано в § 4. § 3. Инвариантные подпространства в групповом пространстве В качестве подготовки к предложенному выше иссле- дованию нам нужна одна фундаментальная теорема о групповой алгебре: здесь мы докажем эту теорему для случая произвольной конечной группы. Однако мы не изменим обозначений,— так, например, л обозначает здесь любую конечную группу порядка h. ‘ Теорема (3.1). Если р—инвариантное"[подпростран- ство в г, то существует элемент е из групповой алгеб- ры, имеющий следующие два свойства1. (1) каждый элемент вида хе принадлежит р, (2) каждый элемент х из р удовлетворяет равенству хе~х.
354 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК В частности, из (1) следует, что элемент е=1е сам принадлежит р, и отсюда, ввиду (2), ее = е, т. е. эле- мент е является идемпотентом [3]. Он оказывается «производящей единицей» для р в том смысле, что подпространство р состоит из всех элементов вида хе. Доказательство. Пусть ех, е2, ..., eh — система коор- динат в векторном пространстве т, которая таким обра- зом приспособлена к g-мерному подпространству р, что р является линейным множеством, определенным системой е2, •••» eg- Параллельная проекция, преобразующая х = х1е1Ч ... Н xheh в имеет два свойства: (1)она проецирует каждый элемент х в некоторый х', лежащий в р, и (2) она является тож- деством в пределах р. В первоначальной системе коор- динат, определенной простыми элементами s алгебры, эта проекция задается формулой A;'(s) = 2^(s, /)х(0» t где матрица d(s, /) обязательно имеет вид d(s, f) -е, (s) ei (/) -|-... -|-eg(s)eg(/), а еДв) определяются системой равенств (j, k = 1, 2, ..g). s To, что p инвариантно, означает, что если X лежит в р, то элемент хг, определяемый равенством xr(s) = x(rs), также лежит в р. Следовательно, проекция с матрицей d(rs, rt) имеет те же самые свойства (1) и (2), если г — любая фиксированная перестановка (т. е. элемент груп- пы л). Следовательно, эти утверждения справедливы также и для отображения с матрицей e(s, /) = уУ d(rs, rt), (3.2) Г которая получается суммированием по всем элементам г группы. Эта матрица подчиняется уравнению e(rs, rt) = e(s, t)t откуда следует, что e(s, /) зависит только от комбина- ции e(s, t) = e(t~xs).
§3. ПОДПРОСТРАНСТВА В ГРУППОВОМ ПРОСТРАНСТВЕ 355 Поэтому линейную проекцию х' (s) = 2^(s’ О* (О t можно записать коротко как х' ~хе, что и доказывает справедливость нашей теоремы. Пусть инвариантное подпространство р полностью приводится к двум инвариантным подпространствам: р = р1 + р2, и пусть е — производящая единица для р. Любой элемент в р можно записать в виде суммы его компонент из pj и р2; отсюда, в частности, e = ei4e2. Из этого следует, что для произвольного элемента х из р можно написать х = хе = xet + xe2. Но так как х^хвг лежит в рп а х2 = хе2 лежит в р2, элементы хА и х2 являются (единственными) компонен- тами х в рх и р2. Для элемента соответствующие две компоненты очевидно равны ег и 0, т. е. eje2 = O; аналогично £2^ = 0, е.е2 = е2. Следовательно, е2 являются производящими идемпо- тентными единицами для рх, р2 соответственно; они «независимы» в том смысле, что После полного приведения р к любому числу компонент: Р = 2Рй производящая единица е из р разлагается i в сумму i компоненты которой удовлетворяют аналогичным равен- ствам e^ = 0 (iVft), eze,= е(. Существование производящей единицы дает средство получения нового и более простого доказательства того, что приводимость означает полную приводимость: Теорема (3.3). Если подпространства р, рх инвариант- ны и pjczp, то р можно привести к рх -Ь р2 таким спо- собом, что р2 будет также инвариантным. 12*
356 Гл. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Доказательство. Пусть ех—производящая единица рх. Разложим каждый элемент из р следующим образом: х = хе1 + {х—хе J. (3.4) Первая компонента х1 = хе1 лежит в р1( а вторая Х2 = Х — Хв} пробегает некоторое линейное подпространство ра из р, когда х пробегает все элементы из р. Это подпростран- ство р2 также инвариантно, поскольку ахг = ах—(ах)е1 и ах лежит в р, если х лежит в р. Элементы хи х2 из plt ра соответственно удовлетворяют равенствам ад = хаех=0. Из этого следует, что сумма элемента ух из рх и эле- мента xt из ра не может обратиться в нуль, если не равны нулю оба элемента у± и ха; следовательно, рх и ра независимы. Чтобы доказать это, мы просто заметим, что после умножения ji + x2 = 0 на ех мы находим угег = = <у1 = 0. Итак, равенство (3.4) представляет собой при- ведение любого элемента из р к его компонентам из Pi и ра. Любой идемпотентный элемент е порождает инвариант- ное подпространство р„ состоящее из элементов вида хе. Если ег, еа—два независимых идемпотентных элемента (ехеа = 0, е2е1 = 0), то подпространства рх, ра, которые они порождают, независимы, и идемпотентный элемент е = ех + ^2 порождает р = р1 + р2. Говорят, что идемпотент- ный элемент е является примитивным, если при за- писи его в виде суммы двух идемпотентных элементов ех + еа одно из слагаемых обязательно равно 0 (а дру- гое е). Для того чтобы рг было неприводимым, необхо- димо и достаточно, чтобы е был примитивным. Очевидно, любой идемпотентный элемент е, в частно- сти, модуль 1 нашей алгебры, можно привести к сумме независимых примитивных идемпотентных элементов. Если у нас есть разложение на ненулевые независимые идем- потентные элементы е = е1+еа+...4-ел и если, например, элемент ех—не примитивный, его в свою очередь можно разложить на сумму двух незави-
§ 3. ПОДПРОСТРАНСТВА В ГРУППОВОМ ПРОСТРАНСТВЕ 357 симых ненулевых идемпотентных элементов еЦ-el; таким способом мы получаем полное приведение е к zzz+l не- зависимым членам^ поскольку мы, например, имеем ^ = ^^ = 0; аналогично е2е; = 0. Ясно, что этот процесс должен обрываться после не более чем h шагов. Приведенный анализ позволяет нам утверж- дать, что мы таким способом получили полное приведе- ние $е к независимым неприводимым подпространствам. Мы видели, что теорема о полной приводимости является следствием существования производящей еди- ницы. Но справедливо также и обратное: если р является слагаемым в полном приведении г = р + нашей заданной алгебры г, то оно обладает производящей единицей. Нужно только конкретизировать развитые выше рассуждения в применении к модулю 1 из г; модуль 1 можно пол- ностью привести к двум компонентам е^е', лежащим в подпространствах р и /, а производящими единицами в р и р' являются соответственно е и е'. Математик заметил бы, что все эти рассуждения все еще применимы, когда алгебра определяется над любым полем. Вместо того, чтобы иметь дело с множеством ве- щественных или комплексных чисел, как в обычном ана- лизе, мы можем в абстрактной алгебре действовать в про- извольном поле, т. е. на. множестве элементов, называе- мых числами, в котором определены две фундаментальные операции—сложение и умножение и их обращения — вы- читание и деление, в соответствии с формальными зако- нами обычной арифметики. Наше исследование зависит только от этих правил действия (с незначительными огра- ничениями). Есть поля, которые обладают тем свойством, что в них умножение определенного целого числа, ска- жем, h, на любое число из поля дает нуль; мы можем сказать, что h аннулирует любое число. Такие «модуляр- ные» поля надо исключить, поскольку мы хотим сохра- нить возможность нахождения такого числа, произведение которого с h есть любое заданное число. Когда наши рассуждения не вовлекают никаких других ограничиваю- щих предположений о поле чисел, мы оперируем в отно- сительно элементарной области теории. Однако такие теоремы, как «фундаментальная теорема» гл. III, (10.5) и теорема Бернсайда—Фробениуса —Шура, которая бази-
358 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК руется на основной теореме алгебры, принадлежат к бо- лее глубокому уровню. Эти теоремы справедливы только в «алгебраически замкнутых» числовых полях, в ко- торых разрешимо любое алгебраическое уравнение (с коэффициентами из этого поля). Наконец, такие поня- тия, как «эрмитовость», «унитарность» и т. д., используют переход от числа к его комплексно сопряженному и не имеют места в общих абстрактных полях. Наше перво- начальное доказательство теоремы о полной приводимости было получено с помощью инородных для общего поня- тия поля средств. Теорема (3.5). Проекция подобия х—+х' инвариант- ного подпространства р на [инвариантное подпростран- ство р' обязательно выражается уравнением вида х' xb. (В частности, когда р и р' эквивалентны, эта теорема применима к взаимно однозначному отображению подобия V^'-) Доказательство. Пусть заданное отображение подобия переводит производящую единицу е из р в Ь. Благодаря подобию хе переходит тогда в x'^xb, где х—произ- вольный элемент из р; но для такого элемента хе = х. Дополнительное замечание. Рассмотренная проекция переводит е в eb\ отсюда eb = b. С другой стороны, если е' — производящий элемент из р', то, поскольку Ь лежит в р', мы имеем be' = Ь\ b = eb = be' = eber. выражаем этот результат, т. е. что Ь имеет вид ехе\ говоря, что b имеет характер (е, е'). Наше рассмотре- ние показало, что такую проекцию всегда можно выра- зить в терминах единственного элемента b характера (е, е'). Если мы действуем в поле комплексных чисел (как это часто бывает в математическом анализе, например, в теории функций), которое является исключительно важным для нас в квантовой теории, мы можем дополнить теорему (3.1) о существовании порождающей единицы е в инвариантном подпространстве р следующим предложе- нием: Порождающую единицу можно выбрать так, чтобы она была ве- щественной; тогда она единственным образом определяется подпро- странством р. Чтобы доказать это, выберем в качестве базиса е±, е2, ..., 6 g из р ортонормированную систему векторов; тогда 2 Ъ (s) ek (s) = &ik (i, k=l, 2....g). s
§ 4. ПОДПРОСТРАНСТВА В ТЕНЗОРНОМ ПРОСТРАНСТВЕ 359 При построении матрицы d(s, t), которую мы теперь обозначаем че- рез e(s, /), мы можем поэтому выбрать = S __ e(s, 0=5 (3-6) 1= 1 Я утверждаю, что равенство e(rs, rt) = e(s, t) (3.7) выполняется автоматически — брать его среднее значение, как в (3.2) больше не нужно. Элемент е, определенный равенством е (/^s) = = e(s, /), является тогда вещественной производящей единицей для р. Чтобы установить справедливость равенства (3.7), нужно только заметить, что e(s, /) не зависит от конкретно выбранного унитарного базиса е1У е2, ..., es\ действительно, при переходе к новому уни- тарному базису ^2’ •••’ e'g посредством унитарного преобразо- вания U билинейная форма (3.6) остается инвариантной. Теперь, в частности, равенство e'(s)=e,-(rs), в котором г есть фиксированный элемент группы, определяет переход к новому унитарному базису. Чтобы доказать, что эта вещественная производящая единица е из р единственна, предположим, что существует вторая, тогда все элементы х из р удовлетворяют равенствам хе = х, хе' = х. Применив первое равенство для х = е', а второе для х = е, мы имеем е’е=^е', ее' Но так как е и е' оба вещественные, первый из этих результатов дает, после перехода к эрмитову сопряжению, ее' — е', а из этого и предыдущего результатов мы заключаем, что е' = е. При таких условиях можно расширить содержание теоремы (3.3) и упростить ее доказательство. Если е, — вещественные произво- дящие единицы для р, рх соответственно, то е1е = е1, поскольку е± лежит ври после перехода к эрмитовым сопряжениям мы находим = Отсюда следует, что идемпотентный элемент е2, определяе- мый условием ^=^14^2, веществен и независим от р = рх + р2, таким образом, полностью приводится к рх и инвариантному подпро- странству р2, которое унитарно-ортогонально к рх и в котором е2— вещественная производящая единица. § 4. Инвариантные подпространства в тензорном пространстве Теперь мы вернемся к исследованию тензоров поряд- ка Д совокупность которых образует пространство Э1Л Пусть л—снова группа всех перестановок f предметов,
360 ГЛ. v- СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК а г (= р)—соответствующее групповое пространство (алгебра). Пусть а—симметрическая величина, т. е. эле- мент алгебры р с компонентами a(s); элемент а тогда определяется равенством a (s)s=a (г1). (4.1) Соотношение F'^aF, которое означает, что тензор F' получается из F дейст- вием оператора а, эквивалентно уравнению F' = Fa между соответствующими элементами F и Ff алгебры р. В самом деле, равенство sF'^atf-^stF t получается из F' = 2a(0-^==2«(i-1)-^ t t при действии на него перестановки s. В последующих рассуждениях, которые касаются клас- сов симметрии тензоров, буква р (с индексом или без него) всегда обозначает инвариантное подпространство из т, е — производящую единицу для р, а $ соответственно есть #р. Тогда мы можем сказать, что элемент е есть производящий идемпотентный оператор класса симметрии ^3 в следую- щем смысле: (1) eF лежит в $|3, если F—любой тензор; (2) если F лежит в ^3, он воспроизводится операто- ром е, т. е. eF=F. Таким способом мы получаем конструктивное опреде- ление класса симмзтрии ^3 как совокупности всех тензоров вида eF. Это определение значительно проще, чем перво- начальное на языке р, поскольку оно зависит только от одного элемента е, вместо многообразия р. Если, напри- мер, мы имеем дело с классом ^3 всех полностью сим- метричных тензоров, то $
§ 4. ПОДПРОСТРАНСТВА В ТЕНЗОРНОМ ПРОСТРАНСТВЕ 361 является таким оператором; соответствующим оператором для класса всех антисимметричных тензоров является аль- тернирующая сумма 7Г L 6 А 1 S Теорема (4.2). Если р' с р, или р = pj + р2, то с $, ф = ^! -т ф2 соответственно. Нам нужно доказать только последнюю часть этой тео- ремы, для случая полного приведения. Производящая еди- ница e = ei + e2 подпространства р имеет в качестве своих компонент ех, е2 в рх, р2 производящие единицы для рх, р2 соответственно. Формула eF=e1F-[ e2F определяет соответствующее полное приведение ф к неза- висимым инвариантным подпространствам $2. Теорема (4.3). Если рх ~ р2, то $х~$2. Отображение подобия хх —► х2 этого рх в р2 имеет, по теореме (3.5), вид Х2 = Х1Ь, Х1 = Х,Ь'. Таким образом, соотношения F2=bFlt F1 = b’F2 определяют взаимно однозначное отображение подобия $х в $2 и обратно. Теорема (4.4). Если per,, то Единственной нетривиальной частью этой первой обрат- ной теоремы, которую нам надо доказать, является то, что р с= I? ф. Все тензоры вида Fa = eEa лежат в ф, где (Еа) — базис для всего тензорного пространства следовательно, все элементы вида .У = 2 01 • • • 0) ' F& 01 •••(/) a, i лежат в h Введя обозначение X « 2 Gx 01 • • 0) ‘^а (0 • • • ^/)> a, i мы получим yt^xe. Вспомнив определение r0= h мы видим, что хе принадлежит если х лежит в г0. Однако,
362 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК ввиду предположения, что р с г0, это автоматически спра- ведливо, если х—произвольный элемент р; но тогда хе~х. Следовательно, каждый элемент х из р содержится в Чтобы сформулировать обращение предыдущих теорем, допустим, что буква (с индексом или без) теперь обо- значает произвольное инвариантное подпространство из 9V, а р—соответственно Теорема (4.5). Если сг $ или $ = 4 $2, то р' а р, р=рх4Р2 соответственно. Теорема (4.6). Если то р~р'. Теорема (4.7). $ = #р. Последняя теорема является самой важной среди всех; она утверждает, что каждое является классом симмет- рии тензоров. Желательно сначала доказать именно ее, т. е. доказать, что Пусть е снова обозначает производящую единицу из р; #р тогда состоит из всех тензоров вида F' — eF. Так как элемент ё принадлежит р, он с необходимостью имеет вид e(s) = e(s-’) = 2 ea(kr ... kj^sE^ ... kJ, (4.8) a, k где тензоры fa образуют базис пространства $. Далее, тривиальное уравнение 2>(h • • • • • • 1/) = 5с(Ч • • • • • • »/) i I после замены sc на с показывает, что 2с(»\ ••• ••• ••• h)-P(h ••• i i Поэтому мы можем заменить (4.8) на e(s)= •.. A/)-£a(^i • •. kJ, a, k а коэффициенты F' тогда определяются выражением F Ux ♦ • • ^/) == Gi • • • (/> • • • ^/) Ea (kx . . . kJ, a, k где ca(i\ ... if, k± ... kJ = %sF(ii ... if)-sea(ki ... kJ. s Благодаря суммированию по всем элементам s группы я это преобразование с коэффициентами са симметрично; таким образом, предположение, что подпространство $£
§ 4. ПОДПРОСТРАНСТВА В ТЕНЗОРНОМ ПРОСТРАНСТВЕ 363 инвариантно, позволяет нам заключить, что F' лежит в если там лежат Еа. А это и доказывает теорему. Эту теорему можно также доказать прямым способом без ссылок на теоремы § 3 следующим способом. То, что F лежит в #р, означает, что .. if) лежит ври, сле- довательно, имеет вид (2.6): F ... if) = 2 Ьа (h • • • ip • • ♦ ^/) ’ Ea (^1 • • • cc, k Элементы Ea образуют базис подпространства Выписав s-компоненту этого уравнения и заменив индексы ip, ..., ip на iT ... if, мы приходим к выражению для компонент F: F (^ ... if) = 2 $ г^а (Ч • • • ip ^1 • • • ^/) ’ (^1 • • • ^/) • a, k Поскольку оно справедливо для любой перестановки s”1, то можно просуммировать по элементам группы, что дает выражение F (г*! ... if) = 2 ^а (Ч • • • ip • • • bf) • Еа (йх . .. kf), a, k коэффициенты которого (4 ... if, kr ... kj) = -jy У, sba (t'j ... if kY ... kf) s симметричны. Отсюда — поскольку Ea принадлежат инва- риантному подпространству ф и f получается из них некоторым симметричным преобразованием—следует, что F также принадлежит Единственной неочевидной частью теоремы (4.5) яв- ляется утверждение, что рп р2 независимы. Из теоремы (4.7) следуют соотношения с= ftp! <= #р* а $2 для (инвариантного) пересечения р* пространств pi и р2. Но так как $р2 независимы, то #р* и, следовательно, р* пусты. Теорема (4.5) показывает, что соответствующее неприводимому р, также является неприводимым. Отсюда, в частности, следует, что многообразие симметричных и многообразие антисимметричных тензоров неприводимы и инвариантны не только относительно алгебры симметрия-
364 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК ных преобразований, но также и относительно преобразо- ваний, индуцированных в тензорном пространстве аффин- ными или унитарными группами преобразований вектор- ного пространства 9i. Применяя этот результат к двумерному векторному пространству, мы видим, что представления 6/ группы с = с2 или группы п, построенные в гл. III, § 5, неприводимы. Чтобы доказать (4.6), мы должны сначала несколько более детально исследовать природу множества т0 (для п< /). Мы называем компоненту а(1) элемента а алгебры следом элемента а. Поэтому след произведения аЬ, кото- рый мы называем скалярным произведением, tr(ab) элементов а и Ь есть tr (ab) = ^a(s)b ($“*). S Таким образом, след элемента а равен tr (al) = tr(la) = = tr (а). Очевидно, что скалярное произведение симмет- рично по а и Ь, а симметрическая билинейная форма tr(a&) невырождена, т. е. а — 0—единственный элемент, для которого равенство tr (ах) — 0 выполняется тождест- венно по х. Вспомогательная теорема (4.9). Множество т0 является как лево-, так и правоинвариантной подалгеброй г. Ска- лярное произведение tr (ab) невырождено на т0, т. е. един- ственным элементом а из г0, для которого скалярное про- изведение с каждым элементом х из г0 равно нулю, яв- ляется а — 0. Первая часть этой теоремы почти очевидна, так как, если x = F(t’i ... if), то элемент х', определяемый равен- ством x'(s) = x(sr), равен F'(г\ ... if), где F' = rF. Пусть i—производящая единица из т0, а—элемент г0, а х—произвольный элемент. Тогда, поскольку т0 право- инвариантно, то ах также лежит в и мы имеем ах=ах-1, tr(ax) = tr(a-xi). Напомним, далее, что xi лежит в г0; следовательно, если скалярное произведение а с каждым элементом xi из г0 равно нулю, то tr (ах) •= 0 без ограничения на х. Отсюда вытекает равенство а = 0, что и утверждалось. Доказательство теоремы (4.6). Пусть Еа—базис под- пространства и пусть [отображение^ подобия в переводит Е£ в базис Е'а пЬдпрЬстранства ^J'. Пусть
§ 4. ПОДПРОСТРАНСТВА В ТЕНЗОРНОМ ПРОСТРАНСТВЕ 365 £а(гх . . . if)—заданная система коэффициентов, и пусть £ = 2 G1 • • • ^/) * (Ч • • • 7) ’ , °Lj............................. (4.10) С — 2 Gz (*1 • • • (f)е (h • • • $/)• a, i Нужное отображение подобия р в р', естественно, следует определить при помощи соответствия с —> с9. Однако это возможно только, если две системы коэффициентов са (fx.. .(Д которые определяют одно и то же с, также определяют одно и то же с'; или же система коэффициентов, при кото- рой с равно нулю, также должна обращать в нуль и с'. Сначала мы заметим, что, если тензор F удовлетворяет уравнению g=2c(s-x)*’sf=o, S то также и G' = 2c' (s"1)«sF=0. .4 Из (4.10) получим c(s-*)= 2 sca ... kf)»Ea (kt ... kf), a, k откуда следует G (fx ... if) = 2 2 (Ч • • • ... kf) Ea (k^ ... kf), a k где Ca(fi . . . if, ki ... kf) — ^sF (it . . . . kf). s Эти коэффициенты ca определяют симметричное преобра- зование. Следовательно, данное преобразование подобия которое переводит Еа в Е'а, переводит G в G'. Это доказывает наше утверждение, что обращение в нуль G влечет обращение в нуль G'. Если с = 0, то 2^(s”1)*^(h ••• = tr ... if)] — 0 s для всех тензоров F и всех комбинаций индексов it ... if, илиТ1т (с'х) = 0 для всех элементов х из т0. Отсюда из вспомогательной теоремы (4.9) получаем с9 = 0.
366 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Результат наших исследований состоит в том, что существует взаимно однозначное соответствие между инва- риантными подпространствами р из т0 и инвариантными подпространствами из Ж Это соответствие является настолько тесным, насколько это вообще возможно', а именно', неприводимость, полное приведение, эквивалентность и не- эквивалентность с одной стороны означают то же самое с другой. В частности, мы подчеркнем такое следствие: Теорема (4.11). Каждое инвариантное подпространст- во ^5 из Ж, в частности, само Ж, можно полностью при- вести к неприводимым инвариантным подпространствам. Я надеюсь, что наши элементарные методы сделали это соответствие вполне прозрачным. Априори очевидно, что мы можем полностью привести модуль 1 алгебры р к сумме + е2 + • • • + независи- мых примитивных идемпотентных элементов. Тогда формула F==e1F + e2F4 . дает полное приведение пространства Ж к независимым инвариантным подпространствам $2, ..., каждое из которых порождается одним из идемпотентных операторов е. (^ состоит из всех тензоров вида егР.) С этой точки зрения, мы могли бы рассматривать в качестве единствен- ного нетривиального результата нашего исследования утверждение, что порожденное примитивным е, непри- водимо (относительно алгебры S всех симметричных пре- образований). Физически это означает, что класс термов, соответствующих такому ^3, нельзя далее разбивать на части, которые ни при каких условиях не могут взаимо- действовать друг с другом. Если, несмотря на это, суще- ствует такое разбиение, оно является случайным, т. е. свой- ственным конкретной динамической ситуации в рассматри- ваемом случае. § 5. Поля и алгебры Здесь мы прервем наше исследование, чтобы дать аксио- матическую трактовку двух фундаментальных понятий — поля и алгебры', наше исследование обнаружило важность этих понятий для квантовой теории. Физик, который особо не интересуется такой трактовкой, может спокойно опу- стить эти параграфы. Поле есть множество элементов, называемых числами, в котором определены обе операции— сложения и умно-
§ 5. ПОЛЯ И АЛГЁБРЫ 36? жения, единственным образом сопоставляющие любым двум числам а, 0 из этого поля определенные числа а + Р, а0 соответственно. Сложение подчиняется законам коммута- тивности и ассоциативности « + Р = Р + а, (а-гР) l у = а + (0 + у) и имеет единственное обращение—вычитание. Из этого следует существование единственного числа о (нуль) со свойством а + о = о + для всех а. Далее, с каждым числом а связывается число —а, ему противоположное, такое что а + (—а) = о. Мы требуем, чтобы умножение подчинялось закону ассоциативности (ар)у = а(Ру) и законам дистрибутивности (а + Р)т = (ау) + (Рт), а(р4-у) = ар + ау относительно сложения. Из закона дистрибутивности сле- дуют соотношения ао — оа — о. Умножение не обязано быть коммутативным; в случае, когда это так, мы говорим о коммутативном поле (23). Пусть, далее, будет возможным деление на любое число, кроме нуля, и пусть оно приводит к единственному част- ному, т. е. каждое из уравнений а£ = р, = Р имеет для данного о и данного Р одно и только одно решение т] соответственно. Из этого следует, что про- изведение ар двух чисел может равняться о, только если один из двух сомножителей равен о. Из всего этого сле- дует, что существует число 8, «один» или «единица», обла- дающее тем свойством, что ае == 8а = а для всех а. Мы явно предполагаем, что не все числа рав- ны о; тогда, в частности, s=^=o. Каждое число а =# о обла- дает единственным обратным ему а"1 со свойством аа-1 = =а”1а = 8. Вдобавок к числам нашего поля мы должны ввести обычные числовые символы 1, 2, 3, ... Их можно истолко-
368 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК вать как множители из уравнений 1а = а, 2а = а 4-а, За = (2а) 4-а... и вообще (и 4- 1)а = (па) 4-а. В частности, мы можем построить ряд 1е, 2е, ..пе, ... (5.1) чисел, кратных е. Таким образом, у нас есть две возмож- ности: (1) Все числа этого множества могут отличаться от е; тогда они все различны, и мы можем заключить с помощью равенства пр = пе«р и аксиомы деления, что для данного числа а существует одно и только одно число Р = а/п, которое удовлетворяет уравнению пР = а; таким образом, мы можем ввести обыч- ные рациональные числа как мультипликаторы. (2) Вторая возможность состоит в том, что одно из кратных (5.1) само есть е; пусть наименьшим кратным такого вида является ре. Тогда числа ряда (5.1) повторяются в циклах длины р. Число р должно быть простым числом, так как, если бы р было произведением двух целых чисел /пип, меньших р, то мы имели бы о= ре = те» ns, но по условию ни ms, ни пе не равны о, так как ре — наименьшее кратное такого вида, а это противоречит аксиоме деления. В этом случае мы имеем дело с конечным полем модуля р [4]. Чтобы не потеряться в этих слишком широких обобще- ниях, мы возьмем в качестве нашего числового поля ком- мутативное поле и определим линейную ассоциатив- ную алгебру конечного порядка над этим полем. Под числами мы подразумеваем элементы поля и обозначаем его нуль о и его единицу 8 через 0 и 1; под элементом мы понимаем элемент алгебры. Будем обозначать элементы поля малыми греческими буквами, а элементы алгебры — малыми латинскими буквами. Алгебра характеризуется тремя фундаментальными операциями: сложением двух эле- ментов, а-\-Ь; умножением элемента на число, у а; умно- жением двух элементов, ab.
§ 5. ПОЛЯ И АЛГЕБРЫ 369 Первая и вторая из этих операций подчиняются обыч- ным аксиомам векторного исчисления (гл. I, § 1), кото- рые мы здесь ради полноты изложем заново. Сложение коммутативно и ассоциативно и имеет един- ственное обращение: вычитание. Отсюда следует, что суще- ствует нуль-элемент о. Умножение на число подчиняется законам 1а == а, а (рс) = (&Р) с, (а+ Р) £==(«£) -] (Рг), а (Ь + г) == (аЬ) 1 (аг). Порядок h вводится аксиомой размерности: каждые элементов алгебры линейно зависимы, причем коэф- фициенты в равенствах, выражающих эту зависимость, являются числами из поля, но существует h линейно независимых элементов. Множество из h таких элементов Г1, е2, ..., eh, называемых «основными единицами», обра- зует базис для алгебры, в том смысле, что любой элемент а можно единственным образом представить в виде л = ад +<х2е2-| ...+алел и, следовательно, можно заменить его набором из h число- вых компонент (ап а2, ..., ал). Умножение элементов друг на друга подчиняется зако- нам дистрибутивности (а + &) с = (ас) 4 (Ьс), с (а 4 Ь) = (са) 4 (сЬ) для обоих сомножителей и законам ассоциативности ya>b~y (ab), b-ya = y (Ьа), (ab)c = a(bc). Мы не предполагаем ни что умножение коммутативно, ни что оно обладает единственным обращением—делением. Но мы предполагаем, что алгебра обладает «единицей», модулем (или главной единицей), т. е. элементом е со свой- ством ае = еа=*а для всех элементов а. Обычно мы без колебаний будем обозначать нуль и единицу из элементов алгебры через 0 и 1. Если мы допустим возможность деления, алгебра све- дется к (вообще говоря, некоммутативному) полю или алгебре с делением конечного порядка h над задан- ным полем.
370 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК § 6. Представления алгебр Для упрощения печати и чтобы сделать текст более читабельным, мы больше не будем выделять элементы нашей алгебры жирным шрифтом. Это относится, в частно- сти, к элементам алгебры р «величин симметрии», которые мы часто будем называть этим именем, во избежание воз- можного смешения с элементами основной группы. Однако мы будем пользоваться этим средством, чтобы различать тензор F и элемент симметрии F, либо при рассмотре- нии элемента как оператора, действующего на тензор. Мы начнем с алгебры р конечного порядка й, элементы которой образуют Л-мерное векторное пространство г, и эле- менту а из р поставим в соответствие отображение (а): х—>х' = ах г на себя. Мы рассматриваем алгебру (р) преобразований (а), которая просто изоморфна алгебре р, в качестве фунда- ментальной для векторного пространства г, т. е. термины «приводимый», «инвариантный» и т. д. применяются к под- пространствам из т относительно группы преобразова- ний (а). Мы предполагаем, что г можно полностью при- вести к неприводимым подпространствам pi + р2 + • • • *, каждое из этих подпространств тогда содержит идемпо- тентную производящую единицу е1У е2, ... Мы уже видели, что это предположение истинно для алгебры, соответ- ствующей любой конечной группе, по крайней мере при условии, что поле, над которым определена алгебра, не имеет в качестве модуля простое число, являющееся делителем порядка группы h. Мы обсуждали представления группы или соответствую- щей алгебры в гл. III. Мы установили, что неприводимые представления подчиняются определенным важным услови- ям, которые, как ни странно, ограничивают их число и вместе с еще недоказанной «теоремой полноты» приводят к разложению данной алгебры на независимые простые матричные алгебры (гл. III, § 13). Того, что мы не смогли доказать теорему полноты применявшимися там методами, следовало ожидать, поскольку мы предполагали пред- ставления заданными и просто исследовали их свойства; у нас не было никакого общего процесса для построения представлений данной алгебры. Но теперь мы обладаем материалом для такого построения: разложение г на не- приводимые подпространства р, приводит регулярное
§6. ПРЕДСТАВЛЕНИЯ АЛГЕБР 371 представление к такому числу неэквивалентных непри- водимых представлений нашей алгебры, сколько имеется неэквивалентных инвариантных подпространств Теперь мы доведем этот процесс построения до получения разло- жения нашей алгебры на независимые простые матричные алгебры; желательно было бы получить еще раз преды- дущие результаты, но с новой точки зрения. Отличие этого рассмотрения от исследования гл. III состоит в том, что здесь мы, насколько это возможно, воздерживаемся от наложения ограничивающих предположений на ком- мутативное поле, над которым определяется алгебра; только в конце мы обсуждаем преимущества того, что множество комплексных чисел (единственное поле, инте- ресное с точки зрения физических приложений) является алгебраически замкнутым. Теорема (6.1). Каждое представление алгебры р вполне приводимо к неприводимым представлениям. Каждая из этих неприводимых составляющих эквивалентна представ- лению, индуцированному в некотором р, регулярным пред- ставлением. (Следовательно, полная приводимость данной алгебры влечет полную приводимость ее представлений. Далее, каждое неприводимое представление содержится в регу- лярном представлении, которое тем самым образует под- ходящую отправную базу для получения всех представ- лений методом приведения.) Пусть $—n-мерное представление, и пусть е19 е2, ..., е„ суть п фундаментальных векторов, образующих систему координат в пространстве Э? представления <£). Если эле- мент а из алгебры соответствует линейному отображе- нию А в представлении ф, то равенство £z = а$ мы понимаем как j' = AJ, где $—векторы в 91. Если е —заданный фиксирован- ный вектор, а х пробегает все элементы одного из не- приводимых инвариантных подпространств р = р/ из г, то, как мы сразу же покажем, хе пробегает определенное подпространство р(е) из 9f, которое инвариантно относи- тельно^. Действительно, преобразование Л, соответствую- щее произвольному элементу а, переводит хе в (ах) е, и если х лежит в р, то ах также лежит в р. Подпростран- ство р(е) есть либо 0, либо подобно р в том смысле, что различные элементы х порождают различные образы 'хе, так как те х из р, для которых хе = 0, образуют инва-
372 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК риантное подпространство р' из р, и в силу предположе- ния о том, что р неприводимо, р' должно быть либо О, либо самим р. Отсюда, если р (е) ={= 0, представление, ин- дуцированное в р(е) представлением эквивалентно регулярному представлению в р. Эти рассуждения надо дополнить следующим замеча- нием. Если $—произвольное инвариантное подпростран- ство из то р (е) либо является независимым от либо целиком содержится в поскольку те элементы х из р, для которых хе лежит в образуют инвариантное под- пространство из р, которое поэтому обязательно есть либо 0, либо само р. Теперь последовательно строим MU. Mei), •••, Pi (Cg) > Pg (Cg), • • • > MU. MU. •••. Каждое подпространство в этом списке либо целиком содержится в сумме предыдущих, либо является незави- симым от этой суммы: оставив только те подпростран- ства, для которых реализуется последняя возможность, мы получаем разложение Й на определенные инвариант- ные подпространства ${(ek). Чтобы доказать эту теорему, нам нужно только заметить, что сумма подпространств из первой строки содержит по крайней мере вектор et, что при добавлении к ним суммы подпространств из вто- рой строки мы получаем вдобавок по крайней мере век- тор е2 и т. д. [5]. Только что доказанная теорема, в частности, приме- нима к симметрической группе л, и теперь мы хотим установить соответствующий аналог для алгебры S сим- метричных преобразований в пространстве тензоров порядка f. Мы уже знаем, что можно привести к под- пространствам которые неприводимы относительно S (если числовое поле, над которым определяется S, не имеет в качестве модуля простое число Каждое преобразование А из S является одновременно преобра- зованием А{ подпространства на себя, а отображение А—+А{, естественно, является представлением алгебры S, «представлением, индуцированным в алгеброй S». Мы хотим показать, что представления алгебры S вполне приводимы к неприводймым составляющим и что каждая
§6. ПРЕДСТАВЛЕНИЯ АЛГЕБР 373 из этих составляющих эквивалентна представлению, инду- цированному в каком-либо из алгеброй 2. Естественно, это не следует прямо из теоремы (6.1); чтобы установить связь между л и 2, мы должны показать, что из полной приводимости к неприводимым инвариантным подпро- странствам вытекает то же самое для алгебры 2. Мы применяем к алгебре 2 обозначения и соглашения, при- нятые в начале этого параграфа: (Л) есть отображение S->S' = AS «векторного пространства» 2 на себя, соответствие А—> —>(А)—регулярное представление алгебры 2; алгебра преобразований (А), которая просто изоморфна алгебре 2, выбирается в качестве фундаментальной в векторном пространстве 2, т. е. группа преобразований 2 состоит из преобразований (А). Теорема (6.2). Пусть 2—алгебра преобразований в век- торном пространстве 9t, и пусть 9? вполне приводимо относительно этой системы преобразований 2 к неприво- димым инвариантным подпространствам Тогда 2 сама вполне приводима к неприводимым инвариантным подпространствам Пу, а представление, индуцированное регулярным представлением в Пу, равно (более точно — эквивалентно) представлению, индуцированному в одном из неприводимых алгеброй 2. Эта теорема справедлива без всяких ограничений на поле, над которым определяется 2. Пусть П—неприво- димое инвариантное подпространство из 2 (состоящее не только из преобразования 0), и пусть —преобра- зование из П. Тогда существует вектор а в 9J, такой, что /?а#=0. Пусть а разлагается на свои компоненты а, в раз- личных подпространствах по крайней мере одна из его компонент, скажем, ctz = e, должна переводиться в век- тор/?еУ=0 преобразованием R. Зафиксируем элемент е, и пусть S в равенстве § = Se пробегает все преобразования из П; тогда эти § образуют инвариантное подпростран- ство П(е) из $ = «Типичное рассуждение», уже при- мененное при доказательстве предыдущей теоремы, позво- ляет нам тогда заключить, что: (1) П(е) есть либо 0, либо $, поскольку $ неприво- димо; в нашем случае с необходимостью оно есть $, так как вектор 7?е#=0 принадлежит П(е). (2) S=0 есть единственное преобразование в П, кото- рое переводит е в 0, так как те 5 из П, для которых
374 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Se = O, образуют инвариантное подпространство неприво- димого подпространства П. Следовательно, равенство § = = Se устанавливает взаимно однозначное соответствие между П и Это соответствие является подобием, так как £' = Л5 означает, что векторы § = — удовлетворяют ра- венству §' = А§. Таким образом, мы доказали вторую часть нашей теоремы: представление, индуцированное в П регулярным, представлением, совпадает с представле- нием, индуцированным в ^3 самой алгеброй; короче го- воря, П подобно какому-нибудь ^3Z. Поскольку Ее пробегает все подпространство ^3, когда S пробегает П, существует такое Е из П, что Ее = е; тогда Е2е = е. Так как преобразования Е и Е2 из П оба связывают с е один и тот же образ, они тождественны, т. е. Е—идемпотент. Поэтому 2 можно полностью при- вести к двум независимым подпространствам П4-2' сле- дующим образом: S = SE + (S—SE). [Ср. с доказательством теоремы (3.3).] Последовательное применение этой процедуры ведет к полному приведению 2 к составляющим Пу. Доказав теорему (6.2), мы получаем из теоремы (6.1) при тех же предположениях следующую теорему: Теорема (6.3). Каждое представление алгебры 2 вполне приводимо к неприводимым представлениям. Каждое не- приводимое представление 2 совпадает с представлением А—> A if индуцированным в некотором самой алгеброй 2. Теорема (6.1) приводит к следующему (впрочем, не очень интересному) факту: не только каждое Пу подобно некоторому SJ3Z, но также и обратно—каждое подобно некоторому П7. Как уже отмечалось, все эти результаты применимы к алгебре симметричных преобразований в тензорном пространстве 5RA Кроме того, мы показали в § 1, что эту алгебру можно заменить на группу (cz), индуцированную в тензорном пространстве группой с линейных преобра- зований х. = 2 a (ik) xk [det [a (ik)] 0] (1.3) 1 и-мерного векторного пространства, т. е. представлением (с группы с. Мы будем говорить, что представление группы с
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 375 имеет порядок /, если компоненты матрицы Л, которая соответствует элементу (1.3) группы, являются рациональ- ными целыми функциями чисел a (ik) порядка /. Тогда наша теорема утверждает: Теорема (6.4). Каждое представление группы с по- рядка f вполне приводимо к неприводимым представлени- ям, и каждое неприводимое представление группы с по- рядка f содержится в представлении (с) Л Эта теорема остается справедливой и после сужения аффинной группы с до ее унитарной подгруппы и. (Естест- венно, понятие «унитарный» означает, что мы больше не имеем дело с произвольным полем, а оперируем в поле всех комплексных чисел.) § 7. Конструктивное приведение алгебры к простым матричным алгебрам Мы снова полагаем, что алгебра р порядка h, которую в то же время можно рассматривать как векторное про- странство г измерений h, вполне приводима к неприво- димым инвариантным подпространствам Производящие единицы et этих неприводимых получаются путем со- ответствующего разложения модуля; тогда мы можем вы- разить произвольный элемент х из г в виде суммы его компонент из различных 1=2*/ ИЗ Р/), х=^хе{. (7.1) i i Если q— подпространство из г, мы обозначаем через qa совокупность элементов вида ха, где х пробегает все эле- менты q; е (с индексом или без него) — идемпотентный элемент, обычно примитивный; $ = хе—инвариантное под- пространство, порожденное элементом е', I)—представле- ние алгебры р, индуцированное в £ регулярным пред- ставлением. Мы могли бы вдобавок к разложению (7.1) простран- ства х на левоинвариантные подпространства рассмотреть аналогичное разложение на правоинвариантные подпро- странства с помощью равенства х = 2 ei*- i Однако наиболее полное разделение на взаимно независи- мые компоненты получается при одновременном осуще-
376 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК ствлении обоих этих процессов: x = = (7-2) ь k i> k Элементы вида е(хек суть элементы характера (е{, ек) или, короче, (ik). Пусть pfft—подпространство, состоящее из всех элементов этого характера. Различные p/ft независимы, и пространство т распадается в сумму этих p/ft; перво- начальное левоинвариантное = Важные свойства подпространств p/ft устанавливает следующая Вспомогательная теорема (7.3). I. Если р, р' суть два неэквивалентных неприводимых подпространства с произ- водящими единицами е, е', то все элементы характера (е, е') равны 0. II. Элементы характера (е, е) образуют поле или ал- гебру с делением, которая просто изоморфна системе отображений подобия р в себя. Доказательство. I. Пусть а—произвольный элемент характера (е, е'). Преобразование [а]: х—+х' = ха (7.4) переводит каждый элемент х из р в элемент х' из р' и определяет проекцию подобия. Наоборот, мы знаем, что любая проекция подобия р на р' определяется равенством такого вида и что производящий элемент а характера (е, е') определяется единственным образом этой проекцией. Если р и р' неприводимы, наше «типичное рассуждение» приводит нас к двум обычным альтернативам: либо про- екция сопоставляет каждому элементу х из р образ х'=0, либо она определяет взаимно однозначное отображение р на р'. Равенство еа — а говорит нам, что первая альтер- натива возможна, только если а = 0, а вторая означает, что р и р' эквивалентны. II. Приведенные выше замечания справедливы для элемента а характера (е, ё) и порождаемой этим элемен- том проекции подобия подпространства р на себя. Если р неприводимо, каждая такая проекция, за исключением проекции, определяемой элементом а = 0, является вза- имно однозначной, и, следовательно, имеет обратную. Но существование обращения эквивалентно возможности де- ления. Изоморфизм в утверждении теоремы становится очевидным при обращении нашей обычной процедуры и чтении композиции двух и более отображений слева на-
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 377 право, так как композицию отображений х' = ха, х"=ха' дает выражение х" = х(аа). С помощью этой вспомогательной теоремы мы пере- ходим к следующему построению: распределим все дан- ные по классам эквивалентных подпространств с про- изводящими единицами ^1, • • • » &19 • * • > *S, • • • и сложим производящие единицы в каждом из этих классов: = е;+...+е; = е\ ... Тогда мы получим 1=е' + е"+..., (7.5) т==т' + т"+..., (7.6) где г', г", ... обозначают неэквивалентные подпростран- ства те', те", к которым приводится г. Часть I приведенной выше вспомогательной теоремы говорит нам, что, например, е'хе" = 0. Следовательно, произведение а'а" двух элементов, при- надлежащих различным подпространствам г', г", всегда равняется 0, и соответствующее разложение CL = a —j- CL —j- . • . = 6Z8 6Z8 "j- • • . приводит к правилу умножения аЬ — а'Ь' + d'b" . Из этого следует, что г' право- и левоинвариантно и, кроме того, a fortiori*) образует алгебру р' («инва-. риантная подалгебра»); е' есть модуль алгебры р'. Таким образом, исходная алгебра является прямой суммой про- стых алгебр р', р", ...; здесь точное значение прямой суммы определяется следующим образом: Пусть р', р", ...—алгебры (определенные над одним и тем же полем); в качестве новой алгебры р—прямой суммы алгебр р', р", ... —рассмотрим совокупность *) Тем более (лат.). (Примеч. пер.)
378 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК наборов а = (а, а", •. в которых а —произвольный элемент из р', а"—-произ- вольный элемент из р", ... Фундаментальные операции в р определяются выражениями (а', а", ...), %(6z', а\ . ..);=(W, •••), (а, а", ...)(&', Ь", . ..) = (а7/, anb", ...), где X — произвольное число. Заметим, что центр алгебры р, полученной прямым суммированием, является прямой суммой центров отдельных алгебр р', р", . .. Изучим детально одну из этих простых подалгебр, скажем, р', которую мы теперь обозначаем просто как р; ее модуль s' можно теперь обозначить через 1. После удаления штрихов разложение 1 по эквивалентным при- митивным идемпотентным элементам et выражается ра- венством 1 = £1 #2 “Ь • • • 4 ' Каждый элемент а из р разлагается в соответствии с фор- мулой (двойное разложение Пирса) «= 2 a« = 2(W) i, k~ 1 i, k по компонентам характера (ik). Нетрудно увидеть, что выражение для компонент cik произведения c = ab через компоненты aik, blk элементов а и b имеет вид cik ~ 2 aijbjk* / = 1 Таким образом, мы установили связь между нашими построениями и матричным исчислением. Все инвариантные подпространства ^2, ..., рг, по- рождаемые элементами ег, е2, ..., ег, эквивалентны. Пусть р — любой из этих классов, например £ = и пусть Г{— фиксированное взаимно однозначное отображение подобия У/ в р. В силу (7.4), любой элемент а = alk — egaek
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 379 характера (ez, ek) порождает проекцию подобия [а] из на эту проекцию можно записать в виде [a] = rfaIV, (7.7) где а—проекция подобия р на себя. Но из части II до- казанной выше вспомогательной теоремы следует, что проекции подобия р на себя образуют поле (алгебру с делением) Ф, которое просто изоморфно множеству эле- ментов характера (е, е). Если Ф имеет порядок у, то каж- дое из г левоинвариантных подпространств Vk~ 2 Vik i — 1 имеет размерность g^r^v. Кратность г, с которой ка- кое-либо неприводимое представление встречается в регу- лярном представлении, является, следовательно, делите- лем размерности представления g. Любой элемент а можно привести к его компонен- там alk, которые могут быть любыми элементами незави- мых подпространств Согласно (7.7) справедливо ра- венство [«№] = ГЛ*ГЛ (7.8) и aik можно заменить соответствующим элементом alk из поля Ф. Поскольку, напротив, любой такой элемент ai{i при помощи (7.8) связывается с проекцией подобия [aikj из на $к, т. е. с определенным элементом alk харак- тера (ik), мы получаем взаимно однозначное обратимое отображение между совокупностью всех элементов а про- стой алгебры р и совокупностью матриц ац (Z12 ... а1г а21 а22 • • • (Х2г /7 ari аГ2 • • • агг порядка г, компоненты которых aik являются элементами поля Ф. Это отображение таково, что трем фундаменталь- ным операциям одной совокупности (сложение элементов, умножение элемента на число и умножение двух элемен- тов) соответствуют те же операции в другой. В частности, заметим, что — [aij] \bjk\= Гр1 • ГуРдГ*1 = Г,. а/7Рд • Г,’1. Таким образом, мы показали, что верна
380 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Теорема Веддерберна [6]. Любая из простых алгебр, прямая сумма которых образует заданную алгебру р, просто изоморфна простой матричной алгебре в некото- ром поле (алгебре с делением) Ф, определенном над полем первоначальной алгебры. (Замечание. Инвариантное подпространство рЛ состоит из всех элементов а таких, что матрица имеет в ка- честве единственного ненулевого столбца k-n столбец. Элемент et тогда описывается диагональной матрицей, все компоненты которой равны нулю, за исключением компо- ненты, занимающей t-e место и равной 1.) Нетрудно увидеть, что центр простой алгебры р со- стоит из тех элементов, матрицы (7.9) которых имеют вид а 0 ... 0 О а ... О 0 0 ... а I где а принадлежит центру поля Ф. Наше построение было разбито на два этапа. Сначала г было полностью приведено к подпространствам г', т",..., одновременно право- и левоинвариантным, затем они были приведены к левоинвариантным подпространствам р{. Те- перь мы должны вернуться к рассмотрению первого этапа. Умножив хе' слева на (7.5), мы находим хе' я=е'хе', а умножив е'х справа на тот же самый множитель, по- лучаем е'х=е'хе'. Отсюда хе' — е!х\ элементы е', е", ... коммутируют со всеми элементами и, следовательно, принадлежат центру алгебры. Подпро- странства г' = р', г", ... одновременно право- и левоин- вариантны в том смысле, что ни преобразования х' — = ха, ни х' — ах не выводят из них, и л кроме того, они в этом смысле неприводимы,—на самом деле, именно по этой причине мы называем их «простыми». Чтобы дока- зать это утверждение, будем рассуждать следующим об- разом.
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 381 (7.10). Если т0—подпространство, которое одновремен- но право- и левоинварнантно, то либо ц содержится в т0, либо тое. = 0, поскольку roez— инвариантное подпрост- ранство неприводимого pt- и, следовательно, есть либо 0, либо само pf-. Во втором случае, так как т0 правоинва- риантно, мы имеем pf==roqczro; поэтому содержится в г0. (7.11). Если лежит в т0, то это же справедливо и для любого а, эквивалентного Поскольку проекция подобия x'=xb из pf на р элементу е ставит в соответст- вие некоторый элемент из р^ с помощью равенства е= —aft и поскольку ai лежит в г0, элемент также лежит в г0. (7.12). Если roc:i’z, то, поскольку r0==2 V/» все М* не i могут быть пустыми, т. е. какой-нибудь один из е- должен лежать в т0. Но тогда все они должны лежать в г0, так же как &' а потому т0 = т'. (7.13). Пусть опять г0 есть одновременно право- и ле- воинвариантное подпространство. Тогда либо тое' = г', либо оно пусто; в первом случае s' лежит в г0. Из ра- венства Го = М' + Гов''+--. следует, что г0 с необходимостью является суммой неко- торых из пространств г', г", ...; в частности, когда тй неприводимо в смысле правой и левой инвариантности, оно должно совпадать с одним из г', т", ... Поэтому приведение (7.6) единственно. Кроме того, это показывает, что каждое одновременно право- и левоинвариантное под- пространство г0 обладает производящей единицей /, при- надлежащей центру алгебры, и что г можно полностью привести к г0 и к дополнительному одновременно пра- во- и левоинвариантному подпространству. (7.14). Если р—неприводимое (лево-)инвариантное подпространство с производящей единицей е, то и ре' ин- вариантно, и, поскольку p8z = е'р, оно равно либо 0, либо самому р. В силу р=ре' + ре"+ . .. равенство р8 = р должно выполняться для какого-то одного из 8Z, в", ..., тогда как для всех остальных ре = О. В та-
382 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК ком случае мы говорим, что 8 принадлежит ft и наобо- рот, что е или р принадлежит &. Подпространство р явля- ется подпространством одновременно право- и левоинва- риантного пространства те. Алгебра р = т, относительно которой мы предполагаем только, что она вполне приводима к неприводимым инва- риантным подпространствам ft, с необходимостью полу- чается последовательным применением следующих процес- сов: (А) Построение поля. (В) Переход к матрицам: в качестве элементов мы бе- рем матрицы фиксированного порядка г, компоненты ко- торых являются произвольными элементами поля. (С) Прямое суммирование. Процессы (В) и (С) формально вполне определены и потому имеют элементарный характер. Следовательно, построение алгебр сводится к построению полей, т. е. спе- циальных алгебр, в которых возможно деление («алгебр с делением»). Естественно, что справедливо также и обратное: любая алгебра, построенная в три этапа (А), (В) и (С), вполне приводима, поскольку: (А) Если сама алгебра г является полем, то только т является неприводимым подпространством г, так как, если а—любой ненулевой элемент поля, то пробегает все поле вместе с это—просто содержание аксиомы де- ления. (В) Матрицы (7.9), в которых компоненты каждого столбца, за исключением r-го, обращаются в нуль, обра- зуют неприводимое подпространство и пространство г всех матриц является суммой этих ft. Подпространство ft неприводимо; чтобы показать это, мы должны доказать, что если а—произвольный элемент из ft-, то любой эле- мент из ft можно выразить в виде ха. Как а, так и а' = ха имеют в качестве своего единственного отличного от ну- ля столбца Z-й столбец; опуская последний индекс i, мы обозначим эти два столбца через («1, а2, ..а„), (а[, а2, ..а;) соответственно. Равенство а' = ха тогда принимает вид г k=l
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 383 таким образом, мы имеем дело с доказательством теоремы о том, что любой ненулевой «вектор» (ап а2, ...,аг) можно преобразовать в любой заданный «вектор» (а'19 а2, . .., а'г) подходящим линейным преобразованием. По- скольку не все ak равны нулю, возьмем один из не рав- ных нулю, скажем, а2, и пусть все 2^, для которых k=^2, равны 0; тогда Ez-2 следует определять из уравне- ния = 2 ^2 ’ то, что это возможно, гарантируется аксиомой деления. (С) Для этого этапа утверждение самоочевидно. Вообще говоря, только первый этап, (А), непригоден для исчерпывающего формального исследования. Однако, если поле, над которым в соответствии с (А) определяется новое поле («алгебра с делением»), алгебраически замкнуто, то этот этап становится крайне простым: Единственной алгеброй с делением конечного порядка над алгебраически замкнутым полем является само это поле. Доказательство. Рассмотрим алгебру порядка v, опре- деленную над алгебраически замкнутым полем. Если а — элемент алгебры, то должна существовать линейная зави- симость между степенями av, av~1, ..., а, 1, т. е. должно существовать линейное соотношение, коэффициен- ты которого являются числами из поля. Поэтому элемента удовлетворяет алгебраическому уравнению порядка m^v: /(Х) = Х'» + у1Х'»-1-н •••+?«,, f (а) = а'я + ?1а'п~14т • • • + = Поскольку соответствующее поле алгебраически замкнуто, /(X) может быть выражено как произведение линейных сомножителей: /(Х) = (Х—aj (X—а2) . . . (X—ат). Соответственно (а—aj) (а—а21) . .. (а--ага1) = 0. (7.15) Введем предположение, что алгебра порядка v является алгеброй с делением; тогда произведение двух или более элементов может обратиться в нуль, только если один из сомножителей равен 0. Поэтому из (7.15)"мы можем заключить, что а = а{1 для некоторого i; алгебра, таким
384 гл. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК образом, состоит из произведений модуля I и любого числа фундаментального поля, и поэтому сама алгебра изоморфна этому полю. Если мы имеем дело с полем всех комплексных чисел, вспомогательную теорему (7.3), согласно сказанному выше, можно заменить более определенной: (7.3'). Все элементы вида ехе' равны нулю, если при- митивные идемпотентные элементы е, е не эквивалентны. Если они эквивалентны, все такие элементы являются кратными одному из них (который отличен от нуля). Далее: кратность, с которой неприводимое представ- ление встречается в регулярном представлении, не просто делитель размерности гпредставления-, в действительности она равна размерности. Таким образом, наш анализ об- наружил истинный источник этого замечательного факта. В гтаких обстоятельствах заданная («полупростая») алгебра является прямой суммой простых матричных ал- гебр над исходным полем. Итак, мы получаем полную систему базисных единиц a^'Za'iketk + 2Хх<х . •. (7.16) ik IX для алгебры; эти базисные единицы подчиняются закону умножения «матричных единиц», т. е. мы имеем произве- дения типа Сц вЦг = &lky (7-17) а все другие равны нулю. Соответствия a->||a;j|, а—*||а^||, ... являются неэквивалентными неприводимыми представле- ниями ()', h", ... Базисные единицы суть производящие единицы e't, е’(, ... неприводимых подпространств pz, с которых мы начали наше построение. Элемент e'ik являет- ся элементом характера (ik), порождаемым отображением подпространства р, в т. е. тем элементом, кото- рый это отображение сопоставляет с е[. Получив таким конструктивным образом неприводимые представления, мы опять, теперь уже с новой точки зре- ния, выводим свойства, ортогональности. Пусть временно под следом элемента а понимается след отображения я—*-у = ах (7.18)
§ 7. ПРИВЕДЕНИЕ К ПРОСТЫМ МАТРИЧНЫМ АЛГЕБРАМ 385 пространства т в себя, которое соответствует элементу а в регулярном представлении. На языке системы коорди- нат, определенной базисными единицами, это отображение превращается в g' ^\ik *= 2 aZ/ ^>jk, • • • / = 1 Каждый из g' столбцов переменных •••> ^g'k (&=1, 2, •••,£) подвергается преобразованию с матрицей ; следова- тельно, след элемента а есть g' g'- 2 • •• f=l В силу (7.16), это эквивалентно равенствам {i = ky для базисных единиц. Отсюда, ввиду (7.17), tr(^^) = g', .... (7.19) а все другие типы произведений базисных матричных единиц имеют нулевой след. Если наша алгебра является групповой алгеброй по- рядка h, то в исходной системе координат, которая состо- ит из элементов s, соответствующих элементам s группы, отображение (7.18) выражается в виде равенства i/(s) = t Из этого следует, что определенный выше след элемента а равен /i-a(I); но раньше, изучая групповую алгебру, мы называли следом элемента а просто я(1), без множителя'^. При возврате к первоначальному определению следа нам нужно просто в правых частях соотношений ортогональ- ности (7.19) заменить g’ n^g'/h. Теперь уравнение (7.16) можно явно разрешить относительно коэффициентов: = tr(^i) = p.^a(s).^((s-1). (7-20)
386 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Связь с построениями гл. III, § 13 устанавливается, если заметить, что выражения u’lk(s) = ^ekl(s-1) (7.21) являются компонентами матрицы i7'(s), соответствующей элементу s группы в неприводимом представлении Следовательно, характер представления I/ равен X'(s) = 7-s,(s-1), (7-22) а (7.19) дает соотношения ортогональности для представ- лений. Таким образом, мы пришли к конструктивной форму- лировке теории, в которой выступают в явном виде использованные фундаментальные понятия и пределы при- менимости каждого этапа. Такая формулировка обеспечи- вает нас конструктивным методом как при получении пол- ной системы неприводимых представлений, так и при установлении соотношений ортогональности (24). Дополнительное замечание. Если рассматривать групповую алгебру как алгебру комплексных чисел, то, согласно замечанию в конце § 3, можно полностью привести модуль 1 к вещественным примитивным идемпотентам е/, а пространство г к соответствующим унитарно-ортогональным неприводимым подпространствам р/. Далее, проекции Г/ можно нормировать таким образом, что e'k. будут сопряжены с e'ik. Чтобы показать это, мы заметим, что сопряже- ние элемента e'ik является в этом случае элементом характера (ki) и, следовательно, должно быть произведением e'ki на число у//г: eik~yik*eki' (7.23) Правила eikeki~eir еи ~ ekieik приводят к следующим условиям для коэффициентов: = W=l- Далее, у^ вещественны и положительны, так как в силу (7.23) и (7.19) можно написать X I eik (S) I2 tf ( e'lk “eik) =- s Таким образом, мы находим, что можно привести к виду yik == = Р1/Р?, где Р/ — положительные вещественные числа (возьмем, на- пример, Р? —Viz)- Заменив первоначальные отображения Г/ натР/Г/, обнаруживаем, что новые e'ki действительно сопряжены с новыми e'ik. Соответственно наши представления .. приведены к унитар- ной^форме,
§ 8. ХАРАКТЕРЫ СИММЕТРИЧЕСКОЙ ГРУППЫ 387 Б. РАСШИРЕНИЕ ТЕОРИИ И ФИЗИЧЕСКИЕ ПРИЛОЖЕНИЯ § 8. Характеры симметрической группы и вырождение эквивалентных состояний в квантовой механике В этом параграфе применяются следующие обозначения: — симметрическая группа перестановок / предметов; г = р = (л) —соответствующая алгебра; е—(примитивный) идемпотентный элемент алгебры р; = хе—(неприводимое) инвариантное подпространство из г, порожденное элемен- том е\ I) — представление, индуцированное в р регулярным представлением; g — размерность и I); %—характер пред- ставления I); 8 — тот элемент из множества s', s", ... (7.14), который содержится в неприводимом подпростран- стве —соответствующий класс симметрии тензоров порядка f, состоящий из всех тензоров вида eF\ $—пред- ставление алгебры S симметричных преобразований (и сле- довательно, линейной группы с), которое индуцируется в ф самой 2. Когда необходима дальнейшая дифферен- циация, мы также обозначаем это § через <£)(%) и <§„(%). В случае, когда рассуждения справедливы для произволь- ной конечной группы л, буквой h обозначается порядок л ( = /! для Пу). Определение групповых характеров, 1Аъ\ начнем с вычисления характера представления I). С этой целью мы определяем след линейного отображения х —+ у = ах (8.1) пространства р на себя;7рассуждения предыдущего пара- графа показывают, что он должен иметь вид 2«(s)x(s). S Рассмотрим теперь вместо (8.1) проекцию х —>у = ахе (8.2) всего пространства г на р; в пределах р она совпадает с (8.1) и переводит любой элемент х из г в элемент у из р. Если выбрать систему координат в г таким образом, что первые g фундаментальных векторов порождают под- пространство р, то последние (h—g) строк матрицы (8.2) будут состоять только из нулей; поэтому след проекции (8.2) полного группового пространства равен следу ото-
388 ГЛ. v- СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК бражения (8.1), рассматриваемого в р. В компонентах уравнение (8.2) имеет вид У (я) = 2 а (О х (я')е (О (^'/' = s), и потому след равен 22«(W), S где внутренняя сумма берется по парам t, t' элементов группы, которые удовлетворяют уравнению tst' = s, или, точнее, след равен 2 Ja(O2е (s-1 s) t ( s Таким образом, характер % представления I) равен X(0=2e(s-lrls), 8 ИЛИ %(s) = 2e(/s-1r-1). Г (8.3) В частности, размерность g представления I) (и нашего пространства р) равна % (1)«=й •<?(!). Резонанс или вырождение по эквивалентности. Значение полученных выше результатов для квантовой механики, как впервые указал Вигнер, состоит в следую- щем [7J. Полное приведение тензорного пространства 9(/ к инвариантным подпространствам означает разделение термов физической системы //, состоящей из f тождествен- ных объектов (электронов), на системы термов, которые не могут входить в комбинацию друг с другом ни при каком динамическом воздействии. Далее, мы видели, что приведение к ф/ соответствует полному приведению общего группового пространства г симметрической группы перестановок л к инвариантным подпространствам Отсюда вытекает, что имеется система термов, связан- ная с каждым неприводимым представлением J) группы л, которую мы обозначим просто как систему термов %, воспользовавшись для обозначения системы характером % этого представления I), а кратность этой системы термов
§8. ХАРАКТЕРЫ СИММЕТРИЧЕСКОЙ ГРУППЫ 389 равна числу т(х) появлений представления I) в регуляр- ном представлении. Ситуация немного изменяется в слу- чае п < f, поскольку тогда мы должны игнорировать все fy, не содержащиеся в т0 = й Но так как т0 одновре- менно право- и левоинвариантно, то все подпространства, которые эквивалентны неприводимому инвариантному р, лежащему в т0, также лежат в г0. Поэтому кратность системы термов % равна т(х) или 0, в зависимости от того, лежит элемент 8, с которым характер % связан соот- ношением (7.22), в г0 или нет. Из этой расширенной тео- рии, построенной в предположении алгебраической замк- нутости поля чисел, с которым мы действуем, следует только один дополнительный факт, интересный с физической точки зрения,— это то, что кратность т (%) равна размер- ности g представления I). Кроме того, эту кратность невоз- можно расщепить никакими физическими средствами, так как соответствующие термы в этих различных системах термов остаются совмещенными при любых динамических воздействиях. Мы рассматриваем расщепление термов в случае, когда взаимодействие между f объектами выражается малой энергией возмущения , пренебрегая высокими степеня- ми параметра X. Предположим на данном этапе, что уровни энергии Е19 Е2, ... отдельного объекта I невы- рождены. Если пренебречь возмущением, то If обладает энергетическими термами вида £, = Е14-Е2 + • • • + £/, (8-4) рассмотрим сначала какой-нибудь один терм такого вида. Его кратность равна /!, и соответствующими координата- ми в тензорном пространстве являются коэффициенты F(M2 • • • */)> индексы которых получаются любой переста- новкой s из чисел 1,2, ...,/. Этот коэффициент •••, if) есть компонента x(s) элемента x = F(l, 2, ..., f) алгебры (я). Расщепление терма (8.4) в первом прибли- кении определяется приведением отображения F (ЧЧ • • • if) ~ 2 (ЧЧ • • • if) ^1^2 • • • ^/) (^1^2 • • • ^/) (&) к диагональному виду; здесь матрица коэффициентов а представляет энергию, а /2, ..., if; kr, k2, ..., kf суть перестановки s, t ряда 1, 2, ..., f. Следовательно,
390 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК это равенство можно записать в виде х (s) ?= 2 а (s> t)x(t). (8.5) t Соотношение a . /р; kf')==a(ii . .. if, kx . . . kff описывающее симметрию матрицы а, где 1 _ Г, .. — любая фиксированная перестановка г, выражается фор- мулой a(sr, Zzj = a(s, t) только для тех коэффициентов, которыми мы здесь инте- ресуемся; в этой формуле г применяется к самим индек- сам 1, 2, .. Д а не к подындексам. Отсюда следует, что a(s, /) зависит только от st"1: a(s, t) = a(st~1), и уравнение (8.5) можно теперь записать в сокращенном виде (а): х = ах, (8.6) где а, х, х—элементы алгебры (л) с компонентами a(s), x(s), x(s). Если ограничиться рассмотрением некоторого инва- риантного неприводимого подпространства ф из простран- ства состояний sjy, то элемент х из алгебры (л) лежит в соответствующем р. Те g термов Wlf F2, ..., Wg1 на которые расщепляется (8.4) при возмущении и которые принадлежат рассматриваемой системе термов /, являются в данном приближении теории возмущений собственными числами отображения (8.6) пространства р на себя. Поэ- тому сумма этих термов должна равняться следу этого отображения, или ^ + Г2+...+^ = 2«(5)х(5)- (8-7) Сумма квадратов этих термов, их третьих степеней, и т. д. получается многократным итерированием отображения (а), т. е. ri + ^+... + ^ = 2at(s)x(s), (8.7') S
§8. ХАРАКТЕРЫ СИММЕТРИЧЕСКОЙ ГРУППЫ 391 где ax(s) суть компоненты элемента симметрии а1: a0(s) = l или 0, если соответственно s = I или «т+i (8) = 2 ах (st-1) a (f). [ (8.8) Если известны «энергии обмена» a(s), мы можем приме- нить эту формулу для расчета тех термов, возникающих из (8.4), которые содержатся в системе термов %; для этого нам нужно знать только характер %, а иметь явное выражение для идемпотентной образующей е или пред- ставления I) группы л не обязательно. Эти рассуждения применимы непосредственно, только если мы игнорируем спиновые явления, т. е. если мы учи- тываем возмущение, вызванное взаимодействием электро- нов, а не спином, как- для случая нормального порядка термов, поскольку уже само существование спина озна- чает, что каждая из энергий по крайней мере дву- кратно вырождена. Позднее мы коснемся дальнейших модификаций, вызванных наличием спина и принципом запрета Паули, позволяющим нам отказаться от большин- ства возможных термов. Невозмущенная система V будет иметь, кроме термов типа (8.4), термы, в которых возникают группы двух или более слагаемых с одинаковыми индексами. Кратность терма + /2-^2+ ••• + Мч (fi + /2+ • • • +/v = /) (8-9) с целыми неотрицательными весами f{ равна Коэффициенты x(s) соответствующего тензора полу- чаются из F(ll ...; 22...; ...) перестановками s этих f аргументов. Но перестановка р неэффективна, если она только переставляет первые индексов между собой, следующие/2 между собой и т. д.; мы больше не можем различить перестановки s и ps — их следует рассматривать как порождающие только одну компоненту. Такие перестановки р образуют группу
392 ГЛ. V, СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК •••) порядка =/х!/2-• • •» а две перестанов- ки s, t следует считать одинаковыми, если они являются левоэквивалентными относительно этой подгруппы л', т. е. если ps = t, где р—элемент из л'. В таком случае мы пишем s=/(modn'). Сейчас мы интересуемся только такими элементами х алгебры (л), которые удовлетворяют равенству x(/)=x(s), когда / = §(тос1л'); они образуют линейное подпространство т' == г (л') размер- ности (8.10). Более точно, г'— правоинвариантная под- алгебра, поскольку если s=Z, то также sr = /r. Вместе с тем a(s, /) = я (s/"1), и к тому же a(ps) = a(s), a (sp) = a (s), если р лежит в л'. Рассмотрим теперь в подпространстве г' отображение х^х: х (S) = 26Z(S^1) х (0 (шобл'), (8.11) t где «шобл'» указывает, что и s, и t пробегают полное множество элементов группы, которые неэквивалентны шоб л'. Когда х пробегает г', хе порождает подпростран- ство* из г', которое отображение (8.11) преобразует в себя, и приведение этого отображения, действующего в })', к диагональному виду дает термы, возникающие из (8.9) и лежащие в системе термов %. След элемента (8.11) в ^)' равен следу отображения Ае: х —>х в г', которое по- лучается из (8.11) заменой х на хе, т. е. при замене x(t) выражением 2 X (tr-1) е (г) = 2 X (г) е (г~Ч). Г г Отсюда следует, что tr(Ae)== 2 Ja (s/-1) 2 е (r-10V s, t mod л' ( r==s / Поскольку a(st~1) = a(rt~1), когда r = s(modjt'), этот след можно записать в виде 2 2«(^-1)е(г~1/). /modп' г
§ 8. ХАРАКТЕРЫ СИММЕТРИЧЕСКОЙ ГРУППЫ 393 Естественно, эта сумма не зависит от того конкретного элемента /, который мы случайным образом выбрали из множества элементов группы, эквивалентных mod л'; от- сюда следует, что при снятии ограничения на множество элементов t приведенная выше сумма умножается на по- рядок hr группы л': Г, t S Здесь %(s)—снова характер представления I), как опре- делено выражением (8.3). В частности, размерность под- пространства р , т. е. число термов в системе %, возни- кающих из (8.9), получается заменой элемента симметрии а в (8.12) элементом aQ, определяемым выражением aQ (s) = 1 или 0, в соответствии с тем, что s=I(modn') или нет; следовательно, это число равно 4" Е % (8) S из л' (8.13) Мы выразим полученный результат—справедливость ко- торого не ограничивается группами перестановок — в виде теоремы: Пусть л'—подгруппа группы л порядка h', и пусть р—левоинвариантное подпространство группового прост- ранства г группы л. Рассмотрим элементы к алгебры (л), удовлетворяющие условию х($) = х(/), где s и t—любые два элемента группы л, которые левоэквивалентны mod л'; элементы (л) этого' типа, лежащие в р, образуют линей- ное подпространство, размерность которого дает формула (8.13), где х—характер регулярного представления в р. Сумма термов равна следу (8.12), а сумму их степе- ней дает выражение 2<s) х (s) ‘w... • <8-М> Этот результат отличается от (8.7') только введением зна- менателя /J/J... и тем» чт0 теперь ax(s) определяется
394 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК формулой От+х (s) = 2<Ms^_1) а (0 (mod л'). t Случай вырождения. Обозначим численно различные уровни энергии объекта / через Е', Е", а кратность EW через nv. Теперь мы вводим различие между пере- менными, имеющими одинаковое «главное квантовое число» v, при помощи «вспомогательного квантового числа» kv, которое принимает nv значений. Энергетический уровень типа Е' + Е"+ ...+Е^ (8.15) невозмущенной полной системы Е имеет кратность fln^.. .Пр а соответствующие тензорные коэффициенты получаются из коэффициента вида 2 ... f \ \kl k% ... kf J перестановкой s над f парами аргументов (v|fe); вместо этого мы пишем x(s\kik2.. .kf). или кратко x(sp). Подобным образом коэффициенты матрицы энергий обо- значаются как a(sp^2.. t\l1l2...lf) = a(st"1\k'1 /). Уровни энергии W, возникающие из (8.15) при возмуще- нии и лежащие в системе термов %, в первом приближе- нии определяются выражением 2r*=22aT(s|£; ^)x(s), (8.16) (£) s где a0(s\k] /)=1, если s = I, k = l. и 0 в противном слу- чае, а композиция определяется равенством ят + 1($|&; /) = 2 m)a(t\m\ I). (8.17) t, (m) Если невозмущенный уровень энергии имел вид f'E' + f"E"+... (Г + /"+...=~/),
§ 9. СООТНОШЕНИЕ МЕЖДУ ХАРАКТЕРАМИ 395 то тензорные коэффициенты, которыми мы интересуемся, получаются из коэффициентов вида f(1 1 2 2 •••; •••V \#Ц &12 • • • ’ &21 &22 • • • ’ • • • / Г Г Пусть /j вспомогательных квантовых чисел k 1V (v = 1,. . . . . ., /') имеют определенное значение k19 другие f2 чисел значение k2 и т. д., так, что /1 + /2+• • • =/Л пусть далее /\, f2, .. • имеют аналогичный смысл для квантовых чисел k2V (v = 1, . . /"), соответствующих главному кван- товому числу 2, и т. д. Соответственно те перестановки р, которые не изменяют указанный выше тензорный коэф- фициент, образуют в определенной раньше для невырож- денного случая группе л' некоторую подгруппу л^, зави- сящую от распределения вспомогательных квантовых чисел k\ порядок nk равен [k] = f[lf2\.Компонента /) не изменяется, когда s умножается слева на элемент из n'k и справа на элемент лг'. Формула (8.16) теперь принимает вид = (8-18) k V 1 J s 1 Здесь a0(s|fe; /)=1 когда /г = / и s^I (modл^), и 0 в противном случае, и в правиле (8.17) мы сначала сумми- руем по t (mod л^) и затем по различным возможным наборам m = (mn, т12, т21, ...). В каждом случае мы получаем явные выражения для сумм различных степеней возмущенных уровней энергии через характер % рассматриваемой системы термов и энер- гий обмена a(s). § 9. Соотношение между характерами симметрической группы перестановок и характерами аффинной группы Полное соответствие, существующее между представ- лениями симметрической группы перестановок Лу и пред- ставлениями порядка f линейной группы с, должно приводить к простому соотношению между соответст- вующими характерами. Имея дело с линейной группой,
396 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК достаточно рассмотреть только «главные преобразования» >8fxf (/=1, 2, и) (9.1) векторного пространства поскольку «любое» ли- нейное преобразование сопряжено в группе с с некоторым главным преобразованием — за исключением того случая, когда совпадают два или более характеристических числа. Кроме того, если мы с самого начала ограничиваемся унитарной группой и—группой, которая интересна для физики,— это положение справедливо безо всяких исклю- чений, и 8Z являются комплексными числами, равными единице по абсолютной величине. В отсутствие взаимо- действия между различными объектами и когда отдельная система I невырождена, предложенная здесь задача сов- падает с задачей исследования распределения термов си- стемы If по различным системам термов %, поскольку, если выбрать гейзенбергову систему координат xt в простран- стве состояний системы / (т. е. систему координат, в ко- торой оператор, представляющий энергию /, имеет диаго- нальный вид), за время t у переменной xt появляется о / \ дополнительный множитель --------). Обозначим характеристику *) представления $ линей- ной группы, субстрат которого состоит из всех тензоров вида eF, через X (S) или X (8П 82, ..., 8Л), где элементS группы с есть главное преобразование (9.1). ^Числа 8{ следует .рассматривать как п независимых переменных. Преобразование тензорного^ пространства, соответству- ющее (9.1), заключается в умножении коэффициентов F (i19 i2>..., if) тензора F на произведение е^-8^-... -8^. Сумма всех таких множителей, взятая по всем линейно независимым коэффициентам тензора общего вида F' = eF, и является искомой характеристикой. Компонента, в ко- торой Д аргументов равны 1, Д равны 2, ...» умножается на 811 -822-... • 8fnn. Но число линейно независимых компо- нент тензора F' этого типа, согласно (8.13), равно ММ--- ’ (9-2) *) В дальнейшем для ясности мы предпочитаем пользоваться сло- вом «характеристика» для непрерывных групп, а «характер» — для конечных групп.
§ 9. СООТНОШЕНИЕ МЕЖДУ ХАРАКТЕРАМИ 397 здесь % — характер представления I) группы Лу, причем сумма распространяется на все элементы s группы л' — == л (fn fv • • •), переставляющие первые номеров между собой, следующие f2 между собой и т. д. То, что (9.2) зависит только от характера %, представляет для наших рассуждений наибольшую ценность. Результат вычисления [8] есть Х(еп е2, •••) = ?Е (9-3) где внутренняя сумма распространяется на все элементы s из л(/х, f2, Обозначим значение характера % для элемента s, принадлежащего классу i сопряженных эле- ментов группы Лу, через %(f); тогда нашу формулу можно записать в виде X = E/x(f) Е (9.4) где c/i/a„.(f) — число элементов л(/п f2, ...), принадле- жащих классу f. Это число можно вычислить элементар- ным образом. Распределение перестановок по классам Любая перестановка s является произведением циклов, из которых никакие два не содержат одинакового номера. Например, пятичисленный цикл (1 3 7 2 4) является пере- становкой, которая превращает 1 в 3, 3 в 7, 7 в 2, 2 в 4, а 4 опять в 1; если записать эти 5 цифр с равными интервалами на ободе колеса, то эту перестановку можно рассматривать как поворот колеса на угол 2л/5. В любой заданной перестановке, например 123456789 шшш 34719826 5, (9.5) можно выделить циклы; для этого сначала определяется число (здесь это 3), в которое преобразуется 1, затем число (7), в которое преобразуется 3, и т. д., до тех пор, пока не получится число, которое уже появлялось в цикле; этим числом, конечно, может быть только 1. После выделения первого цикла таким ^же образом можно по- ступить с оставшимися числами, и этот процесс может быть продолжен, пока нужный результат не будет до- стигнут. Перестановка (9.5) выражается через свои 3 цикла
398 ГЛ. V- СИММЕТРИЧЕСКАЯ группа перестановок следующим образом: (1 3 7 2 4) (5 9) (6 8). (9.6) Очевидно, что разложение произвольной перестановки на ее циклы единственно. Этот способ записи перестановки позволяет нам с одного взгляда сказать, являются ли две заданные перестановки сопряженными в Лу или нет, по- скольку элемент, сопряженный (9.6), получается заменой чисел 1, 2, 3, 4, ... этими же числами, взятыми в любом порядке. Класс f, к которому принадлежит элемент $, таким образом, целиком определяется числом циклов и количеством целых чисел, которые эти циклы содержат; в частности, любая перестановка s и ее обращение s’1 принадлежат одному и тому же классу. Обозначим класс f, элементы которого s состоят из 4 циклов с одним но- мером, i2— с двумя, i3—с тремя, ..., через (м243 ...), и тогда %(f) = %(M2 • • •); естественно, что 1 + 2i2 -|- 3/3 -j- ... — f. (9.7) Число К классов равно числу решений уравнения (9.7) с неотрицательными целыми значениями 4, f2, f3, . . . Количество элементов в классе f = (4y3 • • •) равно п (I) = . (9.8) Чтобы показать это, запишем f целых чисел 1, 2, ..., f в каком-нибудь порядке из /! возможных и заключим каждое из первых целых чисел в круглые скобки, затем 2i2 следующих целых чисел разобьем на группы по 2 числа, следующие З13— на группы по 3 числа, ... Полу- ченный таким образом символ следует интерпретировать как выражение перестановки через ее циклы. Каждое из полученных таким путем /! возможных размещений при- водит к определенному элементу s из класса f, и все та- кие элементы должны быть, таким образом, охвачены. Далее мы должны исследовать, как часто одно и то же s встречается среди этих fl размещений. Например, наш пятичленный цикл (1 3 7 2 4) можно также прочитать как (3 7 2 4 1), (7 2 4 1 3) и т. д.: конкретное целое число, с которого мы начинаем, несущественно; такой цикл будет встречаться пять раз. Отсюда следует, что эти Р1 2‘* 3^ . .. размещений, отличающиеся только циклической переста- новкой номеров в каждом цикле, все соответствуют одному
§ 9. СООТНОШЕНИЕ МЕЖДУ ХАРАКТЕРАМИ 399 и тому же s. Кроме того, одночленных циклов могут быть записаны в любом порядке, 12 двучленных — в лю- бом порядке, и т. д. и все эти . размещений при- водят к одному и тому же элементу s. Поэтому каждый элемент встречается в точности 14J2l'*i2! ... раз, а полное число элементов в классе, следовательно, дает выраже- ние (9.8). Мы должны также определить число элементов из класса f, содержащихся в подгруппе л(/х, /2, ...). С этой целью мы разбиваем числа от 1 до f на участки длины /х, /2, ... и рассматриваем только те перестановки s, ко- торые переставляют числа первого участка между собой, числа второго — между собой и т. д. При разделении s на циклы, как описано выше, некоторые из циклов будут содержаться в первом участке, т. е. будут состоять только из номеров, принадлежащих первому участку, некоторые будут содержаться во втором участке и т. д., и ни один цикл не будет содержать номера, принадлежащие различ- ным участкам. Если обозначить число одночленных цик- лов, содержащихся в первом участке, через Zxx, число двучленных циклов в этом участке через г12 и т. д., то с необходимостью 111г -|- 2/12 -|- 3/13 + ... — Л; число перестановок ряда 1, 2, ..., /, удовлетворяющих этому условию, в силу (9.8) равно ___111—._____!_____ /9 9) Если продолжить этот процесс аналогичным образом для 2-го, 3-го и т. п. участков, число перестановок в n(j\f2...), удовлетворяющих всем нашим требованиям, дает произве- дение чисел вида (9.9) для всех различных участков. Но такой элемент является элементом класса f = (М2...) тогда и только тогда, когда 2 ~ ^*1» 2U=4, • ••> (9.10) ос а отсюда следует, что
400 ГЛ V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК где сумма берется по различным решениям уравнений (9.10) и 2vflv=/i, 2vi*2v=/2> ••• V V Следовательно, внутренняя сумма в (9.4) равна причем единственным ограничением на сумму являются условия (9.10). Пусть ai — ei 4"е2 4" • • • 4~ а2 = е? + еИ...+^ Наши результаты можно полностью выразить на языке этих сумм степеней. Действительно, в силу теоремы о раз- ложении степени п-члена, где на переменные /а1, /а2, ..., по которым осуществляется суммирование, налагаются ограничения (9.10). Таким обра- зом, мы получаем, наконец, простую форму 8. Х(^2 7й ... h!Z2! ... . (9.11) До сих пор мы использовали только элементарную связь между группами лис. Если теперь мы допустим, что числовое поле, над которым определяются наши алгебры, является алгебраически замкнутым и для определенности является множеством всех комплексных чисел, то прими- тивные характеры конечной группы л будут обладать
§ 10. ПРЯМОЕ ПРОИЗВЕДЕНИЕ. ПОДГРУППЫ 401 свойствами ортогональности 2«(f)x(f)x(f-1) = ^ t S«(f)x(f)x'(i_1)=o (х^х')- Г Более того, число примитивных характеров равно числу классов К. Приведенные выше соотношения утверждают, что матрица из этих % (f), где % пробегает все множество примитивных характеров, a f — все классы, имеют обрат- ную матрицу Отсюда следует также, что х 7 Sx(f')X(M = 0 при JVf. X На самом деле это просто альтернативная форма теоремы полноты. В случае симметрической группы перестановок Лу мы имеем f~1 = f, а порядок h = f\. Умножив выражение (9.11) для примитивного харак- тера X на % ...) и просуммировав по всем примитив- ным характерам % группы лу, мы с помощью установлен- ных выше результатов получаем важную формулу ol'o1/ ... = 2 X ОЛ • • •) X (е15 е2, . . ., е„) X , (9.12) где % и X суть характеры соответствующих неприводимых представлений Лу и сл. § 10. Прямое произведение. Подгруппы Программа. Если два атома или иона с /х, /2 электро- нами соответственно сближаются, чтобы образовать моле- кулу, мы можем в первом приближении пренебрегать их взаимодействием, пока расстояние между атомами относи- тельно велико. В таком приближении эти две системы электронов являются динамически различными, поскольку на электроны каждого атома действуют только ядра и остальные электроны того же самого атома. Поэтому сим-
402 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК метрия описывается подгруппой л' симметрической группы л = лу для / = предметов, в которой первые Д пред- метов переставляются между собой, а последние /2—между собой. Подобная ситуация возникает также в случае, когда молекулу образуют три или более атомов. Эти рассужде- ния сразу же подсказывают следующие задачи. I. Теорию, развитую в §§ 2—4, надо расширить на случай, когда симметрическая группа перестановок заме- няется на какую-нибудь произвольную группу перестано- вок л'. Естественно, к новой ситуации можно приспособить определение симметрического преобразования в тензорном пространстве: нам потребуется только, чтобы коэффициенты a(i1 ... if, . kf) из (1.2) оставались неизменными при произвольной перестановке, принадлежащей группе л', над подындексами 1, 2, ...,/. Мы говорим, что эти преобра- зования являются симметрическими относительно л'; они образуют алгебру 2' более общего вида, чем 2. Все предыдущие выводы справедливы для произвольной группы перестановок л', что немедленно разрешает этот вопрос. Здесь л' рассматривается как самостоятельная группа, а не как подгруппа симметрической группы. II. Пусть множество целых чисел от 1 до f разбивается на два или более подмножества. Рассмотрим в качестве примера случай двух подмножеств: «красные» числа рас- полагаются от 1 до fj и «зеленые» числа — от 1 до /2; = Пусть л' состоит из всех перестановок красных между собой и зеленых между собой. Отсюда следует, что перестановка s' = (s!, s2) из л' состоит из перестановки красных чисел и перестановки s2 зеленых чисел; таким образом, л' есть прямое произведение лгх л2 симметрической группы лг перестановок предметов и л2 перестановок /2 предметов. Или наоборот, это прямое произведение — абст- рактное определение которого не имеет никакого отноше- ния к группе перестановок f предметов—можно рассмат- ривать как подгруппу л' симметрической группы для f — предметов, если образовать одно множество, раз- местив наши множества окрашенных элементов, на которые действуют перестановки групп лт, л2, друг за другом. Однако в этом пункте нас интересует следующая задача (которую можно поставить для любой конечной группы): исследовать свойства группы лгхл2, являющейся прямым произведением двух конечных групп лп л2. III. Чтобы исследовать структуру молекул, мы в конеч- ном итоге должны учесть взаимодействие различных атомов
§ 10. ПРЯМОЕ ПРОИЗВЕДЕНИЕ. ПОДГРУППЫ 403 или ионов, содержащихся в молекуле. Это означает, что в конце концов мы должны вернуться от подгруппы л' к полной симметрической группе л, т. е. нам нужно изу- чить отношения, существующие между группой л и ее подгруппой л'. Здесь опять задача не ограничивается группами перестановок. Прямое произведение. Пусть лп л2—две конечные группы порядков /\, f2 соответственно. Элементами прямого произведения л = лгхл2 являются пары (sn s2), состоящие из элемента группы лх и элемента $2 группы л2. Элемен- том групповой алгебры группы л является соответственно функция x(sx, s2), и отсюда следует, что алгебра группы л есть произведение алгебр (лх) и (л2): (л) = (лО X (л2) в смысле х -умножения векторных пространств, введенного в гл. II, § 10. Элемент xt: x1(s1) из (лх) и элемент х2: x2(s2) из (л2) порождают элемент х = х± х х2 из (л), компо- ненты которого определяются в виде x(slt s2) = x1(s1)-x2(s2). Действительно, для любых двух заданных алгебр рх, р2 можно построить их прямое произведение p = pjXp2, и умножение в р определяется формулой (а, х а2) х Ь2) = (а^ х а2&2), независимо от того, являются они групповыми алгебрами или нет. Если ра—линейное подпространство из га = ра (а = = 1, 2), то элемент х: x(slf s2) из (л) лежит в |) = |>1Х|)2 тогда и только тогда, когда он принадлежит если его считать функцией при фиксированном s2, и принадле- жит р2, если фиксируется sf, действительно, любой элемент этого вида можно представить как линейную комбинацию произведений вида а1ха2, где лежит в {ц, а2 лежит в £2. Если ра (а=1, 2) есть инвариантное подпространство из та, порожденное идемпотентным элементом и в то же время является пространством представления алгебры ра, которое индуцируется в регулярным представлением, то р также инвариантно, имеет производящий идемпотент- ный элемент e = eiXe2 и является субстратом представле- ния Ijj X §2 алгебры р. Очевидно, что эквивалентности £1 ~ ~ & означают эквивалентность pi х р2 ~ & х
404 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Предположим, что два рассмотренных выше подпрост- ранства ра, кроме того, неприводимы относительно своих алгебр ра; тогда возникает вопрос, неприводимо ли^хрз (относительно р) и является ли р^^хрз эквивалентным ^,==^1Х|)2 (К неприводимы), при условии, что р2~£2. Подпространства р и р' не эквивалентны, если ехе' = 0 тождественно по х, т. е. если подпространство, состоящее из элементов характера (е, е'), содержит только элемент 0; здесь е = е1хе2, e'=eiXe2. Тогда формула (ех х е2) (хг х х2) (е[ х е2) = егх& х е2х2е2 непосредственно показывает, что подпространство (е, е') является прямым произведением двух подпространств (en Ci) и (е2, е2) и может быть просто нулем только при условии, что одно из этих подпространств состоит лишь из нулей, т. е. только если рг не эквивалентно или р2 неэквивалентно р2. Таким образом, можно ответить утвер- дительно на наш второй вопрос, причем независимо от природы поля, на котором определяются алгебры. На первый вопрос в гл. III, §9 был дан утвердитель- ный ответ для единственного физически интересного слу- чая, т. е. случая алгебраически замкнутого поля. Если нас больше интересует приведение алгебры, чем ее представле- ния, можно рассуждать следующим образом. Алгебра эле- ментов характера (е, е) является прямым произведением поля (алгебры с делением) Фх элементов характера (еп ег) из Pi и поля Ф2 характера (е2, е2) из р2. В предположении алгебраической замкнутости первоначального поля все элементы поля Фа являются кратными еа и, следовательно, все элементы алгебры р характера (е, е) кратны е. Это доказывает неприводимость |ЬХр2. Однако, если первона- чальное поле, над которым определяются алгебры, не является алгебраически замкнутым, наше утверждение правильно только при условии, что прямое произведение ФХХФ2 двух полей—снова поле, а это отнюдь не всегда имеет место. Но в любом случае вопрос о природе пря- мого произведения алгебр, как и вопрос о структуре алгебры в § 7, сводится к аналогичной задаче для полей (алгебр с делением). Если снова фундаментальным полем является множество всех комплексных чисел, полное приведение 12=2^’ i k
§ 10. ПРЯМОЕ ПРОИЗВЕДЕНИЕ. ПОДГРУППЫ 405 к неприводимым инвариантным подпространствам ра имеет следствием, согласно вышеизложенному, приведение т = = х т2 к инвариантным неприводимым подпространствам Подгруппы. Пусть л'—подгруппа заданной конечной группы л. Элемент х' алгебры г' = р' = (л') группы л' состоит из компонент х' (s'), соответствующих различным элементам s' из л'. Однако такой элемент можно (и в последующем так и будет) рассматривать в то же самое время как элемент алгебры р = (л); для этого нужно только определить как нули компоненты х' (s), соответствующие элементам s из л, которые не включаются в л'. Это никоим образом не нарушает сложениями умножения элементов из (л') друг с другом или их умножения на произвольные числа из поля. Элемент х из (л) «принадлежит» л' или «лежит» в (л') тогда и только тогда, когда равны нулю все компоненты x(s), соответствующие элементам s из группы, которые не лежат в л'. Неприводимое инвариантное подпространство р' из г' порождается примитивным идемпотентным элементом е' и является субстратом представления Г)' группы л', индуци- рованного в р' регулярным представлением. После приве- дения модуля 1 из л' к независимым примитивным идем- потентным элементам g' 1=2*;+... (ю.1) i — 1 появится определенное число, скажем, g', элементов е-, эквивалентных е'\ все подпространства р-, которые они порождают, эквивалентны р', и следовательно, регулярное представление группы n'g' раз содержит 1)'. Эквивалентные слагаемые складываются вместе в такие частичные суммы. Однако, если элемент е' рассматривать как элемент пол- ной алгебры р —(л), то он, вообще говоря, приводит к независимым примитивным идемпотентным элементам ь *'=2^+--- (10.2) сс= 1 Здесь снова эквивалентные слагаемые справа собираются в частичные суммы; пусть еа в первой такой частичной сумме порождает представление I) группы л (в дальнейшем мы будем интересоваться только им). Пусть подпрост- ранство р с производящей единицей е является представи-
406 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК телем семейства подпространств £а, порожденных элемен- тами еа. Элементы алгебры (я) вида хе' образуют инвари- антное подпространство <р'>, которое является субстратом представления <!)'> группы л, индуцированного в р' регу- лярным представлением группы л. Наша формула утверж- дает, что в разложении <!)'> на его неприводимые состав- ляющие представление I) встречается в точности b раз. Чтобы найти простой способ описания элементов из <р'>, разобьем группу л на множества групповых элементов, эквивалентных шобл'; при этом tz-й класс состоит из групповых элементов ous', где s' пробегает подгруппу л'. В этом случае элемент х алгебры (л) имеет компоненты x(<ras'); числа x(aus') можно, при фиксированном и, рас- сматривать как компоненты элемента хи алгебры (л'), так что х можно рассматривать как систему элементов х«, принадлежащих алгебре (л'). Тогда формула у = хе' переписывается как равенство у'и — х'ие' в (л'): отсюда сле- дует, что х принадлежит <р'> тогда и только тогда, когда все конкретные элементы х’и лежат в Таким образом, отображение х —> у = ах можно переписать в виде z/(cas') = S 5 v V из л' или У и = 2 G'uvXv^ v где a'uv —элемент алгебры (л'), определенный формулой a'uv (s') = a(o„s'aa1). Следовательно, представление <!)'> можно построить сле- дующим образом: сначала элементу а из (л) ставим в соответствие матрицу ||а^||, коэффициентами которой являются не числа, а элементы алгебры (л'), и затем каждый элемент a'uv заменяем матрицей A'uv, соответствую- щей ему в представлении группы л'. Как мы видели в предыдущей части этой главы, такие представления получаются с помощью двойного разложения Пирса; поэтому мы рассмотрим элементы х~е'хе' харак- тера (е', е'). Идемпотентные элементы еа, ..., возникающие в (10.2), суть элементы этого характера, и такой элемент х
§ ю. прямое произведение, подгруппы 407 можно выразить через его компоненты в виде х= 2 еахе&+... (10.3) а, |3= 1 Здесь мы повторим анализ § 7 для нашего более узкого множества элементов: пусть Га — взаимно однозначное отображение подобия ра на р, и пусть элемент, в который отображение Г^Гр1 переводит элемент еа, обозначается через еа$ *). Если поле, над которым определяются алгебры, алгебраически замкнуто,— а мы это здесь предполагаем,— то элемент еахе^ должен быть произведением ха3 на еа13. Следовательно, вместо (10.3) мы получаем приведение X = 2 + • • • ( 10.4) (где хаР—числа) и соответственно семейство представлений х->||хаЭ||, ... (10.4') Если теперь х лежит, например, в (л'), то х = е'хе' и является численно кратным (10.2); следовательно, мат- рица ||хар||, соответствующая такому элементу, является кратной [единичной матрице.— Таким образом, порядок векового уравнения, решения которого определяют собст- венные числа, уменьшается от g до b для элемента х характера (е', е'). Теперь мы перейдем к исследованию причины этого факта. Пусть Г:-1 — взаимно однозначное отображение подобия р' на $ (Z—1,2,..., g'), и пусть Ь-— элемент, в который оно переводит е'. Рассматривая произвольный элемент х групповой алгебры группы л как систему элементов х'и, мы видим, что соответствие хе' —xb't является взаимно однозначным, обратимым и подобным отображением <У> на <$>: проекция Г- пространства $ на р приводит к возникновению проекции <pt'> на <р'>. Эта проекция связывает с разложением <р'> на неприво- димые инвариантные подпространства разложение того же типа подпространства <$>; в соответствии с равенством *) Здесь,— как и в § 7, но в противоречии с нашими обычными обозначениями,— произведение двух или более отображений следует читать справа налево.
408 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК (10.2), мы получаем уравнения ь е;=2 еа1\- ••• (10-5) а= 1 Комбинируя (10.1) и (10.5), получаем разложение модуля 1 на независимые примитивные идемпотентные элементы алгебры (л). Представим себе, что частичные суммы i модуля 1 и их приведения (10.5) записаны одни над дру- гими. Тогда каждая строка связывается с определенным представлением If группы л', и каждый столбец в правой части, членами которого являются суммы вида связывается с определенным представлением f) группы л. Соберем теперь вместе все слагаемые встречающиеся в первом столбце справа, т. е. все те элементы которые эквивалентны е. Тогда множество индексов J разбивается на подмножества, каждое из которых соответствует одному из неэквивалентных, неприводимых представлений I)', ... группы л'; первое из этих подмножеств, соответствующее I)', состоит из bgf двойных индексов ai. Пусть проекция подобия Г^-1 пространства $ на переводит е\ в Если х'—элемент из (л'), то из равенства х’=2 e'ix'ek+• • • i, k следует разложение х' = 2^;fe+ ••• (10.6) i, k с числовыми коэффициентами x'ik и соответствие х' —> —является представлением (Частичные суммы лучше писать не в строку, а друг над другом.) Отобра- жение можно рассматривать как преобразование подобия <р-> на <р'>, и, следовательно, в нем содержится анало- гичное преобразование подпространства раг на ра. Таким образом, произведение ГгТа дает отображение подобия на Пусть Г7—фиксированное взаимно однозначное отображение подобия на р, и пусть отображение подо- бия ГуГ^1 пространства на переводит ед в ej-K. Мы вправе рассматривать отображение ГгТа как отображение Г7 для индекса J = и поступить подобным образом для остальных подмножеств. Применив отображение ГТ^ 1 =
§ 10. ПРЯМОЕ ПРОИЗВЕДЕНИЕ. ПОДГРУППЫ 409 = Г\Та (Г^Га)-1 к уравнению (10.5), получаем ъ k = 2 + • • • (Ю-7) а= 1 Тогда равенство X — 2 eJxeK + • • • = 2 Xjk^J; /<+••• (10-8) J, К J, к определяет представления I): . В силу (10.6) и (10.7) матрицей, соответствующей эле- менту х алгебры (л'), является матрица %ai; |3/г = ^a^ik > %JK = где два индекса J и Д’. принадлежат различным подмно- жествам. Но это означает, что после сужения л по л' представление I) является приводимым к неприводимым представлениям I)', ... группы л', причем I)' появляется точно b раз. Таким образом, мы получили конструктивное доказательство теоремы [9]: Первая теорема взаимности (для произвольных групп). Если представление <!)'> содержит представление I) группы л точно b раз, то после сужения группы л до подгруппы п представление I) содержит представление группы п точно Ь раз. Если подгруппа л' состоит только из единичного эле- мента 1, эта теорема сводится к полученному нами раньше результату: число раз, с которым неприводимое представ- ление появляется в регулярном представлении, равно его размерности. И полная теорема, и этот частный случай основываются на предположении, что поле, над которым определяется алгебра, алгебраически замкнуто. Связь с классами симметрии тензоров. Мы применим результаты нашего исследования по п. III программы к симметрической группе л и воспользуемся описанной в п. I связью как для группы л, так и для ее подгруппы л'. Неприводимое подпространство из (л) определяет класс симметрии $ = тензоров; пусть соответствующими пред- ставлениями группы л и линейной группы с будут I) и Неприводимое инвариантное подпространство из (л') определяет класс симметрии тензоров инвариантный относительно более широкой алгебры 2' всех преобразо- ваний, симметричных относительно л'; такой неприво-
410 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК дим. Если е' — производящая единица подпространства р', то класс состоит из всех тензоров вида e'F; но это эквивалентно тому, что элемент симметрии F из (л) при- надлежит <р'>. Отсюда следует, что приведение к не- приводимым инвариантным подпространствам относительно суженной алгебры S соответствует приведению <р'>. Пусть есть такое представление л', индуцированное в р' регу- лярным представлением группы л', а ф'—такое представ- ление группы с, субстрат которого состоит из всех тензоров в классе симметрии ф'. Тогда наша общая теорема — или даже обратная к ней теорема, справедливость которой следует прямо из самой теоремы,— позволяет нам сфор- мулировать Вторую теорему взаимности (применима только к груп- пам перестановок). Если неприводимое представление I) группы л содержит неприводимое представление группы я' точно b раз, и если его рассматривать как представление подгруппы л', то, наоборот, представление группы с содержит представление $ точно b раз. В заключение мы в качестве подгруппы л' выбираем группу Л!хл2, как и в п. II программы. Тогда р' можно всегда взять в виде рх х р2, а неприводимое инвариантное подпространство ра алгебры (ла) определяет класс симмет- рии тензоров порядка fa (а=1, 2). Обозначим соот- ветствующие представления групп ла и с через 1)а и $а. Класс , соответствующий пространству р' = рх х р2, состоит из всех тензоров порядка f = f±-\- удовлетво- ряющих условиям симметрии по их первым f± индексам и условиям симметрии $$2 по последним f2, т. е. х $$2. Наша теорема теперь превращается в Третью теорему взаимности (для групп перестановок). Если после сужения группы л до подгруппы тС = ‘л>1'Х.п2 неприводимое представление I) группы л содержит пред- ставление 1ц X ^2 группы п' точно b раз (1)а — неприводимое представление ла), то, наоборот, представление <£цх$2 группы с содержит представление § точно b раз. § 11. Теория возмущений и образование молекул Вернемся к исследованию физической системы Л, состоя- щей из f электронов или каких-либо тождественных объек- тов /. До тех пор, пока мы игнорируем взаимодействие между объектами, мы получаем, среди прочего, /!-кратные энерге- тические уровни Е вида (8.4). Рассмотрим, например, слу-
§11. ТЁОРИЯ ВОЗМУЩЕНИЙ И ОБРАЗОВАНИЕ МОЛЕКУЛ 4Ц чай, когда суть различные простые уровни отдельного объекта I. Чтобы проследить за расщеплением уровня £, обусловленным взаимодействием электронов в приближении теории возмущений, нам нужно сначала определить эле- менты а групповой алгебры группы л, компоненты a(s) которых являются энергиями обмена, и преобразовать матрицы, соответствующие этим элементам а в различных неприводимых представлениях группы л, к диагональному виду с помощью подходящей замены координат (§ 8). Теперь мы допустим, что наиболее важными энергиями обмена a(s) являются те, которые принадлежат переста- новкам s из определенной подгруппы л' группы л; все другие предполагаются малыми по сравнению с ними (так называемые «величины 2-го порядка»). Наша процедура разбивается на два этапа,. в духе выполненного в преды- дущем параграфе исследования подгрупп. Пусть а' обоз- начает тот элемент алгебры (л'), который определяется равенством a' = или О, в зависимости от того, является ли s элементом под- группы л' или нет, и пусть матрицы, соответствующие элементу а' в неприводимых представлениях Ij' группы л', приведены к главным осям; тогда = O (/#=&), е-а'е'^М^е-. Если пренебречь возмущениями 2-го порядка, то собст- венные числа W t представляют собой уровни энергии; мы предполагаем, что все они различны. Для того чтобы исследовать дальнейшее расщепление такого терма W = Wt под действием возмущения 2-го порядка, нам нужно, согласно теории возмущений, рассмотреть только ту часть а* = е'ае' элемента а, которая имеет характер (е', е') (здесь мы написали е' вместо е^). Этот терм дает b термов 1Га, ко- торые принадлежат классу симметрии /, соответствующему неприводимому представлению I) группы л; величины этих термов являются собственными числами матрицы ||Яар||» которая связана с элементом а* = е'ае' подобно (10.4). Все алгебраические объекты, появляющиеся в этих рассужде- ниях, являются вещественными, а следовательно, соот- ветствующие им матрицы эрмитовы.
412 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Применим описанную процедуру к процессу построе- ния молекул из составляющих атомов [10]. В качестве примера рассмотрим два атома, соединяющиеся в моле- кулу, причем один из них содержит Д, а другой — /2 электронов; / = Пусть два неподвижных ядра находятся на расстоянии d друг от друга, которое велико по сравнению с линейными размерами атомов; попробуем определить энергию их взаимодействия как функцию этого расстояния d. Наша подгруппа л' = л2 состоит из всех перестановок, при которых не происходит обмена электро- нами между атомами; в § 10 мы видели, что тогда можно брать примитивные идемпотентные элементы = ал- гебры (л') в виде eYxe2, где е± и е2 принадлежат алгеб- рам (лх) и (л2) соответственно. Пренебрегая взаимодейст- вием между электронами одного и электронами другого атома, мы получаем энергетический терм W, который соответствует состояниям обоих атомов, имеющим опреде- ленную симметрию. Единица е' порождает подпростран- ство = $1Х$2 (тензорного пространства 91^), которое инвариантно относительно всех симметрических преобра- зований; то, что состояние молекулы описывается тензором из этого подпространства означает, что состояние пер- вого атома соответствует элементу из а состояние второго — из $2. Отсюда следует, что после приведения ф', параллельно с приведением </>, к неприводимым инва- риантным подпространствам е'=2еа+..., <У> = 2*><а,+ ---> ^' = 2$<а,+ .... а а а появляется b подпространств $(а), эквивалентных между собой и принадлежащих определенному представлению группы л или определенному классу симметрии термов полной системы. Таким образом, процедура, изложенная в предыдущем параграфе, приводит к термам, которые: (1) возникают благодаря возмущению из данного невоз- мущенного терма (8.4) и (2) связаны с определенной за- данной симметрией состояний %х, %2 и %—двух атомов и молекулы. Естественно, это приведение полного прост- ранства состояний 9V к подпространствам, каждое из ко- торых соответствует определенной симметрии состояния одного^из атомов, взятого в отдельности, и молекулы в целом, не связано тесным образом с приближенным вычислением уровней по теории возмущений; связь между ними появляется только при учете упомянутого выше
$11. ТЕОРИЯ ВОЗМУЩЕНИЙ И ОБРАЗОВАНИЕ МОЛЕКУЛ 413 условия (1), сущность которого заключается в предполо- жении о малости возмущений. Это в некоторой степени беглое рассмотрение картины, возникающей из невозму- щенного терма вида (8.4), в котором энергии Е{ отдель- ного объекта / невырождены, можно без труда распрост- ранить на другие, более сложные типы невозмущенных термов. Эти другие случаи, несомненно, имеют гораздо больший физический интерес; в самом деле, в гл. IV мы видели, что все энергетические уровни атома, за исключе- нием S-термов, обязательно являются вырожденными [И]. Наибольшее значение имеет то обстоятельство, что полная система может находиться в любом одном из не- скольких состояний с симметрией ^3, соответствующей различным энергетическим уровням (т. е. энергиям связи), хотя симметрии состояний составляющих атомов являются заданными. Позже мы покажем, что эти возможности, число которых конечно, и возможности, предсказаннные эмпи- рической теорией валентной связи, совпадают и что, сле- довательно, симметрия состояния атома есть то, что химики называют его валентным состоянием. Возникающую при этом картину нельзя адекватно описать на языке класси- ческих моделей — например, то обстоятельство, что два атома Н, образующие молекулу Н2, могут вести себя таким образом, что возможны состояния молекулы как в пространстве симметричных, так и антисимметричных тензоров порядка 2; причем только в первом случае может возникнуть притяжение, которое свяжет атомы вместе,— второй же всегда приводит к отталкиванию [12]. Энергия связи двух ионов с суммарными остаточными зарядами elf е2, естественно, возникает в основном благодаря куло- новскому потенциалу e^/d (так называемая «ионная связь» или «полярная связь»), но соответствующая энергия для двух нейтральных атомов по большей части возникает из-за взаимодействия «энергий обмена» a (s) электронов этих двух атомов («ковалентная связь» или «гомеополярная связь»). Такое квантово-механическое решение задачи о неполярной связи было впервые дано Ф. Лондоном и В. Гайтлером. При применении теории возмущений в реальных вы- числениях нужно принимать во внимание следующие моменты. Если пренебречь взаимодействием между электро- нами, то каждый электрон подвергается только притяже- нию двух ядер; поэтому нам, быть может, следует начать с собственных чисел Е{ и соответствующих собственных
414 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК функций ^(xyz) такой одноэлектронной задачи. Тогда первое приближение следует получать уже с учетом отталкивания между электронами каждого атома в отдель- ности, вводя таким образом динамическое различие между двумя типами электронов. Эта процедура, естественно, имеет смысл только до тех пор, пока расстояние d между атомами велико по сравнению с их линейными разме- рами а. Но тогда в качестве нашего нулевого приближения разумно принять такое, в котором каждый из электронов подвергается только притяжению его собственного ядра (плюс замкнутой оболочки электронов, которые здесь не учитываются явно). Пусть эта одноэлектронная задача для первого атома имеет собственные значения и соб- ственные функции ф0 и пусть соответствующими величи- нами для второго атома являются Eif, фР. То, что ф,- и фР не могут вместе образовать ортогональную систему (на самом деле они даже не являются линейно независимыми, поскольку уже одни ф,- образуют полную ортогональную систему), приводит к некоторому затруднению. Но если мы обрываем ряд квантовых состояний при конечном п, которое можно выбрать большим, чем наибольшее из воз- можных значений частного d/a для рассматриваемой моле- кулы, то конечная система ф: фп ф2, ..., фп; фг, ф2', ..., фП' функций ф образует почти ортогональную систему; фунда- ментальная метрическая форма Go, коэффициентами кото- рой являются скалярные произведения gik = (Ф/. Фй) = $ Ф/Ф* dV (где i и k пробегают как штрихованные, так и нештрихо- ванные индексы), лишь немного отличается от единичной формы. В самом деле, интеграл (фп фг) имеет порядок величины e~dta. Чтобы это показать, заметим, что если двумя силовыми центрами являются ядра или замкнутые атомные остатки с «единичным» остаточным зарядом, то нормальные состояния атомов описываются выражениями Ф1 = vWe-r/a> Ф1' = -^=5"е",7а’ У ла3 у ла3 где г и г' — расстояния от соответствующих остатков. Подынтегральное выражение в формуле
§11. ТЕОРИЯ ВОЗМУЩЕНИЙ И ОБРАЗОВАНИЕ МОЛЕКУЛ 415 всюду ^e~d‘la. Этот интеграл можно явно вычислить, если ввести биполярные координаты (г, г', ф); в этом случае элемент объема имеет вид г г' dr dr', а а область интегрирования определяется условиями г Д-г' ^d, —d^r — г' ^d. Положив получим оо + 1 М>1, J (p2—p'2)e-^dp' dp = Y -i = -у j (р2—+^ + т) • 1 Для /-электронной задачи мы начнем поэтому с функций (*> у, 2)> i как с некоторых аппроксимаций собственных функций; в этом произведении координатами являются координаты f электронов, a i пробегает значения ily . . ., iff каждое из которых является одним из штрихованных или нештри- хованных индексов от Г до п' или от 1 до п. Фунда- ментальная метрическая форма G = GoxGox ... xG0 имеет своими компонентами скалярные произведения функций Ф(Ч, ^2» • ••, */) и ^2» •••, ^/)» в то время как скалярные произведения ф(1п ..., if) с вектором Яф(&1, в которой оператор Н переводит вектор ф(&х, .... kf), являются компонентами энергии Н, потен- циальная часть которой получается сложением потен- циальных энергий притяжения и отталкивания различных электронов и обоих атомных остатков. Рассмотрим рас- щепление невозмущенного терма £ = (Ех + ... 4- Е^) + (Е^ Е^). Эти компоненты G (4 ... у, kt ... kf) и Н (4 ... kr ... kf), (И. 1)
416 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК в которых индексы f, k определяются перестановками s, t соответственно рядов 1, ..., Г, ..., f'2, имеют вид G (st"1) и Н (st"1). Введем (вещественные) элементы G и И с компонентами G(s) и Н (s). Элементы G и Н в даль- нейшем заменяются на О' и И' с компонентами G (s) и Н (s), если s лежит в л'^л^хл^, и на 0 в противном случае; мы вправе сделать это, поскольку компоненты, соответствующие s и лежащие вне л', очень малы—они имеют относительный порядок e~2dla. Элемент О' есть фактически модуль, тогда как О не является таковым; следовательно, процедуру, применявшуюся ранее, надо видоизменить в следующем (чисто формальном) аспекте. Если повторить наши выкладки, имея в виду, что G больше не является модулем, то в качестве векового уравнения для определения b термов получим выражение | -^ар|“0, (11.2) в котором еве' = 2 + • • •, сф еНе' = 2 Варвар + • • • Оф в обозначениях предыдущего параграфа. Эта процедура уязвима для критики, поскольку, пре- небрегая вторым порядком возмущений по взаимодействию между электронами одного и того же атома, мы в то же время учитываем взаимодействие между двумя атомами, которое рассматриваем как возмущение второго порядка. Следовательно, наши результаты не применимы в пределе d/a-^oo и могут, самое большее, успешно применяться в ^случаях, когда dja значительно больше 1, но все же не1? слишком велико. С другой стороны, мы могли бы начать с предположения, что решение квантовой задачи для отдельных атомов уже известно. Пусть функция фх от координат первых электронов является собственной функцией первого атома, соответствующей энергетическому терму Et (нормированной так, что интеграл от равен единице); она будет принадлежать определенному состоя- нию симметрии первого атома, т. е. существует опреде- ленный вещественный идемпотентный элемент е± из (л^), такой что Аналогично, пусть ф2 является собст- венной функцией второго атома для терма Е2 и обладает соответствующим свойством Если пренебречь
§11. ТЕОРИЯ ВОЗМУЩЕНИЙ И ОБРАЗОВАНИЕ МОЛЕКУЛ 417 взаимодействием между атомами, то функция ф = фгфа является собственной функцией молекулы, состоящей из двух атомов и имеющей энергию Е = Ег + Е2. Элемент е'--=е1хе2 является примитивным идемпотентным элемен- том алгебры л'= лх х л2, и функция ф имеет свойство е'ф = ф. Функции $ф, которые получаются из ф при помощи всего множества /! перестановок s их аргументов, порождают линейное пространство функций (91) конечного числа из- мерений, в котором, естественно, $ф не являются ни ли- нейно независимыми, ни взаимно ортогональными. Теория возмущений требует, чтобы мы нашли все функции <р из (91), такие, что ортогональная проекция Ну на 0R) была бы пропорциональна самой ср; тогда множители про- порциональности суть значения перемещенных термов в первом приближении. Следовательно, мы должны вычис- лить интегралы G (s, /), Н ($, /) от £ф-$ф и £ф-Я($ф) и решить вековое уравнение |XG(s, /) —H(s, 0| = 0. Здесь G и Н зависят только от Z~1s*): G(s, Z) = G(/-1s), H(s, t) = H Это следует из того, что интеграл функции ф-<р остается неизменным при замене ф, у на гф, г<р (г — произвольная перестановка); в силу симметрии оператора Н функция Я($ф) равняется sHty. Пусть G и И—снова элементы алгебры (л) с компонентами G(s), H(s). Они удовлетво- ряют равенствам e'Ge' = G, е'Не' — Н и, следовательно, имеют характер (е', е'). Действительно, мы, например, имеем ф = 2^' *) При сравнении этой формулы с (11.1) следует помнить, что там перестановки s и t действуют на индексы, а не на аргументы; поэтому элементы (11.1) в текущих обозначениях должны иметь вид G(/-1, S-1) и //(/-1, S-1).
418 ГЛ. v- СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК откуда Н (sip) =2е' (г"1)’Н (snip), f а умножив последнее выражение на гр и проинтегрировав, получим H(s) = ^e' (г’1) Н (sr) или Я=/7е'. г Отсюда, кроме того, вытекает, что Н — е'Н и, сле- довательно, в силу вещественности е', получаем —е7/, а поэтому Н=е'Не\ что и утверждалось. Единственными ненулевыми элементами матрицы ||//^||, соответствующей элементу И в представлении Ij, являются (в обозначениях § 10 надо положить e[ = ef) элементы, содержащиеся в квадратной подматрице длины Ь, в кото- рой индексы строк и столбцов J и К имеют вид al. Таким образом, мы приходим непосредственно к вековому урав- нению порядка b. (Наиболее естественный метод решения этого уравнения состоит в нахождении такого линейного преоб- разования, которое переводит эрмитову форму с коэффи- циентами Gap в единичную форму, и в то же самое время приводит ||Яар|| к диагональному виду.) Величина 2^aa a тогда является следом матрицы, принадлежащей Н в пред- ставлении Ij, а именно 2 =.'5 Н (s) % (S). a * Если, в частности, b—lf то рассмотренная выше си- стема симметрии молекулы содержит только один терм, возникающий из невозмущенного терма Е; его величина, согласно полученному выше уравнению, определяется выражением 2^(s)x(s) £ + S'//(s)%(s)^ ( 2°(s)x(s) 1+2Z ° <s) % (s) Штрих в правой части этого равенства означает, что в сум- мировании действуют только те перестановки $, которые не принадлежат л'. Эта формула (11.3) принадлежит Ф. Лондону [13]. Далее будет показано, что в случае
§ 12. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ .419 двухатомных молекул b всегда равно 1; однако нужно ожидать, что при исследовании более сложных молекул найдутся и более высокие значения Ь. Реальная трудность с физической точки зрения состоит, естественно, в полу- чении информации об энергиях обмена Н (s). Однако сле- дует заметить, что нам нужно знать только суммы SGUsr-1) Г Г по различным классам, так как, поскольку %($) — функция7 класса, все слагаемые в (11.3) для элементов одного и того же класса f можно объединить вместе и получить тем. самым указанные выше коэффициенты, умноженные на х (f)~ Эти исследования, пребывающие еще в стадии младен- чества, без сомнения, имеют фундаментальное значение для теоретической химии, ибо ясно, что неполярная связь существует благодаря энергиям обмена. Основываясь на тех же самых принципах, Гейзенберг [объяснил явление ферромагнетизма [14]. § 12. Проблема симметрии в квантовой теории Если учитывать спин, то компоненты вектора x(t/)r представляющего состояние отдельного электрона, имеют два индекса i и г, первый из них относится к спину и пробегает значения от 1 до v, тогда как второй отно- сится к перемещению и пробегает значения от 1 до п. На самом деле v = 2, а п= оо (если мы не ограничиваемся рассмотрением квантовых состояний с фиксированной энер- гией). Соответственно нашим векторным пространством Э? является пространство = Таким образом, состояние системы, содержащей f электронов, теперь должно’ представляться тензором F порядка f в этом пространстве: ^(Mi, i2j2, ..., t/z)— это так называемый «двойной тензор», который, если можно так выразиться, одной ногой (грё- ческие индексы) стоит в пространстве 9?v, а другой (латин- ские индексы) —в J)i„. Такое тензорное пространство вполне- приводимо относительно алгебры всех симметрических: преобразований индексных пар (и’) к неприводимым инва- риантным подпространствам, каждое из которых порож- дается идемпотентным оператором симметрии. Принцип запрета Паули утверждает, что физически реализуется только одно из этих подпространств он автоматически уничтожает физически абсурдное существование кратностей^
420 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК которые нельзя расщепить, и одновременно отрицает суще- ствование абсолютно некомбинирующихся систем термов. Более того, согласно Паули, это является простран- ством всех антисимметричных двойных тензоров. Если игнорировать спиновое возмущение, то это про- странство надо, насколько это возможно, разложить на пространства инвариантные относительно симметри- ческих преобразований специального вида F' (i^.. = - • - kfj'F (irkr. . .iz£z), (12.1) т. e. которые вообще не зависят от греческих индексов; они образуют нашу старую алгебру 2 = Эго переход от к следует выполнять в два этапа. Сначала мы пренебрегаем взаимодействием между спином и перемеще- нием, но допускаем, что перемещения взаимодействуют друг с другом произвольным образом и аналогично — спины друг с другом; тогда мы должны рассматривать только симметрические преобразования вида хх.. (ix.. .у, &x...&z). (12.2) Сами эти преобразования алгебры не образуют, но они принадлежат своей «обертывающей» алгебре Svx состоя- щей из всех преобразований, коэффициенты которых c(ixfx..-i/z; хх£х.. .xzfy) не изменяются, если на две строки ix.. . iz; хх.. .xz грече- ских индексов подействовать одной и той же произвольной перестановкой о, а на две строки латинских индексов — одной и той же произвольной перестановкой s. Тогда на втором этапе следует положить, что у в (12.2) является тождественным отображением. Таким образом, на первом этапе мы просто предполагаем независимость перестановок греческих и латинских индексов, а второй этап состоит в сужении множества перестановок греческих индексов до тождества. Итак, сначала мы вводим элементарный оператор симметрии oxs, который в применении к двой- ному тензору Fподвергает греческие индексы перестановке о, а латинские — перестановке s. Тогда опе- ратор симметрии общего вида является произвольной ли- нейной комбинацией а = 2 а (а> s) (а х $) а. s
$ 12. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 421 таких элементарных операторов; следовательно, мы должны иметь дело с алгеброй рхр элементов х\ компоненты этих элементов являются функциями х(а, $), оба аргумента которых — элементы группы л. Обозначим элемент с ком- понентами F(o, s) — (oxs)F через F; равенство F' = aF (F' — двойной тензор, полученный из F действием опера- тора а) эквивалентно равенству F' = Fa. Группа лхл элементов crxs содержит саму группу л как подгруппу, состоящую из элементов sxs. В рамках первого этапа наша задача равносильна следующей. Пусть / (s) — компо- ненты примитивного идемпотентного элемента алгебры т = = р = (л); положим 1=21 (s)(sxs) S и изучим элементы вида xl в рхр. Они образуют инва- риантное подпространство (rxr)z, которое распадается на неприводимые инвариантные составляющие; например, в случае, когда нужно учитывать принцип Паули, мы имеем / = 7г£А <sxs)' Далее естественно, как нам кажется, представить мо- дуль 1 из алгебры р в виде суммы примитивных незави- симых идемпотентных элементов двумя способами: i=2X 1=2^- (12.3) i j Тогда произвольный элемент х алгебры рхр разлагается на независимые составляющие в соответствии с равенством х = = (12.4) ь / i, j Из §§ 10, 11 мы знаем, что элементы вида xif- образуют неприводимое инвариантное подпространство рассмот- рим в этом свете величины xl = 2 xi jl- i’ i Проекция xу = xl переводит p/7 в определенное инва- риантное подпространство (р/7) из (rxr)z. Поскольку эле- менты х из удовлетворяющие соотношению х/ = 0, образуют инвариантное подпространство пространства р|7, то имеются только две типичные возможности: либо (р7) = 0,
422 ГЛ.- V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК либо рассмотренная проекция х —+ xl отображает тзамно однозначно на (р,у). Пусть сумма (тх T), = S(pf/) (12.5) записана в некотором определенном порядке, так что каж- дый член этой суммы может, в силу его неприводимости, либо содержаться в сумме предшествующих членов, либо быть независимым от этой суммы. Если сохранять только члены, для которых реализуется вторая возможность, то пространство (tX t)z полностью приводится к сумме некото- рых из определенных выше подпространств (pt7); следова- тельно, представление, индуцированное в^(тхг) регуляр- ным представлением группы л XJI, приводится к его непри- водимым составляющим вида !)'Х*Ь Напомним, что этот символ вводится для отображения (a, s)-> U'(o)xU(s)t (12.6) где!)', I)—неприводимые представления о —> (/'(о), s U (s) группы л. Это представление I)' X 5 возникает с некоторой кратностью &(%', %); кратность &(/', %) определяется числом пар ij в разложении (12.5), для которых элементы порождают представление I/, а элементы порождают !). Эти рассуждения являются, конечно, просто повторением доказательства теоремы (6.1) для данного случая. Вернемся теперь к пространству двойных тензоров и рассмотрим подпространство 8, определенное тензорами вида 1F. Это подпространство есть субстрат некоторого представления -2i(2vxS„) алгебры SvxS„, а его полное приведение* дает формула £(SvxS„)= 2 W, хШХ£„) (12.7) X' ,х Эта формула остается верной даже в случае, когда v или п меньше, чем f. Ранее в этой главе мы ввели одновре- менно право- и левоинвариантное подпространство т0 из г как подпространство, состоящее из всех элементов F, кото- рые соответствуют тензорам F в n-мерном векторном про- странстве Если обозначить это пространство г0, зави- сящее от п (и только’для n^f совпадающее с самим г), п ’ v п через г, то вместо гхг следует рассматривать алгебру тхг. V П Однако, если е\ лежит в г, а е,—в г, то многообразие элементов вида х(^хе7) не уменьшается после сужения
§12. ПРОБЛЕМА' СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 423 v п области определения х до тхг, и каждый элемент e*(ez), V п эквивалентный элементу е[ (еД также принадлежит г (г). Это показывает, что формула (12.7) остается верной и при V п сужении пространства ххт до г х г; следует только иметь в виду, что те члены, для которых есть 0-мерное представление, иллюзорны. Теперь мы готовы перейти ко цторому этапу, а именно совершить переход от алгебры Svx2„ к 2 = 2П, взяв в качестве у в выражении (12.2) тождественное отображение. Тогда мы сразу же видим, что представление 2(2) алгебры 2, субстрат которого состоит из двойных тензоров подпространства 2 в смысле уравнения (12.1), является полностью приведенным к его неприводимым составляющим /р, соответствующим различ- ным примитивным характерам % группы л, а именно, S(S)=2"i(x)-'V- X Кратность т(х), с которой встречается представление .£), вычисляется по' формуле • ™(х) = 2М', ХНЛх').' (12.8) X' где Nп (/) — размерность представления <!рп, а сумма берется по всем примитивным- характерам %' группы л. Поэтому, пренебрегая спиновым возмущением, мы получаем тот же тип приведения к некомбинирующим системам термов, что и-раньше, за исключением того, что кратность, первона- чально равнявшаяся размерности g этого %, теперь опре- деляется выражением (12.8). (Спиновое возмущение, при- водит к слабым внутрисистемным комбинациям и, кроме того, расщепляет каждый терм системы % на его т(х) компонент; здесь т(х)— кратность мультиплетной струк- туры. Системы термов х» Для которых т(х) = 0, не воз- никают вообще.) Наша теорема взаимности позволяет нам определить константы Ь. Как упоминалось ранее, группа л содержится в лхл как подгруппа элементов вида sxs; аналогично алгебра р= (л) появляется в рхр как совокупность алгеб- раических элементов вида 2a(s)(5><5)- Элементы xl ал- S гебры р образуют неприводимое инвариантное подпростран- ство pz; пусть неприводимое представление группы л,
424 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК индуцируемое в этом подпространстве регулярным пред- ставлением, обозначается Ijz, а его характер — Z(s). Тогда пространство всех элементов вида xl в рхр образует в обозначениях § 10 подпространство <pz>; это подпро- странство является субстратом представления <^z> алгебры рхр. Представление <Ijz> содержит представление в точности Ь раз; тогда, в силу теоремы взаимности, крат- ность, с которой представление I)' XI) содержит представ- ление I)z, при сужении группы лхл до ее подгруппы л также равна Ь. Далее, это сужение группы л переводит представление (12.6) группы лхл в представление (s, s) —> U' (s)xU (s) группы л. Однако это означает, что &(х', х) ectnb крат- ность, с которой представление Ijz группы л содержится в представлении I)' х I) группы л (без жирного знака умно- жения!). Следовательно, b выражается в виде Ь(х', = {x'(s)x(s)Ms-1)}. (12.9) Таким образом, мы получили общее решение задачи опре- деления кратностей /и(х)« Для примера рассмотрим частные случаи: (1) полной симметрии £ = [Яе-7'] и (2) полной антисимметрии 2 = {917} — случай Паули. В первом случае %(s)=l. Каждому неприводимому представлению х соответствует контрагредиентное представ, ление с характером x(s)==x(s~1)‘> если субстрат первого представления порождается идемпотентным элементом е, то субстрат второго порождается элементом е. Эту ситуа- цию можно описать иначе, а именно: величины х и X являются характерами взаимно контрагредиентных пред- ставлений. (Кстати, x(s"1)==X(s) в случае полной симмет- рической группы л; это равенство, однако, не верно в слу- чае общей группы перестановок, тогда как наша теория целиком справедлива и там.) Теперь равенство (12.9) имеет вид b(x', x) = 9w{x'(s)x(s_1)}- Но в силу ортогональности характеров это среднее зна- чение равно либо 1, либо 0, в зависимости от того, экви- валентно представление х представлению yj или нет. Таким образом, выражение (12.8) для кратности принимает про-
$12. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 425 стую форму /n(x) = ^v (х)- Теорема о том, что представление I) х I) содержит тожде- ственное представление s—»1 только один раз либо не содержит его вовсе, в зависимости от того, эквивалентно I) контрагредиентному If или нет, есть не что иное, как фундаментальная теорема (гл. III, (10.5)), на которой основывалась вся теория представлений. Во втором (антисимметричном) случае мы имеем к (s) == = Ss. Теперь величина X‘(s) = <Vx(s-1) представляет собой характер «дуального» представления If, соответствующего I); если I) порождается идемпотентным элементом е, то !)• порождается идемпотентным e*(s) = == f>se (s"1). Или, коль скоро I): s—U ($), то If: s —> U ($). Выражение для кратности в этом случае имеет вид m(x) = yvv(x*)- (12.10> Если мы обозначим 1-мерное представление s—> б5 через {1}, то из упомянутой выше фундаментальной теоремы сразу же следует, что If х!) содержит представление {1} только один раз или не содержит его вообще, согласно тому, эквивалентны If и 1)* или нет. Уравнение (12.10) является реальной мультиплетной формулой, поскольку именно этот второй случай реализуется в атомной физике. Дополнительные замечания. Для физики имеют значение исследования только двух случаев: (1) случая симметричных и (2) случая антисим- метричных двойных тензоров. Эти исследования можно провести с помощью элементарных методов. Мы вновь будем избегать, насколько это возможно, ограничивающих предположений относительно поля, над которым опреде- ляются алгебры. Методика будет проиллюстрирована на примере случая (1). (12.11) Если е1У е2 суть эквивалентные идемпотентные элементы, то это справедливо и для ех, е2.
426 ГЛ V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Доказательство. Пусть рг отображается на р2 взаимно •однозначным отображением подобия Г: х2 = х1Ь\ здесь b—элемент характера (ег, е2), в который Г переводит Пусть обратное отображение переводит е2 в элемент а, который тогда имеет характер (е2, ej. При этом Г пере- водит а в е2\ поскольку элемент, связанный с а, посред- ством отображения Г, равен ab, то мы имеем e2 = ab. Аналогично, мы находим с помощью Г”1, что е^Ьа. .Мы имеем, таким образом: е2 = а6, ^=5^; е2ае1 = а, е1Ье2 = Ь. Напротив, существование этих уравнений гарантирует, что преобразования ’Являются обратимыми отображениями подобия pt^p2. Т. е. существование этих четырех уравнений означает, что элементы ег и е2 эквивалентны. Нам нужно только «накрыть крышки» на эти уравнения, чтобы заключить, что и е2 также эквивалентны, т. е. переходят в вели- чины х, связанные с каждым из простых х определением x(s) = x(s”x). Мы здесь не предполагали ни примитивно- сти е, ни алгебраической замкнутости поля. (12.12) Инвариантные подпространства р, р, порож- денные элементами е, е, являются субстратами взаимно контрагредиентных представлений. Доказательство. Пусть р состоит из всех элементов хе\ мы вводим, помимо этого левоинвариантного подпростран- ства, правоинвариантное подпространство q, состоящее из всех элементов вида ех. Пусть tr (ху) есть след элементов х и у, которые могут свободно изменяться в р, q соот- ветственно; мы утверждаем, что он является невырожден- ной билинейной формой. Т. е. если tr (ay) = 0 тождест- венно в q, то элемент а из р должен равняться 0, и если ir (xb) = 0 тождественно в р, то элемент b из q должен равняться 0. Действительно, если z — какой-либо произ- вольный элемент и а лежит в р, то az — ae*z = a*ez = ay, где y = ez лежит в q. Поэтому предположение, что ir («t/) = 0 в подпространстве q, означает, что для про- извольного z выполняется равенство tr (az) = 0, откуда
12. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 427 га=0 (см. 4). Аналогично для второго случая получаем tr (xb) — 0. Пусть теперь подпространства р и q снабжены про- извольными системами координат, и пусть координаты х, у равны |2, т)х, т]2, ..., т]л соответственно. Тогда tr (ху) имеет вид tr(x«/)== S Sjz&’V X k) Установленная выше теорема показывает, что g^h и h^g, следовательно, h — g, причем коэффициенты s{k можно рассматривать как коэффициенты несингулярного линейного преобразования. Отсюда, если выбрать соот- ветствующим образом систему координат в пространстве q, то величину tr(xy) можно привести к 'каноническому виду: Fg tr(xy)= 2 i = 1 При этом мы получаем tr (ху) = tr(yx) = tv'i(yr-1 гх). Поэтому одновременная замена х’ = гх, у’^уг"1, которая не выводит из подпространства р, q соответст- венно, оставляет след инвариантным. Эти два преобразо- вания, таким образом, являются контрагредиентными в новых системах координат; отсюда сразу же следует наше утверждение (12.12), если, записать второе из этих уравнений в «крышечной» форме у' — гу и заметить, что у пробегает левоинвариантное подпространство р, порож- денное е, в то время как у пробегает q. После такой «разведки боем» мы применяем использо- ванный прежде метод, несколько видоизмененный, для случая (1), когда z = 7rX(sxs^ S В данном случае мы используем приведение (12.4) только для симметричных элементов х, т. е. элементов, удовле- творяющих уравнениям x(ar, sr) = x(a, s) (12.13}
428 ГЛ. V- СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК для всех г. Тргда нам надо заменить х на xZ; попутно мы замечаем, что элемент хЦе'хе) не является симмет- ричным, что дает нам право умножить его справа на Z. Мы, таким образом, заменяем е'хе на 1(е'хё)1, а не на (e'xe)Z, и, продолжая решение, получаем явное выраже- ние для соответствующего приведения быстрее, чем с по- мощью теоремы взаимности. Компоненты Цехе) (если не учитывать множитель 1//!) принимают вид 2^ (ro)e(rs) 5= е' (га) ~ее' (s~la)- г г Это выражение равно нулю при ее' = 0; а поскольку е' = е, то мы находим, что оно имеет вид е (s”1a) = e(a~;ls). Это означает, что в качестве двух полных приведений (12.3) модуля 1 мы выбираем выражения i i В формуле (12.4) для симметричных x — xl остаются только члены вида x(eixel), а множитель /(^хе,) имеет компо- ненты Так как член х(е{хе() не привелся тож- дественно к 0 при сужении х до области симметричных элементов, то подпространство, которое он здесь порож- дает, остается эквивалентным неприводимому подпро- странству р.-Хр/. Следующий шаг состоит в умножении справа на /, вследствие чего e(a-1s) согласно (8.3) и (7.22) принимает вид j У е (r-^-^r) = % (s^a) = j • 8 (ст-^). Г В итоге мы приходим к выводу, что любой симметричный элемент х может быть приведен согласно формуле х = хе'4-хе"+ ..., где е(а, $) = д-е(a-^s); (12.14) при получении этого результата следует помнить, что кратность, с которой любое неприводимое представление появляется в регулярном, дается его размерностью. Из того факта, что e(s) есть функция класса, следует, что элементы е', е", ... образуют множество независимых идемпотентных элементов в рхр. Этот результат полу- чается прямыми методами и справедлив независимо от
$ 12. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 429 того, является ли поле, в котором мы действуем, алгеб- раически замкнутым или нет. Чтобы показать это, мы заметим, что любой «симметричный» элемент х (о, s) в силу (12.13) зависит только от so-1, т. е. х(о, s) = x(scr-1). Таким образом, существует взаимно однозначное отобра- жение между симметричными элементами рхр, простран- ство которых мы обозначаем через [тх г], и элементами из т. Прямое вычисление показывает, что это отображе- ние сопоставляет с каждым левоинвариантным подпро- странством [ххт] лево- и правоинвариантное подпрост- ранство из т, и наоборот; приведение [ххх] к левоинва- риантным подпространствам, таким образом, соответст- вует приведению х к подпространствам, которые и лево-, и правоинвариантны. Задача в целом, следовательно, гораздо проще для [ххх], чем для самого х; ее решение получается переносом в [тх х] равенства Х — Х&' -|-хе" + ... (7.5) для алгебры р, что и приводит к формуле (12.14). Тем не менее мы должны вернуться к предыдущему менее элементарному анализу, чтобы увидеть (а этот результат предполагает, что поле является алгебраически замкну- тым), что каждое из неприводимых инвариантных под- пространств из [ххх], полученных описанным выше спо- собом, эквивалентно подпространству из алгебры ххх вида рхр (где р и р суть неприводимые инвариантные подпространства из г с производящими единицами е и е). Таким же элементарным образом можно исследовать и полностью антисимметричный случай. Полное приведение многообразия тензоров в 2-мер- ном спиновом пространстве 4iv, v = 2, выполняется при помощи формулы Клебша — Гордана (гл. III, (5.9)). Здесь (су равно ^хбхХ ... х®! (/ сомножителей), где есть собственное представление линейной группы с = с2, а из упомянутой выше формулы следует, что это представле- ние полностью приводится к неприводимым подпростран- ствам где индекс v может принимать только значения /, f—2, f — 4, .... Размерность равна v+L и каж- дой из этих возможных размерностей соответствует только одно неприводимое представление. Тогда из формулы (12.10) следует, что существует только одна система термов, имеющая кратность v 4-1 (= / 4-1, / — 1, / — 3, . . .); сравните это место с началом § 15.
430 ГЛ- V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Без предыдущего анализа, по-видимому, невозможно» полностью понять соотношения, которые возникают, когда мы применяем теорию групп перестановок и не привле- каем приближения теории возмущений. Что касается по- следней, то мы будем действовать следующим образом. Рассмотрим снова терм вида (8.4) для невозмущенной системы, единственным вырождением которого является вырождение из-за тождественности f электронов. Уравне- ние возмущения в этом случае имеет вид /’(Мо ..., (12.15> где a(s)—энергия обмена, а 4...4, . .kf получаются из 1... f перестановками s, t соответственно. Пусть ср — тензор в спин-пространстве, определенный соотношениём i22, i//) = Ф(ЧЧ• • • ^/)> из антисимметрии двойного тензора F следует, что F (iih....= и, если положить a' (s)*=8s-a(s), то (12.15) принимает вид <р==а'ф. (12.16) Задача, таким образом, сводится к задаче нахождения собственных чисел этого линейного отображения в 2-''-мер- ном пространстве ЗД. Пусть ф/(Р)—собственные функции одного электрона. Если возмущение вызывается только кулоновскими силами между различными электронами, то часть матрицы энер- гии aft,... у, относящаяся к возмущению, фор- мируется из суммы членов вида С С ^Z| (Р1) (р/> dV dV J J PaPp 1 /* где a#=p, а числитель есть расстояние между двумя точками Ра и Рр. Из ортогональности ф следует, что этот интеграл может быть ненулевым только в случае, если перестановка s, переводящая систему индексов k в сис- тему i (обе из которых суть перестановки цифр 1,2,..., /), либо тождественна, либо является транспозицией (а0). В этом последнем случае мы находим a^E^^l^^ldvdr.
§ J2. ПРОБЛЕМА СИММЕТРИИ В КВАНТОВОЙ ТЕОРИИ 431 В правой части (12.16) остаются только члены, возни- кающие из s = I и транспозиции s==(aP): Ф= М)-2 (12.17> I (a₽) I Дирак дал замечательную формулу для транспозиции, действующей на спиновый тензор. Пусть <£“ есть спив а-го электрона; тогда величины S“, S$, S“ являются операторами вида действующими на a-й индекс тензора <p(iil£»••*/)• Вычис- лив, в частности, величину (которую, возможно, следует писать как (S^x©2), так как S1 действует только на первый индекс, а @2—только на второй), мы находим, что она представляет собой опе- ратор 12 0 0 1 0 1 —1 2 0 1 1 1 2 —1 1 действующий на первые два индекса, так что все осталь- ные компоненты оказываются равными 0. Отсюда вели- чина 1/2 {l+S1®2} представляет, преобразование фСТ-^ОО). <р(И) —к<р (11); Ф(10) —~ф (01), (01)—» ср (10), т. е. транспозицию первых двух индексов. Энергию (12.17) тогда можно переписать в виде Н = Е~1 Е (12-18) a < 3 Эту формулу можно интерпретировать следующим обра-
432 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК зом: связь между электронами аир отвечает члену — в операторе энергии. Однако постоянная Eq не представляет энергию невозмущенной системы [15]. В. ЯВНОЕ АЛГЕБРАИЧЕСКОЕ ПОСТРОЕНИЕ § 13. Операторы симметрии Юнга Здесь мы дополним развитую выше общую теорию явным алгебраическим построением неприводимых пред- ставлений симметрической группы перестановок = Эта задача, как мы знаем, эквивалентна задаче построе- ния примитивных классов симметрии тензоров порядка f посредством идемпотентных операторов симметрии е; под «примитивным» классом симметрии здесь понимается класс, в котором введение дополнительных условий симметрии не позволяет далее повысить симметрию тензоров—такое дополнительное условие либо воспроизводит все тензоры класса, либо приводит их к 0. Это построение принадле- жит А. Юнгу и Г. Фробениусу [16]; с его помощью мы можем проверить шаг за шагом всю теорию представле- ний группы симметрии явным и элементарным образом. Мы уже знакомились с двумя очень простыми процес- сами, дающими тензор максимальной симметрии: «симмет- ризацией», с помощью которой по тензору F определяется полностью симметричный тензор и «альтернирова- s нием», которое переводит тензор F в Первый из S этих процессов можно легко реализовать следующим образом. Мы разбиваем область определения от 1 до п «переменных» iii2.. -if, от которых зависит общая компо- нента тензора F. .if) (или, что то же, подындексов 1, 2, ..., /), на подмножества длин flt f2, ...; + + • • • -f- Затем мы симметризуем F по индексам каждого из этих подмножеств. Это распределение по под- множествам легко можно представить с помощью «схемы» P = P(fi, fz, •••)> такой, как изо- I I I I | | 1 бражена на рисунке (для схемы Р(7, 5, 4, 4, 1)): в каждом из f квадратиков схемы располагается без повторений одно из f целых чисел —— 1, 2, . .., f. Каждое из указанных —-----------------ранее подмножеств образует гори-
§ 13. ОПЕРАТОРЫ СИММЕТРИИ ЮНГА 433 зонтальную строку в схеме, и различные строки распо- лагаются одна над другой. Отдельные подмножества мож- но расположить в порядке убывания длины: h f2 ; схема тогда будет состоять из неразрывных вертикальных столбцов и неразрывных горизонтальных строк. Те пере- становки р, которые переставляют члены каждой строки между собой, образуют подгруппу (р) группы л по- рядка (обозначенную в § 8 через jx(/1? /2, ...)). Оператор симметрии, описанный выше, применительно к произвольному тензору будет иметь вид р впредь буквой р мы будем обозначать произвольную пе- рестановку, которая не переводит какие-либо числа из одной строки в другую. До сих пор мы не использовали процесса альтерни- рования. Если после симметризации с помощью оператора а мы альтернируем относительно определенных перемен- ных или подындексов 1,2, то мы получим 0 в том случае, если хотя бы два из этих номеров находятся в одной и той же строке, поскольку тензор, полученный при симметризации, симметричен относительно любых двух таких номеров, и результат последующего альтерниро- вания по ним должен быть 0. Для того чтобы избежать такого положения, мы выбираем по одной перемен- ной в каждой из строк и альтернируем по ним; посколь- ку порядок переменных в каждой из строк пока несу- ществен, мы можем поместить эти выбранные переменные в первый столбец. Затем мы, игнорируя первый столбец, продолжаем альтернировать по множеству переменных, полученному при отборе по одной переменной из каждой строки остатка схемы; эти переменные можно теперь сдвинуть во второй столбец. -Процесс продолжается до тех пор, ^пока мы не покроем всю схему; в результате мы симметризовали ее по строчкам с последующим альтер- нированием по столбцам. Пусть q обозначает^произволь- ную перестановку, которая переставляет переменные в каждом столбце между собой; "эти элементы q образуют определенную подгруппу (^) группы л. Альтернирование, описанное выше, состоит в применении оператора сим- метрии
434 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК а процесс в целом сводится к применению результирую- щего оператора с = Ьа = 2 §q qp. Р> q Мы назовем с оператором симметрии Юнга, отно- сящимся к схеме Р. Чтобы получить единственный оператор симметрии с, соответствующий данной схеме Р, мы должны выбрать способ распределения в Р номеров от 1 до п: они будут вводиться таким образом, что при чтении схемы они будут появляться в таком же естественном порядке, как при чтении — страницы книги: 1,2, Если мы за- пишем их в любом другом порядке, скажем, в том, ко- торый получается из стандартной формы при помощи перестановки г, мы получим «сопряженный» элемент сг, который, как явно видно из соотношения между тензо- рами, порожденными этими двумя операторами, связан с с равенством СгГ^= ГС или cr (s) = ^(r~xsr). Поэтому введение г приводит просто к новому имени. С этого момента мы будем иметь дело не с тензорами, а с величинами симметрии, т. е. элементами алгебры (л); мы рассматриваем инвариантное подпространство из г, состоящее из всех элементов вида у = хс, и представление 1)с группы -л, индуцированное в этом подпространстве ре- гулярным представлением. При этом подпространству соответствует класс симметрии всех тензоров вида cF. При замене с на одно из его сопряжений сг мы получаем вместо эквивалентное инвариантное подпространство; в этом смысле порядок, в котором переменные записы- ваются в схеме, совершенно несуществен. Мы предпола- гаем, что неприводимо и что совокупность представле- ний 1)с, соответствующих всем возможным схемам, состав- ляет полную систему неэквивалентных неприводимых представлений группы л. Это предположение основано на том, что полное число схем точно равно числу неэквива- лентных неприводимых представлений. Чтобы показать это, мы заметим, что количество схем равно числу раз- биений f на целые неотрицательные слагаемые + + /2 + ..., которые удовлетворяют условию f2 . Положив fl—= f2—f3 = rit
§ 13. ОПЕРАТОРЫ СИММЕТРИИ ЮНГА 435 мы видим, что это число, в свою очередь, совпадает с числом решений уравнения 1/*1 + 2г24-Зг3+--‘ — / для неотрицательных целых г. Мы уже знаем, что это есть число классов сопряженных элементов в л, и по- этому, в соответствии с общей теорией, оно равно числу неэквивалентных неприводимых представлений группы л. Если размерность п векторного пространства меньше /, то ненулевыми при этом оказываются только классы, которые возникают из схем, содержащих по крайней мере г строк, поскольку, если первый столбец длиннее п, то альтернирование по переменным, стоящим в нем, перево- дит произвольный тензор в 0. Следовательно, в этом случае нам нужны только схемы, полученные из алгебры т0, а не из г, где т0= t? (см. § 2). Количество неэкви- валентных неприводимых инвариантных подпространств, к которым можно привести тензорное пространство соответственно уменьшается до числа разбиений / на п целых слагаемых f = fi + f2+ • • • + L, Для которых Перестановку s=qp, получающуюся композицией пе- рестановки р из (р) и перестановки q из (</), можно, сле- довательно, определить только одним путем. Это прямо следует из замечания, что равенство qp~\ может выпол- няться только при p=I, q = l, так как оно утверждает, что p = q~r принадлежит как (р), так и (</). Компоненты оператора симметрии с поэтому можно описать следую- щим образом: с (s) = 0, если s не принадлежит множеству (q) (р); если же s принадлежит этому множеству, то с($)=±1 согласно тому, дает ли (единственное) разло- жение s=qp четную или нечетную перестановку q. Сейчас мы должны доказать следующие три утверж- дения относительно с: (1) с, по существу, является идемпотентом; или, бо- лее точно, с удовлетворяет равенству у-с, где у — не- нулевой числовой множитель. Более того, у есть целое положительное число и делитель /!. Тогда оператор е = с/у оказывается идемпотентом. (2) Подпространство рс неприводимо и элемент е, вве- денный в (1), примитивен. (3) Различные схемы приводят к неэквивалентным подпространствам
436 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Доказательство этих положений зависит от простой комбинаторной вспомогательной теоремы, которой мы здесь и займемся. Обозначим длины столбцов в схеме Р со стро- ками длин /\, /2, ... через fl, .. а+/2+-.-=л’+/;+..-=л Мы представляем схему Р как вырезку из прямоугольной шахматной доски, содержащую fr горизонтальных строк и Д вертикальных столбцов, а перестановка s действует на f шахматных фигур, занимающих f полей. При* взаим- ной замене строк и столбцов в Р мы получаем двойствен- ную, или транспонированную, схему Р*. Вспомогательная теорема. Перестановка s принадле- жит множеству (qp) тогда и только тогда, когда любые два элемента, находящиеся первоначально в одной и той же строке, не переводятся перестановкой s в один и тот же столбец. Доказательство. Очевидно, что это условие необходимо для того, чтобы s принадлежала (^р). Изменение положе- ния, которое испытывает один из элементов в результате перестановки s, можно выполнить двумя этапами, гори- зонтальным и вертикальным движениями (в этом порядке). Сразу ясно, что горизонтальное движение могло бы пе- ревести элемент в поле первоначальной доски, которое не содержится в схеме Р. Если разложение s = qp воз- можно, то р должно представлять горизонтальное движе- ние, a q—последующее вертикальное движение; ясно, что q и р определяются таким образом однозначно. Далее, если s удовлетворяет условиям, сформулированным в при- веденной выше теореме, то горизонтальное движение ни- когда не сможет передвинуть данные элементы в одинаковый столбец, т. е. на одно и то же поле. Остается только по- казать, что горизонтальное движение никогда не сможет вывести любой элемент за пределы данной схемы, или: те элементы, которые переводятся перестановкой s в стол- бец длины f*, переходят из первых f* строк схемы. Мы делим шахматную доску горизонтально на верхнюю и нижнюю части, причем верхняя состоит из первых f* строк. Элементы, которые переводятся при помощи пере- становки s в первый столбец, по предположению, лежат в /J различных строчках; поэтому имеется по крайней мере (и следовательно, точно) —/* из них, которые пе-
§ 14. НЕПРИВОДИМОСТЬ, ЛИНЕЙНАЯ НЕЗАВИСИМОСТЬ 437 реходят из нижней части доски, а не из первых /* строк. Заметим, что fl—f* есть в точности число полей в первом столбце, которые лежат в нижней части доски. Применив это рассуждение к каждому столбцу последовательно, мы находим, что число элементов, переводимых перестановкой s в те столбцы, которые выступают в нижнюю часть доски, в точности равно числу полей в этой части доски. Таким образом, все элементы в нижней части схемы переводятся в столбцы, длины которых больше /*, и все элементы, переводимые s в столбец длины /*, исходят из верхней части доски. Эта вспомогательная теорема позволяет нам утверждать, что, если s не принадлежит множеству (qp), то существуют два элемента в отдельной строке, которые переходят в тот же самый столбец под действием s. Если и обозначает транспозицию двух элементов в их начальных положениях, a v—их транспозицию в конечных, то su = vs\ здесь и принадлежит (р), a v принадлежит (</). § 14. Неприводимость, линейная независимость, неэквивалентность и полнота Теперь мы рассмотрим операторы симметрии Юнга с, соответствующие различным схемам. Очевидно, c(sp) = c(s), cX<7s) = 6g-c(s), (14.1) где р, q принадлежат, как обычно, подпространствам (р), (ej) соответственно [17]. Теорема (14.2). Любой элемент а из (л), который удовлетворяет уравнениям (14.1): tf(sp) = a(s), a(qs) — dq*a(s), (14.3) кратен с. Чтобы доказать эту теорему, мы сначала заметим, что (14.3) означает если положить а(1) = %, то равенство a (s)»=;X*c (s), которое надо доказать, справедливо очевидным образом для всех групповых элементов s вида рр. Далее мы дол- жны показать, что cz (s) = 0, если s не принадлежит мно- жеству (9р). При таком s существуют транспозиции и
438 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК и V, лежащие в (р) и (q) соответственно, для которых su = vs. Но тогда из (14.3) следует, что a (su) = a (s), a (vs) ~8v-a(s) = — a (s), откуда a (s) = — a (s) или a (s) = 0. Теорема (14.4). Каждый элемент алгебры (л) вида схс кратен с. В общей теории было показано, что данная теорема справедлива в случае, если с является примитивным идем- потентным элементом из (л) и если поле, с которым мы имеем дело, алгебраически замкнуто; здесь мы должны подойти к этому вопросу с противоположной стороны, так как, показав непосредственно, что данное утверждение выполняется для с, мы докажем, что с примитивно. Оче- видно, что любой элемент вида хс удовлетворяет первому из равенств (14.3), а любой элемент вида сх — второму; отсюда любой элемент вида схс обладает обоими свой- ствами и, следовательно, кратен с. Теорема (14.5). сс = ус, где у — положительное целое число, которое делит f\. То, что сс кратно с, следует непосредственно из пре- дыдущей теоремы; следовательно, у есть число вида Т = 2 C(Z) c(f) = 2c(s)-c(s“1). //' = 1 s Пусть подпространство элементов вида хс имеет раз- мерность g. Проекция ху = хс (14.6) отображает любой элемент х на элемент, лежащий в этом подпространстве, и определяется в самом пространстве простым умножением у = ух. Следовательно, след проек- ции есть yg\ чтобы увидеть это, нам нужно только при- способить систему координат группового пространства к подпространству С другой стороны, этот след непо- средственно выводится из (14.6), т. е. из равенства t/(s)=2^(0c(s-i0- t Искомый след есть /!с(1) = /!, отсюда yg = f'-- Отметим значение того факта, что у положительно, т. е. что c(s)r(s“'1) чаще положительно, чем отрицательно!
§ 14. НЕПРИВОДИМОСТЬ, ЛИНЕЙНАЯ НЕЗАВИСИМОСТЬ 439 Элемент е = с!у—идемпотент; поэтому характер пред- ставления индуцированного в р, регулярным представ- лением, равен, согласно (8.3), %(s) = 7Xc(/'”lsr)- (14.7) Мы получаем в качестве побочного следствия вывод: размерность g представления 1)с является делителем fl. Теорема (14.8). Пространство р, неприводимо. Мы уже знаем, что эта теорема является следствием (14.4), но было бы полезно доказать ее непосредственно следующим образом. Пусть е = с!у приводится к двум не- зависимым идемпотентным элементам £i +e2, тогда eer = eve = elf откуда ее^ — е^. Из теоремы (14.4) следует, что любой элемент вида ееге кратен е\ поэтому = Тогда равенство еу^е^ дает для числа % уравнение X2 = Z. Следовательно, либо Х=1, либо Z = т. е. либо ex = e, либо е1 = 0. Мы будем говорить, что схема Р' со строками длины Д, /а» • • • выше, чем схема Р, если первая ненулевая раз- ность f'2—f2, . . . положительна. Теорема (14.9). Если схема Р' выше, чем Р, то с'с = 0. Мы здесь не требуем, чтобы переменные появлялись в схемах Р, Рг в нормальном виде, о котором условились в предыдущем параграфе, т. е. когда при чтении схемы номера появляются в их естественном порядке, как на странице книги. Доказательство основывается на том факте (F), что существуют два номера, находящиеся одно- временно в одной строке схемы Р' и в одном столбце схемы Р. Если v—транспозиция этих номеров, то она принадлежит к группе (//), соответствующей строкам Р', и в то же самое время группе (7), соответствующей столб- цам Р. Отсюда с' (sv) = с (s), с (ys) = — с (s). Заменив vt в равенстве с'с (s) = 2е' (s^-1) с (0 = — 2е' (st-1) с (yt) (14.10) i t
440 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК на Z, мы находим с с (s) = - 2 с' (sZ-1v) с (/) = — 2 с> (s^-1)с (0 = — с'с ($)• t t (14.11) Утверждение (F) очевидно, если первая строка из Р' стала длиннее первой строки из Р, поскольку невозможно распределить f[ номеров в первой строке Р' по различным столбцам из Р, если Если Д = /х и номера первой строки Р' действительно распределяются по различным столбцам Р, то мы можем не учитывать первую строку Р' и /х полей из Р, содержащих те же номера, что и эта строка. Если сдвинуть поля Р вверх, чтобы заполнить пробелы, то Р преобразуется в'схему, которая имеет точно такой же вид, как если бы мы игнорировали первую строку в Р; нам интересно только то, что этот процесс оставляет все элементы в их первоначальном столбце. Доказательство, таким образом, можно завершить мате- матической индукцией—если предположить, что утвержде- ние справедливо для укороченных схем, полученных отбрасыванием первых строк в Р и Р'. Теорема (14.12). Пусть с, с, ... суть операторы сим- метрии Юнга, [соответствующие различным схемам Р, Р',...\ тогда соответствующие подпространства ... линейно независимы. Пусть Р, Р', Р", .. . выстроены в следующем порядке: Р выше, чем Р'; Р' выше, чем Р"; ... Элемент х из = воспроизводится правым умножением на с/у, но, в силу предыдущей теоремы, этот процесс преобразует все эле- менты х' из х" из ... в 0. Предположим, что су- ществует линейная зависимость вида х х х" 4- ... = 0 ; после правого умножения на с мы находим, что х=0 и, следовательно, х'4~х*4- • • • =0. Таким образом, теорема сводится к той же теореме для меньшего множества Р', Р", ..., и доказательство вытекает из математической индукции. Теорема (14.13). Различные схемы Р, Р' приводят к неэквивалентым подпространствам Доказательство выполняется прямым выводом соотно- шений ортогональности. Пусть Р' выше, чем Р. Поскольку при доказательстве теоремы (14.9) мы не требовали, чтобы
§ 14. НЕПРИВОДИМОСТЬ, ЛИНЕЙНАЯ НЕЗАВИСИМОСТЬ 441 цифры в схемах Р и Р' распределялись в одинаковом порядке, то мы можем заменить элемент с с компонентами c(s) «сопряженным» элементом cr-t с компонентами c(rsr~1): 2^' (st"1) c(rtr~1) = O. t Суммирование по г дает 2С (si-1)-Хе (0 = 0. t Если положить % = хс, Х,==Х<?', то эта формула оказы- вается эквивалентной равенству Sx' (s^1)X(O = O. t В частности, 2 х'а-1) % ю=о. t Если бы два подпространства были эквивалентными, то мы имели бы х' (t) = % (t) и, поскольку для симметрической группы х(^"'1) = х(О, тоиз приведенного выше уравнения следовало бы, что 2x2(s) = o. S Но это невозможно, так как в силу (14.7) характер х($) имеет рациональные компоненты, и, в частности, %(1) = Последнее заключение справедливо только, если рас- сматриваемое числовое поле немодулярно; естественно, это ограничение не имеет отношения к физике. Тем не менее, этим создается пробел, который следует устранить, так как остальная часть наших доказательств содержит един- ственное предположение, что fl не есть 0 в рассматривае- мом поле. Из общей теории мы знаем, что имеет место Теорема (14.14). 2 X (5) X (s-1) = /!- S Пробел, упомянутый выше, устраняется прямым до- казательством этой теоремы. Мы должны показать, что 2x(s-1H(s) = l S ИЛИ 2 б (rs-1r-1)e (s) — 1.
442 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК После замены переменной суммирования s на sr, где г фиксировано, это уравнение превращается в равенство 2^ (sr) ^(s^V"1) = 1. (14.15) Г, S Рассмотрим следующую функцию: a(s, s') = 2e(sr)e(s'г~1)’ Г как функция от s она удовлетворяет второму условию (14.3). Но первое из этих условий также выполняется, что можно непосредственно увидеть, заменив г в равенстве a(sp, s') = 2е (spr) е (s'г-1) г другой переменной суммирования р~1г. Отсюда, при по- мощи (14.2), находим a (s, s') = с (s) е (r)е г-1) = с (s) -е (s') = -у с (s) с и поэтому левая часть (14.15), т. е. 2«(s, s-1) = yXc(s)c(s"1)> S ’ S действительно равна 1. Соотношения Sx(s)%' (S^1) = O или fl (14.16) s показывают, что примитивные характеры, полученные с помощью нашего построения из различных схем симмет- рии, линейно независимы, и так как их число равно числу классов сопряженных элементов в группе л, то любую функцию класса можно представить как линейную ком- бинацию характеров %(s). В частности, функция 1 (s), ко- торая есть 1 для s = I и 0 для остальных случаев, должна обладать таким разложением: /!•! (s) = mx(s) + m'x'(s)+• • • (14.17) Умножая на % (s-1) и суммируя по s, мы с помощью со- отношений ортогональности (14.16) получаем уравнение для т: Лх (I) = /!m,
§14. НЕПРИВОДИМОСТЬ, ЛИНЕЙНАЯ НЕЗАВИСИМОСТЬ 443 ИЛИ tn = g . (14.18) Поскольку X(s)=2e(rsr-1) = 2er(s), Г г то уравнение (14.17) дает приведение модуля 1 к прими- тивным идемпотентным элементам ег. Отсюда регулярное представление приводится к неприводимым представлениям §с, соответствующим различным схемам симметрии. Так как /II (s) — характер регулярного представления, то урав- нение (14.18) является прямым подтверждением того факта,—доказанного в общей теории,— что кратность, с которой каждое неприводимое представление появляется в регулярном представлении, равна его размерности. Это завершает наше прямое и элементарное исследование тео- рии представлений симметрической группы. Метод доказательства, примененный при установлении теоремы (14.9), т. е. тот факт, что сс' = 0, если Р' ниже, чем Р, букет теперь использован для ответа на другой вопрос. Пусть а—оператор, введенный в предыдущем па- раграфе, который симметризует по номерам, занимающим строки схемы Р: a (s) == 1 или 0, [в зависимости от того, принадлежит s подгруппе (р) или нет; и пусть номера записаны в ^схеме Р', которая ниже Р, в произвольном порядке. Я утверждаю, что ас' г=0. Су- ществуют два номера, занимающие одинаковую строку в Р и одинаковый столбец в Р'. Если v—транспозиция этих двух номеров, то a (su) = a (s), с' (vs) == — с' (s), и наше утверждение доказывается с помощью (14.10), (14.11) после замены в них с', с на а, с'. Отсюда также следует, что 2 о (s^1) с' (rtr~1) = 0, t т. е. 2«(s^_1)x'(0 = 0 пли 2я(г~1)х'(™) = 0. t г Таким образом, сумма %' (/), распространенная на все элементы t = rs, которые левоэквивалентны smod(p)
444 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК (т. е. г лежит в (р)), равна нулю. В частности, мы имеем 2 %' (s) = 0, причем сумма распространяется на все эле- S менты s из (р); здесь %' — характер, соответствующий схеме Р', которая ниже Р. Применив этот результат к рассуж- дениям в § 8 (в частности, к (8.13) и т. д.), мы находим: Если объект I имеет простые энергетические уровни Elf Е2, ..., то терм + • • • (/1^/2^-/1 + /2+• • • =/) невозмущенной системы If появляется только в тех клас- сах симметрии тензоров, схема которых P' — Ptf^, f2...) не ниже Р = Р (ftf2...). Итак, при обсуждении двухэлектронной задачи мы видели, что термы вида Е± Л-Е2 появлялись как в «анти- симметричных», так и в «симметричных» системах термов, тогда как термы вида 2Ег появляются только в последних. В заключение мы рассмотрим соотношения, существую- щие между двумя двойственными схемами Р и Р* с ге- нераторами с, с* и характерами %, %*. Группа (р), кото- рая переставляет члены каждой строки Р между собой, совпадает с группой (<?*), которая переставляет между собой члены в каждом столбце Р*; аналогично (</) = (р*). Если элемент s~qp лежит в (</р), то элемент s'-1 = p~1q~1 = == <7*р* лежит в (<7*р*) и наоборот; для этих элементов мы можем записать C(s) = 69, c*(s-1) = 6<7. = 6/;. Отсюда, вообще говоря,—даже в случае, если s не лежит в (qp) и, следовательно, s-1 не лежит в (q*p*),— мы имеем c*(s-i) = 6<c(s). Поэтому «двойственные» элементы с, с* связаны друг с другом в точности таким же образом, как «дуальности», введенные в § 12. Далее, ?*=?; x*(s_1)“%*(s) = 8s-x(s); g* = g- Если Р выше Q, то, наоборот, Р* ниже Q*, так как, если мы понижаем Р удалением последнего поля одной из строк Р и прибавлением его в конец последней (более короткой) строки, то один из столбцов в Р повышается за счет последнего (более короткого) столбца; с помощью
§ 15. СПИН И ВАЛЕНТНОСТЬ 445 такого процесса сдвига отдельных полей, при котором не появляется никаких пустот ни в строках, ни в столбцах, Р можно преобразовать в более низкую схему Q (25). § 15. Спин и валентность. Теоретико-групповая классификация атомных спектров Если векторное пространство 91 = Эг2 только двумерно, то к примитивным классам симметрии тензоров порядка f приводят только такие схемы симметрии Р, которые состоят самое большее из двух строк. Первая строка со- держит l+v полей, а вторая I полей; тогда v~f-2Z. Таким образом, схема симметрии Р единственным образом характеризуется числом v, которое мы назовем ее валент- ностью', v может принимать любое из значений /, f—2, f — 4, ... Пусть есть совокупность тензоров вида cF, полученных путем применения оператора симметрии Юнга с, соответствующего схеме Р, к совокупности тензоров F, и пусть есть представление линейной группы, суб- стратом которого является тензорное многообразие В наиболее общем виде тензор порядка /, симметричный как по первой, так и по второй строкам индексов, опре- деляется выражением jxjx ... хjxj (Z +v членов) х 1) х 1? х ... х I) (Z членов), где ? = (%!, х2), = у2) суть два произвольных вектора. Проальтернировав по столбцам, мы находим, что представление линейной группы с = с2 строится на величинах (Х1«/2—х^У x'i'x'y (Г! + г2 = V). Поэтому есть представление линейной группы, обозна- ченное в гл. III, § 5 через Это замечание определяет связь с проблемой симметрии в квантовой механике, с которой мы столкнулись в § 12— при использовании принципа исключения Паули, в кото- ром принимается во внимание существование спина, но не его динамический эффект [18]. Поскольку спиновое
446 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК пространство является двумерным, то из формулы (12.10) следует, что к системе термов приводят только те схемы Р, двойственные к которым Р* состоят самое большее из двух строк, т. е. те Р, которые сами имеют только два столбца. Если же величина v обозначает число полей, на которое первый столбец Р превышает второй, мы называем v ва- лентностью системы термов или соответствующего состоя- ния атома. Кратность системы термов с валентностью v равна v-J-1, и каждой из этих возможных кратностей соответствует только одна система термов, как мы уже это отмечали в § 12 (стр. 429). Ранее (гл. IV) мы назы- вали s = v/2 «спиновым квантовым числом». Тот факт, что наиболее длинный столбец Р не может превышать размерность N векторного пространства 9^, соответствующего переносам электрона, может привести к дальнейшему ограничению на возможные схемы симмет- рии Р. Эта ситуация не может возникнуть, пока мы имеем дело с полным бесконечномерным пространством состояний. С другой стороны, если мы ограничиваемся, например, такими состояниями электрона, которые харак- теризуются фиксированным главным квантовым числом п и фиксированным азимутальным квантовым числом I и которые поэтому образуют (2/4- 1)-мерное подпространство 91 (пГ) в 9?/ — т. е. если мы рассматриваем только те состояния атома, в которых все f электронов вне замкну- того остатка ядра лежат в"г9?(п/),— то размерность N сокращается до 2/4-1. Тогда*/ не может превысить вели- чины 2(2/4-1), и возможные валентности рассматриваемых состояний задаются следующей таблицей: f= 1, 2, з, 4, .. ., 4Z, 4/41, 4/4-2 V 10 10. 2 3 2. 4 . ..0 1 0 .. 2 Эта таблица снова приводит нас к закону альтернации, и, кроме того, показывает, что число возможностей сокра- щается, начиная с середины таблицы. Возможные мульти- плетные числа 2/ -| 1 для термов в этих состояниях превышают v на единицу. Эта «валентность» v, описывающая состояние симметрии системы, как "’показал Ф, Лондон [19], есть в действи-
§ 15. СПИН И ВАЛЕНТНОСТЬ 447 тельности химическая валентность. Мы предположим, что два атома, содержащие Д, /2 электронов соответственно, соединились и образовали молекулу с f = электро- нами. Пусть $Р2 — неприводимые инвариантные под- пространства пространств состояний 91^, 9^2 соответст- венно. Для того чтобы определить, какие состояния симметрии может принимать молекула, первый атом кото- рой находится в состоянии ^х, а второй — в $р2, мы должны полностью привести пространство ^Хх$р2 к его неприво- димым составляющим. Если мы считаем, что такое разло- жение имеет место в векторном пространстве электронного спина, а не в пространстве электронных переносов (под- тверждение чего дается ниже), то задача решается рядом Клебша— Гордана (гл. III, (5.9)); этот ряд показывает нам, что, если валентности состояний симметрии двух атомов обозначить через vlf v2, то результирующие состоя- ния симметрии молекулы имеют валентности y = U!-]-v2, V1 + vi~2, v1 + v2—4, |иг—v2 |.(15.1) Эту ситуацию можно наглядно изобразить симметрии следующим образом. Берем две рии Plt Р2 двух атомов в положениях, указанных в приводимой диаграмме, а за- тем двигаем схему 2 вертикально вверх, одно поле за другим, до тех пор, пока один из двух столбцов составной системы не замкнется; каждый из этих шагов представляет возможную схему симметрии молекулы, в которой v есть число полей, не имеющих пары по горизонтали. Насы- щение валентных связей здесь проявляется как спаривание полей или, выражаясь фи- зическим языком, как насыщение спина электрона в одном из атомов спином элек- трона в другом. Эмпирическая теория ва- лентной связи поэтому имеет довольно глубокий смысл. Мы должны еще доказать правомер- на языке схем схемы симмет- ность использования нами спинового про- странства вместо пространства перено- сов. Пусть представление группы перестановок Лу, соот- ветствующее двухстолбцовой схеме симметрии валент- ности ц, обозначается через двойственное ему I)* состоит только из двух строк. В соответствии с рядом Клебша —
448 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Гордана и третьей теоремой взаимности § 10 в применении к линейной группе с = с2, мы получаем, что при сужении л до подгруппы л' = лх х л2, переставляющей электроны каждого атома в отдельности, представление I)* группы л содержит неприводимое представление X группы л' только один раз или не содержит его вообще, согласно тому, равно ли и одному из значений (15.1) или нет. Из этого сразу же следует, что такой же результат спра- ведлив и для двойственных схем, если приводить после сужения группы л до подгруппы л'. Применяя ту же самую теорему взаимности в обратном направлении для случая, когда с — сп есть линейная группа в п измере- ниях, мы находим, что представление группы с (или алгебры 2) содержит представление только один раз или не содержит его вовсе, в зависимости от того, является ли v одним из значений (15.1) или нет. Приведя к его неприводимым составляющим, мы можем обнаружить, кроме этих простых представлений дру- гие, которые могут встречаться даже более одного раза, однако эти добавочные представления будут соответство- вать схемам симметрии с более чем двумя столбцами и, в силу принципа исключения Паули, не имеют никакого значения для физики. Соответственно число Ь, введенное в § 11, в случае двухатомных молекул не превышает 1. Молекулы, состоящие из большего числа атомов, можно исследовать тем же методом. Так, например, в случае трех молекул с валентностями ux, v3 с помощью ряда Клебша —Гордана можно определить кратность bv, с которой представление встречается при приведении б^хб^Х®^. Те v, для которых Ь„=^0, являются валентностями возможных состояний симметрии молекулы, a b — bv (которые в данном случае могут быть больше 1) являются соответствующими кратностями. Описание кван- товых состояний и состояний симметрии молекулы, сфор- мированной путем объединения трех атомов в заданных квантовых состояниях и состояниях симметрии, требует введения, помимо валентности v, еще одного индекса, опре- деляющего различие между bv возможными энергетиче- скими уровнями. Описание таких возможных вариантов отличается от эмпирической теории валентной связи — набор возможных связей здесь меньше [20]. Классификация спектральных термов. Пусть унитар- ная, или полная линейная, группа cvn в пространстве
§ 15. СПИН И ВАЛЕНТНОСТЬ 449 состояний электрона сужена до группы cvxc„ преоб- разований SvxSn, два сомножителя которых выступают в роли преобразований пространств спина и переносов 9iv, Dt\ соответственно: 9i = &tvx3tn. Пространство pV} антисимметрических тензоров порядка f приводится при этом к неприводимым инвариантным подпространствам относительно алгебры симметрических преобразований вида (12.2). Мы, таким образом, получаем распределе- ние (I) спектральных термов по различным классам сим- метрии; справедливость этого шага носит универсальный характер, и он применим как к молекулам, так и к атомам. Дальнейшая классификация термов, как отмечалось в гл. IV, А, относится к «простым», а не «квантовым» состояниям, т. е. к тем состояниям, которые связаны с пространственным вращением и моментом импульса таким же образом, каким квантовые состояния связаны со смещением во времени и энергией. Естественно, что применение группы вращения b = b3 (элементы которой теперь обозначаются через о, т, ...) справедливо только для атомов (или ионов), ядра которых рассматриваются как фиксированные силовые центры. До тех пор, пока мы имеем дело только с переносом электрона и пренебре- гаем взаимными возмущениями электронов, характери- зуемыми главным и азимутальным квантовыми числами пи/, каждый отдельный терм системы характеризуется квантовыми числами (пх, Zf, п2, /2; ...; nf, lf). Кратность, с которой такой терм появляется в заданной системе симметрии, равна размерности линейного подпространства, в котором лежат рассматриваемые атомные состояния. Расщепление, вызванное взаимными возмущениями, соот- ветствует приведению этого подпространства к его непри- водимым составляющим относительно группы враще- ний i); возникающие компоненты терма имеют естественные кратности 2Е4 1- Спиновое пространство следует привести подобным же образом. Пусть b индуцирует представления I)v: о~>(о) и (&: о—>У(о) в и sJi\ соответственно. Этот второй шаг (II), в котором пространства спина и переноса рассматриваются отдельно, с точки зрения теории групп означает, что мы ставим в соответствие элементу (о, т) из bxb преобразование U (o)xV(t); таким образом, мы получаем шестипараметрическую подгруппу группы cvxc„, и после сужения cvxczz на эту подгруппу наше первоначально неприводимое подпространство далее пол- ностью приводится к неприводимым составляющим. В этом
450 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК подпространстве индуцируется неприводимое представле- ние bxb типа Последний шаг (III) состоит в введении связи о = шестипараметрическая подгруппа, таким образом, сужается до трехпараметрической под- группы, т. е. подгруппы, индуцированной в полном про- странстве состояний системы вращениями Ь. Спиновое возмущение в этом случае расщепляет каждый такой терм — мультиплет на его (самое большее 2s 4-1) ком- поненты: = = l + s—1, |Z—s|); i естественно, что ®5x®z здесь есть представление группы b, а не bxb. В действительности v = 2, и преобразования, индуци- рованные в спиновом пространстве 9t2 группой вращений, образуют унитарную группу в двух измерениях. Следо- вательно, при переходе от cv к на шаге (II) никакого приведения в спиновом пространстве не происходит—это существенное упрощение обусловлено тем, что простран- ство 9iv имеет такую малую размерность. Системе симметрии термов в пространстве 91/ электрон- ных переносов соответствует определенное неприводимое представление унитарной группы п и определенная непри- водимая характеристика (§ 9) Х==Х(81, 82, . . .). Координаты в пространстве разбиваются на классы способом, описанным в гл. IV, § I: х(т) [tn — l, 1—1, ..., —/]; х'(т') [т' = Г, ..., —Z']; ... Каждый из таких классов описывает (2/4- 1)-мерное под- пространство Sl(n, I) из 91/, в котором группа Ь3 прост- ранственных вращений индуцирует неприводимое пред- ставление ®z и характеризуется главным квантовым числом п и азимутальным квантовым числом I. Соответ- ственно и аргументы 8f из X также разбиваются на классы. Для того чтобы определить главное и азимуталь- ное квантовые числа отдельных электронов (не обращая внимания на то, как эти числа распределяются среди f электронов), нам следует только установить, сколько состояний (/') электронов представлено в каждом из раз- личных подпространств 9l' = 9i(nZ). Так, нап имер, если
§ 15. СПИН И ВАЛЕНТНОСТЬ 451 три электрона лежат в 9Г, а остальные пять—в 9Г (/=8), но необходимо отделить ту часть X, которая имеет по- рядок 3 по переменным ez, принадлежащим 31', от части с порядком 5 по переменным, принадлежащим ЭГ'. Крат- ность М соответствующего терма Е + Е (п212) + ♦ ♦. + Е (tiflj) «невозмущенного» атома в рассматриваемой системе сим- метрии при этом определяется из описанной выше части X, если положить, что все 8, содержащиеся в ней, равны единице. Для того чтобы определить, как разбивается этот ТИ-кратный терм при учете взаимного воздействия электронов, мы заменяем переменные 8 (т) из класса 9i (и/) на 8 (m) = 8^, а переменные s' (т') из класса 9? (пТ) на 8'(m') = 8m' (с тем же 8) и т. д. Результирующее выражение должно быть линейной комбинацией сумм + L п, 8L + 1 —8“^ т— — L с неотрицательными целыми коэффициентами. Это позво- ляет нам определить, какие из полных азимутальных квантовых чисел L появляются при расщеплении указан- ного выше терма и как часто это происходит; каждый такой Л-терм все еще имеет кратность 2L 4-1. Пример. Мы рассмотрим в качестве примера случай, в котором / = 3, и все три электрона находятся в одном и том же подпространстве 91 (nl). При этом возможны следующие схемы симметрии: Принцип исключения Паули допускает только первые две: их валентности равны v = 3 и и==1, а соответствую- щими термами, следовательно, являются квадруплеты и дублеты.* Первая схема определяет антисимметрические тензоры порядка 3, а третья — симметрические тензоры. Соответствующие характеристики поэтому имеют вид x1=si= 2 e?w хз= 2 е/еА- i< j< k i<f<k
452 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК Введя обозначения s2— 2 Ф/, 83=2ф i Ф i мы получаем Х3 = Si + s2-j- s3. Размерности представлений группы л3, соответствующих этим трем схемам, а значит и кратности, с которыми представления Хп Х2, Х3 группы с появляются в (с)3, как легко показать, равны 1, 2, 1 (в согласии с уравнением 3! = 12 Н-22Ц-12). Характеристи- кой представления (с)3 группы с является величина == (2 3 — 5з Ч- $s2 + 6sx; (15.2) уравнение Z = Хх -f- 2Х2 -j- Х3 = (2sj S2 4~ 5з) 4~ 2Х2 позволяет нам заключить, что Х2 = s2 + 2sx. Удобно проводить расчет при помощи сумм степеней z1=2ep Z2=2e?> Z3=2e?> i i i при этом в дополнение к (15.2) мы имеем /2 = $3 $2, /д = Sg. Таким образом, мы находим характеристики в виде: дублеты: Х2 = -Г (Л —/3), (15.3) квадруплеты: Х1 = 2 (^ —/3)—(/2—/3)] • (15.4) Решение рассмотренной задачи теперь получается путем замены 21 -|- 1 переменных е,- множеством е1, 8*-1, ..., е_/ с последующим представлением tlt t2, ts в виде суммы 2 (О выражений вида aL (L): 4- е£-1 + ... z~L с целыми кратностями а,. Расчет значительно упрощается, если умножить обе части равенства на 8—1, поскольку (L) тогда превращается в s£+1—e.~L. Полученные таким путем кратности приводятся в следующих таблицах:
§15. СПИН И ВАЛЕНТНОСТЬ 453 Кратность: 3/—1 31—2|... 1 L = 0 1 2 . . . 1 (возраст 2 ает на 1 : з |...| на каждом шаге) 1 (возра^ на иа* 3 стае КДОР 5 т н; л ш. а 2 аге) lAJ: L = 3/ 3/ —1 3/—2 3/—3 1 Кратность: 1 0 1 0 . . . 1 (попеременно 1 и 0) L = t I— 11/—2 I—3 0 1 —1 | 1 —1 . . . (попеременно 1 и —1) L = 3/ 3/—1 3/—2 31 — 3 3/ —4 3/—5 .. . Кратность: 1 —1 0 1 —1 0 . . . (повторение с периодом 3) Применив эти результаты к расчету Х2, Хх, с помощью (15.3), (15.4) мы находим, что число термов с полным ази- мутальным квантовым числом L дается следующей таб- лицей: Дублетная система Л = 0,1,2, 3, 4, 5 (1) --------------------- 0 1 2 2 3 4 с возрастанием до L = l. Период здесь равен трем; крат- ности во втором периоде получаются при увеличении на 2 кратностей первого, кратности в третьем получаются из кратностей во втором прибавлением 2 и т. д. ... (2) L — 31 3/—1 3/—2 31—3 3/ —4 3/—5 ... 0 1 1 1 2 2 . . . с убыванием до L = l. Периодичность вновь равняется трем, но кратности в каждом периоде получаются из кратностей в предыдущем добавлением 1, а не 2. Квадруплетная система. Периодичность здесь равна не трем, а шести.
454 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК (1) При изменении значений L от 0 до I первый пе- риод кратностей (Л = 0, 1, 2, 3, 4, 5) есть для четных Z: 0 10 2 12, а для нечетных Z: 101121. Кратности от периода к периоду возрастают на 2. (2) При изменении значений L от 3/ до I первый период имеет вид 0 0 0 1 0 1, независимо от четности или нечетности Z, и кратности возрастают от периода к пе- риоду на 1. § 16. Определение примитивных характеров групп и и л Руководящим принципом всей этой главы является взаимосвязь симметрической группы перестановок л; с ал- геброй S симметрических преобразований. Симметрические преобразования, как показано в § 1, можно заменить на специальные симметрические преобразования, которые индуцированы в тензорном пространстве линейными пре- образованиями векторного пространства и образуют группу (с/, изоморфную линейной группе с. В действи- тельности мы можем даже сузить с до унитарной группы ц. Таким образом, алгебра 2 имеет отношение к некоторой — правда, не конечной, а компактной непрерывной группе. В этой связи, как мы видели в гл. III, появляется на- дежда, что поведение таких групп полностью аналогично поведению конечных групп, по крайней мере до тех пор, пока мы ограничиваемся только унитарными представле- ниями. В математике, как правило, легче работать с кон- тинуумом, чем с дискретным многообразием; поэтому формула (9.11), выражающая упоминавшуюся выше фун- даментальную взаимосвязь, будет больше отвечать задаче вычисления % через X, чем ее обращение. Соответственно далее мы вычисляем характеристики X непрерывных неприводимых унитарных представлений м-мерной унитарной группы п прямым методом, не зави- сящим от предыдущего построения. Случай п=Л уже рассматривался в гл. III, § 8; сформулированная там процедура служит образцом для данного случая. Помня об этом, мы сначала доказываем следующую вспомога- тельную теорему: Непрерывная функция f (coj, о)2, ..., со„), равная 1 по абсолютной величине, обладающая периодом 2л по каждому из п вещественных аргументов и удовлетворяющая функ- циональному уравнению
§ 16. ОПРЕДЕЛЕНИЕ ХАРАКТЕРОВ ГРУПП ?! И Л 455 с необходимостью имеет вид f ((“)) = е (h^t + /г2ю2 + • • • + Лй<о„), где константы hi — целые числа. Введя п функций М(о) = /((о, О, О, ...,0), /2(со) = (0, со, 0, ...,0), ... одной переменной, мы можем заключить из приведенного выше функционального уравнения, что /((!>!, (02, . • • ) =/1 Ы/2 (С02) . . . Поэтому достаточно доказать теорему для функций /(со) одной переменной, а это мы уже сделали в гл. III, § 8. Каждый элемент S группы п сопряжен «главному» элементу Е, т. е. преобразованию вида xv—>8V%V (v = 1, 2, ..., n). (16.1) Числа 8V равны по модулю единице и поэтому могут быть выражены через «углы вращения» (ох, о)2, . . ., co/z (которые определены только mod 2л) унитарного преобразования S в следующем виде: = = е Для того чтобы имелась возможность применить соотно- шения ортогональности, необходимо определить объем dS той части группового многообразия п, элементы которой имеют углы между o)v и cov4-d(ov. Пусть а19 а2, ..., ап — любые п чисел, a D(a^ a2i ..., ап) обозначает произве- дение разностей П (а,—= 11; i < k здесь п строк определителя, стоящего справа, опреде- ляются при замене а последовательно на а2, ..., ап. Вычисление элемента объема dS будет проведено в сле- дующем параграфе; здесь мы предвосхищаем результат: dS = ДА d<ox d(o2 ... dco„, A==Z)(s1, s2, ..., sj. (16.2) Определение примитивных характеристик группы п осуществляется путем комбинирования следующих важных фактов [21]. 1. Симметрия.— Каждый элемент S из группы и со- пряжен главному элементу Е, (16.1). Поэтому достаточно
456 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК определить характеристику X непрерывного представле- ния группы и для этого главного элемента. Элемент Е переходит в сопряженное преобразование из и при пере- становке 8V; следовательно, характеристика X есть непре- рывная симметрическая функция углов со, периодическая с периодом 2л по каждому из них. 2. Арифметические свойства. Главные элементы образу- ют абелеву подгруппу группы и; при композиции двух та- ких элементов £, Е' углы cov, складываются. Следова- тельно, нормальные координаты ук в пространстве пред- ставления 01 можно выбрать таким образом, чтобы главные элементы соответствовали главным преобразованиям Е Уь—РкУк’ действительно, в гл. I, § 5 мы показали, что любую коммутативную систему унитарных отображений можно одновременно привести к диагональному виду. При ком- позиции двух главных элементов условие, что Е есть представление, выражается функциональным уравнением р(0)1? С02, . . .)р(й>1, . . .) = р(со1 + (о;, С02 + (02, ...), для каждого из сомножителей р = р/г. Из вспомогательной теоремы тогда следует, что каждый из р/г имеет вид е (ZiiCOi -Ь • • • + где константы —целые числа. Характеристика этого представления вычисляется суммированием таких р^; поэтому X представляет собой конечный ряд Фурье по аргументам со с целыми неотрицательными коэффициен- тами. «.Веса» представления определяются наборами пока- зателей (/гх, Л2, ..., /гл) каждого члена е (h^ + /i2©2 + • • • + h„&„) <= . s^, который действительно появляется в X. Говорят, что член (hlf h2, ..., hn) «выше», чем (h^, h'2t ..., если первая ненулевая разность hr— h2 — h2, ... положи- тельна. 3. Ортогональность.—Для всех примитивных харак- теристик X интеграл 2л 2л j . ..J XXAAdoh...^ о о
§ 16. ОПРЕДЕЛЕНИЕ ХАРАКТЕРОВ ГРУПП 31 И л 457 должен иметь значение 2л 2л V = J ... у ДА d(d1... d(dn. о о (16.3) Эти соотношения ортогональности подсказывают, что не- обходимо ввести вместо характеристик X 'величины Н = Д.Х; они также представляют собой конечные ряды Фурье, но они являются не симметрическими, а анти- симметрическими функциями углов со. Если hlf h2, ... ..., hn—целые, расположенные в порядке убывания числа, h1>h2>...>hni (16.4) то мы можем построить «элементарную», т. е. знакочере- дующуюся по перестановкам аргументов со сумму ^(Л1, /12, ..Л„) = 2 ±e(/i1®1 + M2+• • •+MJ; (16-5) выписанный здесь член является наивысшим в данной сумме. Каждый знакопеременный ряд Фурье есть линей- ный агрегат таких элементарных сумм; поскольку коэф- фициенты этих сумм—целые числа, и, в частности, коэф- фициент «наивысшего» члена равен 1, то каждый знако- переменный ряд Фурье с целыми коэффициентами, такой как g, можно выразить в виде линейного агрегата вида 1 = с-Щч, h2, + h'2, (16.6) с целыми коэффициентами с, с', ... Пусть это разложе- ние расположено в порядке убывания, т. е. таким обра- зом, что множество показателей (ftn h2, ...) выше, чем набор (/11, h2, ...) и т. д.; тогда (А1? й2, ...) — наивыс- ший член в Сама величина А является элементарной суммой, а именно, A = g(n—1, п—2, п—3, ..., 1, 0). Отсюда, если наивысший член в X имеет показатели /2, ...» то мы имеем ^=^+(„-1), (16.7) в дальнейшем числа f{ и ht всегда будут связаны друг с другом соотношениями (16.7). Обозначим интегрирование по всем углам вращения от 0 до 2л одним знаком интеграла и запишем da вместо
458 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК dcOi d(o2.. .dan. Затем вычислим $ h2, .. .) здесь наборы h и h' расположены в порядке убывания в согласии с (16.4). Следовательно, никакая перестановка набора h не может совпадать с перестановкой набора Л', если не выполняются условия = h2~h2, ..,,hn = h'n\ (16.8) поэтому интеграл по каждому из (п!)2 членов в произве- дении F(/ii, h2t ...) g(/h, h2, ...) равен 0, если не выполняются условия (16.8). В случае, если (16.8) выполняются, каждый из п\ членов,'для кото- рых перестановки наборов h, h' совпадают, дает вклад (2л)" в интеграл, а все остальные члены равны нулю; от- сюда Г/г! (2л)", J £(/гх, /г2, . . .) %(h'19 h2, .. .)dco= в зависимости от того, выполняется (16.8) или нет. При- меняя это соотношение, в частности, к элементарной сумме Д, мы получаем ДА d(d= V = /г! (2л)". Подставив разложение (16.6) в уравнение J ЙАо = V, мы находим И2 + к'12+--- -1. Так как с, с , ...—ненулевые целые числа, то в (16.6) может появиться только первый член, и при этом с=1 или с =—1; а поскольку коэффициент высшего члена в 5 (как и в X) должен быть положительным, то мы ограни- чиваемся первой возможностью: с=\. Таким образом, мы показали, что каждая примитивная характеристика имеет вид V В (^1> •., eftn I Л д е, 11 (16.9)
§16. ОПРЕДЕЛЕНИЕ ХАРАКТЕРОВ ГРУПП $1 И л 459 где ht — целые числа, расположенные в порядке убывания'. Функция, определенная в (16.9), представ- ляет собой конечный ряд Фурье с высшим членом (А» А, •••> /«)’, коэффициент этого члена (т. е. его крат- ность) равен 1. 4. Полнота.—Последний вопрос, на который надо ответить: является ли обратно каждая функция вида (16.9) характеристикой некоторого неприводимого представления группы ц или нет. Наше явное алгебраическое построе- ние позволяет нам ответить на этот вопрос утвердительно. Чтобы показать это, мы сначала заметим, что представ- ление порядка /, возникающее из схемы симметрии с (самое большее) п строками длины /п /2, ..., fn, имеет в качестве наивысшего веса набор (flf f2, ..., /„); это можно увидеть непосредственно, если считать, что такое представление порождается альтернированием произведе- ния п векторов, первый из которых появляется как со- множитель Д раз, второй — /2 и т. д. (как и в простом случае, рассмотренном в начале § 15). Здесь/ — целые числа, удовлетворяющие условиям При делении преобразования, соответствующего произ- вольному элементу S группы и в этом представлении, на /-ю степень определителя S (/—любое фиксированное неотрицательное число) наивысшим весом возникающего преобразования будет набор (/х — /, /2—/, ..., fn — таким образом, этот простой трюк позволяет нам обой- тись без ограничения /„^0. Мы, следовательно, дока- зали, что все неприводимые унитарные представления унитарной группы ц„ можно получить полным приведе- нием представлений (п/ для /=0, 1, 2, ... к их непри- водимым составляющим и умножением на одномерные представления вида [Z=0, ±1, ±2, ...]. Мы, кроме того, показали, что характеристика непри- водимого представления = f2, ..., fn) порядка f, которое порождается в группе ц схемой симметрии Р (fi, •••> fn), определяется равенством (16.9). Мы могли бы получить этот последний результат по- средством более трансцендентного метода доказательства, примененного в этапах 1—3. Оперируя не на произволь- ном поле, а на континууме всех комплексных чисел, можно
460 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК сформулировать доказательство полноты неприводимых представлений конечной группы при помощи теории интегральных уравнений таким образом, что оно сразу же может быть использовано для случая компактной непре- рывной группы. Конкретное применение этой общей тео- ретико-групповой теоремы о полноте к группе Ь2 враще- ний круга вокруг его центра позволяет доказать полноту ортогональной системы Фурье eim® (т = 0, ±1, ±2, ...). Применение теоремы к компактной группе позволяет получить два следующих результата: (1) Каждое выра- жение вида (16.9) действительно определяет характерис- тику, поскольку в противном случае характеристика была бы непрерывной функцией положения на групповом многообразии (т. е. функцией класса) с нулевыми коэф- фициентами Фурье относительно каждого неприводимого представления; она действительно ортогональна всем дру- гим функциям вида (16.9). (2) Далее, мы находим, что функции (16.9) образуют полную систему ортогональных функций для симметрических периодических функций аргументов (ох, со2, ..., соп; этот результат не имеет ни- какого конкретного интереса, так как является следст- вием полноты одномерной ортогональной системы Фурье. Наши общие рассуждения (1)—(4) выявили столько свойств примитивных характеристик, что мы можем вы- вести для них явное выражение, исходя только из этих свойств. Следствия.—Предположение о том, что hn = fn^O, в действительности не составляет никакого ограничения; характеристикой, таким образом, является симметричная рациональная целая функция от & порядка f. Эти 8 являются корнями характеристического многочлена /(T) = det(rl—S) унитарного преобразования S; следо- вательно, мы можем выразить X через рациональные и целые коэффициенты этого многочлена, а следовательно, и коэффициенты матрицы S. Тогда можно сразу же устра- нить ограничения на унитарность группы, но мы это не будем рассматривать в данной книге [22]. Размерность представления X находится при вычис- лении X для единичного элемента, все собственные числа которого 8V равны 1. Прямой подстановкой в (16.9) мы получаем неопределенность вида 0/0, поэтому поступаем следующим образом. Выразим со1 = (п — 1) со, со2 = (п—2) со, . . ., сол = 0 со
§ 16. ОПРЕДЕЛЕНИЕ ХАРАКТЕРОВ ГРУПП « И я 461 только через угол со. Определитель в знаменателе (16.9) есть не что иное, как альтернированная сумма членов, полученных из произведения е (/ix (п— 1) (h2 (п—2) со) -... >е (йп0ы) перестановками чисел п—1, п—2, ..., 0; следовательно, он равен | {е (/ко)}"’1, •••, ИМ}1, И или произведению разностей выражений е (Ахсо), е (/г2со), ..., получаемых вычитанием каждого члена этой системы из какого-либо предыдущего члена. Полагая со —> 0, мы имеем е (Ахсо) —е (й2<о) ~ /со (Ах—Л2). Размерность N представления, обозначенного выше через ©(/i, /2, •••, следовательно, равна А/ = ‘ ~ ’ hn) — D(n—1, ..., 1, 0) (16.10) Вычисление характеров группы Лу. Получив явные вы- ражения для характеристик представлений группы ц„, мы теперь применяем связь между представлениями групп л7 и ий, установленную в § 9, к вычислению примитивных характеров группы Лу. В равенстве (9.12) % есть харак- тер, а X — характеристика неприводимых представлений групп Лу и соответственно, порожденных схемой сим- метрии Р(/х, /2, ...); в частности, мы должны положить X = 0, коль скоро схема имеет более п строк. Сумма распространяется по всем возможным схемам симметрии Р с f полями. Выражение (16.9) для X теперь позволяет нам установить следующее правило для расчета %: пусть XfJ2...(M2---) (16.11) обозначает величину характера неприводимого представ- ления 1)(/х, /2, ...) группы Лу, которое порождается схе- мой симметрии Р (/х, /2, ...) для элемента $, принадле- жащего классу 1 = (ч/2. ••). Выберем произвольное поло- жительное целое число п и построим суммы ах, а2, ... степеней п независимых переменных ех, 82, ..., и про- изведение D (вх, 82, ..., 8Л) их разностей. Величина (16.11) тогда является коэффициентом при члене 8^-8*»-...-8*«
462 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК [h — fjA (п— /)] в разложении величины D(e,Jt е2, е,л)-<т№... (16.12) Здесь мы предполагаем, что схема Р имеет самое боль- шее п строк; поэтому, если мы хотим получить все при- митивные характеры группы мы должны выбрать n^f. Это правило показывает, что компонентами харак- теров являются целые числа. Этот результат был получен Фробениусом чисто алгеб- раическим способом, без привлечения непрерывной груп- пы п [23]. Но сущность нашего правила, как я полагаю, проясняется только при учете связи между группами nf и \1п — в частности, эта связь позволяет нам понять, почему помимо f возникает другое целое число п. Размерность g представления 1)(Д, /2, ...) опреде- ляется при подстановке аргумента s= I: ir = f9 i2 = i3 = = ...=6 в характере /. Формула (9.12) тогда прини- мает вид <*{=Sgx, причем сумма распространяется здесь на все схемы Р (/1, /2, ...). Поскольку ах— характеристика собствен- ного n-мерного представления с: S —> S группы и, то это равенство просто означает, что в полном приведении (c)z неприводимое представление t£ = §(/x, f2i ...), как мы уже знаем, появляется точно g раз. Подставляя явное выражение (16.9) для X, получаем 8, 8Л*, ..., 8Л*|. Число g соответственно равно коэффициенту при zh^^...zhnn в разложении произведения в левой части. Для того чтобы получить кратность члена 8^8^... этого произведения, мы должны умножить член ±8*« • 8**... 8*« в разложении определителя на величину из aj. Набор (£х, &2, ..., kn) здесь пробегает переста- новки чисел п—1, ..., 1, 0, а число g соответственно равно альтернированной сумме X ± (/»!— *1) ! (Лв —*2) « • • - (ft)
§ 16. ОПРЕДЕЛЕНИЕ ХАРАКТЕРОВ ГРУПП 91 И л 463 по этим перестановкам, т. е. равно определителю я|____1___ .... __L_ 1| = '• | (ft—«+ 1) ! ’ ’ (/1-1)!’ ft! I = 717Г7&—- л + 2)’ ••”Л’ ’!• Строки этого определителя состоят, при чтении справа налево, из многочленов по h степени 0, 1, ..., (п—1) с наивысшим коэффициентом, равным 1. Поэтому опреде- литель равен \hn~\ .... h, 11, и окончательно мы получаем простую формулу -JiDth,, h2, hn) h1\h2\...hn\ (16.13) Число n следует выбрать по крайней мере равным числу строк в схеме P(flt ...); читателю следует самому удостовериться прямым расчетом, что величина (16.13) остается неизменной при замене п на п+1. Правило Фробениуса для характера и полученная нами формула для размерности значительно полезнее для практических расчетов, чем формула (14.7). В качестве примера мы проведем расчеты для случая четырех электронов; результаты приведены в следующей таблице. Число элементов Схема Класс 4 31 22 211 1111 1+ 4 1 3 2 3 1 6— 21 1 1 0 —1 —1 3+ 02 1 —1 2 —1 1 8+ 101 1 0 —1 0 1 6— 0001 1 —1 0 1 —1 Группа л4 содержит двадцать четыре элемента, кото- рые разбиваются на пять классов сопряженных элемен- тов; каждый из этих классов указывается во втором столбце таблицы соответствующими ему величинами (i^. . .). Первый столбец определяет число элементов в каждом из
464 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК этих классов, а знак 4- или — указывает, состоит ли класс из четных или нечетных перестановок. Каждая из остальных пяти колонок содержит значения примитивного характера для класса, в строке которого она находится. Схема симметрии, к которой принадлежит каждый из этих характеров, указывается в начале столбца числами Д, /2, ... элементов в ее строках. Первый и последний из этих столбцов можно заполнить сразу же, а второй и третий—при помощи правила Фробениуса. Четвертый затем получается из второго, если заметить, что его схема симметрии двойственна схеме столбца 2; нам только нужно заменить значения во втором столбце на противо- положные им элементы для (—)-классов. Так как схемы 2 и 3 содержат только по две строки, мы можем принять п = 2. ^Отсюда, записав х, у вместо X, мы Должны найти коэффициенты при х*у (для столбца 31) и при х3у2 (для столбца 22) в следующих многочленах: (х—у)(х + у)*, (х—у) (х 4- у)2 (х2 + у2) = (х 4- у) (х2—у2) (х2 4- у2) = = (х + у)(Х*—у*), (х—у)(х2 + у2)2, (х—у) (х 4- у) (х3 4- у3) = (х2 —у2) (х3 4- у3), (х—у)(х*+у*). Размерности пяти неприводимых представлений содер- жатся в первой строке; они равны 1, 3, 2, 3, 1. Про- верка соотношений ортогональности оставляется читателю. § 17. Вычисление объема на группе и Рассмотрим линейные элементы, исходящие из единич- ной точки I группового многообразия и, т. е. инфини- тезимальные унитарные преобразования 6S = ||6sap||. Мы можем выбрать в качестве вещественных координат этого «вектора» п величин 4- • 6saa плюс вещественные и мни- мые части п(п—1 )/2 величин 6sap (a<p); полное число компонент, таким образом, равно п2, что, следовательно, говпадает с размерностью группового многообразия и. Затем в линейной алгебре этого типа мы можем заме- нить’любые’две вещественные величины а, b на комплексные величины a-\-ib, —a-\-ib, полученные из первых простой линейной заменой; следовательно, мы можем заменить ве-
§ 17. ВЫЧИСЛЕНИЕ ОБЪЕМА НА ГРУППЕ Я 465 щественную и мнимую части величины 6sap (а < £) на ве- личины 6sap и — 6sap = 6spa. При перемещении такого инфинитезимального вектора в точку S группового многообразия посредством левого переноса его конец переходит в точку S-|-iiS = S (1 +6S), dS — S-8S; поэтому мы должны рассматривать инфините- зимальный элемент SS = S~1dS как «вектор», направлен- ный из S в S + dS- Наше определение объема на группо- вом многообразии (гл. III, § 12) состоит в следующем: параллелепипед, определенный п2 векторами 6S, идущими из фиксированной точки S к соседним точкам S-J-dS, имеет как объем абсолютное значение определителя, обра- зованного из компонент п2 векторов 6S. Согласно приве- денным выше замечаниям мы можем выбрать в качестве компонент вектора SS = ||6sap|| совокупность самих коэф- фициентов 6sap. Любой элемент S можно выразить в виде S=UEU~\ (17.1) где Е — главный (диагональный) элемент группы и, а U—унитарно. Элемент S не меняется при умножении U справа на любой главный элемент. Мы применяем гео- метрическую терминологию, позволяющую нам наглядно представить нашу процедуру посредством аналогии. Будем говорить, что два элемента U, U* группы и, которые правоэквивалентны относительно группы главных эле- ментов: U' = UE, «лежат на одной и той же вертикали [t/]». Из п2-мерного многообразия и проектированием мы получаем (п2—nj-мерное многообразие [и] вертикалей [(/], при условии, что все ’’точки из и, принадлежащие одной вертикали, совпадают. Этот процесс отождествления экви- валентных элементов был описан в начале гл. III; мы фактически уже встречали его в гл. I, § 1 в частном случае проектирования в аффинном пространстве. Мы мо- жем теперь считать U в (17.1) представителем всей вер- тикали [[/]; если [17] пробегает все многообразие [и] и углы ®v элемента Е:
466 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК изменяются независимо во всей области 0 со 2л, то элемент S, определенный равенством (17.1), описывает многообразие и ровно п! раз. Вектор 8U — U"1 dU приводит из точки U вертикали [77] к соседней точке U~\-dU вертикали [U-\-dU]. Сово- купность всех точек на [U + dU], лежащих в окрестно- сти элемента U, определяется выражениями вида ((7 4 dU) (1 + 6Е) = U + (dU 4- f76E), где 6Е—произвольный инфинитезимальный главный эле- мент с коэффициентами Z6cov на главной диагонали; соот- ветствующие ему векторы имеют вид 677 = 8U 4- 8Е. По- скольку члены 8U на главной диагонали — чисто мнимые, то Е можно определить единственным образом, обратив все члены на главной диагонали 8U в нуль; мы назовем этот переход от [£7] к [U-]-dU] «горизонтальным пере- ходом из U». Переход из некоторой другой точки UE вертикали [£7] к точке (U~}~dU)E вертикали [U\+dU] выполняется посредством вектора 6'77 = Е~1.677-Е. (17.2) То, что это линейное преобразование (17.2), определенное посредством элемента Е, переводящего 8U в 6'77, является унимодулярным, следует из наших общих замечаний отно- сительно компактных непрерывных групп и может быть проверено в этом случае прямым вычислением. Очевидно, что то же самое уравнение выполняется и для горизон- тальных переносов 677, б'U из U, UE соответственно: 6'77 = Е~Х.677.Е. (17.3) Здесь п2— п горизонтальных векторов 677, выводящих из (7, определяют инфинитезимальный «параллелограмм», емкость которого измеряется абсолютным значением опре- делителя п2—п компонент 6цаР (аУ=Р) различных векто- ров 8U. Если каждая точка и на периметре параллело- грамма описывает вертикаль [77], то мы получаем трубу, горизонтальные сечения которой суть параллело- граммы; ее проекцией на [и] является первоначальный элемент объема, «параллелограмм», определенный посред- ством 8U. Так как линейное преобразование (17.3), 8U -+8'U, унимодулярно, то емкость каждого горизон- тального сечения одна и та же, и поэтому она может рассматриваться как емкость элемента объема на [и].
§ 1?. ВЫЧИСЛЕНИЕ ОБЪЕМА НА ГРУППЕ Я 467 Далее мы рассмотрим изменения, происходящие с [{/] и £ в (17.1), при переходе S в S -f- dS. Мы имеем SU = UE, и поэтому dS-U ^S-dU ~dU • Е + U-dE. Умножив обе части этого равенства на U~ 1S~1 — £’£/’, мы находим U-1.8S.U + 8U = E~1.8U.E + 8Е или 6'S = U-i.8S-U= {E-'.dU-E—6U} 4-б£. (17.4) Матрица, стоящая в скобках, имеет компоненты: М4-1)- \ ър / Мы определяем параллелепипед в S, который будет слу- жить элементом объема, следующим образом: п2—п из п2 строк 6S получаются из (17.4) фиксацией углов вращения (т. е. мы полагаем 6Е==0) и проведением п2 — п гори- зонтальных векторов St/ из точки U для образования элемента объема величины d[U] на [и]; затем остальные п векторов SS выбираются таким образом, чтобы для каждого из них один и только один из углов сог изме- нялся на dcor, а величина [t/1 оставалась неизменной. Соответствующие п2 векторов 6S определяют, в согласии с (17.4), элемент объема величины п (—— 1 (17.5) P=?=q\&P / Поскольку линейное преобразование 6S —> 6'S = унимодулярно, то этот объем равен объему элемента, определенного самим 8S. Так как 8=1/8, то произведе- Нйе II в (17.5) можно записать в виде д / __। V ____। \_ д (е?~ 8jp) (е^~ ер) _ q < р \ Sp '\вр J q<P ЪрЪр = П (89—8^(8,,—е )=А-Д. q<P Окончательный результат таков: если [t/] в (17.1) опре- деляет инфинитезимальный объемный элемент величины
468 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК d[U] на [и], а углы вращения cov изменяются на d^v, то объемный элемент, определяемый посредством S, имеет величину bKd^d^ ...d®n*d[U]. (17.6) Проинтегрировав это выражение относительно d[U] по [и], мы получаем теорему, уже примененную в предыдущем параграфе, в отношении величины той части группы и, в которой углы вращения имеют значения, лежащие между G)<v И 4“ dtdy. Эти рассуждения остаются справедливыми, если мы ограничиваемся группой ц унитарных преобразований с определителем!. Углы поворота при этом подчиняются ограничению (о2 4 -• • 4“ = 0» (17.7) а единственным отличием в результате является то, что в (17.6) исчезает множитель d®n. Условие (17.7) позво- ляет нам нормировать линейную форму . +hnwn по углам вращения таким образом, чтобы hn = 0; показа- тели (hlf h2, ..., hn) в весах представлений и являются тогда неотрицательными целыми числами. Желательно, однако, не налагать эту нормировку hn= 0; следует заме- тить, что для нас имеют значение только разности между hp неприводимые представления <!р(Д, Д, •••> Д) группы п не изменяются при возрастании каждого из Д на одну и ту же целую величину. В частности, эти рассуждения подтверждают адекватность формул, использованных в гл. III для объема на групповом многообразии унимодулярной унитарной группы ц2, а результаты предшествующего па- раграфа составляют прямое и независимое от теоремы полноты доказательство того факта, что представления группы ц2, обозначенные через образуют полную си- стему неэквивалентных неприводимых представлений группы и2. § 18. Законы ветвления В заключение мы покажем полезность наших формул для определения характеров, выводя из них два простых ^закона ветвления». 1. Закон ветвления для группы перестановок.^ Неприводимое представление группы со схемой сим- метрии Р(Д, Д, ...) приводится при сужении до под-
$ 18. ЗАКОНЫ ВЕТВЛЕНИЯ 469 группы перестановок f—1 предметов к сумме непри- водимых представлений Лу_г, соответствующих схемам Р(Л-1, А. /з, •••); Л-i. /».•••); схемы, в которых строки не расположены в порядке убы- вания длин, надо отбросить. Каждая такая составляющая появляется ровно один раз. (Словом, эти схемы полу- чаются из первоначальной схемы путем поочередного уда- ления по одному полю из конца каждой строки, которая действительно длиннее последующей строки.) Доказательство. Пусть s—перестановка чисел 1,2, ... ..., f—1, принадлежащая классу (ix — 1, i2, i3, ...). Рас- сматриваемая как перестановка / чисел 1,2, ..., /, вели- чина s оставляет последнее число неподвижным; число одно- членных циклов при этом возрастает на 1, и перестановка s, рассматриваемая как элемент Лу, принадлежит классу (h, •••)• В разложении Д.аГЧ-..=2«АХ..в^--- (18-1) члены, для которых h[ h2 ., имеют коэффициенты = ° или (18.2) в зависимости от того, является ли каждый из знаков в неравенствах для h на самом деле равенством или нет. Величина представляет собой примитивный характер группы Лу_г, принадлежащий схеме симметрии Р (f[, f'2, ...). С другой стороны, коэффициент при £1'82’ • • • [Ях > h2 > ... ] в А •</]* о2... совпадает с характером (s) представле- ния группы Лу со схемой Р (fu f2, ...). Отсюда, умножив (18.1) на ст1 = 81 + 82+... 4-8л. мы находим Xfifj... (s) =ah,-l, Л,, й3, ... + ал,, Л3-1, /г3, ...+ ••• Из этого результата и формулы (18.2) следует наш закон ветвления. Этот закон, в свою очередь, приводит к ре- куррентной формуле для размерностей g(flt f2, ...). 2. Закон ветвления для сп. При сужении с„ до подгруппы линейных преобразований (п—1)-ао подпространства неприводимое представление (fi> fv • • •) группы с„ приводится к сумме всех тех
470 ГЛ. V. СИММЕТРИЧЕСКАЯ ГРУППА ПЕРЕСТАНОВОК представлений (^, f2, ...) группы для которых fn-i > (18.3) причем каждая из этих составляющих появляется только один раз. Доказательство. Линейные преобразования S подпро- странства сп-1: хп = 0 просто изоморфны тем линейным преобразованиям S переменных х2, ..., хп, в которых >хл. Отсюда еп в характеристике (16.9) следует за- менить на 1. Знаменатель при этом принимает вид D^, е2, 8„_1)-(е1 —1)(е2—1) ... (е,,,!—1), что можно получить путем вычитания последнего столбца из Dt&L, е2, 1) из каждого предыдущего и раз- ложением возникшего (п — 1)-строчного определителя на множители. Для того чтобы разделить определитель в чис- лителе на множитель (Ej— 1)(е2—1)...(e„_i—1), мы вы- читаем второй столбец из первого, третий из второго, ..., и, наконец, n-й из (п—1)-го. Последняя строка тогда есть 0, 0, ..., 0, 1; определитель, таким образом, приводится к определителю порядка (п—1). Теперь разделим каждый элемент в v-й строке на ev—1 согласно формуле _ р^2 В результате мы имеем в числителе определитель [ • 4~ е^2, е^2-1 . 4~ е^3, ... | (£==£!, е2, ..., «„.О. Он представляет собой сумму всех (п—1)-строчных опре- делителей вида | eftl, еЙ2, ..., е'*"-11, hi hi /i2 h2 h3 hn^i hn. (18.4) При вычитании п—1 из /ц, п—2 из и h2, ..., 0 из hn-i и hn, так чтобы получились числа f [(16.7)], нера- венства (18.4) превращаются в неравенства (18.3), и наша теорема доказана.
ДОПОЛНЕНИЯ 1. Доказательство неравенства (стр. 104) Для доказательства неравенства, отмеченного на стр. 104, мы должны показать, что любая непрерывная и дифференцируемая функция ф, определенная для всех значений вещественной переменной х, удовлетворяет условию / 4 оо 2 + оо +оо _______ {•( j < j x^dx- J -^Jfcdx, (*) — 00 / — оо — 00 если, конечно, входящие в условие интегралы действи- тельно существуют. Неравенство Шварца (гл. I) | + ... + anbn |2 «С (а^ + ... + а,рп) (Ь^ + ... + babn) после замены каждой из сумм одним или даже двумя интегралами принимает вид <($ fjidx+ f2Ti dx^gig! dx+ g&dx). Применяя это неравенство к тождеству полагая А = f2 = x$, g^^-, £2 = -g и преобразуя интеграл х Тх (W)dx
472 ДОПОЛНЕНИЕ 1 В фф dx интегрированием по частям в области —оо, 4-оо, мы по- лучаем требуемое соотношение (*), при условии, что ин- тегрируемый член хфф стремится к 0 при х—> ±оо. То, что это действительно имеет место в случае, когда два интеграла в правой части (*) сходятся, можно увидеть из следующего косвенного доказательства. Пусть 8 яв- ляется фиксированной положительной константой; рас- смотрим положительное значение х, для которого х|ф(х)|2>8 и которое настолько велико, что Из неравенства Шварца тогда следует, что для х^х'^хф-е/х выполняется не- равенство |1р(х')—ф(х) |2=с4‘ Т’ откуда Интеграл от х21 ф |2 по области от х до хф-е/х при этом удовлетворяет условию: с...>^.±±..1=4. J 4 х х 4 Отсюда получаем, что, обратно, из условий X х следует неравенство
дополнение 2 473 2. Композиционное свойство групповых характеров (стр. 213) Фундаментальное свойство неприводимого представле- ния s —* U (s), которое выражается равенством U (sf) = U (s)U (/), соответствует соотношению x(s)x(0=fExk'1^)- (*) Г Доказательство. Если х, у — два элемента групповой алгебры, второй из которых принадлежит центру, и если в представлении $ х->-Х, y->-Y, то Y — (x\lg) 1. Матрица, соответствующая элементу z = ху в <£), равна (T|/g) X, а ее след равен &\/g: Цг(г)х(г) = ^-^х(8)х(з)-Х«/(0х(0- г s s t Положив Z (r) = S*(s)*/(0 (st = r), мы находим S* (s) У (О % (st) =у Xх (S) У (0 % (s) X (О- s, t S,t Поскольку y(t) зависит только от класса сопряженных элементов, к которому принадлежит /, то в левой части предыдущего равенства мы можем заменить Х(«0 На 4Xx(sr-1^)- Г При этом коэффициент x(s)y(/) в обеих частях равенства зависит только от класса, к которому принадлежит эле- мент /, и так как x(s) является произвольной функцией, а у(/) есть произвольная функция класса, то утверждение (*) следует из того факта, что обе части должны совпа- дать. Мы опустили упоминание о равенстве (*) в тексте, чтобы не мешать систематическому исследованию теории представлений, которая полностью описывается соотноше- ниями ортогональности и теоремой полноты.
474 ДОПОЛНЕНИЕ 3 3. Теорема о невырожденных антисимметрических билинейных формах (стр. 333) Мы рассматриваем заданную невырожденную антисим- метрическую билинейную форму f 2 с1кх1Ук (СН== cik) i, k- 1 как «антисимметричное произведение» [$!)] двух векторов £ = (%!, х2, • ••, Ху) и 1) = (^). Пусть ei является любым ненулевым вектором; тогда, по предположению, [exj] не может тождественно по j равняться нулю, и, следова- тельно, может быть найден второй вектор е2 такой, что [eie2] = l. Уравнения [е1т] = О, [е2у] = 0 тогда имеют f—2 линейно независимых решений е3, • • •, ег Кроме того, эти векторы таковы, что не может существовать никакой ли- нейной зависимости между ними и et, е2, поскольку, если J + £з£з + • • • 4 = 0, то из построения анти- симметричных произведений [eii’]=£2, [е2г] = — следует, что ^ = ^2 = 0. Мы поэтому можем выбрать et, е2, •••,6/ в качестве системы координат, т. е. как базис, из которого могут быть построены все векторы. Пусть антисимметрич- ное произведение выражается через компоненты векторов г, 1) в этой новой системе координат формулой / №)]= 2 Т/?=1 Способ, которым были определены новые фундаменталь- ные векторы, требует, чтобы коэффициенты у//е= [е/е^] вы- ражались равенствами = 0, у12 = 1; у13 = 0, . .. ..yv = 0, у21 = — 1, Y22= 0; у23 = 0, ..у2/ = 0. Вслед- ствие антисимметрии все yzi, yi2 с г = 3, . . ., f обращают- ся в нуль, и матрица y{k полностью приводится к 2-строчной квадратной подматрице II 0 !1 II -”1 °1 и (/—2)-мерной антисимметрической матрице. Математи- ческая индукция по размерности f дает требуемую теорему о том, что f является обязательно четным и что исходная форма может быть превращена путем соответствующего линейного преобразования в сумму (liHi—^i) + (£3Th — ^4*1з)+ • • • (//2 членов).
СПИСОК ЛИТЕРАТУРЫ Глава I 1.60. С исчерпывающей общностью доказано М. Планшерелем {Plancherel М.. — Circ. Mat. Palermo, 1910, v. 30, p. 330) и Титчмаршем (Titchmarch E. C.— Proc. bond. Math. Soc. (2), 1924, v. 23, p. 279). 2.60. Acta Mathematica, 1924—26, v. 45, p. 29; v. 46, p. 101; v. 47, p. 237. Г. Вейль в работе: Weyl H.— Math. Ann., 1926, Bd. 97, S. 338, дает краткое изложение этого предмета, самым тесным образом связанное с теоремой полноты теории представлений непрерывных групп, которая рассматривается в главах III и V — особенно в гл. V, § 16. 3.61. Hilbert D. Grundzuge einer allgemeinen Theorie der linearen Integralgleichungen.— Leipzig, 1912, часть 4 (избранные труды, вышед- шие в Gott, Nachr. 1904—1910). Hellinger E.— Journ. f. d. reine und angew. Math., 1909, Bd. 136, S. 210. 4.61. Wintner A. Spektraltheoric unendlichen Matrizen.— Leipzig, 1929. 5.61. Math. Ann., 1929, Bd. 102, S. 49, 370. Помимо книг фон Ней- мана и А. Винтнера см. Stone М. Н — Proc. Nat. Acad. Sci., 1929, v. 15, pp. 198, 423. 6.62. Gott. Nachr., 1927, 1, часть V (перевод более позднего издания: Нейман И. Математические основы квантовой механики.— М.: Наука, 1964). Глава II 1.63. Помимо упомянутых во введении книг Зоммерфельда, Руарка— Ури и Герлаха см.: Planck М. The Theory of Heat Radiation.— Phila- delphia, 1914 (перевод: Планк M. Теория теплового излучения.— М.— Л.:|ОНТИ, 1935); статью В. Паули «Quantentheorie» — In: Handbuch der Physik/Eds H. Geiger, K. Scheel.— Berlin, 1926, Bd. 23, S. 1—278 (перевод: Паули В. Труды по квантовой теории.— М.: Наука, 1975, с. 7—351). Аккуратное изложение теории квантованных орбит в том виде, ко- торый она обрела за период 1913—25 годов, смотри в книгах: Born Л4. The Mechanics of the Atom.— London, 1927 (перевод предшествующего немецкого издания: БорнМ. Лекции по атомной механике.—Харь- ков — Киев: ОНТИ ДНТВУ. 1934, т. I); второй том «Elementare Quan- tenmechanik», посвященный новой квантовой механике, который напи- сан^ М. Борном совместно с П. Йорданом. Из учебников по квантовой механике назовем следующие: de Broglie L. An Introduction to the Study of Wave Mechanics.— London, 1930 (перевод: de Бройль Л. Введение в волновую механику.— Харьков — Киев: Гостехиздат, 1934); Con-
476 СПИСОК ЛИТЕРАТУРЫ don Е. U.t Morse Р. М. Quantum Mechanics. N. Y., 1929; Dirac P. A. M. The Principles of Quantum Mechanics.— Oxford, 1930 (перевод этого издания: Дирак П. Основы квантовой механики.— М.— Л.: ГТТИ, 1932, кроме того смотри перевод последнего издания: Принципы кван- товой механики.— М.: Наука, 1979.— (Библиотека теоретической физи- ки); Haas A., Wave Mechanics and the New Quantum Theory.— London, 1928; Heisenberg IF. The Physical Principles of the Quantum Theo- ry.— Chicago, 1930 (перевод: Гейзенберг В. Физические принципы кван- товой теории.—М.—Л.: ГТТИ, 1932); Halpern О., ThirringH. Die Grunzuge der neueren Quantentheorie.— Berlin, 1929. Из соответствую- щих обзоров см.: Honl Н., Eckart С. Grundzuge und Ergebnisse der Wellenmechanik.— In: Phys. Zeits., 1930, Bd. 31, S. 89; Kemble E. C., Hill E. L. General Principles of Quantum Mechanics.— In: Rev. Mod. Phys., 1929—30, v. I, p. 157; v. 2, p. 1. 2.64. Ann. d. Phys., 1905. Bd. 17, S. 132; Ann. d. Phys., 1906, Bd. 20, S. 199 (перевод: Эйнштейн А. Собрание научных трудов.— М.: Наука, 1966, т. 3, сс. 92 и 128). 3.69. Franck J., Jordan Р. Anregung von Quantensprungen durch Stosse.— Berlin, 1926 или одноименная статья в Geiger-Scheel. Hand- buch der Physik, Bd. 23, S. 641. 4.71. Помимо фундаментальной работы Heisenberg W.— Zeits. f. Phys., 1925, Bd. 33, S. 879 (перевод в: УФН, 1977, т. 122, с. 574) см.: BornM., Jordan A—Zeitz, f. Phys., 1925, Bd. 34, S. 858 (перевод в: УФН, 1977, т. 122, с. 586); BornM., Heisenberg IF., Jordan Р.— Zeits. f. Phys., 1926, Bd. 35, S. 557; Dirac P. A. M.— Proc. Roy. Soc., 1926, v. 109 (A), p. 642 (перевод в: УФН, 1977, т. 122, с. 611); de Broglie L.— Ann. de Phys. (10), 1925, v. 2, p. 22; Ondes et mouvements.— Paris, 1926; Schrodinger E.— Ann. d. Phys., 1926, Bd. 79, S. 361, 489, 734; Bd. 80, S. 437; Bd. 81, S. 109 (перевод этих работ в: Шредингер Э. Избранные труды по квантовой механике.— М.: Наука, 1976, сс. 9, 21, 56, 75 и 116 соответственно). 5.72. Einstein A.— Phys. Zeits., 1917, Bd. 18, S. 121. 6.73. Einstein A— Sitzungsber Preuss. Akad., 1924, S. 261; 1925, S. 3, 18; Bose S. N.— Zeits. f. Phys., 1924, Bd. 26, S. 178 (перевод этих работ в: Эйнштейн А. Собрание научных трудов.— М.: Наука, 1966, т. 3, сс. 481, [503 и 475). Относительно связи с волновой механикой см.: Schrodinger Е. Physikal Zeits., 1926, Bd. 27, S. 95 (перевод в: Шрёдин- гер Э. Избранные труды по квантовой механике.— М.: Наука, 1976, с. 172.) 7.73. Phys. Rev., 1927, v. 30, р. 705; кроме того, см. Elsasser IF.— Naturwiss., 1928, Bd. 16, S. 720. О дифракции электронов на тонкой ме- таллической фольге см.: Thomson G. R.— Proc. Roy. Soc., 1928, v. 117 (A), p. 600, а также: Wave Mechanics of Free Electrons.— N. Y., 1930. Далее: Kikuchi S.— Jap. Journ. Phys., 1928, v. 5, p. 83; Rupp E.— Ann. d. Phys., 1928, Bd. 85, S. 981, и Naturwiss., 1929, Bd. 17, S. 174; Mark H„ Wierl R.— Naturwiss., 1930, Bd. 18, S. 205; Zeits. f. Phys., 1930, Bd. 60, S. 741. 8.83.95. Доказательство полноты многочленов Эрмита можно най- ти в книге Courant— Hilbert. Methoden der mathematischen Physik I, (перевод: Курант P., Гильберт Д. Методы математической физики.— М.— Л.: ГТТИ, 1933, т. I или 3-е изд., испр.— М.— Л.: ГИТТЛ, 1951, т. I). Те же методы позволяют утверждать, что одноэлектронный ион не имеет дискретных термов, отличных от полученных в § 5. Относительно их связи с многочленами Лагерра см.: Schrodinger Е. Collected Papers.
СПИСОК ЛИТЕРАТУРЫ 477 9.93. Gerlach W., Stern О.— Ann. d. Phys., 1924, Bd. 74, S. 673. Einstein A., Ehrenfest P.— Zeits. f. Phys., 1922, Bd. 11, S. 31 (перевод: Эйнштейн А. Собрание научных трудов.—M.: Наука, 1966, т. 2, с. 442). 10.93. Об исследовании решений дифференциальных уравнений в окрестности регулярной особой точки см.: Bieberbach L. Theorie der Differentialgleichungen.— 3rd ed.— Berlin, 1930, ч. II, гл. IV; InceE. L., Ordinary Differential Equations.—London, 1927, p. 160, 365 (перевод: Айне Э. Л. Обыкновенные дифференциальные уравнения.— Харьков: ОНТИ ДНТВУ, 1939); Pierport J. Theory of Functions of a Complex Variable.—Boston, 1914, Ch. Ill, § 209. 11.96. Относительно общей теории непрерывного спектра дифферен- циальных уравнений см.: WeylH.— Math. Ann., 1910, Bd. 68, S. 220; по поводу применений в квантовой теорйи см.: цитированные в [4] ра- боты Э. Шрёдингера; Fues Е.— Ann. d. Phys., 1926, Bd. 81, S. 281. Ве- роятности перехода между уровнями с положительной и отрицательной энергиями в центральном поле заряда см.: Sugiura Y.— Inst. Chem. and Phys. Research Sci. Papers.— Tokyo, 1929, № 193. 12.100. Обсуждавшаяся в тексте задача о столкновениях привела Борна к статистической интерпретации квантовой механики: Zeits. f. Phys., 1926, Bd. 37, S. 863; Bd. 38, S. 803 (перевод последней работы в: УФН, 1977, т. 122, с. 632); Wentzel G.— Zeits. f. Phys., 1926, Bd. 40, S. 590; Oppenheimer J. R.— Zeits. f. Phys., 1927, Bd. 43, S. 413. Точные расчеты: Condon W.— Zeits. f. Phys., 1928, Bd. 48, S. 180. 13.100. Born M.— Gott. Nachr., 1927, S. 146. Dirac P. A. M — Proc. Roy. Soc., 1927, v. 114 (A), p. 243. Elsasser W.— Zeits. f. Phys., 1927, Bd. 45, S. 522. Обзор предмета в целом см.: Wentzel G. Die unperiodischen Vorgange in der Wellenmechanik.— In: Phys. Zeits., 1928, Bd. 29, S. 321; Condon E. U. Quantum Mechanics of Collision Processes.— In: Rev* Mod. Phys., 1931, v. 3, p. 43. 14.100. GamovG.—Zeits. f. Phys., 1928—29, Bd. 51, S. 204; Bd. 52, S. 496, 510; Bd. 53, S. 601; Gurney R. F., Condon E. U.— Nature, 1928, v. 122, p. 439;— Phys. Rev., 1929, v. 33, p. 127. За ними следует серия работ в Zeits. f. Phys., Bds 52—60: фонЛауэ, Кудара, Сексла, Мёллера, Борна, Аткинсона и Хаутерманса. Кроме того: Fowler R. Н., Wil- son А. Н.— Proc. Roy. Soc., 1929, v. 124 (А), р. 493; Rice О. К.— Phys. Rev., 1930, v. 35, р. 1538. Еще одно применение см. в работе: Fowler R. Н., Nordheim L.— Proc. Roy. Soc., 1928, v. 119 (A), p. 173. Общее исследо- вание: Schrodinger E.— Sitzungsber. Preuss. Akad., 1929, S. 2. 15.103. Cm.: Weyl H. Philosophie der Mathematik and Naturwissen- schaft.— Munich, 1926, Part II; Naturwissenschaft, II Methodologie. 16.103. Относительно фундаментальной интерпретации квантовой теории см.: Heisenberg W.— Zeits. f. Phys., 1926, Bd. 40, S. 501; BohrN.— Naturwiss., 1928, Bd. 16, S. 245 или Nature, 1928, v. 121, p. 580 (перевод: Бор H. Избранные научные труды.— М.: Наука, 1971, т. 2, с. 30). Кроме того: v. Neumann I.— Gott. Nachr., 1927, S. \ ;WeylH.— Zeits. f. Phys., 1927, Bd. 46, S. 1; Sommerfeld A.— Phys. Zeits., 1929, Bd. 30, S. 866; ясное изложение дает указанная в [1] книга Гейзенберга. 17.105. Gott Nachr., 1927, S. 245. 18.107. Gesammelte Abhandlungen.—Leipsic, 1911, Bd. 2, XXV: Theorie der konvexen Korper, § 12, S. 157. 19.107.- v. Neumann I.— Gott Nachr., 1927, S. 273; Zeits. f. Phys., 1929, Bd. 57, S. 30 (перевод в: фон Нейман И. Математические основы квантовой механики.— М.: Наука, 1964, с. 325); Schrodinger Е.— Ann. d. Phys., 1927, Bd. 83, S. 15; Nordheim L.— Proc. Roy. Soc., 1928,
478 СПИСОК ЛИТЕРАТУРЫ v. 119 (А), р. 689; Pauli W.— In: Sommerfeld —Festschrift: Probleme der modernen Physik.— Leipsic, 1928, S. 30 (перевод: Паули В. Труды по квантовой теории.— М.: 1975, с. 661). 20.108. Dirac Р. А. М.— Proc. Cambr. Phil. Soc. I, 1928, v. 25, p. 62. 21.114. Точный расчет см.: в указанных во введении книгах Хунда и Паулинга — Гаудсмита. 22.116. Эта формулировка фундаментальной задачи теории возму- щений относится к более общему случаю, в котором функция возмуще- ния W также явно зависит от времени /; уравнение (8.1) верно в любом случае. См.: исследование Борном адиабатического принципа в кванто- вой механике: Zeits. f. Phys., 1926, Bd. 40. S. 501, и работу Вейля, ука- занную в [16]; Fermi E.,Persico F.— Rend. Acc. d. Lincei (6), 1926, v. 4, p. 452 (перевод: Ферми Э. Научные труды.— М.: Наука, 1971, т. 1, с. 231); Born М., Fock V.— Zeits. f. Phys., 1928, Bd. 51, S. 165. 23.125. Осознание некоммутативное™ умножения и открытие этих перестановочных соотношений было самым важным шагом в первой ста- тье Гейзенберга и при последующем развитии новой квантовой механики в статьях Борна, Гейзенберга и Йордана, указанных в [4]. 24.126. Превосходное изложение динамики Гамильтона — Якоби и теории возмущений в классической механике имеется в посвященных этим предметам главах из Geiger — Scheel, Handbuch der Physik, напи- санных Л. Нордгеймом и Е. Фусом: Bd. V, гл. Ill и IV. Кроме того, мож- но посоветовать книгу Борна, указанную в [1]. О канонических преоб- разованиях в квантовой механике см.: Jordan Р.— Zeits. f. Phys., 1926, Bd. 37, S. 383; Bd. 38, S. 513; London F.— Zeits. f. Phys., 1926, Bd. 40, S. 193; Dirac P. A. M.— Ptqc,, Roy. Soc., 1927, v. 113 (A), p. 621. 25.132. Weyl H. Raum — Zeit — Materie — 5-е изд.— Berlin, 1923, §§40, 41, или английский перевод Броуза: Space, Time and Matter.— London, 1922, § 35; Schrodinger E.— Zeits. f. Phys., 1922, Bd. 12, S. 13; Zondon E — Zeits. f. Phys., 1927, Bd. 42, S. 375. 26.133. Collected Papers, P. 76. Новые данные приводят Foster J. S., Chalk L.— Proc. Roy. Soc., 1929, v. 123 (A), p. 108. 27.135. Этот результат легко получается более элементарными ме- тодами для прямоугольного параллелепипеда. Общее доказательство см.: в работах: Wr/Z Н.— Journ. f. d. reine u. angew. Math., 1912—13, Bd. 141, S. 163; Bd. 143, S. 177; Rend. d. Circ. Math. Palermo, 1915, v. 39, p. 1 (перевод последней работы см.: Вейль Г. Математика. Теоре- тическая физика.—М.: Наука, 1984, с. 9); Р. Курант перенес этот метод с интегральных уравнений на дифференциальные: см.: гл. VI пер- вого тома «Методов математической физики» Куранта и Гильберта. 28.135. Dirac Р. А. М.— Proc. Roy. Soc., 1927, v. 114 (А), р. 243. Кроме этой статьи по излучению и поглощению, см. также работу по дисперсии на с. 710 этого же тома. Относительно данной Джинсом трак- товки излучения черного тела, которая привела к закону излучения Рэ- лея — Джинса, см.: Jeans J. FL— Phil. Mag., 1905, v. 10 (6), p. 91; Дебай FL— Ann. d. Phys., (4), 1910, Bd. 33, S. 1427 — ввел квант дейст- вия в эту теорию. 29.141. Исходя из общих соображений статистической природы, Эйнштейн осознал необходимость введения вынужденного излучения задолго до построения новой квантовой механики и вывел уравнения (13.9) и (13.10): Phys. Zeits., 1917, Bd. 18, S. 121 (перевод: Эйнштейн А. Собрание научных трудов.— М.: Наука, 1966, т. 3, с. 393). Новая кван- товая механика дополнила этот вывод, получив коэффициент вероятно- сти А — равенство (13.8) —из структуры атома. 30.141. Weisskopf V., Wigner Е,— Zeits, f. Phys., 1930, Bd. 63, S. 54,
СПИСОК ЛИТЕРАТУРЫ 479 Глава III 1.143. Об общих основаниях теории групп и построении теории ко- нечных групп см.: Burnside W. Theory of Groups of Finite Order.— 2nd ed.— Cambridge, 1911; Miller G. A., Blichfeldt H. F., Dickson L. E. Theory and Applications of Finite Groups.— New York, 1916; Speiser A. Theorie der Gruppen von endlicher Ordnung.— 2-е изд.— Berlin, 1927. 2.146. Vergleichende Betrachtungen uber neuere geometrische For- schungen.— Erlangen, 1872; Math. Ann., 1893, Bd 43, S. 63, или Klein E. Gesammelte mathematische Abhandlungen.— Berlin, 1921, Bd. I, S. 460 (перевод: Сб. Об основаниях геометрии./ Под ред. А. П. Нордена.— М.: Гостехиздат, 1956, с. 399). 3.155. Вслед за фундаментальными результатами Ф. Э. Молина по теории гиперкомплексных чисел (Molien Т.— Math. Ann., 1893, Bds 41, 42), теория представлений конечных групп была развита главным образом Г. Фробениусом (Sitzungsber. Preuss Akad., 1898—99.— Имеется перевод: Фробениус Г. Теория характеров и представлений групп.— Харьков: ОНТИ ДНТВУ, 1937). Наиболее важные результаты были переоткрыты Бернсайдом, см.: его вышеуказанную книгу [1]. Метод, раз- витый И. Шуром: Schur I. Neue Begrundung der Theorie der Gruppen- charaktere.— In: Sitzungsber. Preuss. Akad., 1905, S. 406, рекомендуется для практических приложений из-за его прозрачности. 4.172. Изложение в § 6 следует работе Э. Нётер: Noether Е.— Math. Zeits., 1929, Bd. 30, S. 641, особенн 3 и 16. Изложение единственности полного приведения — в отличие от простого приведения — следует в общем работам: Krull W.— Math. Zeits., 1925, Bd. 23, S. 161; Schmidt 0.— Math. Zeits., 1928, Bd. 29, S. 34 (перевод: Шмидт О. Ю. Избранные труды. Математика.— М.: АН СССР, 1959, с. 240); Brauer R., Schur I.— Sitzungsber. Preuss. Akad., 1930, S. 209. 5.192. Трактовка Шура теории представлений, упомянутая в [3], основана на этой лемме. 6.196. Burnside W.— Proc. bond. Math. Soc. (2), 1905, v. 3, p. 430. 7.197. Frobenius G., Schur I.— Sitzungsber. Preuss. Akad., 1906, S. 209. 8.204. Метод интегрирования по групповому многообразию был придуман Гурвицем (Hurwitz А.— Gott. Nachr., 1897, S. 71), хотя он применил его к теории инвариантов, а не к теории групп. Я. Шур пер- вым получил свойства ортогональности характеристик непрерывной группы вращений этим способом и использовал их для доказательства полноты системы известных представлений: Schur I.— Sitzungsber. Preuss. Akad., 1924, S. 189, 297, 346. 9.209. Из более современных книг по алгебре см.: Dickson L. Е. Algebras and their Arithmetics.— Chicago, 1923, и, кроме того, van der Waerden В, L. Moderne Algebra II.— Berlin, 1931 (перевод: Ван дер Варден Б. Л. Современная алгебра, т. 2 — М.: Гостехиздат, 1947). Первоначально алгебра называлась «системой гиперкомплексных чисел», и сейчас это название иногда встречается в немецкой литературе; груп- повая алгебра именуется там словом «Gruppenring». Обычная процедура в современной алгебре состоит в разложении алгебры на простые мат- ричные алгебры, в случае которых теоремы о реализации линейными преобразованиями появляются как естественные следствия; это построе- ние будет осуществлено в гл. V. 10.217. См.: Weitzenbock R.— Invariantentheorie.— Groningen, 1923. Основанием для доказательства фундаментальной теоремы этой теории инвариантов является теорема Гилъберта о базисе: Hilbert D.— Math.
480 СПИСОК ЛИТЕРАТУРЫ Ann., 1890, Bd. 36, S. 473. Автором же показано — Math. Zeits., 1926, Bd. 24, S. 392 (перевод: Вейль Г. Математика. Теоретическая физика.— М.: Наука, 1984, с. 180),— что эта фундаментальная теорема верна для любой компактной и любой полупростой непрерывной группы. Старач теория инвариантов занималась практически только с группой сп всех линейных преобразований с единичным определителем. Действительно современные книги по теории инвариантов отсутствуют *). 11.220. Эта теория представлена самим С. Ли с помощью Ф. Энгеля в гигантской трехтомной работе: Lie S., Engel F. Theorie der Transfor- mationsgruppen.— Leipzig, 1893 или 1930. Кроме того, см.: Lie S. Vor- lesungen uber kontinuierliche Gruppen.— Leipsig, 1893, под редакцией Шефферса, и краткое изложение в книге: Weyl Н. Mathematische Ana- lyse des Raumproblem.— Berlin, 1923, лекция 5 и приложение 8 **). 12.226. Cartan Е.— Bull. Soc. Math. d. France, 1913, v. 41, p. 53, кроме того, см.: Weyl И.— Math. Zeits., 1925, Bd. 23, S. 275 (перевод: Вейль Г. Математика.; Теоретическая физика.— М.: Наука, 1984, с. 100); Born M.f Jordan Р. Elementare Quantenmechanik, гл. IV. 13.227. О более глубокой теории проективных представлений см.: Schur /.— Journ. f. d. reine u. angew. Math., 1904—11, v. 127, p. 20; v. 132. p. 75; v. 138, p. 155. 14.230. Эта теорема содержится в моих исследованиях по представ- лениям полупростых групп: Math. Zeits., 1925—26, Bd. 23, S. 271; Bd.24, S. 328, 377, 789 (перевод: Вейль Г. Математика. Теоретическая физи- ка.— М.: Наука, 1984, с. 100—197). К этому типу групп относятся: груп- пы сп всех линейных преобразований с единичным определителем, груп- пы вращений Ьп и «комплексная группа» всех линейных преобразований, которые оставляют инвариантной невырожденную кососимметрическую форму от двух векторов из (2 п)-мерного пространства (симплектическая группа). Первая и вторая работы имеют дело с этими наиболее важными случаями. Топологическое исследование группы вращений находится в гл. II, § 5 (24, 346). Глава IV 1.238. Теорию атомных спектров, которая развивается в этой и сле- дующей главах, следует постоянно сравнивать с эмпирическими дан- ными; в частности, см.: книги Хунда, Паулинга — Гаудсмита и Грот- риана, указанные во введении. Применение теории представлений 3-мерной группы вращений к атомным спектрам разработано в статьях: Wigner Е.— Zeits. f. Phys., 1927, Bd. 43, S. 624; v. Neumann J., Wig- ner E.— Zeits. f. Phys., 1928, Bd. 47, S. 203; Bd. 49, S. 73. Кроме того, этот предмет недавно был систематически изложен Вигнером: Wig- ner Е. Gruppentheorie und ihre Anwendung auf der Quantenmechanik der Atomspektren.— Braunschweig, 1931 (перевод: Вигнер E. Теория групп.— M.: ИЛ, 1961); обзор этого предмета см. в работе: Eckart С. *) Смотри книги: Вейль Г. Классические группы. Их инварианты и представления.— М.: ИЛ, 1947; Гуревич Г. Б. Основы теории алгебраи- ческих инвариантов.— М.— Л.: ГТТИ, 1948; Спрингер Т. Теория ин- вариантов.— М.: Мир, 1981. (Примеч. пер.) *♦) На русском языке можно указать книги: Чеботарев Н. Г. Тео- рия групп Ли.—М.—Л.: Гостехиздат, 1940; Эйзенхарт Л. П. Непре- рывные группы преобразований.— М.: ИЛ, 1947; и Понтрягин Л. С. Непрерывные группы.—3-е изд.—М.: Наука, 1973. (Примеч. пер.)
СПИСОК ЛИТЕРАТУРЫ 481 Application of Group Theory to the Quantum Dynamics of Monatomic Systems. In: Rev. Mod. Phys., 1930, v. 2, p. 305. Внутреннее квантовое число было введено Зоммерфелъдом на основе эмпирических данных: Sommerfeld A.— Ann. d. Phys., 1920, Bd. 63, S. 221; 1923, Bd. 70, S. 32. 2.239. Теория термов двухатомных молекул исследуется в следую- щих фундаментальных работах Ф. Хунда: Hund F.— Zeits. f. Phys., 1926, Bd. 36, S. 657; 1927, Bd. 40, S. 742, 1927, Bd. 42, S. 93; 1927, Bd. 42, S. 805; 1928, Bd. 51, S. 759; 1930, Bd. 63, S. 719. Кроме того, см.: Mullikan R. S.—Phys. Rev., 1928, v. 32, pp. 186, 761; 1930, v. 36, pp. 699, 1440; Born M.t Oppenheimer J. R.— Ann. d. Phys. (4), 1927, Bd. 84, S. 457; Condon E. {/.— Phys. Rev., 1926, v. 28, p. 1182;' 1928, v. 32, p. 858. Серию докладов и исследований по этому предмету можно найти в Trans. Faraday Soc., 1929, v. 25, p. 611—949; относи- тельно детального обзора всей области молекулярных спектров см.: Mullikan R. S.— Rev. Mod. Phys., 1930, v. 2, p. 60; 1931, v. 3, p. 89, a также книгу Ру арка и Ури, указанную во введении. 3.239. Elert IF.—Zeits. f. Phys., 1928, Bd. 51, S. 8. Сравни: Bet- he H — Ann. d. Phys. (5), 1929, Bd. 3, S. 133; Huckel E.~ Zeits. f. Phys., 1930, Bd. 60, S. 423. 4.242. Подходящие методы проведения расчетов теории возмущений (метод «самосогласованного поля») были развиты в следующих рабо- тах: Hartee D. R.— Proc. Cambr. Phil. Soc., 1928, v. 24, p. 89; Gaunt J, A.— Proc. Cambr. Phil. Soc., 1928, v. 24, p. 328, атакже: Slater J.C, Phys. Rev., 1928, v. 32, p. 339; 1929, v. 34, p. 1293; 1930, v. 36, p. 57; Condon E. U.— Phys. Rev., 1930, v. 36, p. 1121; Condon E. U. Short- ley J. Н,— Phys. Rev., 1931, v. 37, p. 1025; Fock V.—Zeits. f. Phys., 1930, Bd. 61, S. 126; Bd. 62, S. 795; Breit G.— Phys. Rev., 1930, v. 35, p. 569; v. 36, p. 383. Heitler W., RumerG.— Zeits. f. Phys., 1931, Bd. 68, S. 12. 5.250. См. обзор: Honl H — Ann. d. Phys. (4), 1926, Bd. 79, S. 273. Относительно получения этих формул квантовой механики, хотя и не с точки зрения теории групп, см.: Born М., Heisenberg W., Jor- dan Р.— Zeits. f. Phys., 1926, Bd. 35, S. 557. См. также гл. IV из BornM., Jordan P, Elementare Quantenmechanik. 6.252. Pauli IF.— Zeits. f. Phys., 1927, Bd. 43, S. 601. 7.252. Uhlenbeck G. E., Goudsmit S.— Naturwiss., 1925, Bd. 13, S. 953; Nature, 1926, v. 117, p. 264. 8.254. Richardson O.~ Phys. Rev., 1908, v. 26, p. 248; Einstein A., de Haas W. J.— Verhandl. d. Deutsch. Phys. Ges., 1915, Bd. 17, S. 152; 1916, Bd. 18, S. 173 (перевод: Эйнштейн А. Собрание научных трудов.— М.: Наука, 1966, т. 3, сс. 363, 382); Beck Е.— Ann. d. Phys. (4), 1919, Bd. 60, S. 109; Barnett S. J., L. H.~ Phys. Rev., 1921, v. 17, p. 404; Chattock A. P., Bater L. F.— Phil. Trans. Roy. Soc., 1922, v. 223, p. 287. 9.257. Доклад о едином обозначении для термов атомных спектров на языке квантовых чисел был представлен в работе Russell Н. N., Shanstone А. G., Turner L. А.— Phys. Rev., 1929, v. 33, р. 900. Оказалось, что необходимо приписать спин атомному ядру, чтобы учесть сверх- тонкую структуру: Back Е., Goudsmit S.— Zeits. f. Phys., 1927, Bd. 43, S. 321; 1928, Bd. 47, S. 174. Goudsmit S., Bacher R. F — Phys. Rev., 1929, v. 34, p. 1501; Goudsmit S. Phys. Rev., 1931, v. 37, p. 663; Hargrea- ves J — Proc. Roy. Soc., 1929, v. 124 (A), p. 568; Fermi E.— Zeits. f. Phys., 1930, Bd. 60, S. 320 (перевод: Ферми Э. Научные труды.— М.: Наука, 1971, т. 1, с. 323); Breit G.— Phys. Rev., 1931, v. 37, p. 51. 10.259. Back E., Lande A. Zeemaneffekt und Multiplettstruktur.— Berlin, 1925; Lande A.— Zeits, f. Phys., 1923, Bd. 15, S. 189; Pauli
482 СПИСОК ЛИТЕРАТУРЫ Zeits. f. Phys., 1923, Bd. 16, S. 155; Bd. 20, S. 371; Lande A.— Zeits. f. Phys., 1924, Bd. 25, S. 46; Heisenberg W., Jordan P.— Zeits. f. Phys., 1926, Bd. 37, S. 263; Darwin K.— Proc. Roy. Soc., 1928, v. 118 (A), p. 264. По поводу (//) и (si) связей см.: Bartlett J. H — Phys. Rev., 1930, v. 35, p. 229. 11.260. Weyl H.— Math. Zeits., 1925, Bd. 23, S. 292 (перевод: Вейль Г. Математика. Теоретическая физика.— М.: Наука, 1984, с. 126); v. Neumann /., Wigner Е.— Phys. Zeits., 1929, Bd. 30, S. 467 (перевод в: Нокс Р., Голд А. Симметрия в твердом теле.— М.: Наука, 1970, с. 153). 12.261. Proc. Roy. Soc., 1928, v. 117 (A), p. 610; v. 118, p. 351; Dar- win C. G.— Proc. Roy. Soc., 1928, v. 118 (A), p. 654. Lande A.— Zeits. f. Phys., 1928, Bd. 48, S. 601; в том же томе: Moglich F., S. 852, и, Neu- mann Lt S. 868; Fock V.— Zeits. f. Phys., 1929, Bd. 55, S. 127. См. также более старую работу о взаимодействии спина и орбитального момента импульса: Thomas L. Н.— Nature, 1926, v. 117, р. 514; Frenkel J.— Zeits. f. Phys., 1926, Bd. 37, S. 243 (перевод: ФренкельF- И. Собрание избранных трудов.—М.—Л.: АН СССР, 1958, т. 2, с. 460); Heisen- berg W.> Jordan Р.— в том же томе, S. 863. 13.268. Dirac Р. А. М.— In: Quantentheorie und Chemie: Leipzi- ger Vortrage, 1928.— Leipsic, 1928, S. 83. 14.272. Weyl H.— Proc. Nat. Acad. Sci., 1929, v. 15, p. 323; Zeits. f. Phys., 1929, Bd. 56, S. 330; Fock V,— Zeits. f. Phys., 1929, Bd. 57, S. 261; Амбарцумян В., Иваненко Д.— Изв. АН СССР, 1930, с. 45. 15.277. См. доклад Вентцеля из ссылки [13] к гл. II; Sommerfeld А. Wave Mechanics (перевод: Зоммерфельд А. Волновая механика.— Л.— М.: ГТТИ, 1933); Born M.t Jordan Р. Elementare Quantenmechanik; Klein О., Nishina Y.— Zeits. f. Phys., 1929, Bd. 52, S. 853; Nichina Y.t тот же том, S. 869. 16.290. Sommerfeld A.— Ann. d. Phys. (4), 1916, Bd. 51, S. 1. От- носительно значения этих результатов для теории рентгеновских спект- ров см. указанную во введении книгу Зоммерфельда. Расчет возмущений в новой квантовой механике — В. Гейзенберг и П. Йордан [10]; точный вывод при помощи теории электрона Дирака: Gordan W.— Zeits. f. Phys., 1928, Bd. 18, S. 11; Darwin C. G. [12]; Зоммерфельд А. Волновая механика. 17.296. Heisenberg W — Zeits. f. Phys., 1926, Bd. 38, S. 411. Соот- ветствующий энергетический расчет для атома Не: Heisenberg W.— Zeits. f. Phys., 1926, Bd. 39, S. 499; Dirac P. A. M.—Proc. Roy. Soc., 1926, v. 112(A), p. 661; Gaunt J. A.— Proc. Roy. Soc., 1929, V. 122 (A), p. 513; Phil. Trans. Roy. Soc., v. 228(a), p. 151; Sugiura Y.— Zeits. f. Phys., 1927, Bd. 44, S. 190; Houston W. V,— Phys. Rev., 1929, v. 33, p. 297; Slater J. C.— Phys. Rev., 1928, v. 32, p. 349; Breit G — Phys. Rev., 1929, v. 34, p. 553; 1930, v. 36, p. 383. «Симметрическое» под- пространство приводит к статистике Эйнштейна — Бозе, которая об- суждается в работе, указанной под номером 6 в списке ссылок гл. II. Статистика, возникающая из «антисимметрического» подпространства, была развита Э. Ферми: Fermi Е.— Zeits. f. Phys., 1926, Bd. 36, S. 902 (перевод: Ферми Э. Научные труды.— М.: Наука, 1971, т. I, с. 203) и была применена В. Паули: Pauli W.— Zeits. f. Phys., 1927, Bd. 41, S. 81 для объяснения парамагнетизма, а А. Зоммерфельдом к электронной теории металлов: Sommerfeld A., Houston W. V., Eckart С.— Zeits. f. Phys., 1928, Bd. 47, S. 1. 18.299. Stoner E. C.— Phil. Mag. (6), 1924, v. 48, p. 719; Pauli W.— Zeits. f. Phys., 1925, Bd. 31, S. 765 (перевод: Паули В. Труды по кванто- вой теории: Квантовая теория. Общие принципы волновой механики.
СПИСОК ЛИТЕРАТУРЫ 483 Статьи 1920—1928.— М.: Наука, 1975, с. 645). Следует помнить, что это исследование предшествовало новой квантовой теории и теории вра- щающегося электрона и что введение Паули четырех квантовых чисел и, /, /, т требовало полной переклассификации всего спектроскопическо- го материала. 19.304. Dirac Р. А. М.— Proc. Roy. Soc., 1927, v. 114 (А), р. 243. При учете взаимодействия частиц: Jordan Р., Klein О,— Zeits. f. Phys., 1927, Bd. 45, S. 751. 20.307. Jordan P., Wigner E.— Zeits. f. Phys., 1928, Bd. 47, S. 631. 21.309. Jordan P., Pauli W.— Zeits. f. Phys., 1928, Bd. 47, S. 151 (перевод: Паули В. Труды по квантовой теории. Статьи 1928—1958.— М.: Наука, 1977, с. 7); Mie G.~ Ann. d. Phys., 1928, Bd. 85, S. 711; Heisen- bergW., Pauli W.— Zeits. f. Phys., 1930, Bd. 56, S. 1; 1930, Bd. 59, S. 168 (перевод: Паули В. Труды по квантовой теории. Статьи 1928—1958.—М.: Наука, 1977, сс. 30, 89); Heisenberg W.— Zeits. f. Phys., 1930, Bd. 65, S. 4; Ann. d. Phys., 1931, Bd. 9, S. 338; Rosenfeld L — Zeits. f. Phys., 1930, Bd. 63, S. 574; Oppenheimer J. R.— Phys. Rev., 1930, v. 35, p. 461; Breit G.— cm. [7]; Fermi E.— Rend. Acc. d. Lincei (6), 1929, v. 9, p. 881 (перевод: Ферми Э. Научные труды.— М.: Наука, 1971, т. 1, с. 302); Landau L., Peierls Р.— Zeits. f. Phys., 1930, Bd. 62, S. 188 (перевод: Ландау Л. Собрание трудов.— М.: Наука, 1969, т. I, с. 32); Rosenfeld L.— Ann. d. Phys. (5), 1930, Bd. 5, S. 113. 22.314. Weyl H.— Journ. f. d. reine u. angew. Math., 1912, Bd. 141, S. 163. 23.319. Cm.: Jordan P, Die Lichtquantenhypothese.— In: Ergebnisse der exacten Wissenschaften, 1928, Bd. 7, S. 158. 24.321. Dirac P. A. M.— Proc. Roy. Soc., 1930, v. 126 (A), p. 360; Proc. Cambr. Phil. Soc., 1930, v. 26, p. 361; Oppenheimer J. R.— Phys. Rev., 1930, v. 35, p. 939. Обзор этой теории см. в работе: DiracР. А. М.— Nature, 1930, v. 126, р. 605. О попытке устранить уровни отрицательной энергии посредством приведения всех операторов см: Schrodinger Е.— Sitzungsber. Preuss. Akad., 1931, S. 63. 25.322. См. статьи Гейзенберга — Паули и Розенфельда в [21]. 26.336. Weyl Н.— Zeits. f. Phys., 1927, Bd. 46, S. 1. 27.340. Строгое доказательство этих теорем для оо-мерного прост- ранства было объявлено в Stone М. Н.— Proc. Nat. Acad. Sci., 1930, v. 16, р. 172. И. фон Нейман информировал меня в последнем письме, что он также получил доказательство этой теоремы. 28.340. См. ссылку [20]. Глава V 1.345. Переход от группы 20 к алгебре 5 , предлагаемый квантовой механикой, улучшил также теорию с чисто математической точки зре- ния: см. Weyl Н.— Ann. of Math. (2), 1929, Bd. 30, S. 499. Связь между представлениями u/z или с„ и л. была впервые осознана И. Шуром в его диссертации (Берлин, 1901). Далее, см.: Weyl Н.— Math. Zeits., 1925, Bd. 23, S. 271 (перевод: Вейль Г. Математика. Теоретическая физика.— М.: Наука, 1984, с. 100), Schur /.— Sitzungsber. Preuss. Akad., 1927, S. 58; 1928, S. 100. О классах симметрии тензоров см.: Young А.— Proc, bond. Math. Soc., 1900, v. 33, p. 97; 1901, v. 34, p. 361; Weyl H.— Rend. Circ. Mat. Palermo, 1924, v. 48, p. 29. 2.348. Это было подчеркнуто в: Dirac Р. А. М.— Proc. Roy. Soc., 1929, v. 123 (A), p. 714,
484 СПИСОК ЛИТЕРАТУРЫ 3.354. Г. Фробениус использовал термин «характеристическая еди- ница» для этого понятия (см. Sitzungsber. Preuss Akad., 1903, S. 328), и это название было перенесено в физическую литературу. Но тем вре- менем термин «идемпотент» систематически используется при исследо- ваниях алгебр. Обозначения «право- и левоинвариантная подалгебра* и «левоинвариантная подалгебра» соответствуют понятию «идеала* и «левого идеала» в арифметике, когда все элементы алгебры рассматри- ваются как «целые числа». 4.368. Steinitz Е.— Journ. f. d. reine u. angew. Math., 1910, Bd. 137, S. 167. 5.372. Наше доказательство этой теоремы следует Noether Е.— Math. Zeits., 1928, Bd. 30, S. 641. 6.380. В более старых исследованиях Ф. Э. Молин (Molten Т.— Math. Ann., 1893, Bds 41, 42) и Г. Фробениус оперируют в поле всех комплексных чисел. Расширение на произвольные поля принадлежит И. X. М. Веддербёрну’, оно также справедливо для алгебр, которые не являются полностью приводимыми — ветвь предмета, в которую мы не вдавались: Wedderburn J. Н. М.— Proc. bond. Math. Soc. (2), 1907, v. 6, p. 99; Bull. Am. Math. Soc., 1925, v. 31, p. 11. См. также книгу Диксона из ссылки [9] к гл. III. Наше доказательство следует Э. Нетер — см. ссылку [5]. См. далее: Artin Е.— Abh. Math. Semin. Hamburg., 1927, Bd. 5, S. 251; Kothe G — Math. Zeits., 1930, Bd. 32, S. 161. 7.388. Wigner E.— Zeits. f. Phys., 1926—27, Bd. 40, S. 492, 883; Heitler W.— Zeits. f. Phys., 1927, Bd. 46, S. 49. В этих статьях рассмат- ривается только простейший случай, когда невозмущенный терм систе- мы I? состоит из f различных невырожденных термов объекта /. 8.397. Этот прямой вывод следует работе Weyl Н.— Math. Zeits., 1925, Вd. 23, S. 271 (перевод: Вейль Г. Математика. Теоретическая физи- ка.—М.: Наука, 1984, с. 100). 9.409. См. Frobenius G.— Sitzungsber. Preuss. Akad., 1898, S. 501 (имеется перевод: Фробениус Г. Теория характеров и представлений групп.— Харьков: ОНТИ ДНТВУ, 1937, с. 128). 10.412. Heitler IF., London F.— Zeits. f. Phys., 1927, Bd. 44, S. 456; Heitler W.— Zeits. f. Phys., 1927, Bd. 46, S. 47; London F. в том же томе, S. 455; Heitler IF.—Gott. Nachr., 1927, S. 368; Zeits. f. Phys., 1928, Bd. 47, S. 835; London F.— Zeits. f. Phys., 1928, Bd. 50, S. 24; Heitler W.— Zeits. f. Phys., 1928, Bd. 51, S. 805; Delbruck M.— Zeits. f. Phys., 1928, Bd. 51, S. 181; London F.— In: Quanten theorie und Chemie: Leipziger Vortrage 1928.— Leipsic, 1928, S. 59; Zeits. f. Phys., 1930, Bd. 63, S. 245; Born M.— Zeits. f. Phys., 1930, Bd. 64, S. 729; Slater J. C.— Phys. Rev., 1931, v. 37, p. 481; v. 38, p. 1109; Pauling L.— Journ. Ann. Chem. Soc., 1931, v. 53, p. 1367. 11.413. Разъяснение по этому поводу см. у В. Гайтлера (Heitler W.— Naturwiss., 1929, Bd. 17, S. 546). 12.413. Расчет приводится в первой статье Гайтлера и Лондона — см. ссылку [10]. Кроме того, см.: Sugiura Y.— Zeits. f. Phys., 1927, Bd. 45, S. 484; Wang S. C.— Phys. Rev., 1928, v. 31, p. 579; 1927, v. 28, p. 663; Kemble E. C., Zener C — Phys. Rev., 1929, v. 33, p. 512; Mor- se P. M., Stuckelberg E. C. G.— Phys. Rev., 1929, v. 33, p. 932. 13.418. Zeits. f. Phys., 1928, Bd. 50, S. 24. 14.419. Zeits. f. Phys., 1928, Bd. 49, S. 619; Sommerfeld — Fest- schrift: Probleme der modernen Physik.— Leipsic, 1929. 15.432. П. A. M. Дирак — см. [2]. Относительно детального вы- числения термов следующего этой схеме и примеров см. статьи Слетера, Кондона, Кондона — Шортли, Борна — Ру мера из ссылки [4] к гл. IV.
СПИСОК ЛИТЕРАТУРЫ 485 16.432. Введение операторов симметрии с в теорию инвариантов принадлежит А. Юнгу — см. [1]. Но он не доказал неприводимости ни ни для первого это было сделано в: Frobenius G.— Sitzungsber. Preuss. Akad., 1903, S. 328, а для второго: Cartan E.— Bull. Soc. Math, d. France, 1913, v. 41, p. 53 и Г. Вейлем — см. [8]. Классы симметрии были переоткрыты в квантовой механике Ф. Хундом: Hund F.— Zeits. f. Phys., 1927, Bd. 43, S. 788. 17.437. Изложение от теоремы (14.2) до (14.8) следует ходу мысли, сообщенному автору в письме И. фон Неймана. 18.445. См. Ф. Хунд [16]; v. Neumann J., Wigner Е.— Zeits. f. Phys., 1928, Bd. 47, S. 203; Bd. 49, S. 73. 19.446. London F.— Zeits. f. Phys., 1928, Bd. 46, S. 455. 20.448. Heitler W — Zeits. f. Phys., 1928, Bd. 51, S. 805. 21.455. Следует Г. Вейлю— см. ссылку [8]. Точно таким же образом можно вычислить характеристики группы вращений в n-мерном прост- ранстве, «комплексной группы» и всех полупростых групп: Math. Zeits., 1926, Bd. 24, S. 328, 377, 789 (перевод: Вейль Г. Математика. Тео- ретическая физика.—М.: Наука, 1984, с. 134—197). 22.460. См. [8]. При установлении требования унитарности дока- зательство, с помощью которого мы получаем все неприводимые пред- ставления группы сп, требует использования инфинитезимальных эле- ментов группы. Исследование, проделанное для ил, было выполнено для Си при самых широких предположениях . И. Фон Нейманом: v. Neu- mann J.— Sitzungsber. Preuss. Akad., 1927, S. 26; Math. Zeits., 1929, Bd. 30, S. 3, и И. Шуром: Schur I.— Sitzungsber. Preuss. Akad., 1928, S. 100. 23.462. Sitzungsber. Preuss. Akad., 1900, S. 516 (имеется перевод: Фробениус Г. Теория характеров и представлений групп.— Харьков: ОНТИ ДНТВУ, 1937, с. 170).
СПИСОК ОБОЗНАЧЕНИЙ Операционные символы (Число указывает номер страницы, на которой определяется символ) —► с ... связано ... 22, 143 (Z содержится в 353 х комплексное сопряжение х 33 * транспозиция: для операторов 34, величин симметрии 425, схем симметрии 436 ~ эрмитово сопряжение: для операторов 35, элементов алгебры 210 - a (s) = а (s-1) 360 о контрагредиентная матрица 159, контрагредиентное представле- ние 159 ~ эквивалентно для отображений поля лучей 39 ~ преобразуется как 184 ( ) скалярное произведение 33, 53 [ ] векторное произведение (в трехмерном пространстве) 47; ком- мутатор [7/Л]==Д- (НА—АН) 323 < > среднее по времени значение 117 X для векторов 119, векторных пространств 119, отображений 120, представлений 119, групп 163, алгебр и их элементов 403 X умножение представлений двух групп 164 сложение представлений 162 # переход от к $ 349 fcj переход от $ к £ 350 Условные обозначения, имеющие одно и то же значение по всей книге (Число указывает номер страницы, на которой определяется величина) Латинские с скорость света; оператор симметрии Юнга 434 е примитивный идемпотентный элемент (порождающая единица 353); —е—заряд электрона е (х) = eix (Ех, Еу, Ez) — & напряженность электрического поля 130 Ei энергетический уровень f число электронов, порядок тензора 177, 341 F действие электромагнитного поля 266 F (it. i»...iA тензор 177. 341
СПИСОК ОБОЗНАЧЕНИЙ 487 g размерность представления группы 198, множитель Ланде 253, 257 h квант действия Планка, деленный на 2л 74, порядок конеч- ной группы 152 Н энергия 75 (Нх, Н Hz) = § напряженность магнитного поля 130 I четность 235 /, J внутреннее квантовое число 237, 238 вектор полной энергии-импульса 272 k дополнительное квантовое число 281 I, L азимутальное квантовое число 50, 231, 242—для s, р, d, f, g ... термов Z = 0, 1, 2, 3, 4, ... (Lx, Ly, Lz) = & орбитальный момент импульса 90 m магнитное квантовое число 90, 240; кратность представления 389, 423; (=р,) масса электрона mQ = mcjh М, М' действие материального поля 262 (Мх, Му, Mz) = $ft полный момент импульса 224, 234 п размерность векторного пространства 17, главное квантовое чис- ло 95 е | Н | о = множитель Лармора — единица Зеемановского расщеп- ления р, q канонически сопряженные переменные 123, перестановка строк, столбцов в схеме симметрии 433 (рх, Ру, Pz) = $ импульс частицы 75 Р схема симметрии 432 (qx, Qy, Qz) = q электрический дипольный момент 111 г расстояние от центра s элемент группы; спиновое квантовое число (sx, Sy, sz)^§ плотность электрического тока 269, sa—4-вектор заряда-тока 265 (Sx, Sy, Sz)—-& спин 224, 252 /а тензор энергии-импульса Т перестановка ipi, 4>2 и ip', ip' 189 v валентность 445 W энергия возмущения 114, полное действие 267 х0^1Х2Хз или txyz—координаты пространства-времени (/ = х0—129, или ct = x0— 261) Готические (для трехмерных векторов — см. их компоненты выше) С = СП группа (унимодулярных) линейных преобразований для п измерений 164 ((/) представление группы с, субстрат которого составляют тензоры порядка f 124 0^ = 2)/(v = 2j) представление у-го порядка группы с2 или ц2 ~ Ьз 165, 185 ортогональная группа для п измерений 181; bn-—то же самое, но включая несобственные вращения 182 2(z/2) одномерное представление группы вращений Ь2 179 Ci, е2, ..., система координат в векторном пространстве 19
488 СПИСОК ОБОЗНАЧЕНИЙ ® унитарное представление группы вращений, индуцированное в пространстве функций ф (х, у, г) 183 g абстрактная группа 148 t сопряжение 153 95)1 среднее значение 200 91 представление группы вращений, индуцированное в простран- стве состояний системы 233 ф, инвариантное подпространство пространств г, 91^ соответ- ственно 343, 349 г алгебра, рассматриваемая как векторное пространство 348; ro = rn = gt/ 353, 422 91 векторное пространство 17; ЭК—соответствующее пространство тензоров порядка /; [9У] — пространство симметричных тензоров, {ЭК}— пространство антисимметричных тензоров 293, 296 91/, 91я пространство состояний для перемещений и спина элект- рона 244 ta левая трансляция 150 U = un л-мерная унимодулярная унитарная группа 177 Ж проективное представление, приводящее к алгебре комплекс- ных кватернионов 228 £ вектор в n-мерном векторном пространстве 17 Греческие a — e2)ch—постоянная тонкой структуры 267 6/& символ Кронекера =1 (i — k) или 0 (/ k) 37 + 8 6 (х)—6-функция Дирака (= 0 всюду кроме х = 0 и J 6 (х) dx=l) -8 312 65 = ± 1 согласно тому, является ли s четной или нечетной пе- рестановкой 156 6 четность 250 А — д2/дх2 Д-d2/dr/2 + d2/dz2 оператор Лапласа 76 ?=У5“Л-263 дха а 8 порождающий элемент право- или левоинвариантного подпрост- ранства 377 0, ф полярные координаты 85 у, (= т) масса электрона v частота 74 л = лу симметрическая группа перестановок f объектов 156 р плотность электрического заряда 269; алгебра 370 фа 4-вектор электромагнитного потенциала 129 ф вектор, определяющий состояние материального поля 73 %, X групповые характеристики 190, 191 со угол вращения 192
ПРИМЕЧАНИЯ РЕДАКТОРА ПЕРЕВОДА (1) (с. 8). Концепция «обновленной математики», высказанная в этом предисловии Г. Вейлем, нашла свое полное подтверждение во всем дальнейшем развитии современной математики. Понятие абст- рактной алгебры в наше время — одно из центральных математиче- ских понятий, равно как и объект исследования. В приложениях к квантовой физике принципиальную роль играют так называемые опе- раторные алгебры и их абстрактные аналоги (С*-алгебры, IF*-алгеб- ры или алгебры фон Неймана, некоторые классы Йордановых алгебр и т. д.) [1, 4, 13] *). Изучение автоморфизмов этих алгебр (точнее, динамических квантовых систем) приводит непосредственно к тео- рии представлений групп операторами некоторых векторных (напри- мер, гильбертовых) пространств. Открытие квантовой механики вы- звало к жизни и современную теорию представлений групп (в част- ности, групп и алгебр Ли), у истоков которой стоит книга Г. Вей- ля. Общие сведения о современных методах теории представлений групп можно найти в [14, 15, 19]. В [27] детально изложены струк- турные вопросы, связанные с мерой Хаара. Обзор математических методов, используемых в квантовой теории, можно найти в [2, 3]. Более детальный анализ проблемы намечен в многотомном издании [21]. Последние годы ознаменованы новым намечающимся синтезом меж- ду математикой и физикой. Этот этап пока еще слабо отражен в книж- ной литературе. См., например, [18, 23]. (2) (с. 10). Проблема «протона и электрона» возникла в 1928 г., когда Дирак предложил релятивистское волновое уравнение для опи- сания движения электрона и дал новое представление о вакууме как состоянии, в котором электроны занимают все уровни с отрицатель- ной энергией. Кроме того, он заметил, что возмущение вакуума, когда один такой уровень не занят, так называемая дырка, проявляет себя как частица с положительной энергией и положительным зарядом и предположил, что она соответствует протону. Такая интерпрета- ция привела к известным трудностям. На одну из них указал Г. Вейль в первом издании этой книги (1928 г.). Он отметил, что в силу свойств симметрии уравнения Дирака масса дырки должна совпадать с мас- сой электрона. Другое противоречие, связанное со временем жизни свободного электрона вблизи дырки, было найдено Оппенгеймером в 1930 г., который предложил называть гипотетическую частицу (дыр- ку) «положительным электроном» или «позитроном». Выход из создавшейся ситуации был найден Дираком в 1931 г. Он ввел в физику новое фундаментальное понятие античастицы, а *) Здесь и далее в примечаниях ссылки даются на дополнитель- ный список литературы.
490 ПРИМЕЧАНИЯ РЕДАКТОРА ПЕРЕВОДА годом позже Андерсон обнаружил позитроны в космических лучах. Таким образом, решение проблемы «протон—электрон» привело к от- крытию фундаментальных представлений об антиматерии. (3) (с. 16). Современный читатель может познакомиться с эле- ментами линейной алгебры по многим хорошим учебникам. См., напри- мер, [10, 16]. (4) (с. 18). В противном случае (т. е. если хотя бы один из коэф- фициентов ci отличен от нуля) векторы а/ называются линейно зови- самыми. (5) (с. 21). В современной терминологии называется фактор- пространством Ж по Ж', с обозначением (6) (с. 28). Термин «норма» в этом контексте связан с традици- ями теории чисел. Впоследствии этот термин получил другое значе- ние в теории нормированных пространств (см., например, [16]). (7) (с. 33). Такие формы обычно называют полуторалинейными (они линейны по р и антилинейны по £, т. е. линейны по £)• (8) (с. 40). Из вещественности формы (Aj, £) следует вещест- венность собственных значений а/ (f=l, ..., п). (9) (с. 51). Неравенство (6.10), известное еще Коши (1821 г.), есть частный случай общего неравенства Шварца из теории унитарных (в частности, гильбертовых) пространств. (10) (с. 53). В настоящее время термин «гильбертово простран- ство» означает «полное унитарное пространство» (относительно мет- рики р (£, р)=((£— Р)2)1^. Всякое гильбертово пространство обла- дает ортонормированным базисом е/, i е I (е/, Су) = О/y), где I — множество индексов, мощность которого не зависит от выбора базиса и называется (гильбертовой) размерностью данного пространства. Например, «функциональное пространство», определяемое в тексте (и обозначаемое обычно L2(0, 2 л)), имеет счетную размерность. См. по этому поводу замечание автора на с. 55 (после формулы (7.3)), а также ссылку на работу И. фон Неймана в конце главы 1. (11) (с. 59). Более подробно содержание этой «спектральной тео- ремы» изложено, например, в [21]. (12) (с. 107). См. [4], [30] относительно развития этих общих кон- цепций квантовой механики. (13) (с. 119). Автор называет % «пространством-произведением» пространств Я и В современной терминологии пространство & на- зывается} тензорным произведением пространств 9J и (14) ‘(с. 129). Как показывает более детальный анализ логиче- ских основ квантовой механики, выражение энергии через канониче- ские переменные может быть выведено, по крайней мере для свобод- ных частиц, из общих принципов инвариантности квантовых систем относительно группы Галилея. Набросок такого доказательства имеет- ся в [26], причем это рассуждение может быть при известных посту- латах сделано более строгим. Относительно исчисления функций от некоммутирующих переменных р, q см. [28]. (15) (с. 181). Полнота означает в данном случае, что гильбертово пространство Н=Ь2 (0, 2л) есть прямая ортогональная сумма одно- мерных пространств Нп (п=0, ±1, ±2, ...), где Нп натяну*го на экс- поненту en(a}—ein^, причем представление $ индуцирует в Нп не- приводимое представление группы Ь2 с номером п. При этом Й со- держит всюду плотное подпространство тригонометрических поли- номов, в котором Ji есть прямая алгебраическая сумма неприводимых представлений. (16) (с. 182). В наше время общепринята точка зрения на теорию
ПРИМЕЧАНИЯ РЕДАКТОРА ПЕРЕВОДА 491 специальных функций как на «функциональный аспект» теории пред- ставлений групп (либо других алгебраических структур: полугруп- пы, алгебры Ли и т. д.). См., например, [9]. (17) (с. 193). Утверждение I справедливо и в бесконечномерных векторных пространствах. Утверждение II также обобщается на счет- номерные векторные пространства (см., например, [15]), при усло- вии алгебраической замкнутости основного поля. Аналоги утвержде- ний I и II известны также для некоторых (например, унитарных) се- мейств операторов в гильбертовых пространствах. (18) (с. 194). Другими словами, S есть полугруппа, составлен- ная из линейных отображений данного векторного пространства. (19) (с. 269). Более подробно эти идеи развиты в статье Г. Вей- ля «Электрон и гравитация». Русский перевод статьи имеется в [5]. (20) (с. 340). Другой подход к доказательству единственности операторов (15.3) основан на теореме Стоуна—фон Неймана, согласно которой всякое неприводимое унитарное представление группы G, порожденной экспонентами eW, задается с точностью до уни- тарной эквивалентности операторами (15.3) в гильбертовом про- странстве L2 (R). Различные варианты доказательства этой теоремы можно найти в [15], [28]. В [21] имеется обсуждение инфинитезималь- ного аналога этой теоремы. (21) (с. 343). Термин «проекция» в современной литературе ис- пользуется только для параллельного проектирования. (22) (с. 343). «Подобные преобразования» принято называть спле- тающими операторами. (23) (с. 367). В современной литературе поле всегда предпола- гается коммутативным. Алгебраический объект, определяемый Г. Вей- лем как «поле», в настоящее время называется телом. (24) (с. 386). Теория представлений конечных групп излагается в ряде учебников и монографий. См., например, [24]. (25) (с. 445). Относительно представлений симметрической груп- пы см. [24]. ДОПОЛНИТЕЛЬНЫЙ СПИСОК ЛИТЕРАТУРЫ 1. Averson W. An Invitation to C*-algebras.— Berlin: Springer- Verlag, 1976. 2. Барут А., Рончка P. Теория представлений групп и ее прило- жения.— М.: Мир, 1980. 3. Boerner Н. Representations of Groups with Special Considerations for the Needs of Mathematical Physics.— Amsterdarh: North-Holland, 1963. 4. БраттелиУ., Робинсон Д. Операторные алгебры и квантовая статистическая механика.— М.: Мир, 1982. 5. Вейль Г. Избранные труды. Математика. Теоретическая физи- ка.— М.: Наука, 1984. 6. Вейль Г. Классические группы, их инварианты и представле- ния.— М.: ИЛ, 1947. 7. Весе Ю., Беггер Дж. Суперсимметрия и супергравитация.— М.: Мир, 1986. 8. Вигнер Е. П. Теория групп и ее приложения к квантовомехани- ческой теории спектров.— М.: ИЛ, 1961. 9. Виленкин Н. Д. Специальные функции и теория представлений групп.— М.: Наука, 1965.
492 ПРИМЕЧАНИЯ РЕДАКТОРА ПЕРЕВОДА 10. Гельфанд И. М. Лекции по линейной алгебре.— М.: Наука, 1966. 11. Глимм Дж., Джаффе А. Математические методы квантовой физики.—М.: Мир, 1984. 12. Девитт Б. С. Динамическая теория групп и полей.— М.: Наука, 1987. 13. Диксмье Ж. С*-алгебры и их представление.—М.: Наука, 1974. 14. Желобенко Д. П., Штерн А. И. Представления групп Ли.— М.: Наука, 1983. 15. Кириллов А. А. Элементы теории представлений.— М.: Наука, 1978. 16. Кострикин А. И., Манин Ю. И. Линейная алгебра и геомет- рия.—М.: Изд-во МГУ, 1980. 17. Ляховский В. Д., Болохов А. А.— Группы симметрии и экст- ремальные частицы. Л.: Изд-во ЛГУ, 1983. 18. Манин Ю, И. Калибровочные поля и комплексная геометрия.— М.: Наука, 1984. 19. Наймарк М. А. Теория представлений групп.— М.: Наука, 1976. 20. Рамон П, Теория поля. Современный вводный курс.— М.: Мир, 1984. 21. Pud М., Саймон Б. Математические методы современной фи- зики, т. 1—4.— М.: Мир, 1977—1982. 22. Румер Ю. Б., Фет А. И. Теория групп и квантованные по- ля.—М.: Наука, 1977. 23. Сато К», ДзимбаМ., Мива Т. Голономные квантовые поля.— М.: Мир, 1983. 24. Серр Ж.-П. Линейные представления конечных групп.— М.: Мир, 1970. 25. Фадеев Л. Д., Якубовский О. А. Лекции по квантовой механике для студентов-математиков.—Л.: Изд-во ЛГУ, 1980. 26. Холево А. С. Вероятностные и статистические аспекты кванто- вой механики. 27. Хьюитт Э., Росс К- Абстрактный гармонический анализ, том. 1.— М.: Наука, 1975, т. 2.—М.: Мир, 1975. 28. Hove R. Quantum Mechanics and Partial Differential Equati- ons.— Journ. Funct. Anal., 1980, v. 38, p. 188—254. 29. Эллиот Дж., Добер П. Симметрии в физике, т. 1—2.—М.: Мир, 1983. 30. Эмх Ж. Алгебраические методы в статистической механике и в квантовой теории поля.— М.: Мир, 1976.
ОГЛАВЛЕНИЕ Предисловие редактора перевода............................... 5 Из предисловия автора к первому немецкому изданию............ 7 Предисловие автора ко второму немецкому изданию............ 9 Введение..................................................... 13 Глава I. Унитарная геометрия................................ 17 § 1. Векторное пространство /г измерений................ 17 § 2. Линейные отображения. Матричное исчисление .... 22 § 3. Двойственное векторное пространство ............... 29 § 4. Унитарная геометрия и эрмитовы формы............... 33 § 5. Преобразование к главным осям...................... 40 § 6. Инфинитезимальные унитарные преобразования....... 47 § 7. Замечания о оо-мерном пространстве................. 52 Глава II. Квантовая теория.................................................................................... 63 § 1. Физические основы................................................................................... 63 § 2. Волны де Бройля для частиц.......................................................................... 72 § 3. Волновое уравнение Шредингера. Гармонический ос- циллятор ............................................... 78 § 4. Сферические гармоники. 85 § 5. Электрон в сферически-симметричном поле. Простран- 89 ственное квантование ............................ § 6. Процессы столкновений........................................................... 96 § 7. Концептуальная структура квантовой механики ... 101 § 8. Динамический закон. Вероятности переходов .... 107 § 9. Теория возмущений...... 114 § 10. Задача двух тел. Пространство-произведение .... 118 §11. Перестановочные соотношения. Канонические преоб- разования ............................................. 123 § 12. Движение частицы в электромагнитном поле. Эффект Зеемана и эффект Штарка................................ 129 § 13. Взаимодействие атома с излучением.................................................................. 134 Глава III. Группы и их представления........................... 143 § 1. Группы преобразований..................................................... 143 § 2. Абстрактные группы и их реализация........................... 147 § 3. Подгруппы и классы сопряженных элементов .... 151 § 4. Представления групп линейными преобразованиями 155 § 5. Формальные процессы. Ряд Клебша — Гордана . . . 159 § 6. Теорема Жордана — Гёльдера и ее аналоги. 169 § 7. Унитарные представления. 174 § 8. Группа вращений и группа Лоренца............... 179
494 оглавление § 9. Характер представления................................... 190 § 10. Лемма Шура и теорема Бернсайда........................... 192 § 11. Свойства ортогональности характеров групп............. 198 § 12. Развитие теории для компактных непрерывных групп 202 § 13. Групповая алгебра................................... 208 § 14. Инварианты и коварианты............................. 214 § 15. Замечания о теории Ли непрерывных групп преобразо- ваний .............................................. 219 § 16. Представление вращениями пространства лучей . . . 226 Глава IV. Применение теории групп к квантовой механике ... 231 А. Группа вращений............................................... 231 § 1. Представление группы вращений в пространстве состоя- ний ................................................ 231 § 2. Простые состояния и анализ термов. Примеры .... 239 § 3. Правила отбора и правила интенсивностей....... 245 § 4. Вращающийся электрон, мультиплетная структура и аномальный эффект Зеемана........................... 252 Б. Группа Лоренца................................................ 260 § 5. Релятивистски инвариантные уравнения движения электрона........................................... 260 § 6. Энергия и импульс. Замечания о перестановке прошло- го и будущего....................................... 269 § 7. Электрон в сферически-симметричном поле............... 279 § 8. Правила отбора. Тонкая структура...................... 285 В. Группа перестановок........................................... 291 § 9. Резонанс между эквивалентными объектами.................. 291 § 10. Принцип запрета Паули и структура периодической системы элементов................................... 297 § 11. Задача многих тел и квантование волнового уравнения 302 § 12. Квантование полевых уравнений Максвелла —Дирака 309 § 13. Законы для энергии и импульса в квантовой физике. Релятивистская инвариантность....................... 322 Г. Квантовая кинематика........................................... 331 § 14. Квантовая кинематика как абелева группа вращений 331 §15. Вывод волнового уравнения из перестановочных соот- ношений ............................................ 337 Г лава V. Симметрическая группа перестановок и алгебра симмет- рических преобразований.............................. 341 А. Общая теория.................................................. 341 § 1. Группа, индуцированная в тензорном пространстве, и алгебра симметрических преобразований.......... 341 § 2. Классы симметрии тензоров........................ 348 § 3. Инвариантные подпространства в групповом простран- стве 353 § 4. Инвариантные подпространства в тензорном простран- стве 359 § 5. Поля и алгебры................................... 366 § 6. Представления алгебр............................. 370 § 7. Конструктивное приведение алгебры к простым матрич- ным алгебрам................................... 375
ОГЛАВЛЕНИЕ 495 Б. Расширение теории и физические при- ложения ................................................ 387 § 8. Характеры симметрической группы и вырождение эк- вивалентных состояний в квантовой механике .... 387 § 9. Соотношение между характерами симметрической груп- пы перестановок и характерами аффинной группы . . 395 § 10. Прямое произведение. Подгруппы.................... 401 §11. Теория возмущений и образование молекул...... 410 § 12. Проблема симметрии в квантовой теории............. 419 В. Явное алгебраическое построение............432 § 13. Операторы симметрии Юнга.......................... 432 § 14 .. Неприводимость, линейная независимость, неэквива- лентность и полнота................................. 437 § 15. Спин и валентность. Теоретико-групповая классифи- кация атомных спектров.............................. 445 § 16. Определение примитивных характеров групп и и л . . 454 § 17. Вычисление объема на группе U..................... 464 § 18. Законы ветвления.................................. 468 Дополнения ................................................. 471 1. Доказательство неравенства........................... 471 2. Композиционное свойство групповых характеров .... 473 3. Теорема о невырожденных антисимметрических билиней- ных формах.............................................. 474 Список литературы........................................... 475 Список обозначений.......................................... 486 Примечания редактора перевода............................... 489 Дополнительный список литературы........................ 491
Герман Вейль ТЕОРИЯ ГРУПП И КВАНТОВАЯ МЕХАНИКА Серия «Библиотека теоретической физики» Редактор В. Я- Дубнова Художественный редактор Т. Н. Кольченко Технический редактор В. Н. Кондакова Корректоры О. А. Бутусова, И. Д. Кришталь ИБ № 12454 Сдано в набор 23.01.86. Подписано к печати 11.10.86. Формат 84x108/32. Бумага книжно-журнальная. Гарнитура литературная. Печать высокая. Усл. печ. л. 26,15. Усл. кр.-от. 26,1. Уч.-изд. л. 26,27. Тираж 16 700 экз. Заказ № 2278. Цена 2 р. 30 к. Ордена Трудового Красного Знамени издательство «Наука» Главная редакция физико-математической литературы 1 17071 Москва В-71, Ленинский проспект, 15 Ордена Октябрьской Революции и ордена Трудового Красного Знамени МПО «Первая Образцовая типография» имени А. А. Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 1 13054 Москва М-54, Валовая, 28 Отпечатано во 2-й тип. изд-ва «Наука» 121099 Москва Г-99, Шубинский пер., 6 Зак. 3124