Text
                    П. А. М. Дирак
ПРИПЦИПЫ КВАПТОВОЙ МЕХАПИКИ
Книга П. А. М. Дирака давно и заслуженно пользуется всемирной
известностью. В ней дается совершенно оригинальное, последовательно
выдержанное построение квантовой механики, начиная с самых основ и кончая
важными физическими приложениями. В книге разобрано с большим
математическим изяществом много физических задач. Материал книги изложен
исключительно ясно в весьма малом объеме. Второе издание русского перевода
отличается от первого, вышедшего в 1960 г. под редакцией В. А. Фока,
некоторыми редакционными изменениями и уточнениями текста.
Книга дополнена переводом работы П. Дирака «Лекции по квантовой
механике», выходившим в 1968 г.
ОГЛАВЛЕНИЕ
Предисловие редактора серии	5
От редактора русского издания	6
Из предисловия автора к	8
русскому изданию
Из предисловия к первому	9
изданию
Глава I. Принцип суперпозиции	11
§ 1. Потребность в квантовой	11
теории
§ 2. Поляризация фотонов	15
§ 3. Интерференция фотонов	18
§ 4. Суперпозиция и	21
индетерминизм
§ 5. Математическая	27
формулировка принципа
§ 6. Векторы бра и кет	32
Глава П. Динамические	37
переменные и наблюдаемые
§ 7. Линейные операторы	37
§ 8. Соотношения	41
сопряженности
§ 9. Собственные значения и	45
собственные векторы
§ 10. Паблюдаемые	52
§11. Фупкции наблюдаемых	60
§ 12. Общее физическое	67
толкование
§ 13. Коммутативность и
совместность
Глава Ш. Представления
§ 14. Базисные векторы
§ 15. Дельта-функция
§ 16. Свойства базисных
векторов
§ 17. Представление линейных
операторов
§ 18. Амплитуды вероятности
§ 19. Теоремы о функциях
наблюдаемых
§ 20. Усовершенствование
обозначений
Глава IV. Квантовые условия
§ 21. Скобки Пуассона
§ 22. Шредингеровское
представление
§ 23. Импульсное представление
§ 24. Принцип неопределенности
Гейзенберга
§ 25. Операторы сдвига
§ 26, Унитарные преобразования
Глава V. Уравнения движения
§ 27. Шредингеровская форма
уравнений движения
71
77
77
84
88
95
102
107
ПО
117
117
123
130
134
136
141
148
148


§ 28. Гейзенберговская форма 152 уравнений движения § 29. Стационарные состояния 158 § 30. Свободная частица 160 §31. Движение волнового пакета 164 § 32. Принцип действия 169 §33. Ансамбль Гиббса 177 Глава VI. Элементарные 183 приложения § 34. Гармонический осциллятор 183 § 35. Момент количества 188 движения § 36. Свойства момента 193 количества движения § 37. Спин электрона 200 § 38. Движение в центральном 204 силовом поле § 39. Уровни энергии атома водорода § 40. Правила отбора § 41. Явление Зеемана для атома водорода Глава VII. Теория возмущений § 42. Общие замечания § 43. Изменение уровней энергии, вызываемое возмущением § 44. Возмущение как причина переходов § 45. Приложение к излучению § 46. Переходы, вызываемые возмущением, не зависящим от времени § 47. Аномальный эффект 240 Зеемана Глава VIII. Задачи о 246 столкновениях § 48. Общие замечания 246 § 49. Коэффициент рассеяния 250 § 50. Решение задачи в 256 импульсном представлении § 51. Дисперсионное рассеяние 263 § 52. Резонансное рассеяние 266 § 53. Испускание и поглощение 269 Глава IX. Системы, содержащие 274 несколько одинаковых частиц § 54. Симметричные и 274 антисимметричные состояния § 55. Перестановки как 280 динамические переменные § 56. Перестановки как 281 интегралы движения § 57. Определение уровней 286 энергии § 58. Применение к электронам 290 210 213 220 223 223 224 229 234 237 Глава X. Теория излучения § 59. Ансамбль бозонов § 60. Связь между бозонами и осцилляторами § 61. Испускание и поглощение бозонов § 62. Применение к фотонам § 63. Энергия взаимодействия между фотоном и атомом § 64. Испускание, поглощение и рассеяние излучения § 65. Ансамбль фермионов Глава XI. Релятивистская теория электрона § 66. Релятивистское 297 297 300 307 310 315 322 326 332 332 рассмотрение частицы § 67. Волновое уравнение для 334 электрона § 68. Инвариантность 339 относительно преобразований Лоренца § 69. Движение свободного 342 электрона § 70. Существование спина 346 § 71. Переход к сферическим 350
координатам § 72. Тонкая структура уровней 353 энергии водорода § 73. Теория позитронов 357 Глава XII. Квантовая 361 электродинамика § 74. Электромагнитное поле в 361 отсутствие вещества § 75. Релятивистская форма 366 квантовых условий § 76. Шредингеровские 370 динамические переменные § 77. Дополнительные условия 375 § 78. Электроны и позитроны в 381 отсутствие поля ПРЕДМЕТНЫЙ Амплитуда вероятности 103 относительная 104 Аналогия классическая 117 Ансамбль Гиббса 177 Антикоммутативность 201 Антилинейность 39 Возе статистика 278 Ьозон 278 Ьорна — Инфельда электродинамика 459, 470-^72 Ьра-вектор 28, 35 стандартный 113 Вектор 28 — антисимметричный 276 — базисный 88 — длина 33 — симметричный 276 Весовая функция представления 95 Волновая функция 112, 152 Волновой пакет 164 Волны де Ьройля 163 Вторичное квантование 303 фермионов 331 Гамильтона метод 415, 481 — оператор 156 § 79. Взаимодействие 388 § 80. Физические переменные 394 § 81. Трудности теории 399 404 Приложение. О каноническом преобразовании в классической и квантовой механике (В.А.Фок) 408 Лекции по квантовой механике Лекция 1. Метод Гамильтона 408 Лекция 2. Проблема квантования 427 Лекция 3. Квантование на 442 искривленных поверхностях Лекция 4. Квантование на 459 плоских поверхностях Предметный указатель 476 УКАЗАТЕЛЬ Гамильтониан 155, 156, 414 — полный 417 Гамильтонов формализм 413 обобщенный 421 Гейзенберга картина 153 — представление 159 Гиббса ансамбль 177 Гильберта пространство 59 Действие 173 Дельта-функция 84 Динамическая переменная 27, 40, 41 вещественная 48 второго рода 421 гейзенберговская 154 наблюдаемая 55 первого рода 428 шредингеровская 154 — система 27 Дпрака матрица 337 — представление 231 — уравнение 338 Дисперсионная формула Крамерса — Гейзенберга 326 Дополнительное условие Ферми 375 Дырка 360
Зеемана эффект 222, 242 Зоммерфельда формула 356 Импульсное представление 133 Интеграл действия 411 — по путям 176 Канонические переменные 118 Картина движения гейзенберговская 153 шредингеровская 152 Касательное преобразование 144, 145, 404-^07 Квантовые условия 117 основные 121 Кет-вектор 28, 29 стандартный 111 Классическая аналогия 117 Лагранжа функция 173, 411 Лагранжиан 411 Ланде формула 244 Магнитная аномалия спина 222 Магнитный момент электрона 348 Матрица 96 — обобщенная 98 — унитарная 143 — эрмитова 97, 98 Матричный элемент 96 Момент орбитальный 191 — спиновый 191 Паблюдаемые 55 — коммутирующие 72 , полный набор 82 Песобственная функция 84 Пулевая энергия 307 Оператор антисимметризующий 327 — вращения 191 — Гамильтона 156 — линейный 37 вещественный 42, 48 самосопряженный 42 сопряженный 41 — сдвига 136 — симметризующий 297 — унитарный 143 — физический 376 Орбитальный момент 191 Паули принцип 279 Переменная динамическая — см. Динамическая переменная Перенормировки 471 Перестановка 276 Перестановочная функция электромагнитного поля 367 электрон-позитронов 387 Перестановочные соотношения 117 Планка постоянная 120 Плотность вероятности 339 Позитрон 359 Полная система 55 Поляризации состояние 15 Правила отбора 213—220 Представитель 77 Представление 77 — взаимодействия 231 — гейзенберговское 159 — Дпрака 231 — импульсное 133 — ортогональное 79 — симметричное 275 — фоковское 187 — шредингеровское 129 Преобразования унитарные 143 Принцип действия 173, 410 — неопределенности 135 — Паули 279 — сунерпозиции 15, 27 Промежуточные состояния 233 Пространство векторов состояний 28, 59 — Гильберта 59 Рассеяния коэффициент 250 Связи 422 — вторичные 418 — второго рода 422 — первичные 413 — первого рода 422 — сунерпозиционные 26
Система атомная 23 — вырожденная 228 Система динамическая 27 — невырожденная 228 Скобки Пуассона 118, 415 квантовые 120 , соотношения 427 Слабое равенство 377 Собственная энергия 237 Собственные векторы 46 — значения 46 Состояние 23, 24 — антисимметричное 276 — движения 24 — динамической системы 27 — квантовое 24 — нестационарное 249 — поглощения 249 — поляризации 15 — промежуточное 233 — симметричное 276 — стационарное 159, 264 Спин электрона 200 Суперпозиции принцип 15, 23, 27 , математическая формулировка 30 Суперпозиция 15, 19, 21, 24, 26 Унитарное преобразование 143 Уравнение Гамильтона — Якоби 166 — Дпрака338 — неразрывности 168, 177 — Шредингера, волновое 152 Уравнения движения гамильтоновы 415 , гейзенберговская форма 154 , шредингеровская форма 150 Условие дополнительное 375 — квантовое 117 — частот Бора 160 Фазовое пространство 177 Фазовый множитель 36 Фермионы 278 Фупкция Гамильтона 155 — Лагранжа 173 — преобразования 106 — упорядоченная 176 Электромагнитное поле 365 и д. , дополнительное условие 375 , оператор Гамильтона 366 , перестановочная функция 367—369 , поперечная часть 362 , продольная часть 362 Элемент диагональный 96 — матричный 96
ПРЕДИСЛОВИЕ РЕДАКТОРА СЕРИИ Вторым томом «Библиотеки теоретической физики» мы предлагаем знаменитую книгу одного из крупнейших физи- физиков нашего столетия. Первый вариант ее был создан в конце 20-х годов вскоре после завершения квантовой механики и непосредственно вслед за созданием автором релятиви- релятивистской квантовой теории электрона. Несмотря на такой солидный возраст, книга и по сей день представляет большую ценность как для специали- специалистов, так и для студентов. Русский перевод последнего четвертого английского из- издания вышел в 1960 г. под редакцией академика В. А. Фока. Настоящая публикация отличается от предыдущей рядом технических деталей. Терминология приближена к ориги- оригиналу. Кроме того, в данном томе воспроизведен перевод работы Дирака «Лекции по квантовой механике», опубли- опубликованный в 1968 г. издательством «Мир». В этой небольшой по объему, но емкой по содержанию, книжке разработан вопрос о квантовании систем со связями, вопрос, который в последние годы приобрел актуальность в квантовой теории поля в связи с появлением неабелевых калибровочных полей (полей Янга—Миллса). Д. В. Ширкоз 8 марта 1979 г.
ОТ РЕДАКТОРА РУССКОГО ИЗДАНИЯ Книга П. А. М. Дирака «Принципы квантовой механики» давно и заслуженно пользуется всемирной известностью. Первое английское издание ее вышло в 1930 г. (русский перевод его в 1932 г.) последнее — четвертое — в 1958 г. В ней дано совершенно оригинальное, последовательно вы- выдержанное построение квантовой механики, начиная с са- самых основ и кончая важными физическими приложениями. Если оставить в стороне первые четыре параграфа, то можно сказать, что автор строит теорию по методу «математиче- «математической гипотезы»: сперва вводится математический аппарат (начиная с теории линейных операторов), а затем для него подыскивается физическое толкование. Блестящим примером применения метода математической гипотезы является от- открытая Дираком теория позитронов. В книге разобрано с большим математическим изяще- изяществом много физических задач, причем некоторые из них впервые. Рассмотрена не только задача одного тела, включая электрон со спином и теорию столкновений, но и теория систем одинаковых частиц, описываемых симметричными и антисимметричными волновыми функциями. В конце книги излагается релятивистская теория электрона и позитрона и квантовая электродинамика, причем автор подробно останав- останавливается и на затруднениях теории. Глава о квантовой электродинамике заново написана автором для четвертого издания. Однако необходимо указать и на недостатки книги. Ед-за ли можно согласиться с некоторыми философскими высказываниями Дирака (в частности, с теми, которые содержатся в его предисловии к первому английскому изда- изданию). У читателя могут возникнуть также затруднения при чтении вводной части, составляющей начало гл. I, озаглавленной «Принцип суперпозиции». В первых четы-
ОТ РЕДАКТОРА РУССКОГО ИЗДАНИЯ ' рех параграфах этой главы сделана попытка ввести поня- понятия квантового состояния и суперпсзиьии состояний рань- раньше, чем дано опрсуелгние для волновсй функции. По наше- нашему мнению, такс-.? построение невозможно,!, эти места книги (в особенности § 4) несомненно останутся для читателя непонятными. Само понятие состояния трактуется по всей книге так, как если бы оно принадлежало атомному объекту самому по себе, в отрыве от средств наблюдения. Такая абсолютизация понятия «квантовое состояние» приводит, как известно, к парадоксам. Эти парадоксы были разъясне- разъяснены Нильсом Бором на основе представления о том, что необ- необходимым посредником при изучении атомных объектов являются средства наблюдения (приборы), которые должны описываться классически. Чтобы читатель мог восполнить имеющийся в книге Дирака пробел в физическом обосновании квантовой меха- механики, можно рекомендовать ему чтение работ Бора «Дис- «Дискуссии с Эйнштейном»*) и «Квантовая физика и филосо- философия», напечатанных в журнале «Успехи физических на- наук» **). Кроме того, по поводу некоторых утверждений Ди- Дирака редактором сделаны подстрочные примечания ***). В приложении дано отсутствующее в тексте исследование связи канонических преобразований классической и кван- квантовой механики. Несмотря на отмеченный здесь пробел, книга Дирака обладает огромными достоинствами, которые связаны, преж- прежде всего, с цельностью точки зрения автора на квантовую механику и ее математический аппарат. В книге содер- содержится очень большой материал, исключительно ясно из- изложенный в малом объеме. Эта сжатость книги является непревзойденной. Несомненно, что книга Дирака, хотя и написанная давно, надолго останется ценным пособием для всех изучающих квантовую механику. В. Фок *) УФН, 1958, т. 66, с. 571; УФН, 1959, т. 67, с. 37. **) Взгляды В. А. Фока на физические основы квантовой тео- теории изложены в его недавно переизданной книге «Начала квантовой механики» (Наука, 1976, гл. 1), явившейся в свое время A932 г.) одним из первых оригинальных и систематических курсов по квар- квартовой механике. (Прим. перев.). ***) Главы I — V переведены Ю. Н. Демковым, а гл. VI—ХП — Г, Ф. Друкаревым. О переводе введенных Дираком терминов см. под- подстрочное примечание на стр. 28.
ИЗ ПРЕДИСЛОВИЯ АВТОРА К РУССКОМУ ИЗДАНИЮ В этой книге делается упор на те принципы квантовой теории, которые, по моему мнению, являются наиболее надежными и, вероятнее всего, сохранятся при будущем развитии теории. Я не включил в книгу современную тех* нику перенормировки, так как ее нельзя обосновать с той же степенью строгости, как остальную теорию, и она едва ли поэтому уцелеет. Издание русского перевода моей книги радует меня тем, что оно свидетельствует о международном характере научной мысли и о единстве ученых всех наций. Я одобряю сделанные редактором замечания в сносках и приложении в конце книги; то и другое имеет целью об- облегчить читателю понимание затруднительных мест. 15 октября 1959 П. А. М. Дирак ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ Методы развития теоретической физики претерпели в этом столетии сильное изменение. Согласно классической традиции окружающий нас мир рассматривался как сово- совокупность наблюдаемых объектов (частиц, флюидов, полей и т. п.), движущихся под действием сил согласно определен- определенным законам, так что теория допускала наглядное представ- представление в пространстве и времени. Это приводило к физике, задачей которой было делать предположения о механизме и силах, относящихся к этим наблюдаемым объектам, так, чтобы объяснить их поведение возможно более простым способом. Но в настоящее время становится все более оче- очевидным, что природа действует иначе. Ее основные законы не управляют непосредственно миром наших наглядных представлений, но относятся к таким понятиям, о которых мы не можем составить себе наглядных представлений, на
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ 9 впадая в противоречие. Формулировка этих законов тре- требует применения математической теории преобразований. Величины, соответствующие важным понятиям в природе, являются инвариантами этих преобразований (или, в более общем случае, величинами, которые преобразуются по простым правилам). То, что мы непосредственно воспри- воспринимаем, есть отношения этих инвариантов к определенной системе отсчета, которая выбирается обычно так, чтобы добиться тех или иных специальных упрощений, несуще- несущественных для общей теории. Возрастающее применение теории преобразований, ко- которая была сначала применена в теории относительности, а затем в квантовой теории, представляет сущность нового метода в теоретической физике. Дальнейший прогресс со- состоит в том, чтобы делать наши уравнения инвариантными относительно все более широких классов преобразований. Такое положение вещей весьма удовлетворительно с фило- философской точки зрения, так как оно указывает на все возра- возрастающее признание роли наблюдателя в привнесении зако» номерностей в результаты своих наблюдений и на отсут» ствие произвола в природе, однако это делает изучение физики менее простым. Новые теории, независимо от их математической формы, построены на основе таких физи- физических понятий, которые не могут быть объяснены с помощью известных ранее понятий, и даже не могут быть объяснены адекватно словами вообще. Подобно тем основным катего» риям, которыми каждый человек должен овладевать с ро- рождения (например, понятия смежности, тождества), новые физические понятия можно освоить лишь при продолжи-» тельном знакомстве с их свойствами и их употреблением. С математической стороны ознакомление с новыми тео- теориями не представляет затруднений, так как нужные для этого отделы математики (по крайней мере те, которые были нужны для развития физики до настоящего времени), не отличаются существенно от тех, которые постоянно использовались уже долгое время. Математика есть орудие, специально приспособленное для овладения всякого рода абстрактными понятиями, и в этом отношении ее могущество беспредельно. По этой причине всякая книга по современ- современной физике, если только она не ограничивается чистым опи- описанием экспериментальных работ, должна быть существен- существенно математической книгой. Тем не менее математика есть
Ю ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ лишь орудие, и нужно уметь владеть физическими идеями безотносительно к их математической форме. В этой книге я старался выдвинуть физику на передний план, начав изложение с чисто физической главы и в дальнейшем ста- стараясь, где только возможно, исследовать физический смысл, лежащий в основе математического аппарата. Количество теоретического материала, который следует усвоить, прежде чем подойти к решению практических задач, довольно велико, но это обстоятельство является неизбежным следст- следствием той роли, которую играет в данном случае теория преоб- преобразований, и оно будет, по-видимому, усугубляться в теоре- теоретической физике будущего. Относительно математической формы, в которой может быть представлена теория, каждый автор вынужден выби- выбирать с самого начала между двумя методами, Один из них — это символический метод, непосредственно оперирующий в абстрактной форме фундаментальными величинами тео- теории; вторым же является метод координат или метод пред- представлений, который оперирует с системами чисел, соответ- соответствующих этим величинам. Второй метод использовался обычно для изложения квантовой механики. Этот метод из- известен под одним из двух названий: «волновая механика» и «матричная механика» в зависимости от того, какие физиче- физические понятия выдвигаются на первый план — состояния системы или ее динамические переменные. Преимущество этого изложения заключается в том, что требуемые разделы математики более привычны, кроме того, именно этим пу- путем шло историческое развитие квантовой механики. Однако символический метод, по-видимому, глубже про- проникает в природу вещей. Он позволяет выразить физиче- физические законы в ясной и сжатой форме и, вероятно, будет при- применяться во все большей степени по мере того, как его будут больше понимать и будет развиваться соответствующий математический аппарат. По этой причине я выбрал символи- символический метод, используя метод представлений лишь как сред- средство для практических расчетов. Это неизбежно приводит к полному разрыву с исторической линией развития, но зато позволяет подойти к новым идеям возможно более прямым путем. П. А. М. Д. Кембридж 29 мая 1930
ГЛАВА I ПРИНЦИП СУПЕРПОЗИЦИИ § 1. Потребность в квантовой теории Со времен Ньютона классическая механика непрерывно развивалась и применялась ко все более широкому кругу динамических систем, включая электромагнитное поле, взаимодействующее с материей. Основные идеи классиче- классической механики и законы, управляющие применением этих идей, образуют простую и изящную схему. Казалось бы, эта схема не может быть существенно улучшена без утраты всех ее привлекательных свойств. Тем не менее оказалось воз- возможным ввести новую схему, названную квантовой механи- механикой, которая более пригодна для описания явлений атомного масштаба и которая, в известном смысле, более изящна и удовлетворительна, чем классическая схема. Эта возмож- возможность возникла потому, что изменения, которые-влечет за собой новая схема, носят весьма глубокий характер и не вступают в противоречие с теми свойствами классической теории, которые делают ее столь привлекательной; в резуль- результате все эти свойства можно включить в новую схему. Необходимость в отходе от классической механики с оче- очевидностью следует из экспериментальных данных. Прежде всего, силы, известные в классической электродинамике, непригодны для объяснения замечательной стабильности атомов и молекул, стабильности, которая необходима для того, чтобы вещества вообще могли иметь определенные физические и химические свойства. Введение новых гипо- гипотетических сил не спасает положения, так как существуют общие принципы классической механики, справедливые для всех видов сил, которые приводят к результатам, находя- находящимся в прямом противоречии с опытом. Например, если нарушить каким-либо путем равновесие атомной системы,
12 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ а затем предоставить ее самой себе, то она начнет колебать- колебаться; колебания будут воздействовать на окружающее элект- электромагнитное поле, так что частоты этой системы можно будет наблюдать с помощью спектроскопа. Каков бы ни был характер сил, определяющих равновесие, можно ожи- ожидать, что разнообразные частоты могут быть включены в схему, которая содержит некоторые фундаментальные ча- частоты и их гармоники. Однако этого не наблюдается. На самом деле наблюдается новое и неожиданное соотношение между частотами — комбинационный принцип Ритца, сог- согласно которому все частоты могут быть выражены как раз- разности между некоторыми величинами — термами; число этих термов много меньше числа частот. Этот закон совершен- совершенно непонятен с классической точки зрения. Можно было бы попытаться преодолеть эти трудности, не отказываясь от классической механики, предположив, что каждая из спектроскопически наблюдаемых частот есть фундаментальная частота со своей собственной степенью свободы, а законы сил таковы, что высшие гармоники от- отсутствуют. Однако такая теория неудовлетворительна: не говоря уже о том, что она не дает объяснения комбинацион- комбинационному принципу, она. немедленно приводит к противоречию с экспериментальными данными об удельных теплоемкостях. Классическая статистическая механика позволяет установить общее соотношение между полным числом степеней свободы совокупности колеблющихся систем и ее удельной теплоем- теплоемкостью. Если предположить, что все спектроскопические ча- частоты атома соответствуют различным степеням свободы, то для удельной теплоемкости любого вещества получится величина гораздо больше наблюдаемой на опыте. На самом деле наблюдаемые удельные теплоемкости при обычных тем- температурах получаются достаточно хорошо из теории, которая принимает во внимание лишь движение каждого атома как целого и не приписывает ему никакого внутреннего дви- движения. Это приводит нас к. новому противоречию между клас- классической механикой и результатами опыта. В атоме несо- несомненно должно происходить внутреннее движение, что сле- следует из самого существования атомного спектра; однако внутренние степени свободы по какой-то причине, необъяс- необъяснимой с классической точки зрения, не вносят вклада в удель- удельную теплоемкость. Аналогичное противоречие встречается
§ 1. ПОТРЕБНОСТЬ В КВАНТОВОЙ ТЕОРИИ 13 в связи с вопросом об энергии колебания электромагнит- электромагнитного поля в вакууме. Классическая механика требует, чтобы удельная теплоемкость, соответствующая этой энер- энергии, была бесконечной. Из опыта же следует, что она конечна. Общий вывод, который следует из эксперименталь- экспериментальных данных, заключается в том, что высокие частоты не вно- вносят своего классического вклада в удельную теплоемкость. В качестве другого примера неудачи классической меха- механики рассмотрим поведение света. С одной стороны, мы имеем явления интерференции и дифракции, которые можно объяснить только с помощью волновой теории, с другой стороны — такие явления, как фотоэлектрический эффект и рассеяние света свободными электронами, которые пока- показывают, что свет состоит из малых частиц. Каждая из этих частиц, называемых фотонами, имеет определенную энергию и импульс, зависящие от частоты света. Фотоны, по-види- по-видимому, столь же реально существуют, как электроны или любые другие известные в "физике частицы. Дробная часть фотона никогда не наблюдалась. Опыты показывают, что это аномальное поведение свой- свойственно не только свету, а является весьма общим. Все материальные частицы обладают волновыми свойствами, ко- которые могут проявляться в подходящих условиях. В данном случае мы имеем поразительный и общий пример крушения классической механики —¦ крушения, которое заключается не просто в том, что законы движения оказались не точными, а в том, что сами основные понятия классической механики оказались непригодными для описания атомных явлений. Необходимость отказа от классических идей для того, чтобы объяснить более детальное строение материи, можно увидеть не только из экспериментально установленных фак- фактов, но также из общих философских соображений. В клас- классическом объяснении природы вещества предполагается, что оно построено из большого числа малых составных частей и, постулируя законы поведения этих частей, можно вывести законы для вещества как целого. Однако это не есть полное объяснение, так как вопрос о природе и устойчиво- устойчивости составных частей остается при этом открытым. Для рас- рассмотрения этого вопроса необходимо предположить, что каждая составная часть сама состоит из более мелких ча- частей, поведение которых объясняет ее свойства. Очевидно, что это рассуждение можно продолжить до бесконечности,
14 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ так что таким путем невозможно дойти до последних состав- составных частей вещества. До тех пор, пока большое и малое являются лишь относительными понятиями, невозможно объяснить большое с точки зрения малого. Поэтому необхо- необходимо изменить классические идеи таким путем, чтобы при- придать абсолютный смысл понятию размера. На этом этапе важно вспомнить, что наука имеет дело лишь с наблюдаемыми вещами и что мы можем наблюдать объект, лишь заставляя его взаимодействовать с чем-ни- чем-нибудь внешним. Поэтому акт наблюдения неизбежно сопро- сопровождается известным возмущением наблюдаемого объекта. Мы можем назвать объект большим, если возмущением, со- сопровождающим наше наблюдение, можно пренебречь, и ма- малым, если этим возмущением пренебречь нельзя. Это опре- определение находится в тесном согласии с обычным представ- представлением о большом и малом. Обычно предполагается, что, соблюдая осторожность, можно уменьшить возмущение, сопровождающее наше наблюдение, до любого желаемого уровня. Понятия большого и малого при этом являются чисто относительными и в той же мере связаны с тонкостью наших средств наблюдения, как и с объектом, который мы описываем. Для того чтобы придать размерам абсолютный смысл, как того требует всякая теория наиболее мелких частиц вещества, следует допустить, что существует предел тонкости наших средств наблюдения и малости сопровождающего возмущения — предел, который присущ природе вещей и никогда не может быть превзойден совершенствованием техники или искус- искусства экспериментатора. Если наблюдаемый объект таков, что неизбежным, ограничивающим нас возмущением можно пренебречь, тогда объект является большим в абсолютном смысле, и мы можем применять к нему классическую ме- механику. Если же ограничивающим нас возмущением пре- пренебречь нельзя — тогда объект мал в абсолютном смысле, и для того, чтобы его рассмотреть, нужна новая теория. Из предыдущего рассуждения вытекает также, что сле- следует пересмотреть наши представления о причинности. Условие причинности применимо лишь к системе, которая не подвергается возмущениям. Если система мала, то невоз- невозможно наблюдать ее, не внося существенного возмущения, и поэтому нельзя ожидать причинной связи между последо- последовательными результатами наших наблюдений. Мы будем
§ 2. ПОЛЯРИЗАЦИЯ ФОТОНОВ 15 по-прежнему предполагать, что условие причинности при- применимо к невозмущенной системе и что уравнения, описываю- описывающие эту систему, есть дифференциальные уравнения, выра- выражающие причинную связь между обстоятельствами в началь- начальный момент и обстоятельствами в последующие моменты времени. Эти уравнения должны находиться в тесном со- соответствии с уравнениями классической механики, однако они должны быть лишь косвенным образом связаны с резуль- результатами наблюдения. Существует неизбежная неопределен- неопределенность в расчетах наблюдаемых величин; теория позволяет нам рассчитывать, вообще говоря, лишь вероятность того, что мы получим данный результат, если произведем наблюдение. § 2. Поляризация фотонов Рассуждения предыдущего параграфа о пределе тонко- тонкости, с которой могут быть произведены наблюдения, и о со- соответствующей неопределенности в результатах этих на- наблюдений не дают нам еще количественной основы для по- построения квантовой механики. Для этого требуется новая система точных законов природы. Среди них одним рз наиболее фундаментальных и радикальных является прин- принцип суперпозиции состояний. Мы придем к общей формули- формулировке этого принципа, рассмотрев несколько частных случа- случаев — в первую очередь пример, связанный с поляризацией света. Известно из опыта, что если линейно поляризованный свет использовать для вырывания фотоэлектронов, то выле- вылетающие электроны будут иметь преимущественное направле- направление. Таким образом, свойства поляризации света тесно связаны с его корпускулярными свойствами, и отдельному фотону можно приписать определенную поляризацию. Так, например, линейно поляризованный в некотором направле- направлении пучок света можно рассматривать как состоящий из фотонов, каждый из которых линейно поляризован в том же направлении, а пучок света, поляризованный по кру- кругу, — как состоящий из фотонов, поляризованных по кру- кругу. Мы будем говорить, что каждый фотон находится в не- некотором состоянии поляризации. Теперь мы должны рас- рассмотреть вопрос о том, как согласовать эти идеи с извест- известными фактами о разложении света на поляризованные ком- компоненты и об обратном сложении этих компонент.
IS ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ Рассмотрим конкретную задачу. Пусть имеется пучок света, проходящий через кристалл турмалина, который обладает способностью пропускать только свет, поляризо- поляризованный в направлении, перпендикулярном оптической оси кристалла. Из классической электродинамики известно, что будет происходить при той или иной поляризации падаю- падающего пучка. Если этот пучок поляризован перпендикулярно оптической оси, он полностью пройдет через кристалл; если параллельно оси, то вовсе не пройдет; если же он поляри- поляризован под углом а к оси, то через кристалл пройдет часть пучка, равная sin2а. Как понять эти результаты, рассматри- рассматривая свет как пучок фотонов? Пучок света, линейно поляризованного в некотором на- направлении, следует рассматривать как состоящий из фото- фотонов, каждый из которых линейно поляризован в этом на- направлении. Такое рассмотрение не вызывает затруднений в случае, если наш падающий пучок поляризован перпен- перпендикулярно или параллельно оптической оси. В этом случае нам достаточно лишь предположить, что каждый фотон, поляризованный перпендикулярно оси, проходит беспре- беспрепятственно и без изменений сквозь кристалл, в то время как каждый фотон, поляризованный параллельно оси, останав- останавливается и поглощается. Трудность возникает, однако, в случае падающего пучка, поляризованного наклонно (под углом к оси). Каждый из падающих фотонов при этом поля- поляризован наклонно, и неясно, что произойдет с таким фото- фотоном, когда он достигнет турмалина. Вопрос о том, что произойдет с отдельным фотоном в определенных условиях, на самом деле не является точно поставленным. Для того чтобы поставить его точнее, необ- необходимо представить себе, что производится некоторый опыт, имеющий отношение к данному предмету, и задать вопрос, каков должен быть результат опыта. Только вопрос о результатах опытов имеет действительное значение, и лишь такие вопросы должна рассматривать теоретическая физика. В нашем примере, очевидно, следует рассмотреть опыт, в котором падающий на кристалл с одной стороны пучок состоит лишь из одного фотона, и наблюдать, что произой- произойдет на другой стороне кристалла. Согласно квантовой меха- механике результат этого опыта будет тот, что иногда на обрат- обратной стороне будет обнаружен целый фотон с энергией, рав- равной энергии падающего фотона, иногда же не будет обна-
§ 2. ПОЛЯРИЗАЦИЯ ФОТОНОВ 17 ружено ничего. Если будет обнаружен целый фотон, он будет поляризован перпендикулярно оптической оси. Ни- Никогда на обратной стороне кристалла не будет обнаружена дробная часть фотона. Если повторить опыт большое число раз, то число случаев, в которых фотон будет обнаружен на обратной стороне, составит долю sin2 а от общего числа опы- опытов. Таким образом, мы можем сказать, что фотон с вероятно- вероятностью sin2a может пройти через турмалин и появиться на обратной стороне кристалла, будучи поляризованным пер- перпендикулярно оси, и с вероятностью cos2 a может погло- поглотиться. Эти значения для вероятностей приводят к пра- правильным классическим результатам для падающего пучка, содержащего большое число фотонов. Таким путем мы сохраняем индивидуальность фотона во всех случаях. Мы можем сделать это, однако, лишь потому, что мы отказались от детерминизма классической теории. Результат опыта не определен однозначно условиями, находящимися во власти экспериментатора, как должно было бы быть с точки зрения классических представлений. Самое большое, что может быть предсказано, это совокуп- совокупность возможных результатов и вероятность появления каж- каждого из них. Приведенное рассуждение о результатах опыта с отдель- отдельным поляризованным под углом фотоном, падающим на кри- кристалл турмалина, позволяет ответить на все законные ео- просы о том, что произойдет с таким фотоном, когда он до- достигнет турмалина. Вопросы о том, как происходит выбор, пройдет ли фотон сквозь кристалл или нет и каким образом он меняет направление поляризации при прохождении—эти вопросы не могут быть решены опытным путем, и поэтому можно считать, что они лежат за пределами науки. Тем не менее, для того чтобы связать результаты этого опыта с ре- результатами других опытов, которые могли бы быть произ- произведены с фотонами, объединить их всех в общую схему, требуется более подробное описание. Такое описание не следует рассматривать как попытку ответить на вопросы, лежащие за пределами науки, а как вспомогательное сред- средство для формулировки правил, выражающих в сжатой форме результаты многочисленных опытов. Квантовая механика дает следующее более подробное описание. Предполагается, что фотон, поляризованный под углом к оптической оси, можно рассматривать как находя-
'8 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ щийся частично в состоянии поляризации, параллельной оси, и частично в состоянии поляризации, перпендикуляр- перпендикулярной оси. Состояние поляризации под углом к оси можно рассматривать как результат какого-то процесса наложе- наложения, примененного к двум состояниям параллельной и пер- перпендикулярной поляризации. Это приводит к некоторому, особого рода, соотношению между различными состояниями поляризации, похожему на соотношение между поляри- поляризованными пучками в классической оптике, которое, од- однако, применяется теперь не к пучкам, а к двум состояниям поляризации отдельного фотона. Это соотношение позво- позволяет разложить каждое состояние поляризации на два взаимно перпендикулярных состояния поляризации, т. е. представить любое состояние как суперпозицию двух других. Пропуская фотон через кристалл турмалина, мы подвер- подвергаем его наблюдению и устанавливаем, поляризован ли он параллельно или перпендикулярно оптической оси. В результате этого наблюдения мы переводим фотон либо полностью в состояние параллельной поляризации, либо полностью в состояние перпендикулярной поляриза- поляризации. Он должен сделать внезапный скачок от частичного пребывания в обоих этих состояниях к пребыванию цели- целиком либо в одном, либо в другом из состояний; в которое из двух состояний произойдет скачок, невозможно предска- предсказать однозначно: здесь действуют только вероятностные законы. Если произойдет скачок в параллельное состояние, фотон будет поглощен, если же скачок произойдет в перпен- перпендикулярное состояние, фотон пройдет сквозь кристалл и появится на обратной стороне, сохраняя это состояние по- поляризации. § 3. Интерференция фотонов В этом параграфе мы рассмотрим другой пример супер- суперпозиции (наложения). Мы будем по-прежнему иметь дело с фотонами, однако будем рассматривать их импульс и поло- положение в пространстве, а не их поляризацию. Если мы имеем почти монохроматический пучок света, то нам уже кое-что известно о положении и импульсе связанных с этим пучком фотонов. Мы знаем, что каждый из них находится где-то в области пространства, через которую проходит пучок,
§ 3. ИНТЕРФЕРЕНЦИЯ ФОТОНОВ 19 и обладает импульсом, который по направлению совпадает с направлением пучка, а по величине определяется частотой света согласно фотоэлектрическому закону Эйнштейна: им- импульс равен произведению частоты на универсальную по- постоянную. Если мы обладаем такими сведениями о положе- положении и импульсе фотона, то мы будем говорить, что он нахо- находится в определенном состоянии поступательного движения. Разберем теперь, как описывает квантовая механика интерференцию фотонов. Для этого рассмотрим следующий опыт, демонстрирующий интерференцию: пусть пучок све- света пропущен через некоторый интерферометр, так что пу- пучок расщепляется на две компоненты, которые затем интер- интерферируют друг с другом. Как и в предыдущем параграфе, мы можем взять падающий пучок, состоящий из одного фотона, и спросить, что произойдет, когда он пройдет через прибор. Это поставит перед нами во всей остроте вопрос о трудно- трудностях, связанных с противоречием между волновой и корпус- корпускулярной теорией света. Соответственно тому описанию, которое мы приняли в случае поляризации, мы должны .теперь, описывая пове- поведение фотона, считать, что он войдет частично в каждую из двух компонент, на которые расщепился пучок. Мы мо- можем тогда сказать, что фотон находится в состоянии посту- поступательного движения, которое представляет собой супер- суперпозицию двух состояний, соответствующих двум компо- компонентам. Таким образом, мы приходим к обобщению понятия «состояния поступательного движения» в применении к фо- фотону. Фотон, который находится в определенном состоянии поступательного движения, не обязательно связан с одним пучком света, а может быть связан с двумя или несколькими пучками, на которые расщепился исходный пучок *). В точной математической теории каждое состояние поступа- поступательного движения связывается с некоторой волновой функ- функцией обычной волновой оптики, а эти волновые функции могут описывать как отдельный пучок, так и два и более пучков. Состояния поступательного движения могут, таким *) То обстоятельство, что идея суперпозиции заставляет нас обоб- обобщить первоначальное понятие состояния поступательного движения, тогда как в предыдущем параграфе подобного обобщения для состояния поляризации не требовалось, является чисто случайным и не имеет глубокого теоретического смысла,
20 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ образом, налагаться одно на другое так же, как и волновые функции. Рассмотрим теперь, что произойдет, если мы определим энергию одной из компонент. Результатом такого опреде- определения может быть либо целый фотон, либо ничего. Таким образом, фотон должен внезапно оказаться целиком в одном из пучков и перестать находиться отчасти в одном, а отчасти в другом пучке. Такое внезапное изменение вызвано тем возмущением в состоянии движения фотона, которое не- неизбежно вносит наблюдение. Невозможно предсказать, в каком из двух пучков будет найден фотон. Можно рассчи- рассчитать лишь вероятность каждого из результатов, зная пер- первоначальное распределение фотона между двумя пучками. Можно произвести измерение энергии, не уничтожая при этом составного пучка: например, можно отразить пучокчэт движущегося зеркала и измерить отдачу. Наше описание фотона позволяет сделать вывод, что после такого измере- измерения энергии уже невозможно вызвать явления интерферен- интерференции между обеими компонентами. До тех пор, пока фотон находится частично в одном, частично в другом пучке, ин- интерференция при наложении пучков может возникнуть, но эта возможность исчезает, как только фотон переведен по- посредством измерения целиком в один из пучков. В этом слу- случае второй пучок перестает участвовать в описании фотона, и следует считать, что он целиком находится в первом пучке, с которым в свою очередь, как обычно, можно произвести любой опыт. Таким путем, квантовая механика способна примирить противоречия между корпускулярными и волновыми свой- свойствами света. Существенным является то, что каждое со- состояние движения фотона связывается с некоторой волновой функцией обычной волновой оптики. Сущность этой связи не может быть описана на основе классической механики и является чем-то совершенно новым. Было бы совершенно неверно считать, что фотон и связанная с ним волна взаи- взаимодействуют между собой так же, как взаимодействуют частицы и волны в классической механике. Это соответст- соответствие можно толковать только статистически: волновая функ- функция дает сведения о вероятности того, что при измерении положения фотона мы найдем его в том или ином месте. Еще за некоторое время до открытия квантовой меха- механики физикам стало ясно, что связь между световыми вол-
§ 4, СУПЕРПОЗИЦИЯ И ИНДЕТЕРМИНИЗМ 21 нами и фотонами должна иметь статистический характер. Однако они еще не вполне понимали того, что волновая функция дает сведения о вероятности нахождения одного фотона в данном месте, а не о вероятном числе фотонов в этом месте. То, что это различие является важным, видно из следующего рассуждения. Пусть мы имеем пучок света, состоящий из большого числа фотонов, который расщепля- расщепляется на две компоненты одинаковой интенсивности. Сделав предположение о том, что интенсивность пучка связана с ве- вероятным числом фотонов, мы получили бы, что в каждую из компонент попала бы половина от общего числа фотонов. Если далее эти две компоненты будут интерферировать, то мы должны потребовать, чтобы фотон из одной компоненты мог интерферировать с фотоном в другой компоненте. Иногда эти два фотона уничтожались бы, иногда же они превращались бы в четыре фотона. Это противоречило бы закону сохранения энергии. Новая теория, которая связы- связывает волновую функцию с вероятностями для одного фотона, преодолевает эту трудность, считая, что каждый фотон вхо- входит отчасти в каждую из двух компонент. Тогда каждый фотон интерферирует лишь с самим собой. Интерференции между двумя разными фотонами никогда не происходит. Рассмотренная выше связь между частицами и волнами относится не только к свету, а имеет, согласно современной теории, универсальный характер. Все виды частиц связаны с волнами и, обратно, всякое волновое движение связано с частицами. Таким образом, все частицы могут интерфери- интерферировать, и энергия всякого волнового движения имеет кван- квантовый характер. Причина того, что эти общие явления не являются очевидными, заключена в законе о пропорциональ- пропорциональности между массой или энергией частицы и частотой волны. Коэффициент пропорциональности в этом законе таков, что для волн обычных частот соответствующие кванты весьма малы, в то время как даже для таких легких частиц, как электроны, соответствующая частота волн столь велика, что обнаружить их интерференцию нелегко. § 4. Суперпозиция и индетерминизм Читатель, возможно, будет неудовлетворен сделанной в двух предыдущих параграфах попыткой согласовать су- существование фотонов с классической теорией света. Он мо-
22 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ жет возразить, что была введена весьма странная идея — возможность частичного нахождения фотона в обоих состоя- состояниях поляризации или в каждом из двух различных пучков света, причем даже с помощью этой странной идеи не было получено удовлетворительной картины для основных про- процессов, происходящих с одним фотоном. Он может сказать далее, что эта странная идея не позволяет получить новые сведения о результатах измерений в рассмотренной поста- постановке опытов, сверх тех, которые могут быть получены из элементарного рассмотрения фотонов, поведение которых управляется каким-то неопределенным образом волнами. В чем же тогда польза этой странной идеи? В ответ на первое возражение следует отметить, что главная задача физической науки состоит не в том, чтобы снабжать нас наглядными картинами, а в том, чтобы форму- формулировать законы, управляющие явлениями, и использовать эти законы для открытия новых явлений. Если наглядная картина существует, то тем лучше; однако существует она или нет — это лишь второстепенный вопрос. В случае атом- атомных явлений нельзя ожидать, что существует наглядная кар- картина в обычном смысле этого слова, в котором под «нагляд- «наглядной» понимается модель, действующая в основном по клас- классическим принципам. Можно, однако, расширить смысл слова «картина» так, чтобы включить в него любой способ рассмотрения основных законов, при котором их взаимная согласованность становится очевидной. В этом, более широ- широком смысле слова, картина атомных явлений постепенно раскрывается по мере изучения законов квантовой те- теории. Что касается второго возражения, то следует отметить, что для многих простых опытов со светом, элементарная теория, связывающая волны и фотоны каким-то статисти- статистическим способом, дает правильные результаты. В случае таких опытов квантовая механика не дает нам ничего но- нового. Однако в подавляющем большинстве опытов условия сложнее, элементарная теория такого рода неприменима, и требуется более разработанная схема, которую и дает квантовая механика. Способ описания, который дает кван- квантовая механика в более сложных случаях, применим также и в простых случаях. И хотя в простых случаях этот способ описания не обязателен для объяснения экспериментальных результатов, тем не менее изучение его на этих простых
§ 4. СУПЕРПОЗИЦИЯ И ИНДЕТЕРМИНИЗМ 23 примерах может, пожалуй, служить хорошим введением к его изучению в общем случае. Остается общее возражение, которое можно отнести ко всей схеме, которое заключается в том, что, отходя от де- детерминизма классической теории, мы сильно усложняем описание природы, а это является весьма нежелательным. Такое усложнение, конечно, имеет место, однако оно вполне окупается тем большим упрощением, которое вносит прин- принцип суперпозиции состояний, к дальнейшему рассмотрению которого мы и перейдем. Однако до этого необходимо определить важное понятие «состояния» общей атомной системы. Рассмотрим некоторую атомную систему, состоящую из частиц или тел с определенными известными нам свойствами (масса, момент инерции и т. п.); силы взаимодействия между частями этой системы также известны. Возможны различ- различные движения, совместные с законами действия этих сил. Каждое из таких движений называется состоянием системы. Согласно классическим представлениям состояние системы можно определить, задавая численные значения всех коор- координат и скоростей различных составных частей системы в некоторый момент времени, ибо тем самым будет полностью определено и все движение. Однако те доводы, которые приведены на стр. 14 и 15, показывают, что мы не можем наблюдать малую систему с той степенью подробности, ко- которую предполагает классическая теория. Ограничение воз- возможностей наблюдения приводит к ограничению числа дан- данных,' которыми характеризуется состояние. Таким образом, состояние атомной системы должно определяться не полным набором численных значений всех координат и скоростей в некоторый момент времени, а меньшим числом данных или же менее определенными данными. В случае, когда система состоит из одного фотона, состояние определяется пол- полностью путем задания состояния поступательного движения (в смысле § 3) и состояния поляризации (в смысле § 2). Состоянием системы может быть названо невозмущенное движение, которое ограничено таким количеством условий и данных, какое теоретически возможно задать без того, чтобы они друг другу мешали или противоречили. Практи- Практически эти условия могут быть заданы путем соответствующего приготовления системы, что может быть достигнуто, в част- частности, путем пропускания ее через различные типы сорти-
24 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ рующих приборов, таких, как щели и поляриметры, при- причем после приготовления дальнейшее вмешательство в дви- жение системы прекращается. Под словом «состояние» можно понимать как состояние в определенный момент вре- времени (после приготовления), так и состояние в течение всего времени после приготовления. В тех случаях, когда могут возникнуть недоразумения, мы, употребляя слово состоя- состояние во втором из указанных значений, будем говорить о «состоянии движения» *). Общий принцип суперпозиции квантовой механики при- применим к состояниям (в любом из указанных выше значений) ¦ произвольной динамической системы. Этот принцип застав- заставляет нас принять, что между этими состояниями существуют особые соотношения — такие, что если система находится целиком в одном определенном состоянии, мы можем в то же время считать, что она находится отчасти в каждом из двух или нескольких других состояний. Первоначальное состояние следует считать результатом некоторой суперпо- суперпозиции (наложения) двух или нескольких новых состояний, причем это наложение не может быть понято с классиче- классической точки зрения. Любое состояние можно рассматривать как результат суперпозиции двух или многих других со- состояний и притом бесконечным числом способов. Наоборот, любые два или несколько состояний могут быть наложены друг на друга и, тем самым, будет получено новое состоя- состояние. Представление состояния в виде результата суперпо- суперпозиции некоторого числа других состояний — это матема- математическая процедура, которая всегда возможна и не имеет отношения к физическим условиям. Эта процедура анало- аналогична разложению волны на компоненты Фурье. Будет ли такое разложение полезно, это зависит от конкретных фи- физических условий в рассматриваемой задаче. В обоих предыдущих параграфах были приведены при- примеры применения принципа суперпозиции к системе, состоя- состоящей из одного фотона. В § 2 рассматривались состояния, отличающиеся лишь поляризацией, в § 3 — состояния, отли- отличающиеся лишь поступательным движением фотона. *) Это определение фундаментального для квантовой механики понятия состояния не вполне удовлетворительно. Действительный смысл понятия «квантовое состояние» выяснится в дальнейшем при рассмотрении волновой функции и выражаемых через нее вероятностей, (Прим, В. А. Фока),
§ 4. СУПЕРПОЗИЦИЯ И ИНДЕТЕРМИНИЗМ 25 Природа вытекающего из принципа суперпозиции соот- соотношения между состояниями любой системы такова, что ее нельзя объяснить в рамках привычных физических понятий. В классическом смысле слова нельзя представить себе, что система находится частично в одном состоянии, а частично в другом и что это эквивалентно тому, что система целиком находится в некотором третьем состоянии. Здесь вводится совершенно новая идея, к которой нужно привыкнуть и на основе которой следует далее строить точную матема- математическую теорию, не имея при этом детальной классиче- классической картины. Если состояние образовано путем суперпозиции двух других состояний, то оно будет иметь свойства, которые в некотором, несколько неопределенном смысле слова являются промежуточными между свойствами обоих ис- исходных состояний и которые в большей или меньшей степени приближаются к свойствам одного из них, в зависимости от того, с большим или меньшим «весом» это состояние вошло в суперпозицию. Новое состояние будет полностью опреде- определено двумя исходными состояниями, если заданы их отно- относительные веса, а также некоторая разность фаз; точный смысл этих весов и фаз в общем случае будет дан матема- математической теорией. В случае поляризации фотона их смысл дается классической оптикой, так что, например, если про- происходит наложение с одинаковыми весами двух состояний линейно поляризованных во взаимно перпендикулярных направлениях, то новое состояние может быть поляризо- поляризовано по кругу в любом направлении, или плоско поляри- поляризовано под углом У4л, или же эллиптически поляризовано, в зависимости от разности фаз. Неклассический характер процесса суперпозиции прояв- проявляется ясно, если мы рассмотрим суперпозицию двух со- состояний Аи В — таких, что существует наблюдение, которое, будучи произведено над системой в состоянии А, наверняка приведет к некоторому определенному результату а, а бу- будучи произведено над системой в состоянии В, наверняка приведет к какому-то иному результату Ъ. Каков будет ре- результат наблюдения в смешанном состоянии? Ответ на этот вопрос гласит, что результат будет иногда а, иногда Ь, в сог- согласии с вероятностным законом,зависящим от относительных весов состояний А и В в смешанном состоянии. Результат измерения никогда не будет отличаться от а или Ь. Промежу-
28 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ точный характер состояния, образованного в результате суперпозиции, выражается в том, что вероятность того или иного результата измерения будет промежуточной между соответствующими вероятностями для исходных состояний*), а не в том, что сам результат будет промежу- промежуточным между соответствующими результатами для ис- исходных состояний. Таким образом, мы видим, что отступление от обычных взглядов столь резкое, как допущение суперпозиционных связей между состояниями, становится возможным лишь в том случае, если мы признаем важность возмущений, сопровождающих наблюдения и связанную с ними неопре- неопределенность в результатах наблюдения. Если производятся наблюдения над атомной системой, которая находится в за- заданном состоянии, то результат, вообще говоря, не будет детерминированным, т. е., повторяя опыт при одинаковых условиях несколько раз, мы будем получать различные результаты. Однако законом природы является то, что если опыт повторять большое число раз, каждый результат будет получен в определенной доле от общего числа случаев, так что имеется определенная вероятность получения данного результата. Эту вероятность и будет вычислять теория. Лишь в тех частных случаях, когда вероятность некоторого результата равна единице, результат опыта однозначен. Допущение суперпозиционных связей между состояни- состояниями приводит к математической теории, в которой уравне- уравнения, определяющие состояние, линейны по отношению к не- неизвестным. Ввиду этого многие пытались установить ана- аналогию с системами классической механики, такими, как колеблющиеся струны или мембраны, которые подчиняются линейным уравнениям, а следовательно, и принципу су- суперпозиции. Эти аналогии привели к тому, что квантовую механику иногда называют «волновой механикой». Важно помнить, однако, что суперпозиция, которая встречается в квантовой механике, существенным образом отличается *) В общем случае, когда вероятности данного результата в исход- исходных состояниях не равны 0 и 1, вероятность этого же результата в про- промежуточном состоянии, полученном в результате суперпозиции, не обязательно имеет промежуточное значение, так что «промежуточный характер» этого состояния следует понимать в ограниченном смысле. (Прим. В. А. Фока).
§ 5. МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА ПРИНЦИПА 27 от суперпозиции,встречающейся в любой классической теории. Это видно из того факта, что квантовый принцип супер- суперпозиции требует неопределенности результатов измерения, чтобы его было возможно разумно истолковать физически. Поэтому аналогии такого рода могут привести к ошибкам. § 5. Математическая формулировка принципа В нашем столетии произошло глубокое изменение точки зрения физиков на математические основы их науки. Ранее они считали, что принципы механики Ньютона образуют основу описания всех физических явлений, и все, что оста- оставалось физику-теоретику, — должным образом развивать и применять эти принципы. После осознания того, что не существует логических причин, почему ньютоновы и дру- другие классические принципы применимы вне той области, в которой они экспериментально подтверждены,— стало ясно, что отклонения от этих принципов в самом деле не- неизбежны. Эти отклонения нашли свое выражение в том, что методы математической физики пополнились новыми формами математического аппарата, новыми системами аксиом и правил действия. Квантовая механика дает нам яркий пример новых идей. Она требует, чтобы состояния динамической системы и динамические переменные были взаимосвязаны весьма странным образом, который непостижим с классической точки зрения. Состояния и динамические переменные должны характеризоваться математическими величинами другой природы, чем те, которые обычно используются в физике. Новая схема станет точной физической теорией, если будут перечислены все аксиомы и правила действия для математических величин и если, кроме того, будут установлены некоторые законы, связывающие физические факты с математическим аппаратом, так что если заданы физические условия, то могут быть выведены уравнения, связывающие математические величины, и обратно. Приме- Применение теории будет заключаться в том, что сначала заданные физические сведения следует выразить в виде уравнений между математическими величинами. Далее, используя аксиомы и правила действия, следует получить новые уравнения, и в заключение надлежит истолковать эти урав- уравнения как некоторые физические условия. Подтверждение
28 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ всей схемы зависит, помимо ее внутренней непротиворе- непротиворечивости, от согласия окончательных результатов с опытом. Мы начнем построение схемы с рассмотрения мате- математических соотношений между состояниями динамической системы в определенный момент времени, соотношений, которые возникают в результате математической формули- формулировки принципа суперпозиции. Процесс суперпозиции есть нечто вроде процесса сложения; это означает, что состояния можно как-то складывать, получая новые состояния. Поэ- Поэтому состояния должны быть связаны с такими математи- математическими величинами, которые можно складывать между собой, пелучая математические величины того же рода. Наиболее простыми и известными из таких величин являют- являются векторы. Обычное представление о векторах в прост- пространстве с конечным числом измерений не является доста- достаточно общим для большинства систем в квантовой механике. Мы должны обобщить это понятие и перейти к векторам в пространстве бесконечного числа измерений; при этом математическое рассмотрение усложняется вопросом о схо- сходимости. Однако сейчас мы будем рассматривать лишь не- некоторые общие свойства векторов, свойства, которые можно получить из простой системы аксиом; сходимость и связан- связанные с ней вопросы" не будут рассматриваться, пока в этом не возникнет необходимость. Удобно иметь специальное обозначение для векторов, которые сопоставляются состояниям системы в квантовой механике независимо от того, будут ли это векторы в про- пространстве с конечным или бесконечным числом измерений. Мы будем называть их кет-векторами или просто кет *) и в общем случае будем обозначать символом | ). Если мы *) В первом издании перевода, по предложению редактора В, А. Фока, термины «кет-вектор» и вводимый далее «бра-вектор» были заменены соответственно на «вектор состояния» и «со-вектор состояния». В настоящее время термины «бра» и «кет» хотя и не стали общеприня- общепринятыми, но все же нередко употребляются; поэтому мы решили в данном издании вернуться к этим обозначениям, представляющим собой первую Й вторую половину английского слова bracket (скобка). В тех случаях, когда очевидно, какой из двух типов векторов имеется в виду, или же утверждение относится к обоим типам векторов, будет использоваться также термин вектор состояния или просто вектор. Следует различать значки (, ) и | в обозначениях бра- и кет-векторов и других величин от знаков >, < и | | (больше, меньше, знак модуля комплексного числа), которые также встречаются в книге. (Прим. перев.)
§ 5 МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА ПРИНЦИПА 29 хотим снабдить кет-вектор состояния значком, например, А, то мы будем помещать его в середину — \ А). Когда схема будет разработана, станет ясным удобство этого обозначения. Кет-векторы можно умножать на комплексные числа и складывать между собой, получая другие кет-векторы, так, например, из двух кет-векторов \ А) и \ В) можно образовать кет-вектор A) где сх и с2 — два комплексных числа. Мы можем также призводить более общие ли-нейные операции такие, как сложение бесконечной последователь- последовательности кет-векторов, а также, если мы имеем кет-вектор \ х), который зависит от параметра х (и обозначаемый тем же параметром), принимающего все значения в неко- некотором промежутке, то можно проинтегрировать по х и по- получить другой кет-вектор Кет-вектор, который можно выразить в виде линейной комбинации других кет-векторов, называется линейно за- зависящим от них. Совокупность кет-векторов называется линейно независимой, если ни один из них не выражается в Ечде линейной комбинации остальных. Предположим теперь, что каждому состоянию динами- динамической системы в определенный момент времени соответ- соответствует кет-вектор, причем это соответствие таково, что если состояние образовано в результате суперпозиции из некоторых других состояний, то кет-вектор этого состоя- состояния линейно выражается через соответствующие кет- векторы других состояний и обратно. Таким образом, состояние R образовано в результате наложения состояний А и В, если только соответствующие кет-векторы связаны уравнением A). Сделанное выше предположение приводит к опреде- определенным свойствам процесса суперпозиции, свойствам, ко- которые фактически необходимы для того, чтобы слово «су- «суперпозиция» отражало суть дела. Если происходит супер- суперпозиция двух или большего числа состояний, то порядок, в котором производится их суперпозиция, несуществен, так что процесс суперпозиции симметричен относительно
30 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ состояний, суперпозиция которых производится. Опять-таки из уравнения A) мы видим, что (за исключением случая, когда сг или с2 равны нулю), если состояние R может быть образовано наложением состояний А и В, то состояние А может быть образовано наложением В и R, и В может быть образовано наложением А и R. Соотношение суперпозиции между всеми тремя состояниями А, В и R симметрично. Состояние, которое получено в результате наложения некоторых других состояний, мы будем называть линейно зависимым от этих состояний. Более общо состояние будет называться линейно зависимым от некоторой (конечной или бесконечной) последовательности состояний, если соответ- соответствующий кет-вектор линейно зависит от кет-векторов состояний этой последовательности. Последовательность состояний будем называть линейно независимой, если ни одно из них не зависит линейно от остальных. Развивая далее математическую формулировку принципа суперпозиции, мы должны ввести предположение, что, про- производя наложение некоторого состояния самого на себя, мы не можем получить никакое новое состояние — в ре- результате такого наложения состояние не изменится. Если исходному состоянию соответствует кет-вектор | А), то полученному после суперпозиции состоянию будет соответ- соответствовать кет-вектор где сх и с2 — некоторые числа. Может случиться, что <?i + С2 — 0; в этом частном случае результатом суперпо- суперпозиции будет нуль, обе компоненты взаимно уничтожатся в результате интерференции. Наше новое допущение со- состоит в том, что, помимо этого частного случая, полученное состояние совпадает с исходным, так что кет-вектор (сх + с2) | А ) соответствует тому же состоянию, что и кет- вектор | А ). Но сх + с2 произвольное комплексное число, и, следовательно, мы можем заключить, что если кет-век- кет-вектор, соответствующий некоторому состоянию, умножить на любое неравное нулю комплексное число, то полученный кет-вектор будет соответствовать тому же состоянию. Таким образом, состояние определяется лишь направле- направлением кет-вектора, а длина, которую ему можно приписать, несущественна. Все состояния динамической системы на- находятся во взаимно однозначном соответствии с возможными
§ 5. МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА ПРИНЦИПА 31 направлениями кет-векторов, причем не делается различия между направлениями кет-векторов | А ) и — | А ). Сделанное только что предположение показывает весьма ясно глубокое различие между суперпозицией в квантовой теории и какой бы то ни было классической суперпозицией. В случае классической системы, для которой справедлив принцип суперпозиции, например в случае колеблющейся мембраны, суперпозиция состояния с самим собой приводит к другому состоянию с другой амплитудой колебаний. В квантовом состоянии не существует физических характе- характеристик, соответствующих амплитуде классических коле- колебаний; аналогия с квантовым состоянием возможна только в отношении характера классического колебания, который определяется отношением амплитуд колебания в разных точках мембраны. Опять-таки, в классической механике существует состояние, в котором амплитуда колебаний повсюду равна нулю — состояние покоя, в то время как аналогичного состояния для квантовой системы не суще- существует — нулевой кет-вектор соответствует отсутствию ка- какого бы то ни было состояния вообще. Если заданы два состояния, которым соответствуют кет-векторы | А ) и \ В), то общему состоянию, получен- полученному в результате наложения, соответствует кет-вектор | R), который определяется двумя комплексными числами, а именно, коэффициентами сг и с2 в уравнении A). Если эти два коэффициента помножить на одинаковое число (тоже комплексное), то кет-вектор | R) помножится на это число и соответствующее ему состояние не изменится. Таким образом, для определения состояния R существенно лишь отношение обоих коэффициентов. Следовательно, это состояние определяется одним комплексным числом или двумя вещественными параметрами. Таким образом, в результате суперпозиции из двух состояний может быть получена дважды бесконечная последовательность состоя- состояний. Этот результат подтверждается примерами, рассмотрен- рассмотренными в §§ 2 и 3. В примере из § 2 имелось как раз два неза- независимых состояния поляризации фотона, за которые можно принять состояния линейной поляризации, параллельной и перпендикулярной некоторому фиксированному направ- направлению. В результате суперпозиции этих двух состояний может быть получена дважды бесконечная последователь-
32 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ ность состояний эллиптической поляризации, для описания каждого из которых требуется задание двух параметров. Точно так же и в примере из § 3, в результате суперпозиции двух заданных состояний движения фотона может быть получена дважды бесконечная последовательность состоя- состояний движения, каждое из которых характеризуется двумя параметрами. В качестве таких параметров можно взять отношение амплитуд двух волновых функций, которые складываются между собой, и разность фаз между ними. Эти примеры подтверждают необходимость допущения комплексных коэффициентов в уравнении A). Если бы мы допустили только вещественные коэффициенты,то, поскольку направление кет-вектора | R) определяется лишь их от- отношением, в результате суперпозиции получили бы при заданных И) и \ В) лишь простую (а не двойную) беско- бесконечную последовательность состояний. § 6. Векторы бра и кет Если в какой-либо математической теории встречается совокупность векторов, мы можем всегда ввести вторую совокупность векторов, которые математики называют ду- дуальными векторами. Мы рассмотрим эту процедуру для случая, когда исходными векторами являются кет-век- кет-векторы. Пусть имеется число <р, которое является функцией кет- вектора | Л), т. е. каждому кет-вектору | А ) соответствует число ф. Предположим далее, что эта функция лин?йна, т. е. что число, соответствующее сумме | Л>+ \А'), есть сумма чисел, соответствующих \А)и | А'), а число, соответст- соответствующее с | А >, есть число, соответствующее | А ), умноженное на с, где с — численный множитель. Тогда число ф, соответ- соответствующее любому | А ), можно рассматривать как скаляр- скалярное произведение этого | А ) на некоторый новый вектор, причем каждой линейной функции от ] А) соответствует один из этих новых векторов. Такой способ рассмотрения функции ф вводится потому, что, как мы увидим далее (см. уравнения E) и F)), новые векторы можно складывать между собой и умножать их на числа, получая снова век- векторы той же природы. Новые векторы, очевидно, определены лишь условием, что их скалярное произведение с исходными векторами дает заданные числа, однако этого уже достаточно
§ 6. ВЕКТОРЫ БРА И КЕТ ¦'¦' для того, чтобы построить математическую теорию подобных векторов. Будем называть эти новые векторы бра-векторами или просто бра *) и обозначим общий бра-вектор символом ( |, который является зеркальным отображением соответ- соответствующего символа | ) для кет-вектора состояния. Если нужно снабдить бра-вектор значком, например В, мы бу- будем помещать этот значок в середину, т. е. будем писать (В |. Скалярное произведение бра-вектора (В | и кет-вектора | А) мы напишем в виде (В | А >, т. е. поместим оба вектора рядом, кет-вектор справа, бра-вектор слева и для краткости объединим обе вертикальные черты в одну. Символы ( и > можно рассматривать как особого рода скобки. Тогда скалярное произведение (В | А ) представля- представляет собой полное скобочное выражение, а бра-вектор (В | или кет-вектор \ А) — неполные скобочные выражения. Мы получаем правило, что полное скобочное выраокение означает число, а неполное скобочное выражение означает вектор бра или кет в зависимости от того, содержит ли выражение первую или вторую часть скобок. Условие того, что скалярное произведение векторов (В | и \А ) есть линейная функция от | А ), может быть вы- выражено символически в виде '), B) (В\{с\А)}=с(В\А), C) где с — любое число. Можно считать, что бра-вектор определен полностью, если задано его скалярное произведение с любым кет-век- тором. Так, например, если это скалярное произведение равно нулю, то следует считать, что и сам бра-вектор равен нулю. Символически: если (Р\А)=0 для всех \А), то D) < Сумма двух бра-векторов (В | и <?' | определяется из условия, чтобы скалярное произведение суммы на любой *) См. примечание на стр. 28. {Прим, перге.)
34 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ кет-вектор | А > было равно сумме скалярных произведений (В | и <В'| на \А), т. е. {(В\ + (В'\}\А) = (В\А) + (В'\А). E) Произведение бра-вектора (В | на число с определяется из условия, чтобы скалярное произведение с (В \ на любой кет-вектор | А) было равно скалярному произведению (В | на | А), умноженному на с, т. е. {с{В\}\А) = с(В\А). F) Уравнения B) и E) показывают, что произведение бра- вектора и кет-вектора удовлетворяет распределительному (дистрибутивному) закону умножения, а уравнения C) и F) показывают, что умножение на численные множители удовлетворяет обычным алгебраическим аксиомам. Из данных здесь определений видно, что бра-векторы имеют совсем иную природу, чем кет, и до сих пор между ними не было никакой связи, за исключением возможности образования скалярного произведения для любого бра- вектора и кет-вектора. Сделаем теперь предположение о том, что имеется взаимно однозначное соответствие между бра- и кет-векторами такое, что бра, соответствующий сум- сумме | А) -f \A'), есть сумма бра, соответствующих | А) и \А'), а бра, соответствующий с \ А), равен бра, соответ- соответствующему!^ ), умноженному на с, где с есть число комплек- комплексно-сопряженное числу с. Мы будем использовать тот же значок для образования соответствующих векторов. Так, например, бра-вектор, соответствующий кет-вектору | А), будем обозначать (А \. Соотношение между кет-вектором и соответствующим бра- вектором таково, что имеет смысл считать один из них сопряженным другому. Наши бра- и кет-векторы являются комплексными величинами, так как их можно умножать на комплексные числа, после чего их природа не меняется, однако они являются комплексными величинами особого рода, которые не могут быть разбиты на чисто веществен- вещественную и чисто мнимую части. Обычный метод получения вещественной части комплексной величины путем вы- вычисления полусуммы этой величины и ее сопряженной здесь неприменим, так как бра-векторы и кет-векторы имеют различную природу и их нельзя складывать. Для того чтобы подчеркнуть это различие, мы будем использовать
§ 6. ВЕКТОРЫ БРА И КЕТ 35 термин «комплексно-сопряженный» для чисел и других комплексных величин, которые могут быть разбиты на ве- вещественную и чисто мнимую части, и термин «сопряжен- «сопряженный» — для векторов состояния, которые нельзя разбить подобным образом. Для величин первого рода мы будем использовать обычное обозначение — переход к комплек- комплексно-сопряженной величине будет обозначаться чертой над соответствующим выражением. Вследствие взаимно однозначного соответствия между бра-векторами и кет-векторами любое состояние динами- динамической системы в определенный момент времени может быть охарактеризовано как направлением бра-вектора состоя- состояния, так и направлением соответствующего кет-вектора. Действительно, в дальнейшем вся теория будет по суще- существу симметричной относительно бра- и кет-векторов. Если даны два кет-вектора \ А) и | В), то мы можем образовать из них число (В \ А), взяв скалярное произве- произведение первого на сопряженный второй. Это число зависит линейно от | А ) и антилинейно от \ В), причем под антили- антилинейной мы понимаем такую зависимость, при которой число, образованное из суммы | В) + I В'), есть сумма чисел, образованных из \В) и \В'), а число, образованное из про- произведения с \ В), равно умноженному на с числу, образо- образованному из | В). Величину, которая зависит линейно от \ А) и антилинейно от \ В), можно построить и другим путем: взять комплексно-сопряженную величину от ска- скалярного произведения кет-вектора \ В) и бра-вектора, сопряженного вектору | А ). Мы предположим, что эти два числа всегда равны, т. е. что (В\А) = ЩВ). G) Полагая здесь | В) = \ А), находим, что число (А \ А> должно быть вещественным. Предположим далее, что <Л|Л>>0, (8) за исключением случая, когда | А) — 0. В обычном пространстве из двух векторов можно по- построить число — их скалярное произведение, которое ве- вещественно и симметрично относительно обоих векторов. В пространстве бра-векторов или в пространстве кет-век- кет-векторов из любых двух векторов можно также построить число — скалярное произведение одного на сопряженный
36 ГЛ. I. ПРИНЦИП СУПЕРПОЗИЦИИ второй, но число это комплексное и переходит в комп- комплексно-сопряженное число, если поменять местами оба вектора. В пространстве векторов состояния также имеет смысл понятие перпендикулярности, которое является обобщением перпендикулярности в обычном пространстве. Мы будем говорить, что бра и кет-вектор ортогональны, если их скалярное произведение равно нулю; два бра- вектора или два кет-вектора ортогональны, если скалярное произведение одного на сопряженный второй равно нулю. Далее, мы будем говорить, что два состояния нашей дина- динамической системы ортогональны, если ортогональны век- векторы, соответствующие этим состояниям. Длина бра-вектора (А | или сопряженного кет-вектора | А ) определяется как квадратный корень из положитель- положительного числа (А | А >. Если нам дано состояние системы и мы хотим ввести бра или кет, соответствующий этому со- состоянию, то будет определено только направление вектора— сам вектор будет определен лишь с точностью до произволь- произвольного численного множителя Часто бывает удобно выбрать этот численный множитель так, чтобы длина вектора была равна единице. Эта процедура называется нормировкой, и выбранный таким образом вектор — нормированным. Вектор состояния" не определен до конца даже в этом случае, так как мы все еще можем помножить его на число, равное по модулю единице, т. е. на любое число е'у с веществен- вещественным у, не изменяя длины вектора. Мы будем называть та- такое число фазовым множителем. Сделанные выше допущения дают полную схему соотно- соотношений между состояниями динамической системы в опре- определенный момент времени. Эти соотношения имеют матема- математический характер, однако они отображают определенные физические условия, приводящие к следствиям, которые могут быть выражены через наблюдаемые на опыте величи- величины, как это будет видно из дальнейшего развития теории. Например, ортогональность двух состояний выражается пока лишь некоторым уравнением в нашем математическом аппарате, однако это уравнение отображает определенное физическое соотношение между этими состояниями, и дальнейшее развитие теории позволит истолковать это соотношение с точки зрения опытных данных (см. стр. 53, 54).
ГЛАВА II ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ § 7. Линейные операторы В предыдущем параграфе мы рассмотрели число, кото- которое являлось линейной функцией от кет-вектора, и это привело нас к понятию бра-вектора. Рассмотрим теперь кет-вектор, который является линейной функцией кет- вектора. Это приведет нас к понятию линейного оператора. Пусть мы имеем кет | F), который является функцией кет-вектора \ А), т. е. каждому кет-вектору | А) соответ- соответствует некоторый кет | F); и пусть, кроме того, эта функция линейна, т. е. кет| F), соответствующий \ А) + \А'), есть сумма кет-векторов \ F), соответствующих \ А) и \ А'), а | F), соответствующий с | А ), есть умноженный на с кет|/), соответствующий | А), где с — численный множитель. При этих условиях мы можем рассматривать переход от | А) к \ F) как действие линейного оператора на кет-вектор | А). Вводя для линейного оператора сим- символ а, мы можем написать где действие оператора ее на \ А) записывается как произ- произведение а на | А). Введем правило, что в таком произве- произведении кет-вектор всегда должен быть расположен справа от линейного оператора. Сформулированные выше условия линейности могут быть выражены тогда уравнениями Можно считать, что линейный оператор полностью определен, если известен результат его действия на любой
38 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ кет-вектор. Так, например, оператор можно считать равным нулю, если результат действия его на любой кет есть нуль; два линейных оператора можно считать равными, если, действуя на одинаковые кет-векторы, они всегда дают одинаковые результаты. Линейные операторы можно складывать, сумма двух линейных операторов есть, по определению, такой линей- линейный оператор, который, действуя на любой кет, дает ре- результат, равный сумме кет-векторов, полученных в резуль- результате действия каждого из двух слагаемых операторов на тот же кет. Таким образом, оператор а + Р определяется равенством { + $}\А)\А) + р\А) B) для любого | А). Уравнение B) и первое из уравнений A) показывают, что произведение линейных операторов на векторы подчиняется распределительному закону умно- умножения. Линейные операторы можно также перемножать; про- произведение двух линейных операторов есть по определению такой оператор, который, действуя на любой кет, дает такой же результат, как и последовательное действие этих двух операторов на этот кет-вектор. Таким образом, произведение сф определяется как оператор, который, действуя на любой кет | А ), переводит его в кет, который может быть получен, если на \ А) подействовать сначала оператором р\ а затем на результат первой операции по- подействовать оператором а. Символически: Это определение имеет вид сочетательного закона умно- умножения для тройного произведения а, р и | А ) и позволяет нам писать это произведение без скобок в виде сф | А). Однако это тройное призведение, вообще говоря, отлича- отличается от того, которое мы получим, действуя на \А ) сначала оператором а, а затем р, т. е., вообще говоря, «р | Л) отличается от Ра | А ), так что оператор ар обычно отли- отличается от Ра. Для линейных операторов коммутативный закон умножения не выполняется. Иногда может оказаться, что для двух линейных операторов ? и т] произведения |т] и г\1 равны. В таком случае мы говорим, что § коммутирует с т] или что I и ц коммутативны.
§ 7. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 39 Повторяя действия сложения и умножения, мы можем получать суммы и произведения более чем двух операторов. В этой алгебре не выполняется коммутативный закон умно- жениЯ) кроме того, может быть равно нулю произведение двух отличных от нуля операторов. Однако легко доказать, что все остальные законы обычной алгебры, включая сочетательный и распределительный законы, выполняются. Если взять число k и умножить на него кет-вектор, то это число можно рассматривать как линейный оператор, действующий на вектор, поскольку условия A) выполня- выполняются после замены в них оператора а на k. Число является, таким образом, частным случаем линейного оператора. Оно обладает тем свойством, что коммутирует со всеми ли- линейными операторами, и это свойство отличает его от об- общего случая линейного оператора. До сих пор мы рассматривали действие линейных опера- операторов только на кет-векторы. Мы можем придать смысл их действию на бра-векторы следующим образом. Рассмотрим скалярное произведение бра (В \ на кет а \ А). Это произ- произведение есть число, которое линейно зависит от | А) и, следовательно, согласно определению бра, это число можно рассматривать как произведение кет-вектора | А) на не- некоторый бра-вектор. Определенный таким образом сопря- сопряженный бра-вектор зависит линейно от (В \ , так что мы можем рассматривать его как результат действия некоторого линейного оператора на (В \ . Этот линейный оператор однозначно определяется исходным линейным оператором а, и поэтому естественно считать, что это тот же самый опе- оператор, действующий на бра-вектор. Таким образом, наши линейные операторы могут теперь действовать и на бра- векторы. Бра-вектор, полученный в результате действия опера- оператора а на (В |, удобно обозначить (В | а так, что в этих обозначениях уравнение, определяющее (В | а, имеет вид \А)}, C) где \А) — любой кет-вектор. Это уравнение выражает попросту сочетательный закон умножения для произве- произведения (В |, а и \ А). Поэтому мы введем общее правило, согласно которому в произведении бра-вектора и линейного оператора бра-вектор должен всегда стоять слева. Мы можем тогда писать тройное произведение (В |, а и \ А) просто
40 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ в виде (В | а | А ) — без скобок. Легко показать, что рас- распределительный закон умножения так же справедлив для произведения бра на операторы, как и для произве- произведения операторов на кет-векторы. Имеется еще один вид произведения, который имеет смысл в нашей схеме, а именно произведение кет-вектора и бра-вектора, в котором кет-вектор стоит слева, т. е. | А ) (В |. Чтобы исследовать это произведение, умножим его справа на произвольный кет | Р) и допустим, что выполняется сочетательный закон умножения. Произведение имеет тогда вид | А) (В | Р) и является новым кет-вектором, а именно | А), умноженным на число (В \ Р), и этот новый кет зависит линейно от \ Р). Таким образом, | А ) (В | можно рассматривать как линейный оператор, который может действовать на кет-векторы. Он может действовать также и на бра-векторы; так, например, умножая | А) (В | на бра (Q | слева, получим (Q | А > (В |, т. е. умноженный на число (Q | А ), бра (В \. Произведение | А ) (В | следует четко отличать от произведения (В | А ), в котором те же множители стоят в обратном порядке, второе из этих про- произведений является, очевидно, числом. Теперь мы имеем полную алгебраическую схему, в ко- которой имеется три рода величин: бра-векторы, кет-векторы и линейные операторы. Их можно перемножать между собой различными способами, которые рассмотрены выше; сочетательный и распределительный законы умножения выполняются при этом всегда, коммутативный же закон умножения не выполняется. В этой общей схеме по-преж- по-прежнему справедливы правила для обозначений, сформули- сформулированные в предыдущем параграфе, согласно которым полное скобочное выражение, содержащее ( слева и ) справа, означает число», а неполное скобочное выражение, содержащее только ( или ), означает соответственно бра- вектор или кет-вектор. Рассматривая физическое значение этой схемы, мы уже приняли, что бра-векторы или кет-векторы, или, точнее, направления этих векторов, соответствуют состояниям физической системы в определенный момент времени. Сделаем теперь дальнейшее предположение, что линейные операторы соответствуют динамическим переменным в тот же момент времени. Под динамическими переменными следует понимать такие величины, как координаты, компо-
§ 8. СООТНОШЕНИЯ СОПРЯЖЕННОСТИ 41 ненты скорости, импульса или момента количества движе- движения частиц, а также функции от этих величин, т. е. все те переменные величины, которые используются при по- построении классической механики. Из нового предположения следует, itto эти величины должны встречаться также и в квантовой механике, однако характерной особенностью является то, что теперь эти величины подчиняются алгебре, в которой не выполняется коммутативный закон умножения. Эта особая алгебра динамических переменных пред- представляет собой одну из самых важных особенностей, отли- отличающих квантовую механику от классической. Мы увидим далее, что, несмотря на это фундаментальное различие, динамические переменные квантовой механики и соответ- соответствующие классические величины все же обладают многими общими свойствами и что возможно построить теорию, на- находящуюся в тесной аналогии с классической теорией и являющуюся замечательным обобщением последней. Удобно использовать одну и ту же букву для обо- обозначения динамической переменной и соответствующего ли- линейного оператора. Действительно, мы можем, не впадая при этом в противоречие, считать, что динамическая пе- переменная и соответствующий линейный оператор — это одно и то же понятие. § 8. Соотношения сопряженности Наши линейные операторы комплексны; это видно из того, что после умножения их на комплексные числа мы снова получаем линейные операторы, т. е. величины той же природы. Поэтому они должны, вообще говоря, соот- соответствовать комплексным динамическим переменным, т. е. комплексным функциям от координат, скоростей и т. п. Для того чтобы увидеть, какие операторы соответствуют вещественным динамическим переменным, необходимо раз- развить теорию несколько дальше. Рассмотрим кет, сопряженный бра-вектору (Р | а. Этот кет зависит антилинейно от (Р |, следовательно, линейно от \ Р), и его можно поэтому рассматривать как результат действия некоторого линейного оператора на \ Р). Этот оператор мы назовем сопряженным оператору а и обозначим а, В этих обозначениях кет-вектором, сопряженным < Р | а, будет а | Р). Подставим в формулу G) гл. I (Р\а вместо
42 ГЛ. П. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ (А | и сопряженный вектор а | Р) вместо | А) .Тогда ) = <Р|а|В>. D) Эта общая формула справедлива для любых кет-векторов \В > и | Р) и любого линейного оператора а; она выражает то свойство сопряженного оператора, которое чаще всего используется. Подставляя в формулу D) а вместо а, получаем Здесь снова использована формула D) с переставленными | Р) и \ В). Формула справедлива для любого кет-вектора \Р), и поэтому, согласно формуле D) гл. I, имеем Поскольку, далее, эта формула справедлива для любого бра-вектора (В |, мы можем заключить, что Таким образом, оператор, сопряженный сопряженному оператору, есть исходный линейный оператор. Это свойство операции сопряжения делает ее похожим на комплексное сопряжение чисел; легко показать, что в том частном случае, когда линейный оператор есть число, сопряженным оператором будет комплексно-сопряженное число. Поэтому разумно предположить, что сопряженному линейному опе- оператору соответствует комплексно-сопряженная динами- динамическая переменная. Имея в виду этот физический смысл сопряженного оператора, мы можем называть его также комплексно-сопряженным оператором, что и соответствует нашему обозначению. Если некоторый линейный оператор и сопряженный ему оператор совпадают, то мы будем называть такой опе- оператор самосопряженным. Он соответствует вещественной динамической переменной, и поэтому его с таким же правом можно назвать вещественным линейным оператором. Любой линейный оператор может быть разбит на вещественную и чисто мнимую части. В этом отношении операторы скорее похожи на числа, и поэтому к ним применим также термин «комплексно-сопряженный», и непохожи на векторы со- состояния, для которых такое разбиение не имеет смысла.
§ 8. СООТНОШЕНИЯ СОПРЯЖЕННОСТИ 43 Оператор, комплексно-сопряженный сумме двух ли- линейных операторов, есть, очевидно, сумма соответствующих комплексно-сопряженных операторов. Чтобы получить оператор, комплексно-сопряженный произведению двух линейных операторов аир, воспользуемся формулой G) гл. I, положив < так что Тогда, используя формулу D), получаем Поскольку формула справедлива для любых | Р) и \ Q), из нее следует, что рй =сф. E) Таким образом, оператор, комплексно-сопряженный произ- произведению двух линейных операторов, равен произведению комплексно-сопряженных операторов сомножителей, рас- расположенных в обратном порядке. Простым следствием этого результата является то, что если i и г) вещественны, произведение ?т1, вообще говоря, не будет вещественным. Это — существенное отличие от классической механики. Однако Ъ\ + ц1, а также i (lr\ — T]g) вещественны. Произведение Ъ,х\ будет также веществен- вещественным, только если ? и г\ коммутируют. Далее, если | вещественно, то вещественным будет ?г, а также ?л, где п — любое целое положительное число. Мы можем получить оператор, комплексно-сопряженный произведению трех линейных операторов, применяя по- последовательно правило E). Имеем Таким образом, оператор, комплексно-сопряженный про- произведению трех линейных операторов, равен произведению комплексно-сопряженных операторов сомножителей, рас- расположенных в обратном порядке. Это правило легко распространить на произведение любого числа операторов. В предыдущем параграфе мы видели, что призведение | А) (В | есть линейный оператор. Мы получим соответ- соответствующий комплексно-сопряженный оператор, обратив-
44 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ шись непосредственно к определению сопряженного опера- оператора. Умножая | А ) (В | на произвольный бра-вектор (Р |, получаем (Р | А ) (В |; соответствующим сопряженным кет- вектором будет Следовательно, Теперь мы имеем ряд правил для образования сопряжен- сопряженных или комплексно-сопряженных произведений, а именно: уравнения G) гл. I, уравнения D), E), F), G) этого пара- параграфа а также правило, что кет-вектор, сопряженный бра- вектору (Р | а, есть а | Р). Все эти правила можно свести к одному общему правилу: если имеется произведение бра-векторов, кет-векторов и линейных операторов, то, чтобы получить сопряженное или комплексно-сопряженное выражение, нужно заменить все сомножители на сопряжен- сопряженные или комплексно-сопряженные и расположить их в об- обратном порядке. Легко проверить, что это правило спра- справедливо в самом общем случае, в частности, и во всех тех случаях, которые не были рассмотрены явно выше. Теорема. Если \ — вещественный линейный оператор и = 0 (8) для некоторого кет-вектора \Р), где т — целое положи- положительное число, то 1\Р)=0. Чтобы доказать эту теорему, рассмотрим сначала случай т — 2. Из уравнения (8) тогда следует а это значит, что произведение кет-вектора ? | Р) на сопря- сопряженный ему бра-вектор (Р \ | есть нуль. Согласно предпо- предположению (8) гл. I отсюда следует, что \\ Р) равно нулю. Таким образом, теорема доказана для случая т = 2. Пусть теперь т > 2. Введем обозначение Тогда из уравнения (8) следует
§ 9. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 45 Применяя теорему для случая т — 2, получаем ё! Q> = о или |m-i | р) = о. (9) Повторяя процесс, посредством которого получено урав- уравнение (9), мы получим последовательно и, таким образом, теорема доказана для общего случая *). § 9. Собственные значения и собственные векторы Развивая далее теорию линейных операторов, мы должны исследовать уравнение а\Р)=а\Р), A0) де а — линейный оператор, a a — число. Обычно в этом равнении а — известный линейный оператор, а число а кет | Р) неизвестны, и мы должны выбрать их так, чтобы довлетворить уравнению A0) (тривиальное решение | Р) — - 0 не принимается во внимание). Уравнение A0) означает, что оператор а, действуя на | Р), просто умножает этот вектор на численный множитель, не меняя его направления, или же умножает его на нуль, после чего вектор вообще перестает иметь направление. Тот же самый оператор а, действуя на другие кет-векторы, будет, вообще говоря, менять как их длину, так и их на- направление. Следует отметить, что в уравнении A0) имеет значение только направление кет-вектора | Р). Если \Р) удовлетворяет (или не удовлетворяет) уравнению A0), то после умножения на любое не равное нулю число он по- прежнему будет удовлетворять (или соответственно не удовлетворять) тому же уравнению. Наряду с уравнением A0) нам следует рассмотреть также сопряженное уравнение (Q\a = b(Q\, A1) *) Формулированная выше теорема верна, если все рассматриваемые векторы удовлетворяют граничным условиям, что подразумевается. (Прим. В. А. Фока.)
46 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ где Ь — число. Здесь неизвестными являются число Ь и не равный нулю бра-вектор (Q |. Уравнения A0) и A1) имеют настолько большое значение в теории, что желательно иметь специальные слова для описания отношений между вели- величинами, входящими в уравнения. Если уравнение A0) удовлетворяется, мы будем называть а собственным зна- значением *) оператора а (или соответствующей динамической переменной), а кет-вектор | Р) будем называть собственным кет-вектором линейного оператора или динамической пе- переменной. Далее мы будем говорить, что «собственный кет-вектор | Р) относится к собственному значению а» или «собственный кет | Р) с собственным значением о». Аналогично, если удовлетворяется уравнение A1), мы будем называть b собственным значением a, (Q | собственным бра-вектором, относящимся к этому собственному значению. Слова: «собственное значение», «собственный кет-вектор», «собственный бра-вектор» имеют, очевидно, смысл лишь по отношению к определенному линейному оператору или динамической переменной. Используя эту терминологию, мы можем сказать, что если собственный вектор оператора а умножить на любое не равное нулю число, то полученный вектор будет также собственным вектором и будет относиться к тому же собст- собственному значению, что и исходный вектор. Может оказаться, что существует два или несколько линейно независимых собственных векторов линейного оператора, относящихся к одному и тому же собственному значению этого оператора; иначе говоря, уравнение A0) может иметь несколько решений |Р1), | Р2), | РЗ),... при одном и том же значении а, причем различные собственные векторы \ Р\), \ Р2), |РЗ>,... —линейно независимы. В этом случае очевидно, что линейная комбинация этих собственных векторов также будет собственным вектором, относящимся к тому же соб- собственному значению линейного оператора, т. е. решением уравнения A0) будет также вектор где съ сг, ся, ... — произвольные числа. *) Следует иметь в виду, что слова «собственный» и «несобстЕен- ный» часто используются и в другом смысле. Так, например, в §§ 15 и 46 используются слова «несобственная функция» и «собственная энергия».
§ 9. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 47 В частном случае, когда линейным оператором в урав нениях A0) и A1) является некоторое число k, очевидно, что любой кет | Р) или бра (Q | удовлетворяет этому урав- уравнению, если положить а и Ь равными k. Таким образом, число, рассматриваемое как линейный оператор, имеет только одно собственное значение, любой кет есть соб- собственный кет-вектор, любой бра есть собственный бра-век- бра-вектор, и все они относятся к этому собственному значению В квантовой механике почти не используется,теория собственных значений и собственных векторов для тех операторов, которые не являются вещественными. Поэтому мы, развивая теорию дальше, ограничимся лишь вещест- вещественными линейными операторами. Подставляя вместо произвольного линейного оператора а, вещественный ли- линейный оператор ?, получаем вместо уравнений A0) и A1) 1\Р)=а\Р), A2) (Q\l = b(Q\. A3) Легко получить три важных результата. I. Все собственные значения — вещественные числа. Для доказательства того, что а в уравнении A2) вещественно, умножим A2) слева на бра (Р |. Получаем (Р\1\Р)=а(Р\Р). Далее, из уравнения D), если в нем заменить (В | на (Р |, а а заменить вещественным оператором ?, видно, что число (Р \l \ P) должно быть вещественным. Из формулы (8) § 6 следует, что число (Р \ Р) вещественно и не равно нулю. Таким образом, а вещественно. Аналогично, умножая A3) на |Q) справа, можно доказать, что Ь вещественно. Пусть мы имеем решение уравнения A2). Напишем сопряженное уравнение, которое будет иметь вид ввиду того, что \ и а вещественны. Это сопряженное урав- уравнение дает нам решение уравнения A3), если положить (Q | = (Р | и b = а. Таким образом, мы можем утверждать далее: II. Собственные значения, соответствующие собствен- собственным кет-векторам, и собственные значения, соответствую- соответствующие собственным бра-векторам, совпадают,
48 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ III. Бра-вектор, сопряженный некоторому собствен- собственному кет-вектору, является собственным кет-вектором, от- относящимся к тому же самому собственному значению, и обратно. Из этого последнего результата следует, что естественно назвать состояние, которое соответствует соб- собственному кет-вектору и собственному бра-вектору, соб- собственным состоянием вещественной динамической пере- переменной ?. Собственные значения и собственные векторы различ- различных динамических переменных весьма широко исполь- используются в квантовой механике, так что желательно иметь для них систематические обозначения. Для большинства приложений удобна следующая схема. Если ? — вещест- вещественная динамическая переменная, мы будем обозначать ее собственные значения ?', \", %г и т. п. Таким образом, сама буква обозначает вещественную динамическую пере- переменную или вещественный линейный оператор, а эта же са- самая буква со штрихом или с индексом означает число, а именно: собственное значение величины (оператора), которую обозначает буква. Собственный вектор можно теперь характеризовать тем собственным значением, к которому он относится. Таким образом, |?') означает собственный кет-вектор, относящийся к собственному зна- значению Е' динамической переменной |. В тех случаях, когда мы имеем дело с несколькими собственными векторами, относящимися к одному собственному значению динами- динамической переменной, мы будем различать их дополнительным значком или даже несколькими значками. Так, например, если мы имеем дело с двумя собственными кет-векторами, относящимися к одному собственному значению ?', мы будем обозначать их ||'1)и | ?'2). Теорема. Два собственных вектора вещественной ди- динамической переменной, относящиеся к разным собственным значениям, ортогональны. Доказательство. Пусть | I') и | |" ) — два собственных кет-вектора вещественной динамической пе- переменной, относящиеся соответственно к собственным зна- значениям \' и |". Тогда мы имеем уравнения 1\1')=1'\Г), A4) li !"> = ?" Ю- A5)
§ 9. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 49 Возьмем уравнение, сопряженное уравнению A4), <П? = Б'<?'|. Умножая это уравнение справа на ||"), имеем а умножая уравнение A5) на (|'| слева, имеем <ri?ir> = r<rir>- Отсюда после вычитания (Г-П<5'1Г> = 0, A6) и, таким образом, если |' т^|", то (?' |Е") = 0, т. е. собственные кет-векторы |?') и |?") ортогональны Эту теорему мы будем в дальнейшем называть теоремой орто- ортогональности. Мы обсуждали свойства собственных значений и соб- собственных векторов вещественного линейного оператора, однако еще не рассмотрен вопрос о том, существуют ли вообще для данного линейного оператора собственные значения и собственные векторы, а если и существуют, то как их найти. На этот вопрос, как правило, весьма трудно ответить. Имеется, однако, один полезный частный случай, который можно рассмотреть до конца, когда вещественный линейный оператор ? удовлетворяет алгебраическому урав- уравнению = 0, A7) причем коэффициенты уравнения а — числа. Это уравнение означает, очевидно, что линейный оператор ф (|), дей- действуя на любой кет-вектор или бра-вектор, дает в резуль- результате нуль. Пусть A7) есть простейшее алгебраическое уравнение, которому удовлетворяет ?. Тогда можно показать сле- следующее: (се) число собственных значений 5 равно п; (Р) имеется столько собственных кет-векторов оператора I, что любой кет всегда может быть предетавлен в виде суммы этих собственных кет-векторов.
50 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ Алгебраическое выражение ф (|) может быть представлено в виде произведения п сомножителей, линейных относи- относительно |, Ф (I) = (? - с,) (I - с2) (g - с,) ... (| _ ся), A8) где с — некоторые числа, среди которых могут быть и одинаковые. Такое разбиение на множители может быть произведено для случая, когда \ — линейный оператор, точно так же, как и для обычной алгебраической переменной, поскольку в формуле A8) не содержится величин, не ком- коммутирующих с \. Обозначим через %г (?) частное от деления Ф (I) на (i — сг), т. е. <f(t) = (t-Cr)Xr(t) (г = 1, 2, 3, .... п). Тогда для любого кет-вектора j Р) выполняется равенство (?-Cr)Xr(?)|^> = q>(g)|/>>=0. A9) Далее Xr (?) I Р) не может быть равно нулю для любого | Р >, ибо в этом случае %г (?) само было бы равно нулю и % удовлетворяло бы уравнению (п. — 1)-й степени, что противоречит предположению о том, что A7) есть простей- простейшее уравнение, которому удовлетворяет ?. Если выбрать | Р) так, чтобы выражение %r (I) \ P) не исчезало, то из урав- уравнения A9) следует, что %г (|) \ Р) есть собственный кет- вектор оператора |, относящийся к собственному значению сг. Это рассуждение годится для любого г от 1 до п, и, сле- следовательно, каждое из чисел с есть собственное значение |. Никакое другое число не может быть собственным значе- значением |. Действительно, если ?' есть собственное значение, относящееся к собственному кет-вектору |?'), т. е. то мы получаем отсюда а так как левая часть уравнения равна нулю, то и ф (|') = 0. Чтобы закончить доказательство утверждения (а), мы должны убедиться, что все числа с различны. Допустим, что не все с различны и что cs встречается т раз, где т >¦ 1. Тогда ф (?) имеет вид
§ 9. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ 51 причем е (I) есть целая рациональная функция от ?. Далее, из уравнения A7) следует, что уравнение (?-с,Ге(?)|Л> = 0 B0) справедливо для любого кет-вектора | А). Поскольку число cs есть собственное значение вещественного опера- оператора ?, оно должно быть вещественным, так что ? — cs есть вещественный линейный оператор. Уравнение B0) имеет теперь тот же вид, что и уравнение (8), в котором | заменено на I — cs, а \Р) на 0 (?) \ А). На основании теоремы, которая была доказана в связи с уравнением (8), мы можем утверждать, что (?-с,)вф|Л>=0. Поскольку кет | А > произволен, то что противоречит предположению о том, что A7) есть простейшее уравнение, которому удовлетворяет ?. Следо- Следовательно, все числа с различны, и утверждение (а) доказано. Обозначим через %г (сг) то число, которое получится, если в алгебраическое выражение %г (?) подставить вместо | число сг. Поскольку все с различны, %г (сг) не может быть равно нулю. Рассмотрим далее выражение 21г (I) 1 Х(С) Если в него подставить cs вместо |, то все члены суммы, за исключением члена г = s, обратятся в нуль. Это следует из того, что множитель (? — с^) содержится во всех функ- функциях %г (|), за исключением той, для которой г = s. Член суммы, для которого г = s, равен единице, и, следовательно, все выражение B1) обращается в нуль, если вместо % под- подставить любое из п чисел съ с2, ..., сп. Поскольку, однако, выражение B1) есть целая рациональная функция от | степени п — 1, оно должно быть тождественно равно нулю. Если теперь подействовать линейным оператором B1) на произвольный кет \ Р) и приравнять результат нулю, мы получим 2Ь-х'Ш|Р)- B2)
52 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ Но, согласно уравнению A9), каждый из членов этой суммы является собственным кет-вектором |, если только он не обращается в нуль. Таким образом, уравнение B2) выра- выражает произвольный кет [ Р) в виде суммы собственных векторов оператора |, и утверждение (Р) доказано. В качестве простого примера рассмотрим вещественный линейный оператор а, который удовлетворяет уравнению а2=1. B3) Тогда 0 имеет два собственных значения 1 и —1. Любой вектор | Р) может быть представлен в виде \Р)A + о)\Р) + (\о)\Р) Легко убедиться, что оба члена в правой части этого ра- равенства являются собственными кет-векторами оператора а (если только они не обращаются в нуль), относящимися соответственно к собственным значениям 1 и —1. § 10. Наблюдаемые Мы сделали ряд предположений о том, каким образом представляются математически в нашей теории состояния и динамические переменные. Эти предположения сами по себе не являются законами природы, однако они станут законами природы, если мы сделаем некоторые дальнейшие предположения, позволяющие дать физическую интерпрета- интерпретацию теории. Эти дальнейшие предположения должны уста- установить связь между результатами опытов, с одной стороны, и математическим аппаратом, с другой стороны. Производя опыт, мы измеряем некоторую динамическую переменную. Физически очевидно, что результатом такого опыта всегда будет вещественное число, поэтому следует ожидать, что любая динамическая переменная, которую мы можем измерить, должна быть вещественной динамической переменной. Казалось бы, измерение комплексной динами- динамической переменной можно было бы произвести, измеряя порознь ее вещественную и чисто мнимую части. Однако такое действие включает в себя два измерения или два опыта, проведение которых возможно в классической механике и не всегда возможно в квантовой, поскольку оба опыта могут мешать друг другу. Вообще говоря, нельзя считать,
§ 10. НАБЛЮДАЕМЫЕ 53 что два измерения могут быть проведены точно и одно- одновременно, а если же их провести почти сразу одно за дру- другим, то первое обычно приводит к возмущению состояния системы и к неопределенности, которая влияет на второе измерение. Поэтому мы должны считать, что динамические переменные, которые мы можем измерить, вещественны, условие их вещественности в квантовой механике сформу- сформулировано в § 8. Однако и не всякая вещественная динами- динамическая переменная может быть измерена. Необходимы еще дальнейшие ограничивающие условия, как мы увидим далее. Сделаем теперь некоторые предположения, связанные с физическим толкованием теории. Если динамическая си- система находится в собственном состоянии вещественной динамической переменной |, которое относится к собствен- собственному значению \', то в результате измерения \ мы наверняка получим число ?'. Обратно, если система находится в таком состоянии, что измерение динамической переменной | на- наверняка дает один определенный результат (вместо того чтобы давать, в общем случае, тот или иной из всех возмож- возможных результатов в соответствии с вероятностными законами), то система находится в состоянии, которое является соб- собственным состоянием ?, а результатом измерения будет то собственное значение переменной \, к которому относится собственное состояние. Эти предположения разумны, по- поскольку собственные значения вещественного линейного оператора вещественны. Отметим некоторые прямые следствия из этого предпо- предположения. Если мы имеем два или более собственных состоя- состояний динамической переменной ?, относящихся к одному собственному значению |, то любое состояние, полученное путем суперпозиции этих состояний, будет также собствен- собственным состоянием переменной I и относится к тому же соб- собственному значению ?'. Мы можем, следовательно, утвер- утверждать, что если имеются два или более состояний, для которых измерение g наверняка приводит к результату ?', то и для состояния, полученного в результате их суперпо- суперпозиции, результатом измерения \ также будет наверняка ?'. Это позволяет нам отчасти понять физический смысл супер- суперпозиции состояний. Далее, два собственных состояния ?, относящихся к разным собственным значениям, ортого- ортогональны. Мы может утверждать, что два состояния, для кото- которых измерение | дает наверняка два разных результата,
54 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ ортогональны. Это позволяет нам отчасти понять физиче- физический смысл ортогональных состояний. Когда мы измеряем вещественную динамическую пере- переменную |, то возмущение, вызванное актом измерения, вы- вызывает скачок в состоянии динамической системы. Если мы производим второе измерение той же самой динамической переменной | непосредственно после первого измерения, то вследствие физической непрерывности результат второго измерения должен быть тот же, что и результат первого "). Таким образом, после того как произведено первое измере- измерение, в результатах второго нет никакой неопределенности. Поэтому после того, как произведено первое измерение, система находится в собственном состоянии динамической переменной |, а собственное значение, к которому это состояние относится, равно результату первого измерения. Это утверждение остается справедливым и в том случае, если второе измерение фактически не производилось. Таким образом, мы видим, что измерение всегда вызывает скачок системы в собственное состояние той динамической перемен- переменной, измерение которой производилось, а собственное зна- значение, к которому относится это собственное состояние, равно результату измерения. Мы можем утверждать, что в каком бы состоянии ни находилась динамическая система, результатом измерения вещественной динамической переменной будет одно из собственных значений этой переменной. Наоборот, любое собственное значение является возможным результатом измерения динамической переменной для некоторых состоя- состояний системы. В самом деле, мы наверняка получим этот результат, если система находится в собственном состоянии, относящемся к этому собственному значению. Отсюда ясен физический смысл собственных значений. Совокупность собственных значений динамической переменной предста- представляет просто возможные результаты измерений этой дина- динамической переменной, и поэтому задача о вычислении соб- собственных значений является важной задачей. Сделаем еще одно предположение, связанное с физиче- физическим толкованием теории, а именно: пусть система нахо- *) Это рассуждение непоследовательно, так как нельзя ссылаться на физическую непрерывность, если акт измерения вызывает скачок. (Прим. В. А. Фока.)
§ 10: НАБЛЮДАЕМЫЕ 55 дится в некотором состоянии и над ней производится изме- измерение некоторой вещественной динамической переменной. Тогда состояния, в которые может перейти система в ре- результате измерения, таковы, что начальное состояние ли- линейно выражается через них. Поскольку все эти состояния, в которые может перейти система, являются собственными состояниями переменной ?, исходное состояние должно линейно выражаться через собственные состояния этой переменной. Но исходное состояние может быть любым и, таким образом, любое состояние линейно выражается через собственные состояния ?. Если любое состояние может быть линейно выражено через состояния, относящиеся к неко- некоторой системе векторов, то мы, по определению, назовем такую систему полной. Тогда наше заключение можно сформулировать в следующем виде: собственные состояния переменной ? образуют полную систему. Не всякая вещественная динамическая переменная обла- обладает достаточным количеством собственных состояний, чтобы образовать полную систему. Те переменные, собственные состояния которых не образуют полной системы, не являются величинами, которые могут быть измерены. Таким образом, мы, помимо условия вещественности, получили еще одно условие, которому должна удовлетворять динамическая переменная, для того чтобы ее можно было измерить. Те динамические переменные, собственные состояния кото- которых образуют полную систему, мы будем называть наблю- наблюдаемыми. Итак, любая величина, которую можно изме- измерить, есть наблюдаемая. Возникает естественный вопрос: может ли быть измерена любая наблюдаемая? Теоретически на этот вопрос можно ответить — да. Практически может оказаться, что весьма затруднительно построить такой прибор, который мог бы измерять некоторую определенную наблюдаемую. Воз- Возможно, что экспериментатор не сможет сказать, как по- построить такой прибор, однако теоретически всегда можно вообразить, что такое измерение может быть произведено. Выясним, как выражается математически условие того, что динамическая переменная ? является наблюдаемой. Ее собственные значения могут состоять из (конечного или бес- бесконечного) дискретного ряда чисел или же они могут со- состоять из всех чисел в некотором интервале, например из всех чисел в промежутке от а до Ь. В первом случае любое
56 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ состояние будет линейно зависеть от собственных состоя- состояний |, если любой вектор состояния может быть представ- представлен в виде суммы собственных векторов |. Во втором слу- случае это требование должно быть несколько изменено, по- поскольку вместо суммы следует брать интеграл, т. е. в этом случае требуется, чтобы кет \Р) мог быть представлен в виде интеграла от собственных кет-векторов |: \P)~\\l')di', B4) где \\') — собственный кет-вектор переменной \, относя- относящийся к собственному значению ?', а областью интегриро- интегрирования является область собственных значений, соответст- соответствующих тем векторам, от которых линейно зависит данный вектор. Не всякий кет, линейно зависящий от собственных кет-векторов переменной |, может быть представлен, со- согласно формуле B4), в виде интеграла. Зто видно из того, что сам собственный кет-вектор, или, в более общем случае, произвольная сумма собственных кет-векторов, не может быть представлена в таком виде. Условие того, что собствен- собственные состояния переменной | образуют полную систему, формулируется поэтому так: произвольный кет | Р) можно выразить в виде 'интеграла и суммы собственных значений переменной I, т. е. 5i;d>, B5) где все кет-векторы | \'с) и | %rd) являются собственными векторами переменной %, а значки с (continuous — непрерыв- непрерывный) и d (discrete — дискретный) введены для того, чтобы различать эти векторы в случае, когда ?' и \г равны; интег- интеграл берется по всей области изменения собственных значе- значений, а сумма — лишь по некоторым отдельным собственным значениям. Таким образом, в случае, когда собственными значениями переменной \ являются все числа в некотором интервале, то переменная \ является наблюдаемой при выполнении условия B5). Встречается иногда и более общий случай, когда мно- множество собственных значений представляет собой некото- некоторый интервал, и, кроме того, дискретный ряд чисел, лежа- лежащих вне этого интервала. Условие того, чтобы динамиче- динамическая переменная \ была наблюдаемой, остается в этом слу- случае прежним: необходимо, чтобы произвольный кет можно
§ 10. НАБЛЮДАЕМЫЕ 57 было выразить в виде правой части формулы B5), причем под суммой по г в этом случае понимается суммирование как по дискретному ряду собственных значений, лежащему вне сплошного спектра, так и по дискретным собственным значениям переменной ?, лежащим внутри сплошного спектра. Математически часто бывает трудно установить, удовлет- удовлетворяет ли динамическая переменная этим условиям, т. е. является ли она наблюдаемой, поскольку задача определе- определения собственных значений и собственных векторов, вообще говоря, весьма трудна. Однако в ряде случаев мы можем и на основании экспериментальных фактов утверждать с достаточным основанием, что динамическая переменная может быть измерена; тогда мы можем считать, что она является наблюдаемой, несмотря на отсутствие математиче- математического доказательства. ААы будем часто поступать таким обра- образом в процессе построения теории, например, мы будем считать, что энергия любой динамической системы всегда является наблюдаемой, хотя, за исключением простейших случаев, доказательство этого утверждения невозможно провести средствами современного математического анализа. В частном случае, когда динамическая переменная — число, любое состояние является собственным состоянием и динамическая переменная, очевидно, является наблюдае- наблюдаемой. Любое измерение этого числа всегда дает один и тот же результат, так что это число будет физической констан- константой, подобной заряду электрона. Физическая константа в квантовой механике может, таким образом, рассматри- рассматриваться либо как наблюдаемая с единственным собственным значением, либо как обычное число, появляющееся в урав- уравнениях. Обе точки зрения эквивалентны. Если вещественная динамическая переменная удовлет- удовлетворяет алгебраическому уравнению, то из утверждения (Р) предыдущего параграфа следует, что динамическая пере- переменная является наблюдаемой. Такая наблюдаемая имеет конечное число собственных значений. Наоборот, любая наблюдаемая с конечным числом собственных значений удовлетворяет алгебраическому уравнению. Действительно, пусть |', |", ...,?" — собственные значения наблюдаемой |, тогда уравнение (Е - ?') (g — Г)... (S — 6я) i ^> = о
58 ГЛ. И. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ справедливо для любого собственного кет-вектора перемен- переменной ?, а следовательно, оно справедливо и для любого | Р), поскольку переменная ? является наблюдаемой и любой кет-вектор состояния может быть представлен в виде суммы собственных кет-векторов. Следовательно, (&-Г)(?-Г)..-(&-?я) = о. B6) В качестве примера рассмотрим линейный оператор | А) (А |, где \ А) — нормированный кет. Этот линейный оператор веществен согласно формуле G), а его квадрат равен {1 Л> <Л |}2 = 1 Л><Л 1 Л> <Л ! = | Л><Л |, B7) поскольку (А |Л) = I. Таким образом, квадрат этого оператора равен ему самому. Следовательно, оператор удовлетворяет алгебраическому уравнению и является на- наблюдаемой. Его собственными значениями будут 1 и О, причем собственный кет-вектор | А ) соответствует собст- собственному значению 1, а любой кет, ортогональный к | А ), соответствует собственному значению 0. Измерение этой наблюдаемой наверняка дает результат 1, если динамиче- динамическая система находится в состоянии, соответствующем век- вектору | А ), и результат 0, если система находится в орто- ортогональном состоянии, так что эту наблюдаемую можно рассматривать как величину, которая определяет, находится ли система в состоянии | А ) или нет. Прежде чем окончить этот параграф, рассмотрим усло- условия того, что интеграл, подобный интегралу в формуле B4), имеет смысл. Пусть | X) и | У) — два кет-вектора, которые могут быть выражены в виде интегралов от собственных кет-векторов переменной ?, где х и у — значки, позволяющие различать оба подынтег- подынтегральных выражения. Тогда, взяв уравнение, сопряженное первому, и умножая его на второе, получаем (X\Y) = \l(l'x\l"y)dl'dl\ B8) Рассмотрим теперь интеграл \. B9)
§ 10, НАБЛЮДАЕМЫЕ 59 Согласно теореме ортогональности подынтегральное выра- выражение в нем должно исчезать во всей области интегрирова- интегрирования, за исключением одной точки ?" = ?'. Если подынтег- подынтегральное выражение в этой точке конечно, то интеграл B9) исчезает, и если это справедливо для всех ?', то из фор- формулы B8) мы получаем, что исчезает также (X | У). Но поскольку, вообще говоря, (X | У) не равно нулю, по- постольку A,'х | %,'у) должно быть бесконечно велико, так чтобы интеграл B9) не исчезал и был конечным. В § 15 обсуждается, каким образом должно стремиться к беско- бесконечности это выражение, для того чтобы указанные требо- требования были выполнены. До сих пор во всех наших рассуждениях подразумева- подразумевалось, что наши бра-векторы и кет-векторы имеют конечную длину и их скалярное произведение конечно. Мы видим теперь, что необходимо ослабить это условие, когда мы имеем дело с наблюдаемой, собственные значения которой заполняют некоторый интервал. Если этого не сделать, то нельзя будет рассматривать случай, когда собственные зна- значения заполняют область (сплошной спектр собственных значений), и наша теория будет недостаточной для рас- рассмотрения большинства практических задач. Полагая выше | У) = | X), мы получаем, что, вообще говоря, A'х | \'х) бесконечно велико. Мы примем, что если I \'х) ф 0, то l(t'x\t"x)d$">0. C0) Эта аксиома для векторов бесконечной длины аналогична условию (8) в § 6. Пространство бра-векторов и кет-векторов, имеющих конечную длину и конечное скалярное произведение, назы- называется математиками пространством Гильберта. Бра-век- Бра-векторы и кет-векторы, которые мы теперь используем, обра- образуют пространство более общее, чем пространство Гиль- Гильберта. Далее, мы можем убедиться в том, что разложение кет- вектора | Р), согласно формуле B5), является единствен- единственным, если только в сумме нет двух или большего числа чле- членов, относящихся к одному и тому же собственному значе- значению. Чтобы доказать это, допустим, что возможны два различных разложения для | Р). Тогда, вычитая одно из
60 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ другого, получаем уравнение вида C1) где а и b — новые значки, характеризующие собственные векторы, а еумма по s включает в себя все члены, оставшиеся после вычитания одной суммы из другой. Если в сумме по s имеется член, соответствующий собственному значению ?f, лежащему вне сплошного интервала, то, умножая C1) слева на (?fb | и используя теорему ортогональности, получаем что противоречит условию (8) § 6. Далее, если подынтег- подынтегральное выражение не исчезает для некоторого собствен- собственного значения ?", не равного значениям Is, имеющимся в сумме, то, умножая C1) слева на (?"a | и используя теорему ортогональности, получаем что противоречит условию C0). Наконец, если в выраже- выражении C1) имеется член в сумме, соответствующий собствен- собственному значению ?', лежащему внутри интервала, то, умно- умножая C1) слева на (?,'Ь | и на фа |, получаем b), C2) jj b>. C3) Интеграл в выражении C3) конечен, а следовательно, конечны также произведения (I'a \ I'b) и фЬ \ 1'а). От- Отсюда следует, что интеграл в выражении C2) равен нулю, т. е. равно нулю произведение (\'b \ Ь,'Ь), и мы снова при- приходим к противоречию. Таким образом, все члены в выра- выражении C1) должны быть равны нулю и разложение кет- вектора | Р) в форме B5) является единственным. § 11. Функции наблюдаемых Пусть 5 — некоторая наблюдаемая. Мы можем умно- умножить ее на вещественное число k и получить новую наблю- наблюдаемую k\. Если система находится в таком состоянии, что измерение переменной | наверняка дает результат |', то
§ 11. ФУНКЦИИ НАБЛЮДАЕМЫХ 61 измерение переменной k\ должно обязательно дать резуль- результат k\'. Это условие должно выполняться для того, чтобы теория была самосогласованной. Легко убедиться, что оно действительно выполняется Кет, соответствующий тому со- состоянию, для которого измерение | наверняка приводит к результату ?', есть собственный кет-вектор наблюдае- наблюдаемой ?, т.е. кет-вектор ||')> удовлетворяющий уравнению Из этого уравнения следует откуда видно, что 11') является также собственным кет- вектором наблюдаемой k\ с собственным значением k%', и, следовательно, измерение k\ наверняка даст результат #?'. В более общем случае мы можем взять вещественную функцию f (I) от I и рассматривать ее как новую наблюдае- наблюдаемую, которая будет измерена автоматически, как только измерена ?, так как экспериментальное определение вели- величины | дает нам также и значение f (|). Не обязательно считать / (I) вещественной функцией; если / (|) комплексна, то ее вещественная и мнимая части будут являться двумя наблюдаемыми, которые измеряются автоматически, как только измерена ?. Если система находится в таком состоя- состоянии, что измерение | наверняка дает рез> дьтат ?', то изме- измерение вещественной и чисто мнимой чахлей / (Q должно наверняка дать в качестве результатов вещественную и мнимую части от / (|'). Выполнение этого условия необхо- необходимо для того, чтобы теория была непротиворечива. В том случае, когда / (g) можно представить в виде степенного ряда f(l) + t + ?* + &* + в котором коэффициенты с — числа, выполнение этого усло- условия может быть снова проверено с помощью элементарной алгебры. В случае более общих функций f проверка усло- условия может оказаться невозможной. Тогда само условие может быть использовано для определения переменной f (?), поскольку она еще не была определена математически. Таким путем мы можем получить более общее определение функции от наблюдаемой, чем то, которое получается с по- помощью степенного ряда.
62 ГЛ. П. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ Определим в общем случае / (?) как такой линейный опе- оператор, который удовлетворяет уравнению Ш1 ?'>=/(?')!?'> C4) для любого собственного кет-вектора 11') переменной ?, причем каждому собственному значению |' сопоставляется некоторое число / (?'). Легко убедиться, что это определе- определение самосогласовано также и по отношению к линейно за- зависимым собственным кет-векторам | \'). Если мы имеем собственный кет-вектор 11'А ), линейно зависящий от дру- других собственных кет-векторов переменной %, то эти другие собственные кет-векторы все должны относиться к тому же самому собственному значению ?', в противном случае должно было бы выполняться уравнение типа C1), что, как мы видели, невозможно. Возьмем уравнение, которое выражает | \'А) линейно через другие собственные кет- векторы переменной \, и подействуем на обе части этого уравнения слева оператором f (?). При этом мы просто умножим каждый член уравнения на число / (!'), так что оно, очевидно, будет по-прежнему удовлетворяться. Далее, уравнения C4) достаточно для того, чтобы определить опе- оператор / (?) полностью. Действительно, для того чтобы полу- получить результат действия / (?) на любой кет | Р), нам доста- достаточно разложить \ Р) согласно формуле B5), а затем по- положить l ^^)\lrd). C5) Сопряженный оператор f (I) определяется уравнением, сопряженным уравнению C1), т. е. которое должно выполняться для любого собственного бра- вектора, причем f (?') — функция, комплексно-сопряженная функции / (!'). Заменим в этом уравнении |' на \" и умно- умножим его справа на произвольный кет | Р). Тогда, исполь- используя разложение B5) для | Р), получаем - \ 1 (Г) <Г 1 \'с) dV + Ц / (Г) <П Vd) = г = \ f (?") <Г I \'с) <% + / (I") (Г i I'd). C6)
§ И. ФУНКЦИИ НАБЛЮДАЕМЫХ 62 При этом использована теорема ортогональности и подразу- подразумевается, что (?" | |"d) равно нулю, если I," не совпадает ни с одним из собственных значений, встречающихся в сум- сумме. Далее, подставляя вместо / (?') комплексно-сопряжен- комплексно-сопряженную функцию J (?') в уравнении C5) и умножая его слева на (?" |, получаем <&" \f(l)\P) = \f (i') <Г IV с) di'+f (Г) <Г | I'd). Правые части этого уравнения и уравнения C6) совпадают, поскольку подынтегральное выражение равно нулю при I' Ф I", и, следовательно, Это уравнение справедливо для любого собственного бра- вектора (?" | и для любого кет-вектора | Р), и, следова- следовательно, TW=f(D- C7) Таким образом, оператор, сопряженный линейному опера- оператору f (?), есть комплексно-сопряженная функция f от опе- оператора |. Отсюда, в частности, следует, что если / (|') — вещест- вещественная функция от |', то / (|) — вещественный линейный оператор; / (|) является, кроме того, и наблюдаемой, так как каждое собственное состояние ? является и собствен- собственным состоянием / (?), а система этих собственных состояний является полной. Используя сделанное выше определение, мы можем придать смысл любой функции f от наблюдаемой, пред- предполагая лишь, что область, в которой определена функ- функция вещественной переменной f (x), включает в себя все собственные значения наблюдаемой. Если область суще- существования содержит, помимо собственных значений, еще и другие точки, то значения / (л:) в этих точках никак не повлияют на функцию от наблюдаемой. Функция не обя- обязательно должна быть аналитической или непрерывной. Собственными значениями функции от наблюдаемой будут функции от собственных значений самой наблюдаемой. Важно отметить, что определить функцию от наблюдае- наблюдаемой возможно лишь в том случае, если для каждого зна- значения х, равного собственному значению наблюдаемой,
64 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ существует лишь единственное значение / (х). Таким обра- образом, функция / (х) должна быть однозначной *). Это утверж- утверждение можно проиллюстрировать, рассматривая следующий вопрос: если мы имеем наблюдаемую/ (А), которая является вещественной функцией от наблюдаемой А, то является ли в свою очередь А функцией от наблюдаемой / (А)? Ответ на этот вопрос будет положителен, если различным собст- собственным значениям А' наблюдаемой А всегда соответствуют различные значения / (А1), Если же существуют два различ- различных собственных значения А' и А" наблюдаемой А такие, что / (А') — f (А"), то собственному значению / (А1) наблю- наблюдаемой / (Л) не будет соответствовать единственное соб- собственное значение наблюдаемой А, и, следовательно, наблю- наблюдаемая А не будет являться функцией от наблюдаемой / (А). Используя определение, легко установить математически, что сумма или произведение двух функций от наблюдаемой также будет функцией этой наблюдаемой и что функция от функции наблюдаемой также будет функцией той же на- наблюдаемой. Также легко убедиться, что вся теория функ- функций наблюдаемой симметрична по отношению к бра-векто- бра-векторам и кет-векторам, и что мы могли бы с таким же успехом исходить из уравнения (t'\f(l)=f(l')(V\ C8) вместо уравнения C4). Закончим этот параграф разбором двух примеров, кото- которые имеют большое практическое значение, а именно, рассмотрим обратную величину и квадратный корень. Об- Обратная величина от наблюдаемой существует, если наблю- наблюдаемая не имеет собственного значения нуль. Пусть наблю- наблюдаемая а не имеет собственного значения нуль; тогда обрат- обратная величина, которую мы обозначим а или 1/а будет удовлетворять уравнению а-1|а'>=а'-1|а'>, C9) где | а') — собственный кет-вектор наблюдаемой а, отно- относящийся к собственному значению а'. Отсюда следует *) В той области, в которой расположены собственные значения наблюдаемой. (Прим. В. А, Фока),
§11. ФУНКЦИИ НАБЛЮДАЕМЫХ 65 Поскольку это равенство справедливо для любого собствен ного кет-вектора | а'), мы получаем аа-1=1. D0) Аналогично а-ха=1. D1) Каждого из этих уравнений достаточно для того, чтобы полностью определить наблюдаемую а, если только наблю- наблюдаемая а не имеет собственного значения нуль. Докажем это, например, для уравнения D0). Пусть х — линейный оператор, удовлетворяющий уравнению ах— 1. Умножим это уравнение слева на оператор а, который определен уравнением C9). Получаем и отсюда, используя D1), имеем х = or1. Уравнения D0) и D1) можно использовать для опре- определения оператора, обратного (если только он существует) общему линейному оператору а, который может быть даже и не вещественным. В последнем случае одного из этих уравнений может оказаться недостаточно. Если обратные операторы имеются у каждого из двух линейных операто- операторов а и р, то их произведение также имеет обратный опе- оператор, который равен = р-1а-1 D2) и может быть получен, если обратить каждый из сомножи- сомножителей и взять их в обратной последовательности. Справед- Справедливость формулы D2) видна из того, что ее правая часть дает единицу при умножении на оф как справа, так и слева. Этот закон для обращения произведения можно немедленно обобщить на случай большего числа сомножителей, т. е. можно написать Квадратный корень от наблюдаемой а всегда существует, а если а не имеет отрицательных собственных значений, то
66 ГЛ. П. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ он веществен. Мы обозначим его Уа или а1/г. Он удовлет- удовлетворяет уравнению У'а\а')^±У^\а'), D3) где | а') — собственный кет-вектор переменной а с собст- собственным значением а'. Отсюда имеем Уа У~а \а') = j/о7 Уа/ \а') = а' \ а') = а |а'), и поскольку это равенство справедливо для любого собст- собственного кет-вектора | а'), должно выполняться равенство VaVa^a. D4) Вследствие того, что знак .в формуле D3) произволен, существует много квадратных корней. Для того чтобы вы- выбрать один из них, мы должны определить знак в уравне- уравнении D3) для каждого собственного значения. Этот знак может меняться нерегулярно от одного собственного зна- значения к другому, при этом уравнение D3) будет всегда определять некоторый линейный оператор Уа, удовлетво- удовлетворяющий уравнению D4) и являющийся квадратным корнем из а. Если одно собственное значение соответствует не- нескольким собственным кет-векторам, то мы, в соответствии с нашим определением функции, должны иметь в урав- уравнении D3) одинаковый знак для всех этих собственных кет- векторов. Однако если мы возьмем разные знаки, то урав- уравнение D4) будет по-прежнему выполняться и поэтому урав- уравнение D4) само по себе не определяет Уа, за исключением особого случая, когда каждому собственному значению соответствует лишь один независимый собственный кет- вектор. Число различных квадратных корней от наблюдаемой равно 2", где п есть полное число не равных нулю собст- собственных значений. Практически эта функция используется лишь для наблюдаемых, не имеющих отрицательных соб- собственных значений, причем обычно используется тот квад- квадратный корень, для которого в формуле D3) всегда стоит знак плюс. Этот частный вид квадратного корня назы- называется положительным квадратным корнем.
§ 12. ОБЩЕЕ ФИЗИЧЕСКОЕ ТОЛКОВАНИЕ 67 § 12. Общее физическое толкование Те предположения, которые мы сделали в начале § 10 для того, чтобы получить физическое толкование матема- математической теории, носили довольно частный характер, так как их можно было использовать только по отношению к собственным состояниям. Необходимы более общие пред- предположения, которые позволили бы нам извлечь физические сведения из математической схемы и в том случае, когда мы не имеем дела с собственными состояниями. В классической механике наблюдаемая всегда, как мы говорим, «имеет определенное значение» для любого задан- заданного состояния системы. Что соответствует этому в кван- квантовой механике? Если взять наблюдаемую | и какие-либо два состояния х и у с соответствующими векторами | х) и | у), то можно составить число (х | ? \ у). Это число по трем причинам мало похоже на ту величину, которую на- наблюдаемая может «иметь» согласно классической теории: 1) оно относится к двум состояниям системы, в то время как классическое значение относится к одному состоянию; 2) оно не является, вообще говоря, вещественным числом; 3) оно не определяется однозначно заданием наблюдаемой и обоих состояний, так как векторы | х) и \ у) содержат про- произвольные численные множители. Даже если мы будем счи- считать | х) и \у) нормированными, то и тогда в выражении (х |Е \ у) останется неопределенным множитель, равный по модулю единице. Однако все эти три аргумента теряют силу, если положить оба состояния одинаковыми и считать, что \ у) есть кет-вектор сопряженный бра-вектору (х\. Число, которое мы тогда получим, а именно (х | 5 \ х), является всегда вещественным, оно однозначно определено, если кет | х) нормирован, так как, если мы умножим | х) на численный множитель е'с, где с — некоторое вещественное число, то мы должны умножить (х | на еЧс, и число (х | I \х) не изменится. На основании этого можно было бы выдвинуть гипотезу о том, что наблюдаемая | «имеет значение» (х | ? | х) для состояния х, аналогично тому, как это имеет место в клас- классическом случае. Однако эта гипотеза неудовлетворительна по следующей причине. Рассмотрим вторую наблюдаемую г\, которая будет иметь, согласно сделанной гипотезе, значе- значение (х | ц | х) для того же состояния. Мы должны тогда,
68 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ согласно классической аналогии, ожидать, что сумма двух наблюдаемых будет иметь в этом состоянии значение, равное сумме значений каждой из наблюдаемых в отдельности, а произведение двух наблюдаемых будет иметь значение, равное произведению значений каждой из наблюдаемых. В самом деле, согласно нашей гипотезе для суммы двух наблюдаемых получается значение (х \ \ + ц \ х), кото- которое действительно равно сумме (х \ I | х) и (х\г[\х), но для произведения получается (х \ ?11 \x) или же (х \ц1 | х) — величины, которые не имеют простой связи с величинами (х ] ? | х) и (х | г) | х). Однако, поскольку дело обстоит плохо только в отно- отношении произведения, но не в отношении суммы, имеет смысл считать (х | ? | х) средним значением переменной | в состоянии х. Это можно сделать потому, что среднее от суммы двух величин должно быть равно сумме их средних значений, но среднее значение произведения не обязательно должно быть равно произведению средних значений. По- Поэтому мы сделаем основное предположение, что если про- производить большое число раз измерение переменной % над системой, находящейся в состоянии, которому соответст- соответствует кет | х), то среднее от всех полученных результатов будет равно (х \ ? \ х), причем предполагается, что кет | х) нормирован. Кет | х) может быть и не* нормирован; это с необходимостью имеет место, если состояние х есть собственное состояние некоторой наблюдаемой с собствен- собственным значением, относящимся к сплошному спектру. В этом случае следует предположить, что средний результат изме- измерения \ пропорционален (х | ? | х). Это основное предпо- предположение дает нам основу для общего физического толкова- толкования теории. Утверждение, что наблюдаемая «имеет определенное зна- значение» для определенного состояния, допустимо в квантовой механике только в частном случае, когда измерение наблю- наблюдаемой наверняка приводит к определенному значению, т. е. когда состояние является собственным состоянием этой наблюдаемой. Придавая такой ограниченный смысл этому утверждению, нетрудно показать с помощью алгебры, что если в данном состоянии две наблюдаемые имеют опре- определенное значение, то в этом же состоянии сумма двух наблюдаемых имеет значение, равное сумме значений ка- каждой наблюдаемой в отдельности (если только сумма на-
§ 12. ОБЩЕЕ ФИЗИЧЕСКОЕ ТОЛКОВАНИЕ 69 блюдаемых сама является наблюдаемой *)), а произве- произведение двух наблюдаемых будет иметь значение, равное про- произведению значений каждой из наблюдаемых в отдельности (если только произведение наблюдаемых само является наблюдаемой **)). В общем случае мы не можем говорить, что наблюдаемая имеет определенное значение в данном состоянии, но мы можем говорить, что она имеет определенное среднее зна- значение в данном состоянии. Мы можем пойти далее и гово- говорить о вероятности того, что наблюдаемая имеет некоторое значение, понимая под этим вероятность того, что это зна- значение будет получено, если произвести измерение. Значе- Значение для этой вероятности может быть получено из основного предположения следующим путем. Пусть имеется наблюдаемая ?, и пусть состоянию соот- соответствует нормированный вектор | х). Тогда из основного предположения следует не только то, что среднее значение | равно (х | ? | х), но также и то, что среднее значение лю- любой функции / (I) переменной ? также равно (х \ f A) | х). Пусть функция f (|) равна единице при \ — а, где а — некоторое вещественное число, и равна нулю при всех других значениях \. Такая функция имеет смысл согласно нашей общей теории функций от наблюдаемых, и ее можно обозначить \а в соответствии с тем общим смыслом, кото- который придается символу б с двумя значками (см. уравне- уравнение A7) § 16). Среднее значение этой функции от % равно как раз вероятности Ра того, что переменная | имеет зна- значение а. Таким образом, Ра = (х\Ь1а\х). D5) Если а не является собственным значением |, то 86в, дей- действуя на любой собственный вектор наблюдаемой Jj, дает нуль, следовательно, б|а = 0 и Ра = 0. Это согласуется с выводом в § 10, что любой результат измерения наблюдае- наблюдаемой должен быть равен одному из ее собственных значений. Если возможные результаты измерений наблюдаемой об- *) Это не очевидно, так как собственные состояния суммы могут не обладать свойством полноты. В этом случае сумма, рассматриваемая как отдельная величина, может не быть наблюдаемой. **) Здесь может не выполняться условие вещественности, а также и условие полноты системы собственных состояний.
70 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ разуют непрерывную последовательность, то для большин- большинства физических задач вероятность того, что | имеет строго определенное значение, равна нулю. В этом случае вели- величиной, которая существенна с физической точки зрения, будет вероятность того, что | имеет значение в промежутке между а и а + da. Эта вероятность, которую мы обозначим Р (a) da, равна среднему значению такой функции от |, которая равна единице, если | лежит в промежутке между а и а + da, и равна нулю вне этого промежутка. Такая функция от | имеет смысл согласно нашей общей теории функций от наблюдаемой. Обозначая эту функцию % (?), имеем Р (a) da = <*|X (?)!*>• D6) Если промежуток от а до а + da не содержит собственных значений \, то, как это было показано выше, х (I) = 0 и Р (а) — 0. Если вектор | х) не нормирован, то правые ча- части формул D5) и D6) будут соответственно пропорцио- пропорциональны вероятности того, что ? имеет значение а и вероят- вероятности того, что ? имеет значение, лежащее в промежутке от а до а 4 da. Принятое в § 10 предположение о том, что измерение ? наверняка дает результат ?', если система находится в соб- собственном состоянии наблюдаемой \ с собственным значе- значением |', согласуется с нашим основным предположением о физическом толковании и может быть выведено из него. Из основного предположения непосредственно следует, что если | ?') есть собственный кет-вектор наблюдаемой \ с соб- собственным значением |', то в случае дискретных собствен- собственных значений 6|а|?')=0, если аф\', и в случае сплошного спектра собственных значений | %(l) I I') = 0, если I' лежит вне промежутка от а до a -f da. В любом случае, если состояние характеризуется вектором 11'), то вероятность того, что g имеет значение, не равное ?', равна нулю. Собственное состояние наблюдаемой \ g собственным значением ?', лежащим в сплошном спектре, практически не может быть строго осуществлено, так как потребовалась бы бесконечно большая точность, чтобы получить | строго рав- равным I'. Самое большее, чего можно добиться практически, —
§ 13. КОММУТАТИВНОСТЬ И СОВМЕСТНОСТЬ 7! чтобы ? находилось в узком промежутке около значения ?'. Система будет тогда находиться в состоянии, приближаю- приближающемся к собственному состоянию переменной ?. Таким обра- образом, собственное состояние, относящееся к собственном) значению в сплошном спектре, является математической идеализацией того, что может быть достигнуто практически. Тем не менее эти собственные состояния играют весьма большую роль в теории и без них трудно обойтись. В науке есть много примеров таких теоретических построений, кото- которые являются предельными случаями того, что мы встре- встречаем на практике, и которые полезны для точной форму- формулировки законов природы, хотя экспериментально они не могут быть осуществлены; в данном случае мы имеем при- пример такого рода. Возможно, что бесконечная длина собст- собственных векторов, соответствующих этим собственным со- состояниям, связана с их неосуществимостью, и что всем осуществимым состояниям соответствуют такие векторы, которые могут быть нормированы и образуют гильбертово пространство. § 13. Коммутативность и совместность Состояние системы может быть одновременно собствен- собственным состоянием двух наблюдаемых | и г\. Если состояние характеризуется кет-вектором | А), то мы получим тогда уравнения где ?' и г)' — соответственно собственные значения | и г\. Тогда мы получаем последовательно о наводит на мысль, что наиболее благоприятным для существования общего собственного значения будет тот случай, когда |т| — yfe = 0, т. е. когда обе наблюдаемые коммутируют. Если же они не коммутируют, то общее собственное состояние, хотя и не невозможно, но оно является скорее исключением, чем правилом. С другой
72 ГЛ. П. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ стороны, если наблюдаемые коммутируют, то имеется столько общих собственных состояний, что они образуют полную систему. Докажем это утверждение. Пусть \ и г\ — две коммутирующие наблюдаемые. Рас- Рассмотрим собственный кет-вектор | л') наблюдаемой л g соб- собственным значением т)' и разложим его по собственным кет-векторам наблюдаемой | согласно формуле B5). Тогда №0. D7) Собственные кет-векторы наблюдаемой I в правой части равенства снабжены дополнительным значком л' для того, чтобы подчеркнуть, что они получены не при разложении произвольного кет-вектора, как, скажем, в формуле B5), а при разложении конкретного кет-вектора | г\' >. Мы мо- можем теперь показать, что каждый из этих собственных кет- векторов наблюдаемой ? является также собственным кет- вектором наблюдаемой л в собственным значением л'- Имеем о = (л - л') I V) = S (л - л') I S'ti'c) 4' + 2 (л - *Г) I №>• D8) Далее кет (л — л') ! ?гл'^) удовлетворяет уравнению g (л - л') I Гл'й) = (л - V) SI Гл'<0 = = (л - л') ГI W> = Г (л - л') 15'л'й), откуда видно, что этот вектор является собственным кет- вектором наблюдаемой ? с собственным значением ?г; ана- аналогично вектор (л — л') IIVO является собственным кет- вектором I с собственным значением ?'. Таким образом, правая часть уравнения D8) представляет собой суперпози- суперпозицию (сумма плюс интеграл) собственных кет-векторов на- наблюдаемой I, причем эта суперпозиция равна нулю, что, как было доказано для уравнения C1), невозможно, если только подынтегральное выражение и каждый член суммы не обращаются в нуль. Следовательно, (л-л'I?'л'с> = о, (л-л'Ш'л'<О=о, так что все кет-векторы, которые имеются в правой части уравнения D7), являются собственными кет-векторами не только наблюдаемой л. но также и наблюдаемой |. Таким
§ 13. КОММУТАТИВНОСТЬ И СОВМЕСТНОСТЬ 73 образом, уравнение D7) дает разложение |т)') по общим собственным кет-векторам наблюдаемых | и т|. Поскольку любой кет может быть разложен по собственным кет-векто- кет-векторам | г)' > наблюдаемой ц, то, следовательно, любой кет может быть разложен по общим собственным кет-векторам наблюдаемых g и г), и, таким образом, общие собственные кет-векторы образуют полную систему. Рассмотренные выше общие собственные кет-векторы 11'ц'с) и | lry\'d) наблюдаемых | и т] имеют в качестве знач- значков соответствующие собственные значения ?', т]' или I7", т)' этих наблюдаемых наряду со значками cud, которые также могут оказаться необходимыми. Мы будем в основном при- придерживаться этих обозначений и в дальнейшем, снабжая общие собственные векторы в качестве значков соответст- соответствующими собственными значениями, точно так же, как мы делали это раньше для собственных векторов одной наблю- наблюдаемой. Теорема, обратная доказанной выше, гласит: если ? и т) — две наблюдаемые, общие собственные состояния которых образуют полную систему, то | и ц коммутируют. Для доказательства заметим, что если | %'ц') — общий собст- собственный кет-вектор с собственными значениями |' и t|', то (^i-ni)ii'ri'>=(rn'-ri'i'm'v>=o. D9) Поскольку общие собственные состояния образуют полную систему, то произвольный кет \ Р) может быть разложен по общим собственным кет-векторам | l'r\'), для каждого из которых справедливо уравнение D9), следовательно, и, таким образом, Понятие об общих собственных состояниях может быть обобщено на случай, когда имеется не две, а большее число наблюдаемых. При этом доказанные выше прямая и обрат- обратная теоремы будут по-прежнему справедливы, т. е. если имеется ряд наблюдаемых, каждая из которых коммути- коммутирует со всеми остальными, то их общие собственные состоя- состояния образуют полную систему, и обратно. Те же самые рассуждения, которые использовались при доказательстве для случая двух переменных, пригодны и в общем случае.
74 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ Так, например, если мы имеем три коммутирующих наблю- наблюдаемых |, ц, ?,, то можно разложить общий собственный кет- вектор наблюдаемых ? и у] по собственным кет-векторам ?, а затем показать, что каждый из этих собственных кет- векторов является также собственным кет-вектором \ и х\. Таким образом, общий собственный кет-вектор наблюдае- наблюдаемых I и г) можно разложить по общим собственным кет- векторам |, г) и ?, а так как любой кет может быть разло- разложен по общим собственным кет-векторам | и т], то он может быть разложен также и по общим собственным векто- векторам I, ц и ?. Теорема ортогональности для общих собственных кет- векторов гласит, что два общих собственных вектора ряда коммутирующих наблюдаемых ортогональны, если соот- соответствующие собственные значения обоих векторов отли- отличаются хотя бы для одной наблюдаемой. Благодаря тому, что общие собственные состояния двух или большего числа коммутирующих наблюдаемых образуют полную систему, мы можем построить теорию функций двух или большего числа коммутирующих наблюдаемых анало- аналогично построенной в § 11 теории функций одной наблюдае- наблюдаемой Если |, г), ?-, ... — коммутирующие наблюдаемые, то общая функция / этих наблюдаемых определяется как ли- линейный оператор, удовлетворяющий равенству /(?, л, ?, .. -)IW. ••> = /(!'. V. V, ...)IW-.. где |?'г|'О — общий собственный кет-вектор наблюдае- наблюдаемых I, г), Ё> ••• с собственными значениями |', г/, ?', ... Здесь f — любая функция / (а, Ь, с, ...), которая определена для всех тех значений а, Ь, с, ..., которые являются соответст- соответственно собственными значениями наблюдаемых |, г}, ?, ... Так же, как и для случая функции одной наблюдаемой, которая определялась условием C4), можно показать, что функция / A, г\, ?, ...) полностью определяется условием E0), что в соответствии g формулой C7) и что если / (а, Ь, с, ...)-- вещественная функция, то / (|, г\, ?, ,..) также вещественна и является наблюдаемой.
§ 13. КОММУТАТИВНОСТЬ И СОВМЕСТНОСТЬ 75 Далее мы можем обобщить формулы D5) и D6). Если заданы коммутирующие наблюдаемые ?, т), ?, ..., то мы можем построить такую функцию от них, которая равна единице, если \ = а, х\ = Ь, ? = с, ..., где а, Ь, с, ... — вещественные числа, и равна нулю, если хоть одно из этих равенств не выполняется. Эта функция может быть запи- записана в виде бЧаб^б^с ..., она и на самом деле равна про- произведению сомножителей б|а, 6^, 6Sr, ..., расположенных в любой последовательности, каждый из которых опре- определен как функция от одной наблюдаемой. В том, что это так, легко убедиться, если подставить это произведение вместо / (Е, г), ?, ...) в левую часть формулы E0). Среднее значение этой функции для любого состояния будет равно вероятности РаЬс... того, что наблюдаемые |, г\,?,... имеют в этом состоянии соответственно значения а, Ь, с, ... Таким образом, если состояние характеризуется нормированным кет-вектором | х), мы получаем из нашего основного предположения о физическом толковании, что РпЬс ¦ ¦ ¦ = (X | б|а6пДс ,..[Х). E1) Раьс--- равно нулю, если только хотя бы одно из чисел а, Ь, с, ... не равно собственному значению соответствующей наблюдаемой. Если какое-нибудь из чисел а, Ь, с, ... лежит в сплошном спектре собственных значений соответствующей переменной, то Раьс--- будет, вообще говоря, также равно нулю; однако в случае сплошного спектра требование, чтобы эта наблюдаемая имела строго определенное значение, сле- следует заменить требованием, чтобы она имела значение, лежа- лежащее в некоторой малой области, что означает замену од- одного из множителей б в E1) множителем, подобным % (?) в уравнении D6). Произведя такую замену для каждой из наблюдаемых ?, ц, ?, ..., для которой соответствующее численное значение а, Ь, с, ... лежит в сплошном спектре собственных значений, мы получим вероятность, которая, вообще говоря, не обращается в нуль. Если некоторые наблюдаемые коммутируют, то сущест- существуют состояния, в которых все эти наблюдаемые имеют опре- определенные значения в том смысле, как это объясняется в конце стр. 68. Такими состояниями будут общие собственные со- состояния. Таким образом, можно придать смысл тому, что различные коммутирующие наблюдаемые имеют одновре- одновременно определенные значения. Далее из формулы E1) мы
76 ГЛ. II. ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ И НАБЛЮДАЕМЫЕ видим, что для любого состояния можно придать смысл вероятности того, что при одновременном измерении раз- различных коммутирующих наблюдаемых будет получен опре- определенный результат. Это заключение представляет собой существенный шаг вперед. Вообще говоря, нельзя произ- произвести наблюдение над системой, которая находится в опре- определенном состоянии, не нарушив этого состояния и не испор- испортив тем самым условия для второго наблюдения. Поэтому в общем случае нельзя придать никакого смысла двум наблюдениям, которые производят одновременно. Из сде- сделанного выше заключения следует, что в частном случае, когда две наблюдаемые коммутируют, наблюдения следует считать совместимыми, т. е. не мешающими друг другу; это значит, что можно придать смысл двум наблюдениям, которые проводятся одновременно, и можно говорить о ве- вероятности получения определенного результата. Такие два наблюдения можно в действительности считать одним наблю- наблюдением более сложного типа, результат которого выра- выражается двумя числами вместо одного. € точки зрения общей теории, две или более коммутирующих наблюдаемых можно считать одной наблюдаемой, результат измерения которой состоит из двух или более чисел. Состояния, в которых это измерение наверняка приводит к определенному резуль- результату, являются совместными собственными состояниями.
ГЛАВА 111 ПРЕДСТАВЛЕНИЯ § 14. Базисные векторы В предыдущих параграфах мы построили алгебраиче- алгебраическую схему, в которой используются абстрактные вели- величины трех родов, а именно бра-векторы, кет-векторы и линейные операторы; используя эти величины, мы сфор- сформулировали некоторые из основных законов квантовой механики. Можно было бы и далее развивать теорию с помо- помощью этих абстрактных величин и использовать их в при- приложениях к конкретным задачам. Однако для ряда прило- приложений более удобно заменить абстрактные величины числами или совокупностями чисел со сходными математическими свойствами и использовать далее эти совокупности чисел. Такой переход аналогичен использованию координат в гео- геометрии и имеет то преимущество, что позволяет использо- использовать более мощные математические методы для решения конкретных задач. Способ, согласно которому абстрактные величины заме- заменяются числами, не является единственным: имеется много способов соответственно тому, что в геометрии возможно построить много координатных систем. Каждый из таких способов мы назовем представлением, а совокупность чисел, заменяющих абстрактную величину, — представителем этой абстрактной величины в данном представлении. Таким об- образом, представитель абстрактной величины аналогичен координатам геометрического объекта. Если в квантовой механике нужно решить конкретную задачу, то можно значительно облегчить работу, выбрав представление так, чтобы представители существенных для данной задачи абст- абстрактных величин имели наиболее простой вид. Для того чтобы построить представление наиболее об- общим способом, рассмотрим полную систему бра-векторов
78 ГЛ. III. ПРЕДСТАВЛЕНИЯ состояния такую, что произвольный бра-вектор может быть представлен в виде линейной комбинации бра-векторов этой последовательности (в виде суммы, интеграла или, быть может, в виде интеграла и суммы одновременно). Эти бра- векторы мы назовем базисными бра-векторами представле- представления. Как мы увидим далее, они полностью определяют представление. Рассмотрим произвольный кет | а) и образуем скаляр- скалярные произведения этого кет-вектора с каждым из базисных бра-векторов. Полученная таким образом совокупность чи- чисел и является представителем кет-вектора \ а). Эти числа определяют кет \а) однозначно. Действительно, если имеется второй кет | Cj), для которого эти числа те же са- самые, то скалярное произведение разности \ а)— | о^) на каждый из базисных бра-векторов равно нулю. Следова- Следовательно, равно нулю скалярное произведение этой разности на любой бра-вектор и, таким образом, сама разность \а) — | аг) также равна нулю. Мы можем предположить, что базисные бра-векторы нумеруются с помощью одного или нескольких параметров %ъ Х2, ..., %и, каждый из которых может принимать опре- определенные численные значения. Тогда базисные бра-векторы можно записать в виде (ЯХХ2 ... Ки |, а представитель кет- вектора \а) запишется в виде (Х^К% ... %п \ а). Любому возможному набору значений Хи Я2, ..., Я„, где каждый из параметров пробегает все возможные для него значения, сопоставляется число, и совокупность всех этих чисел со- составляет представитель кет-вектора | а). Такая совокуп- совокупность чисел образует функцию переменных Ки Я,2, ..., Ха. Таким образом, представитель кет-вектора можно рас- рассматривать либо как совокупность чисел, либо как функ- функцию тех переменных, которые используются для нумерации базисных бра-векторов. Если число независимых состояний динамической си- системы конечно и равно п, то достаточно взять п базисных бра, которые можно занумеровать одним параметром, при- принимающим значения 1, 2, ... Тогда представитель любого кет-вектора \ а)состоит из п чисел A { а),'B \ а), C \ а), ... ..., (п \ а), которые как раз и являются, в обычном смысле слова, координатами вектора в данной системе координат. Понятие представителя кет-вектора является простым обоб- обобщением понятия координат обычного вектора и переходит
§ 14. БАЗИСНЫЕ ВЕКТОРЫ /V в это последнее, если число измерений в пространстве кет- векторов конечно. В общем случае необязательно, чтобы все базисные бра- векторы, определяющие данное представление, были неза- независимы. Однако для большинства представлений, которые практически используются, эти векторы независимы и удо- удовлетворяют даже еще более жесткому условию — любые два базисных вектора ортогональны. Такое представление мы будем называть ортогональным представлением. Рассмотрим ортогональное представление с базисными бра-векторами (Я^ ... Я„ |, нумерованными при помощи параметров Яь Яа, ..., Я„, область изменения которых вещественна. Рассмотрим кет-вектор \ а) и составим представитель (АД2 ...%и\а). Далее образуем числа \ (АД2 ... Я„ | а) и будем рассматривать их как предста- представитель некоторого нового кет-вектора | Ь). Это допустимо, так как числа, образующие представитель этого кет-вектора, независимы, поскольку независимы базисные бра-векторы. Кет | Ь) определяется уравнением Кет | Ь), очевидно, является линейной функцией кет-век- кет-вектора | а)-, так что | Ь) можно рассматривать как результат действия на \ а) некоторого линейного оператора. Обозна- Обозначая этот оператор через Llt имеем |ft>=L1|a>, или (Х^ ... Я„ | Li I a) = kt <A,1A,a ...К„\а). Это уравнение справедливо для произвольного кет-вектора \а), и, следовательно, (К^ъ ... %u\L1 — 'k1 (Я^а ...%а\. A) Уравнение A) можно рассматривать как определение ли- линейного оператора Lv Из этого уравнения следует, что каждый базисный бра-вектор является собственным бра- вектором оператора Lx с собственным значением, равным значению параметра Xt для этого вектора. Из условия ортогональности базисных бра-векторов сле- следует, как мы сейчас покажем, что оператор Lx веществен и является наблюдаемой. Пусть К\, Яг, ... Д» и Я", Яг, ... Д« — два набора значений параметров Яь Я2, ..., Яи. Подставляя V
80 ГЛ. III. ПРЕДСТАВЛЕНИЯ вместо А в уравнение A) и умножая обе части справа на вектор \К\к2...К), сопряженный базисному бра-вектору {%'{%?> ¦¦¦ К I. имеем (AjA.^ . . . Ац I Lx | A; A.j ... Ам) = Aj (Л[Л^ ... Ли | Л] Л-2 ... Аы/. Меняя местами л' и л", получаем (aJ'A.2 ... Ли ?-i | А[А.2 . . . Ац) = Aj (AjA^' . . . Аи ) АДз • • • "«)• Вследствие ортогональности базисных бра-векторов правые части этих формул обращаются в нуль, если только К не равны К для всех г от 1 до и; в этом последнем случае пра- правые части равны, а также вещественны, если только пара- параметр Х1 веществен. Отсюда, а также используя уравнение D) § 8, получаем . . А„ j Lj | Л] А2 .., Аи) —• (Ai л.г .. . Аи | Li AiA.a . . . Аи) = = (a{Aj ... 'k'u\L1\ Ai'Aj . . . k'u) независимо от того, равны ли параметры а' параметрам а" или нет. Так как бра-векторы (АДг ... К |, так же как и кет-векторы | aj'aI. ... Яц), образуют полные системы, то мы можем заключить, что Lx — Ъх. Другое условие; которое должно быть наложено на Lx для того, чтобы Lx было на- наблюдаемой, а именно условие полноты системы собствен- собственных состояний, очевидно, также выполняется, так как для оператора Lx собственными бра-векторами будут базисные бра-векторы, образующие полную систему. Точно так же мы можем ввести операторы L?, L3, ..., L,,, умножая (л^г ... а„ \ а) по очереди на множители Я2, А3, ..., ли и рассматривая полученные совокупности чисел как представители векторов состояния. Далее можно пока- показать, что эти операторы вещественны, являются наблюдае- наблюдаемыми и что их собственными бра-векторами являются ба- базисные бра-векторы. Таким образом, базисные бра-векторы являются общими собственными бра-векторами всех опе- операторов. Поскольку эти общие собственные бра-векторы образуют полную систему, из теоремы § 13 следует, что любые два из операторов L коммутируют. Покажем далее, что если ?ь ?2, ..., \и — любая совокуп- совокупность коммутирующих наблюдаемых, то мы можем постро- построить ортогональное представление, в котором базисными
§ 14. БАЗИСНЫЕ ВЕКТОРЫ 81 бра-векторами будут собственные бра-векторы операторов ?lt |2, ...Ли- Допустим сначала, что каждому набору собствен- собственных значений ||, %2, ¦¦¦, Vu соответствует только один общий собственный бра-вектор. Тогда мы можем рассматривать эти общие собственные бра-векторы с произвольными чис- численными коэффициентами как базисные бра-векторы. Все они ортогональны согласно теореме ортогональности (лю- (любая пара бра-векторов будет иметь неодинаковые собствен- собственные значения хотя бы для одной из наблюдаемых, откуда и следует ортогональность). Из результатов § 13 следует, что бра-векторы образуют полную систему. Естественно харак- характеризовать эти бра-векторы с помощью соответствующих собственных значений V\, ??, ¦•¦, Vu, так что они могут быть записаны в виде (liU ...Vu [• Переходя теперь к общему случаю, когда для некото- некоторых наборов собственных значений наблюдаемые |lt g2 ... ..., \и имеют несколько независимых общих собственных бра-векторов, мы должны из всех общих собственных бра- векторов с одними и теми же собственными значениями Ц, Vi, •••, Vu отобрать полную подсистему, члены которой орто- ортогональны между собой. Условие полноты означает в дан- данном случае, что любой собственный бра-вектор с собствен- собственными значениями Vi, Щ>, •••, Vu может быть линейно выра- выражен через члены этой подсистемы. Мы должны сделать это для каждого набора собственных значений V\> I2, •••, Vu, объединить затем все члены всех этих подсистем и взять их в качестве базисных бра-векторов представления. Все эти бра-векторы ортогональны между собой. Действительно, если два таких бра-вектора имеют неодинаковые наборы собственных значений, то они ортогональны согласно тео- теореме ортогональности, а если все собственные значения одинаковы, то они ортогональны по самому способу по- построения. Все вместе эти бра-векторы образуют полную систему бра-векторов, поскольку любой бра-вектор может быть линейно выражен через общие собственные бра-век- бра-векторы, а каждый общий собственный бра-вектор линейно выражается через бра-векторы построенных нами подси- подсистем. Имеется бесконечно много способов выбора этих под- подсистем, и каждый из способов приводит к своему ортого- ортогональному представлению. Для обозначения базисных бра-векторов в этом общем случае, мы можем использовать собственные значения |[,
82 гл. ш. представления ??• ••¦, Vu каждого вектора, а также некоторые дополни- дополнительные вещественные переменные къ кг, ..., кг„ которые необходимы для того, чтобы отличать один от другого век- векторы, имеющие одинаковые наборы собственных значе- значений. Базисные бра-векторы запишутся тогда в виде (?!Е2 ... ILKK ¦¦¦ ^v I- Каждой из переменных klt к2, .,., kv можно сопоставить соответственно линейные операторы Llt Ьг, ..., Lv с помощью уравнения, аналогичного A). Далее можно показать, что собственными бра-векторами этих ли- линейных операторов являются базисные бра-векторы, что операторы вещественны и являются наблюдаемыми и что они коммутируют между собой и с операторами ?. Тогда базисные бра-векторы будут общими собственными векто- векторами всех коммутирующих наблюдаемых ?1( |2> ••¦> 6«. L-lt ^2> •••> '-'ъ- Будем называть полным набором коммутирующих на- наблюдаемых такую совокупность наблюдаемых, в которой все они коммутируют друг с другом и для которой каждому набору собственных значений соответствует только одно общее собственное состояние. Согласно этому определению наблюдаемые |ъ ?2> ••¦. 1». Lu L2, ... Lv образуют полный набор коммутирующих наблюдаемых, так как собственные значения ?!, la, ..., Ь,'и, klt k2, ..., kv имеются только у одного собственного бра-вектора — у соответствующего базисного бра-вектора. Точно так же наблюдаемые Llt L2, ..., Lu, которые определены в уравнении A) и далее, образуют полный набор коммутирующих наблюдаемых. С помощью данного определения основные результаты этого параграфа могут быть кратко сформулированы следующим образом. I. Базисные бра-векторы ортогонального представле- представления являются общими собственными бра-векторами полного набора коммутирующих наблюдаемых. II. Если задан полный набор коммутирующих наблю- наблюдаемых, то мы можем построить ортогональное представле- представление, базисными бра-векторами которого являются общие собственные бра-векторы этих наблюдаемых. III. Любая совокупность коммутирующих наблюдае- наблюдаемых может быть дополнена до полного набора путем добав- добавления к ней новых наблюдаемых. IV. Удобно нумеровать базисные бра-векторы ортого- ортогонального представления при помощи собственных значений полного набора коммутирующих наблюдаемых, для кото-
§ 14. БАЗИСНЫЕ ВЕКТОРЫ 83 рого каждый базисный бра-вектор является общим собст- собственным бра-вектором. Векторы, сопряженные базисным бра-векторам представ- представления, мы будем называть базисными кет-векторами пред- представления. Таким образом, если обозначать базисные бра- векторы <Я,1Л,2 ... Хи |, то обозначение для базисных кет- векторов будет | ЯХА,2 ... Ка). Представитель бра-вектора ф | определяется значениями скалярных произведений бра- вектора ф | на каждый из базисных кет-векторов, т. е. числами ф \XX%2 ... Хи). Этот представитель, так же как и представитель кет-вектора, можно рассматривать либо как последовательность чисел, либо как функцию перемен- переменных Xv Я2, ..., К- Далее имеем т. е. если кет-вектор и бра-вектор являются сопряженными, то их представители являются комплексно-сопряженными. В случае ортогонального представления, когда базисные бра-векторы являются общими собственными бра-векторами полного набора коммутирующих наблюдаемых g1( ?2, ..., |и, базисные кет-векторы будут общими собственными кет- векторами тех же наблюдаемых. До сих пор мы не рассматривали длин базисных векто- векторов. Для ортогональных представлений наиболее естест- естественно нормировать базисные векторы, а не считать их длину произвольной; таким образом, мы делаем еще один шаг, упрощающий представления. Однако это возможно сделать, если только все параметры, определяющие базис- базисные векторы, могут принимать лишь дискретные значения. Если хоть один из этих параметров меняется непрерывно и может принимать любые значения в некотором интервале, то базисные векторы являются собственными векторами такой наблюдаемой, которая имеет сплошной спектр соб- собственных значений. В таком случае, как это следует из рассуждений в § 10, базисные векторы имеют бесконечную длину. Тогда необходим какой-то иной метод, позволяю- позволяющий фиксировать те численные множители, на которые следует умножить базисные векторы. Для того чтобы прийти к удобному методу рассмотрения этого вопроса, требуются новые математические понятия и обозначения, которые будут введены в следующем параграфе.
84 ГЛ. III. ПРЕДСТАВЛЕНИЯ § 15. Дельта-функция Рассуждения в § 10 привели нас к рассмотрению вели- величин, содержащих различные типы бесконечностей. Для того чтобы иметь точные обозначения, позволяющие оперировать о этими бесконечностями, мы введем зависящую от пара- параметра х величину б (х), которая удовлетворяет условиям ) B) 6(je) = 0 при J Для того чтобы получить наглядное представление о б (х), рассмотрим функцию вещественной переменной х, которая обращается в нуль повсюду, за исключением малого проме- промежутка длины е, внутри которого находится точка х = 0, причем внутри этого промежутка функция настолько ве- велика, что интеграл от нее по промежутку равен единице. Точное поведение функции внутри этого промежутка несу- несущественно; предполагается только, что она не меняется там чересчур быстро (например, можно считать, что функция всегда имеет порядок е)- Тогда в пределе при е -> 0 эта функция перейдет в б (х). Дельта-функция б (х) не является функцией от х в соот- соответствии с обычным математическим определением функции, когда требуется чтобы функция имела определенное значение для любого значения аргумента. Чтобы отметить отличие от обычного определения функции, можно назвать такую ве- величину, как б (х) «несобственной функцией». Таким обра- образом, б (л;) не является такой величиной, которую можно было бы использовать повсюду в математическом анализе; ее применение должно быть ограничено некоторыми про- простыми типами математических выражений, для которых это применение наверняка не приводит к противоречиям. Наиболее важное свойство б (х) демонстрируется сле- следующим уравнением: $ f(xN(x)dx=f@), C) — со где / (ж) — произвольная непрерывная функция от х. Легко убедиться, что это свойство следует из рассмотренного выше
§ 15. ДЕЛЬТА-ФУНКЦИЯ 85 наглядного представления об (л:). Левая часть уравнения C) может зависеть только от тех значений / (х), для которых аргумент х близок к нулю, так что мы, без существенной погрешности, можем заменить / (х) на ее значение в нуле / @). Тогда уравнение C) является следствием первого из урав- уравнений B). Перенося в формуле C) начало координат, мы получаем формулу $ f(x)b(x-a)dx = f(a), D) — со где а — вещественное число. Таким образом, операция ум- умножения функции от х на б (х — а) и интегрирования по всем значениям х эквивалентна замене х на а. Этот общий результат справедлив также, если функция от х не есть просто численная функция, а является вектором или ли- линейным оператором, зависящим от х. Область интегрирования в формулах C), D) не обяза- обязательно должна быть от —оо до <х>, достаточно чтобы эта область включала в себя особую точку, в которой дельта- функция не обращается в нуль. В дальнейшем пределы ин- интегрирования будут в таких уравнениях обычно опускаться; при этом будет подразумеваться, что область интегрирова- интегрирования удовлетворяет нужным условиям. Из уравнений C), D) видно, что хотя несобственная функция и не имеет строго определенных значений, но если она содержится в качестве множителя в подынтегральном выражении, то сам интеграл имеет строго определенное зна- значение. Квантовая теория такова, что где бы ни появлялась несобственная функция, в конечном счете она всегда войдет в подынтегральное выражение. Можно было бы сформули- сформулировать всю теорию так, чтобы несобственные функции всегда стояли под интегралом. Тогда можно было бы вообще исклю- исключить несобственные функции. Таким образом, использова- использование несобственных функций вовсе не означает, что теория является недостаточно строгой; это есть просто удобный способ обозначений, позволяющий нам выразить в краткой форме такие соотношения, которые, если необходимо, можно было бы записать и без несобственных функций, но в более громоздком виде, который затемнял бы смысл наших рас- рассуждений. Можно предложить и другой способ определения дельта- функции, а именно, ее можно рассматривать как произвол-
86 ГЛ. Ш. ПРЕДСТАВЛЕНИЯ ную 6' (х) от функции 6 (х), определенной следующим обра- образом: Легко убедиться, что это определение эквивалентно преды- предыдущему, если подставить б' (х) вместо 8 (х) в левую часть формулы C) и произвести интегрирование по частям. Счи- Считая, что gx и g2 — положительные числа, получаем S / (х) 6' (х) dx = [/ (х) 6 (x)]g2g2 - I f (x) 9 (х) dx = г т. е. получаем согласие с формулой C). Дельта-функция появляется всегда, если дифференцировать разрывные функ- функции. Можно написать ряд элементарных уравнений, выражаю- выражающих свойства дельта-функции. Эти уравнения представляют собой правила обращения с математическими выражениями, содержащими дельта-функции. Смысл каждого из таких уравнений заключается в том, что если в подынтегральное выражение в качестве множителя входит одна из сторон уравнения, то ее можно заменить другой стороной, значение интеграла при этом не изменится. Приведем некоторые из таких уравнений: 8(—х) = 6(*), F) *6(*) = 0, G) 8(ах)=а^(х) (а>0), (8) )} (а>0), (9) b), A0) (x-a). A1) Уравнение F) означает только то, что б (х) — четная функция от х, что очевидно. Чтобы доказать справедливость уравнения G), рассмотрим произвольную непрерывную
§ 15. ДЕЛЬТА-ФУНКЦИЯ 87 функцию / (а) от а. Тогда, согласно формуле C), \f(x)xb{x) dx = 0. Таким образом, множитель хб (х) в подынтегральном выра- выражении эквивалентен нулю; а смысл уравнения C) как раз и эквивалентен этому утверждению. Справедливость урав- уравнений (8) и (9) может быть доказана с помощью аналогичных элементарных рассуждений. Чтобы доказать справедливость уравнения A0), рассмотрим непрерывную функцию f (а) от переменной а. Тогда \ f (a) da\ 8(a-x) dxb (x-b) = = \b{x-b)dx\f(a)dab{a-x) = = \8(x-b)dxf(x) = \f (a) da б (а - b). Таким образом, обе стороны уравнения A0), рассматривае- рассматриваемые как множители в подынтегральном выражении, экви- эквивалентны, если только считать, что а есть переменная инте- интегрирования. Тем же путем может быть доказана справедли- справедливость равенства A0) для случая, когда обе части его стоят под интегралом с переменной интегрирования Ь, так что уравнение A0) можно рассматривать с любой из этих точек зрения. Справедливость уравнения (И), рассматриваемого с этих двух точек зрения, также легко доказать с помощью формулы D). Уравнение A0) можно рассматривать как частный случай формулы D), когда / (х) = б (х — Ь). Здесь мы имеем при- пример того, что часто оказывается возможным рассматривать несобственную функцию так, как если бы она была обычной непрерывной функцией, не приходя при этом к противоре- противоречиям и ошибкам. Из уравнения G) следует, что если обе части уравнения разделить на переменную х, которая может принимать зна- значение нуль, то следует прибавить к одной из частей дельта- функцию б (х), умноженную на произвольную величину; т. е. из уравнения Л=б A2) не следует, что А В
88 ГЛ. III. ПРЕДСТАВЛЕНИЯ а только то, что A3) где о — неизвестная величина. В качестве примера применения дельта-функции рас- рассмотрим дифференцирование log x. Обычная формула ж log*«4 <14) требует дополнительного рассмотрения в окрестности точки х = 0. Для того чтобы определить более точно функцию 1/х в окрестности точки х = 0 (в смысле несобственных функ- функций), следует ввести дополнительное условие, например, что интеграл этой функции от —е до е равен нулю. Если учесть это дополнительное условие, то интеграл правой части уравнения A4) от —е до е равен нулю, тогда как тот же интеграл от левой части равен log (—1), и, таким образом, уравнение A4) не является правильным. Для того чтобы его исправить, заметим, что если брать основное зна- значение log х, то он имеет для отрицательных значений х чисто-мнимую добавку in. При переходе переменной х через нуль этот член исчезает разрывным образом. Дифференциро- Дифференцирование этого чисто-мнимого члена даст нам результат —т8 (х), так что формулу A4) следует записать в виде — Iog* = --wi8(;c). A5) Такая комбинация функции ~ и дельта-функции, которая получилась в правой части формулы A5), играет важную роль в квантовой теории столкновений (см. § 50). § 16. Свойства базисных векторов Используя введенную нами дельта-функцию, мы можем продолжить построение теории представлений. Предполо- Предположим сначала, что имеется одна наблюдаемая ?, которая сама по себе образует полный коммутирующий «набор», условием чего является то, что каждому собственному зна- значению %' соответствует только одно собственное состояние наблюдаемой |. Построим ортогональное представление, базисными векторами которого будут собственные векторы наблюдаемой ?, т. е. <g' [ и 11').
§ 16. СВОЙСТВА БАЗИСНЫХ ВЕКТОРОВ 89 В случае, когда собственные значения ? дискретны, мы можем нормировать базисные векторы. Тогда Эти уравнения можно объединить в одно <Г1Г> = %- A6) где символ б о двумя значками, который мы будем в даль- дальнейшем часто использовать, имеет смысл 6„ = 0, если r=?s, \ б„ = 1, если г = s. ) В случае, когда собственные значения \ непрерывны, мы не можем нормировать базисные векторы. Если теперь рассмотреть величину <?' 1?"), где параметр ?' фиксирован, а параметр ?" считается переменным, то из рассуждений, связанных g выражением B9) § 10, следует, что эта вели- величина исчезает для ?" =? ?' и что интеграл от нее по |" по области, включающей в себя |', конечен. Пусть этот инте- интеграл равен с; тогда Согласно формуле C0) § 10, с — положительное число. Оно может зависеть от ?', так что мы будем писать с (?') или, для краткости, с'. Таким образом, <Г!Г>=С6(|'-Г)- A8) Вместо этого можно написать где с" — краткое обозначение для с (I"), а правые части формул A8) и A9) равны согласно уравнению A1). Перейдем к другому представлению, базисными векто- векторами которого будут собственные векторы наблюдаемой ?; новые базисные векторы будут отличаться от старых лишь численным множителем. Обозначим новые базисные векторы (!'* I, II'*) дополнительным значком *, который введем для того, чтобы отличать их от старых базисных векторов. Тогда <Е'-! = *'<6'1, №*)=*# \V),
90 ГЛ. III. ПРЕДСТАВЛЕНИЯ где К — краткое обозначение для k (?'), величина, завися- зависящая от ?'. Получаем, используя формулу A8), <?'* I ?"*> = k'F (Г | ?"> = k'Fc' б (Г -§")• Это же равенство, согласно уравнению A1), можно записать в виде Выбирая к' так, чтобы его модуль был равен с'/г (что воз- возможно, так как с' положительно), мы можем получить <?'* )?"•> = 6 G'-g"). B0) Длины новых базисных векторов теперь фиксированы так, чтобы сделать представление возможно более простым. Тот метод, с помощью которого эти длины были фиксированы, в известном смысле аналогичен методу нормировки базисных векторов в случае дискретных значений |'; в самом деле, уравнение B0) и уравнение A6) аналогичны, в одном в правой части стоит функция б (?' — ?"), а в другом анало- аналогичный символ б|'|-/. Мы будем применять в дальнейшем новое представление, опуская для краткости значок *. Тогда уравнение B0) примет вид <Г[Г> = б(Г-Г). B1) Далее развитие теории для дискретного и для сплошного спектров собственных значений ? можно вести параллельно. Так, для дискретного спектра, используя уравнение A6), имеем 2i] 1' V где суммирование производится по всем собственным зна- значениям. Это уравнение справедливо для любого базисного кет-вектора | ?"); отсюда, учитывая, что базисные кет- векторы образуют полную систему, получаем El?'><S'l=l- B2) V Это — полезное уравнение, выражающее важное свойство базисных векторов, а именно, если | ?') умножить справа на (|' | и просуммировать по всем ?', то мы получаем еди- единичный оператор. Уравнения A6) и B2) выражают основ-
§ 16. СВОЙСТВА БАЗИСНЫХ ВЕКТОРОВ 91 ные свойства базисных векторов для случая, когда спектр собственных значений | дискретен. Аналогично для случая сплошного спектра |, используя уравнение B1), получаем SIГ> С <?' | Г> = $ I Г> 4' б (Г - П = I Г). B3) Здесь использована формула D), где вместо функции / (х) подставлен кет-вектор состояния, а интегрирование произ- производится по всей области изменения собственных значений. Уравнение B3) справедливо для любого базисного кет- вектора | ?"> и, следовательно, Sl6'>dr<|'| = l. B4) Отличие этой формулы от формулы B2) состоит лишь в том, что здесь сумма заменена интегралом. Уравнения B1) и B4) выражают основные свойства базисных векторов для случая сплошного спектра собственных значений. Уравнения B2) и B4) позволяют произвести разложение любого бра-вектора или кет-вектора по базисным векто- векторам. Например, для кет-вектора | Р) в случае дискретного спектра путем умножения формулы B2) справа на \ Р) получаем уравнение \р)=2,ю<1'\р), B5) V т.е. разложение вектора | Р) по векторам |?'), причем коэффициентами разложения являются числа <?' | Р), сово- совокупность которых и является представителем вектора | Р). Аналогично в случае сплошного спектра получаем \Р) = [\1')<%&'\Р), B6) т. е. разложение вектора | Р) в интеграл по векторам | ?'), причем коэффициентом в подынтегральном выражении раз- разложения будет опять-таки представитель (?' \ Р) векто- вектора \ Р). Уравнения, сопряженные уравнениям B5) и B6), дадут разложение бра-вектора (Р | по базисным бра-век- бра-векторам. Математический метод, которым мы сейчас пользуемся, позволяет нам в случае сплошного спектра разложить про- произвольный кет в интеграл по собственным кет-векторам наблюдаемой |. Если же не использовать понятие дельта-
92 ГЛ. III. ПРЕДСТАВЛЕНИЯ функции, то разложение произвольного кет-вектора со- состояло бы, вообще говоря, из интеграла и суммы, как, например, в уравнении B5) § 10. Дельта-функция позволяет нам заменить эту сумму интегралом, подынтегральное вы- выражение будет состоять тогда из членов, каждый из которых содержит в качестве множителя дельта-функцию. Напри- Например, собственный кет-вектор | |") можно представить в виде интеграла по всем собственным кет-векторам, как это видно из второго равенства в формуле B3). Если (Q | и | Я) — произвольные бра и кет, то, исполь- используя снова формулы B2) и B4), получаем (Q,P) = Z(Q\Z')(Zip) B7) с' для случая дискретного спектра и (Q[P) = \(Q\1-r)dl-'G'\P) B8) для сплошного спектра ?. Эти уравнения выражают скаляр- скалярное произведение (Q \ и \ Р) через их представителей (Q I I') и (I' | Р). Уравнение B7) совпадает с обычной формулой для скалярного произведения двух векторов, выраженного через их координаты, а уравнение B8) явля- является естественным обобщением этой формулы на случай сплошного спектра I — сумма заменена в этом случае ин- интегралом. Обобщение предыдущих рассуждений на случай, когда 1 имеет как дискретный, так и сплошной спектры собствен- собственных значений, не представляет затруднений. Если ввести обозначения \г, Is для дискретных и \', |" для сплошных собственных значений, то мы получим уравнения №> = Vi*- <?'li'>=o, <rir> = 6(i'~l"), B9) являющиеся обобщением уравнений A6) и B1). Эти уравне- уравнения выражают тот факт, что все базисные векторы ортого- ортогональны, что принадлежащие к дискретному спектру векторы нормированы, а длина векторов, принадлежащих к сплош- сплошному спектру, определяется теми же правилами, которые привели нас к формуле B0). Из формул B9) можно получить обобщение формул B2) и B4) + $|В'><*5'<&'1«1, C0)
§ 16. СВОЙСТВА БАЗИСНЫХ ВЕКТОРОВ 93 причем интегрирование производится по всему сплошному спектру собственных значений. Используя формулу C0), получаем немедленно ), C1) т. е. обобщение формул B5) и B6), а также <Q\P) = Tl(Q\ lr) <?' \Р) + \Ш') <% <!' j P) C2) — обобщение формул B7) и B8). Перейдем теперь к общему случаю, когда имеется не- несколько коммутирующих наблюдаемых ^, ?2> •••> 1и> обра- образующих полный набор, и построим ортогональное представ- представление, базисными векторами которого будут общие собственные векторы всех этих наблюдаемых. Будем обоз- обозначать базисные векторы <|J... ?„ | и | Ц... ?„>. Предположим, что наблюдаемые %и \2, ..., \v (v < и) имеют дискретный спектр собственных значений, а |в+1, ..., |„— сплошной. Рассмотрим величину A[... ^;+1... \'и \Ъ\... l'vll+1.. &). Из теоремы ортогональности следует, что эта величина равна нулю, если не выполняется хотя бы одно из условий Is = t's для s = v + 1» •••, и. Обобщая рассуждения, свя- связанные с выражением B9) § 10, на случай общих собствен- собственных векторов нескольких наблюдаемых, и обобщая также аксиому C0) § 10, находим, что (и — и)-кратный интеграл от этой величины по каждому из собственных значений |" является положительным числом, если областью инте- интегрирования является весь сплошной спектр каждого из собственных значений, так что все ^ лежат внутри области. Обозначая это число через с', где' означает, что оно является функцией от \\, ... ,\v, \'v+i, ¦..,, ?«, мы можем сформулиро- сформулировать наш результат в виде уравнения \S1 • • • ён?»+1 • ¦ • ёи | Si • ¦ ¦ S»Sa+i . • . ёи/ =" = сб(^1-|;+1)...в(К-К), C3) где в правой части имеется по одному множителю с дельта- функцией для каждого значения s от v -\- 1 до и. Далее, мы изменим длины наших базисных векторов так, чтобы сделать множитель с' равным единице, подобно тому, как это было сделано в формуле B0). Используя снова теорему
94 ГЛ. III. ПРЕДСТАВЛЕНИЯ ортогональности, получаем окончательно \6l • • • Ъи Si • • • S«/ = = 8^y • • ¦ \'vi"& (?0+1 ~ ?»+i) • • • ^ (S« — lu), C4) причем в правой части стоит по двухзначковому символу б для каждой из наблюдаемых | с дискретным спектром собственных значений и по дельта-функции для каждой из наблюдаемых 1 со сплошным спектром. Это уравнение является обобщением уравнений A6) и B1) на случай, когда полная совокупность состоит из нескольких наблю- наблюдаемых. Из формулы C4) получается обобщение формул B2) и B4) где интегрирование производится по всем переменным собственным значениям ?' сплошного спектра, а сумми- суммирование — по всем собственным значениям %' дискретного спектра. Уравнения C4) и C5) выражают основные свойства базисных векторов для данного случая. Используя формулу C5), мы можем немедленно написать обобщения формул B5) или B6) и B7) или B8). Случай, который мы только что рассмотрели, можно обобщить, считая, что некоторые из наблюдаемых имеют как дискретный, так и сплошной спектры собственных зна- значений. Соответствующие изменения в уравнениях вполне очевидны, однако мы не будем их здесь приводить, так как довольно затруднительно записать их в общем виде. Существуют некоторые задачи, для которых оказывается более удобным не полагать число с' в уравнении C4) равным единице, а считать его некоторой заданной функцией от переменных ?'. Обозначая эту функцию через р' \ получаем вместо формулы C4) = p'-\w,... 66U;6 (|'0+1 - &;+1)... б ii'u - xi), C6) а вместо формулы C5) имеем 2] \...\\^...lu)9'dlvH-.-dlu{l[...lv\^l. C7)
§ 17. ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ »5 Функция р' называется весовой функцией представления, величина p'dl'v+.1...dlu является «весом», который припи- приписывается малому элементу объема в пространстве перемен- НЫХ gafi,..., gu. Все представления, которые мы рассматривали ранее, имели весовую функцию, равную единице. Введение отлич- отличной от единицы весовой функции является исключительно вопросом удобства и ничего не прибавляет к математическим возможностям аппарата представлений. Легко убедиться, что базисные бра-векторы (%[...?,'и* | представления с ве- весовой функцией р' связаны простым соотношением с ба- базисными бра-векторами (?f...?u I соответствующего пред- представления с единичной весовой функцией <|;..д«*|=р'~1/2<15 ¦¦¦i'u\. C8) Примером такого удобного представления с неединичной весовой функцией является случай, когда двумя наблюдае- наблюдаемыми являются полярный и азимутальный углы б и ср, определяющие направление в трехмерном пространстве. Тогда удобно положить р' —- sin 6' так, чтобы в формулу C7) под интеграл вошел множитель sin e'de'dcp', т. е. элемент телесного угла. § 17. Представление линейных операторов В § 14 мы определили, каким образом можно представить кет-векторы и бра-векторы с помощью совокупностей чисел. Теперь нам следует сделать то же для линейных операторов, для того чтобы иметь законченную схему для представления всех наших абстрактных величин совокупностями чисел. Те же самые базисные векторы, которые мы рассматривали в § 14, могут быть снова использованы для этой цели. Допустим, что базисные векторы являются общими собственными векторами полного набора коммутирующих наблюдаемых g^, ?2, ..., ?и. Если а ¦— некоторый линейный оператор, то мы можем взять любой из базисных бра-век- бра-векторов A1...1', I и любой из базисных кет-векторов | !"...?„) и составить из них числа <?J --- 6i|o6|g;... Б*>. C9) Этих чисел достаточно для полного определения оператора а, так как они прежде всего определяют кет а | ?'...?«) (по-
96 гл. ш. Представления скольку они образуют представитель этого кет-вектора), а значение этого вектора для всех базисных кет-векторов | ?|'...1и> определяет а. Совокупность чисел C9) мы будем называть представителем линейного оператора а или дина- динамической переменной а. Эта совокупность более сложна, чем представители кет-векторов или бра-векторов, так как она зависит от параметров, характеризующих два базисных вектора, а не один. Рассмотрим совокупность этих чисел в простейших случаях. Предположим сначала, что наблюдаемая 1 сама образует полный коммутирующий набор, и что эта наблю- наблюдаемая имеет дискретный спектр собственных значений ?'. Представителем оператора а будет тогда дискретная сово- совокупность чисел (|'| а | ?"). Если бы потребовалось выписать эти числа в явном виде, то было бы естественно расположить их в виде двумерной таблицы, т. е. в виде D0) где I1, ?2, |3, ... — все собственные значения наблюдаемой |. Такая таблица называется матрицей, а числа — матрич- матричными элементами. Мы условимся, что элементы будут всегда расположены так, чтобы определенному номеру строки соответствовал определенный базисный бра-вектор; а столбцу с тем же номером — соответствующий сопряжен- сопряженный базисный кет-вектор. Элемент <|' | a | ?' >, соответствующий двум базисным векторам с одинаковыми индексами, называется диаго- диагональным матричным элементом, поскольку все такие эле- элементы расположены по диагонали матрицы. Если положить а равным единице, то из уравнения A6) следует, что все диагональные матричные элементы равны единице, а все остальные — нулю. Такая матрица называется единичной матрицей. Если оператор а веществен, то мы имеем <6'1«|Г> =¦<?»?'>• D1) Из этого условия следует, что в матрице D0) диагональные матричные элементы должны быть вещественны, а пары
§ 17. ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ 97 недиагональных элементов, симметричных относительно диагонали, являются комплексно-сопряженными друг другу. Матрица, удовлетворяющая такому условию, называется эрмитовой матрицей. Если положить а равным ?, то произвольный элемент матрицы будет иметь вид A'\1Ю=1' {\'\\') = l'h'V- D2) Таким образом, все недиагональные матричные элементы равны нулю. Такая матрица называется диагональной матрицей. Ее диагональными элементами являются как раз собственные значения наблюдаемой ?. В более общем случае, если полагать ее равным функции / (?) от ?, получаем <П/(ШГ>=/(Г)б|г D3) и матрица опять-таки будет диагональной. Определим, какой вид будет иметь представитель про- произведения ар двух линейных операторов а и р.если известны представители каждого из сомножителей. Используя урав- уравнение B2), в котором |' заменено на ?"', получаем D4) т. е. требуемый результат. Из уравнения D4) видно, что матрица, построенная из элементов (?' | ар |\"), равна произведению матриц, построенных соответственно из эле- элементов <|' | ос | |") и (I' | р1 | I") согласно обычному мате- математическому правилу перемножения матриц. По этому правилу элемент матрицы — произведения, расположен- расположенный в r-й строке и s-м столбце, равен сумме произведений каждого из элементов л-й строки первой матрицы на соответ- соответственный элемент s-ro столбца второй матрицы. Умножение матриц некоммутативно, так же как и умножение линейных операторов. Мы можем следующим образом подытожить наши ре- результаты для случая, когда имеется только одна наблюдае- наблюдаемая ? , и она имеет дискретный спектр собственных значений. I. Представителем любого линейного оператора является матрица
98 ГЛ III. ПРЕДСТАВЛЕНИЯ II. Представителем единичного оператора является еди- единичная матрица. III. Представителем вещественного оператора является эрмитова матрица. IV. Представителями базисной наблюдаемой ? или любой функции от I являются диагональные матрицы. V. Матрица, являющаяся представителем произведения двух линейных операторов, равна произведению матриц, являющихся представителями обоих операторов-сомножи- операторов-сомножителей. Рассмотрим теперь случай, когда имеется только одна наблюдаемая |, но она имеет сплошной спектр собствен- собственных значений. Представителем оператора а будет тогда <?' , а | I") — функция двух переменных |' и ?", каждая из которых может принимать непрерывный ряд значений. Удобно назвать такую функцию «матрицей», используя это слово в обобщенном смысле, для того чтобы иметь возмож- возможность использовать одну и ту же терминологию для случая дискретного и сплошного спектров *). Такая обобщенная матрица, конечно, не может быть записана, подобно обыч- обычной матрице, в виде таблицы, так как число ее строк и столб- столбцов бесконечно и равно числу точек, составляющих ли- линию, а число элементов также бесконечно и равно числу точек на плоскости. Расположим наши определения, относящиеся к этим матрицам, таким образом, чтобы правила (I)—(V), которые мы имели выше для случая дискретного спектра, годились также и в случае сплошного спектра собственных значений. Представителем единичного оператора является дельта- функция 8 (?' — ?"); соответствующую обобщенную матрицу мы назовем единичной матрицей. Условием вещественности оператора а будет по-прежнему уравнение D1), и мы будем называть обобщенную матрицу эрмитовой, если ее эле- элементы (?' | а ] \") удовлетворяют этому условию. Предста- Представители наблюдаемой \ и функции / (|) имеют вид G'|gir> = r8(&'-r). D5) <п mm=/(n в (г-п.- D6) *) В случае сплошного спектра более употребительно название «ядро оператора». (Прим. В. А. Фока.)
§ 17. ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ 99 обобщенные матрицы с такими элементами мы будем назы- называть диагональными матрицами. Согласно уравнению A1) в правых частях формул D5) и D6) можно с таким же правом написать соответственно |" и / (?"). Используя фор- формулу B4), получаем уравнение, аналогичное уравнению D4), <Г ! «Р I Г) = 1A' I«11'") <Щ" <Г I P | Г>, D7) в котором сумма заменена интегралом. Обобщенную мат- матрицу, образованную по этой формуле, мы будем называть произведением матриц (?' | а | ?"} и (?' | Р I |">. Благода- Благодаря этим определениям мы достигаем полного параллелизма между дискретным и сплошным спектром и правила (I)—(V) годятся в обоих случаях. Возникает вопрос, какое определение следует дать диа- диагональной матрице в случае сплошного спектра, поскольку до сих пор мы получали в формулах D5) и D6) лишь частные примеры диагональных матриц. Казалось бы, что диаго- диагональной матрицей следует считать такую, все элементы которой (?', |") равны нулю, если только ?' не отличается бесконечно мало от ?". Однако такое определение неудовлет- неудовлетворительно, так как важным свойством диагональных мат- матриц в случае дискретного спектра является то, что все они коммутируют между собой, и это свойство должно выпол- выполняться также в случае сплошного спектра. Для того чтобы обобщенная матрица с элементами (?' | со | |") коммути- коммутировала с матрицей, определенной уравнением D5), должно выполняться равенство \ <|', со | г> 4Т6(Г - Г) = \ Е'б ft' - Г") <%* <Г I ©! Г>, которое следует из правила умножения D7). Если исполь- использовать формулу D), то это условие запишется в виде <Г ! со , Г')Г = Г <П со |Г> D8) или (Г-ГКГ; Отсюда получаем <Г1сй!Г>=с'6(Г-Г) согласно правилу, по которому уравнение A3) следует из уравнения A2), причем с есть число, которое может за- зависеть от|'. Таким образом, матричный элемент (?' | со | I") имеет тот же вид, что и правая часть формулы D6). Поэтому мы будем называть диагональными только такие матрицы,
'00 ГЛ. III. ПРЕДСТАВЛЕНИЯ элементы которых имеют вид D6). Легко проверить, что все такие матрицы коммутируют друг с другом. Можно построить такие матрицы, у которых также обращаются в нуль все элементы (?', ?"), если | Ф |", но которые имеют другой вид особенности при |' = |". (В дальнейшем мы введем производную б' (х) от дельта-функции, тогда мат- матрица с элементами б' (%' — !•") будет примером подобного рода — см. § 22, уравнение A9).) Такие матрицы не являют- являются диагональными согласно нашему определению. Перейдем теперь к случаю, когда по-прежнему имеется только одна наблюдаемая |, но она имеет смешанный спектр собственных значений — как дискретный, так и сплошной. Обозначая через |г, ?¦' дискретные, а через ?', |" сплошные собственные значения, мы получаем, что представитель оператора а состоит из величин четырех типов Все эти величины можно объединить и считать, что они образуют матрицу более общего вида, имеющую как ди- дискретные строки и столбцы, так и непрерывные последова- последовательности строк и столбцов. Понятия: единичная матрица, эрмитова матрица, диагональная матрица, а также произве- произведение двух матриц определяются для этого более общего случая так, чтобы правила (I)—(V) по-прежнему выпол- выполнялись. Более подробно эти определения не стоит рассмат- рассматривать, так как они являются непосредственным обобще- обобщением того, что было сделано ранее. Вернемся теперь к общему случаю нескольких коммути- коммутирующих наблюдаемых ?ь ?2> •••> \п- В этом случае можно также считать, что представитель оператора а, т. е. сово- совокупность чисел, выражаемых формулой C9), образует матрицу, в которой каждому набору значений |{, ...,\'и соот- соответствует строка, а каждому набору ?[', ..., \"и — столбец. Если не все | имеют дискретный спектр собственных значе- значений, то эта матрица будет обобщенной и будет иметь участки с непрерывными последовательностями строк и столбцов. Далее мы снова формулируем все определения так, чтобы правила (I)—(V) выполнялись, причем правило (IV) в этом случае обобщается и приобретает следующий вид. IV. Представителями каждой из наблюдаемых \т (т = 1, 2, ..., и) и любой функции от них являются диаго- диагональные матрицы.
§ 17. ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫХ ОПЕРАТОРОВ 101 При этом по определению диагональной будет такая матрица, произвольный элемент которой (?|... fi | со \\[.. .?„) имеет вид <& ¦ • • U I <•> | II ...?«> = = с'6|;еГ ... 6^6 &+1 - йч)... 6 (& - Q, D9) если предполагать, что наблюдаемые |ь .... ?„ имеют ди- дискретный, а ?г+1, ..., |„ — сплошной спектр собственных значений. Здесь с' есть некоторая функция от всех ?'. Это определение является обобщением того, которое мы имели для случая одной наблюдаемой ?; из него следует, что все диагональные матрицы коммутируют между собой. Таким образом, представителями линейных операторов всегда являются матрицы. Представителем суммы двух ли- линейных операторов будет сумма матриц, являющихся пред- представителями слагаемых, а это, совместно с правилом (V), означает, что матрицы подчиняются тем же самым алгеб- алгебраическим соотношениям, что и линейные операторы. Если выполняется какое-либо алгебраическое уравнение для ли- линейных операторов, то это же уравнение должно выполнять- выполняться и для матриц, являющихся представителями этих опера- операторов. Матричную схему можно расширить так, чтобы вклю- включить в нее представителей кет-векторов и бра-векторов. Представителями линейных операторов являются всегда квадратные матрицы — с одинаковым числом строк и столб- столбцов и фактически с взаимно однозначным соответствием ме- между строками и столбцами. Мы можем рассматривать пред- представитель кет-вектора | Р) как матрицу с одним столбцом, расположив образующие представитель числа (?¦[ ... %'и\ Р) одно под другим. Номера строк в этой матрице долж- должны быть те же, что и номера строк или столбцов в матрице — представителе линейного оператора. Такая одностолбцовая матрица может быть умножена слева на квадратную мат- матрицу по правилу, аналогичному правилу умножения квад- квадратных матриц. В результате мы получим другую одностолб- одностолбцовую матрицу, элементы которой определяются формулой si
102 ГЛ. III. ПРЕДСТАВЛЕНИЯ Согласно формуле C5) эти числа как раз равны числам (?[...?« I ос I P), т.е. совокупность их является предста- представителем кет-вектора а \ Р). Аналогично представитель бра-вектора (Q | можно рассматривать как матрицу с одной строкой, расположив все числа < Q\ if..-!«> одно за другим. Такую однострочную матрицу можно умножить справа на квадратную матрицу (?i...|« \a I 5f-.-?u). произведение бу- будет снова однострочной матрицей, которая и является как раз представителем бра-вектора (Q | а. Однострочную мат- матрицу, являющуюся представителем бра-вектора, можно умножить справа на одностолбцовую матрицу — предста- представитель кет-вектора | Р); произведение будет матрицей, содержащей только один элемент, который равен (Q \ Р). Наконец, однострочную матрицу — представитель бра-век- бра-вектора (Q | можно умножить слева на одностолбцовую мат- матрицу — представитель кет-вектора |Р)\ произведение бу- будет квадратной матрицей, которая является как раз пред- представителем оператора | P)(Q |. Таким образом, все наши абстрактные символы — линейные операторы, бра-векторы и кет-векторы — могут быть представлены матрицами, причем эти матрицы будут удовлетворять тем же алгебраи- алгебраическим соотношениям, что и сами абстрактные символы. § 18. Амплитуды вероятности Представления имеют большое значение для физического толкования квантовой механики, так как они дают удобный метод для получения вероятностей того, что наблюдаемые имеют заданные значения. В § 12 мы получили вероятность того, что для заданного состояния наблюдаемая имеет опре- определенное значение, а в § 13 мы обобщили этот результат на случай, когда одновременно несколько наблюдаемых имеют определенные значения. Применим теперь этот ре- результат к случаю, когда имеется полный набор коммути- коммутирующих наблюдаемых, пусть это будет набор наблюдаемых ?, с которым мы уже имели дело. Согласно формуле E1) § 13 для состояния, которое характеризуется нормирован- нормированным кет-вектором | х), вероятность того, что каждая не- ненаблюдаемых ir имеет значение \'г, равна /Ъ S' = <x|6ft.6. ъ> ... 6, %, \х). E0,
§ 18. АМПЛИТУДЫ ВЕРОЯТНОСТИ 103 Если все наблюдаемые ? имеют дискретные собственные значения, то мы можем использовать формулу C5), отбросив в ней интеграл и положив v = и. Тогда получаем si' - С = (х | \[ ... la) <g| .. • lu I x) = | <|; ... U I X) |2 *). E1) Мы получили, таким образом, простой результат: вероят- вероятность того, что все наблюдаемые I имеют значения ?', в точности равна квадрату модуля соответствующей коор- координаты нормированного кет-вектора, характеризующего рассматриваемое состояние. Если не все наблюдаемые имеют дискретный спектр соб- собственных значений — скажем, ?lt ..., |„ имеют дискретный, а ?вШ ..., |а — непрерывный спектр, то физический смысл будет иметь лишь вероятность того, что каждая из наблю- наблюдаемых %г (г = 1, ..., и) имеет определенное значение \'г, а каждая из ?s (s = v + 1, ..., и) имеет значение, лежащее в малом промежутке от \'s ao\'s + d\'s. Для того чтобы полу- получить эту вероятность, мы должны заменить каждый из множителей 8Г > в формуле E0) на множитель %s, т. е. на такую функцию наблюдаемой %s, которая равна единице, если ?з лежит в промежутке от ^ ДО I's + dt,'s и равна нулю вне этого промежутка. Используя снова формулу C5), полу- получаем для этой вероятности выражение /V 8' d&n ...dt'u = \(& ... 1'и | x) [2 dl'vn ... d\'u. E2) Таким образом, в любом случае распределение вероятностей различных значений наблюдаемых % определяется квадратом модуля представителя нормированного кет-вектора, харак- характеризующего данное состояние. Числа, совокупность которых образует представитель нормированного кет-вектора (или бра-вектора), можно поэтому назвать амплитудами вероятности. Квадрат мо- *) См. примечание на стр, 28. {Прим, перев.)
104 ГЛ. III. ПРЕДСТАВЛЕНИЯ дуля амплитуды вероятности есть обычная вероятность или плотность вероятности на единицу интервала для тех переменных, которые имеют непрерывную область изме- изменения. Обратимся к случаю, когда состояние характеризуется ненормируемым кет-вектором | х). Это имеет место, напри- например, если состояние является собственным состоянием некоторой наблюдаемой с собственным значением, лежащим в сплошном спектре. При этом можно по-прежнему исполь- использовать формулы E1) и E2), но они дают в этом случае отно- относительную вероятность того, что наблюдаемые | имеют определенные значения, или что значения их лежат в неко- некотором малом интервале. Таким образом, эти формулы дают тогда правильные величины для отношений вероятностей при различных ?'. Числа (|j... \'u\ х) можно поэтому назвать относительными амплитудами вероятности. Представление, для которого справедливы полученные выше результаты, характеризуется тем, что его базисные векторы являются общими собственными векторами всех наблюдаемых ?. Это представление можно характеризовать также требованием, чтобы каждая из наблюдаемых | имела своим представителем диагональную матрицу. Легко убе- убедиться, что оба условия эквивалентны, однако второе из них является обычно более удобным. В дальнейшем мы бу- будем формулировать его кратко, говоря, что все наблюдаемые | «диагональны в данном представлении». Если предположить, что наблюдаемые | образуют полный набор коммутирующих наблюдаемых, то представление определяется каждым из этих условий полностью, с точ- точностью до произвольного фазового множителя при каждом базисном векторе. Каждый базисный бра-вектор (Ц... |„| можно умножить на е'7', где у' —любая вещественная функ- функция переменных ?{, ..., \'и; при этом не нарушится ни одно из условий, которым должно удовлетворять данное представле- представление, т. е. условие, что все \ диагональны или что все базисные векторы являются общими собственными векторами всех |. Не нарушатся также основные свойства базисных векторов C4) и C5). Если изменить базисные бра-векторы подобным образом, то представитель (?f... \'и \ Р) кет-вектора | Р) умножается при этом на е'?', представитель (Q ] \\...\'и) бра-вектора (Q \— на e~iy', а представитель (?f...|i | a | ?!...!«) линейного оператора умножается на e'(v'-v">. Be-
§ 18. АМПЛИТУДЫ ВЕРОЯТНОСТИ 105 роятности или относительные вероятности в формулах E1), E2), очевидно, при этом не изменятся. Вероятности, которые вычисляются в конкретных зада- задачах квантовой механики, почти всегда получаются как квадраты модулей амплитуд вероятности или относительных амплитуд вероятности. Даже если нас интересует вероят- вероятность тех или иных значений неполного набора коммутирую- коммутирующих наблюдаемых, то обычно оказывается необходимым сначала сделать этот набор полным путем добавления неко- некоторого числа дополнительных коммутирующих наблюдае- наблюдаемых; затем получить вероятность определенных значений этого полного ряда наблюдаемых (в виде квадрата модуля соответствующей амплитуды вероятности) и, наконец, про- просуммировать или проинтегрировать по всем возможным значениям дополнительных наблюдаемых. Более прямой способ расчета вероятностей с помощью формулы E1) в большинстве случаев практически неудобен. Итак, для того чтобы построить представление, делаем следующее. I. Ищем те наблюдаемые, которые желательно сделать диагональными, либо потому что нас интересуют вероятнос- вероятности для этих наблюдаемых, либо в целях математической простоты. II. Мы должны проверить, что все они коммутируют — это является необходимым условием, так как диагональные матрицы коммутируют всегда. III. Затем мы проверяем, образуют ли они полный набор коммутирующих наблюдаемых, а если нет, то добавляем еще столько коммутирующих наблюдаемых, чтобы набор всех наблюдаемых стал полным. IV. Строим ортогональное представление, в котором все наблюдаемые из полного коммутирующего набора диаго- нальны. Таким путем представление определяется полностью с точностью до произвольных фазовых множителей. Для большинства задач эти фазовые множители несущественны и тривиальны, и мы можем считать, что представление пол- полностью определено, если заданы наблюдаемые, которые в этом представлении диагональны. Этот факт уже отражен в наших обозначениях, так как в выражении для представи- представителя само представление характеризуется только буквами, обозначающими те наблюдаемые, которые диагональны.
106 ГЛ. III. ПРЕДСТАВЛЕНИЯ Может случиться, что нас будут интересовать два пред- представления для одной и той же динамической системы. Пред- Предположим, что в одном из этих представлений диагональны коммутирующие наблюдаемые ?ь ..., |„, образующие полный набор, и базисные бра-векторы будут (?[ ... 1'и |; а в другом представлении диагональны наблюдаемые т^, ..., r\w и базис- базисные бра-векторы будут (г\\... цш |. Кет \Р) будет тогда иметь двух представителей (Ц ... \'и \ Р) и (п( ... т^ \ Р). Если наблюдаемые \х, ..., |„ и г\и ..., г\х имеют дискретный спектр собственных значений, a |„+1, ..., \и и г\х+1, ..., цт — непрерывный спектр, то из формулы C5) мы получаем xdl'v+1...dl'a(l'l...lu\P), E3) а также, меняя местами I и ц, 1 ... rf-Пш <л! ... Tb!/>>. E4) Эти уравнения преобразования выражают один представи- представитель кет-вектора \ Р) через другой. Из них следует, что любой из представителей может быть линейно выражен через другой, причем коэффициентами разложения будут величины <ni •¦• nilSJ •••&>, <II ••• Sal Л! ••• Чш). E5) Эти величины называются функциями преобразования. Такие же уравнения можно написать для того, чтобы связать два представителя бра-вектора или оператора. Функции пре- преобразования E5) являются средством, позволяющим в лю- любом случае переходить от одного представления к другому. Обе функции являются комплексно-сопряженными друг другу, и, кроме того, удовлетворяют условию X (l'i . . . I'u \ Til' ... 1\w) =
§ 19. ТЕОРЕМЫ О ФУНКЦИЯХ НАБЛЮДАЕМЫХ Ю7 и аналогичному условию, в котором ? и г\ следует поменять местами. Эти равенства можно доказать, используя уравне- уравнения C5) и C4) и соответствующие уравнения для tj. Функции преобразования являются примером амплитуд вероятности или же амплитуд относительной вероятности. Рассмотрим случай, когда все ? и все г\ имеют дискретный спектр собственных значений. Тогда базисные векторы | T)i ... г\'ш) нормированы, так что их представители в ^-пред- ^-представлении, т. е. (?[ ...\и ... | г)! ... x\w>, являются амплитудами вероятности того, что наблюдаемые ? имеют значения |'. Со- Состояние, к которому относятся эти вероятности, а именно состояние, которое характеризуется вектором \ г\\ ... ц'т), определяется тем условием, что одновременное измерение наблюдаемых тI( ..., цш наверняка приводит к результату т][, ..., г)ш. Таким образом, число |(?[ ... \'и \ х\\ ... x\w) \г есть вероятность того, что все наблюдаемые % имеют значе- значения ?( ... ?„ для состояния, в котором все ц наверняка имеют значения \\\ ... ц'ш. Из тождества следует теорема взаимности: вероятность того, что все ? имеют значения \' в состоянии, для которого все т) наверняка имеют значения х\', равна вероятности того, что все г\ имеют значения т)' в состоянии, для которого все | навер- наверняка имеют значения \'. Если все наблюдаемые г\ имеют дискретный спектр соб- собственных значений, а некоторые из | имеют сплошной спектр, то величина | (?[... \'и \ Ц\ ¦¦¦ ц'т) Р по-прежнему дает ве- вероятность или плотность вероятности различных значений ? для состояния, в котором все г\ имеют наверняка значения г\'. Если же и некоторые из ц имеют сплошной спектр собст- собственных значений, то векторы | г\\ ... r\'w) не нормированы и величина | (|{ ... \'и \ T)f ... ч\'ш) |2 дает только относитель- относительную вероятность или плотность вероятности значений ? для состояния, в котором все т) наверняка имеют значе- значения Г]'- § 19. Теоремы о функциях наблюдаемых Мы проиллюстрируем математическое значение предста- представлений, используя их для доказательства некоторых теорем.
108 ГЛ. III. ПРЕДСТАВЛЕНИЯ Теорема 1. Линейный оператор, который коммути- коммутирует с наблюдаемой I, коммутирует также с любой функ- функцией ?. Теорема очевидно, верна, если функция разложима в степенной ряд. Докажем ее в общем случае. Пусть со — линейный оператор, удовлетворяющий уравнению 1<о - &1 = 0. E7) Введем представление, в котором наблюдаемая \ диагональ- на. Если ? сама по себе не образует полной совокупности коммутирующих наблюдаемых, то мы должны сделать эту совокупность полной путем добавления некоторого числа наблюдаемых р, а затем построить представление, в котором диагональны как \, так и р. (Случай, когда наблюдаемая \ сама образует полную совокупность, можно рассматривать как частный случай, когда число наблюдаемых Р равно нулю.) В этом представлении уравнение E7) примет вид откуда получаем I' {I'р' >[|Т>-<!Т I«IЕТ>Г = о. В случае, когда спектр собственных значений ? дискретен, из этого уравнения следует, что все матричные элементы (?'§' | со | |"Р"> оператора со равны нулю, кроме тех, для которых %' = |". В случае, когда | имеет сплошной спектр собственных значений, можно, так же как для уравнения D8), показать, что A'$' \ со J ?"Р") имеет вид <1Т!в>|5Т) = сб(Г-Г), где с есть некоторая функция от %', а также от |3' и Р". В обоих случаях мы можем говорить, что матрица — пред- представитель оператора со диагональна по отношению к ?. Если наблюдаемая / (?) есть некоторая функция от ?, то, в соответствии с общей теорией в § 11, согласно которой функция / (%"') должна быть определена для всех собствен- собственных значений |"' наблюдаемой %, мы можем в обоих случаях получить / (Г) <&Т | со | ГР"> - <1Т ! а | ГР">/ (Г) = о. Отсюда следует
§ 19. ТЕОРЕМЫ О ФУНКЦИЯХ НАБЛЮДАЕМЫХ 109 так что со-«>/(&) = 0, и, следовательно, теорема доказана. В качестве частного случая этой теоремы получаем, что любая наблюдаемая, коммутирующая с наблюдаемой ?, коммутирует также с произвольной функцией от ?. Этот результат является, очевидно, необходимым с физической точки зрения, если отождествлять, как мы это сделали в § 13, условие коммутативности двух наблюдаемых и усло- условие совместности соответствующих измерений. Любое из- измерение, совместное с измерением наблюдаемой I, должно быть совместно также и с измерением f (§), так как любое измерение ? включает в себя и измерение / (?). Теорема 2. Линейный оператор, который коммути- коммутирует со всеми коммутирующими между собой наблюдаемыми из полного набора, является функцией этих наблюдаемых. Пусть со — линейный оператор, а %ъ |2> •¦•> 5в — полный набор коммутирующих наблюдаемых. Введем представление, в котором эти наблюдаемые диагональны. Так как со ком- коммутирует с каждой из наблюдаемых \, то матрица, являю- являющаяся представителем со, диагональна по отношению к каж- каждой из наблюдаемых ? по причинам, которые были рассмот- рассмотрены выше. Отсюда следует, что эта матрица будет диагональной и будет иметь вид D9), причем число с' является функцией переменных ?'. Таким образом, матрица является представителем функции с' от ?' и, следовательно, со является той же функцией от наблюдаемых |. Теорема 3. Если наблюдаемая ? и линейный оператор g таковы, что каждый линейный оператор, который ком- коммутирует с 5, коммутирует также и с g, то g является функцией от |. Эта теорема является обратной теореме 1. Для доказа- доказательства используем то же самое представление, в котором наблюдаемая I диагональна и которое мы уже использовали в теореме 1. Во-первых, мы видим, что оператор g должен коммутировать с самой наблюдаемой ?; отсюда следует, что представитель g должен быть диагоналей относительно |, т. е. он должен иметь вид <ST I g I IT) = а (БТР") h-v или а (НТП б (V - Г) в зависимости от того, имеет ли ? дискретный или сплошной спектр собственных значений. Далее, пусть со — линейный
ПО ГЛ. Ill ПРЕДСТАВЛЕНИЯ оператор, который коммутирует g ?, так что его предста- представитель имеет вид <|'Р'! со IT) = Ь (ГРТ) hi или b d'p'p") б (|' - Г). Согласно гипотезе оператор со должен коммутировать также и с g, так что выполняется уравнение <ГР'!?со-со|г|ГР">=О. E8) Если для определенности предположить, что все наблюдае- наблюдаемые р имеют дискретный спектр собственных значений, то из уравнения E8), используя правило умножения матриц, получаем ? {а (Г Р'Р'") Ь (?'Р'Т) - Ь (?'Р'П a (Г FP")} = 0, E9) причем левая часть уравнения E9) отличается от левой части уравнения E8) множителем б|-|" или б (?' — ?"). Уравнение E9) должно выполняться для всех функций Ь (?'Р'Р"). Отсюда следует, что а(|'Р'р") = О при р'=^Р", Первое из этих уравнений означает, что матрица — пред- представитель оператора g диагональна, а второе — что функ- функция а (?'Р'Р') не зависит от Р'. Отсюда мы можем заключить, что оператор является такой же функцией от |, какой яв- является а (?'Р'Р') от I', и, таким образом, теорема доказана. Если все наблюдаемые р или некоторые из них имеют сплошной спектр собственных значений, то доказательство аналогично. Теоремы 1 и 3 выполняются также, если заменить наблю- наблюдаемую ? набором коммутирующих наблюдаемых lL, ?2, ... ...,?/•• Изменения в ходе доказательства будут при этом чисто формальными. § 20. Усовершенствование обозначений Теория представлений, развитая нами, позволяет ввести общую систему для обозначения значками бра- и кет- векторов. В представлении, в котором диагональны комму- коммутирующие наблюдаемые %lt ..., \и, составляющие полный
§ 20. УСОВЕРШЕНСТВОВАНИЕ ОБОЗНАЧЕНИЙ HI набор, представитель произвольного кет-вектора | Р) будет иметь вид A\ ... 1и | Р) или, для краткости (I' j Р). Этот представитель является некоторой определенной функцией переменных ?'; обозначим ее ty (?'). Тогда функция я]з одно- однозначно определяет кет | Я), и она может быть поэтому ис- использована для обозначения значками этого кет-вектора вместо произвольного значка Р. Таким образом, если то мы обозначим ( F0) Мы должны писать | ty (|)), а не | ty (?')) потому, что этот вектор зависит не от частных значений чисел ?', а только от вида функции тр. Если / (?) — произвольная'функция наблюдаемых ?ь ... ..., |ц, то представитель вектора / (!) | Я) будет иметь вид В соответствии с формулами F0) обозначаем /(?)|Р> = |/AЖ?)>- Наконец, используя второе из уравнений F0), получаем /(?)|гИШ = 1/AЖШ- F1) Этот результат является общим и справедлив для любых функций г|з и / наблюдаемых ?; мы влдим, таким образом, что вертикальная черта | не является обязательной для но- нового обозначения кет-вектора; обе стороны уравнения F1) можно записать просто в виде f (|) гр (|)). Тогда правило, по которому вводятся новые обозначения, примет вид: если то обозначаем > F2) >> ] Далее мы будем писать кратко я|з) вместо г|з (!)>, опуская переменную ?, которая будет подразумеваться в тех слу- случаях, когда это не вызывает недоразумений. Кет *ф (!)) можно рассматривать как произведение ли- линейного оператора гр (|) на кет, который мы будем обозна- обозначать просто символом ) без всяких дополнительных знач- значков. Назовем кет ) стандартным кет-вектором. Любой кет может быть представлен как произведение функции
112 ГЛ. III. ПРЕДСТАВЛЕНИЯ наблюдаемых | на стандартный кет. Например, взяв вместо | Р) в формуле F2) базисный вектор | \"), находим I г)=б5..... б? .в (tv+1 - и+1)... б а„ - к), F3) для случая, когда наблюдаемые ?1( ..., |в имеют дискретный, a if+i, •••, iu — сплошной спектры собственных значений. Стандартный кет обладает тем основным свойством, что его представитель (?' | > равен единице при всех значениях переменной %', как легко видеть, полагая в формуле F2) !>= 1. Дальнейшее сокращение обозначений можно сделать, если опускать символ >, подразумевая стандартный вектор. Тогда кет запишется просто в виде \\> (|) — в виде функции наблюдаемых \. Функция наблюдаемых \, используемая таким образом для обозначения кет-вектора состояния, на- называется волновой функцией *). Система обозначений, ос- основанная на волновых функциях, используется обычно большинством авторов в квантовых расчетах. При пользо- пользовании этими обозначениями следует подразумевать, что каждая волновая функция умножена справа на стандартный кет-вектор, и это предохраняет нас от умножения волновой функции на оператор справа. Волновые функции можно умножать на операторы только слева. Это отличает их от обычных функций наблюдаемых |, которые являются опе- операторами и могут умножаться на другие операторы как справа, так и слева. Волновая функция, как функция наблюдаемых ?, и представитель, как функция собственных значений ?', — обе эти функции имеют одинаковый вид для одного и того же вектора состояния. Квадрат модуля волновой функции дает вероятность (или относительную вероятность, если функция не нормирована) того, что для данного состояния наблюдаемые | имеют определенные значения или лежат в определенных малых промежутках. Новые обозначения для бра-векторов можно ввести тем же путем. Бра (Q |, представителем которого (Q |?') яв- является функция ф (|'), мы будем записывать в виде (ф (|) |. В этих обозначениях бра-вектором, сопряженным кет-век- *) Название было дано потому, что на заре квантовой механики все примеры этих функций имели вид волн. С точки зрения современной общей теории такое название не отражает характерных свойств этих функций.
§ 20. УСОВЕРШЕНСТВОВАНИЕ ОБОЗНАЧЕНИЙ ИЗ тору | ip (?)). будет (^ (I) |. Таким образом, правило, соглас- согласно которому два сопряженных вектора снабжаются одина- одинаковыми значками, следует несколько уточнить и сформули- сформулировать следующим образом. Если значки, от которых зави- зависит кет-вектор, содержат комплексные числа или комп- комплексные функции, то значками для сопряженного бра-век- бра-вектора будут комплексно-сопряженные числа или функции. Так же, как и в случае кет-векторов, можно показать, что (Ф (I) | / (I) и (ф (I) f (I) | — одинаковые бра-векторы, так что вертикальная черта может быть опущена. Мы можем рассматривать бра (ф (?) как произведение линейного опе- оператора ф (|) и стандартного бра (, который является век- вектором, сопряженным стандартному вектору ). Мы можем опускать символ (, подразумевая его, тогда произвольный бра-вектор запишется в виде ф (?) —¦ в виде комплексно- сопряженной волновой функции. Комплексно-сопряженную волновую функцию можно умножать на оператор только справа, но не слева. Можно построить тройное произведе- произведение (/(?)). Такое произведение является числом, равным функции / (?), просуммированной или проинтегрированной по всему спектру собственных значений наблюдаемых ?, т. е. </(Ш= Z \...\f(l')dl^...dl'u F4) el --to для случая, когда %ъ ..., \„ имеют дискретный, a lvn, ... • ••, \и — сплошной спектры собственных значений. Стандартные кет и бра определены для данного пред- представления. Если провести те же рассуждения для другого представления, в котором диагональны другие коммутирую- коммутирующие наблюдаемые ц, образующие полный набор, или если мы даже просто изменим фазовые множители в старом представлении, в котором диагональны наблюдаемые |, то мы получим другие стандартные кет и бра. В тех рассуж- рассуждениях, в которых появляется несколько стандартных кет- векторов и бра-векторов, следует, конечно, различать их, снабжая их значками. Теперь рассмотрим дальнейшее усовершенствование обо- обозначений, которое является весьма важным для изучения сложных динамических систем. Пусть имеется динамическая система, которая описывается такими динамическими пере- переменными, что все они могут быть разбиты на две группы —
114 ГЛ. III. ПРЕДСТАВЛЕНИЯ Л и В, причем любая переменная из группы А коммутирует с переменной из группы В. Произвольная динамическая переменная должна быть представима в виде функции пере- переменных А и переменных В. Можно рассмотреть другую динамическую систему, в которой динамическими перемен- переменными являются только переменные А, назовем ее системой А. Точно так же можно рассмотреть третью систему, в которой динамическими переменными являются только переменные В — систему В. Исходную систему можно рассматривать как комбинацию системы А и системы В в соответствии с математической схемой, приведенной ниже. Рассмотрим кет-векторы \ а) и \Ь), характеризующие соответственно состояния систем А и В. Предположим, что имеет смысл произведение \ а) \Ь), для которого вы- выполняются перестановочная и распределительная аксиомы, {c1\a1)+c2\ai}}\b)=c1\al}\b)-{-ci\a2}\b), \а) К | &х> +с21 Ьг)} = d |а) | bt) +с21а) | Ь2), где с — комплексные числа. Мы можем придать смысл действию на это- произведение любой из переменных А, считая, что она действует только на множитель | а) и комму- коммутирует с множителем | Ь). Точно так же можно придать смысл действию на это произведение любой из переменных В, считая, что она действует только на множитель | Ь) и коммутирует с множителем | а). (Отсюда вытекает, что каждая переменная А коммутирует с каждой переменной В.) Таким образом, любая динамическая переменная исходной системы может действовать на произведение \ а) \Ь) так, что его можно рассматривать как кет этой системы и запи- записывать в виде | ab), причем двух значков а и b достаточно для его обозначения. Таким образом, мы получаем основное уравнение \\b) \b)\) \b). F5) Умножение в этой формуле имеет совершенно другую природу, чем умножение, которое рассматривалось ранее в излагаемой теории. Кет-векторы | а) и | Ь) находятся в двух различных векторных пространствах, а их произве- произведение находится в третьем векторном пространстве, которое можно считать произведением первых двух пространств.
§ 20. УСОВЕРШЕНСТВОВАНИЕ ОБОЗНАЧЕНИЙ 115 Число измерений в произведении двух пространств равно произведению числа измерений каждого из пространств- сомножителей. Произвольный кет-вектор в произведении пространств не обязательно имеет вид F5), а является, вооб- вообще говоря, суммой или интегралом кет-векторов такого вида. Рассмотрим такое представление для системы А, в кото- котором коммутирующие наблюдаемые %А, составляющие пол- полный набор для этой системы, диагональны. Тогда базисными бра-векторами для системы А будут бра-векторы (lj,A |. Ана- Аналогично, рассматривая представление для системы В, в ко- котором диагональны наблюдаемые \в, мы получаем базисные бра-векторы A'в I для системы В. Произведения F6) являются базисными бра-векторами представления для исходной системы; в этом представлении будут диагональны наблюдаемые %д и ?д. Переменные Ъ,А и 1В вместе образуют полный набор коммутирующих наблюдаемых исходной системы. Из формул F5) и F6) получаем A'А\а)A'в\Ь) = (?д1'в\аЬ), F7) откуда видно, что представитель произведения |ab) равен произведению представителей векторов | а) и | Ь) в соответ- соответствующих представлениях. Можно ввести стандартный кет )А для системы А и для данного представления, в котором наблюдаемые ?д диаго- диагональны, а также стандартный кет )в для системы В и для представления, в котором диагональны \в. Их произве- произведение )д )в будет тогда стандартными кет-вектором для исходной системы и для того представления, в котором диагональны наблюдаемые ?д и \в. Любой кет исходной системы может быть представлен в виде Ц(Ыв))а)в. F8) Может случиться, что в тех или иных вычислениях мы хотим использовать определенное представление для сис- системы В, например уже рассмотренное представление, в кото- котором диагональны наблюдаемые \в, но не хотим вводить оп- определенное представление для системы А. Тогда удобно использовать стандартный кет )в для системы В, но не вводить стандартного кет-вектора для системы А. В таком
46 ГЛ. III. ПРЕДСТАВЛЕНИЯ случае произвольный кет исходной системы можно записать в виде \1в))в, F9) где [ 1ц) есть кет для системы А, зависящий от наблюдае- наблюдаемых in как от параметров, т. е., вообще говоря, различный для различных наборов значений наблюдаемых |в. Выраже- Выражения F8) и F9) будут равны между собой, если положить Можно опускать стандартный вектор )в в выражении F9), подразумевая его; тогда произвольный кет для исходной системы будет иметь вид | \в) и будет являться кет-вектором состояния для системы А и волновой функцией, зависящей от переменных \в, системы В. Подобные обозначения будут использованы в §§ 66 и 79. Все эти рассуждения можно немедленно обобщить на динамическую систему, которая описывается такими дина- динамическими переменными, что они могут быть разбиты на три или более групп: А, В, С, ..., так что каждый член из одной группы коммутирует с любым членом другой группы. Уравнение F5) тогда обобщается и принимает вид \a)\b)\c) ...= \abc ...>, где множители в левой части являются кет-векторами под- подсистем, а кет в правой части характеризует исходную сис- систему. Уравнения F6)—F8) обобщаются на случай несколь- нескольких сомножителей тем же путем.
ГЛАВА IV КВАНТОВЫЕ УСЛОВИЯ § 21. Скобки Пуассона До сих пор мы занимались построением общей математи- математической схемы квантовой механики, описывающей состояния и наблюдаемые. Одно из основных свойств этой схемы заключается в том, что наблюдаемым или динамическим переменным сопоставляются такие величины, которые не подчиняются коммутативному закону умножения. Теперь нам необходимо получить уравнения, которые заменили бы коммутативный закон умножения и которые позволили бы определить, чему равна разность %ч\ — т)|, если | и ц — какая-то пара наблюдаемых или динамических переменных. Только тогда, когда эти уравнения будут установлены, мы будем иметь законченную схему новой механики, которая должна заменить механику классическую. Эти новые уравнения называются квантовыми условиями или переста- перестановочными соотношениями. Проблема отыскания квантовых условий не имеет столь общего характера как все то, что мы рассматривали до сих пор. Это, напротив, частная задача, которая возникает для каждой частной системы, изучаемой нами. Однако сущест- существует довольно общий метод получения квантовых условий, применимый к очень широкому классу динамических систем. Это метод классической аналогии; он и является главной темой этой главы. Те динамические системы, к ко- которым этот метод неприменим, следует рассматривать по отдельности и пользоваться в каждом случае особыми сооб- соображениями. Значение классической аналогии в построении квантовой механики связано с тем фактом, что классическая механика правильно описывает динамические системы в определенных условиях — когда частицы и тела, образующие систему, достаточно массивны, так что возмущение, сопровождающее
118 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЙ наблюдение, пренебрежимо мало. Поэтому классическая механика должна быть предельным случаем квантовой. Таким образом, мы должны ожидать, что важные понятия классической механики будут соответствовать важным понятиям квантовой механики. Учитывая общий характер аналогии между классической и квантовой механикой, мы можем надеяться получить законы и теоремы квантовой механики, являющиеся простыми обобщениями хорошо известных результатов классической механики. В частности, можно надеяться получить квантовые условия, являющиеся простым обобщением классического закона, согласно кото- которому все динамические переменные коммутируют. Рассмотрим динамическую систему, состоящую из вза- взаимодействующих частиц. В качестве независимых динами- динамических переменных, характеризующих эту систему, можно воспользоваться декартовыми координатами всех частиц и соответствующими компонентами скоростей частиц. Более удобно, однако, использовать вместо компонент скорости компоненты импульса. Обозначим координаты через qr, а соответствующие компоненты импульса через рп причем значок г принимает значения от 1 до Зп, где п — число частиц. Величины' q и р называются каноническими коорди- координатами и импульсами. В методе уравнений движения Лагранжа координаты qr и импульсы рг вводятся более общим способом, который применим также к системам, состоящим не только из ча- частиц (например, к системам, состоящим из твердых тел). Эти более общие величины q и р также называются канони- каноническими координатами и импульсами. Любая динамическая переменная может быть выражена как функция набора канонических координат и импульсов. Важным понятием в классической динамике являются скобки Пуассона. Любой паре динамических переменных и и v можно сопоставить СП (скобку Пуассона), которую мы будем обозначать символом [и, v] и которая определяется формулой Р , _ VI \ ди dv ди dv [и, П-^\ причем и и v рассматриваются при дифференцировании как функции некоторого набора канонических координат и импульсов. Правая часть уравнения A) не зависит от того,
§ 21. СКОБКИ ПУАССОНА US какой именно набор канонических координат и импульсов взят при вычислении A); это следует из общего определения канонических переменных. Таким образом, определение СП является однозначным. Главные свойства СП, которые не- непосредственно следуют из определения A), таковы: [и, »] = — [v, и], B) [«, с] = 0, C) где с является числом (которое можно рассматривать как частный случай динамической переменной), [и, vl + v2] = [u, Ьг] + [и, v2], ' E) Легко также проверить, что выполняется тождество [и, [v, w]] + [v, [w, u]] + [w, [и, о]] = 0. F) Уравнения D) означают, что СП [и, v] содержит и и v ли- линейно, в то время как уравнения E) соответствуют обычному правилу дифференцирования произведения. Попытаемся ввести квантовую СП, которая была бы аналогом классической. Мы предположим, что квантовая СП удовлетворяет всем условиям B)—F), причем теперь необходимо, чтобы порядок сомножителей м1( wx и и2, w2 во всех частях уравнений E) оставался таким, как мы его здесь написали. Из нижеследующего рассуждения видно, что этих условий уже достаточно, чтобы определить одно- однозначно явный вид квантовых СП. Можно вычислить СП \иуиг, vxu2] двумя разными способами, используя либо первое, либо второе из уравнений E). Получаем = {[«l. Vi] V2 + У, [Uu V2\] U2 + «i {[«,, Uj V% + Vx [иг, V2]} = = [uu vx] v2u2 + t»j [«,, y2] и2 + «x [м2, yj y2 + ulvl [u2, v2],
120 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ и, с другой стороны, [«!«!,, V1V2] = [u1U2, V^Vv + V, \Щ11г, V2] = = [Ub V^UiVi + UilUi, V1\v2+V1[u1, V2] U2 + »!«! [u2, V2]. Приравнивая оба результата, имеем [иъ vx]{u2v2~viu2) = (u]vl — vlu1)[u.l, v2]. Поскольку это условие выполняется для операторов их и i^. которые никак не связаны с операторами и2 и v2, то мы должны иметь u1vi — v1ul = itl[u1, Vi], u2v2 — v2u2 = iU[u2, v2], где величина Н не должна зависеть ни от щ и ь\, ни от и2 и v^ а, кроме того, должна коммутировать с (гад—ухщ). Отсюда следует, что величина Н должна быть просто числом. Мы хотим, чтобы СП от двух вещественных переменных была также вещественной, так же как и в классической теории. Это требование будет выполнено согласно расужде- ниям на стр. 45, если только постоянная Н будет веществен- вещественным числом (при условии, что она введена в формулы, как это сделано нами, со множителем i). Таким образом, мы пришли к следующему определению квантовых скобок Пуассона [и, v] для двух переменных и и о uv — vu = i% [и, v], G) где h есть новая универсальная постоянная, имеющая раз- размерность действия. Для того чтобы теория согласовалась с опытом, следует- положить постоянную Н равной Л/2л, где h есть универсальная постоянная, введенная Планком, так называемая постоянная Планка. Легко проверить, что квантовые СП удовлетворяют условиям B)—F). Задача о нахождении квантовых условий сводится теперь к задаче об определении СП в квантовой механике. Близкое сходство между квантовой СП, определяемой уравнением G), и классической СП, определяемой уравнением A), наводит нас на предположение, что квантовые СП или, во всяком случае, самые простые из них, имеют те же значения, что и соответствующие классические СП. Простейшими СП являются те, в которые входят сами канонические коорди-
§ 21. СКОБКИ ПУАССОНА 121 наты и импульсы; в классической теории они имеют следую- следующие значения: [Чг, <7,J = 0, [рг, ps] = 0 г 1 я < (8) [Я г, Ps] = O Поэтому мы предположим, что соответствующие квантовые СП также имеют значения (8). Исключая квантовые СП с помощью формулы G), получаем уравнения ~Я*Яг = О, PrPs-psPr=O, | которые являются основными квантовыми условиями. Они показывают нам, в чем именно заключается некоммутатив- некоммутативность канонических координат и импульсов. Эти условия дают нам также основу для нахождения перестановочных соотношений между другими динамическими переменными. Например, если \ и ц — любые две функции координат q и импульсов р, которые можно разложить в степенные ряды, то мы можем, применяя повторно формулы B)—E), выра- выразить перестановочное соотношение ?г] — т)!- или СП [?, г\] через элементарные СП (8) и, тем самым, вычислить эти вы- выражения. В простых случаях результат часто не отличается от классического или же отличается от классического ре- результата лишь тем, что требуется соблюдать определенный порядок множителей в произведении, порядок, который в классической теории, очевидно, несуществен. Даже если | и т| являются более общими функциями канонических пере- переменных q и р, неразложимыми в степенные ряды, то урав- уравнений (9) все же достаточно, чтобы определить значение 1ц—г\1, как это будет ясно из дальнейшего. Таким образом, уравнения (9) дают решение задачи о нахождении квантовых условий для всех динамических систем, для которых имеются классические аналоги и которые можно описывать с помощью канонических координат и импульсов. Сюда входят, однако, не все возможные квантовомеханические системы. Уравнения G) и (9) образуют основу для проведения аналогии между квантовой и классической механикой. Они показывают, что классическую механику можно рассматри- рассматривать как предельный случай квантовой, когда постоянная % стремится к нулю. В квантовой механике СП является
122 ГЛ IV. КВАНТОВЫЕ УСЛОВИЯ чисто алгебраическим понятием, и поэтому она является чем-то более фундаментальным, чем классическая СП, кото- которую можно определить лишь со ссылкой на определенный набор канонических координат и импульсов. По этой при- причине канонические координаты и импульсы имеют в кван- квантовой механике меньшее значение, чем в классической механике; в самом деле, в квантовой механике возможна система, для которой не существует канонических коор- координат и импульсов, а СП тем не менее имеют смысл. Такая система не будет иметь классического аналога, и мы не можем поэтому получить для нее квантовые условия опи- описанным здесь методом. Из уравнений (9) видно, что две переменные с разными значками г и s всегда коммутируют. Отсюда следует, что любая функция переменных qr и рг будет коммутировать с любой функцией qs и ps, если г ф s. Различные значения г соответствуют различным степеням свободы динамической системы, так что мы получаем результат: динамические переменные, относящиеся к разным степеням свободы, коммутируют. Мы вывели этот закон из формул (9) и поэ- поэтому он справедлив только для динамических систем, обладающих классическим аналогом, однако мы предполо- предположим, что закон справедлив и в общем случае. Таким обра- образом, можно подойти к решению задачи о нахождении кван- квантовых условий для систем, у которых не существует канони- канонических координат и импульсов, если только можно придать смысл различным степеням свободы системы в соответствии с ее физической природой. Теперь становится ясным физический смысл обсуждав- обсуждавшегося в конце предыдущего параграфа подразделения ди- динамических переменных на группы, в которых каждый член одной группы коммутирует с каждым членом другой. Каждая из этих групп соответствует определенным степеням свободы или только одной степени свободы. Это подразделе- подразделение может соответствовать физическому процессу разделе- разделения динамической системы на составные части, причем каждая из частей может существовать сама по себе как физическая система, а если привести эти системы во взаимо- взаимодействие друг с другом, то снова получится исходная систе- система. Это же подразделение может быть и просто математи- математической процедурой разделения динамической системы на степени свободы, которые не могут быть разделены физи-
§ 22. ШРЕДИНГЕРОВСКОЕ ПРЕДСТАВЛЕНИЕ 123 чески; так, например, система, состоящая из частицы, имею- имеющей внутреннюю структуру, может быть разделена на степе- степени свободы, описывающие движение центра частицы и сте- степени свободы, описывающие внутреннюю структуру. § 22. Шредингеровское представление Рассмотрим динамическую систему с п степенями свобо- свободы, имеющую классический аналог и, следовательно, опи- описываемую каноническими координатами и импульсами qr, pr(r = 1, 2, ..., п). Предположим., что все координаты qr являются наблюдаемыми и имеют сплошной спектр собст- собственных значений, — эти предположения являются естест- естественными, если иметь в виду физический смысл координату. Введем представление, в котором координаты q диагональны. Возникает вопрос, будут ли эти координаты образовывать полный набор коммутирующих наблюдаемых для данной динамической системы. Это предположение кажется до- довольно очевидным. Мы примем, что это действительно так, а в дальнейшем это предположение будет обосновано (см. стр. 127). Если координаты q образуют полный набор коммутирующих наблюдаемых, то представление при по- помощи координат полностью определено с точностью до произвольных фазовых множителей. Рассмотрим сначала случай, когда п = 1, так что имеется только одна координата q и импульс р, удовлетворяющие уравнению qp-pq^ih. A0) Произвольный кет-вектор может быть записан с помощью стандартного кет-зектора в виде ij) (q)). Из этого кет-вектора можно построить кет dtyldq), представителем которого будет производная исходного представителя. Этот новый вектор линейным образом зависит от исходного кет-век- кет-вектора, и получается, таким образом, в результате действия некоторого линейного оператора на исходный кет. Обозна- Обозначая этот линейный оператор через dldq, имеем ?¦>-¦?>• Уравнение A1), справедливое для любой функции
124 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ определяет оператор dldq. Имеем Будем рассматривать линейный оператор dldq в соот- соответствии с общей теорией линейных операторов, построен- построенной в § 7. Тогда мы можем подействовать этим оператором на бра-вектор (ср (q), причем, согласно формуле C) § 7, произведение (ср dldq определяется формулой где т|) — любая функция. Переходя к представителям, имеем <Ф ± | q') dq'q (q>) = J <p (q') dq' Ш1. A4) Правую часть уравнения можно проинтегрировать по час- частям. Получаем <р ± q') dq' я|> (q') = - J *$Ш dq' я|> (q')t A5) предполагая, что внеиитегральный член обращается в нуль Отсюда имеем /\ _ dff(q') П~ dq' • Из этой формулы следует равенство Таким образом, оператор dldq, действуя влево на ком- комплексно-сопряженную волновую функцию, имеет смысл опе- оператора дифференцирования по q, взятого с обратным знаком. Справедливость этого результата зависит от того, пра- правилен ли переход от формулы A4) к формуле A5); этот переход возможен, если ограничиться такими бра и кет, для которых соответствующие волновые функции удовлет- удовлетворяют требуемым граничным условиям. Таким условием, которое обычно выполняется практически, является обра- обращение волновой функции в нуль на границах. (Несколько более общие условия будут приведены в следующем параг-
§ 22. ШРЕДИНГЕРОВСКОЕ ПРЕДСТАВЛЕНИЕ 125 рафе). Эти условия не ограничивают физической примени- применимости теории, а напротив, они обычно необходимы также и из физических соображений. Например, если <7есть декарто- декартова координата частицы, то ее собственные значения про- пробегают все значения от —оо до -f-oo, и из физического усло- условия, что вероятность нахождения частицы на бесконечности равна нулю, следует, что волновая функция должна обра- обращаться в нуль при q = ± оо. Оператор, комплексно-сопряженный оператору d/dq, можно вычислить, если учесть, что, согласно формуле A6), вектор, сопряженный вектору d/dq-ty) или dty/dq), имеет вид (dty'dq или — ($>dldq. Таким образом, оператором, сопряженным оператору d/dq, будет —d/dq, т. е. d/dq есть чисто-мнимый линейный оператор. Чтобы получить представитель оператора d/dq, восполь- воспользуемся формулой F3) § 20. Получаем \q")=8(q-q"). A7) Далее имеем > =-J-6 (<7-</')>> A8) dq а отсюда следует равенство d A9) Представитель оператора d/dq выражается через производ- производную от дельта-функции. Выведем перестановочные соотношения между опера- операторами d/dq и q. Имеем ?^ ? B0) Поскольку это равенство справедливо для любого кет-век- тора г(з >, получаем Сравнивая этот результат с формулой A0), мы видим, что оператор — ih d/dq удовлетворяет тому же самому переста- перестановочному соотношению с координатой q, что и импульс р. Чтобы обобщить предыдущее рассуждение на случай произвольного числа п степеней свободы, запишем произ- произвольный кет-вектор в виде ^(^...^л)) = "Ф) и введем п ли-
126 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ нейных операторов d/dqr(r = 1, ..., п), которые могут дей- действовать на этот вектор в соответствии с формулой ?¦>-¦&>• да аналогичной уравнению A1). Формула, аналогичная A2), имеет вид -гг->=0. B3) dqr/ y ' Если ограничиться только такими бра-векторами и кет- векторами, которым соответствуют волновые функции с дол- должными граничными условиями, то эти линейные операторы могут действовать также и на кет-векторы согласно формуле аналогичной формуле A6). Таким образом, операторы d/dqr могут действовать влево на комплексно-сопряженную волновую функцию; при этом они имеют смысл операторов частного дифференцирования по qr с обратным знаком. Мы получаем, как.и ранее, что каждый из линейных опера- операторов d/dqr является чисто мнимым. Аналогично формуле B1) перестановочные соотношения имеют вид ^4s-qs^ = brs. B5) Далее откуда имеем д следует g равенство д д dqr dq д2ф Яг dq S dqs д д dqr ' д B7) Сравнивая B5) и B7) с формулой (9), получаем, что линей- линейные операторы — ih d/dqr удовлетворяют тем же пере- перестановочным соотношениям с координатами q, что и им- импульсы р. Не приходя к противоречию, было бы возможно поло- положить B8)
§ 22. ШРЕДИНГЕРОВСКОЕ ПРЕДСТАВЛЕНИЕ 127 Эта возможность позволяет заключить, что координаты q должны составлять полный набор коммутирующих наблю- наблюдаемых. В самом деле это означает, что любую функцию от координат q и импульсов р можно рассматривать как функ- функцию от операторов q и — ih d/dq и, таким образом, эта функ- функция будет коммутировать со всеми q только в том случае, если она будет являться функцией одних координат q. Уравнение B8) не является единственно возможным. Однако, во всяком случае, каждая из величин pr + ih d/dqr должна коммутировать со всеми q, и, следовательно, она является функцией одних координат q согласно теореме 2 § 19. Таким образом, Pr = -iHdldqr+fr(q). B9) Так как операторы рг и — ih d/dqr вещественны, то и функ- функции fr (q) должны быть вещественными. Для любой функции f от координат q имеем dqr ' т/ ' dqr Y/ ' dqr откуда следует равенство д f f д df Используя формулу B9), мы можем теперь получить общую формулу ff ihdfd C1) Эта формула может быть записана с помощью СП в виде F/, pr] = dfldqr. C2) Такую же формулу мы получаем и из классической теории, что видно из определения A). Умножая уравнение B7) на (—i/гJ и подставляя вместо — ih d/dqr и — ih d/dqs их зна- значения по формуле B9), получаем (Рг - fr) (Ps ~ fs) = (Ps ~ fs) (Pr - fr)- Эта формула сводится, с помощью квантового условия Prps = PsPn к формуле Pris + IrPs = Psfr + fsPr-
128 ГЛ IV. КВАНТОВЫЕ УСЛОВИЯ Далее, используя формулу C1), получаем dfr/dqs, C3) откуда видно, что все функции fr должны иметь вид fr = dF/dqr, C4) причем функция F не зависит от г. Тогда уравнение B9) принимает вид рг = — ih d/dqr + dF/dqr. C5) Представление, в котором мы вели рассмотрение, опре- определялось лишь тем, что все координаты q должны быть в нем диагональны, однако при этом остается еще произ- произвол в выборе фазовых множителей. Если изменить фазо- фазовые множители, то изменятся также и операторы d/dqr. Покажем теперь, что, выбрав должным образом фазовые множители, можно обратить в нуль функцию F в уравнении C5), так что уравнение B8) будет действительно выполнять- выполняться. Обозначая звездочкой величины, относящиеся к новому представлению с новыми фазовыми множителями, мы полу- получим следующее соотношение между прежними и новыми базисными бра-векторами: {q[...qn\=e^{q'l...q'n\, C6) где у' = у (q') — вещественная функция координат q'. Но- Новый представитель вектора состояния отличается от старого также множителем е'у>, т. е. е'у г|з)* = "Ф). Отсюда следует соотношение между исходным и новым стандартным кет- вектором >*=<r'Y). C7) Используя уравнение C7), получаем для нового линейного оператора (d/dqr) * соотношение аналогичное соотношению B2). Далее, используя B2), имеем UJ oqr T/ dqr
§ 22. ШРЕДИНГЕРОВСКОЕ ПРЕДСТАВЛЕНИЕ 129 откуда следует равенство д &7) -=e~iyWeiy- C8) Используя уравнение C0), получаем v dqr I dqr * dqr ' Если определить функцию у уравнением F = hy-\- постоянная, D0) то формула C5) примет вид pr = — ih(d/dqr)*. D1) Уравнение D0) определяет у с точностью до произвольной постоянной; таким образом, представление определено с точ- точностью до произвольного постоянного фазового множителя. Таким образом, мы видим, что может быть построено представление, в котором координаты q диагональны и вы- выполняется уравнение B8). Это представление является весь- весьма полезным для многих задач. Назовем его шредингеров- ским представлением, так как именно в этом представлении Шредингер в 1926 г. дал первоначальную формулировку квантовой механики. Шредингеровское представление су- существует, если только система имеет канонические коор- координаты q и импульсы р, и оно определяется этими q и р полностью, с точностью до произвольного постоянного фа- фазового множителя. Большим удобством этого представления является то, что оно позволяет непосредственно представить любую алгебраическую функцию от координат q и импуль- импульсов р, имеющую вид степенного ряда, в форме дифференци- дифференциального оператора, а именно, если f (qlt ..., qn, рг, ..., рп) — такая функция, то в шредингеровском представлении мы имеем f(qu ..., qn, pu ..., р„) = = /(9i, .... Qn, —iftd/dqlt .... —ihd/dqn); D2) при этом предполагается, что при подстановке — ih d/dq вместо импульсов р мы сохраняем порядок сомножителей в произведениях. Из уравнений B3) и B8) получаем Рг> = 0. D3)
130 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ Таким образок, стандартный кет-вектор в шредингеровском представлении обладает тем свойством, что он является об- общим собственным вектором всех импульсов с нулевыми собственными значениями. Отметим некоторые свойства ба- базисных векторов в шредингеровском представлении. Из уравнения B2) имеем д dq/ Отсюда получаем Таким образом, приходим к формуле ' — ( ' dq'r \ [ ...q'n\pr = - Як\ Подобно этому, уравнение B4) приводит к формуле Рг\Я\ ¦•• qn) = itl-Qjr\q[ ... q'n). D4) D5) D6) § 23. Импульсное представление Рассмотрим систему с одной степенью свободы, которая описывается одной координатой q и импульсом р, причем собственные значения q пробегают все значения от —оо до + со . Пусть \р') — собственный кет-вектор импульса р. Используя формулу D5) для случая одной степени свободы, получаем, что представитель этого вектора в шредингеров- шредингеровском представлении удовлетворяет уравнению Решение этого дифференциального уравнения для функции (q' I p' > имеет вид (q'\p') = c'e?p'i''n, D7) где с' = с' (р') не зависит от q', но может зависеть от р'.
§ 23. ИМПУЛЬСНОЕ ПРЕДСТАВЛЕНИЕ 131 Представитель (q'\p') не удовлетворяет упомянутым выше граничным условиям, т. е. не обращается в нуль при q' = ±00. Это вызывает некоторые затруднения, которые проявляются наиболее непосредственно в том, что не выпол- выполняется теорема ортогональности. Возьмем другой собст- собственный кет-вектор | p")j импульса р с собственным значе- значением р" ф р'. Представитель его имеет вид < Мы получим -f-оэ -f-°° (р'р")= \ {p'\q')dq'(q'\p") = C'c" \ е~'^ ~ ?") *'* dq'. — ТО —GO D8) Этот интеграл не является сходящимся согласно обычному определению сходимости. Для того чтобы восстановить по- порядок в теории, мы примем новое определение сходимости интегралов с бесконечными пределами, аналогичное опре- определению сходимости Чезаро для сумм бесконечных рядов. Согласно этому определению интеграл, как функция верх- верхнего предела q', считается равным нулю при q , стремящемся к бесконечности, если он имеет при конечных q вид cos aq' или sin aq', где а не равно нулю. Иначе говоря, мы произ- производим усреднение по колебаниям интеграла на верхнем пределе. То же самое производится и на нижнем пределе при стремлении его к —сх>. Отсюда следует, что правая часть уравнения D8) обращается в нуль, если р" =? р', и теорема ортогональности восстанавливается. Отсюда же следует, что правые части формул A3) и A4) равны между собой, если (ф и г|))—собственные векторы импульса р, так что на соб- собственные векторы импульса р можно действовать операто- оператором d/dq. Таким образом, граничные условия, которым дол- должен удовлетворять представитель кет-вектора или бра-век- бра-вектора, обобщаются и допускают колебания представителя типа cos aq' или sin ag' при q', стремящемся к + со или — со. Для значений р", близких к р', правая часть формулы D8) содержит дельта-функцию. Для ее вычисления можно воспользоваться формулой 5 eiax dx = 2л6 (а), D9)
•32 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ где а вещественно. Доказать ее можно следующим обра- образом. Формула, очевидно, верна при а, отличном от нуля, так как обе ее части равны тогда нулю. Далее, для непре- непрерывной функции / (а) имеем + СО g +00 $ f(a)da\ eiaxdx= \ f (a) da 2а'1 sin ag = 2nf @) — со —g —oo в пределе npng, стремящемся к бесконечности. Из несколько более сложных рассуждений следует, что мы получим тот же результат, если подставить вместо пределов g и —g пре- пределы gx и —g2 и устремлять независимо gt и g2 к бесконеч- бесконечности. Отсюда следует эквивалентность обеих сторон уравнения D9), если их рассматривать как множители в подынтегральном выражении, что и доказывает формулу. Используя формулу D9), можно записать соотношение ортогональности D8) в виде <р' | р"> = с'сп61(р' - р")/Н] = с~'с'Ы (р' - р") = = \с' \2h8(p' -р"). E0) Мы получили собственный кет-вектор импульса р для любого вещественного собственного значения р'. Предста- Представитель этого собственного вектора имеет вид D7). Любой кет | X) можно разложить по этим собственным кет-векто- рам импульса р, так как его представитель (q' | X ) может быть разложен по представителям D7) согласно формуле Фурье. Отсюда следует, что импульс р является наблюдаемой, что согласуется с опытными данными, согласно которым импульс всегда может быть измерен. Таким образом обнаруживается симметрия между коор- координатой q и импульсом р. Каждая из них является наблю- наблюдаемой, имеет сплошной спектр собственных значений от — со до + со, и перестановочное соотношение между ними (уравнение A0)) не изменится, если поменять местами q и р и заменить i на —i. Мы построили представление, в котором координата q диагональна, а р = —ih d/dq. Из соображений симметрии следует, что можно также построить представление, в котором импульс р диагоналей, а коор- координата имеет вид E1)
§ 23. ИМПУЛЬСНОЕ ПРЕДСТАВЛЕНИЕ 133 причем оператор d/dp вводится тем же способом, что и опе- оператор d/dq. Назовем это представление импульсным пред- представлением. Это представление менее полезно, чем рас- рассмотренное ранее шредингеровское, по следующей причине. Шредингеровское представление позволяет представить в ви- виде дифференциального оператора такую функцию коорди- координаты q и импульса р, которая является суммой степенных функций относительно р, в то время как импульсное пред- представление позволяет сделать то же с суммой степенных функ- функций координаты q. Между тем важные динамические вели- величины почти всегда являются степенными функциями р или суммами таких функций и часто не являются степенными функциями от q. Тем не менее импульсное представление оказывается полезным в ряде задач (см. § 50). Вычислим функцию преобразования (q' | р'), связываю- связывающую оба представления. Базисные кет-векторы | р') импуль- импульсного представления являются собственными векторами импульса р, а их шредингеровские представители (q' \ р') определены формулой D7), причем коэффициенты с' должны быть выбраны должным образом. Фазовые множители этих базисных кет-векторов нужно выбрать так, чтобы выполня- выполнялась формула E1). Проще всего удовлетворить этому усло- условию, используя рассмотренную выше симметрию между q и р, из которой следует, что выражение (q' \ р') должно перейти в (р' \ q'), если поменять местами q' и р' и заменить i на —I. Далее, (q' J р'> равно правой части формулы D7), a (q'\pr) равно комплексно-сопряженному выражению. Отсюда следует, что с' не зависит от р', и, таким образом, с' есть просто число. Далее должна выполняться формула откуда, после сравнения с формулой E0), видно, что | с | = = /Г1/г. Произвольный постоянный фазовый множитель в обоих представлениях можно выбрать так, чтобы было с = Н~Чг; тогда получаем для функции преобразования вы- выражение '> = /i-1Vp'«'/^. E2) Предыдущие рассуждения легко обобщить на систему с п степенями свободы, которая может быть описана п ко- координатами q и п импульсами р, причем собственные зна- значения каждой из координат пробегают все значения от — со
134 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ до +°°- Тогда каждый из импульсов будет наблюдаемой, собственные значения которой пробегают все значения от —оо до +°°, причем будет иметь место симметрия между со- совокупностью координат q и совокупностью импульсов р, по- поскольку перестановочные соотношения остаются инвариант- инвариантными, если поменять местами каждую из координат qr с со- соответствующим импульсом рг и заменить i на —i. Может быть построено импульсное представление, в котором им- импульсы р диагональны, а каждая из координат имеет вид qr = ihd/dpr. E3) Функция преобразования, связывающая импульсное представление с- шредингеровским, будет являться произ- произведением функций преобразования для каждой степени сво- свободы, как это видно из формулы F7) § 20. Таким образом, имеем (qlq'i ...q'n\ р\р\ ...р'п) = {q[ \ p[) (q\ \ р'г) ...<fl'n\ р'п) = -+РпЯп) § 24. Принцип неопределенности Гейзенберга Для системы с одной степенью свободы представители кет-вектора J X) в шредингеровском и в импульсном пред- представлении связаны между собой следующими соотношениями: /rI/! $ e-'o'e'^dq' (q'\X), ' (р'\Х). E5) Эти формулы имеют простой смысл. Они показывают, что каждый из представителей является с точностью до числен- численного множителя амплитудой разложения другого представи- представителя в интеграл Фурье. Интересно применить формулы E5) к кет-вектору, для которого шредингеровский представитель является так на- называемым волновым пакетом. Так называется функция, которая весьма мала повсюду, кроме некоторой области hq', а в этой области приближенно равна периодической
§ 24. ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ ГЕЙЗЕНБЕРГА 135 функции с определенной частотой *). Если разложить такой волновой пакет в интеграл Фурье, то значение амплитуды разложения будет мало для всех частот, кроме тех, которые близки к этой определенной частоте. Полоса частот, для ко- которых амплитуда разложения заметно отлична от нуля, будет иметь ширину порядка 1 /Aq', так как две компоненты Фурье, частоты которых отличаются на эту величину, а фазы — совпадают в середине области Aq', будут находиться в противофазе на краях этой области и будут таким образом гасить друг друга. Далее, в первом из уравнений E5) пере- переменная Bn)~ipl I К = р I h играет роль частоты. Поэтому, если (<?' | X) имеет вид волнового пакета, то функция (р' \ X), которая является амплитудой разложения этого пакета в интеграл Фурье, будет мала в //-пространстве повсюду, кроме некоторой области ширины Ар' = h/Aq'. Воспользуемся теперь физическим толкованием квад- квадрата модуля представителя вектора состояния как вероят- вероятности. Мы видим, что наш волновой пакет характеризует состояние, для которого измерение координаты q почти на- наверняка дает результат, лежащий в области с шириной Aq', а измерение р почти наверняка даст результат, лежащий в области с шириной Ар', Мы можем сказать, что в этом со- состоянии координата q имеет определенное значение с ошиб- ошибкой порядка Aq', а импульс р имеет определенное значение с ошибкой порядка Ар'. Произведение этих ошибок равно Aq' Ар' ««А. E6) Поэтому, чем более определенное значение имеет одна из переменных q или р, тем менее определенное значение имеет другая. Для системы с несколькими степенями свободы, уравнение E6) применимо к каждой из степеней свободы в отдельности. Уравнение E6) известно под названием принципа неопре- неопределенности Гейзенберга. Оно ясно показывает, в какой мере ограничена возможность одновременно приписывать для какого-либо состояния системы определенные численные зна- значения двум некоммутирующим наблюдаемым, когда этими наблюдаемыми являются канонические координата и им- импульс. Это же соотношение дает простой пример того, как могут оказаться несовместимыми наблюдения в квантовой *) Частотой здесь названа величина, обратная длине волны.
136 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ механике. Оно показывает также, что классическая механи- механика, приписывающая одновременно определенные числен- численные значения всем наблюдаемым, может оказаться хорошим приближением, когда постоянную h можно считать пре- пренебрежимо малой величиной. Равенство в формуле E6) достигается только в наиболее благоприятном случае, ко- который имеет место, если представитель состояния имеет вид пакета. Другие виды представителя приведут к значе- значениям Aq' и Ар', произведение которых больше чем //.. Принцип неопределенности Гейзенберга показывает, что в пределе, когда одна из величин q или р определена одно- однозначно, другая останется полностью неопределенной. Этот же результат можно получить и непосредственно из функции преобразования (q' | р'). В конце § 18 было показано, что величина | (q' | р' > |2 dq' пропорциональна вероятности того, что координата q имеет значение, лежащее в малом про- промежутке от q' до q + dq' для состояния, в котором им- импульс р имеет наверняка значение р'. Согласно формуле E2) эта вероятность не зависит от q' при заданном dq'. Таким образом, если р наверняка имеет значение р', то все значения q равновероятны. Точно так же, если q наверняка имеет значение q', то равновероятны все значения р. Физически очевидно, что состояния, в которых все зна- значения либо координаты, либо импульса равновероятны, не могут быть практически достигнуты — в первом случае из-за ограниченности размеров системы, а во втором слу- случае из-за ограниченности энергии. Таким образом, практиче- практически не могут быть достигнуты собственные состояния коор- координаты или импульса. Из рассуждений в конце § 12 уже сле- следовало, что эти собственные состояния недостижимы из-за бесконечной точности, необходимой для их создания; теперь мы пришли к этому же заключению другим путем. § 25. Операторы сдвига К новой точке зрения на некоторые из квантовых усло- условий можно прийти путем изучения операторов сдвига. Эти операторы могут быть введены в теорию, если принять во внимание, что данная в гл. II схема соотношений между состояниями и динамическими переменными является суще- существенно физической схемой. Отсюда, в частности, следует, что если некоторые состояния или динамические перемен-
§ 25. ОПЕРАТОРЫ СДВИГА 137 ные связаны определенными соотношениями, то после не- некоторого определенного сдвига их всех (например, после сдвига на расстояние 8х вдоль оси х декартовой системы координат) новые состояния и динамические переменные должны быть связаны теми же соотношениями. Сдвиг состояния или наблюдаемой есть физически вполне определенный процесс. Так, например, для того чтобы сдвинуть состояние или наблюдаемую на расстояние 6х вдоль оси х, мы должны просто сдвинуть на расстояние дх вдоль оси х все приборы, с помощью которых мы создаем это состояние или с помощью которых мы измеряем эту наблюдаемую. Сдвинутые таким образом приборы и опреде- определят сдвинутое состояние или сдвинутую наблюдаемую. Сдвиг динамической переменной должен быть столь же опре- определенным, как и сдвиг наблюдаемой, вследствие тесной ма- математической связи между динамическими переменными и наблюдаемыми. Сдвинутое состояние (сдвинутая наблюдае- наблюдаемая) однозначно определяются несдвинутым состоянием (несдвинутой наблюдаемой), а также направлением и ве- величиной сдвига. Однако понятие о сдвиге кет-вектора не является столь определенным. Пусть имеется некоторый кет-вектор, харак- характеризующий определенное состояние; мы можем сдвинуть это состояние и получить вполне определенное новое со- состояние, но этим новым состоянием не будет однозначно определяться наш смещенный кет — им будет определяться только направление смещенного вектора. Мы можем по- попытаться уточнить это определение, требуя, чтобы длины сдвинутого и несдвинутого векторов были одинаковы, но и при этом однозначная определенность не достигается; произвольным остается фазовый множитель при кет-век- торе. С первого взгляда может показаться, что каждый сдви- сдвигаемый кет-вектор может иметь независимый фазовый мно- множитель, однако с помощью нижеследующего рассуждения можно убедиться, что этот множитель должен быть одина- одинаков для всех векторов. Воспользуемся тем правилом, что суперпозиционная связь между состояниями должна оста- оставаться неизменной при смещении. Эта связь выражается ма- математически линейным уравнением между кет-векторами, характеризующими состояния, например = c1\A)+ci\B), E7)
138 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ гдесхис2 — числа. Инвариантность суперпозиционной связи требует, чтобы сдвинутые состояния характеризовались кет-векторами, удовлетворяющими тому же линейному уравнению. Обозначая в нашем случае сдвинутые кет-век- кет-векторы через | Rd), | Ad), | Bd), получаем \Rd)=c1\Ad)+c2\Bd). E8) Мы будем считать, что именно такие векторы являются сдви- сдвинутыми векторами, а не те, которые при сдвиге умножаются на разные множители и которые после сдвига будут удовлетво- удовлетворять линейному уравнению с коэффициентами, отличными от с1г с2. Единственная оставшаяся теперь неопределенность для сдвинутых кет-векторов — это возможность умножения их всех на один и тот же произвольный фазовый множитель. То условие, что линейные уравнения между кет-векто- кет-векторами остаются инвариантными при сдвиге и что, таким об- образом, выполняется уравнение типа E8), если справедливо соответствующее уравнение E7), означает, что сдвинутые кет-векторы являются линейными функциями несдвинутых кет-векторов. Таким образом, каждый сдвинутый кет | Pd) является результатом действия некоторого линейного опе- оператора на соответствующий несдвинутый кет | Р). Этот результат выражается формулой \Pd)*=D\P), E9) где D — линейный оператор, не зависящий от кет-вектора | Я) и зависящий только от величины и направления сдвига. Поскольку все сдвинутые кет-векторы могут быть умножены на произвольный фазовый множитель, то и оператор сдвига определен с точностью до этого множителя, равного по мо- модулю единице. После того как сдвиг кет-векторов определен таким об- образом (и точно так же, очевидно, определен сдвиг бра-век- бра-векторов, поскольку они являются сопряженными кет-векто- рам), мы можем утверждать, что любое символическое урав- уравнение между кет-векторами, бра-векторами и динамиче- динамическими переменными должно оставаться инвариантным при сдвиге всех входящих в него символов, потому что физи- физический смысл этого уравнения при сдвиге не меняется. Рассмотрим в качестве примера уравнение (Q\P)=c,
§ 25. ОПЕРАТОРЫ СДВИГА 139 где с — некоторое число. Тогда должно выполняться урав- уравнение (Qd\Pd)^c=(Q\P). F0) Заменяя в уравнении E9) Q на Р и переходя к сопряженному уравнению, имеем (Qd\^(Q\D. F1) Таким образом, уравнение F0) можно записать в виде (Q\DD\P) = (Q\P). Поскольку это равенство выполняется для любых (Q | и ( Р), то мы имеем DD=1, F2) т. е. мы получили общее условие, которому должен удов- удовлетворять оператор D. Рассмотрим в качестве второго примера уравнение где v — динамическая переменная. Тогда, обозначая через vd сдвинутую динамическую переменную, приходим к равен- равенству vd\Pd)=\Rd). Используя уравнение E9), получаем vd\Pd)=DiR) = Dv\P) = DvD л \ Pd). Поскольку кет | Р) произволен, то имеем vd = DvD-\ F3) откуда видно, что линейный оператор D определяет не только сдвиг кет-векторов и бра-векторов, но и сдвиг дина- динамических переменных. Отметим, что произвольный числен- численный множитель, равный по модулю единице, который со- содержится в операторе D, не влияет на оператор vd, и также не влияет на справедливость формулы F2). Перейдем теперь к бесконечно малому сдвигу, т. е. бу- будем рассматривать сдвиг вдоль оси х на расстояние бх и устремим Ьх к нулю. Из соображений физической непре- непрерывности мы будем предполагать, что сдвинутый кет I Pd) будет стремиться к исходному вектору \Р), и, далее, мы
140 гл. iv. квантовые условия можем ожидать, что существует предел ,. \Pd) — \P) ,. D—\ , m hm -—'-——- = hm —j»—\P). Отсюда вытекает, что должен существовать предел lim (D — 1)/бд:. F4) б*-0 Пределом этого выражения будет линейный оператор, кото- который мы будем называть оператором сдвига в направлении х и обозначим его dx. Произвольный численный множитель е'у (где у — вещественное число), на который можно умножить оператор Р, должен стремиться к единице при 6х -»- 0. Этот множитель приводит таким образом к неопределенности в dx\ действительно, оператор dx может быть заменен на опе- оператор lim (Deiy — 1)/6л; = lim (D — 1 + iy)J&x = dx + iax, где ах есть предел величины у/8х. Таким образом, опера- оператор dx содержит произвольную чисто мнимую аддитивную постоянную. При малых дх имеем D = 1 + Шх. F5) Подставляя это выражение в формулу F2), получаем Пренебрегая величиной (охJ, приходим к формуле Таким образом, оператор dx является чисто мнимым. Под- Подставляя выражение F5) в формулу F3) и снова пренебрегая величинами (бл:J, получаем vd = A + Шх) оA- Шх) = v + 8x (dxv - vdx), F6) откуда следует формула lim (vd — v)/bx = dxv - vdx. F7) 6д:-0 Мы можем описывать всякую динамическую систему с помощью следующих динамических переменных: декартовы координаты х, у, г центра инерции системы, компоненты
§ 26. УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ '41 p.v. Ру, Рг полного импульса системы, которые являются переменными канонически сопряженными х, у, г, и другие динамические переменные, необходимые для описания внут- внутренних степеней свободы системы. Если мы предположим, что прибор, предназначенный для измерения координаты х, смещен вдоль оси х на расстояние 8х, то он будет измерять величину х — б#, следовательно, ха — х — дх. Подставляя в формулу F6) х вместо у, получаем dxx-xdx = —l. F8) Мы получили квантовое условие, связывающее dx и х. С помощью таких же рассуждений мы находим, что пере- переменные у, z, рх, ру, рг и внутренние динамические перемен- переменные, которые не меняются при сдвиге, должны коммутиро- коммутировать с оператором dx. Сравнивая этот результат с форму- формулой (9), мы видим, что оператор i%dx удовлетворяет тем же самым квантовым условиям, что и оператор импульса рх. Их разность рх — ifidx коммутирует со всеми динамическими переменными и, следовательно, должна быть числом. Это число обязательно должно быть вещественным, так как операторы рх и illdx — вещественны, и оно может быть об- обращено в нуль путем соответствующего выбора произволь- произвольного чисто-мнимого числа, которое может быть добавлено к оператору dx. Таким образом, мы получаем результат px = ihdx, F9) т. е. компонента по оси х от полного импульса системы равна оператору сдвига dx, умноженному на Ш. Это — основной результат, позволяющий придать но- новый смысл операторам сдвига. Аналогичные результаты полу- получаются, конечно, и для операторов сдвига dy, d2 вдоль осей у, г. Квантовые условия, гласящие, что рх, ру и рг комму- коммутируют между собой, связаны, как это теперь видно, с тем фактом, что сдвиги в различных направлениях являются коммутирующими операциями. § 26. Унитарные преобразования Пусть U — какой-то линейный оператор, для которого существует обратный оператор U'1. Рассмотрим уравнение GJ)
142 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ где а — произвольный линейный оператор. Это уравнение можно рассматривать как правило, по которому любой ли- линейный оператор а преобразуется в соответствующий линей- линейный оператор а*. С этой точки зрения уравнение G0) имеет довольно любопытные свойства. Прежде всего следует отметить, что каждый оператор а* имеет те же самые соб- собственные значения, что и соответствующий оператор а. Действительно, если а' — собственное значение оператора а и |а') — соответствующий собственный кет-вектор, то а|а') =а' |а'), а отсюда следует a*U | а') = UaU-W | a') = Ua | а'> = a'U \ а'). Таким образом, кет U \ а') является собственным кет- вектором оператора а* с тем же самым собственным зна- значением. Точно так же можно показать, что любое собствен- собственное значение оператора а* будет также собственным зна- значением ос. Далее, если ввести различные операторы а, связанные алгебраическими уравнениями, и преобразо- преобразовать их всех по формуле G0), то соответствующие операто- операторы а* будут удовлетворять тем же алгебраическим уравне- уравнениям. Этот результат следует из того факта, что основные алгебраические действия — сложение и умножение — оста- остаются инвариантными при преобразовании G0), как видно из следующих уравнений: («! +сс2)* = U (cq + сц) U-1 = Ua^ + UaJU-1 =cc? Посмотрим теперь, какое условие будет наложено на оператор U, если потребовать, чтобы всякий вещественный оператор а переходил в вещественный же оператор а*. Уравнение G0) можно записать в виде a*U = Va. G1) Заменяя правую и левую части уравнения (8) на комплексно- сопряженные и используя формулу E) § 8, получаем, считая, что а и a * вещественны, Па*=аП. G2)
§ 26. УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 143 Из уравнений G1) и G2) получаем соответственно Ua*U = UUa, Ua*U = aUU. Отсюда имеем UUa = aUU. Итак, оператор UU коммутирует с любым вещественным ли- линейным оператором, а следовательно, и с любым линейным оператором вообще, так как любой оператор может быть представлен в виде суммы некоторого вещественного опера- оператора и другого вещественного оператора, помноженного на i. Отсюда следует, что оператор LJLJ является числом. Оно, очевидно, является вещественным, так как комплекс- комплексно-сопряженная величина, согласно формуле E) § 8, равна тому же числу. Кроме того, это число является положитель- положительным, поскольку число (Р | VU | Р), где \ Р) — произ- произвольный кет, положительно, так же как и число (Р \ Р). Мы можем положить его равным единице, не ограничивая при этом общности преобразования G0). Тогда имеем UU=l. G3) Уравнение G3) можно записать в любом из следующих видов: U = U-1, U = U-\ (/-W-1 = l. G4) Матрица или линейный оператор U, удовлетворяющие условиям G3), G4), называются унитарной матрицей и унитарным оператором, а само преобразование G0) — унитарным преобразованием. Унитарное преобразование переводит вещественные линейные операторы в веществен- вещественные же и оставляет инвариантными любые алгебраические соотношения между линейными операторами. Его можно считать применимым также к кет-векторам и бра-векторам, а именно, П (Р\и-1. G5) Из этих формул следует, что унитарное преобразование оставл ет инвариантным любое алгебраическое соотноше- соотношение между линейными операторами, кет-векторами и бра- векторами. Оно преобразует собственные векторы операто- операторов а в собственные векторы операторов а*. Отсюда легко получить, что оно преобразует наблюдаемую в наблю-
144 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ даемую и оставляет инвариантным любое функциональное соотношение между наблюдаемыми, основанное на общем определении функции, которое дано в § 11. Преобразование, обратное унитарному, является также унитарным, поскольку, согласно формуле G4), оператор 11~1 будет унитарным, если унитарен оператор U. Далее, если последовательно произвести два унитарных преобра- преобразования, то в результате мы получим третье унитарное пре- преобразование. Это можно проверить следующим образом. Пусть одно из унитарных преобразований определяется фор- формулой G0), а второе — формулой Тогда связь между а* и а имеет вид а+ = VUaU-W-1 = (VU) a (VU)-1 G6) согласно формуле D2) §11. Далее, оператор VI) унитарен; действительно, VUVU = UVVU = UU = \, и, таким образом, преобразование G6) является унитарным. Рассмотренное в предыдущем параграфе преобразование от несдвинутых величин к сдвинутым является примером унитарного преобразования. Это видно из уравнений F2), F3), соответствующих уравнениям G3), G0), и уравнений E9), F1), соответствующих уравнениям G5). В классической механике можно совершить преобразо- преобразование от канонических координат и импульсов qr, рг (г = = 1, .... п) к новой совокупности переменных q*, р* (г = = 1, ..., я), для которых скобки Пуассона (СП) имеют те же значения, так что уравнения (8) § 21 остаются справед- справедливыми при замене q и р на q* и р*. Все динамические пе- переменные можно выразить через переменные q*, p*. Тогда переменные q* и р* можно назвать также каноническими, а само преобразование — касательным преобразованием. Легко убедиться, что значение скобок Пуассона для двух динамических переменных и я и, вычисленное по формуле A) § 21, не изменится, если заменить в этой формуле q и р на q* и р*, так что это значение инвариантно относительно касательного преобразования. Это приводит к тому, что в сбитой динамической теории новые канонические коорди- координаты q * и импульсы р* во многих отношениях равноправны
§ 26. УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ '45 со старыми переменными q и р, несмотря на то, что новые координаты q* могут и не быть обобщенными координатами Лагранжа, а могут зависеть как от координат, так и от скоростей. Можно показать, что для квантовой динамической си- системы, имеющей классический аналог, унитарные преобра- преобразования квантовой теории являются более общими, чем касательные, так как первые можно применять к таким кван- квантовым системам, которые не имеют аналога в классической теории; аналогия между унитарными и касательными преоб- преобразованиями имеет место для тех систем, которые могут быть описаны с помощью канонических координат и импуль- импульсов *). Чтобы установить эту аналогию, заметим, что унитарное преобразование, примененное к квантовым переменным qr, pr, дает новые переменные </*, p*, для которых СП имеют те же значения, поскольку СП эквивалентны алгебраи- алгебраическим выражениям (9) § 21, а алгебраические выражения остаются инвариантными при унитарном преобразовании. И наоборот, любые вещественные переменные ф , p'f , удов- удовлетворяющие СП для канонических координат и импуль- импульсов, связаны с qr, pr унитарным преобразованием, как это можно видеть из следующих аргументов. Используем представление Шредингера и запишем для краткости базисный кет \q[ ... q'a) в виде ; q''). Поскольку мы предполагаем, что q% , р? удовлетворяют СП для канони- канонических координат и импульсов, то мы можем построить относящееся к ним шредингеровское представление, в ко- котором ф диагональны, а каждый импульс р* равен — ihd/дф. Базисные кет-векторы в этом втором шрединге- ровском представлении будут \ q'V ... q%')\ мы запишем их для краткости в виде j q* '). Введем теперь линейный опера- оператор U, определяемый формулой (q*'\U\q')=8(q*'-q'), G7) где б (q *' — q') есть сокращенное обозначение для б (q*' -<f) = b (qV - q[) 6 (qV -<?,)... 6 (qV - q'n). G8) *) В нижеследующем рассуждении сформулированная выше связь между касательными преобразованиями в классической механике и унитарными преобразованиями в квантовой механике фактически не рассматривается. Об этой связи см. далее § 32, а также приложение. (Прим. В, А. Фока.)
146 ГЛ. IV. КВАНТОВЫЕ УСЛОВИЯ Формула, сопряженная G7), имеет вид (q' | U | q*) = б (q*' — </'). Отсюда получаем *) так что UU = 1. Таким образом, U есть унитарный опера- оператор. Далее мы имеем (q*'\Uqr\q')=6(q*'-q')q'r. Правые части этих равенств равны между собой согласно свойству A1) § 15 дельта-функции, так что или q* = UqU-1. Аналогично, согласно D5) и D6), (q*1 \p*l/\q') =- ih^^q*' - q'), Правые части этих уравнений, очевидно, равны, и следо- следовательно, или Таким образом, условия унитарности преобразования под- подтверждены . Мы получим бесконечно малое унитарное преобразова- преобразование, считая, что оператор U в формуле G0) отличается беско- бесконечно мало от единицы. Пусть U=l+ i&F, *) Мы обозначаем однократным интегралом и дифференциалом dq*' интегрирование по всем переменным q'f, q?', .,,, q*'. Это сокращен- сокращенное обозначение будет использоваться и далее,
8 26. УНИТАРНЫЕ ПРЕОБРАЗОВАНИЯ 147 где г — бесконечно малая величина, квадратом которой мож- можно пренебречь. Тогда ?/-1=1- iaF. Из условия унитарности G3) или G4) следует, что оператор F должен быть вещественным. Тогда уравнение преобразо- преобразования G0) принимает вид a* = (\+ieF)a(l-ieF), откуда имеем a*-a = iE(Fa-aF). G9) Используя СП, это равенство можно записать в виде а* -а = ей [a, F]. (80) Если а есть каноническая координата или импульс, то формально это п[ еобразование аналогично классическому бесконечно малому касательному преобразованию.
ГЛАВА V УРАВНЕНИЯ ДВИЖЕНИЯ § 27. Шредингеровская форма уравнений движения Начиная с § 5 и до сих пор все наши рассуждения отно- относились только к одному моменту времени. Эти рассуждения привели нас к построению общей схемы соотношений между состояниями и динамическими переменными динамической системы для одного момента времени. Чтобы получить пол- полную динамическую теорию, мы должны рассмотреть также связь между различными моментами времени. Когда произ- производится измерение над динамической системой, то ее состояние меняется непредсказуемым образом, однако в пе- период между измерениями причинность имеет место в кван- квантовой механике так же, как и в классической, и система подчиняется уравнениям движения, которые позволяют по состоянию в один момент времени однозначно определить состояние в последующие моменты времени. К изучению этих уравнений движения мы и перейдем теперь. Они оста- остаются справедливыми до тех пор, пока в результате измере- измерения или аналогичного процесса не произойдет возмущения системы *). Общая форма уравнений движения может быть получена из принципа суперпозиции, рассмотренного в гл. III. Рассмотрим некоторое частное состояние движения за время, в течение которого система не испытывает возмуще- возмущения извне. Состояние в момент t будет характеризоваться некоторым кет-вектором, зависящим от t, который мы обозна- обозначим через j t). Если мы будем иметь дело с несколькими та- такими состояниями движения, то мы будем различать их, *) Процессом такого рода является приготовление состояния. Часто такое приготовление состоит в измерении какой-либо наблюдае- наблюдаемой данной физической системы и выделении тех случаев, когда резуль- результат измерения совпадает с некоторым наперед заданным числом.
At0) At). 0) § 27, ШРЕДИНГЕРОВСКАЯ ФОРМА УРАВНЕНИЙ ДВИЖЕНИЯ '49 вводя дополнительные значки, например А, и будем обо- обозначать кет, характеризующий это состояние, \At). Тре- Требование, чтобы состояние в один момент времени определяло состояние в другой момент времени, означает, что кет A определяет с точностью до численного множителя кет ) Принцип суперпозиции справедлив для этих состояний дви- движения в течение всего времени, пока система не испыты- испытывает возмущения. Он гласит, что если в момент t0 имеет место супер позиционная связь между некоторыми состояния- состояниями, которая приводит к линейному уравнению между соот- соответствующими кет-векторами, например к уравнению \Rto)^Cl\Ato)+c2\Bto), то эта же связь должна иметь место между состояниями движения в течение всего времени, пока система не испыты- испытывает возмущений. Поэтому то же самое линейное соотноше- соотношение должно быть справедливо для кет-векторов, характери- характеризующих эти состояния в любой момент t (из промежутка времени, в течение которого система не испытывает возму- возмущения), т. е. в данном случае должно выполняться уравне- уравнение если только выбрать должным образом произвольные чис- численные множители при этих векторах. Отсюда следует, что кет-векторы | Pt) зависят линейным образом от кет-векто- кет-векторов | Pt0) и каждый кет | Pt) является результатом действия некоторого линейного оператора на кет j Pt0). В наших обозначениях получаем \Pt)=T\Pt0), A) где Т — линейный оператор, не зависящий от Р и зависящий только от t (и от ^0). Предположим теперь, что все [ Pt) имеют ту же длину, что и j Pt0). He всегда возможно выбрать произвольные численные множители, на которые можно умножать векторы Pt) так, чтобы это предположение выполнялось. Таким об- образом, это новое предположение является физическим, а не является просто вопросом обозначений. Оно представляет собой некоторое уточнение принципа суперпозиции. Тогда в векторе | Pt) остается произвольным только фазовый мно- множитель, который не должен зависеть от ] Pt) для того, чтобы
150 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ сохранялась линейная зависимость j Pt) от | Pt0). Из того условия, что длина вектора с1 \ Pt) + с2 | Qt) должна быть равна длине вектора сг \ Pt0) + с2 | Qt0) при любых значениях комплексных чисел с2 и с2, мы получаем формулу (Qt\Pt) = (Qto\Pto). B) Связь между кет-векторами | Pt) и | Pt0) формально аналогична связи между сдвинутым и несдвинутым векто- векторами, которую мы имели в § 25, с той лишь разницей, что здесь идет речь о сдвиге во времени вместо рассмотренного в § 25 пространственного сдвига. Уравнения A) и B) иг- играют в данном случае роль уравнений E9) и F0) из § 25. Далее можно повторить рассуждения § 25 и доказать, что оператор Т определен с точностью до произвольного числен- численного множителя и удовлетворяет условию ТТ = 1, C) аналогичному условию F2) § 25. Таким образом, оператор Т унитарен. Перейдем к бесконечно малому сдвигу, устре- устремляя t к /0, и предположим, что в соответствии с условием физической непрерывности существует предел Этот предел есть просто производная от | Pt0) no t0. Согласно уравнению A) он равен — = (ИтТГтН \Р*о>- D) Получающийся в пределе линейный оператор является чисто- мнимым, так же как это было в формуле F4), и, кроме того, он определен лишь с точностью до чисто-мнимой произволь- произвольной аддитивной постоянной. Если обозначить этот опера- оператор, умноженный на ih, через Н, или лучше через Н (t0) (он может зависеть от t0), то уравнение D) примет для про- произвольных t вид Уравнение E) дает общий закон изменения со временем кет-вектора, характеризующего состояние системы. Это — шредингеровская форма уравнений движения. В уравнение
$ 27. ШРЕДИНГЕРОВСКАЯ ФОРМА УРАВНЕНИИ ДВИЖЕНИЯ ^ входит только один оператор Н (/), котрый должен быть характерным для рассматриваемой динамической системы. Мы предположим, что Н (t) есть полная энергия системы. Для такого предположения есть два основания: а) аналогия с классической механикой, которая будет развита в следую- следующем параграфе; б) оператор Н (t) определен нами как умно- умноженный на Л оператор сдвига во времени, подобный опера- операторам сдвига в направлениях х, у и г из § 25, поэтом) в соответствии с формулой F9) § 25 следует ожидать, что оператор Н (/) равен полной энергии, поскольку из теории относительности следует, что отношение между энергией и временем аналогично отношению между импульсом и коор- координатой. Мы будем считать на основании физических соображе- соображений, что полная энергия системы всегда является наблюдае- наблюдаемой. Для изолированной системы она постоянна, и ее можно обозначать просто Н. В тех случаях, когда энергия не яв- является постоянной, мы будем все же обозначать ее символом Я, подразумевая зависимость от времени. Если энергия зависит от t, то это значит, что на системы действуют внеш- внешние силы. Такое внешнее воздействие следует отличать от возмущения, вносимого измерением, поскольку первое совместимо с причинным описанием системы и с уравнениями движения, а второе — нет. Связь между операторами Т (в уравнении A)) и Н (t) можно получить, подставляя в уравнение E) вместо | Pt) его значение из уравнения A). Получаем Поскольку | Pt0) — произвольный кет, то отсюда следует уравнение ih-^- = H(t)T. F) Уравнение E) является весьма важным для практиче- практических задач, причем оно обычно используется в связи с опре- определенным представлением. Если ввести представление, в ко- котором диагональны коммутирующие наблюдаемые \, об- образующие полный набор, писать г|з (It) вместо (?' | Pt) и перейти к обозначениям § 20, использующим стандартный кет, то мы получим
152 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ Уравнение E) примет тогда вид Уравнение G) обычно называется волновым уравнением Шредингера, а его решение волновой функцией, зависящей от времени. Каждое решение характеризует состояние движения системы, а квадрат его модуля дает вероятность того, что переменные ? имеют определенные значения в дан- данный момент времени t. Для систем, которые можно описы- описывать с помощью канонических координат и импульсов, мы можем использовать шредингеровское представление и тогда оператор Н будет дифференциальным оператором согласно формуле D2) § 22. § 28. Гейзенберговская форма уравнений движения В предыдущем naparpaqe мы получили наглядное изоб- изображение состояний движения системы в отсутствие возму- возмущений, характеризуя каждое такое состояние переменным ве- вектором состояния, так что состояние системы в определен- определенный момент времени характеризуется значением вектора в тот же момент. Такое изображение движения системы мы будем называть шредингеровской картиной. Произведем такое унитарное преобразование наших векторов, которое переводит каждый кет | а) в \а*) = Т~Ча). (8) Это преобразование имеет тот же вид, что и преобразование G5) § 26, но только оно зависит от времени /, поскольку от времени зависит оператор Т. Таким образом, преобразо- преобразование (8) можно рассматривать как непрерывное движение (вращение и однородную деформацию) всего пространства векторов состояния. Кет, который был первоначально постоянным, становится переменным, его изменение опре- определяется формулой (8), в которой ] а) не зависит от времени. С другой стороны, если взять кет, который первоначально изменялся, характеризуя изменения состояния со време- временем в отсутствие возмущений, т. е. изменялся согласно урав- уравнению A), то этот кет после преобразования будет постоян- постоянным, потому что после подстановки в формулу (8) вектора
§ 28. ГЕЙЗЕНБЕРГОВСКАЯ ФОРМА УРАВНЕНИИ ДВИЖЕНИЯ 153 Pt) вместо | а), мы получаем вектор \а*), который не зависит от t. Таким образом, преобразование переводит за- зависящие от времени кет-векторы, которые характеризуют состояние движения системы в отсутствие возмущения, в неподвижные кет-векторы. Этому унитарному преобразованию можно подвергнуть также и бра-векторы и линейные операторы для того, чтобы уравнения между различными величинами остались инвари- инвариантны. Преобразование бра-векторов определяется форму- формулой, сопряженной формуле (8), а преобразование операто- операторов — формулой G0) § 26, в которую надо подставить 71 вместо U, после чего получаем а* = T-W. (9) Линейный оператор, фиксированный первоначально, стано- становится после преобразования, вообще говоря, переменным, за- зависящим от времени. Но динамической переменной соответ- соответствовал до преобразования оператор, который первоначаль- первоначально вообще не содержал времени; поэтому, после преобразо- преобразования, этой переменной будет соответствовать зависящий от времени линейный оператор. Преобразование приводит, таким образом, к новому изображению движения, в котором состояния характеризуются неподвижными векторами, а ди- динамические переменные — зависящими от времени линей- линейными операторами. Будем называть это гейзенберговской картиной движения. Физические условия, в которых находится система в не- некоторый момент времени, характеризуются отношением меж- между динамическими переменными и состоянием системы; изменение физических условий со временем можно приписать либо изменению состояния, считая динамические перемен- переменные постоянными, что приводит к шредингеровской картине, либо изменению динамических переменных, считая постоян- постоянным состояние — тогда приходим к гейзенберговской кар- картине движения. В гейзенберговской картине динамические переменные подчиняются уравнениям движения. Рассмотрим динами- динамическую переменную, соответствующую в шредингеровской картине постоянному линейному оператору v. В гейзен- гейзенберговской картине ей соответствует переменный линейный оператор, который мы обозначим через vt вместо v * для того,
154 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ чтобы подчеркнуть его зависимость от t. Этот оператор име- имеет вид Vt^T-W. A0) Отсюда имеем Tvt = v Т. Дифференцируя это уравнение по t, получаем dt "t^1 dt v df Используя уравнение F), приходим к формулам dt lHTvt=vtHt-Htvt, A1) где Ht^T-WT. A2) Уравнение A1) можно записать иначе, используя определе- определение СП. Тогда ~J(~==lvt' "t\- A3) Уравнения A1) или A3) показывают, каким образом изменяется со временем динамическая переменная в гейзен- гейзенберговской картине. Они представляют собой гейзенбергов- гейзенберговскую форму уравнений движения. Эти уравнения движения будут определены, если задать линейный оператор Ht, по- получающийся путем преобразования из оператора Н, кото- который мы имели в шредингеровскои форме уравнений движе- движения. Таким образом, оператор Ht соответствует энергии в гейзенберговской картине. Мы будем называть изменяю- изменяющиеся со временем динамические переменные в гейзенбер- гейзенберговской картине — гейзенберговскими динамическими пере- переменными, чтобы отличить их от постоянных динамических переменных в шредингеровскои картине, которые мы будем называть шредингеровскилш динамическими переменными. Каждая гейзенберговская динамическая переменная свя- связана с соответствующей шредингеровскои переменной урав- уравнением A0). Так как это уравнение представляет унитарное преобразование, то все алгебраические и функциональные соотношения для обоих видов динамических переменных одинаковы. При t = t0 мы имеем Т — \, так что vt(l = v,
4 28. ГЕЙЗЕНБЕРГОВСКАЯ ФОРМА УРАВНЕНИЙ ДВИЖЕНИЯ 155 и поэтому любая гейзенберговская динамическая перемен- переменная равна при / = tn соответствующей шредингеровской переменной. Уравнение A3) можно сравнить с соответствующими результатами классической механики, где также имеются динамические переменные, изменяющиеся со временем. Уравнения движения классической механики могут быть записаны в гамильтоновой форме J?l ML J^EjL _J^L dt ~ дрг' dt ~ dqr' где q и р — канонические координаты и импульсы, а Я — энергия, выраженная как функция от q и р, а также, воз- возможно, и от времени I. Энергия, выраженная таким образом, называется функцией Гамильтона или гамильтонианом. Для произвольной функции v от координат q и импульсов р, не содержащей явно времени, мы получаем из уравнений A4) соотношение dv _ VI ( dv dqr . dv dpr ~dJ ~~ Zi \~dq7 ~dT + дрг ~~Ш~ L ' согласно классическому определению СП в уравнении A) § 21. Это уравнение имеет тот же вид, что и уравнение A3) в квантовой теории. Мы получили таким образом аналогию между классическими уравнениями движения в форме Гамильтона и квантовыми уравнениями движения в форме Гейзенберга. Эта аналогия подтверждает наше предполо- предположение, что линейный оператор Н, введенный в предыдущем параграфе, является в квантовой механике оператором энергии системы. В классической механике динамическая система опреде- определена математически, если задана ее функция Гамильтона, т. е. если дана энергия как функция канонических коорди- координат и импульсов. Этого достаточно, чтобы получить уравне- уравнения движения. В квантовой механике система определена математически, если энергия выражена через динамиче- динамические переменные, перестановочные соотношения между которыми нам известны, — этого также достаточно, чтобы получить уравнения движения как в форме Шредингера,
156 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ так и в форме Гейзенберга. При этом нам нужно, чтобы либо оператор Н был выражен через шредингеровские дина- динамические переменные, либо же чтобы оператор Ht был вы- выражен через гейзенберговские переменные. Функциональная зависимость будет, очевидно, в обоих случаях одинакова. Мы будем называть энергию, выраженную таким образом, оператором Гамильтона или гамильтонианом для того, чтобы сохранить аналогию с классической теорией. Система в квантовой механике всегда имеет оператор Гамильтона независимо от того, обладает ли система клас- классическим аналогом и может ли она быть описана с помощью канонических координат и импульсов или нет. Но если си- система обладает классическим аналогом, то ее связь с клас- классической механикой является особенно тесной, и обычно можно предполагать, что гамильтониан в классической и квантовой теории является одной и той же функцией кано- канонических координат и импульсов *). При этом могло бы возникнуть затруднение, если бы классический гамильто- гамильтониан содержал произведение множителей, квантовые анало- аналоги которых не коммутируют между собой, ибо тогда было бы неизвестно, в каком порядке расположить эти множители в квантовом гамильтониане. Однако для большинства про- простейших динамических систем, изучение которых важно в атомной физике, такое затруднение не возникает. Вслед- Вследствие этого мы можем в большинстве случаев употреблять для описания динамических систем в квантовой теории тот же язык, что и в классической теории (например, можем говорить о частицах с определенными массами, движущих- движущихся в заданном поле сил), и если нам дана система в клас- классической механике, то обычно можно придать смысл понятию «той же самой» системы в квантовой механике. Уравнение A3) справедливо для любой переменной vt, являющейся функцией гейзенберговских динамических пере- переменных и не содержащей явно времени, т. е. для такой пе- переменной, которая в шредингеровской картине является постоянным линейным оператором. Из этого уравнения вид- видно, что такая функция vt является постоянной, если она ком- коммутирует с Ht или если v коммутирует с Н. Тогда мы имеем vt = vto = v, *) Это предположение, как оказалось, является справедливым только для канонических координат и импульсов в декартовой системе координат, В более общих криволинейных координатах оно неверно.
§ 28. ГЕЙЗЕНБЕРГОВСКАЯ ФОРМА УРАВНЕНИЙ ДВИЖЕНИЯ 157 и мы будем тогда называть vt или v интегралом движения. Необходимо, чтобы оператор v коммутировал с операто- оператором Н в любой момент времени; обычно это возможно, только если оператор Н сам постоянен и не зависит от вре- времени. В этом случае мы можем подставить в формулу A3) оператор Н вместо оператора у; тогда мы получим, что опе- оператор Ht является постоянным, и сам оператор Н является интегралом движения. Таким образом, если оператор Гамиль- Гамильтона постоянен в шредингеровской картине, то он постоя- постоянен и в гейзенберговской картине. Для изолированной системы, на которую не действуют внешние силы, всегда существуют некоторые интегралы дви- движения.Одним из таких интегралов является полная энергия, т. е. оператор Гамильтона. Другие интегралы даются тео- теорией сдвигов, рассмотренной в § 25. Физически очевидно, что полная энергия не должна меняться, если все динами- динамические переменные сдвинуть определенным образом; отсюда следует, что уравнение F3) § 25 должно выполняться, если в него подставить vd = v — Н. Таким образом, оператор D коммутирует с Я и является интегралом движения. Пере- Переходя к бесконечно малым сдвигам, мы видим, что операторы сдвига dx, dy и dz являются интегралами движения и, сле- следовательно, согласно формуле F9) § 25, интегралом движе- движения является полный импульс системы. Далее, полная энер- энергия не должна меняться, если подвергнуть все динамические переменные некоторому вращению. Как будет показано в § 35, это приводит к тому, что полный момент количества движения является интегралом движения. Для изолиро- изолированной системы законы сохранения энергии, импульса и момента количества движения справедливы в гейзенбергов- гейзенберговской картине квантовой механики так же, как и в класси- классической механике. Таким образом, уравнения движения квантовой механики даны в двух формах. Одна из них — шредингеровская форма •— более удобна для практических задач, так как она приводит к более простым уравнениям. Неизвестными в шредингеровском волновом уравнении являются числа, которые образуют представитель кет-вектора, в то время как уравнение движения Гейзенберга для динамической пере- переменной, написанное в определенном представлении, содер- содержит в качестве неизвестных числа, образующие представи- представитель динамической переменной. Эти числа образуют уже
158 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ двумерную схему, и поэтому их труднее вычислить, чем шредингеровские неизвестные. Гейзенберговская форма уравнений движения важна потому, что она устанавливает непосредственную аналогию с классической механикой, позволяя видеть, каким образом переносятся в квантовую теорию различные особенности классической теории, напри- например такие, как рассмотренные выше законы сохранения. § 29. Стационарные состояния Здесь мы будем рассматривать систему, энергия кото- которой постоянна. Для этого случая справедливы некоторые особенно простые соотношения. Уравнение F) может быть тогда проинтегрировано *), и решение его имеет вид Т1 _ p-lH(t—ta)in при этом использовано начальное условие, что Т = 1 при t = tQ. Подставляя этот результат в формулу A), получаем вектор \Pt)M«t*\t0), A6) который является решением шредингеровского уравнения движения E). Подставляя это решение в формулу A0), получаем Vt==.eiH{t—i0)inve iH(t-to)/n_ Это есть решение гейзенберговского уравнения движения A1), причем здесь Н, = Н. Таким образом, мы имеем реше- решения уравнений движения в простом виде. Однако эти реше- решения не имеют существенного практического значения вслед- вследствие трудности вычислений с оператором e~iH^~to)/n, за исключением тех случаев, когда оператор Н имеет особенно простой вид. Для решения практических задач приходится вернуться к решению волнового уравнения Шредингера. Рассмотрим такое состояние движения системы, что в момент t0 оно является собственным состоянием энергии. Кет ! Pt0), характеризующий систему в этот момент, дол- должен тогда быть собственным кет-вектором оператора Н. *) Интегрирование можно производить так, как будто Н является обычной алгебраической переменной, а не оператором, потому что в ходе вычислений не появляется величин, которые не коммутируют с Я,
§ 29. СТАЦИОНАРНЫЕ СОСТОЯНИЯ 159 Если обозначить собственное значение Н для этого вектора через #', то из уравнения A6) получаем откуда видно, что кет | Pt) отличается от | Pt0) только фазовым множителем. Таким образом, состояние все время остается собственным состоянием энергии; более того, оно вообще не меняется со временем, так как не меняется со временем направление кет-вектора | Pt). Такие состояния называются стационарными состояниями. Вероятность ка- какого-либо результата измерения в этом случае не зависит от времени наблюдения. Из нашего предположения, что энергия является наблюдаемой, следует, что совокупность стацио- стационарных состояний является полной и что любое состояние может быть представлено в виде линейной комбинации стационарных состояний. Зависящая от времени волновая функция а|з (%{), представ- представляющая состояние с энергией Н', меняется со временем согласно следующему закону: W) = *>(?)*-'"'"», A8) и волновое уравнение Шредингера G) упрощается, прини- принимая вид Н'%)=Н%). A9) Это уравнение означает просто, что состояние, характери- характеризуемое функцией г|з0, является собственным состоянием энер- энергии Н. Мы назовем функцию %, удовлетворяющую уравне- уравнению A9), собственной функцией Н с собственным значе- значением Н'. В гейзенберговской картине стационарные состояния характеризуются постоянными собственными векторами энергии. Мы можем построить представление, в котором все базисные векторы будут собственными векторами энергии и, таким образом, характеризуют стационарные состояния в гейзенберговской картине Назовем такое представление представлением Гейзенберга. Первоначальная форма кван- квантовой механики, открытая Гейзенбергом в 1925 г., была основана на представлении такого рода. Энергия в этом представлении диагональна Любая другая диагональная ди- динамическая переменная будет тогда коммутировать с энер- энергией и будет, следовательно, интегралом движения. Задача о построении представления Гейзенберга сводится, таким
•60 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ образом, к задаче о нахождении полного набора коммути- коммутирующих наблюдаемых, каждая из которых является инте- интегралом движения и, следовательно, диагональна в этом пред- представлении. Согласно теореме 2 § 19 энергия должна быть функцией этих наблюдаемых. Иногда оказывается удобным принять за одну из таких наблюдаемых саму энергию. Пусть а означает полный набор коммутирующих наблю- наблюдаемых в представлении Гейзенберга, тогда базисные бра- и кет-векторы можно записать в виде (а' [, | а"). Энер- Энергия является функцией этих наблюдаемых, т. е. Н = Н (а). Из формулы A7) получаем <а' | vt | а") = <а' | еш « ~ '°y*ve-'H «-<°)'п \ а") = ==е«(Я'-я")(^-^)/л</а'|„|а"I B0) где Н' = Н (а') и Н" = Н (а"). Множитель (a' \v\a") в правой части формулы не зависит от времени, поскольку он является элементом матрицы — представителя постоян- постоянного линейного оператора v. Из формулы B0) видно, как ме- меняется со временем гейзенберговский матричный элемент любой гейзенберговской динамической переменной; именно такая зависимость от времени приводит, как легко убедиться, к тому, что оператор vt удовлетворяет уравнению дви- движения A1). Зависимость от времени в формуле B0) является чисто периодической с частотой \Н' -Н"\12лП = \Н' -H"\/h, B1) зависящей только от разности энергий тех двух стационар- стационарных состояний, к которым относится данный матричный элемент. Этот результат тесно связан с комбинационным принципом в спектроскопии и с правилом частот Бора, согласно которому величина B1) есть частота электромаг- электромагнитного излучения, которое испускается или поглощается, когда система совершает переход между состояниями а' и а" под влиянием излучения; собственные значения оператора Н являются при этом боровскими уровнями энергии. Эти вопросы будут рассматриваться в § 45. § 30. Свободная частица Наиболее фундаментальным и простым приложением квантовой механики является ее приложение к системе, со- состоящей только из одной свободной частицы, т. е. из частицы,
§ 30. СВОБОДНАЯ ЧАСТИЦА 161 на которую не действуют силы. Для ее рассмотрения мы воспользуемся в качестве динамических переменных тремя декартовыми координатами х, у, г и сопряженными с ними импульсами рх, ру, pz. Гамильтонианом будет в этом случае кинетическая энергия частицы, т. е., согласно механике Ньютона, ^ B2) где т — масса частицы. Эта формула справедлива, если только скорость частицы мала по сравнению со скоростью света с. Для быстро движущихся частиц, с которыми часто приходится иметь дело в атомной теории, формулу B2) следует заменить релятивистской формулой Н = с(т2с2 + р1 + р1 + р1У*. B3) Для малых значений рх, ру и рг формула B3) переходит в B2) с точностью до постоянной тс2, которая соответствует энергии покоя частицы в теории относительности и не вли- влияет на уравнения движения. Формулы B2) и B3) можно непосредственно перенести в квантовую теорию. Квадратный корень в формуле B3) следует тогда понимать как положи- положительный квадратный корень, определение которого дано в конце §11. Постоянная тс2, на которую отличается форму- формула B3) от B2) при малых значениях рх, ру и рг, по-прежнему не повлияет на физические следствия, так как гамильтониан в квантовой теории, согласно данному в § 27 определению, определен лишь с точностью до произвольной вещественной аддитивной постоянной. Мы рассмотрим здесь более точную формулу B3). Прежде всего решим уравнения движения Гейзенберга. Согласно квантовым условиям (9) § 21, рх коммутирует с ру и рг, отсюда, согласно теореме 1 § 19, обобщенной на случай нескольких коммутирующих наблюдаемых, рх коммутирует с любой функцией рх, ру и pz, а следовательно, и с Я. Это означает, что рх является интегралом движения. Анало- Аналогично ри и рг являются интегралами движения. Эти резуль- результаты совпадают с соответствующими результатами класси- классической теории. Далее, уравнение движения для координаты, например для xt, имеет, согласно формуле A1), вид = ih —rf- = = х,с (mV + px + pi + p|)v. - с (m V + px + pi + p»)v. xt.
162 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ Правую часть этого уравнения можно вычислить с помощью формулы C1) § 22, поменяв в ней местами координаты и импульсы. Тогда эта формула примет вид qrf-fqr=i1ldfldpr, B4) где / — любая функция импульсов р. Она дает Точно так же Абсолютное значение скорости будет тогда v = Ш + yl + %У* = с2 (р\ + pl + р1У'ЧН. B6) Уравнения B5) и B6) имеют в точности тот же вид, что и в классической теории. Рассмотрим состояние, которое является собственным состоянием импульса с собственными значениями р'х, р'у, р'г. Это состояние будет также собственным состоянием га- гамильтониана с собственным значением Н' =с (т*с* + р'х2 + р'у + р?I'' B7) и, таким образом, является стационарным состоянием. Воз- Возможными значениями энергии Н' будут все числа от тс2 до оо так же, как и в классической теории. Волновая функ- функция г|з (xyz), характеризующая это состояние в любой мо- момент времени в представлении Шредингера, должна удовлет- удовлетворять уравнению р^ (xyz)) = px^ (xyz)) = - in Щ^), а также аналогичным уравнениям для ру и р2. Из этих уравнений видно, что t|; (xyz) имеет вид B8) -где а не зависит от х, у и г. Далее, из формулы A8) видно, что зависящая от времени волновая функция г|5 (xyzt) имеет вид где а0 не зависит от х, у, z и t.
§ 30. СВОБОДНАЯ ЧАСТИЦА 163 Функция B9) переменных х, у, г и t описывает плоскую волну в пространстве-времени. Из этого примера видна целесообразность терминов «волновая функция» и «волновое уравнение». Частота волны v равна v = H'fh, C0) длина волны К равна * = Л/ (Рх + Ру + PzT2 =h/P', C1) где Р' — длина вектора (р'х, р'у, р'г), направление движения определяется вектором (р'х, р'у, p'z), а фазовая скорость волны — величиной lv = H'/P' = c2/v', C2) где и' — скорость частицы, обладающей импульсом (р'х, р'у, рг), вычисленная по формуле B6). Уравнепия C0)—C2), как легко видеть, справедливы во всех лоренцевых систе- системах отсчета, поскольку правая часть формулы B9) является релятивистски инвариантной, причем р'х, р'у, р'г и Н' явля- являются компонентами четырехмерного вектора. Эти свойства релятивистской инвариантности привели де Бройля еще до открытия квантовой механики к постулату, что с движе- движением любой частицы связаны волны вида B9). Поэтому эти волны известны под названием волн де Бройля. В предельном случае, когда масса т стремится к нулю, классическая скорость v частицы становится равной с, и следовательно, согласно формуле C2), волновая скорость также становится равной с. Волна будет тогда подобна световой волне, связанной с фотоном, с той разницей, что в ней отсутствует указание на направление поляризации и что она содержит комплексную экспоненту вместо синуса и косинуса. Формулы C0) и C1) по-прежнему справедливы, и они связывают частоту световой волны с энергией, а длину волны — с импульсом фотона. Для состояния, которое характеризуется функцией B9), вероятность найти частицу, при измерении ее положения, в некотором малом объеме, не зависит от положения этого объема. Это является иллюстрацией принципа неопреде- неопределенности Гейзенберга: для состояния, в котором импульс точно задан, координата оказывается совершенно неопре- неопределенной. Такое состояние является, конечно, предельным случаем, который никогда не осуществляется. Состояния,
164 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ с которыми обычно приходится иметь дело, характеризу- характеризуются волновыми пакетами, которые, согласно рассужде- рассуждениям § 24, получаются в результате наложения ряда волн типа B9) со слегка отличающимися значениями параметров (р'х, р'у, p'z). Обычная, известная из гидродинамики формула для скорости такого волнового пакета, т. е. для группо- групповой скорости волн, имеет вид откуда, согласно формулам C0) и C1), получаем dH' d /on, n/2W« С^Р' I /O<\ ЧГ¦-c-jp-imV + P' )i' = — = v'. C4) Это и есть как раз скорость частицы. Волновой пакет дви- движется в том же направлении и с той же скоростью, что и частица в классической механике. § 31. Движение волнового пакета Только что полученный результат является частным слу- случаем общего принципа. Для любой динамической системы, обладающей классическим аналогом, состояние, для кото- которого приближенно справедливо классическое описание, ха- характеризуется в квантовой механике волновым пакетом, при- причем все координаты и импульсы имеют почти определенные значения с разбросом, ограниченным снизу принципом не- неопределенности Гейзенберга. Но изменение волнового пакета со временем определяется волновым уравнением Шредин- гера. Следовательно, для того чтобы классическое описание оставалось справедливым и с течением времени, волновой пакет должен оставаться волновым пакетом и должен дви- двигаться по законам классической механики. Убедимся, что зто действительно так. Рассмотрим динамическую систему, обладающую клас- классическим аналогом. Обозначим ее гамильтониан через Н (Чг, Рг) (г = 1, 2, ..., п). Соответствующая классическая динамическая система будет иметь гамильтониан Нс (qr, pr), который получится, если подставить обычные алгебраиче- алгебраические переменные вместо qr и рГ в функцию Н (<?,, pi) и устре- устремить постоянную % к нулю, если она содержится в Н (qr, pi). Классический гамильтониан является, конечно, веществен-
§ 31. ДВИЖЕНИЕ ВОЛНОВОГО ПАКЕТА 165 ной функцией своих переменных. Обычно он представляет квадратичную функцию импульсов рг, но это не всегда так: релятивистская теория свободной частицы является приме- примером того, когда он имеет другой вид. Предположим, что зависящая от времени волновая функция в представлении Шредингера имеет вид ф {(ft) = AeiSin, C5) где Л и S — вещественные функции переменных q и вре- времени t, которые не очень быстро изменяются при измене- изменении своих аргументов. Волновая функция имеет тогда вид волны, причем А и S определяют соответственно амплитуду и фазу. Волновое уравнение Шредингера G) принимает вид ih J- AeiSi-n) = H (qr, pr) Ae'S/*) или {ih ^ - A§}) = er iS<*H (qr, pr) Ae'V*). C6) Далее, e'iS/n есть, очевидно, унитарный линейный оператор, и его можно взять в качестве U в уравнении G0) § 26, что дает нам унитарное преобразование. Все координаты qr остаются при этом преобразовании неизменными; импульсы рг переходят в е~ isifipretsm = Pr _|_ dS/dqr согласно формуле C1) § 22, а Я принимает вид e-iS'nH(qn Pr)eis'n = H(qr, pr + dS/dqr), поскольку все алгебраические соотношения после преобра- преобразования сохраняются. Таким образом, уравнение C6) за- запишется в виде Щ{^)). C7) Допустим теперь, что постоянную h можно считать малой, и пренебрежем всеми членами в формуле C7), содержа- содержащими U. Это означает, в частности, что следует пренебречь входящими в Я в формуле C7) величинами рг, так как каждая величина рг эквивалентна оператору — i% d/dqr, который действует на функцию от координат q, находя-
166 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ щуюся справа от него. После такого пренебрежения полу- получаем ?Ч?) <38> Это — дифференциальное уравнение, которому должна удо- удовлетворять фазовая функция 5. Вид его определяется клас- классической функцией Гамильтона Нс, и оно известно в клас- классической механике под названием уравнения Гамильтона — Якоби. Оно допускает вещественные решения для S, откуда видно, что предположение о том, что волна имеет вид C5), не приводит к противоречиям. Чтобы получить уравнение для А, следует удержать в уравнении C7) члены, линейные относительно ti, и по- посмотреть, что дадут эти члены. Прямое вычисление этих членов для функции Н общего вида довольно затрудни- затруднительно; легче получить нужный нам результат, умножив предварительно обе части уравнения C7) на бра-вектор (Af, где / есть произвольная вещественная функция от q. Имеем тогда Комплексно-сопряженное уравнение имеет вид <Л/{- ih ™--А §-}> = (АН (д„ Pr+^jfA). Вычитая эти уравнения и сокращая на Ш, получаем 2<Л/^-) = (Л[/, H[qr, Рг + ^)]А). C9) Вычислим далее СП: Наше предположение, что постоянную Н можно считать малой, позволяет разложить функцию Н (qr, pr -f dS/dqr) в ряд по степеням р. Члены, не зависящие от р, не вносят никакого вклада в СП. Члены, линейно зависящие от р, вносят вклад в СП, который легко вычислить, используя классическую формулу A) § 21 (эта формула остается справедливой также и в квантовой теории, если и не зави-
§ 31. ДВИЖЕНИЕ ВОЛНОВОГО ПАКЕТА 167 сит от импульсов р, a v линейно зависит от р). Величина этого вклада равна у а/ г дн (gr, Pr) - j_ dqs L dps s лричем введенные обозначения имеют тот смысл, что в функ- функции [ ] от координат q и импульсов р следует подставить вместо каждого из рг величину dS/dqr\ таким образом, мы получаем функцию одних только координат. Дальнейшие члены разложения по р дают вклад в СП, который исче- исчезает, когда Я ->- 0. Итак, если в формуле C9) пренебречь членами, содержащими Я (что эквивалентно пренебрежению членами, содержащими Я2 в формуле C7)), то мы получаем df \dHc(qr,Pr) Далее, если a (q) и b (q) — любые две функции координат q, то по формуле F4) § 20 имеем = \a(q')dq'b(q') и, таким образом, будет если только a (q) и b (q) удовлетворяют должным гранич- граничным условиям (см. §§ 22 и 23). Отсюда следует, что фор- формулу D0) можно записать в виде /t ML\ = _/f V д { лг\днс(Чг, Рг)Л 4 dt ' ч Lidqs\ I dps \р = S Поскольку эта формула справедлива для произвольной ве- вещественной функции /, мы должны иметь <^2 _ у а \ dt Zidqs\ а \Л2\дНс(дг,Рг) dqs\ Al dPs r f Это и есть уравнение для амплитуды волновой функции. Для того чтобы понять его смысл, предположим, что име- имеется жидкость, движущаяся в пространстве переменных q,
168 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ причем плотность жидкости в каждой точке равна А2, а ско- скорость равна dqs = \дИс{дг, рг) dt [ Уравнение D2) как раз совпадет тогда с уравнением не- неразрывности для такой жидкости. Движение жидкости опре- определяется функцией S, удовлетворяющей уравнению C8), причем каждому решению этого уравнения соответствует одно возможное движение. Рассмотрим при заданном S решение уравнения D2), для которого плотность Л2 в определенный момент времени исчезает вне некоторой малой области. Мы можем предпо- предположить, что область движется вместе с жидкостью и ее ско- скорость в каждой точке определяется уравнением D3), и тогда из уравнения неразрывности D3) будет следовать, что плот- плотность будет всегда исчезать вне этой области. Область нельзя выбирать слишком малой — это следует из прибли- приближения, которое мы сделали, пренебрегая постоянной Н в формуле C9). Это приближение справедливо, если только выполняется условие hJLA<dsA dqr ^ dqr ' или иначе Это условие означает, что заметное относительное изменение амплитуды А может происходить лишь на таком интервале изменения координат q, на котором изменение функции S во много раз превосходит постоянную Н, т. е. в таком интервале, который включает в себя много длин волн вол- волновой функции C5). Наше решение является, таким обра- образом, волновым пакетом того типа, который обсуждался в § 24, причем оно остается пакетом в течение всего вре- времени. Итак, мы получили волновую функцию, характеризую- характеризующую состояние движения, для которого координаты и импульсы имеют приближенно определенные численные значения во все моменты времени. Такое состояние движе- движения в квантовой теории соответствует тем состояниям, с ко- которыми имеет дело классическая теория. Движение нашего волнового пакета определяется уравнениями C8) и D3).
§ 32. ПРИНЦИП ДЕЙСТВИЯ 169 Разумея под импульсами ps величины dS/dqs, получаем из этих уравнений dps _ d_ dS __ d2S . VI d^S dqu __ ~~dT ~ dllhu ~~ dtdqs + Li dqa dqs ЧГ ~~ - dqsnc\4r' dq J 4" Zi dqu dqs дРи ~ dqs ' D4) причем в последней строчке при частном дифференцирова- дифференцировании импульсы р и координаты q считаются независимыми переменными. Уравнения D3) и D4) являются как раз клас- классическими уравнениями движения в форме Гамильтона, и из них видно, что волновой пакет движется согласно законам классической механики. Таким образом, мы пока- показали, как можно вывести классические уравнения движения из квантовой механики, рассматривая их как предельный случай квантовых уравнений движения. Решая волновое уравнение более точно, можно показать, что точность, с которой координаты и импульсы имеют одновременно определенные численные значения, не может оставаться постоянно предельно высокой, допускаемой прин- принципом неопределенности Гейзенберга, т. е. уравнением E6) § 29. Если первоначально точность и была предельно высо- высокой, то затем она становится меньше и волновой пакет расплывается *). § 32. Принцип действия **) Из уравнения A0) видно, что гейзенберговские динами- динамические переменные vt в момент t связаны унитарным преоб- преобразованием с этими же переменными vt или и в момент t0. Гейзенберговские переменные в момент t + 8t связаны с пе- переменными в момент t бесконечно малым унитарным преоб- преобразованием, что следует из уравнений движения A1) или A3); из них получаются связывающие vu& и vt уравнения типа G9) или (80) § 26, в которых нужно подставить Ht вместо F и Ы/Ь. вместо е. Изменение со временем динамиче- *) См. Kennard, Z. f, Physik, 1927, Bd. 44, S, 344; Dar- Darwin— Proc. Roy. Soc, A, 1927. v. 117, p. 258. **) Читатель, не знакомый достаточно детально с аналитической динамикой, может пропустить этот параграф,
170 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ ских переменных Гейзенберга можно, таким образом, рас- рассматривать как непрерывно развертывающееся унитарное преобразование. В классической механике значения дина- динамических переменных в момент t + б/ связаны с их значе- значением в момент / бесконечно малым касательным преобра- преобразованием, и все движение системы можно также рассматри- рассматривать как непрерывно развертывающееся касательное пре- преобразование. Мы имеем здесь математическую основу ана- аналогии между классическими и квантовыми уравнениями движения, и можем развить ее далее, получив квантовые аналоги всех основных положений классической динамики. Пусть имеется представление, в котором диагоналей полный набор коммутирующих наблюдаемых I, так что базисные бра-векторы будут иметь вид (?' |. Можно ввести другое представление, базисными бра-векторами которого будут <g*\=G'\T. D5) Новые базисные бра-векторы зависят от времени t и обра- образуют как бы движущееся представление, подобное движу- движущейся системе осей в обычном векторном пространстве. Срав- Сравнивая формулу D5) с формулой, сопряженной с (8), мы ви- видим, что новые базисные векторы получаются из старых путем преобразования от шредингеровскои картины движе- движения к гейзенберговской картине; поэтому они должны быть так же связаны с динамическими переменными Гейзенберга vt, как исходные базисные векторы связаны с динамиче- динамическими переменными Шредингера и. В частности, каждый бра (?'* | должен быть собственным вектором переменной |, с собственным значением ?'. Поэтому эти бра можно обозна- обозначить через (It |, подразумевая, что числа \\, являющиеся собственными значениями переменных \t, совпадают с соб- собственными значениями ?' переменных \. Из формулы D5) получаем <r<ir>=<?'mr>. D6) откуда видно, что функция преобразования является просто представителем оператора Т в исходном представлении. Дифференцируя формулу D5) по t и используя F) и A2), имеем
§ 32. ПРИНЦИП ДЕЙСТВИЯ 171 Умножая справа на произвольный кет | а), не зависящий от t, получаем ih | (It! а) = <? {! Я, j a) = J <?,' | Ht | g?> dg; (I'i I fl>, D7) если для определенности рассматривать случай сплошного спектра собственных значений наблюдаемых |. С другой стороны, уравнение E), записанное с помощью представи- представителей, имеет вид Ш | <Г | Pt) = j <g'| H j Г') <*Г <Г I«>• D8) Поскольку (It \ Ht lit ) и (?,' \ H \ ^"> — одинаковые функ- функции своих переменных \'t, %'i и |', |", то уравнения D7) и D8) в точности совпадают, если только заменить в уравне- уравнении D7) переменные \\, %,'i на \', \", а функцию (\'t | а) на функцию (|' | Pt). Мы можем, таким образом, рассматри- рассматривать уравнение D7) как такой вид волнового уравнения Шре- дингера, в котором роль волновой функции играет функция (!? | а) от переменных &, Итак, волновое уравнение Шредин- гера можно рассматривать с новой точки зрения как усло- условие, налагаемое на представитель не зависящего от времени кет-вектора, характеризующего состояние в гейзенбергов- гейзенберговской картине; это условие налагается на вектор в том «под- «подвижном» представлении, в котором переменные Гейзенберга h,t диагональны. В функции (I't | а) зависимость от времени символизируется левым множителем (Ь \, в отличие от функции (|' | Pt), изменение которой со временем симво- -шзируется правым множителем | Pt). Если положить | а) = | \" ) в формуле D7), то получаем i% § <Г,Г> = J (It I Ht! It") dl't" (I'/' 11"), D9) откуда видно, что функция преобразования (gj | Ь,") удо- удовлетворяет волновому уравнению Шредингера. Далее, ??„ = Е и, следовательно, аи г>=6(е;, -г), E0) причем под дельта-функцией здесь подразумевается произве- произведение множителей, по одному на каждую из переменных 1-, подобное тому, которое имелось в правой части уравнения C4) § 16 для переменных ?0+1, ..., |а. Таким образом, функ-
172 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ ция преобразования является таким решением волнового уравнения Шредингера, для которого переменные ? имеют наверняка значения ?" в момент t0. Квадрат модуля этой функции | (l't | ?") |2 равен относительной вероятности того, что переменные ? имеют значения |J при некотором t > t0, если при t = t0 эти переменные наверняка имели значения ?". Функцию (?J | ?") можно записать в виде (It | Ц) и считать, что она зависит не только от t, но и от t0. Чтобы полу- получить эту зависимость от t0, рассмотрим уравнение, сопряжен- сопряженное уравнению D9), поменяем местами t и t0, а также значки ' и ". Тогда получаем 0>. E1) Проведенное рассмотрение функции преобразования (%'t | |") справедливо, если переменные ? образуют полный набор коммутирующих наблюдаемых. Уравнения написаны для случая, когда все ? имеют сплошной спектр собственных значений, но они остаются справедливыми, если любые из переменных ? имеют дискретный спектр собственных значений, если только произвести необходимые формальные изменения в этих уравнениях. Рассмотрим теперь динами- динамическую систему, которая имеет классический аналог, и пусть наблюдаемыми ? будут координаты ц. Положим <?;|<7">=e's/ft, E2) определив таким образом функцию 5 от переменных qi, q". Эта функция зависит также явно от /. Функция E2) является решением волнового уравнения Шредингера, и если по- постоянную U можно считать малой, то с ней можно действо- действовать так же, как с функцией C5). В формуле E2) 5 отли- отличается от S в C5) тем, что в формуле E2) нет А, и поэтому 5 в ней является комплексной функцией, но вещественная часть этой функции равна S в C5), а ее мнимая часть имеет порядок величины %. Таким образом, в пределе при ft ->- О функция S в E2) равна 5 в C5) и поэтому, согласно фор- формуле C8) должна удовлетворять уравнению Prt), E3) где E4)
§ 32. ПРИНЦИП ДЕЙСТВИЯ 173 а Нс есть гамильтониан классического аналога нашей кван- квантовой динамической системы. Но функция E2) является также решением уравнения E1), если подставить в него q вместо |, так как уравнение E1) является комплексно- сопряженным волновому уравнению Шредингера с перемен- переменными q" или q'la. Это приводит к тому, что функция 5 удо- удовлетворяет также уравнению *) dS/dto = Hc(qr, P'r), E5) где p; = — dSidq'r. E6) Решением уравнений Гамильтона — Якоби E3) и E5) является в классической механике функция действия для промежутка времени от t0 до t, т. е. интеграл по времени от функции Лагранжа L, t S = \L{t')dt'. E7) и Таким образом, функция S, определяемая формулой E2), есть квантовый аналог классической функции действия **), и они равны между собой в пределе при Ъ, —>- 0. Чтобы по- получить квантовый аналог классической функции Лагранжа, перейдем к случаю бесконечно малого промежутка времени, положив t = t0 + 8t; тогда величина (q't0+st I q't0) будет ана- аналогом величины eiL(t°)btin. Ради аналогии будем считать L (Q функцией координат q' в момент t0 + Ы и координат q" в момент t0, а не функцией координат и скоростей в мо- момент t0, как это делается обычно. Принцип наименьшего действия в классической механике гласит, что функция действия E7) остается стационарной при малых вариациях траектории системы, которые не сме- смещают конечных точек, т. е. при малых вариациях коорди- координат q во все промежуточные моменты времени между t0 и t, причем qta и qt остаются фиксированными. Посмотрим, что соответствует этому принципу в квантовой теории. Пусть exp \i \L(t)dt/fl\ = exp{iS(tb, ta)/h} = B(tb, ta), E8) *) Подробное сравнение функций преобразования с классической теорией см. V а п V 1 е с к, — Proc. Nat. Acad., 1928, v. 14, p. 178. **) Функция E7) должна быть выражена через начальные и конеч- конечные значения координат {q"r и q'), (Прим. В. А. Фока.)
174 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ так что величина В (tb, ta) есть классический аналог кван- тбвой величины (q't | q't ). (Мы считаем здесь, что q\ и q't означают разные собственные значения переменных qt и qt для того, чтобы не вводить в формулы большого числа штрихов.) Предположим далее, что промежуток времени t0 -> t разделен на большое число малых промежутков to->- tlt tx-+t2, ..., tm_x-> tm, tm-> t, путем введения про- промежуточных значений времени tu t2, ..., tm. Тогда получаем В (t, t0) = В (t, tm) В (tm, tm.j) ...В (t2, tt) В (/„ t0). E9) Соответствующее квантовое уравнение, которое следует из свойства C5) § 16 базисных векторов, имеет вид (Qt ко) = П .. • $ (q't I q'm) dq'm (q'm \ q'm _ j) dq'm _, ... ;<^|^>, F0) где для краткости вместо qik всюду написано q'{. На пер- первый взгляд между формулами E9) и F0) нет сколько-нибудь близкого соответствия. Однако смысл уравнения E9) сле- следует проанализировать несколько более тщательно. Каждый из множителей В нужно рассматривать как функцию значе- значений координат q на концах того временного интервала, к которому этот множитель относится. Тогда правая часть уравнения E9) будет зависеть не только от qt и qto, но также и от всех промежуточных значений q. Уравнение E9) справедливо только в том случае, если вместо промежу- промежуточных координат q в правой части подставить их значения для истинной траектории, малые вариации которых остав- оставляют функцию 5, а следовательно, согласно E8), и величину В (t, t0) стационарными. Процесс подстановки этих про- промежуточных значений координат q и соответствует интегри- интегрированию по всем промежуточным q в формуле F0)*). Кванто- Квантовый аналог принципа действия содержится, таким образом, в законе композиции F0), а классическое требование, со- согласно которому промежуточные значения q должны быть таковы, чтобы функция S была по отношению к ним ста- *) Формула F0), предложенная Дираком в 1935 г., явилась основой для интеграла по путям, впоследствие введенного Р, Фейн- маном. (Прим. ред.)
§ 32. ПРИНЦИП ДЕЙСТВИЯ 175 ционарной, соответствует в квантовой механике тому усло- условию, что из всех значений промежуточных координат су- существенны лишь те, которые вносят заметный вклад в ин- интеграл в формуле F0). Выясним, каким образом формула E9) может быть пре- предельным случаем формулы F0) при малых h. Мы должны предположить, что подынтегральное выражение в формуле F0) имеет вид eiF/n, где F — функция от q'o, q\, q'2, ..., q'm, q't, которая остается непрерывной, когда % стремится к нулю, так что подынтегральное выражение является быстро ос- осциллирующей функцией, когда постоянная % мала. Инте- Интеграл от такой быстро осциллирующей функции, взятый по любому участку, будет весьма мал, за исключением того участка, в котором сравнительно большие вариации коор- координат q'k приводят лишь к весьма малым вариациям F. Та- Таким участком будет окрестность той точки, в которой функ- функция F стационарна относительно малых вариаций q'k. Таким образом, значение интеграла в формуле F0) определяется в основном значением подынтегральной функции в той точке, в которой эта функция стационарна относительно малых вариаций промежуточных значений координат q, и, таким образом, формула F0) переходит в формулу E9). Уравнения E4) и E6) выражают тот факт, что перемен- переменные q't, p't связаны с переменными q", р" касательным пре- преобразованием и являются стандартной формой записи каса- касательного преобразования. Аналогичная форма записи урав- уравнений унитарного преобразования возможна и в квантовой механике. Из формулы E2), с помощью формулы D5) § 22, имеем {q't! prt | q") = ~'Й a^7 (q<I<?"> = dS%4) { Аналогично, используя уравнение D6) § 22, получаем {q't I Pr | q") = itl -^r (q't \ q") = - ^^^ <4 I <7">- F2) Из общего определения функции коммутирующих наблю- наблюдаемых *) имеем далее (q't I / (ж) g(q)\ q") = f (q't) g Ю (q't I q") - F3) *) Автор имеет в виду, что различные q't коммутируют между собой, а также различные q — между собой, (Прим. В, А, Фока),
176 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ где / (qt) и g (q) — соответственно функции переменных qt и q. Пусть G (qt, q) — произвольная функция переменных qt и q, которая может быть разложена в сумму или интеграл по членам вида / (qt) g (q) так, что все переменные qt рас- расположены слева от переменных q. Назовем такую функцию упорядоченной. Применяя формулу F3) к каждому из чле- членов функции G и производя суммирование или интегриро- интегрирование, получаем {q't \ G (qt, q) I q") = G (q't, q") (q't \ q"). Пред- Предположим далее, что каждая из переменных prt и рг может быть представлена как упорядоченная функция коор- координат qt и q; обозначим эти функции через prt (qt, q) и Pr {qt, q)- Подставляя эти функции вместо G, получаем (q't\prt\q")=prt{q't, q")(q't\q"), Сравнивая эти уравнения соответственно с уравнениями F1) и F2), находим п In' n"\ dS(ci'1' я") п ,„' п»\ dS(qt, q") Prt{qt,q)= щ? . pr(qt,q)— щ-„ • Это означает, что выполняются равенства jqt. q) Pr~ n Prt" dqrt ' Pr~ dqr ' если предполагать, что правая часть формулы F4) записана в упорядоченном виде. Эти уравнения имеют тот же вид, что и уравнения E4) и E6), но относятся к некоммутирующим квантовым пере- переменным qt, q, а не к обычным алгебраическим перемен- переменным q't, q". Они показывают, какой смысл имеет аналогия между условием унитарности преобразования квантовых пе- переменных и требованием, чтобы преобразование классиче- классических переменных являлось касательным. Аналогия не явля- является, однако, полной, потому что классическая функция 5 должна быть вещественной, а соответствующее простое условие для функции 5 в формуле F4) отсутствует *). *) О связи между унитарным преобразованием и касательными преобразованиями классической механики см, приложение, (Прим. В, А, Фока,)
§ 33. АНСАМБЛЬ ГИББСА 177 § 33. Ансамбль Гиббса До сих пор в нашей книге мы все время предполагали, что рассматриваемая динамическая система в каждый мо- момент времени находится в определенном состоянии, иными словами, что ее движение задано настолько полно и точно, насколько это возможно сделать, не нарушая общих прин- принципов теории. В классической теории это означало бы, очевидно, что значения всех координат и импульсов заданы. Может случиться, однако, что нас заинтересует движение, которое задано не с такой максимальной полнотой. Настоя- Настоящий параграф будет посвящен тем методам, которые сле- следует применять в этом случае. В классической механике для этого существует способ так называемого ансамбля Гиббса, идея которого заклю- заключается в следующем. Мы рассматриваем все динамические координаты и импульсы как декартовы координаты в неко- некотором фазовом пространстве, число измерений которого вдвое больше числа степеней свободы системы. Любое со- состояние системы может быть изображено точкой в этом пространстве. Эта точка будет двигаться согласно класси- классическим уравнениям движения A4). Допустим теперь, что нам неизвестно, в каком именно состоянии находится си- система, а известна лишь вероятность того, что система нахо- находится в том или ином состоянии из некоторого множества состояний. Можно было бы изобразить такое состояние системы в виде жидкости в фазовом пространстве, масса ко- которой в произвольном объеме фазового пространства равна полной вероятности того, что система находится в каком- либо из состояний, изображаемых точками этого объема. Каждая частица такой жидкости будет двигаться согласно уравнениям движения A4). Введем плотность р этой жид- жидкости в данной точке, равную вероятности (на единицу объема фазового пространства) того, что система будет близка к данному состоянию. Тогда будет выполняться урав- уравнение неразрывности дР _ XI д \\ i д / дН\ д / дН\\ = — 7 k- Pi — ч— 0-5— Г =
178 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ Его можно рассматривать как уравнение движения для жид- жидкости, так как оно определяет плотность р для всех мо- моментов времени, если задано начальное значение р как функции координат q и импульсов р. Если не считать знака минус, это уравнение имеет тот же вид, что и обычное уравнение движения A5) для динамической переменной. То требование, что полная вероятность нахождения си- системы в каком-либо состоянии должна быть равна единице, приводит к условию нормировки для р \\9dqdp = \, F6) где интегрирование производится по всему фазовому про- пространству, а дифференциалы dq или dp означают произве- произведение всех dq или всех dp. Если р есть некоторая функция динамических переменных, то ее среднее значение равно \\^9dqdp. F7) Несущественное, хотя и удобное для облегчения многих рассуждений, видоизменение теории получится, если пользо- пользоваться плотностью р, которая отличается от прежней неко- некоторым положительным множителем k. Тогда вместо уравне- уравнения F6) получаем jj jj р dq dp = k. С помощью этой плотности мы можем представить себе, что жидкость изображает k одинаковых динамических систем, которые движутся независимо, без взаимных возмущений и без взаимодействия в одном и том же месте пространства. Плотность в данной точке будет тогда равна вероятному или среднему числу систем на единицу объема фазового пространства, находящихся вблизи данного состояния, а вы- выражение F7) даст среднее значение р для всех этих систем. Такая совокупность динамических систем и есть ансамбль, введенный Гиббсом. Ансамбль Гиббса обыкновенно нельзя осуществить практически, разве что в грубом приближении, но тем не менее он является полезной теоретической аб- абстракцией. Убедимся теперь, что в квантовой механике существует соответствующая плотность р с аналогичными свойствами. Она была впервые введена фон Нейманом. То, что она су- существует, является даже несколько неожиданным фактом,
§ 33. АНСАМБЛЬ ГИББСА 179 поскольку понятие о фазовом пространстве в квантовой ме- механике уже не имеет смысла ввиду того, что координатам q и импульсам р невозможно приписать одновременно опре- определенные численные значения. Рассмотрим динамическую систему, которая в определен- определенный момент времени может находиться с известной вероят- вероятностью в том или ином состоянии из некоторой совокуп- совокупности состояний. Эти состояния могут составлять либо дискретную совокупность, либо сплошную, либо то и другое вместе. Будем для определенности рассматривать дискрет- дискретный случай, и будем нумеровать состояния индексом т. Пусть | т) — нормированный кет-вектор, характеризую- характеризующий состояние т, а Рт — вероятность того, что система находится в этом состоянии. Определим тогда квантовую плотность р формулой Ц>Рт<т|. F8) Пусть р' есть некоторое собственное значение р и | р') — собственный кет-вектор с этим собственным значением. Тогда имеем 2|m>/>m<m|p'>=p|p'>=p'|p'>. Отсюда получаем У]<р'|ш>Рт<т[р')=р'<р'|р') т ИЛИ но число Рт, будучи вероятностью, никогда не может быть отрицательным. Отсюда следует, что р' не может быть отрицательным. Таким образом, р не имеет отрицательных собственных значений, в соответствии с тем фактом, что классическая плотность р не может быть отрицательной. Выведем теперь уравнение движения для квантовой плот- плотности р. В шредингеровской картине кет-векторы и бра- векторы в формуле F8) будут изменяться со временем со- согласно уравнению Шредингера E) и согласно сопряженному уравнению, при этом вероятности Рт будут оставаться постоянными, поскольку система до тех пор, пока отсут-
180 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ ствуют возмущения, не может перейти из состояния, кото- которое характеризуется одним вектором, удовлетворяющим уравнению Шредингера, в состояние, характеризуемое дру- другим вектором. Таким образом, мы имеем = 2i{H\m)Pm(m\-\m)Pm<rn\H}=Hp-pH. F9) т Это уравнение и является квантовым аналогом классиче- классического уравнения движения F5). Квантовая плотность р, подобно классической, однозначно определяется для всех моментов времени по заданному начальному значению. Согласно предположению, сделанному в § 12, среднее значение наблюдаемой р\ когда система находится в состо- состоянии т, равно (т | р | т). Отсюда следует, что если система может находиться с вероятностями Рт в различных состоя- состояниях т, то среднее значение р будет равно ^?iPm(jn\§\ т). т Если ввести представление, в котором базисные кет-век- кет-векторы 11' > образуюгдискретную совокупность, то это выра- выражение примет вид 2 I'm ] I' последнее из равенств легко проверить, воспользовавшись правилом умножения матриц (уравнение D4) § 17). Выраже- Выражение G0) является аналогом выражения F7) классической теории. В то время как в классической теории нужно было умножить р на р и проинтегрировать по всему фазовому пространству, в квантовой механике следует умножить р на р, взяв множители в любом порядке, и вычислить сумму диагональных элементов (след) произведения в некотором представлении. Если представление содержит непрерывную совокупность базисных векторов | ?'), то мы вместо фор- формулы G0) получаем =J<l'iPPII'>d|', G1)
§ 33. АНСАМБЛЬ ГИББСА 18! т. е. мы должны произвести «интегрирование по диагонали» вместо суммирования диагональных элементов. Выражение G1) мы будем называть диагональной суммой (следом) произ- произведения Рр для непрерывного случая. Легко убедиться, ис- используя свойства функций преобразования E6) § 18, что диагональная сумма (след) будет одинакова во всех пред- представлениях. Из того условия, что векторы ] т) нормированы, мы получаем для дискретных ?' 2 <rip|5'> = E<S'|m>Pffl<m|S'> = 2]Pin=lI G2) ибо полная вероятность нахождения системы в каком-либо из состояний равна единице. Это уравнение аналогично урав- уравнению F6). Вероятность того, что система находится в со- состоянии |', или вероятность того, что наблюдаемая ?, диа- диагональная в данном представлении, имеет значение ?', бу- будет, согласно толкованию E1) § 18 представителей кет-век- кет-векторов, равна 2l\(t'\ni)*pm = (i'\P:t'). G3) m Таким образом, становится ясен смысл каждого члена суммы в левой части формулы G2). Для непрерывных |' правая часть формулы G3) дает вероятность того, что все ? имеют значения, близкие к значениям %' (вероятность, рассчитан- рассчитанную на единичный интервал изменения значений ?'). Как и в классической теории, мы можем взять плот- плотность в k раз большую, чем прежняя плотность р, и счи- считать, что она представляет ансамбль Гиббса из k одинаковых динамических систем, которые не взаимодействуют и не воз- возмущают друг друга. Тогда в правой части формулы G2) будет стоять k, формулы G0) или G1) будут давать полное среднее значение суммы наблюдаемых р для всех членов ансамбля, а G3) — вероятное число членов ансамбля, для которых все | равны ?', или, отнесенное к единичному ин- интервалу изменения значений ?', число членов, для которых % находятся в окрестности ?'. Весьма важным является применение метода ансамбля Гиббса к динамической системе, которая находится в термо- термодинамическом равновесии с окружающей средой при задан-
182 ГЛ. V. УРАВНЕНИЯ ДВИЖЕНИЯ ной температуре Т. Гиббс показал, что такая система харак- характеризуется в классической механике плотностью где Я — гамильтониан, который в данном случае не зависит отвремени,/;— постоянная Больцмана.ас — число, кото- которое выбирается так, чтобы выполнялось условие норми- нормировки F6). Эта формула может быть перенесена без изме- изменений и в квантовую теорию. При высоких температурах формула G4) принимает вид р = с, откуда, после подста- подстановки в правую часть формулы G3), получаем с (?,' | ?') = с для случая дискретных |'. Таким образом, при высоких температурах все дискретные состояния равновероятны.
ГЛАВА VI ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ § 34. Гармонический осциллятор Простым и интересным примером динамической системы в квантовой механике является гармонический осциллятор. Этот пример важен для общей теории, так как он является краеугольным камнем теории излучения Динамические пе- переменные, необходимые для описания системы, — ясего одна координата q и сопряженный ей импульс р. Функция Гамильтона в классической механике равна H = ~(p2 + mWq*), A) гдет — масса колеблющейся частицы, а со — частота, умно- умноженная на 2л. Мы предположим, что в квантовой механике оператор Гамильтона имеет такой же вид, как классическая функция Гамильтона. Этот оператор совместно с квантовыми условиями A0) § 22 полностью определяет систему. Гейзенберговские уравнения движения имеют вид Удобно ввести безразмерную комплексную динамическую переменную *) т] = BтП(л)~ ч* (р + im&q). C) Из уравнений движения B) следует x\t = Bm/?co)-1/2 (— m<a2qt + mpt) — кот],. *) Более употребительными являются операторы а = jtj и а+ = == - Ц, (Прим, перев.)
184 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Это уравнение может быть проинтегрировано, и приводит к формуле ri/ = VM', D) где г|0 — линейный оператор, не зависящий от t и равный r\t при / =-• 0. Вышенаписанные уравнения вполне аналогичны уравнениям классической теории, Мы можем выразить q и р через ц и сопряженный Т) и оперировать с т] и fj. Имеем Лащ = Bm) (p -\- imcoq) (р — imcaq) = = Bm)'1 [p2 + m2<a2q2 -f ima {qp-pq)] = H-~ha E) и аналогично fi(i>r\r\ = H + -g- Йсо. F) Таким образом, f)ri-irn = l. G) Уравнение E) или F) выражает Н через ц и fj, a G) дает перестановочные соотношения для ц и fj. Из E) имеем Нщщ = т)Я — у ЙсоТ}, а из равенства F) Нщщ = #fj + у Йсот}. Таким образом, fjtf — //fj = йщ. (8) Далее, уравнение G) приводит к соотношению для любого положительного целого п; это можно показать по индукции, так как, умножая равенство (9) слева на г\, мы получим то же равенство для значения п ~\- 1 вместо п. Пусть Н' — собственное значение Я, и \ Н') — соответ- соответствующий этому собственному значению собственный кет- вектор. Из соотношения E) следует Йсо (Я' | г|Т| | Н') =
§ 34. ГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР 185 Далее, (Я' \Щ \ Я') — квадрат длины кет-вектора Щ | Я') и, следовательно, должно быть причем равенство наступает только при ц \ Я') = 0. Мы имеем также (Я' | Я')> 0. Таким образом, получаем Я'эЦ-Йсо, A0) причем равенство наступает только при fj | #') = 0. По- Поскольку выражение A) для Я имеет вид суммы квадратов, следовало ожидать, что все собственные значения будут по- положительны или равны нулю (так как среднее значение Я в любом состоянии должно быть положительным числом или нулем). Соотношение A0) дает нам уточненное условие. Из соотношения (8) имеем Ят) | Я'> = (т)Я - Пщ) | Я') = (Я' - й<о) г) | Я'). A1) Если Я'=/=у Йи, то вектор fj | Я') Ф 0 и, согласно A1), является собственным кет-вектором Я с собственным значе- значением Я' — йсо. Следовательно, если Я' — любое собствен- собственное значение Я ^= — йю.то Я' — Йсо будет также собствен- собственным значением. Мы можем повторить это рассуждение и по- получить, что если Я' — Йсо^у Йсо, то Я'—2Йю также будет собственным значением Я. Продолжая таким образом, мы получим ряд собственных значений Я', Я' — fta>, H'—2/гсо, Я' — ЗЙсо, . . ., который не может продолжаться до бес- бесконечности (так как тогда найдутся собственные значения, противоречащие A0)), но может кончиться только на ве- величине у/ко. Точно так же из у равнения, сопряжен- сопряженного с (8), имеем Нц | Я') = (i\H + Пощ) | Я') = (Я' + йев) r\ \ Я'), откуда видно, что Н' -\- ha> — также собственное значение Я и т] | Я') — собственный вектор, за исключением случая ц |Я') = 0. Этот случай, однако, невозможен, так как иначе было бы 0 = П(ОЩ | Я') = (Я +1 fta) | Я') = (Я' + 1 ft©) | Я'),
186 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ что противоречит A0). Таким образом, Н' + ha всегда яв- является собственным значением Н, а также Н' -\- 2ha, Н' -\- ЗЙсо и т. д. Следовательно, собственными значени- значениями Н является ряд чисел у #00, уЙСО, уЙСО, уЙСО, .... A2) простирающийся до бесконечности. Они являются возмож- возможными значениями энергии гармонического осциллятора. Пусть | 0) — собственный кет-вектор Н, относящийся к наи- наинизшему собственному значению y^to, так что тцо>=о. A3) Образуем последовательность кет-векторов |0>, Л|О>, VI 0>, Л3|0>,... A4) Они все являются собственными векторами Н, соответ- соответствующими собственным значениям A2). Из,соотношений (9) и A3) следует Щп\0)=пг\п-1\0) A5) для любого неотрицательного целого п. Таким образом, по- последовательность векторов A4) такова, что действие х\ или fj на один из векторов последовательности дает вектор, при- принадлежащий этой же последовательности. Все динамические переменные в нашей задаче могут быть выражены через ц и % так что векторы A4) должны образовать полную си- систему (в противном случае должны были бы быть еще дру- другие динамические переменные). Имеется всего один вектор для каждого собственного значения A2), так что оператор Н сам образует полный набор коммутирующих наблюдаемых. Векторы A4) соответствуют различным стационарным со- состояниям осциллятора. Стационарное состояние с энергией (п-\- yj ha, которое характеризуется вектором r\n | 0>, на- называется д-м квантовым состоянием. Квадрат длины вектора т)" | 0) равен, как следует из формулы A5), По индукции находим, что <0|тТ1Г|0>=«!, A6)
§ 34. ГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР 187 если вектор | 0) нормирован. Следовательно, векторы A4), умноженные на /г!~>;% где п — 0, 1, 2 ... образуют базис представления, именно, представления, в котором опера- оператор Н диагоналей. Любой вектор | х) может быть разложен в ряд СО l*) = I>«rf|0>, A7) о где хп — числа. Таким путем вектор | х) поставлен в соот- соответствие ряду %хпцп по степеням переменной т), причем раз- различные члены в этом степенном ряде соответствуют раз- различным стационарным состояниям. Если вектор | х) норми- нормирован, то он определяет состояние, для которого вероятность нахождения осциллятора в п-м квантовом состоянии, т. е. вероятность того, что переменная Н имеет собственное зна- значение [п + -j) ^ш> Равна Р» = п\\хп\*. A8) как вытекает из тех рассуждений, которые приводят к формуле E1) § 18. Мы можем рассматривать вектор | 0) как стандартный, а степенной ряд по т] — как волновую функцию (мы знаем, что любой вектор может быть выражен как такая волновая функция, умноженная на стандартный вектор). Данный вид волновой функции отличается от обычного, определяемого уравнением F2) § 20, тем, что это — функция комплексной динамической переменной г], а не наблюдаемой. Она была впервые введена В. А. Фоком, так что мы будем называть это представление фоковским. Для многих целей это есть представление наиболее удобное для описания состояний гармонического осциллятора. Стандартный вектор |0) удов- удовлетворяет условию A3), которое заменяет условие D3) § 22 для стандартного вектора в шредингеровском пред- представлении. Введем шредингеровское представление, в котором диа- диагонально q, и найдем представители стационарных состоя- состояний. Из A3) и C) следует так что (q' \p — imoiq\0) = 0.
188 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ С помощью соотношения D5) § 22 это дает Ь, ¦?-,¦, (о' 10) — тщ' (q' I 0) = 0. A9) од Решение этого дифференциального уравнения есть ' ' ' \ ЯП I v ' Численный коэффициент выбран так, чтобы (q' | 0) было нор- мированно. Мы имеем здесь представитель основного состо- состояния, как называется состояние с наинизшей энергией. Из него могут быть получены представители других стационар- стационарных состояний. Из соотношения C) имеем (q' | rf | 0) = Bmh«>)-n<2 (q' | (p + im&q)n 10) = n/2in(nl_ + mM^,^0^ 2n. B1) Вычисления легко проводятся при малых п. В результате получается е-тС0"'г/2П, умноженное на полином ге-й степени от q', Для того чтобы получить нормированный представи- представитель л-го квантового состояния, нужно ввести в B1) множи- множитель п!"'/г. Фазовый множитель i" можно опустить. § 35. Момент количества движения Рассмотрим частицу, описываемую тремя декартовыми координатами х, у, г и сопряженными импульсами рх, ри, рг. Момент количества движения частицы относительно начала координат определяется, как и в классической теории, соот- соотношениями или в векторных обозначениях m = х х р. Мы должны вычислить скобки Пуассона (СП) для комбина- комбинаций компонент момента количества движения с динамически- динамическими переменными х, рх и т д. и друг с другом. Это наиболее удобно сделать с помощью соотношений D) и E) § 21. Так, [тгу х}- ¦ х I B3) [mz, z] = [(xpu — ypx), г\ = 0 B4)
§ 35. МОМЕНТ КОЛИЧЕСТВА ДВИЖЕНИЯ 189 и аналогично [tnz, рх] = ру, [тг> ру] = — рх, B5) К, рг} = 0 B6) с соответствующими соотношениями для тх и ту. Далее, [niy, mz\ = [(zpx — хрг), тг] = г[рх, mz] — [x, тг]рг = = — zpy-^-ypz — nix, B7) [тг, тх] = ту, [тх, ту] = тг. Эти результаты те же самые, что и в классической теории. Знак в выражениях B3), B5) и B7) можно легко запо- запомнить, исходя из правила, что знак + имеет место в том случае, когда три динамические переменные—две в скобках в левой части равенства и третья, дающая результат, в пра- правой части равенства — расположены в порядке циклической перестановки х, у, г. В противном случае будет знак —. Уравнения B7) могут быть записаны в векторном виде m X m = ihm. B8) Предположим теперь, что мы имеем несколько частиц с мо- моментами количества движения ть т2 и т. д. Каждый из этих векторов будет удовлетворять соотно- соотношению B8), так что и любые два из них будут коммутировать друг с другом, так что Следовательно, если М = 2] mr — полный момент количе- ства движения, то rs r<s дnv) = ih2]nv = itM. B9) Этот результат имеет тот же вид, что и B8), так что ком- компоненты полного момента количества движения М для лю- любого числа частиц удовлетворяют тем же самым перестано- перестановочным соотношениям, что и для одной частицы.
190 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Пусть Ах, Ау, Аг обозначают три координаты некоторой частицы, или же три компоненты импульса некоторой ча- частицы. Величины А будут коммутировать с моментом количества движения другой частицы, и следовательно, из соотно- соотношений B3) — B6), получаем [Мг, АХ] = АУ, [Мг, Ау] = -Ах, [Мг, Аг] = 0. C0) Если Вх, Ву, Вг — другая совокупность трех величин, обо- обозначающих координаты или компоненты импульса одной из частиц, то они будут удовлетворять соотношениям, анало- аналогичным C0). Следовательно, будем иметь [Мг, (АхВх + АуВу + АгВг)] = = [Мг, Ах]Вх + Ах[Мг, BX] + [MZ, Ау]Ву + Ау[М„ Ву] = = АуОх ~\- AxDy AxDy AyDx = U. Таким образом, скалярное произведение АХВХ -f- AtJBy -f + AZBZ коммутирует с Мг и аналогично с Мх и Ми. Вводя векторное произведение АхВ=С или АуВг-АгВи = СХ1 АгВх-АхВ, = Су, АХВУ- AyBx = Cz, имеем [Мг, Сх] = —АхВг + АгВх = Су и аналогично [Мг, Су] = -Сх, [Мг, Сг] = 0. Эти соотношения опять имеют вид уравнений C0), в кото- которых вместо А стоит С. Мы можем отсюда заключить, что уравнения вида C0) справедливы для трех компонент любого вектора, который можно построить из наших динамических переменных, и что любой скаляр коммутирует с М. Мы можем ввести линейный оператор /?, относящийся к вращению вокруг начала координат, таким же образом, как мы ввели линейный оператор D в § 25, относящийся к сдвигу. Производя вращение на угол бср вокруг оси z и считая бф бесконечно малым, мы можем получить в пределе оператор, соответствующий F4) § 25, а именно, оператор lim (R - 1)/6ф, 6ф-.О
§ 35. МОМЕНТ КОЛИЧЕСТВА ДВИЖЕНИЯ ^' который мы назовем оператором вращения вокруг оси г и обозначим через гг. Подобно оператору сдвига, rz — чисто- мнимый линейный оператор, определенный с точностью до чисто-мнимой аддитивной постоянной. Соответственно равен- равенству F6) § 25 изменение любой динамической переменной v, вызванное вращением на малый угол 8ф вокруг оси г, есть 8ф {rzv - vrz) C1) с точностью до величин второго порядка относительно 8<р. Далее, изменения трех компонент вектора Ах, Ау, Аг при вращении 8ц> вокруг оси г, которому подвергается вся изме- измерительная аппаратура, равны соответственно бфЛ^, — Ьц>Ах, О, любая же скалярная величина остается при вращении не- неизменной. Приравнивая эти изменения выражению C1), получим Кроме того, rz коммутирует с любым скаляром. Сравнивая эти результаты с соотношениями C0), мы видим, что опе- оператор Шгг удовлетворяет тем же перестановочным соотно- соотношениям, что и Mz. Их разность Mz — ibrz коммутирует с любой динамической переменной и, следовательно, должна быть числом. Это число, являющееся по необходимости вещественным, так как Mz и ihrz вещественны, может быть сделано равным нулю путем выбора чисто-мнимой аддитив- аддитивной постоянной в rz. Таким образом, имеем Mz = ihrz. C2) Такие же уравнения справедливы для Мх и Му. Они ана- аналогичны уравнениям F9) § 25. Итак, полный момент ко- количества движения связан с оператором вращения так же, как полный импульс связан с оператором сдвига. Это заключение справедливо при любом выборе начала коор- координат. Вышеприведенные рассуждения относятся к моменту ко- количества движения, возникающему при движении частиц, определяемому для каждой частицы соотношением B2). Имеется еще другой вид момента количества движения, встречающийся в атомной теории — спиновый момент ко- количества движения. Предыдущий вид момента количества
192 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ движения для отличия мы будем называть орбитальным моментом количества движения. Спиновый момент частицы следует представлять себе как результат некоторого внутреннего движения частицы, так что он связан со степенями свободы, отличающимися от тех, которые описывают движение частицы как целого. Следо- Следовательно, динамические переменные, описывающие спин, должны коммутировать с х, у, z, px, ру и pz. Спин не имеет близкого соответствия с чем-либо в классической механике, так что метод классических аналогий не подходит для его изучения. Однако мы можем построить теорию спина просто, предполагая, что компоненты спинового момента связаны с оператором вращения таким же образом, как компоненты орбитального момента, т. е. что уравнение C2) справедливо для М~, рассматриваемого как компонента спина по оси г и гг — как оператора вращения вокруг оси г, относящегося к состоянию спина частицы. При этом предположении пере- перестановочные соотношения, связывающие компоненты спино- спинового момента М с любым вектором А, относящимся к спину, должны иметь вид C0). Следовательно, взяв в качестве А спиновый момент количества движения, мы получим урав- уравнение B9), справедливое также для спина. Тогда урав- уравнение B9) будет удовлетворяться всегда, т. е. для любой суммы орбитального и спинового моментов. Уравнение C0) также будет удовлетворяться всегда, если разуметь под М полный орбитальный и спиновый момент и под А — любую векторную динамическую переменную; связь между момен- моментом количества движения и оператором вращения останется в силе. В качестве непосредственного следствия этой связи можно вывести закон сохранения момента количества движения. Для изолированной системы оператор Гамильтона не должен меняться при любом вращении вокруг начала коор- координат. Другими словами, он должен быть скаляром, и значит, должен коммутировать с моментом количества движения относительно начала координат. Таким образом, момент ко- количества движения является интегралом движения. В этом рассуждении началом координат может быть любая точка. В качестве другого непосредственного следствия мы мо- можем вывести, что состояние с нулевым полным моментом количества движения является сферически симметричным.
§ 36. СВОЙСТВА МОМЕНТА КОЛИЧЕСТВА ДВИЖЕНИЯ 193 Это состояние характеризуется кет-вектором, скажем I S), удовлетворяющим соотношениям и, следовательно, rx\S) = ry\S) = rz\S)^0. Отсюда видно, что кет-вектор | S) не меняется при беско- бесконечно малом повороте и, следовательно, не может меняться при конечном повороте, так как поворот на конечный угол может быть построен из бесконечно малых поворотов. Зна- Значит, состояние сферически симметрично. Обратная теорема, именно: сферически симметричное состояние имеет нуле- нулевой полный момент количества движения, также верна, хотя ее доказательство не столь простое. Сферически симметричное состояние соответствует вектору | S), направ- направление которого не меняется при любом вращении. Следова- Следовательно, изменение | S), вызванное оператором вращения rx, rу или гг, должно сводиться к умножению | S) на число- числовой множитель, скажем rx\S) = cx\S), ry\S)=cy\S), rs\S)=c,\S), где с — числа. Отсюда следует Mx\S) = ihcx\S), My\S) = ihCy\S), Mz\S) = ihcz\S). C3) Эти уравнения несовместимы с перестановочными соотно- соотношениями B9) для Мх, Му, М2, за исключением случая сх = = су — сг = 0, а это и значит, что состояние соответствует нулевому полному моменту количества движения. В уравне- уравнениях C3) мы имеем пример вектора состояния, являющегося одновременно собственным вектором трех некоммутирующих линейных операторов Мх, Му, Мг, что возможно лишь при обращении в нуль всех трех собственных значений. § 36. Свойства момента количества движения Существуют некоторые общие свойства момента количе- количества движения, которые вытекают из одних только пере- перестановочных соотношений между тремя компонентами. Эти свойства относятся в равной мере к спиновому и орбиталь- орбитальному моментам. Пусть тх, ту, mz — три компоненты мо-
194 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ мента количества движения. Введем величину р\ определяе- определяемую соотношением Так как Р — скаляр, то эта величина должна коммутировать с тх, ту, тг. Предположим, что мы имеем динамическую систему, для которой тх, ту и mz являются единственными динамическими переменными. Тогда р коммутирует с любой динамической переменной, и поэтому величина Р должна быть числом. Мы можем изучать такую динамическую си- систему почти тем же путем, какой был использован для гар- гармонического осциллятора в § 34. Положим mx — imy — r\. Из перестановочных соотношений B7) получаем Щ = {тх + iniy) (тх — imy) =tnl-\-tn\ — i (mxtny — тутх) = = $-ml + Hmz, C4) а также равенство т)Т) = р — ml — Umz. C5) Таким образом, имеем туг) — T]Tj = 2hmz. C6) Точно так же тгг] — х\тг = ihniy — hmx = — Ux\. C7) Предположим, что компоненты момента количества движе- движения являются наблюдаемыми, и, таким образом, тг имеет собственные значения. Пусть т'г — одно из них; и | т'г) — собственный кет-вектор, относящийся к нему. Из соотноше- соотношения C4) имеем {т'г | Щ | т'г) == {т'г \ р - т$ + Нтг | т'г) = Здесь левая сторона — квадрат длины вектора ц | т'г), и, следовательно, больше или равна нулю, причем случай ра- равенства наступает тогда и только тогда, когда \] | т'г) = 0. Значит, или |A)а C8)
§ 36. СВОЙСТВА МОМЕНТА КОЛИЧЕСТВА ДВИЖЕНИЯ 195 так что Определим число k формулой k +1 ft = (р + j ^2)'/2 = [ml + ml + ml + \- ft2)'72, C9) так что k^—x-H. Тогда неравенство C8) примет вид 1 ± 2 или k + h^sm'z^-k. D0) Знак равенства имеет место в том и только в том случае, если ц | т'г) — 0. Аналогично из соотношения C5) получаем (т'г [ Щ | т'г) = (р - т'г - Пт'г) (т'г \ т'г), откуда видно, что $-т'г'-Птг^0 или k >s tn'z ^ — k — И, причем знак равенства имеет место тогда и только тогда, когда Ц | т'г) = 0. Комбинируя этот результат с неравенством D0), полу- получим k ^ 0 и k^m'z^ — k, D1) причем m'z = k, если r\ \ m'z) = 0 и т'г = —k, если r\ \ m'z) = = 0. Из соотношения C7) следует /ИгЛ | т'г) = (ЦП1г — ЙТ|) | »1г> = (/«г — К) Ц \ т'г). Теперь, если т'г Ф —k, то ц | /Пг> =# 0 и, следовательно, является собственным кет-вектором тг, соответствующим собственному значению т'г — И. Аналогично, если/Пг— % Ф Ф —k, то т'г — 2Н будет другим собственным значением тг и т. д. Мы получаем таким путем ряд собственных значений т'г, т'г — Н, т'г — 2Н, .,, который должен обры- обрываться согласно условию D1) и может обрываться только па величине —к.
•96 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Из уравнения, сопряженного с C7), имеем тгг\ \т'г) = (х\тг + Пг\)\т'г) = (т'г + Й) Л' т'г), откуда следует, что т'г + ft является еще одним собствен- собственным значением тг, за исключением случая fj | т'г) = О, когда т'г — k. Продолжая таким же образом, мы получим ряд собственных значений т'г,т2 + Н,т'г + 2%, ....который, согласно условию D1), должен обрываться и может обры- обрываться только на величине k. Мы можем заключить, что 2k является целым кратным % и что собственными значениями тг являются k,k-H,k-2H -k + H, -k. D2) Вследствие симметрии собственные значения тх и ту ге же самые. Эти собственные значения являются все или . 1 . целыми кратными п, или нечетными кратными ¦„- п в зави- зависимости от того, является ли 2k четным или нечетным кратным И. Обозначим через | max) — собственный кет-вектор тг, соответствующий максимальному собственному значению k, так что f]|max) = 0, D3) и образуем последовательность собственных кет-векторов, которую обозначим через |тах>, г]|тах), т]2|тах>, ..., т]2*/л|тах). D4) Эти векторы все являются собственными векторами тг, соответствующими последовательности собственных значе- значений D2). Последовательность векторов D4) такова, что действие оператора ц на какой-либо из них дает вектор, также принадлежащий последовательности (действие ц на последний из векторов D4) дает нуль). Из соотношений C6) и D3) видно, что действие ц на какой-либо вектор из последовательности также дает вектор, принадлежа- принадлежащий к последовательности. Все динамические переменные рассматриваемой системы могут быть выражены через ц и % так что последовательность векторов D4) является полной. Для каждого собственного значения D2) опера- оператора mz имеется всего один собственный вектор, так что переменная mz сама по себе образует полный набор комму- коммутирующих наблюдаемых.
§ 36. СВОЙСТВА МОМЕНТА КОЛИЧЕСТВА ДВИЖЕНИЯ 19 Удобнее принять в качестве величины вектора момента количества движения величину k, определяемую из C9), а не величину р, поскольку возможными значениями к являются О, i-ft, П, \%, 2h D5) тогда как собственные значения р даются более сложной последовательностью чисел. Для динамической системы, содержащей другие дина мические переменные наряду с тх, ту, mz, могут быть переменные, которые не коммутируют с р. Тогда р1 уже не будет более числом, а будет линейным оператором. Это имеет место для любого орбитального момента количества движения B2), так как х, у, г, рх, ру и рг не коммути- коммутируют с р. Мы будем предполагать, что р всегда наблю- наблюдаемая, и k может быть поэтому выражено, согласно C9), через положительный квадратный корень и тоже является наблюдаемой. Мы будем называть k, определенное таким образом, величиной вектора момента количества движения tr в общем случае. Проведенное выше рассмотрение, с по- помощью которого мы получили собственные значения mz, остается применимым, если мы заменим вектор | m'z) на общий собственный вектор | k'tn'z) коммутирующих пере- переменных k и тг. Оно приводит к результату, что возмож- возможными собственными значениями k являются числа D5), и для каждого собственного значения k' переменной k собствен- собственными значениями mz являются числа D2), где k заменено на k'. Мы имеем здесь пример явления, не встречавшегося ранее, — случай двух коммутирующих наблюдаемых, когда собственные значения одной зависят от того, какие значе- значения приписываются другой. Это явление можно объяснить тем, что обе наблюдаемые не являются полностью незави- независимыми, а в некоторой степени зависят друг от друга. Число независимых векторов, являющихся одновременно собственными векторами k и тг, соответствующими соб- собственным значениям k' и т'г, не должно зависеть от т'г. Действительно, если дано т"г из последовательности D2), то для каждого независимого кет-вектора | k'm'z) мы можем получить независимый кет-вектор | k'm'z) путем умноже- умножения кет-вектора | k'm'z) на подходящую степень ц ИЛИ 1|.
198 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ В качестве примера рассмотрим динамическую систему с двумя моментами т1 и т2, коммутирующими друг с дру- другом. Если нет других динамических переменных, то все динамические переменные коммутируют с величинами kx и k2 векторов т1 и т2, так что кх и k2 являются числами. Однако величина К результирующего момента М = тх + щ не является числом (К не коммутирует со слагаемыми rrij и ш2). Представляет интерес найти собственные значения К- Это может быть сделано проще всего путем подсчета неза- независимых собственных векторов. Имеется один независимый вектор, являющийся одновременно собственным вектором операторов ти и т2г, соответствующим некоторому т[г из совокупности &!, &1 — h, k-y — 2h, ..., ¦— kx и некоторому m<iz из совокупности k2, k2— Й, k2— 2tl, ..., — k2. Он явля- является собственным вектором оператора Mz, соответствую- соответствующим собственному значению M'z — т\г + т^- Возмож- Возможными значениями М'г являются, таким образом, числа kx + /г2, k-L + k2 — Й, &! + k2 — 2h, ..., — kx — k2. Число, показывающее сколько раз встречается каждый из них, дается следующей схемой (мы полагаем для определенности К Ss k2): D6; Далее, каждое собственное значение К' величины К может комбинироваться с собственными значениями К', К' — Л, К' —2/г, ..., — К' величины М:, с тем же самым числом независимых собственных векторов К и М, для каждого из них. Полное число независимых собственных векторов оператора Mz, соответствующих собственному значению М'г, должно быть тем же самым независимо от того, рассмат- рассматриваем ли мы их как общие собственные векторы опера- операторов ти и т22 или операторов К, и Мг, т. е. всегда дается схемой D6). Отсюда следует, что собственными значениями К являются -2h kx-k% D7) 2—h,kx+kz—2h,..., kx—k2, kx—k2—h,... 3 ... 262+l 2k.2 + 2..
§ 36. СВОЙСТВА МОМЕНТА КОЛИЧЕСТВА ДВИЖЕНИЯ 19?- и что для каждого из этих собственных значений операто- операторов К и соответствующего собственного оператора М, имеется всего один независимый вектор, являющийся общим собственным вектором К и Мг. Следует отметить влияние вращения на собственные век- векторы переменных момента количества движения. Возьмем некоторый собственный вектор | М'г > компоненты по оси г от полного момента количества движения некоторой дина- динамической переменной и подвергнем его малому повороту вокруг оси z на угол бср. Учитывая равенство C2), получим, что этот вектор после поворота "перейдет в Гг) | М'г) = A - 1буМг/П) | М'г). Это равенство равносильно следующему: A - с точностью до членов второго порядка по бф. Таким обра- образом, | M'z) умножается на численный множитель e~i("fMzini Произведя последовательность малых вращений, мы нахо- находим, что поворот на конечный угол ф вокруг оси г вызывает умножение величины | М'г) на е—'<гмг/я- Полагая ф = 2л, мы находим, что полный оборот вокруг оси г не меняет | М'г), если собственное значе- значение М'г есть целое — кратное к, и меняет знак, если М'г равно полуцелому числу U. Рассмотрим теперь собствен- собственный вектор | К'> величины К- Если собственное значе- значение К' является целым кратным %, то возможные собствен- собственные значения Мг являются все целыми кратными Й, и полный оборот вокруг оси z не меняет | К' >. Наоборот, если К' равно полуцелому числу Н, то все собственные значения М будут полуцелыми числами Н, и полный обо- оборот вокруг оси г приводит к перемене знака | К'). Вслед- Вследствие симметрии вращение вокруг любой другой оси при- приводит к тому же результату для | К' )¦ Мы получаем, таким образом, общий результат: при полном обороте вокруг некоторой оси знак вектора состояния меняется или оста- остается неизменным в зависимости от того, соответствует ли вектор состояния такому собственному значению вели- величины полного момента количества движения, которое является целым кратным Н, или такому, которое является
200 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ нечетным кратным у Н. Состояние, очевидно, не изменяется при полном обороте, поскольку состояние не меняется при перемене знака соответствующего вектора. Для динамической системы, включающей только орби- орбитальные моменты количества движения, вектор не должен меняться при повороте вокруг оси. Действительно, тогда можно ввести шредингеровское представление, в котором все координаты диагональны, и шредингеровскии предста- представитель вектора состояния будет принимать при полном обороте начальное значение. Отсюда следует, что собствен- собственные значения величины орбитального момента количества движения всегда являются целыми кратными Я. Собствен- Собственные значения компоненты орбитального момента также всегда целые кратные U. Для спина шредингеровское пред- представление не существует, и здесь возможны оба типа соб- собственных значений. § 37. Спин электрона Электроны, а также некоторые другие элементарные частицы (протоны, нейтроны) имеют спин, величина кото- которого равна -к%. Это установлено на опыте, и, кроме того, имеются теоретические основания, указывающие на то, что эта величина спина более элементарна, чем любая другая, даже чем нулевой спин (см. гл. XI). Поэтому изучение этого частного значения спина особенно важно. При рассмотрении момента количества движения tn, величина которого равна -^-Н, удобно положить т=~По. D8) Компоненты вектора <т удовлетворяют, согласно формулам B7), соотношениям D9) = 2iay,
§ 37. СПИН ЭЛЕКТРОНА 201 Собственными значениями тг являются ^ Ь и — у#, так что собственными значениями стг будут 1 и —1, а о\ будет иметь всего одно собственное значение, равное 1. Отсюда следует, что а| должно быть равно 1, и анало гично ох и аи, т. е. oj} = <r» = oj = l. E0) Мы можем преобразовать уравнения D9) и E0) к более простому виду, применяя непосредственно правила неком- некоммутативной алгебры. Из равенства E0) получаем ofa - Wl = 0 или Оу (<yyoz - огоу) + (oy<jz - ozoy) ау = 0, откуда, принимая во внимание соотношения D9), имеем Это означает, что вхау — —ауах. Две динамические пере- переменные или два линейных оператора, удовлетворяющие закону умножения, как бы коммутативному, но с обратным знаком, мы будем называть антикоммутативными. Сле- Следовательно, ох антикоммутирует с ау. Вследствие симметрии каждая из трех динамических переменных ах, оу,аг должна антикоммутировать с любой другой. Уравнения D9) могут быть теперь записаны в виде ауог = iax = — y | | E1) Мы имеем также, учитывая E0), oxoyoz = t. E2) Уравнения E0), E1), E2) являются основными уравне- уравнениями, которым удовлетворяет спиновая переменная а при величине спина -=-#. Установим матричное представление для величин а, при- причем будем считать вг диагональной. Если в рассматриваемой системе нет других независимых динамических переменных, кроме т или а, то az само по себе образует полный набор
202 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ коммутирующих наблюдаемых, поскольку, согласно соотно- соотношениям E0) и E1), нельзя построить из ах, ау и аг другой динамической переменной, которая коммутировала бы с аг. Так как диагональные элементы матрицы, представляю- представляющей az, являются собственными значениями а2, а они равны 1 и —1, то сама матрица ог будет /1 0\ \0 -I)' Пусть ах представляется матрицей \а3 aj' Эта матрица должна быть эрмитовой, так что at и а4 дол- должны быть вещественными, а а2 и а3 комплексно-сопряжен- комплексно-сопряженными. Уравнение агах = —аког дает нам / ах ал __ _ fax — аЛ \—ая — о4/ W —aj' так что ах — а4 = 0. Следовательно, ах представляется матрицей вида /0 аЛ U 0/ Уравнение а* = 1 дает а2а3 — 1. Следовательно, а2 и а?, будучи комплексно-сопряженными, должны иметь вид е'а и е~'а соответственно, где а вещественно. Следовательно, ах представляется матрицей 0 е е-'а 0 Аналогично можно показать, что ау представляется матри- матрицей такого же вида. Путем подходящего выбора фазового множителя, который не определяется полностью условием диагональности аг, можно привести матрицу ах к виду \l Матрица для ау тогда определится из уравнения <уу = iaxoz. Таким образом, окончательно мы получаем три матрицы /О Г, /0 — Л /1 О 1 о;1 w о ' о -1
5 37. СПИН ЭЛЕКТРОНА 203 представляющие соответственно ах, ау и az, которые удо- удовлетворяют всем алгебраическим соотношениям D9) — E2). Проекция вектора а на произвольное направление, опре- определяемое направляющими косинусами /, т, п, именно 1ах + тОу + пог представляются матрицей / п l—im\ Представитель вектора состояния будет образован всего двумя числами, соответствующими двум значениям +1 и —1 величины а'г. Эти два числа образуют функцию пе- переменной а'г, причем область изменения этой переменной состоит только из двух точек +1 и —1. Состояние, для которого аг имеет величину 1, будет представлено функ- функцией fa (а'г), состоящей из пары чисел 1, 0, а состояние, для которого ог = —1, будет представлено функцией /р (а'г), состоящей из пары чисел 0, 1. Любая функция перемен- переменной а'г, т. е. любая пара чисел может быть представлена в виде линейной комбинации этих двух функций. Таким образом, любое состояние может быть получено супер- суперпозицией двух состояний, для которых аг равно соответ- соответственно + 1 и —1. Например, состояние, для которого проекция вектора а на направление /, т, п (см. выражение E4)) имеет величину +1, представляется парой чисел а, Ь, удовлетворяющей уравнению I » l-im\(a\fa\ \l + tm -n)\b) \b) ИЛИ па + (/ — im) b = a, (I -f- im) a — nb = b. Таким образом, a l — im 1 + л Это состояние можно рассматривать как суперпозицию двух состояний, для которых аг равно +1 и —1 с относитель- относительными весами | а |2: i b |а = [ / - im !2:11 - п |2 = A + п): A - /г). E5) Для полного описания электрона (или другой элементарной частицы со спином уй) необходимо иметь спиновую дина-
204 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ шческую переменную а, связанную со спиновым моментом количества движения формулой D8), а также декартовы координаты х, у, г и импульсы рх, ру, pz. Спиновые пере- переменные коммутируют с координатами и импульсами. Следо- Следовательно, полный набор коммутирующих наблюдаемых для одного электрона будет х, у, г, ог. В том представлении, в котором эти наблюдаемые являются диагональными, пред- представитель любого состояния будет функцией четырех пере- переменных х', у', г', а'г. Так как область изменения а'2 состоит всего из двух точек, именно, +1 и —1, эта функция че- четырех переменных есть то же самое, что две функции трех переменных, т. е. <*', у', г',\)+ = (х', у ', z', +1\),) ',z', -1|>. J ( > Таким образом, существование спина может быть учтено либо путем введения новой переменной в представитель состояния, либо путем употребления двухкомпонентного представителя. § 38. Движение в центральном силовом поле Атом состоит из массивного положительно заряженного1 ядра и некоторого количества электронов, движущихся вокруг ядра под действием притяжения к ядру и взаимного- отталкивания. Точное рассмотрение этой динамической си- системы является очень трудной математической задачей. Однако можно получить некоторую ориентировку в глав- главных чертах этой системы, если в качестве грубого приближе- приближения рассматривать каждый электрон как движущийся независимо в некотором центральном поле, а именно, в поле неподвижного ядра и в усредненном поле остальных элек- электронов. Таким образом, задача о движении частицы в цен- центральном силовом поле является краеугольным камнем, теории атома. Пусть декартовы координаты частицы, начало отсчета которых находится в силовом центре, будут х, у, z, а соот- соответствующие компоненты импульса — рх, ру, рг. Оператор Гамильтона, в пренебрежении релятивистскими эффектами,, имеет вид L +Р*г) + У, E7)
§ 38 ДВИЖЕНИЕ В ЦЕНТРАЛЬНОМ СИЛОВОМ ПОЛЕ 205 где V — потенциальная энергия, являющаяся функцией только от х2 + у2 + z1. Для дальнейшего удобно ввести сферическую систему координат. Мы введем сначала ра- радиус г, определенный как положительный квадратный корень 2 Его собственные значения лежат в интервале от 0 до оо Если вычислить СП г с рх, ру, рг, то с помощью фор- формулы C2) § 22 мы получим V,px] = i=y; [r,Py] = jr; [г, р,] = ±, т. е. то же самое, что в классической теории. Мы введем также динамическую переменную рп опреде- определяемую соотношением рг = г-1 (хрх + уру + грг). E8) СП от рг и г определяется из цепи равенств r[r> Pr] = [r, rpr] = [r, (хрх + уру + грг)] = = x[r, px] + y[r, py] + z[r, pj = Следовательно, ИЛИ rpr - prr = it. Перестановочное соотношение между г и рг как раз такое, как между канонической координатой и импульсом (формула A0) § 22). Это делает рг похожим на импульс, сопряженный с коор- координатой г, однако соответствие здесь не точное, поскольку рг не вещественно: выражение, сопряженное с рг, есть рг = (рхх + РУУ + Р*г) г 1 = (хрх + уру + zpz - ЫП) г-1 = = (грг - ЫП) г-1 =рг- 2Шт-\ E9) Оператор pr — ihr'1 веществен и поэтому является истин- истинным импульсом, сопряженным с г. Момент количества движения частицы m относительно начала координат дается выражением B2), а его величина k — выражением C9). Так как г и рг являются скалярами, то они коммутируют с т, а значит и с k.
206 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Мы можем выразить оператор Гамильтона через г, рг и k. Обозначая через Jv] сумму по всем циклическим переста- хуг новкам х, у, z и принимая во внимание выражение E9), имеем хуг хуг = 1](хРу хРу + УРх УРх - хру урх - урх хру) = хуг = У] (x2pl + i/pl — хрхруу — урурхх -f- " ?| - хрхрхх — 2Шхрх) = - (хрх + уру + грг) (рхх + р1:у + р = гг (Pi + Pl+Pi) - rpr (prr + 2itl) = Следовательно, М^ ^1) (б0) Это вьфажение для Я таково, что k коммутирует не только с Н, как и должно быть, поскольку k есть инте- интеграл движения, но также и с другими динамическими переменными, входящими в Я, а именно, с г, рГ и величи- величиной V, являющейся функцией от г. В силу этого возникает возможность упростить задачу, а именно, мы можем рас- рассматривать собственное состояние оператора k, относящееся к собственному значению k' и заменить в выражении F0) k на k'. После этого мы получаем задачу с одной степенью свободы г. Введем шредингеровское представление с диагональ- диагональными х, у, z. Тогда рх, ру, рг будут равны соответственно _ /* д _ ;ь — /ft д Состояние представляется волновой функцией ij) (x, у, z, t), удовлетворяющей уравнению Шредингера G) § 27, которое в данном случае при операторе Н, определяемом выраже нием E7), имеет вид «$?-{-?(?+?+?)+"}¦
§ 38. ДВИЖЕНИЕ В ЦЕНТРАЛЬНОМ СИЛОВОМ ПОЛЕ 207 Мы можем перейти от декартовых координат х, у, z к сфе- сферическим г, е, ф с помощью соотношений х = г sin 8 coscp, | t/ = r sin 8 sin ф, \ F2) 2 = rcos 6 J и можем выразить волновую функцию через сферические координаты, так что она перейдет в \|з (г, G, Ф, t). Фор- Формулы F2) дают операторное уравнение д _ дх д ,ду д . дг д_ х д . у д . z д дг ~~ WSx"^"dr ду"т~ ~дг dz ~ 7"дх~^'7 ду~т~ 7 Тг' из которого при сравнении с E8) получаем рг = — ih-к-. Таким образом, принимая во внимание F0), мы получим уравнение Шредингера в виде Здесь k — некоторый линейный оператор, содержащий только 6, ф, щ и ч~, поскольку он коммутирует ели Y- Из формулы kk h l l F4) вытекающей из соотношений C9) и F2), можно получить выражение k (k + Щ'- да - sine ае sinoae sin^edcp2" (ЬЬ> Этот оператор хорошо известен в математической физике. Его собственные функции называются шаровыми функциями, а его собственные значения равны п (п + 1), где п — целое число. Таким образом, теория шаровых функций дает дру- другое доказательство того, что собственные значения перемен- переменной k являются целыми кратными %. Для собственного состояния переменной k, соответству- соответствующего собственному значению пН (п — неотрицательное це- целое число), волновая функция имеет вид q = rl%(r, t)Sn(Q, ф), F6) где Sn F, ф) удовлетворяет k (k+h) sn F, Ф) = n (n -f i) msn (e, 9), F7)
208 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ т. е. на основании соотношения F5) Sn является шаровой функцией п-го порядка. Множитель Гх введен в правую часть F6) для удобства. Подставляя F6) в выражение F3), мы получаем следующее уравнение для %: tft( ln dt \2т Если состояние является стационарным, соответствующим значению энергии Н', то % будет иметь вид и уравнение F8) приводится к следующему: F9) Это уравнение может быть использовано для определения уровней энергии Н' рассматриваемой системы. Для каждого решения уравнения F9), относящегося к данному я, будет 2л + 1 независимых состояний, поскольку имеется 2« + 1 независимых решений уравнения F7), соответствующих 2л + 1 различным значениям проекции момента количества движения на некоторую ось, скажем mz. Вероятность нахождения частицы в элементе объема dx dy dz пропорциональна | г)з \2dx dy dz. Если \\i имеет вид F6), то эта вероятность будет г | %l2 | Sn\2dx dy dz. Вероятность нахождения частицы в шаровом слое между г и г -f- dr пропорциональна Ixl2^- Отсюда ясно, что при решении уравнений F8) или F9) нужно наложить краевое условие на % при г = 0. Именно, функция % должна быть такая, чтобы интеграл $|%|2dr сходился на нижнем пре- о деле. Если бы этот интеграл расходился, волновая функция представляла бы состояние, в котором вероятность нахож- нахождения частицы в начале координат была бы бесконечной. Такое состояние является физически недопустимым. Краевое условие при г = 0, полученное выше при рас- рассмотрении вероятности, однако, недостаточно жесткое (т. е. недостаточно ограничивает вид функции). Мы получим более жесткое условие, проверяя, что волновая функция, получен- полученная при решении волнового уравнения в сферических коор- координатах F3), действительно удовлетворяет волновому урав- уравнению в декартовых координатах F1).
§ 38. ДВИЖЕНИЕ В ЦЕНТРАЛЬНОМ СИЛОВОМ ПОЛЕ 209 Рассмотрим случай V = 0, соответствующий задаче о движении свободной частицы. В стационарном состоянии с энергией Н' = 0 уравнение F1) дает V2^ = 0, G0) 2 г, д2 , д2 , д2 где у — оператор Лапласа ^~j + ^ + з-у. а из уравнения F3) следует Одним из решений уравнения G1) для k — 0 является о(з = г. Оно не удовлетворяет уравнению G0), так как хотя yV исчезает для любого конечного г, интеграл от у2г по объему, содержащему начало координат, равен —4я. (Это можно доказать, преобразуя объемный интеграл в по- поверхностный с помощью теоремы Гаусса.) Следовательно, VV-1 = — 4пб (х) б (у) б (г). G2) Таким образом, не всякое решение уравнения G1) является решением уравнения G0). Обобщая этот результат, можно сказать, что не всякое решение уравнения F3) есть решение уравнения F1). Мы должны наложить на решение уравне- уравнения F3) условие, чтобы оно не стремилось к бесконечности при г->0, как г, для того чтобы при подстановке его в F1) не получилось дельта-функции в правой части ана- аналогично уравнению G2). Только если уравнение F3) допол- дополнено этим условием, оно становится эквивалентным уравне- уравнению F1). Таким образом, мы получаем условие гф -> 0 или %-> 0 при г-> 0. Имеются также краевые условия для волновой функции при г = оо. Если нас интересуют только «связанные» со- состояния, т. е. состояния, в которых частица не уходит в бесконечность, мы должны потребовать, чтобы интеграл со I !x(r)l2^r сходился на верхнем пределе. Эти связанные состояния не являются, однако, единственными допусти- допустимыми физически. Могут быть также состояния, когда частица приходит из бесконечности, рассеивается центральным сило- силовым полем и уходит опять в бесконечность. Для этих состоя- состояний волновая функция может оставаться конечной при г-> оо.
210 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Такие состояния будут рассматриваться в гл. VIII, пос- посвященной задачам столкновения. Во всяком случае, вол- волновая функция не должна стремиться к бесконечности при г->- оо, иначе она будет описывать состояние, не имеющее физического смысла. § 39. Уровни энергии атома водорода Приведенное выше рассмотрение может быть применено к задаче об атоме водорода, если пренебречь релятивистской механикой и спином электрона. Потенциальная энергия *) будет теперь равна —-, так что уравнение F9) примет вид d* п(я+1) , 2тез 11 ЫН' № 7* г-"йГу|Хо- р- Полное исследование уравнения проведено Шредингером **). Мы получим здесь собственные значения Я' уравнения G3) элементарным путем. Удобно положить Xo(r)=f(r)e-'/«, G4) введя таким образом новую функцию f (r); величина а равна одному из двух значений квадратного корня « = ±/("?4 G5) Уравнение G3) принимает вид Мы ищем решение этого уравнения в виде степенного ряда /(г) = ? «у*. G7) в котором последовательные значения s отличаются на еди- единицу, хотя сами по себе они не обязаны быть целыми. *) Букву е, обозначающую здесь величину заряда электрона, не следует смешивать с основанием экспоненциальной функции. **) Schrodinger, Ann, d, Physik, 1926, Bd. 79, S, 361,
§ 39. УРОВНИ ЭНЕРГИИ АТОМА ВОДОРОДА 211 Подставляя ряд G7) в уравнение G6), получаем что дает, после перегруппировки членов и приравнивания нулю коэффициента при rs~2, следующее соотношение между последовательными величинами cs: cs[s(s-l)-n (п + 1)] =c^i|^2 — p-j. G8) Мы видели в предыдущем параграфе, что допустимы только такие собственные функции х. которые стремятся к нулю при г-»-0, и согласно выражению G4), f (г) должно стре- стремиться к нулю при г -> 0. Ряд G7) должен, следовательно, обрываться со стороны малых s на некотором минимальном числе, большем нуля. Единственно возможными минималь- минимальными значениями s являются такие, при которых в соотно- соотношении G8) исчезает коэффициент при cs. Такими значениями будут п + 1 и —я, но во втором случае число s отрицатель- отрицательное или нуль. Значит, минимальное значение s должно быть я + 1. Так как я всегда целое число, то и все значения s будут целыми. Ряд G7), вообще говоря, простирается до бесконечности со стороны больших s. Согласно уравнению G8) для боль- больших s отношение последовательных членов равно Следовательно, ряд G7) всегда сходится, так как отношения далеких членов друг к другу такие же, как в ряде который сходится к е2г/а. Мы должны теперь исследовать поведение %о при боль- больших г. Следует различать два случая: когда Н' положительно и когда оно отрицательно. Для отрицательных Н' величина а, определяемая из выражения G5), будет вещественной. Допустим, что квадратный корень в а берется с положитель-
212 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ ным знаком. Тогда при г->- оо сумма ряда G7) будет стре- стремиться к бесконечности по тому же закону, что и сумма ряда G9), т. е. как е2г/а. Как видно из G4), величина %0 будет поэтому стремиться к бесконечности по закону ег/а, и не будет описывать какое-либо физически возможное сос- состояние. Поэтому для отрицательных Н', вообще говоря, допустимого решения уравнения G3) не существует. Исключением будет случай, когда ряд G7) обрывается со стороны больших s. В этом случае все краевые условия удовлетворяются. Условие, при котором ряд обрывается, состоит в том, что коэффициент прис5_х в выражении G8) обращается в нуль при некотором значении индекса s — 1 не меньшем, чем его минимальное значение п + 1. Это усло- условие равносильно равенству для некоторого целого s, величина которого не меньше чем п + 1. С учетом выражения G5) это условие принимает в; д и дает значения уровней энергии. Так как s может быть любым положительным числом, формула (80) дает дискрет- дискретную совокупность отрицательных уровней энергии атома водорода. Они находятся в соответствии с экспериментом. Для каждого из них (за исключением наинизшего состояния s = 1) имеется несколько независимых состояний, так как имеются различные возможные значения п, именно, любое целое положительное число, меньше s или нуль. Та крат- кратность состояний, соответствующих одному уровню энергии, о которой здесь идет речь, имеет место сверх упомянутой в предыдущем параграфе кратности состояний, возникающей благодаря различным возможным значениям проекции момента количества движения, и имеющей место в любом центральном поле. Дополнительная кратность состояний с данной энергией получается лишь в кулоновском поле, но даже и в этом случае она исчезает, как показано в гл. XI, если честь релятивистскую механику. Решение %0 уравне- уравнения G3) при Н', удовлетворяющем соотношению (80), стре- стремится к нулю экспоненциально при r-v оо, и представляет связанное состояние (соответствующее эллиптическим орби- орбитам теории Бора).
§ 40. ПРАВИЛА ОТБОРА 213 Для любого положительного значения И' величина а, даваемая формулой G5), будет чисто-мнимой. Ряд G7), который при больших г ведет себя как ряд G9), будет иметь сумму, остающуюся конечной при r-э-оо. Значит, вели- величина х0, определяемая формулой G4), будет конечной при г-у оо, и будет поэтому допустимым решением уравнения G3). Это решение дает волновую функцию г|), убывающую при г -v оо как г. Следовательно, в дополнение к дискрет- дискретной совокупности отрицательных уровней энергии (80), воз- возможны также все уровни с положительной энергией. Сос- Состояния с положительной энергией не являются связанными, так как для них интеграл J | %o \2dr расходится на верхнем пределе (эти состояния соответствуют гиперболическим орбитам в теории Бора). § 40. Правила отбора Если динамическая система приведена в некоторое стационарное состояние, то она будет оставаться в этом состоянии до тех пор, пока на нее не подействует некоторая внешняя сила. Однако практически любая атомная система часто подвергается воздействию внешнего электромагнит- электромагнитного поля, вследствие чего становится возможным переход из одного стационарного состояния в другое. Теория таких переходов будет развита в §§ 44 и 45. Как вытекает из этой теории, можно с большой степенью точности утверждать, что переходы между двумя состояниями под действием электромагнитного поля не могут происходить, если в гей- гейзенберговском представлении, в котором два рассматривае- рассматриваемых состояния выбираются в качестве базисных, соответ- соответствующий матричный элемент вектора дипольного момента D исчезает. Для многих атомных систем оказывается, что гро- громадное большинство матричных элементов D в гейзен- гейзенберговском представлении в самом деле обращается в нуль, и следовательно, имеются сильные ограничения на возмож- возможности переходов. Правила, выражающие эти ограничения, называются правилами отбора. Представление о правилах отбора может быть уточнено путем более детального применения теории §§ 44 и 45, согласно которой матричные элементы различных компо- компонент D в декартовых координатах соответствуют различным
214 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ состояниям поляризации электромагнитного излучения. Это соответствие как раз такого рода, какого следовало бы ожидать, если рассматривать матричные элементы, точнее их вещественные части, как амплитуды гармонических осцилля- осцилляторов, взаимодействующих с электромагнитным полем согласно классической электродинамике. Имеется общий метод получения гсех правил отбора. Обозначим интегралы движения, являющиеся диагональ- диагональными в гейзенберговском представлении, через а, и пусть D — одна из компонент D в декартовых координатах. Мы должны получить алгебраическое уравнение, связываю- связывающее D и а, которое не содержало бы других динамических переменных, кроме D и а, и являлось линейным *) отно- относительно D. Такое уравнение будет иметь вид ZfrDgr-0, (81) г где величины / и g — функции только от а. Если это урав- уравнение выразить через представители, то получится или, иначе, откуда видно, что <а' D а") = 0, если только не выполняется соотношение 2M°O&(aff) = 0. (82) Г Поскольку последнее уравнение дает связь между а' и а", которая должна существовать, чтобы (a' \D \a") могло не обращаться в нуль, это уравнение и представляет пра- правило отбора для компоненты D величины D. Рассмотрение гармонического осциллятора в § 34 дает пример правила отбора. Уравнение (8) имеет тот же вид, что и (81), причем fj стоит вместо D и Н играет роль а. Оно показывает, что все матричные элементы (#' | ц \ Н") исчезают, за исключением тех, для которых Н" — Н' = йсо. *) И однородным. {Прим. В. А. Фока),
§ 40. ПРАВИЛА ОТБОРА 215 Так как оператор q пропорционален т) — т), то все его матричные элементы (#' \q \ H") исчезают, за исключением тех, для которых Н" — Н' — ±Ны. Если гармонический осциллятор несет электрический заряд, то его дипольный момент D пропорционален q. Таким образом, правило отбо- отбора здесь состоит в том, что возможны лишь те переходы, при которых Н меняется только на один квант %и>. Получим теперь правила отбора для операторов тг и k в задаче об электроне, движущемся в центральном поле. Компоненты дипольного момента здесь пропорциональны декартовым координатам х, у, г. Рассматривая сначала mz, мы имеем, что тг коммутирует с г, т. е. что mzz — zmz = 0. Это — уравнение требуемого типа (81), дающее правило отбора m'z-m"z=0 для компоненты дипольного момента по оси г. Далее, из уравнений B3) мы имеем [тг, [тг, х]]^[тг, у] = — х или mix — 2тгхтг + xml — h2x = 0, что также имеет вид (81) и дает правило отбора т'г — 2m'zm"z + т"г —Н2 = 0 или (т'г - т"г — ft) (т'г — т"г +ft) = 0 для компоненты дипольного момента по оси х. Правило отбора для компоненты по оси у такое же самое. Таким образом, наши правила отбора для tnz состоят в том, что при переходе, связанном с излучением, поляризация которого соответствует диполю, ориентированному по оси z, вели- величина m'z не может меняться, тогда как при переходах, для которых поляризация соответствует ориентациям диполя по оси х или у, величина т'г должна меняться на ±%. Состояние поляризации излучения, связанного с перехо- переходом, для которого т'г меняется на ±й, мы можем опреде- определить более точно, рассматривая условия, при которых не исчезают матричные элементы х + iУ и х — iy.
216 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ Имеем [тг, или тг (х + iy) -(x + iy) (mz + К) = О, что опять имеет вид (81). Отсюда получаем т'г — m'z—H~0 как условие того, что величина (т'г | х -f- iу \ т"г) не обязана равняться нулю. Аналогично т'г — тг+Н = 0 есть условие того, что величина (т'2 | х — iy \ т"г) не обя- обязана равняться нулю. Следовательно, имеем (m'z\x-iy\m'z-h) = 0, и мы можем положить (m'z\x\mz-h) = i (m'z\y\m'z-H) = (a + ib) еш, где a, ft и со вещественны. Выражение, комплексно-сопря- комплексно-сопряженное этому, будет (т'г-П\х\т'г)=— i(m'z-H\y\ т'г)=(а-ib)e~m. Состояние поляризации излучения, связанного с переходом, в котором m'z = т'г — к, определяется вектором Этот вектор имеет следующие три компоненты: = у {(а + ib) еш + (а - ib) е~ш} = a cos со* - ft sin at, = ~i{—(a + ib) еш + {a — ib) e~m) = a sin Ы + ft cos со/, j {{m^ j z j m; - ft) + <mi - Й j г, m^)) = 0. (83)
§ 40. ПРАВИЛА ОТБОРА 217 Отсюда видно, что излучение, распространяющееся в нап- направлении оси г, является поляризованным по кругу; излу- излучение, распространяющееся в любом направлении в плоско- плоскости ху, будет линейно поляризованным в этой плоскости; излучение, распространяющееся в промежуточном направ- направлении, будет эллиптически поляризованным. Направление круговой поляризации для излучения, распространяюще- распространяющегося вдоль оси г, зависит от того, положительна или отрица- отрицательна величина со, что в свою очередь зависит от того, какое из состояний т'г или т"г = т'г — % имеет большую энергию. Определим теперь правила отбора для к. Имеем [k(k+H), z] = [mx, z] + [ml, z]=— ytnx-m.xy + xmy + myx=r- = 2 (niyX - tnxy + ihz) = 2 (triyx - ymx) = 2 (xmy - mxy). Аналогично и [k(k + h), у] =» 2 (mxz—xmz). Следовательно, x}-2mx[k(k + h), y]+2ifl[k(k + H), z] = imy (ymz — rriyZ) — \mx (mxz — xmz) + Из соотношения B2) имеем mxx -f myy + mzz = 0 (84) и, следовательно, [k(k + h), [k(k + h), z]]= — 2{k(k + H)z + zk(k + fl)}, откуда вытекает fe2 (? _(_ ^J z _ 2k (k + ft) zk {k + h) -f zk* (k + %f - — 2ft2{?(? + /Z)z+z&(&+ft)}=0. (85) Аналогичные уравнения справедливы для х и у. Эти урав- уравнения имеют требуемый вид (81) и дают нам правило отбора k'* (k' + %f - 2k' (k' + ft) k" (k" + h) + К (k" + %)* ~ - 2Wk' (ft' + ft) - 2Й2/?" (k" + ft) = 0,
218 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ которое приводится к (k' + k" + 2ft) (k' + k") (k' - k" + ft) (k' - k" - ft)=0. Переход между двумя состояниями k' и k" может иметь место, только если один из четырех множителей обращается в нуль. Первый из этих множителей (k' + k" + Щ никогда не обращается в нуль, так как все собственные значения k положительны или равны нулю. Второй множитель (k' -\~ k") может обратиться в нуль, только если k' — 0 и k" = 0. Но переход между двумя состояниями с этими значениями k не может происходить из-за других правил отбора. Это можно видеть из следующих соображений. Если два состоя- состояния (обозначаемые штрихом и двумя штрихами) таковы, что k' = 0 и k" = 0, то из неравенства D1) и соответствую- соответствующих результатов для тх и ту вытекает т'х = т'у — т'г = 0 и т"х — ml = т'г — 0. Но правило отбора для тг показывает, что матричные элементы хну, относящиеся к этим двум состояниям, должны исчезать, поскольку величина mz не меняется при переходе. Аналогично правила отбора для тх и ту показывают, что матричный элемент z также ис- исчезает. Итак, переходы между этими двумя состояниями не могут происходить. Наше правило отбора для k сводится к откуда видно, что k должно меняться на ±Н. Это правило отбора может быть записано в виде и так как это есть условие того, что матричный элемент (k' | г | k") не обязан равняться нулю, мы получаем урав- уравнение или [k, [k, г]]—— г. (86) Этот результат едва ли может быть получен более прямым путем. В качестве заключительного примера мы получим пра- правило отбора для величины К, полного момента количества движения М атомной системы общего вида. Пусть х, у, z будут координаты одного из электронов. Мы должны по-
§ 40. ПРАВИЛА ОТБОРА 219 лучить условие того, что матричный элемент величин х, у или z с индексами k' и k" не обязан равняться нулю. Это, очевидно, то же самое, что и необходимое условие неравен- неравенства нулю матричного элемента с индексами k' и к" для величин кг, Я2 или к3; где къ к2 и кя — любые три незави- независимые линейные функции х, у и z с числовыми коэффициен- коэффициентами. Это условие может быть заменено более общим, когда вместо численных коэффициентов упомянутые линейные функции могут иметь любые коэффициенты, коммутирую- коммутирующие с К, а значит, и представимые матрицами, диагональ- диагональными относительно К. Пусть кх = Myz — Мгу — ihx, ку = Мгх — Mxz — ihy, К = Mxy — Мух — ihz. Мы имеем, учитывая B9), Мхкх + Му%у + MX = 2 (MxMyz - MxMzy = 2 (МХМУ - М„Л!, - ИМ,) z = 0. (87) Таким образом, Я^, А,^, Яг не являются линейно независимыми функциями х, у, z. Однако, любые две из них, вместе с к0, образуют три линейно независимые функции и могут быть взяты в качестве к1, к2, к3, поскольку все коэффициенты Мх, My и Mz коммутируют с К- Наша задача, таким образом, сводится к отысканию условия, при котором матричные элементы величин к0, кх, ку, к2 с индексами К' и /С" могут не обращаться в нуль. Физический смысл этих величин к состоит в том, что к0 пропорционально проекции вектора (х, у, z) на направление М, а кх, ку, кг пропорциональны декартовым компонентам проекции (х, у, г) на направление, перпендикулярное к М. Так как к0 — скаляр, то он должен коммутировать с К- Отсюда следует, что только диагональные матричные элементы (К' \ к0 \ К') величины к0 могут отличаться от нуля. Таким образом, для величины К правило отбора по
220 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ индексу Хп состоит в том, что К не меняется. Применяя соот- соотношения C0) к вектору Хх, Ху, Хг, имеем [Мг, ЪХ] = ХУ, [Мг, Ху\= — Хх, [Мг, Xz} = 0. Эти соотношения между Мг и Хх, Ху, Хг имеют в точности тот же вид, что и соотношения B3), B4) между mt и х, у, г. Кроме того, соотношение (87) имеет тот же вид, что и (84). Таким образом, динамические переменные Хх, Ху, Хг имеют по отношению к моменту количества движения М такие же свойства, как и х, у, z по отношению к т. Поэтому можно перенести вывод правила отбора по индексу k, проведенный для случая, когда дипольныи момент пропорционален х, у, г на правило отбора по К для случая, когда дипольныи мо- момент пропорционален (Хх, Ху, Хг). Мы находим таким путем, что по отношению к Хх, Ху, Хг правило отбора состоит в том, что К должно меняться на ±h. Собирая вместе результаты, мы получаем в качестве правила отбора для К,, что оно должно меняться на 0 или ±U. Мы рассматривали дипольныи момент, происходящий от одного из электронов, но такое же правило отбора должно выполняться для каждого электрона, и следовательно, также для суммарного дипольного момента. § 41. Явление Зеемана для атома водорода Рассмотрим атом водорода в однородном магнитном поле. Оператор Гамильтона E7) с V — , описывающий атом водорода в отсутствие внешнего поля, видоизменяется магнитным полем, причем, согласно классической механике, видоизменение состоит в заменерх, ру, рг на [рх-\— Ах , V с 1 где Ах, Аи, Аг— компоненты вектор-потенциала, описывающего поле. Для однородного поля величины <Ж, направленного по оси г, мы можем взять Классическая функция Гамильтона будет тогда иметь вид 1 I е \ > I | р Н^1т №* - 2Т^У + [Ри + 2 Т ^ Х
§ 41. ЯВЛЕНИЕ ЗЕЕМАНА ДЛЯ АТОМА ВОДОРОДА 221 Эта классическая функция может быть перенесена в кван- квантовую механику, если мы добавим член, учитывающий спин электрона. Согласно экспериментальным данным и согласно тео- теории гл. XI электрон имеет магнитный момент — ^— о, где а — спиновый вектор, введенный в § 37. Энергия этого магнитного момента в магнитном поле будет -^— ог. Таким образом, полный квантовый оператор Гамильтона будет *¦ Строго говоря, в операторе Гамильтона должны быть еще члены, дающие взаимодействие магнитного момента электрона с электрическим полем ядра атома. Однако этот эффект мал, — он того же порядка величины, что и реля- релятивистские поправки, и мы им здесь пренебрежем. Он будет учтен в релятивистской теории электрона в гл. XI. Если магнитное поле не слишком велико, мы можем пре- пренебречь членами, содержащими ~Ж'*, так что оператор Га- Гамильтона (88) приводится к виду н = 1^ Добавочные члены, возникающие благодаря магнитному полю, будут иметь вид е>эЖ'/2тс- (тг + Яаг). Но эти доба- добавочные члены коммутируют с полным оператором Гамиль- Гамильтона и, следовательно, являются интегралами движения. Это обстоятельство сильно упрощает задачу. Стационар- Стационарными состояниями системы, т. е. собственными состояниями оператора Гамильтона (89) будут такие собственные состоя- состояния оператора Гамильтона без поля, которые являются одновременно собственными состояниями наблюдаемых тг и ог, или, по крайней мере, одной наблюдаемой тг + Hoz. Если ограничиться связанными состояниями, то уровнями энергии данной системы будут уровни энергии (80) системы без поля, к которым добавляется собственное значение величины %—(тг-\-Ног). При этом, если рассматривать л/ttXC
222 ГЛ. VI. ЭЛЕМЕНТАРНЫЕ ПРИЛОЖЕНИЯ те стационарные состояния системы без поля, для которых тг имеет численное значение т'г, кратное h и для которых также az имеет численное значение g'z, to эти стационарные состояния останутся стационарными состояниями также и при наличии поля. Добавка к энергии будет складываться из двух частей: часть -^— т'г возникает вследствие орби- орбитального движения, и ее можно рассматривать как проис- происходящую от орбитального магнитного момента, — —-, тогда как часть -^— fto'z происходит от спина. Отношение орбитального магнитного момента к орбитальному механи- механическому моменту т'г равно — -^—, что вдвое меньше отноше- отношения спинового магнитного момента к спиновому механи- механическому моменту. Этот факт иногда называют магнитной аномалией спина. Так как уровни энергии теперь содержат mz, то правила отбора для тг, полученные в предыдущем параграфе, становятся доступными непосредственной эксперименталь- экспериментальной проверке. Введем гейзенберговское представление, в котором т2 и ог диагональны, как и другие интегралы движения. Правило отбора для тг требует изменения тг на Й, 0 или —U, тогда как а2 не будет вообще меняться, поскольку аг коммутирует с дипольным моментом. Значит, разность энергий двух состояний, участвующих в процессе перехода, будет отличаться от своего значения при отсут- отсутствии поля на величину -»—, 0 или —~~—• Согласно усло- условию частот Бора отсюда следует, что частоты соответствую- соответствующего электромагнитного излучения будут отличаться на е° 0 или — ~ от частот в отсутствие магнитного поля. Это означает, что каждая спектральная линия рас- расщепляется под действием магнитного поля на три компо- компоненты. Если рассматривать излучение, распространяющееся вдоль оси г, то, как следует из формул (83), две боковые компоненты будут поляризованы по кругу, тогда как цен- центральная несмещенная компонента будет иметь интенсив- интенсивность, равную нулю Эти результаты согласуются с опытом, а также с классической теорией явления Зеемана.
ГЛАВА VII ТЕОРИЯ ВОЗМУЩЕНИЙ § 42. Общие замечания В предыдущей главе было проведено точное рассмотрение некоторых простейших систем в квантовой теории. Боль- Большая часть квантовых задач, однако, не может быть решена современными средствами математики, так как эти задачи приводят к уравнениям, решение которых не может быть выражено в конечном виде с помощью обычных функций анализа. Для таких задач часто оказывается применимым метод возмущений. Он состоит в том, что производится разделение оператора Гамильтона на две части, одна из которых должна быть простой, а другая малой. Первую часть можно рассматривать как оператор Гамильтона упрощенной или невозмущенной системы, поддающейся точному исследованию, а добавление второй части тогда потребует малых поправок, имеющих характер возмущения, в решение задачи для невозмущенной системы. Требование, чтобы первая часть была простой, практически означает также, что она не должна содержать явно время. Если вто- вторая часть содержит малый числовой множитель е, мы можем получить решение наших уравнений для возмущенной сис- системы в виде ряда по степеням е; в том случае, если ряд схо- сходится, он дает решение задачи с любой желаемой степенью точности. Но даже если ряд не сходится, то часто первое приближение, получаемое с его помощью, оказывается довольно точным. В теории возмущений имеются два различных метода. В одном из них возмущение рассматривается как причина изменения состояний движения невозмущенной системы. В другом мы не рассматриваем изменения состояний невоз- невозмущенной системы, но предполагаем, что возмущенная система вместо того, чтобы оставаться постоянно в одном
224 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ из этих состояний, непрерывно переходит из одного в дру- другое или совершает переходы под влиянием возмущения. Какой из методов следует использовать в каждом частном случае, зависит от характера задачи, подлежащей решению. Первый метод обычно полезен только тогда, когда энергия возмущения (поправка к оператору Гамильтона невозму- невозмущенной системы) не содержит в явном виде время, и поэтому применяется к стационарным состояниям. Он может быть использован для расчета таких величин, которые не отно- относятся к какому-либо определенному моменту времени, как, например, уровни стационарных состояний возмущенной системы, или в случае задач о столкновениях вероятность рассеяния на данный угол. Второй метод должен, напротив, применяться для решения всех задач, где встречается время, например таких, как явления перехода при внезапном наложении возмущения, или в более общих задачах, где возмущение изменяется со временем произвольным образом (т. е. энергия возмущения содержит время явно). Кроме того, второй метод должен также применяться в некоторых задачах о столкновениях, несмотря на то, что энергия воз- возмущения здесь не зависит явно от времени, а именно в тех задачах, где нужно рассчитывать вероятность испускания или поглощения; эти вероятности, в отличие от вероятности рассеяния, не могут быть определены безотносительно к условиям, которые меняются с течением времени. Можно суммировать отличительные черты обоих мето- методов, сказав, что в первом методе сравниваются стационарные состояния возмущенной и невозмущенной системы; во вто- втором же методе берут стационарное состояние невозму- невозмущенной системы и изучают его изменение со временем под влиянием возмущения. § 43. Изменение уровней энергии, вызываемое возмущением Первый из вышеупомянутых методов мы теперь приме- применим к расчету изменения уровней энергии системы, вызы- вызываемого возмущением. Предполагаем, что энергия возму- возмущения, так же как и оператор Гамильтона невозмущенной системы, не содержит времени явно. Наша задача имеет смысл, разумеется, только при том условии, что уровни энергии невозмущенной системы являются дискретными и
§ 43. ИЗМЕНЕНИЕ УРОВНЕЙ ЭНЕРГИИ 225 разность между ними велика по сравнению с их изменением, вызванным возмущением. Необходимость учитывать это обстоятельство приводит к тому, что имеются некоторые различия в применении первого метода в зависимости от того, являются ли уровни энергии невозмущенной системы дискретными или непрерывными. Пусть оператор Гамильтона возмущенной системы будет H = E + V, A) где Е — оператор Гамильтона невозмущенной системы, а V — малая энергия возмущения. По предположению, каждое собственное значение Я' оператора Я лежит очень близко к одному-единственному собственному значению Е' оператора Е. Мы будем ставить то же самое число штрихов для обозначения некоторого собственного значения Я и собственного значения Е, лежащего близко от него. Таким образом, Я" будет отличаться от Е" на малую величину порядка V, но будет отличаться от Е' на величину, не явля- являющуюся малой, если только не имеет места равенство Е' = Е". Мы должны все время заботиться о том, чтобы употреблять различнее число штрихов для обозначения соб- собственных значений Я и Е, которые не должны лежать близко друг к другу. Для определения собственных значений Я нужно решить уравнение Я Н') = Н'\Н') или (H'-E)\H') = V\H'). B) Пусть | 0) — собственный кет-вектор Е, соответствующий собственному значению ?". Допустим, что \Н') и Я', удовлетворяющие уравнению B), мало отличаются от век- вектора | 0) и Е' соответственно и выражаются в виде где | 1 > и ах ¦— первого порядка малости (т. е. того же порядка, что и V), | 2) и о2 — второго и т. д. Подставляя эти выражения в B), получим
226 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ Если мы отделим члены нулевого порядка, первого порядка, второго порядка и т. д., то получится следующая система уравнений: (?'?)|0> 0 (Е'-Е)\ 1>+а1|0) = (E'-E)\2)+a1\l)+at\0) = D) Первое из этих уравнений сз гачает то, что было уже пред- предположено, а именно, что | 0) является собственным векто- вектором Е, относящимся к собственному значению Е'. Другие уравнения дают возможность вычислить различные по- поправки. Для дальнейшего удобно ввести представление, в кото- котором Е диагонально, т. е. гейзенберговское представление для невозмущенной системы, и взять само Е как одну из наблюдаемых, собственными значениями которой нумеру- нумеруются представители. Другие наблюдаемые, если они необходимы, как, напри- например, в случае, когда одному собственному значению Е соот- соответствует более чем одно состояние, обозначим через р. Базисный бра-вектор будет (?"'|3" |. Так как | 0) — соб- собственный кет-вектор Е, относящийся к собственному зна- значению Е', то имеем , E) где / (Р") — некоторая функция переменных Р". С помощью этого соотношения второе из уравнений D), выраженное через представителей, принимает вид (?' - Е"){ЕУ\ 1) +а1бя»?'/:(П = 5 <?Т1 V|J?T>/(P'). F) Полагая здесь Е" = Е', получаем %/(П = 2<?'ПУ|?'Р'>/(Р'). G) В' Уравнение G) имеет по отношению к переменным р стандартный вид уравнения теории собственных значений. Оно показывает, что различные собственные значе- значения аг являются собственными значениями матрицы (?"Р" | V |?"Р'). Эта матрица есть часть представителя энергии возмущения в гейзенберговском представлении
§ 43. ИЗМЕНЕНИЕ УРОВНЕЙ ЭНЕРГИИ 227 для невозмущенной системы, именно, часть, состоящая из таких матричных элементов, строки и столбцы которых относятся к одной и той же невозмущенной энергии Е'. Каждое из этих значений ах дает в первом приближении уровни энергии возмущенной системы, лежащие близко к уровню энергии невозмущенной системы *). Итак, в воз- возмущенной системе может быть несколько уравнений энергии, лежащих вблизи одного уровня ?" невозмущенной системы. Их число может быть любым, не превосходящим числа независимых состояний невозмущенной системы, соответ- соответствующих уровню энергии Е'. Таким образом, возмущение может вызвать полное или частичное расщепление тех уров- уровней энергии, которые сливаются в значение Е' для невозму- невозмущенной системы. Уравнение G) также определяет в нулевом приближении представители (Е"§" | 0) стационарных состояний возмущен- возмущенной системы, соответствующие уровням энергии, лежащим вблизи ?". Каждое решение / (р") уравнения G), будучи под- подставлено в E), дает один из таких представителей. Каждое из этих стационарных состояний возмущенной системы близко к одному из стационарных состояний невозмущен- невозмущенной системы. Но обратное — что каждое стационарное состояние невозмущенной системы близко к одному из состояний возмущенной системы — неверно, так как об- общее стационарное состояние невозмущенной системы, соот- соответствующее уровню энергии Е', имеет представителем правую часть выражения E) с произвольной функцией / (р"'). Задача определения стационарного состояния невоз- невозмущенной системы, близкого к стационарному состоянию возмущенной системы, т. е. задача отыскания решения / (Р') уравнения G) соответствует задаче «вековых возму- возмущений» классической механики. Следует отметить, что полу- полученные выше результаты не зависят от величины всех тех матричных элементов энергии возмущения, которые отно- относятся к двум различным уровням энергии невозмущенной системы. *) Для того чтобы различать эти уровни энергии, необходима более разработанная система обозначений, так как при настоящих обоз- обозначениях эти уровни все должны обозначаться одним и тем же числом штрихов — именно таким, как уровень энергии невозмущенной системы, из которого они происходят. Для наших целей, однако, эта более разра- разработанная система обозначений не понадобится,
228 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ Посмотрим, что получается в простейшем случае, когда имеется всего одно стационарное состояние невозмущенной системы, относящееся к одному уровню энергии *). В этом случае переменная Е сама определяет представление и пере- переменную р вводить не нужно. Сумма G) сводится к единственному члену, и мы полу- получаем ai~(E'\V\E'). (8) Имеется всего один уровень возмущений системы, лежащей вблизи некоторого уровня энергии невозмущенной системы: изменение в анергии в первом приближении равно соответ- соответствующему диагональному элементу энергии возмущения в гейзенберговском представлении для невозмущенной сис- системы, или среднему значению энергии возмущения в соответ- соответствующем невозмущенном состоянии. Последняя формули- формулировка результата та же самая, что и в классической меха- механике, когда невозмущенная система является многократно периодической (условно-периодической). Перейдем теперь для случая невырожденной системы к расчету поправки второго порядка а2 к уровню энергии. Уравнение E) в этом случае, в пренебрежении несуществен- несущественным числовым множителем, принимает вид <?'|0) = б?.?., а уравнение F) принимает вид (?' - Е") (Е" | 1) + а^Б-в' = (Е° | V \ Е'). Отсюда получаем величину (Е" | 1), когда Е" Ф Е', именно . да Третье из уравнений D), выраженное через представители, принимает вид (?'-Е'){Е" \2) + ах (Е" | 1) + афЕ»Е- = *) Система, в которой каждому уровню энергии принадлежит только одно собственное значение, часто называется невырожденной, а система с двумя или более состояниями, принадлежащими одному уровню энергии, называется вырожденной, хотя эти термины являются не совсем подходящими с современной точки зрения. (В § 39 автором применен более удачный термин «кратность состояний». {Прим. В. А. Фот))
§ 44. ВОЗМУЩЕНИЕ КАК ПРИЧИНА ПЕРЕХОДОВ 229 Полагая здесь Е" — Е', получим a1(E'\l)+a2~2l(E'\V\E"')(E"'\l), Е'" что с помощью равенства (8) сводится к выражению «2= 2 (E'\V\E'")(E"\1). Е"фЕ' Подставляя (Е" | 1) из (9), мы находим окончательно <Е'\У\Е')(Е'\У\Е') а2- Е"фЕ' Отсюда получается следующее выражение для полного из- изменения энергии во втором приближении: | Е") Е"фЕ' Этот метод может быть распространен, если нужно, на ра- расчет высших приближений. Общие рекуррентные формулы, выражающие поправку «-го порядка через поправки низ- низших порядков, были получены Борном, Гейзенбергом и Иорданом *). § 44. Возмущение как причина переходов Перейдем теперь к рассмотрению второго метода теории возмущений из тех двух, о которых шла речь в § 42. Мы предположим опять, что имеется невозмущенная система, характеризуемая оператором Гамильтона Е, не содержащим время явно, и энергия возмущения V, которая может быть произвольной функцией времени. Оператор Гамильтона возмущенной системы будет Н = Е -f V. Для рассматри- рассматриваемого метода не составляет существенного различия, будет ли спектр энергии невозмущенной системы, т. е. спектр собственных значений Е, дискретным или сплошным. Мы возьмем для определенности случай дискретных сос- состояний. Будем опять работать с гейзенберговским предста- представлением для невозмущенной системы; но поскольку теперь *) Z. f, Physik, 1925, Bd. 35, S. 565.
230 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ собственные значения ? не будут представлять в качестве значков при нумерации представителей никакого преиму- преимущества, мы предположим, что в качестве нумерующих значков используется какая-то сововокупность наблюдае- наблюдаемых а. Предположим, что в начальный момент времени t0 сис- система находится в состоянии, когда а имеют определенные значения а'. Вектор, соответствующий этому состоянию, есть базисный вектор | а'). Если бы не было никакого воз- возмущения, т. е. если бы оператор Гамильтона был Е, это состояние было бы стационарным. Возмущение приводит к изменению состояния. В момент времени t вектор, соответ- соответствующий состоянию в шредингеровской картине, будет Т | а') согласно уравнению A) § 27. Вероятность того, что а будут иметь значения а", равна Р(а'а") = |(а"|Т|а')|2. A1) При а" =?-- а' Р (а'а") представляет собой вероятность пере- перехода из состояния а' в состояние а" за промежуток времени /„ —>- /, тогда как Р (а'а') — вероятность того, что никакого перехода не произойдет. Сумма Р (а'а") по веема", очевидно, равна единице. Допустим теперь, что первоначально система не находи- находилась в одном определенном состоянии а', а могла находиться в различных состояниях а' с вероятностью Р& для каждого из них. Гиббсовская плотность, соответствующая этому распределению, будет, согласно F8) § 33, p=2la')^'(«'l- A2) а' К моменту времени t каждый кет-вектор | а') перейдет в Т | а' > и каждый бра-вектор (а | — в (а' | Т, так что р перейдет в р/- Е т I °О Лх-<«'I г. A3) а' Тогда вероятность того, что величины а будут иметь зна- значения а", будет, как вытекает из формулы G3) § 33 и фор- формулы (И), равна (а" | р, | О = Ц (а" | Г | а') Ра, (а' | Г | а") = ? Р«'Р (а', а'). «' а' A4)
§ 44. ВОЗМУЩЕНИЕ КАК ПРИЧИНА ПЕРЕХОДОВ 231 Этот результат показывает, что вероятность нахождения системы в момент времени t в состоянии а" слагается из двух частей. Первая часть равна произведению двух величин: вероятности находиться с самого начала в состоянии а" и вероятности не сделать никакого перехода; вторая часть есть сумма произведений вероятности находиться вначале в состоянии а' =? а" на вероятность сделать отсюда переход в состояние а". Таким образом, вероятности различных переходов вносят вклад независимо друг от друга, что согла- согласуется с обычными законами теории вероятностей. Итак, задача расчета переходов сводится к определению амплитуд вероятности (а" \Т | а'). Они могут быть полу- получены из дифференциального уравнения F) § 27 для Т ^ . A5) Вычисление можно упростить, если перейти к величине Т*=е1Е«-^'пТ. A6) Имеем A7) где У* = т. е. У* получается путем применения некоторого унитар- унитарного преобразования к V*). Уравнение A7) более удобно, чем A5), так как в уравне- уравнении A7) изменение Т* определяется целиком возмущением V, и при V = О Т* будет равно своему первоначальному значению, т. е. единице. Пользуясь A6), получим <а" | Т* | а') = eiE"« - ^'п (а" | Г | а'), так что Р(а'а")--=\(а"\Т*\а')\\ A9) откуда видно, что все равно, чем пользоваться для вычис- вычисления вероятности перехода: величиной Т* или величи- величиной Т. *) Представление, отвечающее Т* и V* получило назвчние пред- представление взаимодействия, или представление Дирака. (Прим. ред.)
232 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ Наше рассмотрение до сих пор было точным. Мы пред- предположим теперь, что V есть малая величина первого порядка и представим Т* в виде Т* = 1+71 + 71+..., B0) где Т* — первого порядка, Т* — второго порядка и т. д. Подставляя выражение B0) в уравнение A7) и приравнивая члены одинакового порядка, получим dTf ifl- dt V*, B1) Из первого уравнения имеем = — ih-1^ V*(f)df, из второго Т$ = — ft-« (Г) dt' \ V* (Г) dt" B2) B3) и т. д. Для многих практических задач можно получить доста- достаточную точность, сохраняя только член Т*. Это дает для вероятности перехода Р (а'а") при а" =? а' выражение V*(f)df\ct) '| V*(f)|a'> B4) Мы получили вероятность перехода с точностью до второго порядка включительно. Результат зависит только от матрич- матричного элемента (ее" | У* (f)\a') величины У* (f), относящегося к двум рассматриваемым состояниям, причем f изменяется от 4 до /. Так как V* вещественна, так же как и V, то и, следовательно, g точностью до второго порядка включи- включительно Р (a'a") = P (a'a'). B5)
§ 44. ВОЗМУЩЕНИЕ КАК ПРИЧИНА ПЕРЕХОДОВ 233 Иногда встречается необходимость рассматривать переходы а' -у а" такие, что матричный элемент (а" \ V* \а') исче- исчезает или мал по сравнению с другими матричными элемен- элементами V*. Тогда нужно вести вычисление более точно. Если сохранить только члены Т1* и Т%, то получим при а" Ф а Р (а'а") = /Г2 (a"\V*(f)\a')df- - ift-1 Z \(a"\ v* (f) 1 a'">df S (a'"Iv* (ПI a'>dt" а'" фа.', a" t0 t0 B6) Члены с a'" = а' и а'" = а" исключены из суммы, так как они малы по сравнению с другими членами из-за малости (а" | V* |а'). Для истолкования результата B6) можно принять, что член \ (а", V* (О | а'> Л' B7) дает переход непосредственно из а и а , тогда как член t v — Ш'1 \ (а" \ V* (Г) | a'") df $ (о* V* (Г) | a') df B8) to to дает переход из а' в а'", после которого происходит переход из а'" в а". Состояние а'" в таком толковании называется промежуточным состоянием. Мы должны прибавить член B7) к различным членам B8), соответствующим различным промежуточным состояниям, и образовать квадрат модуля суммы; это означает, что имеется интерференция между различными процессами перехода — непосредственным и через промежуточные состояния — и невозможно придать смысл вероятности для одного из этих процессов самого по себе. Для каждого из этих процессов, однако, имеется амплитуда вероятности. Если продолжить метод возмущений до более высокой степени точности, то получится результат, допускающий аналогичное толкование с помощью более сложных процессов перехода, включающих последователь- последовательность промежуточных состояний,
234 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИИ § 45. Приложение к излучению В предыдущем параграфе была развита общая теория ¦зозмущений атомной системы, в которой энергия возмуще- возмущения может меняться со временем произвольным образом. Возмущение такого рода может быть практически осущест- осуществлено с помощью воздействия электромагнитных волн на систему. Посмотрим, к чему сводится наш результат B4) в этом случае. Если пренебречь влиянием магнитного поля падающего излучения и если предположить, далее, что длины волн всех монохроматических компонент излучения велики по срав- сравнению с размерами атомной системы, то энергия возмущения будет просто скалярным произведением V = (D, П), B9) где D — полный электрический дипольный момент системы, а Ш — напряженность электрического поля падающего излучения. Мы будем предполагать, что Ш есть заданная функция времени. Если взять для простоты случай поляри- поляризованного падающего излучения с определенным направле- направлением электрического "вектора и обозначить через D проек- проекцию D на это направление, то выражение B9) для V сведется к простому произведению где g — величина вектора Ш. Так как g — число, то мат- матричные элементы V будут равны <сс" j V j a') = <а" D | а') g, причем матричный элемент (a" \D \a') не зависит от t. Пользуясь формулой A8), получим (а" • V* (t):«') = <а" I D |а'> e''<?"-?'> «-<•>/*& (t) и, следовательно, выражение B4) для вероятности перехода принимает вид / 2 P(a'a') = h-2\(a"\D\a')\2 I е^Е"-Е">^'-^Щ(Г) df . C0) и Если падающее излучение разложить в интервале вре- времени от ^0 до t в интеграл Фурье, то поток энергии через единичную площадку, рассчитанный на единичный интервал
§ 45. ПРИЛОЖЕНИЕ К ИЗЛУЧЕНИЮ 235 частот вблизи частоты v будет, согласно классической элек- электродинамике, t 2 F =— ? p2ro'v (Г-<„)?//' )rlf /Q ] 1 2я 0 v ' x ' Сравнивая это с формулой C0), находим Р (сс'сс") - 2пс~1Н-г | <а" | ?> | а'> \2EV, C2) где . С С1' | v = iA_Ai. C3) Отсюда видно, прежде всего, что вероятность перехода зависит только от той компоненты Фурье падающего излу- излучения, частота которой v связана с изменением энергии соотношением C3). Это дает нам правило частоты Бора и показывает, как идеи Бора в его теории атома, которая была предтечей квантовой механики, могут быть согласованы с квантовой механикой. Данная элементарная теория не говорит нам ничего об энергии поля излучения. Разумно предположить, что энергия, поглощаемая атомной системой в процессе перехода, происходит от компоненты излучения, частота которой v дается соотношением C3), а также, что энергия, испускае- испускаемая атомной системой, переходит в эту компоненту излу- излучения. Это предположение будет подтверждено более полной теорией излучения, излагаемой в гл. X. Результат C2) сле- следует толковать следующим образом. Если система перво- первоначально находилась в состоянии с более низкой энергией, чем в конце, то величина C2) есть вероятность того, что система поглотит излучение. Если же система вначале нахо- находилась в состоянии с более высокой энергией, чем в конце, то величина C2) есть вероятность испускания, индуциро- индуцированного падающим излучением. Данная теория не объяс- объясняет того наблюдаемого факта, что и при отсутствии излу- излучения система, находящаяся в состоянии с большей энергией может излучать спонтанно, переходя в состояние с меньшей энергией. Это также будет объяснено более полной теорией в гл. X. Заключение о существовании явления индуцированного испускания было выведено Эйнштейном *) задолго до от- открытия квантовой механики из рассмотрения статистичес- *) Einstein, Phys, Zeits, 1917, Bd. 18, S. 121,
236 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ кого равновесия между атомами и полем излучения абсолют- абсолютно черного тела, удовлетворяющим закону Планка. Эйн- Эйнштейн показал, что вероятность перехода для индуцирован- индуцированного излучения должна быть равна вероятности перехода для поглощения (при переходе между той же самой парой состояний) в соответствии с настоящей квантовой теорией, а также вывел соотношение, связывающее эту вероятность перехода с вероятностью перехода для спонтанного излу- излучения, причем это соотношение согласуется с теорией гл. X. Матричный элемент (а" | D | а' ) в выражении C2) играет роль амплитуды одной из компонент Фурье для вели- величины D в классической теории взаимодействия многократно периодической системы с излучением. Фактически именно идея замены классических компонент Фурье матричными элементами привела Гейзенберга в 1925 г. к открытию квантовой механики. Гейзенберг предположил, что фор- формулы, описывающие в квантовой теории взаимодействие системы с излучением, могут быть получены из классических формул, если подставить вместо компонент Фурье для элек- электрического дипольного момента системы соответствующие матричные элементы. Если применить это предположение к спонтанному излучению, система, находящаяся в состоя- состоянии а' и имеющая дипольный момент D, будет спонтанно испускать излучение частоты v = —~— (где Е" — уро- уровень энергии некоторого состояния а" более низкий, чем ?"), причем энергия, испускаемая в единицу времени, равна  3—'!\а и1а)Г- (^4) Распределение этого излучения по различным направлениям и состояние поляризации для каждого направления будут такими же, как для классического электрического диполя с моментом, равным вещественной части (а" | D \а'). Для того чтобы установить связь между количеством излученной в единицу времени энергии и вероятностью перехода, мы должны разделить величину C4) на квант /rv; результат можно толковать как вероятность спонтанного испускания этого кванта в единицу времени с одновременным переходом системы в состояние а" с более низкой энергией. Эти пред- предположения Гейзенберга подтверждаются настоящей тео- теорией излучения, дополненной теорией спонтанных перехо- переходов (см. гл. X).
§ 46. ВОЗМУЩЕНИЕ НЕ ЗАВИСЯЩЕЕ ОТ ВРЕМЕНИ 237 § 46. Переходы, вызываемые возмущением, не зависящим от времени Метод возмущений, развитый в § 44, остается примени- применимым и тогда, когда энергия возмущения V не содержит времени явно. Поскольку полный оператор Гамильтона Н в этом случае не зависит от времени явно, мы могли бы при желании рассмотреть систему с помощью метода § 43 и найти ее стационарные состояния. Целесообразность этого будет зависеть от того, что мы хотим узнать о системе. Если то, что мы хотим рассчитать, явным образом содержит указа- указание времени, например, если нам нужно вычислить вероят- вероятность нахождения системы в определенном состоянии в не- некоторый момент времени при условии, что она была в опре- определенном состоянии в другой момент времени, то более удобным будет метод § 44. Посмотрим, что даст выражение B4) для вероятности перехода, если V не зависит от времени явно, причем для простоты положим t0 = 0. Матричный элемент (а" | V |а') теперь не зависит от t, и согласно соотношению A8) имеем {а" | V* (О I а') = <«" I V | а') ё <*"-?') <'/», C5) откуда, предполагая Е" ф Е', находим ' J(,E"-E')t/n, <сс' | V* (Г) |a') df = (a" \V\a') i(E«_E,)jn ¦ Следовательно, вероятность перехода будет равна V |сс'> |2 [е1 (Е"-?/>{'п—\] [е~1 <?"-Е"> *1п- 1 ] х (E'-E')t 1 —cos г—'— Если Е" существенно отличается от Е', эта вероятность перехода мала и остается малой для всех t. Этот результат есть то, что требуется по закону сохранения энергии. Пол- Полная энергия Н постоянна, а значит, собственная энергия Е (т. е. энергия за вычетом части V, вызванной возмущением), будучи приблизительно равной Я, должна быть приблизи- приблизительно постоянной. Это означает, что если численная вели- величина Е в начальный момент была равна ?", то в любой более
238 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ поздний момент времени Е лишь с малой вероятностью может заметно отличаться от Е'. С другой стороны, если начальное состояние а' таково, что существует другое состояние а", имеющее ту же самую или почти ту же самую собственную энергию Е, то вероят- вероятность перехода в конечное состояние а" может быть значи- значительной. Физический интерес представляет случай, когда конечные состояния а" принадлежат непрерывной области, которой соответствует сплошной спектр уровней собствен- собственной энергии Е", включающий значение собственной энергии в начальный момент. Начальное состояние не должно быть одним из тех состояний, которые принадлежат к непрерыв- непрерывной области конечных состояний, а может быть либо отдель- отдельным дискретным состоянием, либо одним из состояний дру- другой непрерывной области. Вспоминая правила § 18 для толкования амплитуд вероятности в случае сплошного спектра, мы получим, что вероятность перехода в конечное состояние в малом интервале между а" и а" + da" будет рав- равно Р (a'a") da" (где Р (а'а") дается выражением C6)), если а' дискретно и пропорционально этой величине, если а' непрерывно. Допустим, что переменные а', описывающие конечное состояние, состоят из Е и еще некоторого числа других динамических переменных р, так что мы имеем представле- представление, аналогичное тому, какое было рассмотрено в § 43 для случая вырожденных состояний. (Величины р, однако, не обязательно имеют смысл для начального состояния а'.) Предположим для определенности, что переменные р имеют только дискретные собственные значения. Полная вероятность перехода в конечное состояние а", для которого Р имеют значения р", а Е — любое значение (с большой вероятностью Е будет вблизи начального значения Е') равна (или пропорциональна) следующему выражению: \ Р («'a') dE" = C7)
§ 46. ВОЗМУЩЕНИЕ, НЕ ЗАВИСЯЩЕЕ ОТ ВРЕМЕНИ 239 если произвести подстановку (?"' — ?") t/tl — х. При боль- больших t это выражение становится равным ^^dx = = 2лЙ~1К?'Р"[ V| а') |2. C8) Таким образом, полная вероятность перехода к моменту времени t в конечное состояние, в котором р имеет значение, равное Р", оказывается пропорциональной t. Следовательно, имеется определенная вероятность в единицу времени для рассматриваемого перехода; величина ее равна 2ЯЙ-11 <?'Р"! V | а'> |я. C9) Этот коэффициент вероятности пропорционален квадрату модуля матричного элемента энергии возмущения, связан- связанного с данным переходом. Если-матричный элемент <?"Р" | V | а') мал по сравне- сравнению с другими матричными элементами V, то следует поль- пользоваться более точной формулой B6). Пользуясь соотноше- соотношением C5), получим J (a" \V*(t')\ a'") dt' \ (а'" | V* (Г) | a') dt" = о о — In" I V I п."") (а!" 11/ I ct/4> f р' <?" - Е""> l'ln dt' v О V У'{Е ~E)tindt= i(E'"-E')/n X г X X $ о Для Е", близких к ?', только первый член в подынтеграль- подынтегральном выражении дает существенный вклад в вероятность перехода, а второй член можно отбросить. Учитывая это и подставляя в формулу B6), получим вместо C6) выражение <а" | V а'") {а" \ V | а') (а \ V | а ) — 7 Е'" — Е' 2 а" X (?" — ?'), 1 — COS -^ ; П
240 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ Аналогично предыдущему получаем выражение для вероят- вероятности перехода в единицу времени в конечное состояние, где величины р равны Р" и энергия Е лежит вблизи Е'. 2я /Г./О*,,,_.»ч V <?Т\V |а'^>(оГ | V | а') 2 П ?'" — ?' а'" -фа,', а" Это выражение показывает, какую роль в определении коэффициента вероятности играют промежуточные состоя- состояния, отличные от начального и конечного. Для того чтобы приближения, использованные при выводе выражений C9) и D0), были законными, время t не должно быть ни слишком большим, ни слишком малым. Оно должно быть большим по сравнению с периодами атомной системы, для того чтобы было оправдано прибли- приближенное вычисление интеграла C7), приводящее к C8), и вместе с тем оно не должно быть чрезмерно большим, иначе перестанут быть справедливыми общие формулы B4) или B6). Действительно, если выбрать t достаточно большим, можно сделать вероятность C8) больше единицы. Верхний предел для t определяется условием, чтобы вероятности B4) либо B6) или умноженные на /выражения C9) либо D0) были малы по сравнению с единицей. Если энергия возму- возмущения мала, то можно без затруднений подобрать значения t, удовлетворяющие одновременно обоим условиям. § 47. Аномальный эффект Зеемана Одним из простейших примеров применения метода возмущений § 43 является расчет в первом приближении изменения уровней энергии, вызванного однородным маг- магнитным полем. Задача об атоме водорода в однородном магнитном поле уже рассматривалась в § 41 и была столь простой, что не было необходимости в теории возмущений. Случай произвольного атома ненамного сложнее, если допустить некоторые приближения, приводящие к простой модели атома. Рассмотрим сначала атом в отсутствие магнитного поля и будем искать интегралы движения или величины, прибли- приближенно являющиеся таковыми. Полный момент количества движения атома, скажем, вектор j, несомненно является интегралом движения. Этот момент количества движения
§ 47. АНОМАЛЬНЫЙ ЭФФЕКТ ЗЕЕМАНА 241 можно рассматривать как сумму двух частей: полного орби- орбитального момента всех электронов 1, и полного спинового момента s. Таким образом, имеем j = 1 + s. Влияние спинового магнитного момента на движение электронов мало по сравнению с влиянием кулоновского поля, и им можно в первом приближении пренебречь. В этом прибли- приближении спиновый момент количества движения каждого электрона является интегралом движения, поскольку от- отсутствуют силы, которые могут изменить ориентацию спина. Итак, s, а значит, также и 1 будут интегралами движения. Величины векторов 1, s и j, которые мы обозначим через /, s и / даются выражениями соответствующими уравнениям C9) § 36. Они коммутируют друг с другом и из последовательности чисел D7) § 36 видно, что при данных численных значениях I и s возможными численными значениями / являются /-fs, l+s — H, ..., \l — s\. Рассмотрим стационарное состояние, в котором /, s и / имеют определенные значения в соответствии с вышеизло- вышеизложенной схемой. Энергия в этом состоянии будет зависеть от /. Можно было бы думать, что, если пренебрегать спино- спиновыми магнитными моментами, то энергия не будет зависеть ни от s, ни от направления s относительно 1, и следовательно, что она не будет зависеть от /. Однако в гл. IX будет пока- показано, что энергия сильно зависит от величины 5 вектора s (хотя и не зависит от его направления, если пренебречь спиновыми магнитными моментами) в силу некоторого явления, возникающего из-за неразличимости электронов. Таким образом, имеются различные уровни энергии системы для различных Ins. Это означает, что / и s являются функ- функциями от энергии в смысле общего определения функции,
42 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ данного в § 11, т. е. в том смысле, что если фиксирована энергия стационарного состояния, то фиксированы и вели- величины / и s. Мы можем теперь учесть влияние спинового магнитного момента, трактуя его как особое возмущение по методу §43. Энергия невозмущенной системы будет приближенно инте- интегралом движения, а следовательно, I и s, будучи функциями энергии, также будут приближенно интегралами движения. Направления векторов 1 и s, однако, не являются функция- функциями невозмущенной энергии, поэтому они не обязаны быть приближенно интегралами движения и могут испытывать большие «вековые» изменения. Так как вектор j является постоянным, то единственно возможным изменением 1 и s является прецессия вокруг j. Мы имеем, таким образом, приближенную модель, состоящую из двух векторов по- постоянной длины 1 и s, прецессирующих вокруг их суммы j, которая является постоянным вектором. Энергия опреде- определяется в основном величинами векторов 1 и s и лишь незна- незначительно зависит от их относительного направления, определяемого /. Следовательно, состояния с одними и теми же / и s, но разными / будут иметь слегка различные энергии, образуя то, что называется мультиплетом. Считая нашу модель невозмущенной системой, предпо- предположим теперь, что на нее действует однородное магнитное поле величины <Ж в направлении оси г. Добавочная энергия, появляющаяся из-за магнитного поля, состоит из суммы членов вида * D1) (аналогичных последнему члену в уравнении (89) § 41), взятой по всем электронам, и будет иметь вид ^ + 2^ ^ + 5) D2) Это и есть наша энергия возмущения V. Воспользуемся методом § 43 для определения изменения уровней энергии, вызванного возмущением V. Метод будет законным только в случае столь слабого поля, что V мало по сравнению с раз- разностями энергии внутри мультиплета. Наша невозмущенная система вырождена, так как не определено направление вектора j. Мы должны поэтому
§ 47. АНОМАЛЬНЫЙ ЭФФЕКТ ЗЕЕМАНА 243 из представителей в гейзенберговском представлении для невозмущенной системы выбрать те матричные элементы, которые принадлежат строкам и столбцам, относящимся к одному и тому же уровню энергии, и определить собствен- собственные значения полученной таким образом матрицы. Лучше всего это можно сделать, разделив V на две части, одна из которых есть интеграл невозмущенного движения, так что ее представитель содержит только такие матричные эле- элементы, которые принадлежат строкам и столбцам, относя- относящимся к одному и тому же уровню невозмущенной системы, а представитель другой части содержит лишь матричные элементы, строки и столбцы которых относятся к разным энергиям, так что эта вторая часть не будет оказывать влия- влияния на возмущение в первом приближении. Член, содер- содержащий /г в D2), является интегралом невозмущенного движения и поэтому целиком принадлежит к первой части. Для члена, содержащего sz, имеем Ш + II + /*) = U (Sxjx + Syjy + Szjz) + (Szjx - jzSx) jx + ИЛИ jjj^, D3) где Ух — Szjy — hsy = szly — Lz .... Уу = lz$x $z]x ~ 'г^л: SllS lS ) Первый член в выражении для sz — интеграл невозмущен- невозмущенного движения и поэтому относится целиком к первой части, тогда как второй член, как мы сейчас увидим, отно- относится целиком ко второй части. Аналогично выражениям D4) мы можем ввести величину Уг = 1х$у — lySx- Легко показать, что имеет место равенство
244 ГЛ. VII. ТЕОРИЯ ВОЗМУЩЕНИЙ и что из формул C0) § 35 следует Эти соотношения, связывающие 'jx, jy, )г и ух, уу, уг, имеют тот же вид, что и соотношения, связывающие тх, ту, тг и х, у, г в вычислениях правила отбора для матричного элемента в представлении, где k диагонально (см. § 40). Из полученного там результата, что все матричные эле- элементы z исчезают, за исключением относящихся к двум значениям k, различающимся на ±Н, мы можем заключить, что в представлении, где j диагонально, все матричные элементы yz и аналогично ух и уу исчезают, за исключением тех, которые относятся к двум значениям/, различающимся на ±й. Коэффициенты при ух и уу во втором члене правой части выражения D3) коммутируют с /, так что представи- представитель всего члена в целом будет содержать лишь матричные элементы, относящиеся к двум значениям /, различающимся на ±/i, а значит, и к двум различным уровням энергии не- невозмущенной системы. Следовательно, после пренебрежения частью, содержа- содержащей матричные элементы, которые относятся к различным невозмущенным уровням энергии, энергия возмущения V будет иметь вид Собственные значения этого выражения дают изменение уровней энергии в первом порядке. Мы можем сделать представители этого выражения диагональными, выбирая наше представление так, чтобы /г было диагональным. Тогда это выражение непосредственно дает изменение в пер- первом приближении уровней энергии, вызванное магнитным полем. Выражение D5) известно как формула Ланде. Результат D5) справедлив только в предположении, что возмущение V мало по сравнению с разностями энергии в мультиплете. Для больших V нужна более сложная тео- теория. Для очень сильных нолей, при которых V велико по сравнению с разностями энергии в мультиплете, теория опять становится простой. Мы можем тогда вовсе пренебречь энергией спинового магнитного момента атома в отсутствие внешнего поля, так что для нашей невозмущенной системы
§ 47. АНОМАЛЬНЫЙ ЭФФЕКТ ЗЕЕМАНА 245 сами векторы 1 и s, а не только их величины / и s будут интегралами движения. Энергия возмущения, равная по-прежнему —~—(/* + s*), является теперь интегралом движения для невозмущенной системы, так что собственные значения этого выражения дают непосредственно изменение уровней энергии. Эти собст- собственные значения являются целыми или полуцелыми крат- ными величины-^—, смотря по тому, четно или нечетно число электронов в атоме.
ГЛАВА VIII ЗАДАЧИ О СТОЛКНОВЕНИЯХ § 48. Общие замечания В этой главе мы будем рассматривать задачи, связанные с частицей, которая приходит из бесконечности, встречается или «сталкивается» с некоторой атомной системой, и после рассеяния на некоторый угол уходит опять на бесконеч- бесконечность. Атомную систему, производящую рассеяние, мы будем для краткости называть рассеивателем. Итак, мы имеем динамическую систему, состоящую из падающей частицы и рассеивателя, взаимодействующих друг с другом; эту систему нужно рассматривать по законам квантовой механики и, в частности, вычислить для нее вероятность рассеяния на данный угол. Обычно предполагается, что рассеиватель обладает бесконечной массой и покоится на протяжении всего процесса рассеяния. Задача о рассеянии впервые была решена Борном с помощью метода, по сущест- существу эквивалентного методу следующего параграфа. Следует иметь в виду, что рассеиватель сам по себе, как система, может иметь различные стационарные состояния и что, будучи в одном из этих состояний вначале, когда частица приходит из бесконечности, он может оказаться в другом состоянии после того, как частица ушла на бесконечность. Таким образом, налетающая частица может вызывать пере- переходы в рассеивателе. Оператор Гамильтона полной системы «рассеиватель -f- -f- частица» не содержит времени явно, так как вся система будет иметь стационарные состояния, представляемые пери- периодическими (во времени) решениями шредингеровского волнового уравнения. Для того чтобы правильно понять смысл этих стационарных состояний, следует проявить некоторую острожность. Очевидно, что в любом состоянии движения системы частица будет проводить почти все время
§ 48. ОБЩИЕ ЗАМЕЧАНИЯ 247 на бесконечности, так что усредненная по времени вероят- вероятность нахождения частицы в любом конечном объеме будет равна нулю. Но в стационарном состоянии вероятность нахождения частицы в данном конечном объеме, так же как и другие результаты наблюдения, не должна зависеть от времени; следовательно, эта вероятность будет равна своему среднему по времени, которое, как мы видели, равно нулю. Значит, физический интерес представляют только относи- относительные вероятности нахождения частицы в различных конечных объемах, поскольку абсолютные их значения все равны нулю. Полная энергия системы имеет сплошной спектр собственных значений, так как начальная энергия частицы может быть любой. Следовательно, кет-вектор стационарного состояния, скажем | s), будучи собственным вектором полной энергии, должен быть бесконечной длины. Физическое основание этому можно видеть в следуюшем. Пусть j s) нормировано, и пусть Q — такая наблюдаемая некоторая функция положения частицы, которая равна единице, если частица находится внутри данного конечного объема, и равна нулю, если частица находится вне его. Тогда величина (s \ Q s) будет равна нулю; но это озна- означало бы, что среднее значение Q равно нулю, т. е. что равна нулю вероятность нахождения частицы в данном объеме. С таким вектором было бы неудобно работать. Однако если s имеет бесконечную длину, то величина (s | Q \ s) может быть конечной, и она будет давать тогда относительную вероят- вероятность нахождения частицы в данном объеме. Для изображения состояния системы, соответствующего ненормированному кет-вектору | х), для которого, скажем, (х | х) = п, можно предположить, что имеется п тождест- тождественных систем, занимающих один и тот же объем, но не взаимодействующих друг с другом, так что каждая движется независимо от других, как в гиббсовском ансамбле (§ 33). Если а — некоторая наблюдаемая, мы можем тогда толко- толковать величину (х \а \ х) непосредственно как сумму значений а для всех п систем. Применяя эти соображения к вышеупомянутому вектору | s) бесконечной длины, соот- соответствующему стационарному состоянию системы «рассеи- ватель + налетающая частица», мы должны представить себе бесконечное число таких систем с рассеивателями, находящимися в одной и той же точке и частицами, непрерыв- непрерывно-распределенными в пространстве. Число частиц в данном
248 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ конечном объеме будет изображаться величиной (s | Q | s), где Q — определенная выше наблюдаемая, равная единице, если частица находится в данном объеме, и нулю в против- противном случае. Если вектор представлен шредингеровской вол- волновой функцией, содержащей декартовы координаты части- частицы, то квадрат модуля волновой функции может быть не- непосредственно истолкован как плотность частиц в этой картине. Необходимо, однако, помнить, что каждая частица имеет свой отдельный рассеиватель. Различные частицы могут принадлежать рассеивателям, находящимся в разных состояниях. Значит, для каждого состояния рассеивателя будет сбоя плотность частиц, именно, плотность тех частиц, которые принадлежат рассеивателю в данном состоянии. Это обстоятельство учитывается путем включения в волно- волновую функцию переменных, описывающих состояние рассеи- рассеивателя, в дополнение к переменным, описывающим положе- положение частицы. Для определения коэффициента рассеяния необходимо рассматривать стационарные состояния системы «расеи- ватель + частица», например, если мы хотим определить вероятность рассеяния в различных направлениях, когда рассеиватель первоначально находится в заданном стацио- стационарном состоянии, а падающая частица нервоначально имеет данную скорость в данном направлении, мы должны поступить следующим образом. Мы должны рассматривать такое стационарное состояние всей системы, картина кото- которого в принятом выше способе описания содержит на боль- большом расстоянии от рассеивателей только частицы, движу- движущиеся с данной начальной скоростью в заданном направле- направлении, и принадлежащие каждая к своему рассеивателю в данном начальном состоянии, кроме того, частицы, уходящие от рассеивателей и могущие принадлежать к рас- рассеивателям в различных стационарных состояниях. Эта картина близко соответствует действительному положению дела при экспериментальном определении коэффициента рассеяния, с той лишь разницей, что на самом деле картина описывает только одну действительную систему «рассеива- «рассеиватель -f- частица». Получаемое в этой картине распределение уходящих частиц на бесконечности дает нам непосредственно все сведения о коэффициентах рассеяния, которые можно получить на опыте. Для практических расчетов, относящих- относящихся в стационарному состоянию, описываемому вышеупомя-
§ 48. ОБЩИЕ ЗАМЕЧАНИЯ 249 нутой картиной, можно использовать метод возмущений, до некоторой степени аналогичный изложенному в § 43, принимая за невозмущенную систему, например такую, в которой отсутствует взаимодействие между частицей и рассеивателем. При рассмотрении задач о столкновениях следует еще принять во внимание, что рассеиватель может поглотить и вновь испустить частицу. Такая возможность возникает, если существует одно или более состояний системы, являю- являющихся состояниями поглощения. Состояние поглощения является приблизительно стационарным, и его можно счи- считать связанным в том смысле, как сказано в конце § 38 (т. е. вероятность нахождения частицы на расстоянии, большем чем г от рассеивателя, при г -> оо стремится к нулю). Так как состояние поглощения только приблизительно стационарно, то свойство быть связанным является времен- временным, и по истечении достаточного времени будет конечная вероятность найти частицу удалившейся как угодно далеко. Физически это означает, что имеется конечная вероятность спонтанного испускания частицы. Тот факт, что мы вынужде- вынуждены пользоваться словом «приблизительно» при форму- формулировке условий, необходимых для существования явлений поглощения и испускания, показывает, что эти условия не могут быть выражены точным математическим образом. Можно придать смысл этим явлениям, только опираясь на метод возмущений. Они возникают тогда, когда невозму- невозмущенная система («рассеиватель + частица») имеет связан- связанные состояния. Введение возмущения портит стационарный характер этих состояний и приводит к появлению спонтан- спонтанного испускания и обратного ему поглощения. Для вычисления вероятностей поглощения и испускания необходимо иметь дело с нестационарными состояниями системы, в противоположность случаю коэффициента рас- рассеяния, так что нужно использовать метод § 44. Так, для вычисления коэффициента испускания нужно рассматри- рассматривать вышеупомянутые нестационарные состояния погло- поглощения. Кроме того, так как за поглощением всегда следует испускание, то невозможно отличить этот процесс от рассе- рассеяния в любом опыте, относящемся к установившемуся процессу, соответствующему стационарному состоянию сис- системы. Различие может быть обнаружено л'ишь в нестацио- нестационарных процессах, когда, например, используется поток
230 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ частиц, имеющий резко выраженное начало; тогда рассеян- рассеянные частицы будут появляться сразу после того, как па- падающие частицы дошли до рассеивателя, частицы же, испы- испытавшие поглощение и последующее испускание, начнут появляться лишь спустя некоторое время. Такой поток частиц изображался бы некоторым вектором состояния бес- бесконечной длины, и этот вектор мог бы служить для расчета коэффициента поглощения. § 49. Коэффициент рассеяния Обратимся теперь к расчету коэффициента рассеяния, причем в первую очередь мы рассмотрим случай, когда нет поглощения и испускания, что означает отсутствие связан- связанных состояний в невозмущенной системе. В качестве невоз- невозмущенной системы удобно взять такую, в которой отсутству- отсутствует взаимодействие между рассеивателем и частицей. Ее оператор Гамильтона имеет вид E = HS + W, A) где Hs — оператор Гамильтона одного лишь рассеивателя, a W — оператор Гамильтона одной лишь частицы, имеющей вид (в пренебрежении релятивистской механикой) Энергия возмущения V, которую мы предположили малой, будет функцией координат частицы х, у, z (а также, быть может, ее импульсов рх, ру, рг) и, кроме того, будет зависеть от динамических переменных, описывающих рас- сеиватель. Так как мы интересуемся сейчас только стационарным состоянием всей системы, то будем пользоваться методом возмущений, аналогичным рассматриваемому в § 43. Наша невозмущенная система непременно имеет непрерывный спектр энергии,так как в ее состав входит свободная частица. Это обстоятельство приводит к некоторому видоизменению метода возмущений. Вопрос об изменении уровней энергии, вызванном возмущением, который был главным в §43, больше не имеет смысла, и условие § 43 относительно использования одинакового числа штрихов для обозначения почти равных собственных значений Е и Н отпадает. Кроме того, рас-
$ 49. КОЭФФИЦИЕНТ РАССЕЯНИЯ 261 щепление уровней энергии, которые мы имели в § 43 в слу- случае вырожденной невозмущенной системы, теперь возник- возникнуть не может, так как если невозмущенная система вы- вырождена, то и возмущенная система, которая должна иметь непрерывный спектр энергий, будет вырожденной в той же самой мере. Воспользуемся общей схемой уравнений, разработанной в начале § 43 (см. уравнения A)—D)), но в качестве невоз- невозмущенного состояния, образующего нулевое приближение, мы выберем стационарное состояние с энергией ?", в точ- точности равной энергии Н' возмущенного стационарного состояния. Тогда величины а, определяемые вторым урав- уравнением из системы C) § 43, все равны нулю, и второе урав- уравнение из системы D) примет вид (Б'-Е)\ 1> = V |0>. C) Аналогично третье уравнение из системы D) § 43 принимает вид (Е'-Е) |2> = 1/|1>. D) Перейдем к решению уравнения C) и к определению коэф- коэффициента рассеяния в первом приближении. Уравнение D) понадобится в § 51. Пусть а означает полный набор коммутирующих наблю- наблюдаемых, описывающих рассеиватель, притом таких, которые являются интегралами движения рассеивателя самого по себе и могут быть поэтому использованы для нумерации стационарных состояний рассеивателя. Для этого нужно, чтобы оператор #s коммутировал со всеми а и являлся функцией от а. Мы можем выбрать такое представление полной системы, в котором все а и координаты частицы х, у, г являются диагональными. В этом представлении опера- оператор Hs будет диагональным. Пусть представителем кет- вектора | 0) будет (ха' | 0>, а представителем | 1) будет (хос' | 1), где х означаете, у, г и штрих у хопущен для крат- краткости. Вместо dx dy dz будем писать d3x. Уравнение C), выраженное через представители, при учете A) и B) прини- принимает вид = 2 $ <ха' | V | х"а") d V (х"а" 10>. E) а"
252 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ Предположим, что налетающая частица имеем импульс р° и что начальное состояние рассеивателя есть а0. Стационар- Стационарное состояние нашей невозмущенной системы, следователь- следовательно, будет таким, что р = р° и а = а0, и значит, его предста- представитель есть Уравнение E) тогда напишется: ' - Hs («') + ||f V2} <х«' 11> *= J <**' IV | х°а°> или (*» + Уя)<ха'|1>=Л G) где k2 = 2mH-2{E'-Hs(a')} (8) и F = 2тЙ-2 \ <ха' | V | х°а°> dW<р°- x°v». (9) Величина Z7 есть определенная функция от х, у, г и а'. Кроме того, мы имеем A0) Наша задача состоит в отыскании такого решения (ха' | 1) уравнения G), которое вдали от рассеивателя, т. е. при больших х, у, г, изображает лишь уходящие части- частицы. Квадрат модуля этого решения | (ха' | 1) |2 будет тогда давать плотность рассеянных частиц, относящуюся к рассеивателю в состоянии а', если плотность падающих частиц, равная | (ха° | 0) р, принята за единицу. Если перейти к полярным координатам г, 8, <р, то уравнение G) примет вид д дв ШОае + r2Sin2fl дф2) Х X <г9ф«' | 1) = F. A1) Величина F должна стремиться к нулю при г -* оо в силу физического условия, что энергия взаимодействия между рассеивателем и частицей стремится к нулю при л^-оо. Если вовсе пренебречь величиной F в A1), то при больших г приближенным решением уравнения A1) будет <г6<ра' | 1) = и (вера') r~1eikr, A2) где и — произвольная функция от б, Ф и а'; действительно, при подстановке этого выражения в левую часть A1) полу-
§ 49. КОЭФФИЦИЕНТ РАССЕЯНИЯ 253 чатся члены порядка г 3. Если же не пренебрегать величи- величиной F, то решение уравнения A1) по-прежнему будет при больших г иметь вид A2), если только F исчезает достаточно быстро при г -* оо. При этом функция « будет теперь опре- определяться поведением решения при малых г. Для таких значений а' величин а, которым соответст- соответствуют по формуле (8) положительные k2, следует взять в фор- формуле A2) в качестве k положительный квадратный корень из k2, чтобы A2) представляло только уходящие частицы, т. е. частицы, для которых радиальная компонента импуль- импульса, равная, согласно § 38, рг — ihr'1 или — Ш (^ + —), положительна. Плотность рассеянных частиц, соответству- соответствующая рассеивателю в состоянии а, равная квадрату модуля величины A2), убывает при возрастании г обратно пропор- пропорционально г2, как и должно быть на основании физических соображений. Угловое распределение рассеянных частиц дается величиной | и F ера') |2. Далее, величина Р' импульса рассеянных частиц должна быть равна Ш, поскольку напра- направление импульса при больших г должно быть радиальным; поэтому энергия частиц равна (принимая во внимание (8) и A0)). Это в точности равно энергии налетающей частицы ро2/2/л за вычетом энергии, переданной рассеивателю и равной Hs (а1) — Нs (а0) в соот- соответствии с законом сохранения энергии. Если значения а' таковы, что им соответствуют отрицательные &2, то рас- рассеянные частицы отсутствуют: полная начальная энергия при этом недостаточна для того, чтобы перевести рассеива- тель в состояние а'. Мы должны теперь вычислить величину и (8 фа') для состояний а', которые соответствуют положительным k2, и получить угловое распределение рассеянных частиц, отно- относящихся к рассеивателю в состоянии а'. Достаточно вы- вычислить и в направлении полярной оси 9=0, поскольку это направление произвольно. Воспользуемся теоремой Грина, которая гласит, что для любых двух функций А [и В объемный интеграл ^ (Лу2Д ~
254 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ взятый по некоторому объему, равен поверхностному ин- интегралу взятому по поверхности, ограничивающей этот объем, при- причем д/дп означает дифференцирование по нормали к поверх- поверхности. Мы положим и применим теорему к большой сфере, центр которой на- находится в начале координат. Подынтегральное выражение в объемном интеграле равно, в силу соотношения G) или (П). = е~ ikr cos в (V2 _|_ fe2) <г6 фа' 11 > = е~ikr cos e F, тогда как в поверхностном интеграле подынтегральное вы- выражение будет равняться, с учетом A2), д_ <г9фа' | 1> _ ^фа' | 1> ~ e-'*'cose = == ikur-1 A + cos e)e'*''(I-cose), где пренебрежено величиной Г2. Следовательно, получаем 2я л е/7 <рх = ^Ф \ г2 sin 9 db ikur-1 A +cos 6) е«*М1-свзв)) о о о о причем объемный интеграл в левой части берется по всему пространству. Правая часть, будучи проинтегрированной по частям относительно б, принимает вид 2п I ^[ыA +cos9)]de|. Второй член в фигурных скобках имеет порядок величины г, как можно обнаружить при дальнейшей интеграции
§ 49. КОЭФФИЦИЕНТ РАССЕЯНИЯ 255 по частям, и следовательно, им можно пренебречь. Мы при- приходим к соотношению 2л $<?-»/¦ cos е^8* = —2 \ dtp и (О, <р, «') = — 4ш/@, ф, а'), о которое дает величину и F, ф, а') для 8=0. Этот результат может быть записан в виде и @<рсО = — Dл)-15 e-'^ так как Р' = &Й. Если вектор р' обозначает импульс рас- рассеянного электрона, движущегося в некотором направлении (величина его равна Р'), то значение и для этого направ- направления равно и (8'ф'а') = — Dл)-1 \ е-{ <р'. *'nF d3x. Это вытекает из A3), если вышеупомянутое направление выбрать в качестве полярной оси. С помощью (9) это вы- выражение принимает вид и (б'ф'сО = — Bл) т/И \ $ *-'»'•*>/* d*x X X <ха' | V \ х°а°) dW &• х°»/л = — 2nmh <р'а' | V \ р°а°). A4) Здесь произведено преобразование от координат х к им- импульсам р, причем использована функция E4) § 23. Одна буква р обозначает здесь три компоненты импульса. Плотность рассеянных частиц, относящихся к рассеива- телю в состоянии а', дается величиной |« (8'ф'а') \2/г2. Так как скорость частиц есть Р'/т, то число частиц, появ- появляющихся в единицу времени в единичном телесном угле около направления р', равно ~\и(д'ц>'а')\'. Плотность падающих частиц принята при этом за еди- единицу, так что число падающих частиц, пересекающих единичную площадку за единицу времени, равно их ско- скорости Р°/т, где Р° — величина р°. Следовательно, эффек- эффективное сечение, которое должны задеть падающие частицы, чтобы испытать рассеяние в единичный телесный угол около направления р', и перевести рассеиватель в
256 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ состояние а', будет равно *) -^ | и (б'ф'сО |2 = 4я2т2/г2 ~ | <р'а' | У I р°а°> |2. A5) Это выражение есть коэффициент рассеяния для перехода рассеивателя вида а°->а'. Он определяется матричным элементом <р'а' | У | р°а°) энергии возмущения У, столбец которого р°а° и строка р'а' относятся соответственно к на- начальному и конечному состояниям невозмущенной системы, между которыми происходит переход. Результат A5) не- некоторым образом аналогичен результату B4) § 44, хотя числовые коэффициенты в обоих случаях разные, сооб- сообразно различной природе двух процессов перехода. § 50. Решение задачи в импульсном представлении Результат A5) для коэффициента рассеяния формули- формулируется в том представлении, в котором импульс р диаго- диагоналей. Следует ожидать поэтому, что можно получить более непосредственное доказательство этого результата, работая все время с импульсным представлением, вместо того чтобы работать с координатным представлением, и лишь в конце перейти к импульсному, как это делалось в § 49. На первый взгляд это не кажется существенным усовершенствованием, поскольку менее прямой путь полу- получения результата в методе координатного представления окупается большей его наглядностью и возможностью изо- изображать квадрат модуля координатного представителя состояния как плотность потока частиц, испытывающих рассеяние. Однако метод координатного представления имеет, с другой стороны, серьезные недостатки. Одно из важнейших применений теории столкновений относится к случаю, когда падающей частицей является фотон. Фотон — не простая частица, а имеет поляризацию. Из клас- классической электромагнитной теории очевидно, что фотон с определенным импульсом, т. е. движущийся в опреде- определенном направлении с определенной частотой, может иметь определенную поляризацию (линейную, круговую и т. д.), тогда как фотон с определенным положением, который можно было бы изобразить электромагнитным возмуще- *) Величину A5) обычно называют дифференциальным эффектив- эффективным сечением, (Прим. перев.)
§ 50. РЕШЕНИЕ ЗАДАЧИ В ИМПУЛЬСНОМ ПРЕДСТАВЛЕНИИ 257 нием, локализованным в малом объеме, не может иметь определенной поляризации. Эти факты означают, что наблюдаемая, соответствующая поляризации фотона, ком- коммутирует с его импульсом, но не с его координатой. Резуль- Результаты в методе импульсного представления непосредственно применимы к случаю фотона; необходимо лишь ввести в пред- представитель поляризационную переменную и рассматривать ее наравне с величинами а, описывающими рассеиватель. Метод же координатного представления здесь неприменим. Далее, имея дело с фотонами, необходимо принимать во внимание релятивистскую механику. Это может быть легко сделано в импульсном представлении, но не так легко в координатном представлении. Уравнение C) справедливо и для релятивистской ме- механики, но Wb этом случае дается выражением вместо выражения B). Будучи записано в импульсном представлении, уравнение C) имеет вид \Е' - Hs (а1) - W] <ра'; 1 > = <рсс' | V f0>, где для краткости написано р вместо р' и подразумевается, что величина W есть функция от рх, ру, рг, определяемая из A6). Предыдущее уравнение можно переписать в виде (W'-W)<pa'\l) = (pa'\V\0), A7) где W' = E'-Hs(a'). A8) Эта величина представляет собой энергию, необходимую, согласно закону сохранения энергии, для того, чтобы рас- рассеянная частица принадлежала рассеивателю в состоянии а'. Вектор | 0) в координатном представлении дается вы- выражением F), а базисный вектор | р°а°> представляется выражением <ха' | р°а°> = 6eW <х ! р°> = ба-ао/Г^' <р«. «)/*, как вытекает из вида функции преобразования E4) § 23. Следовательно, |0> = /i3/*|p°a0> A9) и уравнение A7) может быть записано в виде (W - W) <рсс' | 1) = /13/, <Рсс' | V | р°а°>. B0)
258 ГЛ VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ Перейдем теперь от декартовых координат рх, ру, рг к полярным координатам Р, со, % согласно формулам рх = Р cos о), рц = Р sin to cos x, pz = P sin to sin %. Если в новом представлении взять весовую функцию в виде Я2 sin to, то вес, приписываемый любому объему в импуль- импульсном пространстве, будет тем же самым, что и в преды- предыдущем импульсном представлении, так что преобразование координат будет означать просто перенумерацию строк и столбцов матрицы без изменения матричных элементов. Таким образом, в новом представлении уравнение B0) примет вид (W' - W) (Ра>ха' | ]> =/23/* (Ра>хаг | V | Я°й>охоа°>, B1) где W теперь будет функцией одной переменной Р. Коэффициент при {Рауа' | 1 >, именно, W — W будет теперь просто множителем, а не дифференцированным оператором, как было в координатном представлении. Мы мо- можем поэтому разделить на этот множитель и получить явное выражение для {Pwyjz' \ 1). Если, однако, а' таково, что W, определяемое выражением A8), больше тс2, то этот множитель обращается в нуль в некоторой точке об- области изменения Р, именно, в точке Р = Р', которая связана с W соотношением A6). Функция (Р&%а' |1) будет, следовательно, иметь особенность в этой точке. Эта особенность показывает, что (Ясоха' | 1) представляет бесконечное число частиц, движущихся на большом рас- расстоянии от рассеивателя с энергиями, близкими к W, и следовательно, именно эту особенность нужно исследовать для того, чтобы определить угловое распределение на бесконечности. Результат деления выражения B1) на W— W, согласно формуле A3) § 15, имеет вид V \ х> w^rw + + Я(ог/сО 6 (»"-№), B2) где К — произвольная функция от to, % и а'. Для того чтобы придать смысл первому члену в правой части равен- равенства B2), мы условимся, что интеграл от этого члена по Р, взятый по области, включающей точку Р', есть предел при е-*-0 интеграла, в котором исключена малая область от Р' — е до Р' +е. Этого достаточно, чтобы придать вы-
§ 50. РЕШЕНИЕ ЗАДАЧИ В ИМПУЛЬСНОМ ПРЕДСТАВЛЕНИИ 259 ражению B2) точный смысл, так как по существу мы инте- интересуемся только интегралами от представителей состояния, когда представление имеет непрерывные области строк и столбцов. Мы видим, что уравнение B1) недостаточно для полного определения представителя (Ра%а' | 1 >, так как в формулу B2) входит произвольная функция X. Мы должны выбрать эту функцию Я таким образом, чтобы выражение (Ры%а' | 1 > представляло только уходящие частицы, по- поскольку мы хотим, чтобы все приходящие частицы входи- входили в состав вектора | 0). Рассмотрим сначала общий случай, когда представитель состояния частицы удовлетворяет уравнению типа X), B3) где / (Ра%) — произвольная функция от Р, со и /, и W —• число, превосходящее тс2, так что (Ра% |) имеет вид ww l (WX) б (W - W). B4) Определим, каким должно быть X для того, чтобы (Р(»х I) могло представлять только уходящие частицы. Мы можем это сделать, если преобразовать (Ра% |) к координатному представлению или, точнее, к представлению в полярных координатах г, 6, <р и сравнить результат с выражением A2) для больших г. Функция преобразования есть <г6ф | Ясох) = , — -- I—-[cos и cos 9 +sin ш sin 9 cos (х — Ф)]- — II ig< (Р, х)/Л = /j ig n Для направления 6=0 имеем ?. со qn л . Рг 'COSO) V т / J J Л J о о и 3 со in \ \ ' ft Второй член в фигурных скобках — порядка г2, в чем можно убедиться путем дальнейшего интегрирования по
260 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ частям по со, и поэтому им можно пренебречь. Остается <г0ф | > = ih~ "» Bл/-) \ Р dP \ dj x о о [ .Рг .Рг \ X \е п (Рл,х | ) — е п (Р0% |) j = _ 1 со \ _iPr -Ел \ о Если мы подставим вместо (Ра>% | ) его значение, да- даваемое формулой B4), то первый член в подынтегральном выражении B5) даст j СО рг ih~ 1r~1 \ P dPe~l ~я |у;^ + ^(лх) б(^' - tt7)}• B6) о Член, содержащий 8 (W — W), может быть сразу проин- проинтегрирован. Если использовать вытекающее из A6) соотно- соотношение Р dp = —5— • эт0 Дает iTTV2/-1 [ WdWe~l~* тс2 _ 1 _ ?1Г = ;7i « г2г?'), (лх) е ' п~. B7) Для того чтобы проинтегрировать другой член в B6), вос- воспользуемся формулой .Рг ,Рг —( —¦ СО —I — СО —I — = g (Pr) J ^rp dP, B8) верной для любой непрерывной функции g (P), если пре- пренебречь членами, содержащими г~К Эта формула справед- р(Р) о(Р') лива потому, что разность ¦ р, _„ — ~рт^-ъ~ есть непрерыв- непрерывная функция, а для любой непрерывной функции интеграл СО j Рг \ К(Р)е п dp будет порядка г1. Вычисляя правую часть о B8) и пренебрегая членами, содержащими г'1, а также
§ 50. РЕШЕНИЕ ЗАДАЧИ В ИМПУЛЬСНОМ ПРЕДСТАВЛЕНИИ 261 пренебрегая малой областью от Р' — е до Р' +г в проме- промежутке интеграции, получим J р,_р — со prf dP = ing(P')e~'тт. B9) В нашем случае g (P) равно Это выражение имеет при Р = Р' предельное значение, равное g (P') = ih a r-ip'f (Я'ЯХ) Z_ = ih s c-tr-Wf (Р'ях). Подставляя это в B9) и добавляя выражение B7), получим следующее значение интеграла B6): h « c-V-ЧГ' {— я/ (Р'ях) + й (ях)} е ' * . C0) Аналогично второй член в подынтегральном выражении B5) дает -1 iEIL h ^ cr'r-W {— л/ (Р'Ох) - /Я (Ох)} е п . C1) Сумма этих двух выражений есть значение величины (гО<р [ ) при большом г. Нам требуется, чтобы (Юср | > представляло только ухо- уходящие частицы; следовательно, это выражение должно быть пропорционально eiP'r;n . Значит, выражение C0) должно обращаться в нуль, так что х). C2) Мы видим, таким образом, что условие, в силу которого (гЭф | > должно представлять только частицы, уходящие в направлении 9=0, фиксирует величину X для противо- противоположного направления б = п. Так как направление 9=0 или со = 0 оси нашей полярной системы координат ничем
262 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ не выделено, то мы можем обобщить C2) и написать C3) Это дает величину К для произвольного направления. Под- Подстановка этого выражения в формулу B4) приводит к ре- результату, который можно записать в виде У^у - шб (W - W)), C4) так как в члене, содержащем множителем б (W — W), можно, не изменяя величины этого члена, заменить Р на Р'. Условие, чтобы выражение (Ра>% | ) представляло только уходящие частицы, состоит в том, что это выражение должно содержать множитель ¦in6(W'-W). C5) W'—W Интересно отметить, что этот множитель имеет вид праЕой части уравнения A5) § 15. При X, определяемом согласно C3), выражение C0) обращается в нуль- и величина (лОср | ) определяется при больших г одним лишь выражением C1), т. е. ) = — 2я/г Обобщая это равенство, получим _ 1 .Р'г <г8ср|> = — 2nh ^c-2r-Wf(P'ax)e'ir. Мы получили для любого направления 8, Ф величину <л8ф | ), выраженную через / (Р'ау) для того же самого направления, обозначаемого через (о, х- Это выражение имеет вид A2), причем входящая в A2) величина и равна _ 1 и (бф) = — 2л/Г ~ crWf (P'cox). Она представляет, таким образом, распределение уходящих частиц с импульсом Р', а именно, число таких частиц равно | = /ос. C6)
§ 51. ДИСПЕРСИОННОЕ РАССЕЯНИЕ 263 на единицу телесного угла в единицу времени. Это именно то распределение, которое представляется величиной (Яor/ |) в формуле C4). Из этого общего результата мы можем заключить, что всегда, когда имеется представитель (Ра>% |), представ- представляющий только уходящие частицы и удовлетворяющий уравнению типа C2), число частиц в единичном телесном угле в единицу времени дается формулой C6). Если (Рсоя/ |) встречается в задаче, в которой число падающих частиц задается на единицу объема, и равно единице, то это будет соответствовать коэффициенту рассеяния C7) Как видно, существенным является лишь значение функции / (Ясох) в точке Р = Р'. Если мы теперь применим эту общую теорию к уравне- уравнениям B1) и B2), то получим / (Рсох) — к>/г (Р(чха' I V | Р0со0х0а0). Следовательно, учитывая выражение C7), коэффициент рассеяния есть """""'"' | (Я'соха' | V | Я0со0х0а°> |2. C8) Если пренебречь релятивистскими эффектами и положить ¦—j— = m2, то этот результат приводится кг^езультату A5), полученному в предыдущем параграфе с помощью теоремы Грина. § 51. Дисперсионное рассеяние Рассмотрим теперь рассеяние в том случае, когда па- падающая частица может быть поглощена, т. е. когда наша невозмущенная система «рассеиватель + частица» имеет связанные стационарные состояния с поглощенной частицей. Как мы увидим, существование таких связанных состояний невозмущенной системы оказывает существенное влияние на рассеяние в возмущенной системе, причем влияние это
264 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ сильно зависит от энергии падающей частицы, приводя к явлению дисперсии в оптике в том случае, когда падающей частицей является фотон. Воспользуемся представлением, для которого базисные векторы соответствуют стационарным состояниям невоз- невозмущенной системы, как было в случае импульсного пред- представления в предыдущем параграфе. В качестве этих ста- стационарных состояний мы выберем состояния (р'сс'), в ко- которых частица имеет определенный импульс р', и рассеи- ватель находится в определенном состоянии а', и кроме того связанные состояния k, которые образуют отдельную дискретную совокупность; мы предположим, что эти со- состояния все независимы и ортогональны. Это предположе- предположение неточно, когда частицей является электрон или атомное ядро, так как в этом случае в состоянии поглощения k частица все же будет где-то находиться, так что следует ожидать, что можно разложить | k) по собственным век- векторам | х'а') величин х, у, z и а, а значит, и по векторам | р'а'). С другой стороны, если частицей является фотон, то в состояниях поглощения он не существует, поэтому эти состояния несомненно являются независимыми и орто- ортогональными по отношению к состояниям (р'а'), в которых частица существует. Следовательно, в этом практически важном случае наше предположение справедливо. Поскольку нас интересует рассеяние, мы по-прежнему должны рассматривать стационарные состояния всей си- системы. Однако мы теперь имеем дело со вторым приближе- приближением, так что мы не можем ограничиться использованием только уравнения C), а должны использовать также и D). Уравнение C), выраженное через представители в рассматри- рассматриваемом представлении, имеет вид где W — функция от Е' и а', определяемая выражением A8), а Ек — энергия стационарного состояния k невозму- невозмущенной системы. Аналогично уравнение D) принимает вид (№'-№) <pa'|2> = <pa'!F|l>, 1 (E'-Ek)(kl2) = (k\V\l). J K Разлагая правые части по правилу умножения матриц,
§ 51. ДИСПЕРСИОННОЕ РАССЕЯНИЕ 265 получаем (W - W) <ра' 1 2) = -?*)<* | 2> = <рсс' I V 1 р"а"> й»р" <р"а" | 1) + к" V | р"а" <р"а" \ D1) Вектор | 0) по-прежнему дается выражением A9), так что уравнение C9) может быть записано в виде О (W - W) <ря' 11 > = h~ (рос' | V j р°а р°а°) Можно предположить, что матричные элементы (k' | V | Л") величины F равны нулю; в самом деле, эти матричные элементы для рассматриваемого явления не- несущественны, а если бы они не равнялись нулю, то это означало бы просто, что состояния поглощения к не выбраны надлежащим образом. Далее, мы предположим, что матрич- матричные элементы (р'а' | V | р"а") имеют второй порядок ма- малости, если принять, что матричные элементы (k' \ V \ р"сх") и <р'а' | V | k") имеют первый порядок малости. Это пред- предположение будет оправдано в случае фотонов в § 64. Из урав- уравнений D3) и D2) мы заключаем, что величина (к \ 1 > будет первого порядка малости, если только Е' не лежит близко к одному из дискретных уровней энергии Ek, и что величина <ра' | 1) будет второго порядка малости. Как это вытекает из первого уравнения D1), значение <рсс' |2) с точностью до второго порядка равно 3 (W _ W) <ра' I 2> = h * У <ра' [ V | k") (k" \ V \ р°а°> ^ jk" Полная поправка второго порядка к волновой функции, именно, <ра' |1>+ (рос' |2>, удовлетворяет уравнению ^ ё |(ра' 1 У + ! V I P*">| j
266 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ Это уравнение имеет вид B3), если только а' таково, что W > тс2. Последнее неравенство означает, что выбор а' в качестве конечного состояния рассеивателя не противо- противоречит закону сохранения энергии. Мы можем поэтому заключить из общего результата C7), что коэффициент рассеяния равен р'а' ] V j р°а°>+2^ — Е' — Е^ k Таким образом, можно считать, что рассеяние состоит из двух частей; из части, происходящей от матричного элемента (р'а' | V | р°а°) энергии возмущения, и из части, проис- происходящей от матричных элементов (р'а' | V | k) и (k \ V | р°а°). Правая часть, совпадающая с ранее полученным ре- результатом C8), может быть названа прямым рассеянием. Вторую часть можно рассматривать как происходящую от поглощения падающей частицы в некоторое состояние k, за которым непосредственно следует испускание в другом направлении; эта часть аналогична переходу через про- промежуточные состояния, рассмотренному в § 44. Тот факт, что нужно сложить оба члена прежде, чем образовать квад- квадрат модуля, означает, наличие интерференции между двумя типами рассеяния. Экспериментально разделить оба типа рассеяния невозможно, и различие между ними является лишь математическим. § 52. Резонансное рассеяние Предположим, что энергия падающей частицы меняется непрерывно, а начальное состояние рассеивателя а0 фикси- фиксировано, так что полная энергия Е' или Н' меняется непре- непрерывно. Формула D4) показывает, что если Е' приближается к значению одного из дискретных уровней Ек, то рас- рассеяние становится очень большим. Согласно D4) рассеяние должно было бы быть даже бесконечным, когда Е' в точности равно одному из Ек. Бесконечный коэффициент рассеяния, разумеется, физически невозможен, так что мы должны заключить, что приближение, использованное при выводе D4), перестает быть законным, когда Е' близко к Ек. Для того чтобы исследовать рассеяние в этом случае, мы должны вернуться к точному уравнению (E'-E)\H') = V\H')
§ 52. РЕЗОНАНСНОЕ РАССЕЯНИЕ 267 (т. е. к уравнению B) § 43, в котором Е' написано вместо Я') и воспользоваться для нахождения приближенного решения другим методом. Точное уравнение, выраженное через представители, имеет вид (W - W) (щ' | Я') = 2 \ <ра' | V | рV> d3p" <р"а" | Я') + а" Б' - Ек) (k | Н') = 2 \Ф | V ] Р"а"> dE а" D5) аналогичный D1). Выберем одно какое-либо Ек и рассмотрим случай, когда Е' близко к нему. Большой член в коэффициенте рассеяния D4) возникает от таких матричных элементов У, которые лежат в столбце k или в строке k, т. е. от мат- матричных элементов вида (k | У | рсс') или вида <ра' | У | k). Рассеяние, происходящее от других матричных элементов V, имеет меньший порядок величины. Это наводит на мысль, что в точных уравнениях D5) следует в качестве прибли- приближения пренебречь всеми матричными элементами V, за ис- исключением важнейших, которые имеют вид (pa' | У ] k) или (k | У |рсс'), причем а' есть такое состояние рассеи- вателя, что его энергия допускает, без нарушения закона сохранения энергии, рассматривать его как конечное со- состояние. Тогда уравнения приводятся к виду (W - W) <ра' | Я') = <ра' | V \ k) (k \ H'), ] (Е' -Ek)(k | Я') = 2 \Ф I V | ря'> (Рр <рсс' | Я'), f причем суммирование по а' производится по тем значениям этой величины, для которых W, определяемое из A8), будет больше, чем тс2. Эти уравнения достаточно просты, и их можно решить точно без дальнейших пренебрежений. Из первого уравнения D6) получаем путем деления на W ~ W (рсс И ) = W' — W ' ™*v" —w). D7)
268 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ Мы должны выбрать величину X (которая может быть функцией от р и а') так, чтобы выражение D7) представ- представляло падающие частицы, соответствующие вектору состоя- состояния |0> или /i3/2 |p°a°), вместе с уходящими частицами. Представитель /iS/2 | р°а°> в действительности имеет вид Яб (W — W), так как условия а' = а°ир = р°, при которых он не обращается в нуль, приводят к равенству W = E'-HS (a') = E'-HS (а0) = W° = W. Итак, выражение D7) должно иметь вид D8) ' | V! k) (k | Н') а из общей формулы C7) коэффициент рассеяния будет \k)f\(k\H')\\ D9) Остается определить величину (k | Н' >. Это можно сделать, подставив во второе уравнение D6) выражение D8) для (ра' | Н'). Мы получим (?' - Ek) (k \ Н') = W* (Jt\V\ р°а°) + 2 = А»/« (k | V | р°а» где '> (а - /&), E0) Ь = я V 11 (k j F | pa'> |2 б (W - W) dsp = =*Ш a'> I2 б (В7' - W) P2 dP sin со dco dx = a' = л 2] P'l^'c 5 $ I <& | V \ P'ojxa') i2 sin со da d%. E1) a' Таким образом, (k|H') = AM<Л|К|p"ao> F,_F,' ,.,. E2)
§ 53. ИСПУСКАНИЕ И ПОГЛОЩЕНИЕ 269 Заметим, что а и Ь вещественны и b положительно. Под- Подстановка этого значения (k | Н' > в уравнение D9) приводит к следующему выражению для коэффициента рассеяния: <Pa'! v | k) ;з j (k j v , p-^vr 53 Можно получить полное эффективное сечение, если про- проинтегрировать E3) по всем направлениям рассеяния, т. е. проинтегрировать по всем направлениям вектора р' с фик- фиксированной абсолютной величиной Р' и затем просумми- просуммировать по всем а', которые следует учитывать, т. е. по тем значениям а', для которых W > тс2. При помощи E1) на- находим для полного сечения выражение b\(k\V\ tW) ? Если предположить, что величина Е' меняется непрерыв- непрерывно, проходя через значение Ек, то главное изменение в E3) или E4) вызывается малым знаменателем (?" — Ek — аJ + + Ь2. Если пренебречь зависимостью от ?" других мно- множителей в E3) или E4), то максимальное рассеяние будет иметь место, когда ?" равно Ек -\- а, и рассеяние будет половиной максимального, когда Е отличается от этого значения на величину Ь. Сильное рассеяние, возникающее при таких энергиях падающей частицы, когда ?"становится приблизительно равным Ек, приводит к появлению линии поглощения. Центр линии смещен на величину а от резо- резонансной энергии налетающей частицы, т. е. от той энергии частицы, при которой полная энергия системы в точности равнялась бы Ek, величина b иногда называется полушири- полушириной линии. § 53. Испускание и поглощение Чтобы исследовать испускание и поглощение, нужно рассматривать нестационарные состояния системы и поль- пользоваться методом возмущения § 44. Для определения коэф- коэффициента спонтанного испускания мы должны выбрать начальное состояние, в котором частица поглощена (это состояние соответствует вектору | k)) и найти вероятность того, что в некоторый более поздний момент времени ча-
270 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ стица будет уходить на бесконечность с определенным им- импульсом. Здесь можно применить метод § 46. Из выражения C9) § 46 видно, что вероятность такого испускания частицы в некотором направлении со'%', после которого рассеиватель остается в состоянии а', рассчитанная на единицу времени и единичный интервал сох. равна 2ntr1\(W'(i>'%'a;\V\k)\*. E5) При этом а' предполагается таким, что энергия частицы W, определяемая из A8), больше тс2. Для значений а', не удовлетворяющих этому условию, испускание невозможно. Матричный элемент < W'w'x'a' \ V \ k) относится к пред- представлению, в котором W, со, % и а диагональны, а весовая функция равна единице. Матричные элементы V, рассмот- рассмотренные в предыдущих трех параграфах, относились к пред- представлению, в котором рх, ру, рг диагональны при весовой функции, равной единице, или Р, со, % диагональны при весовой функции Р2 sin со. Они относятся, тем самым, к представлению, в котором W, со, х диагональны при весовой dP п2 . WP . _ л функции -т™-- Pi sin со =—?— sin со. 1аким образом, мат- матричный элемент (Wco'y/a' | V \ k) в выражении E5) равен /WP' ¦ ,\1/г умноженному на (—^— sin со нашему предыдущему матричному элементу (tt^'co'/'a' | V | k) или (p'a' | V \ к), так что выражение E5) равно 2я WP' , , , , Вероятность испускания в единичный телесный угол в еди- единицу времени с одновременным переходом рассеивателя в состояние а равна 2л_ WP' "ft ti*~ <р'а' i V \ k) \2. E6) Для того чтобы получить полную вероятность испускания частицы в единицу времени во всевозможных направлениях при всевозможных конечных состояниях рассеивателя, нужно проинтегрировать E6) по всем углам ц>'% и просум- просуммировать по всем состояниям a , энергия которых Hs (a') такова, что Hs (a) + me2 < Ek. Результат в точности ра- равен 2Ь/Н, где b определено по E1). Таким образом, имеется
§ 53. ИСПУСКАНИЕ И ПОГЛОЩЕНИЕ 271 простое соотношение между полным коэффициентом испу- испускания и полушириной линии поглощения. Рассмотрим теперь поглощение. Мы должны взять на- начальное состояние, в котором частица наверняка не погло- поглощена, а налетает с определенным импульсом. Вектор, соответствующий начальному состоянию, должен поэтому иметь вид A9). Нужно определить вероятность поглощения частицы спустя время t. Поскольку наше конечное состояние k не принадлежит к сплошному спектру, мы не можем непосредственно использовать выражение C9) § 46. Однако если мы возьмем !0> = |р°а°> E7) в качестве вектора, соответствующего начальному состоянию, то рассуждения §§ 44 и 46, которые привели к уравнению C6), будут по-прежнему применимы Они показывают, что вероятность поглощения частицы в состояние k спустя время / равна 2\(k\V\\№>)\ (Ek-E'f Это соответствует распределению падающих частиц с плот- плотностью /г ввиду отсутствия в E7) множителя h3/2, имею- имеющегося в A9). Вероятность поглощения спустя время t при условии, что одна падающая частица пересекает еди- единичную площадку в единицу времени, равна E8) Для того чтобы получить коэффициент поглощения, мы должны считать, что падающие частицы не имеют все строго одну и ту же энергию W = Е' — Hs (a0), a имеют распределение по энергии около точного значения Ek —• — Hs (a°), необходимого для поглощения. Если пучок па- падающих частиц таков, что одна частица пересекает единич- единичную площадку в единицу времени в единичном интервале энергии, то вероятность поглощения спустя время t будет даваться интегралом E8) по Е'. Этот интеграл может быть вычислен таким же образом, как интеграл C7) в § 46, и
272 ГЛ. VIII. ЗАДАЧИ О СТОЛКНОВЕНИЯХ будет равен С2РО ! <k I V \ Р°« > I • Вероятность поглощения в единицу времени при условии, что в падающем пучке одна частица пересекает единичную площадку за единицу времени в единичном интервале энергии, равна, следовательно, *™*lW)\; E9) что и представляет собой коэффициент поглощения. Следует отметить связь между коэффициентом погло- поглощения и испускания E9) и E6) и коэффициентом резонан- резонансного рассеяния, рассчитанного в предыдущем параграфе. Если падающий пучок не состоит из частиц с одной и той же энергией, но представляет собой такое распределение частиц, что число частиц на единичный интервал энергии, пересекающих единичную площадку на единицу времени, равно единице, то полное число частиц, налетающих с энергиями вблизи линии поглощения и испытывающих рассеяние, будет равно интегралу от E4) по Е'. Если пренебречь зависимостью числителя в E4) от ?", то этот интеграл в силу равенства ,) {E'~Ek — c — со будет в точности равен E9). Значит, полное число рассеян- рассеянных частиц в окрестности линии поглощения равно пол- полному числу поглощенных частиц. Мы можем поэтому рас- рассматривать все эти рассеянные частицы как поглощенные и затем снова испущенные в другом направлении. Далее, число таких частиц с энергией в окрестности линии погло- поглощения, которые испытывают рассеяние в единичный теле- телесный угол вблизи направления р', причем рассеиватель остается в состояниях а', выражается интегралом по Е' от величины E3). Этот интеграл вычисляется таким же об- образом и равен ¦-,- (р a V\k)\2\(k\V p°a°) 2
§ 53. ИСПУСКАНИЕ И ПОГЛОЩЕНИЕ 273 Это как раз равно коэффициенту поглощения E9), умножен- умноженному на коэффициент испускания E6) и деленному на пол- полный коэффициент испускания 2Ь/%. Полученный результат согласуется с точкой зрения, рассматривающей резонан- резонансно рассеянные частицы как поглощенные и вновь испу- испущенные, причем процессы испускания и поглощения ста- статистически независимы. Действительно, эта точка зрения приводит к тому, что доля от всего числа поглощенных частиц, которая вновь испускается в единичном телесном угле около данного направления, как раз равна коэффици- коэффициенту испускания в данном направлении, разделенному на полный коэффициент испускания.
ГЛАВА IX СИСТЕМЫ, СОДЕРЖАЩИЕ НЕСКОЛЬКО ОДИНАКОВЫХ ЧАСТИЦ § 54. Симметричные и антисимметричные состояния Если система в атомной физике содержит некоторое число частиц одного сорта, например некоторое число электронов, то эти частицы абсолютно неотличимы друг от друга. Перестановка двух таких частиц не приводит ни к каким наблюдаемым изменениям. Это обстоятельство порождает в квантовой механике некоторые специфические явления, не имеющие аналога в классической теории. Эти явления связаны с тем, что в квантовой механике может произойти переход,' представляющий собой всего лишь перестановку одинаковых частиц, а такой переход не может быть обнаружен экспериментально. Удовлетворитель- Удовлетворительная теория должна, очевидно, считать два экспериментально- неразличимых состояния за- одно и то же и отрицать, что произошел какой-либо переход, когда две одинаковые частицы поменялись местами. Мы увидим, что можно пере- переформулировать теорию таким образом, чтобы это так и было. Допустим, что имеется система, содержащая п одинако- одинаковых частиц. Мы можем выбрать в качестве динамических переменных набор переменных |ь описывающих первую частицу, соответствующий набор ?2> описывающих вторую частицу, и т. д. до ?„, описывающих п-ю частицу. Перемен- Переменные 1,г будут коммутировать с \s при г Ф s. (Могут понадо- понадобиться некоторые дополнительные переменные, описываю- описывающие то, что входит в состав системы сверх п одинаковых частиц, но в данной главе не обязательно вводить их явно.) Оператор Гамильтона, описывающий движение системы, будет выражаться функцией от |х, |2, ..., ?„. Тот факт, что частицы являются одинаковыми, требует, чтобы оператор Гамильтона был симметричной функцией от 1Ъ 1% ?„>
§ 54. СИММЕТРИЧНЫЕ И АНТИСИММЕТРИЧНЫЕ СОСТОЯНИЯ 275 т. е. он не должен меняться, если производится взаимная перестановка наборов переменных ?Л, или вообще любая их перестановка. Действительно, любая величина, имеющая физическое значение, должна быть симметричной функцией от переменных ?. Пусть \ ах), \ Ьх)... — кет-векторы состояния для первой частицы, рассматриваемой как отдельная динамическая система. Соответственно \ а2), \Ь2) ... — кет-векторы состоя- состояния для второй частицы, взятой в отдельности, и т. д. Мы можем получить вектор состояния для ансамбля частиц, взяв произведение векторов, относящихся к каждой из частиц в отдельности, например I «i>! &а> i с3> • • • | gn) = | яАсз • - -gn), (I) в соответствии с обозначениями F5) § 20. Вектор A) соот- соответствует частному виду состояния для ансамбля частиц, который может быть описан так, что каждая частица на- находится в своем собственном состоянии, соответствующем своему множителю в левой части выражения A). Общий вектор состояния системы частиц имеет вид суммы или интеграла векторов, аналогичных A), и соответствует со- состоянию системы, относительно которого нельзя говорить, что каждая частица находится в своем собственном состоя- состоянии, а можно лишь говорить, что каждая частица отчасти находится в каждом из нескольких состояний, причем име- имеется корреляция с другими частицами, находящимися от- отчасти в различных состояния». Если векторы \ах), \bl), ... представляют собой совокупность базисных векторов для первой частицы, то векторы \ а2), \Ьг), ... будут совокуп- совокупностью базисных векторов для второй частицы и т. д., и, наконец, векторы A) будут совокупностью базисных векторов для системы, т. е. для ансамбля частиц. Мы назовем пред- представление, даваемое для системы такими базисными век- векторами, симметричным представлением, так как в нем все частицы рассматриваются на равных основаниях. В выражении A) можно переставить векторы первых двух частиц и получить другой вектор системы, именно Вообще мы можем поменять ролями первые две частицы в любом векторе системы (ансамбля частиц) и получить другой вектор системы. Процесс взаимной перестановки
276 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ (транспозиции) первых двух частиц представляет собой оператор,,который может применяться к вектору состояния системы и, очевидно, является линейным оператором такого типа, который рассматривался в § 7. Аналогично процесс взаимной перестановки двух частиц любой пары есть ли- линейный оператор, и при повторном применении таких взаим- взаимных перестановок или транспозиций мы получим некоторую произвольную перестановку частиц как результат действия линейного оператора на вектор состояния системы. Пере- Перестановка называется четной перестановкой или нечетной перестановкой, смотря по тому, составлена она из четного или нечетного числа транспозиций. Вектор | X) системы называется симметричным, если он не изменяется при любой перестановке, т. е. если Р\Х) = \Х) B) для любой перестановки Р. Он называется антисимметрич- антисимметричным, если не меняется при четной перестановке и меняет знак при нечетной, т. е. если Р\Х)=±\Х), C) где + или — берется в зависимости от того, четно или нечетно Р. Состояние, соответствующее симметричному век- вектору, называется симметричным состоянием, а состояние, соответствующее антисимметричному вектору, называется антисимметричным состоянием. В симметричном пред- представлении представителем симметричного вектора является симметричная функция переменных, относящихся к различ- различным частицам, а представителем антисимметричного вектора является антисимметричная функция. В шредингеровской картине вектор, соответствующий состоянию системы, изменяется со временем соответственно уравнению Шредингера. Если он первоначально был сим- симметричен, то он должен все время оставаться сим- симметричным, поскольку в силу симметричности оператора Гамильтона никакое возмущение не может нарушить сим- симметрию. Аналогично, если вектор первоначально анти- антисимметричен, то он должен все время оставаться антисим- антисимметричным. Итак, состояние, являющееся первоначально сим- симметричным, всегда остается симметричным, а состояние, первоначально антисимметричное, всегда остается анти- антисимметричным. Как следствие этого возникает возможность,
§ 54. СИММЕТРИЧНЫЕ И АНТИСИММЕТРИЧНЫЕ СОСТОЯНИЯ 277 что для некоторых частиц в природе встречаются только симметричные состояния, а для других только антисим- антисимметричные состояния. Если бы осуществилась какая-либо из этих возможностей, то это привело бы к некоторым осо- особым явлениям для таких частиц. Предположим сперва, что встречаются только антисим- антисимметричные состояния. Вектор A) не является антисим- антисимметричным и поэтому не соответствует состояниям, встре- встречающимся в природе. Из выражения A) мы можем, вообще говоря, образовать антисимметричный вектор, произведя всевозможные перестановки, сложив результаты, причем нужно ввести коэффициент —1 перед членами, происхо- происходящими от нечетных перестановок. Таким образом полу- получится >\а,Ь.,с*...еп). D) Знак + или — берется в зависимости от того, четна или нечетна перестановка Р. Вектор D) можно записать как определитель !«2 I&2 It's) 1«я> \Ьп) \Сп) \Sn) E) и его представитель в симметричном представлении будет определителем. Вектор D) или E) не является общим видом антисимметричного вектора, а представляет собой простей- простейший случай. Он соответствует состоянию системы, о котором можно сказать, что некоторые одночастичные состояния, именно состояния а, Ь, с, ..., g, заняты, но нельзя сказать, какая именно частица в каком состоянии; каждая частица может в равной мере находиться в любом состоянии. Если два из одночастичных состояний а, Ь, с, ..., g являются одинаковыми, то вектор D) или E) обращается в нуль и не соответствует какому-либо состоянию системы. Таким обра- образом, две частицы не могут быть в одном и том же состоянии.
278 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ В более общей форме можно сказать, что занятые состояния должны быть все линейно независимы, иначе D) и E) обра- обращаются в нуль. Это очень важная характеристика частиц, для которых в природе встречаются только антисимметрич- антисимметричные состояния. Она приводит к особой статистике, которая впервые была изучена Ферми, и поэтому мы будем называть частицы, для которых в природе встречаются только анти- антисимметричные состояния, фермионами. Предположим теперь, что в природе встречаются только симметричные состояния. Вектор A) не является симметрич- симметричным, за исключением того случая, когда все одночастичные состояния а, Ь, с, ..., g одинаковы, но мы всегда можем получить из него симметричный вектор, выполняя всевозмож- всевозможные перестановки и складывая результаты так, чтобы получить Zp\aihc3...gn). F) Вектор A) не является общим видом симметричного вектора, а представляет собой простейший случай. Он соответствует состоянию системы,-о котором можно сказать, что опреде- определенные одночастичные состояния заняты, именно a,b,c,...,g, но нельзя сказать, какая частица в каком состоянии. Теперь возможно, чтобы два или более состояний были одинаковыми, гак что две или более частиц могут быть в одном состоянии. Несмотря на это, статистика таких частиц отличается от обычной статистики классической теории. Новая статистика была впервые изучена Бозе, и поэтому мы будем называть частицы, для которых в природе встречаются только сим- симметричные состояния, бозонами. Отличие статистики Бозе от обычной статистики можно представить себе, рассматривая частный случай — случай двух частиц и всего лишь двух независимых состояний а и b для частицы. Согласно классической механике, если система из двух частиц находится в состоянии термодина- термодинамического равновесия при высокой температуре, то каждая частица может быть с равной вероятностью в любом из этих состояний. Следовательно, имеется вероятность 1/4, что обе частицы находятся в состоянии а, вероятность i/i, что обе частицы находятся в состоянии b и вероятность '/г. что в каждом состоянии находится одна частица. В квантовой
§ 54. СИММЕТРИЧНЫЕ И АНТИСИММЕТРИЧНЫЕ СОСТОЯНИЯ 279 теории имеется три независимых симметричных состояния пары частиц; они соответствуют симметричным векторам I «i> I (к), | &!> | Ь2) и | ах) \Ь2)+ | а2) | Ьх), и их можно характеризовать как случаи, когда обе частицы находятся в состоянии а, обе находятся в состоянии Ь, и по одной на- находится в каждом из состояний а и Ь. Как было показано в § 33, в термодинамическом равновесии при высокой темпе- температуре эти три состояния равновероятны, так что имеется вероятность '/,,, что обе частицы будут в состоянии а, веро- вероятность 1/з, что обе частицы будут в состоянии Ь, и вероят- вероятность Уз, что в каждом из состояний а и b будет по одной частице. Таким образом, по статистике Бозе вероятность нахождения двух частиц в одном и том же состоянии больше, чем по классической статистике. Статистика Бозе отличается от классической статистики в противоположную сторону по сравнению со статистикой Ферми, для которой вероятность нахождения двух частиц в одном и том же состоянии равна нулю. При построении теории атома в духе, указанном в на- начале § 38, нужно для достижения согласия с экспериментом считать, что два электрона никогда не бывают в одном и том же состоянии. Это правило известно как принцип Паули. Оно показывает, что электроны являются фермионами. Планковский закон излучения показывает, что фотоны являются бозонами, так как только статистика Бозе для фотонов приводит к закону Планка. Аналогично для каж- каждого сорта других частиц, известных в физике, существуют экспериментальные данные, показывающие, что эти частицы являются либо фермионами, либо,бозонами. Протоны, ней- нейтроны, позитроны являются фермионами, а-частицы явля- являются бозонами. По-видимому, все частицы, существующие в природе, являются либо фермионами, либо бозонами, и таким образом, практически встречаются только антисимметрич- антисимметричные или только симметричные состояния системы одинаковых частиц. Математически возможны и другие более сложные виды симметрии, но они не соответствуют ни одной из из- известных частиц. В теории, допускающей только антисим- антисимметричные частицы или только симметричные состояния для данного вида частиц, невозможно провести различие между двумя состояниями, отличающимися только пере- перестановкой частиц, как что переходы, о которых шла речь в начале параграфа, действительно отсутствуют.
280 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ § 55. Перестановки как динамические переменные Построим теперь общую теорию систем, содержащих п одинаковых частиц для случая, когда допускаются состояния с любыми свойствами симметрии, а не только симметрич- симметричные или антисимметричные. Состояние в общем случае не будет симметричным или антисимметричным и не будет выражаться линейной комбинацией симметричного и анти- антисимметричного состояний, если только п > 2. Эта теория не приложима непосредственно к какому-либо сорту ча- частиц, встречающихся в природе, но тем не менее она полезна для разработки приближенного метода рассмотрения ан- ансамбля электронов, как будет показано в § 58. Мы видели, что каждая перестановка Р системы п частиц является линейным оператором, действующим на любой вектор системы частиц. Следовательно, мы можем рассма- рассматривать Р как динамическую переменную в нашей системе п частиц. Имеется п\ перестановок, каждую из которых можно рассматривать как динамическую переменную. Одна из них, скажем, Ри есть тождественная перестановка, равная единице. Произведение любых двух перестановок есть третья перестановка, и следовательно, любая функция перестановок приводится к линейной. Каждая перестановка Р имеет обратную Р1, удовлетворяющую Перестановка Р, примененная к бра-вектору системы (X ], дает другой бра-вектор Р (X |. Если Р применить к обоим множителям произведения (X | У"), то произведение не должно меняться, поскольку оно является числом, не зависящим от порядка частиц. Значит, (P(X\)P\Y) = (X\Y), откуда Р(Х\ = (Х\Р-\ G) Далее, Р (Х_\ является сопряженным от Р \ X), и поэтому равно (X | Р, что, согласно G), дает Р = Р-К (8) Следовательно, перестановка, вообще говоря, не является вещественной динамической переменной, поскольку ее сопряженная равна обратной.
§ 56. ПЕРЕСТАНОВКИ КАК ИНТЕГРАЛЫ ДВИЖЕНИЯ 281 Любая перестановка чисел 1, 2, 3, ..., п может быть выражена с помощью циклов, например для я = 8 Л, = A43) B7) E8) F), (9) где каждое число в скобке заменяется последующим, а последнее число в скобке заменяется на первое. Следо- Следовательно, Ра переводит числа 12345678в4713862 5. Тип некоторой перестановки определяется разбиением числа п на части, равные количеству чисел в скобках. Так, тип Ра определяется разбиением 8 = 3 + 2 + 2+ 1. Переста- Перестановки одного и того же типа, т. е. соответствующие одному и тому же разбиению, мы будем называть подобными. Так, например, перестановка в (9) подобна следующей: Яй = (871)C5)D6)B). A0) Все п\ возможных перестановок могут быть подразделены на серии подобных перестановок; каждая серия назы- называется классом. Перестановка Рх — 1 сама по себе образует класс. Каждая перестановка подобна обратной себе. Если две перестановки Ра и Рь подобны, то одна из них Рь может быть получена путем применения некоторой пере- перестановки Рх к другой Ра. Так, в наших примерах (9), A0) мы можем взять в качестве Рх перестановку, переводящую 1 4 3 2 7 5 8 6 в 8 7 1 3 5 4 6 2, т. е. перестановку Рх = A8623) D75). Различные способы записи Ра и Рь в виде циклов приводят к различным Рх. Каждое из этих Рх, примененное к произ- произведению Ра | X), переводит его в Рь • Рх \ X), т. е. РхРа\Х) = РьРх\Х). Следовательно, Рь = РхРаР-х\ (И) что выражает условие подобия Ра и Рь в виде алгебраиче- алгебраического уравнения. Существование хотя бы одного Рх, удовле- удовлетворяющего соотношению A1), является достаточным усло- условием для доказательства подобия Ра и Рь. § 56. Перестановки как интегралы движения Любая симметричная функция V динамических пере- переменных всех частиц не изменяется при любой перестановке Р, так что применение Р к произведению V | X) сказыва-
282 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ ется только на множителе | X), так что PV\X) = VP\X), значит, PV = VP A2) откуда видно, что симметричная функция динамических переменных коммутирует с любой перестановкой. Оператор Гамильтона является симметричной функцией динами- динамических переменных, так что он коммутирует с любой пере- перестановкой. Отсюда следует, что каждая перестановка яв- является интегралом движения. Это имеет место даже в том случае, если оператор Гамильтона не постоянен. Если | Xt) является некоторым решением уравнения Шредин- гера, то Р | Xt) есть также решение. Если для некоторой системы в квантовой механике известен интеграл движенияа, то мы знаем, что первоначальное значение а, равное а', сохраняется все время, так что можно приписать различ- различным состояниям различные а' и таким образом классифи- классифицировать состояния. Однако эту процедуру нельзя приме- применить непосредственно в случае, когда имеется несколько интегралов движения, не коммутирующих друг с другом (как в случае с нашими перестановками Р), поскольку нельзя, вообще говоря, приписать для произвольного со- состояния числовые значения всем а одновременно. Рассмот- Рассмотрим сначала случай системы, оператор Гамильтона которой не содержит времени явно. Существование интегралов движения а, не коммутирующих друг с другом, есть признак вырожденности системы. Действительно, для невырожден- невырожденной системы оператор Гамильтона сам по себе образует полный набор коммутирующих переменных и, следовательно, по теореме 2 § 19 каждое из а является функцией Н и поэ- поэтому коммутирует с другими а. Мы должны теперь искать такую функцию |5 от величины а, которая имела бы одно и то же численное значение f>' для всех состояний, относя- относящихся к одному и тому же уровню энергии Н', чтобы можно было использовать р для классификации уровней энергии системы. Требование для |3 можно выразить, сказав, что [J должно быть функцией от Я, и поэтому должно коммути- коммутировать с любой динамической переменной, коммутирующей g H, т. е. с любым интегралом движения. Если величины а являются единственными интегралами движения или если они образуют набор, коммутирующий со
§ 56. ПЕРЕСТАНОВКИ КАК ИНТЕГРАЛЫ ДВИЖЕНИЯ 283 всеми другими независимыми интегралами движения, наша задача сводится к нахождению функции р от величин а, которая коммутировала бы со всеми а. Тогда мы можем приписать численные значения Р' величины р каждому уровню энергии. Если можно найти несколько таких функ- функций р, они должны все коммутировать друг с другом, так что мы можем приписать им всем одновременно численные зна- значения. Таким образом, мы получаем классификацию уровней энергии. Если оператор энергии содержит время явно, то нельзя говорить об уровнях энергии, но величины р будут по-прежнему давать удобную классификацию состояний. Воспользуемся этим методом при рассмотрении наших перестановок Р. Нужно найти функцию % от Р такую, что Р%Р'1 = % для любого Р. Очевидно, что возможным % является ?РС, сумма всех перестановок определенного класса с, т. е. сумма всех подобных перестановок, так как сумма ^РРСР'1 должна состоять из тех же перестановок, суммируемых в другом порядке. Для каждого класса будет одно такое %. Далее, не может быть других независимых %, так как произвольная функция от Р может быть выражена как линейная функция этих перестановок с численными коэффициентами, и она будет коммутировать со всеми Р только в том случае, если коэффициенты при подобных Р будут всегда одинаковыми. Таким путем получаются все х. которые могут быть использованы для классификации со- состояний. Удобно определить каждое % как среднее, а не сумму, так что где пс — число перестановок Р в классе с. Другое выражение для %с имеет вид где сумма распространяется на все п\ перестановок Р; легко проверить, что сумма содержит каждый член класса с оди- одинаковое число раз. Для каждой перестановки Р имеется одно %, скажем % (Р), равное среднему от всех перестано- перестановок, подобных Р. Одно из % есть % (Рх) = 1. Интегралы движения Xi> Xa. ¦••> 1т, полученные таким образом, будут каждый иметь определенное численное зна- значение для каждого стационарного состояния системы в том
284 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ случае, когда оператор Гамильтона не содержит времени явно. В общем случае они также могут быть использованы для классификации состояний, причем каждому набору до- допустимых численных значений %\, yfa, ¦¦¦, %'т величин % будет соответствовать одна совокупность состояний. Так как % всегда являются интегралами движения, эти совокуп- совокупности состояний будут обособленными или взаимно исклю- исключающими в том смысле, что переходы из состояний одной группы в состояния другой группы никогда не происхо- происходят. Допустимые наборы значений %', которые можно придать величинам %, ограничены тем, что существуют алгебраи- алгебраические соотношения между величинами %. Произведение любых двух х, типа %р ¦ х?, очевидно, может быть выра- выражено в виде линейной функции от Р, а так как оно коммути- коммутирует с любым Р, то должно выражаться линейной функцией X, так что а-zli +••• +атХт, A4) где а — числа. Всякие численные значения %', которые приписываются величинам %, должны быть собственными значениями % и должны удовлетворять тем же алгебраи- алгебраическим уравнениям. Каждому решению %' этих уравнений соответствует один обособленный набор состояний. Одним из Таких решений является, очевидно, %р = 1 для всех iP; оно дает совокупность симметричных состояний. Другое очевидное решение, дающее совокупность антисимметричных состояний, есть %'р = ± 1, где знак ¦+- или — берется в за- зависимости от того, являются ли перестановки в классе р четными или нечетными. Другие решения могут быть получены в любом частном случае с помощью обычных алгебраических методов, так как коэффициенты а в выра- выражении A4) могут быть определены непосредственно при рас- рассмотрении типов перестановок, к которым относятся рас- рассматриваемые %. Любое решение представляет собой, с точ- точностью до некоторого множителя, то, что называется в тео- теории групп характером группы перестановок. Величины % все являются вещественными динамическими переменными, так как каждое Р и его комплексно-сопряженное Р'х являются подобными перестановками и по определению х они входят в % в виде суммы, так что %' должны быть все вещественными числами.
§ 56. ПЕРЕСТАНОВКИ КАК ИНТЕГРАЛЫ ДВИЖЕНИЯ 285 Число возможных решений уравнений A4) может быть легко определено, так как оно должно быть равно числу различных собственных значений произвольной функции В от величины %. Функцию В можно выразить как линейную функцию от % с помощью уравнения A4), так что m. A5) Аналогично мы можем выразить каждую из величин В2, В3, ..., Вт как линейную функцию от %. Из полученных таким образом т уравнений совместно с уравнением % (Pi)= = 1 мы можем исключить m неизвестных %1( ул, ..., %т, по- получив в результате алгебраическое уравнение т степени относительно В Совокупность т решений этого уравнения дают т возмож- возможных собственных значений В, каждое из которых, согласно A5), будет линейной функцией от Ьъ Ь2, ..., Ът\ коэффи- коэффициенты каждой такой линейной функции являются воз- возможными системами значений величин %ь %2, ..., %'т. Си- Системы значений у', полученные таким образом, должны быть все различны, так как если бы различных допустимых систем величин у' для х было меньше чем т, то существовала бы такая линейная функция от %, все собственные значения которой были бы равны нулю. Это означает равенство нулю самой линейной функции. Но тогда величины х не были бы линеГшо независимыми. Итак, число допустимых систем зна- значений х в точности равно т, что равно числу классов перестановок или числу разбиений п. Это число и есть поэтому число обособленных наборов состояний. Все физически важные динамические переменные и все наблюдаемые величины симметричны по частицам и, сле- следовательно, коммутируют со всеми Р. Таким образом, един- единственными физически важными функциями Р являются вели- величины %. Если два состояния соответствуют векторам | %') и / (Р) I У»'). гДе I х') — некоторый собственный вектор опе- операторов %, принадлежащий собственному значению х> и / (Р) — некоторая функция от Р такая, что / (Р) | у/ ) ф 0, то эти два состояния неразличимы и являются поэтому физи- физически эквивалентными. Имеется определенное число п (х') не- независимых векторов, которые могут быть образованы умно- умножением | %') на различные функции от Р, причем это число
286 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ зависит только от х- Оно равно числу строк и столбцов в матричном представлении Р, в котором каждое х равно % . Если | х') соответствуют стационарному состоянию, то п (%') будет степенью его вырождения (поскольку дело ка- касается вырождения, вызванпого симметрией относительно перестановки частиц). Это вырождение не может быть устранено никаким возмущением, являющимся симметрич- симметричным относительно перестановки частиц. § 57. Определение уровней энергии Применим метод возмущения § 43 для определения в первом приближении уровней энергии, когда оператор Гамильтона не содержит времени явно. Предположим, что в невозмущенном стационарном состоянии системы каждая из одинаковых частиц имеет свое собственное индивидуаль- индивидуальное состояние. При п частицах в системе мы будем иметь п таких состояний, соответствующих векторам, скажем 1а1), |а2), ..., |а"), которые будем считать ортогональными. Вектор системы имеет вид = \а\)\а\)...\аая), A6) как и вектор A), с той разницей, что здесь написано а1, а2,... вместо а, Ь,... Применяя к нему оператор перестановки Р, получим другой вектор, например P\X) = \al)\a*)...\anz), A7) где г, s, ..., г образуют некоторую перестановку чисел 1, 2, ..., п, соответствующую другому стационарному состоя- состоянию системы частиц с той же энергией. Всего имеется га! невозмущенных состояний с этой энергией, если предполо- предположить, что нет других источников вырождения. Согласно методу § 43 в таком случае, когда система вырождена, нужно рассматривать такие матричные элементы энергии возмущения V, которые относятся к двум состояниям с од- одной и той же энергией, т. е. матричные элементы типа (X | P0VPb \ X). Они образуют матрицу из о! строк и столбцов, собственные значения которой образуют поправку первого порядка к уровням энергии. Мы должны теперь ввести другой вид оператора пере- перестановки, который может действовать на вектор A7), именно оператор, действующий на индексы а. Обозначим этот one-
§ 57. ОПРЕДЕЛЕНИЕ УРОВНЕЙ ЭНЕРГИИ 287 ратор через Ра. Основное различие между Р и Ра можно пояснить следующим образом. Рассмотрим перестановку в общем смысле, скажем, состоящую в обмене 2 и 3. Она может быть истолкована либо как перестановка объектов 2 и 3, либо как перестановка объектов в местах 2 и 3. Зти две операции дают, вообще говоря, совершенно различные результаты. Первое толкование соответствует оператору Р; объектами, о которых идет речь, являются одинаковые частицы. Перестановка во втором толковании имеет смысл только в применении к вектору вида A7), согласно кото- которому каждая часть имеет «место», определяемое своим а, или к сумме векторов вида A7). Перестановку Ра можно рассматривать как обычную динамическую переменную лишь в ограниченном смысле только тогда, когда дело касается состояний, получаемых путем суперпозиции различных со- состояний вида A7). Как раз таким случаем является наша настоящая задача возмущения. Мы можем образовать алгебраическую функцию от Ра, которая будет оператором, действующим на вектор вида A7). В частности, можно построить величину % (Р*), т. е. среднее от всех Ра в определенном классе с. Эта величина должна быть равна % (Рс), среднему от Р в том же классе, так как полный набор всех перестановок в данном классе должен, очевидно, быть тем же самым, независимо от того, пере- переставляются ли частицы или места, в которых находятся частицы. Любое Р коммутирует с любым Ра, т. е. РаР* = РЪРа. A8) Нумеруя а теми же числами 1, 2, 3, ..., что и частицы, мы установим взаимно однозначное соответствие между вели- величинами а и частицами, так что если дана некоторая пере- перестановка Ра, действующая на частицы, то можно придать смысл соответствующей перестановке Р™, действующей на а. Этот смысл состоит в том, что для вектора | X), опреде- определяемого формулой A6), имеет место равенство РааРа\Х) = \Х). A9) Так как различные векторы 1а1), |а2), ... ортогональны, то | X) и Р | X) являются ортогональными, за исключением случая Р = 1. Отсюда следует, что для любого набора
288 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ коэффициентов ср справедливо равенство 2ср(Х\Р*Ра\Х)-сРа B0) р в предположении, что | X) нормировано; суммирование про- производится по всем п\ перестановкам Р или Ра при фиксиро- фиксированном Ра- Определим теперь VP посредством формулы VP = (X\VP\X). B1) Принимая во внимание B0), мы имеем тогда, для любых двух перестановок Рх и Ру (X | PxVPy | X) = (X | VPxPy | X) = VPxPy = p Согласно A8) отсюда следует (X | Р xVPy! Х> = % VP (XI РХР*РУ! Х>. B2) р Мы можем переписать этот результат в виде V «= У) VP/», B3) р где знак «й означает равенство в ограниченном смысле: операторы с обеих сторон равны лишь постольку, поскольку они действуют на кет-векторы вида Р | X) и на сопряженные им бра-векторы. Формула B3) показывает, что энергия возмущения V равносильна, в ограниченном смысле, линейной функции операторов перестановки Ра с коэффициентами Vr, давае- даваемыми выражением B1). Равенство в ограниченном смысле, указанном выше, является достаточным для расчета попра- поправок к уровням энергии в первом приближении, так как в расчете участвуют только те матричные элементы V, которые даются выражением B2). Формула B3) очень удобна, так как с выражением в правой части легко иметь дело. В качестве примера применения формулы B3) определим среднюю энергию всех тех состояний, возникающих из невозмущенного состояния A6), которые принадлежат од- одному обособленному набору состояний. Требуется сосчитать среднее значение V для таких состояний A7), в которых у.
§ 57. ОПРЕДЕЛЕНИЕ УРОВНЕЙ ЭНЕРГИИ 289 имеют выбранные численные значения у'. Среднее собст- собственное значение Р* в любом из этих состояний равно сред- среднему собственному значению PaP'^(Payi для произвольного Ра и, следовательно, равно что равно %'(PaJ или %' (Ра). Следовательно, среднее соб- собственное значение V равно ^]VPx'(P). Аналогичный метод р может быть использован для расчета среднего собствен- собственного значения любой функции от V; для того чтобы выпол- выполнить усреднение, нужно только заменить каждое Ра на Число урозней энергии в обособленном наборе состояний % = % , возникающих из данного состояния невозмущен- невозмущенной системы, равно числу собственных значений правой части B3), совместных с уравнениями % — %'. Это число равно тому числу п (%'), которое было введено в конце предыдущего параграфа, и, таким образом, как раз равно степени вырождения состояний в рассматриваемом обо- обособленном наборе. Мы предполагали, что индивидуальные кет-векторы 1), а1), (а которые, согласно A6), определяют невозмущенное состоя- состояние, являются ортогональными. Теория легко может быть распространена на случай, когда некоторые из этих векторов равны, тогда как неравные векторы по-прежнему ортого- ортогональны. Некоторые перестановки Ра теперь будут такими, что имеет место Ра | X) = | X); это именно те перестанов- перестановки, которые содержат лишь обмен местами одинаковых а. Уравнение B0) будет выполняться, если производить сум- суммирование только по тем Р, которые делают Ра | X) раз- различными. С этим изменением смысла 2 все предыдущие р уравнения останутся по-прежнему справедливыми, вклю- включая результат B3). Для рассматриваемого типа | X) будут ограничения на возможные числовые значения величин %, например, эти величины не могут иметь таких значений, ко- которые соответствовали бы антисимметричному вектору [ X ).
290 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ § 58. Применение к электронам Рассмотрим случай, когда одинаковые частицы являются электронами. Это означает, согласно принципу Паули, рас- рассмотренному в § 54, что мы должны принимать во внимание только антисимметричные состояния. Необходимо теперь в явном виде учесть, что электроны имеют спин, который проявляется в наличии момента количества движения и маг- магнитного момента. Влияние спина на движение электрона в электромагнитном поле не очень велико. Возникают доба- добавочные силы, действующие на электрон благодаря его маг- магнитному моменту, что требует введения дополнительных членов в оператор Гамильтона. Спиновый момент количе- количества движения не влияет непосредственно, но он вступает в игру, когда появляются силы, стремящиеся повернуть магнитный момент, так как магнитный момент и момент ко- количества движения всегда должны быть одинаково направ- направлены. В отсутствие сильного магнитного поля все эти эф- эффекты малы и имеют тот же самый порядок величины, что и релятивистские поправки, и нет необходимости принимать их во внимание в нерелятивистской теории. Важность спина состоит не в этих, слабых влияниях на движение электрона, но в том, что спин дает электрону два внутренних состояния, соответствующих двум возможным значениям проекции спина на произвольное направление, что приводит к удвое- удвоению числа независимых состояний электрона. Этот факт в сочетании с принципом Паули имеет весьма важные по- последствия. Имея дело с ансамблем электронов, мы встречаемся с двумя группами динамических переменных. Первая груп- группа, которую можно назвать орбитальными переменными, со- состоит из координат х, у, г всех электронов и сопряженных им импульсов рх, ру, рг. Вторая группа состоит из спиновых переменных, т. е. из определенных в § 37 величин ох, ау, ог для каждого из электронов. Эти две группы переменных относятся к различным степеням свободы. Согласно §§ 20 и 21 вектор, фиксирующий состояние всей системы, может иметь вид \ А) \ В), где \ А) — вектор, относящийся к од- одним лишь орбитальным переменным, а | В) — вектор, отно- относящийся к одним спиновым переменным, а общий вид векто- вектора, фиксирующего состояние всей системы, представляет собой сумму или интеграл таких выражений. Такой подход
§ 58. ПРИМЕНЕНИЕ К ЭЛЕКТРОНАМ 291 к задаче позволяет нам ввести два вида операторов пере- перестановки. Первый, скажем Рх, применяется лишь к орби- орбитальным переменным и действует только на множитель | А > и второй, скажем Ра, применяется лишь к спиновым переменным и действует только на множитель [ В). Опера- Операторы Рх и Р° могут быть применены к любому вектору всей системы, не обязательно к определенным частным видам век- векторов, как Ра в предыдущем параграфе. Перестановки Р, которые мы имели до сих пор, применяются ко всем дина- динамическим переменным рассматриваемых частиц, так что в случае электронов они действуют как на орбитальные, так и на спиновые переменные. Это означает, что каждое Ра равно произведению Ра = Р'аР°а- B4) Теперь можно показать необходимость учета спиновых переменных при применении принципа Паули, даже если мы пренебрегаем спиновыми силами в операторе Гамильтона. Для любого состояния, встречающегося в природе, каждое Ра должно иметь величину ±1, смотря по тому, является ли данная перестановка четной или нечетной, так что из B4) следует #Я2 = ±1. B5) Теория трех предыдущих параграфов становится три- тривиальной, если ее применять непосредственно к электронам, для которых каждая перестановка Ра =±1. Мы можем, однако, применить ее к перестановкам типа Рх для электро- электронов. Операторы Р° являются интегралами движения, если пренебречь членами в операторе Гамильтона, возникающими от спиновых сил, так как при таком пренебрежении спино- спиновые динамические переменные о вообще не входят в опе- оператор Гамильтона. Следовательно, операторы Рх также должны быть интегралами движения. Мы можем теперь ввести новые %, равные среднему от всех Рх в каждом классе, и утверждать, что любому допустимому набору чис- численных значений %' этих величин % будет соответствовать обособленный набор состояний. Таким образом, существу- существуют обособленные наборы состояний для многоэлектронных систем, даже если ограничиться только теми состояниями, которые удовлетворяют принципу Паули. Обособленность набора состояний теперь, разумеется, только приближенная,
292 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ так как операторы % являются интегралами движения лишь постольку, поскольку мы пренебрегаем спиновыми силами. В действительности будет существовать небольшая вероят- вероятность переходов из состояний одного набора в состояния другого набора. Уравнение B5) дает нам простую связь между величина- величинами Рх и Р°, которая означает, что вместо изучения динами- динамических переменных Рх мы можем для получения всех желае- желаемых результатов, например характеров %', изучать динами- динамические переменные Р°. Изучать Ра гораздо легче, так как имеется всего два независимых состояния каждого электрона. Наличие всего двух спиновых состояний приводит к тому, что число характеров %' группы перестановок спиновых переменных меньше, чем в общем случае группы перестано- перестановок, так как вектор состояния, содержащий спиновые пе- переменные, не может быть антисимметричным более чем по двум переменным. Изучение Ра особенно облегчается тем, что их можно выразить в виде алгебраических функций от динамических переменных <х. Рассмотрим величину 1 1 С помощью уравнений E0) и E1) § 37 легко находим, что (<*i> о2J = (<Ух1<ух2 + оу1оу2 + аг1стг2)а = 3 - 2 @Х, <т2) B6) и, следовательно, ОЪ = \ {1 + 2 К, а2) + (orlf <х2K} = 1. B7) Далее мы находим 12и*1 о \их1~Г^х2 lvzlu!j2~rlu!/lueZ!t и, следовательно, Аналогичные соотношения выполняются для ауХ и агЪ так что мы имеем О12в1 = ст2О13 или
§ 58. ПРИМЕНЕНИЕ К ЭЛЕКТРОНАМ 293 Отсюда мы можем получить с помощью B7) Эти перестановочные соотношения для О1а с а, и а8 в точ- точности те же самые, как для P°s, т. е. для перестановки, состоящей в обмене спиновых переменных электронов 1 и 2. Следовательно, мы можем положить где с — число. Уравнение B7) показывает, что с = ±1. Для того чтобы определить, какое из этих значений пра- правильно, заметим, что собственные значения Р°„ равны 1, 1, 1, —1 в соответствии с фактом существования трех незави- независимых симметричных и одного антисимметричного состоя- состояний в спиновых переменных двух электронов. В обозначе- обозначениях § 37 это состояния, представляемые тремя симме- симметричными функциями /а Ш fa Ю, h Ш k Ю. /а (<&) k (*«) +/р Ш fa Ш и одной антисимметричной Следовательно, среднее значение Р°н = у. Среднее собст- собственное значение (в1в2), очевидно, равно нулю и, следова- следовательно, среднее собственное значение Qi2 = -o- Значит, должно быть с = 1, так что можно положить К. = |{1+К, <7о)Ь B8) Таким образом, перестановка Ра, являющаяся простой транспозицией, может быть выражена в виде алгебраи- алгебраической функции от а. Любая другая перестановка представ- представляется произведением транспозиций, и поэтому также может быть выражена как функция от or. С помощью B5) мы можем теперь выразить Рх, как алгебраическую функцию от а, и исключить из рассмотрения Ра. Поскольку в B5) нужно взять знак минус, когда перестановки являются транспо- транспозициями, и поскольку квадрат транспозиции равен еди- единице, то мы имеем 4 **)}• B9)
294 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ Формулу B9) удобно использовать для вычисления ха- характеров %', определяющих обособленные наборы состояний. Мы имеем, например, для перестановок, состоящих из транспозиций, Можно ввести динамическую переменную 5, описывающую величину полного спинового момента количества движения, ¦у У аг в единицах %. Согласно C9) § 36 мы имеем r t Используя эту формулу, мы получим 22>г. «<) = Следовательно, 1 J. . 4s (s -j- 1) — 3n\ __ n (n — 4) + 4s(s_|_l) Xi2 = —у \l~i n(rt-l) / = 2n(n-\) • Итак, х12 может быть выражено, как функция от динами- динамической переменной s и числа электронов я. Всякое другое у, может быть вычислено сходным путем и будет функцией только от s и от п, так как нет других симметричных функций всех динамических переменных в, которые могли бы войти в %. Поэтому имеется по одному набору численных значений X величины % и, следовательно, одному обособленному набору состояний для каждого собственного значения s' величины s. Собственные значения s равны 11 , 1 о Ряд обрывается на значении 0 или у. Мы видим, таким образом, что каждое из стационарных состояний многоэлектронной системы является собствен- собственным состоянием s величины полного спинового момента 1 v количества движения у > аг в единицах %. Это состояние
§ 58. ПРИМЕНЕНИЕ К ЭЛЕКТРОНАМ 295 соответствует определенному собственному значению s'. Для любого заданного s' будет 2s' + 1 возможных значений проекции вектора полного спина на некоторое направление, и они будут соответствовать 2s' + 1 независимым стацио- стационарным состояниям с одной и той же энергией. Если не пренебрегать силами, возникающими из-за спинового маг- магнитного момента, эти 2s' + 1 состояний, вообще говоря, расщепятся на 2s' + 1 состояний со слегка различными энергиями, и будут образовывать мультиплет с мульти- плетностью 2s' + 1. Переходы с изменением s',t. e. переходы от одной мультиплетности к другой, не могут происходить, если пренебрегать спиновыми силами; они происходят лишь с малой вероятностью, если спиновыми силами не пренебрегать. Мы можем определить уровни энергии многоэлектрон- многоэлектронной системы в первом приближении, применяя теорию предыдущего параграфа, в которой векторы | аг> относятся только к орбитальным переменным, и пользуясь формулой B3). Если рассматривать только кулоновские силы между электронами, то энергия взаимодействия V будет представ- представлять собой сумму слагаемых, каждое из которых относится только к двум электронам. Это приводит к равенству нулю всех матричных элементов Vp, за исключением тех, для ко- которых Рх есть тождественная перестановка или простая транспозиция двух электронов. Поэтому формула B3) сво- сводится к соотношению V^V.+ ^VrsP^s, C1) r< s где Vrs есть матричный элемент, относящийся к транспо- транспозиции электронов г и s. Так как величины Ра имеют те же свойства, что и величины Рх, то любая функция от Ра бу- будет иметь те же самые собственные значения, что и соответ- соответствующая функция от Рх, так что правая часть C1) будет иметь те же значения, что и илл, учитывая B9), Vx — 4 У,Угх{1+(аг, as)}. C2)
296 ГЛ. IX. СИСТЕМЫ, СОДЕРЖАЩИЕ ОДИНАКОВЫЕ ЧАСТИЦЫ Собственные значения C2) будут давать поправки к уровням энергии в первом приближении. Вид выражения C2) дает основание считать приемлемой модель, в которой предпола- предполагается взаимодействие между спинами различных электро- электронов с энергией —„ У™ (<*/•> °s)> гДе г и s — орбитальные со- состояния. Зта энергия взаимодействия гораздо больше, чем энергия взаимодействия спиновых магнитных моментов. Такие модели атома употреблялись еще до того, как было получено их квантовомеханическое обоснование. Возможен случай совпадения двух орбитальных состоя- состояний невозмущенной системы, другими словами, векторы \аг), содержащие орбитальные переменные, могут быть одинаковы для двух электронов. Допустим, что векторы 1а1) и |а2) одинаковы. Тогда следует брать только те собственные значения C1), которые согласуются с равенством Р%= 1, или такие собственные значения C2), которые согласуются с равенством РД = 1 или Р°2 = —1. Согласно формуле B8) это условие дает (av <r2) = —3, так что (а± + а2J = 0. Сле- Следовательно, сумма двух спинов ст, и <т3 равна нулю, что можно толковать как антипараллельность спинов ох и оа. Таким образом, можно сказать, что два электрона, находя- находящиеся в одном и том же орбитальном состоянии, имеют антипараллельные спины. Больше двух электронов в од- одном и том же орбитальном состоянии находиться не может,
ГЛАВА К ТЕОРИЯ ИЗЛУЧЕНИЯ § 59. Ансамбль бозонов Рассмотрим динамическую систему, состоящую из и' оди- одинаковых частиц. Введем представление для одной частицы в виде дискретных базисных векторов |аA)), |аB)), |аC>),... Тогда, как было разъяснено в § 54, мы получим симметрич- симметричное представление для ансамбля из и' частиц, если возьмем в качестве базисного вектора произведение ?> | а\) | с?>... | at) = | а?а&... с&>, A) в котором каждой частице соответствует один множитель. Нижние значки 1, 2, 3, ..., и' у величин а нумеруют ча- частицы, а индексы а, Ь, с, ..., g соответствуют верхним значкам A), B), C), в базисных векторах для одной частицы. Если частицы являются бозонами, так что имеются только симметричные состояния, то нужно иметь дело только с сим- симметричными векторами, которые могут быть построены из выражений вида A). Состояния, соответствующие этим сим- симметричным векторам, образуют полную систему состояний для собрания бозонов. Мы можем построить теорию такого ансамбля бозонов следующим образом. Введем линейный оператор S, определив его выражением S = uT^P, B) где сумма берется по всем и'\ перестановкам и' частиц. Действие S на любой вектор системы дает симметричный вектор. Поэтому мы можем назвать S симметризирующим оператором. Согласно (8) § 55 он является вещественным, Действуя им на вектор A), получим ^ . с&> = S 1 aaaV... ag>, C)
298 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ причем номера частиц в правой части опущены, так как они становятся несущественными. Вектор C) соответствует состоянию ансамбля из и' бозонов с определенным распреде- распределением бозонов по различным бозонным состояниям, причем какое-либо определенное состояние какому-либо определен- определенному бозону не приписывается. Распределение бозонов задано, если установлено, сколько бозонов имеется в каждом бозонном состоянии. Пусть в таком распределении п\, п'ч, п'з, ... будут числа бозонов в состояниях осA), аB), а{3\ ... соответственно. Числа п' определяются алгебраически с помощью уравнения аа + а» + ас + ... + аЛ = п[а^ -f n'pS^ + я^C) +... D) Сумма величин п , очевидно, равна и'. Число величин п равно числу базисных векторов | а{г) ), которое в большин- большинстве приложений теории много больше чем и', так что большая часть чисел п будет равна нулю. Если величины аа, аь, а,с, ..., ag все различны, т. е. если числа п' все равны О или 1, то вектор C) нормирован, так как в этом случае члены в левой части C) взаимно ортогональны, и каждый вносит вклад и'! в квадрат длины вектора. Однако если аа, аь, с° ..., ag не все различны, то в левой части C) будут равны друг другу члены, возникающие от тех перестановок Р, которые только обменивают бозоны в одинаковых состоя- состояниях. Число равных членов будет п[\ п'ч\ п'з\ ..., так что квад- квадрат длины вектора C) будет (с^а6^... а.е | S21 а"а6ас... а^> = п[\ п\\ п\\... E) Для рассмотрения общего состояния ансамбля бэзонов можно ввести числа пъ п.г, п3, ... бозонов в состояниях аA), аB), аC) ... соответственно и считать эти числа динамиче- динамическими переменными или наблюдаемыми.Они имеют собствен- собственные значения 0, 1, 2, ..., и'. Вектор C) является общим собственным вектором всех п, причем он соответствует соб- собственным значениям п\, п.2, Щ, ... Различные векторы C) образуют полную систему векторов для динамической си- системы из и' бозонов, так что все п коммутируют (см. тео- теорему, обратную теореме § 13). Далее, имеется только один независимый вектор C), принадлежащий данному набору собственных значений п\, п%, п'з, ... Следовательно, величины п образуют полный набор коммутирующих наблюдаемых. Если пронормировать векторы C) и обозначить полученные
§ 59. АНСАМБЛЬ БОЗОНОВ 299 векторы посредством собственных значений п, которым они соответствуют, т. е. если положить _^ (п[\ n'i\ riil...) 2 S | ааа"ас... а.?) = | п[п\п.г...), F) то получим систему векторов | rixritri^ ...), где числа п при- принимают все неотрицательные целые значения до и , npi чем эти векторы образуют систему базисных векторов предста- представления, в котором все п диагональны. Величины п могут быть выражены как функции наблю- наблюдаемых аъ <х2, а3, ..., аа>, определяющих базисные векторы индивидуальных бозонов, с помощью уравнений или уравнений 2 И)• (8) справедливых для любой функции /. Допустим теперь, что число бозонов в системе не фикси- фиксировано, а может меняться. Это число является тогда дина- динамической переменной или наблюдаемой и, собственные зна- значения которой равны 0, 1, 2, ..., и вектор C) есть собствен- собственный вектор и, соответствующий собственному значению и'. Для того чтобы получить полную систему векторов нашей динамической системы, мы должны взять все симметричные векторы C) для всех значений и'. Мы можем расположить их в таком порядке: |>, |а°>, S\aaab), S\aaahac), ... (9) Здесь первым выписан вектор без значков, соответствующий состоянию без бозонов, далее идут векторы, соответствую- соответствующие состояниям с одним бозоном, с двумя бозонами и т. д. Общий вид состояния соответствует вектору, являющемуся суммой различных векторов (9). Векторы (9) все ортого- ортогональны друг к другу; в самом деле, два вектора, относящиеся к одному и тому же числу бозонов, ортогональны, как объяснено выше, а два вектора, относящиеся к разным чис- числам бозонов, ортогональны потому, что они являются соб- собственными векторами и, относящимися к разным собствен- собственным значениям. Нормируя все векторы (9), мы получаем систему векторов, аналогичных F), но без ограничений
300 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ для п' (т. е. каждое п' принимает все отрицательные цело- целочисленные значения) и эти векторы являются базисными векторами представления, в котором величины п диагональ- ны для динамической системы, состоящей из переменного числа бозонов. Если между бозонами нет взаимодействия и если базис- базисные векторы |aUj), |аB)), ... соответствуют стационарным состояниям бозона, то векторы (9) будут соответствовать стационарным состояниям ансамбля бозонов. Число бозонов и теперь постоянно во времени, но не должно обязательно быть фиксированным числом, т. е. в общем случае состояние является суперпозицией состояний с различными значе- значениями и. Если энергия одного бозона равна Н (а), то энер- энергия собрания бозонов будет равна 2Я(а,) = 2«в№, A0) г а как вытекает из (8), причем Н" написано для краткости вместо величины Н (ап). Это равенство выражает оператор Гамильтона для ансамбля бозонов как функцию от динами- динамических переменных п. § 60. Связь между бозонами и осцилляторами В § 34 мы изучали гармонический осциллятор, динами- динамическую систему с одной степенью свободы, описываемую каноническими переменными q и р и такую, что ее опера- оператор Гамильтона представляет собой сумму квадратов q и р с численными коэффициентами. Мы определим математи- математически осциллятор общего характера как систему с одной степенью свободы, описываемую каноническими перемен- переменными q и р, если ее оператор Гамильтона есть степенной ряд по q и р, и остается таковым, когда система возмущена каким-либо образом *). Будем изучать динамическую систе- систему, состоящую из нескольких таких осцилляторов. Можно вместо q и р использовать для описания осцилляторов ком- комплексную динамическую переменную т), аналогичную вели- величине г) в § 34, вместе с сопряженной величиной fj, причем *) Заметим, во избежание недоразумений, что для осциллятора общего характера, о котором говорит автор, вектор A4) не является собственным вектором оператора энергии, в отличие от гармонического осциллятора, (Прим, перев.)
§ 60. СВЯЗЬ МЕЖДУ БОЗОНАМИ И ОСЦИЛЛЯТОРАМИ 301 г\ и Г] удовлетворяют перестановочным соотношениям G) §34. Припишем различным осцилляторам номера 1, 2, 3, ... Вся система осцилляторов будет описываться динами- динамическими переменными г\и т]2, %, ..., fj,, fj.2, % ....удовлет- ....удовлетворяющими перестановочным соотношениям ] = 0, i (И) Положим Ч]а!Ча = Па, A2) так что будет Ло'По = Па+1. A3) Величины п являются наблюдаемыми, коммутирующими друг с другом, и рассмотрение § 34 показывает, что каждая из них имеет в качестве собственных значений неотрица- неотрицательные целые числа. Для осциллятора а имеется в фоков- ском представлении стандартный кет, скажем 10„), который является нормированным собственным вектором па, принадлежащим собственному значению, равному нулю. Перемножая все эти стандартные векторы, мы получаем стандартный кет системы осцилляторов в фоковском представлении |0х> |0я> |0в>... A4) Он является общим собственным вектором всех п, соответ- соответствующих нулевым собственным значениям. Мы обозначим его просто через ] 0). Из A3) §44 следует тЫ0> = 0 A5) для любого а. Рассмотрение § 34 также показывает, что если п\, гь2, tiz, ... — любые неотрицательные целые числа, то является общим собственным кетом всех п, соответству- соответствующих собственным значениям п\, п'2, п'з, ... Различные век- векторы A6), получаемые при различных п', образуют полную систему векторов, которые все ортогональны друг к другу, и квадрат длины одного из них, согласно A6) § 34, равен п[\п:2\п'3\...
302 гл. х. теория излучения Если иметь в виду результат E), то отсюда видно, что кет- векторы A6) имеют в точности те же самые свойства, что и кеты (9), так что мы можем, не приходя к противоре- противоречию, приравнять каждый вектор A6) кету (9), относя- относящемуся к тем же самым п'. Для этого нужно положить S | а«а6ас... а»*> = ад^... ilg | 0>. A7) Стандартный кет 10 > становится равным первому из векторов (9), соответствующему отсутствию бозонов. Уравнение A7) означает, что состояния ансамбля бозо- бозонов отождествляются с состояниями набора осцилляторов. Это значит, что динамическая система, состоящая из ан- ансамбля одинаковых бозонов, эквивалентна динамической сис- системе, состоящей из ансамбля осцилляторов — эти две системы представляют собой одну и ту же систему, рас- рассматриваемую с двух разных точек зрения. С каждым неза- независимым бозонным состоянием связан один осциллятор. Мы имеем один из наиболее фундаментальных результатов квантовой механики, позволяющий объединить волновую и корпускулярную теории света. Рассмотрение в предыдущем параграфе было основано на дискретном ряде базисных кетов |аа) для бозона. Мы могли бы перейти к другому дискретному ряду базисных векторов, скажем, | {5Л ) и построить аналогичную теорию, основываясь уже на них. Базисные векторы собрания бозо- бозонов будут вместо (9) Первый кет в A8), относящийся к состоянию без бозо- бозонов, тот же самый, что и в (9). Векторы A8), относящиеся к состоянию с одним бозоном, линейно выражаются через те из векторов (9), которые относятся к состоянию с одним бозоном, именно |Рл> = 2>а><а'ЧРл>, A9) а и вообще векторы A8), соответствующие наличию и' бозонов, линейно выражаются через кеты (9), соответствующие наличию того же числа и' бозонов. С новыми базисными состояними | рл> для бозонов будет связан новый ряд осцилляторных переменных, и аналогично A7) мы будем иметь .|O>. B0)
§ 60. СВЯЗЬ МЕЖДУ БОЗОНАМИ И ОСЦИЛЛЯТОР \ МП 303 Таким образом, вектор ц/цв ¦¦¦ I 0) с числом множителей v\a, fJB. •••> равным и', должен быть линейной функцией от векторов цач\ь ... | 0> с тем же числом множителей ч\а, г\ь ... Отсюда следует, что каждый линейный оператор лА должен быть линейной функцией от -х\а. Уравнение A9) дает и, следовательно, Лл = Цт]в<«1Рл). B1) а Итак, операторы г| преобразуются по тому же самому закону, что и базисные кеты бозона. Преобразованные операторы V] вместе с сопряженными операторами удовлетворяют тем же перестановочным соотношениям A1), что и исходные. Преобразованные к\ равноправны с исходными и, следова- следовательно, если мы рассматриваем нашу динамическую систему как набор осцилляторов, то различные степени свободы не имеют инвариантного значения. Величины Г) преобразуются по тому же самому закону, что и базисные бра-векторы и, следовательно, по тому же закону, что и числа (аа | х), образующие представление со- состояния х. Имея в виду эту аналогию, часто говорят, что х\а получается в результате вторичного квантования, приме- примененного к (аа | х); под этим подразумевается, что, построив квантовую теорию одной частицы и введя числа (аа \ х), представляющие состояние частицы, можно эти числа пре- превратить в линейные операторы, которые вместе со своими сопряженными удовлетворяют правильным перестановоч- перестановочным соотношениям типа A1), что дает подходящую матема- математическую основу для рассмотрения системы частиц, если они являются бозонами. Аналогичная процедура существует для фермионов и будет изложена в § 65. Так как ансамбль бозонов представляет собой то же самое, что набор осцилляторов, то можно выразить любую симметричную функцию бозонов через осцилляторные пере- переменные т) и т). Примером этого является уравнение A0), где па следует заменить на г|от)а. Посмотрим, как обстоит дело в общем случае. Возьмем сперва случай, когда функция от бозонных переменных имеет вид иТ = ^иг, B2)
304 гл.х. теория излучения где каждая Ur есть функция только динамической перемен- переменной r-го бозона, так что она имеет представитель (aar \ Ur |a*>, отнесенный к базисному вектору | ааг) r-го бозона. Для того чтобы величина Ur была симметричной, этот представитель должен быть одним и тем же для всех г, так что он может зависеть только от обоих собственных значений, обозначен- обозначенных через а и Ь. Мы можем поэтому записать его в виде B3) где для краткости написано просто а и b вместо аа и аь Мы имеем Ur \ ...а?.. .> <а! B4) Суммируя по всем г и действуя на обе части равенства сим- метризующим оператором S, получаем SUT ...) = S | afa?.. .a?...) <a | U \ xr). B5) Так как f/r симметрично, мы можем заменить SUr на UTS, и мы можем поэтому.подставить для симметричных векторов в B5) их значения A7). Таким путем получим ! UI ¦ ¦ ¦ 10) = ab ^Л, • • • 10> 66,г <а B6) где символ т)^1 означает, что нужно исключить множитель цх . Из уравнения A5) и из перестановочных соотношений A1) имеем ?И<,П*, • • • 10> = 2 т?>Л*. • • • 10) ЬЬХг. B7) Заметим, что переменная т\ь аналогична оператору част- частной производной d/di\b, так что формула B6) принимает вид ...10> = 0 B8) ab Векторы r\xlr\x2... |0> образуют полную систему, и, следо- следовательно, мы можем вывести из B8) операторное уравнение иг = ?лв<а|</|Ь>Ъ. B9) ab
§ 60. СВЯЗЬ МЕЖДУ БОЗОНАМИ И ОСЦИЛЛЯТОРАМИ 303 Оно выражает Ut через переменные т] и fj и матричные эле- элементы (а\ U | Ь). Теперь возьмем симметричную функцию бозонных пере- переменных, состоящую из суммы членов, каждый из которых относится к двум бозонам, VT= 2 У„. C0) г, sjtr Нет необходимости предполагать, что Vrs — Vsr. Соответ- Соответственно в формуле B3) величина Vrs имеет матричные эле- элементы <с#4 | Vrs I °#*1> = (ab | V | cd). C1) Аналогично предыдущему мы получаем равенство, соответ- соответствующее B5), = Z IiS\ax11ali...tf...al..)(ab\V\xrxs) C2) и равенство, соответствующее B6), |cd>. C3) aucd r, s фг Обобщая B7), можно вывести соотношение i*,..-|0>= 2 Т1*ХЛ*1Л*,...|О>6„6^ C4) так что равенство C3) принимает вид л:1Лд:г ...\Q)(db\V\ abed Это дает операторное уравнение VT= Л, T\ar\b(ab\V №)%&!• C5) Развивая этот метод, можно получить выражение через т] и fj для произвольной симметричной функции от бозонных переменных. Предыдущая теория может быть легко обобщена на слу- случай, когда ансамбль бозонов взаимодействует с другой дина- динамической системой,, которую мы для определенности назовем
306 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ атомом. Нужно ввести базисные векторы, скажем | ?'), для атома, взятого в отдельности. После этого можно получить базисные векторы всей системы из атома и бозонов, умножая вектор | ?') на каждый из векторов (9). Можно записать эти векторы в виде Ю, | ?'««>, S|?'a°au>, S|S'a°a»oc>, ... C6) Систему можно рассматривать как состоящую из атома, взаимодействующего с набором осцилляторов, так что ее можно описывать атомными переменными и осцилляторными переменными r\a, fja. Используя опять стандартный вектор | 0) для набора осцилляторов, мы имеем уравнение 5 | ?'aoa*ae...) = ЧаЦЛ... | 0> | ?'>, C7) соответствующее A7) и выражающее базисные векторы C6) через осцилляторные переменные. Любая функция от атомных переменных и бозонных пе- переменных, симметричная по всем бозонам, может быть выра- выражена как функция от атомных переменных и от переменных т) и т). Рассмотрим сперва функцию Ur вида B2), где Ur есть функция только от атомных переменных и переменных r-го бозона, так что она имеет представитель (?'a° \ Ur | ?"a*). Чтобы функция UT могла быть симметричной по всем бозо- бозонам, этот представитель не должен зависеть от г, так что мы можем записать его в виде (?'art | U | ?"a*). Определим теперь (а \ U ] Ь) как такую функцию атомных переменных, представитель которой есть (t,'aa \ U | ?"ай), так что мы имеем U | Г«"> = (V | (а ) U \ Ь) \ Г'>, C8) что соответствует формуле B3). Можно перенести на рас- рассматриваемый случай уравнения B4)—B8), если умножить обе стороны всех этих уравнений на | ?' | справа. Тогда по- получится, что формула B9) остается в силе. Аналогично можно рассмотреть симметричную функцию VT вида C0), где Vrs — функция только атомных переменных и перемен- переменных r-го и s-ro бозонов. Определяя (ab \ V\ cd) как такую функцию атомных переменных, представитель которой есть найдем, что по-прежнему справедлива формула C5).
§ 61. ИСПУСКАНИЕ И ПОГЛОЩЕНИЕ БОЗОНОВ 307 § 61. Испускание и поглощение бозонов Предположим, что осцилляторы, рассмотренные в пре- предыдущем параграфе, являются гармоническими, и что между ними нет взаимодействия. Энергия а-го осциллятора, со- согласно E) § 34, равна Мы пренебрежем постоянным членом wh&a, представляю- представляющим собой энергию осциллятора в наинизшем состоянии — так называемую «нулевую энергию». Как объяснено в на- начале § 30, это пренебрежение не оказывает никакого влияния на динамические свойства и сводится лишь к несколько иному определению На. Полная энергия осцилляторов тогда равна, если учесть соотношение A2), Нт = ^На = ^Поуау\аца = ^1Гтапа. C9) а а а Это выражение имеет тот же вид, что и A0), только теперь вместо На стоит На>а. Следовательно, набор гармонических осцилляторов эквивалентен ансамблю невзаимодействую- невзаимодействующих бозонов в стационарных состояниях. Если один из осцилляторов находится в квантовом состоянии п', то имеется п' бозонов в соответствующем бозонном состоянии. В общем случае оператор Гамильтона для набора осцил- осцилляторов будет степенным рядом по переменным ц, г\а- М будем иметь ЦаЦь + УаЬЦаЦь + \Га!)ЩаГЦ))+ ••-, D0) ab где НР, lJ_a, Uab, Vab являются числами, НР вещественно и U'аЬ — Uьа- Если осцилляторы взаимодействуют с атомами (см. конец предыдущего параграфа), то полный оператор Гамильтона будет иметь вид D0), но НР, Ua, Уаь> Vab будут функциями от атомных переменных, и, в частности, НР будет оператором Гамильтона для самого атома. Рассмотре- Рассмотрение этой динамической системы в общем виде является до- довольно сложным. В практических применениях обычно
308 гл. х. теория излучения предполагается, что члены tfp + St/oaVb D1) а велики по сравнению с другими и описывают невозмущен- невозмущенную систему. Остальные члены рассматриваются, согласно теории § 44, как возмущение, вызывающее переходы в не- возмущенной системе. Если, далее, величина Uaa не зависит от атомных переменных, то невозмущенная система с опе- оператором Гамильтона D1) состоит просто из атома с опера- оператором Гамильтона НР и из ансамбля невзаимодействующих бозонов в стационарных состояниях, которым соответствует оператор Гамильтона C9). Рассмотрим, какие переходы вызываются различными членами, представляющими в формуле D0) возмущение. Выберем стационарное состояние невозмущенной системы, при котором атом находится в стационарном состоянии ?', и бозоны — в стационарных бозонных состояниях а,Ь,с,.... Этому стационарному состоянию невозмущенной системы соответствует вектор 1\аг\ь1\с..\0)Ю> D2) аналогичный C7). Если член Uxr\x из D0) умножить на этот вектор, то в результате получится линейная комбинация век- векторов вида -.|0>jr>, D3) где Z," означает некоторое стационарное состояние атома. Вектору D3) соответствует состояние с числом бозонов на единицу большим, чем в векторе D2), причем добавочный бозон находится в состоянии х. Следовательно, член возму- возмущения Uxt\x вызывает переходы, в которых испускается один бозон в состоянии х, а атом совершает какой-то ска- скачок. Если член Пхцх из D0) умножить на D2), то в резуль- результате получится нуль, за исключением случая, когда D2) содержит множитель цх; в этом же случае получается линей- линейная комбинация векторов вида которые соответствуют уменьшению на единицу числа бозо- бозонов в состоянии х. Таким образом, член возмущения Uxr\x вызывает переходы, в которых поглощается один бозон из состояния х и атом совершает какой-то скачок. Аналогична
§ 61. ИСПУСКАНИЕ И ПОГЛОЩЕНИЕ БОЗОНОВ 309 находим, что член возмущения ихуг\хцу (х Ф у) вызывает процессы, в которых один бозон поглощается из состояния у и один бозон испускается в состояние х, или, что то же самое физически, один бозон переходит из состояния у в состояние х. Процессы такого рода могут вызываться членами типа UT (см. формулы B2) и B9)) в энергии возму- возмущения, если диагональные матричные элементы вида (а | U ) а) равны нулю. Члены возмущения вида Vxyr\xr[y, УхуЦх'Цу вызывают процессы, в которых испускаются или поглощаются два бозона и т. д. для более сложных членов. При любом из этих процессов поглощения или испускания атом может совершить скачок из одного состояния в другое. Определим, как зависит вероятность каждого из этих процессов перехода от числа бозонов, имеющихся перво- первоначально в различных бозонных состояниях. Согласно §§ 44 и 46 вероятность перехода всегда пропорциональна квад- квадрату модуля матричного элемента энергии возмущения, отно- относящегося к рассматриваемым двум состояниям. Таким обра- образом, вероятность испускания бозона в состоянии х при пере- переходе атома из состояния ?' в состояние ?" пропорциональна величине \... (п'х + 1)... | Uxr)x \ п\п\... п'х...) | ?'> |», D4) где п' — числа бозонов, первоначально находившихся в раз- различных состояниях. Но из F) и A7), принимая во внимание D), имеем | п[п'А • • ¦> = {п[\п№ .-..Г ^»fri»^I • • • 10), D5) так что цх \п{п:2...п'х... > = («;+ I)"» \п{п1..(п'х+1)...). D6) Следовательно, выражение D4) равно (n'x+l)\{Z'\Ux\O?, D7) откуда видно, что вероятность перехода, при котором бозон испускается в состояние х, пропорциональна перво- первоначальному числу бозонов в состоянии х, увеличенному на единицу. Вероятность поглощения бозона из состояния х при пе- переходе атома из состояния ?' в состояние С" пропорциональна величине \ts"\(nln'i...(nx-l)...lUxy)x\n'1n'i...nx...)\O\\ D8)
310 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ где по-прежнему п' — числа бозонов, первоначально нахо- находившихся в различных состояниях. Из D5) имеем т], ] n[nl ..«;...) = п'хт | п\п\...(«;- 1) ...>, D9) так что выражение D8) равно n'x\(U\Ux\t,')f. E0) Следовательно, вероятность перехода, при котором бозон поглощается из состояния х, пропорциональна числу бозонов, имевшихся первоначально в состоянии х. Аналогичные методы могут быть применены к более сложным процессам; они показывают, что вероятность про- процессов, в которых бозон переходит из состояния у в со- состояние х (х =^ у), пропорциональна п'у (п'х + 1). Вообще, вероятность процесса, в котором бозоны поглощаются из состояний х, у, ... и испускаются в состояния а, Ь, ..., пропорциональна величине п'хп'у...(п'а+\)(п'ь+\)..., E1) где величины п' означают каждый раз числа бозонов, имев- имевшихся первоначально. Эти результаты справедливы как для прямых переходов-, так и для переходов, идущих через одно или более промежуточных состояний, согласно толкованию, данному в § 44. § 62. Применение к фотонам Поскольку фотоны являются бозонами, то к ним приме- применима вышеизложенная теория. Фотон находится в стацио- стационарном состоянии, когда у него есть определенный импульс. Он имеет тогда два независимых состояния поляризации, в качестве которых можно 'взять два взаимно перпендику- перпендикулярных состояния линейной поляризации. Динамическими переменными, необходимыми для описания стационарных состояний, будут вектор импульса р и поляризационная пе- переменная 1, представляющая собой единичный вектор, пер- перпендикулярный р. Переменные р и 1 играют роль перемен- переменных а, введенных ранее. Собственные значения р состоят из всех чисел от — оо до оо для каждой из трех декарто- декартовых компонент р, тогда как для каждого собственного зна- значения р' вектора р имеется всегда два собственных значе- значения 1, именно, два произвольно выбранных вектора, перпен-
§ 62. ПРИМЕНЕНИЕ К ФОТОНАМ 311 дикулярных к р' и друг к другу. Поскольку собственные значения р образуют сплошной спектр, имеется непрерывная область стационарных состояний, дающих базисные векторы |р'Г), которые относятся к непрерывной области. Между тем, вышеизложенная теория была построена в, предположе- предположении дискретных базисных векторов \а') для бозонов. Существует два математических приема, которыми можно воспользоваться для преодоления этого несоответствия. Один из них состоит в замене непрерывного трехмерного распределения собственных значений р большим числом дискретных точек, лежащих очень близко друг к другу и образующих «порошок», рассыпанный по всему трехмерному пространству импульсов. Пусть sp- будет плотностью по- порошка (число точек в единице объема) в окрестности неко- некоторой точки р'. Величина sp- должна быть большой и поло- положительной, но в остальном может быть произвольной функ- функцией от р'. Интеграл по пространству импульсов можно заменить суммой по точкам в соответствии с формулой s?. E2) Эта формула служит основанием для перехода от непрерыв- непрерывных значений р' к дискретным и наоборот. Любая задача мо- может быть сперва рассмотрена для дискретных значений р', к которым можно применить теорию §§59—61, а затем результат можно преобразовать к случаю непрерывных значений р. Произвольная плотность sp- не должна входить в окончательный результат. Другой математический прием состоит в том, чтобы видо- видоизменить уравнения теории §§59—61 и сделать их приме- применимыми к случаю сплошного спектра базисных векторов | а'), заменяя суммы интегралами и символы 6 в перестано- перестановочных соотношениях A1) б-функциями, поскольку это касается переменных со сплошным спектром собственных значений. Каждый из этих приемов имеет свои достоинства и недостатки. Первый более удобен для физического рас- рассмотрения, второй — для математической разработки. Здесь будут развиты оба эти метода и мы будем пользоваться тем из них, какой окажется удобнее в каждом отдельном случае. Оператор Гамильтона, описывающий совокупность фото- фотонов, взаимодействующих с атомами, будет иметь вид, соот- соответствующий общему выражению D0); коэффициенты Нр, Ua, Vab, Vab будут содержать атомные переменные. Этот
312 гл. х. теория излучения оператор Гамильтона может быть записан в виде E3) где НР — энергия атома в отдельности, HR — энергия сово- совокупности фотонов в отдельности Я* = 1>р'г/пу E4) р'1« (причем vP' — частота фотона с импульсом р'), и HQ — энергия взаимодействия, которая может быть определена по аналогии с классической теорией, как будет показано в следующем параграфе. К системе в целом можно применить метод возмущений в том виде, как он излагался в предыду- предыдущем параграфе; НР и HR представляют собой энергию D1) невозмущенной системы, a Hq есть энергия возмущения, вызывающая переходы, в которых испускаются и погло- поглощаются фотоны, а атом совершает скачок из одного стацио- стационарного состояния в другое. Мы видели в предыдущем параграфе, что вероятность акта поглощения пропорциональна числу бозонов, находив- находившихся первоначально в состоянии, из которого поглощается бозон. Отсюда мы можем заключить, что вероятность погло- поглощения фотона из пучка излучения, падающего на атом, про- пропорциональна интенсивности пучка. Мы также видели, что вероятность процесса испускания пропорциональна перво- первоначальному числу бозонов в соответствующем состоянии, увеличенному на единицу. Для того чтобы истолковать этот результат, нужно тщательно исследовать соотношения, свя- связанные с заменой непрерывной области фотонных состояний дискретной совокупностью. Пренебрежем на время поляризационной переменной 1. Пусть |p'D) — нормированный вектор, соответствующий дискретному фотонному состоянию р'. Тогда из соотношения B2) § 16 следует что в силу E2) приводится к виду S|Sp,dy = l. E5) Для краткости мы пишем d3p' вместо dp'x dp'y dp'z. Но если | р') есть базисный вектор, соответствующий состоянию из
§ 62. ПРИМЕНЕНИЕ К ФОТОНАМ 313 сплошного спектра р', то на основании формулы B4) § 16 мы имеем откуда следует при сравнении с E5) \p') = \p'D)s]f. E6) Связь [ р') и [ p'D ) аналогична сзязи между базисными век* торами при изменении весовой функции представления, кай видно из соотношения C8) § 16. При Пр- фотонах в каждом дискретном фотонном со- состоянии гиббсовская плотность р ансамбля фотонов, согласно F8) § 33, равна, с учетом E6), р = 21 Р'Я> n'p,(p'D\ = \\p'D) n'p- (p'D j v d*p' = = $|Р>Р'<Р'1<*У. E7) Согласно формуле G3) § 33 число фотонов в единице объема в окрестности некоторой точки х' будет тогда <х' | р | х'), Учитывая E7) и подставляя значение E4) § 23 для функции преобразования <х' | р'), получим <х' |pIx'> = S<x'|p'>«;- <P' I x'> dy = \h-*n'r dy. E8) Уравнение E8) выражает число фотонов в единице объема через интеграл по импульсному пространству, так что подын- подынтегральное выражение может быть истолковано как число фотонов на единичный объем фазового пространства. Мы получаем, таким образом, результат, что число фотонов на единичный объем в фазовом пространстве равно h~3, умноженному на число фотонов в одном дискретном состоя- состоянии, другими словами, ячейка объемом КЛ в фазовом простран- пространстве эквивалентна одному дискретному состоянию. Этот результат является общим и справедлив для любого вида частиц. Если не пренебрегать поляризационной переменной, то результат справедлив для каждого из двух независимых состояний поляризации. Импульс фотона частоты v равен по величине hv/c, так что элемент объема импульсного пространства есть dpx dpy dpz — h3c3v2 dv da, где dco — элемент телесного угла в направлении вектора р.
314 гл.х.теория излучения Следовательно, распределение фотонов с числом п'9 на одно дискретное состояние, эквивалентное распределению с чис- числом /Г3 tip dsp d?x фотонов на элементе объем'а d3x и на эле- элемент объема импульсного пространства dsp, есть то же самое, что распределение по n'pc'3\id'vdu>d3x фотонов на эле- элемент объема d3x и интервал частот dv при направлении дви- движения фотонов внутри d(o. Это соответствует плотности энергии n'phc~3v3 на единицу телесного угла и на единичный интервал частоты, или, иначе говоря, на единичный интер- интервал частоты должна приходиться интенсивность (т. е. энер- энергия, проходящая за единицу времени через единичную площадку), равная /v = n;hv3/c2. E9) Тот вывод, что вероятность испускания фотона пропорцио- пропорциональна /ipi + 1, где «pi —число фотонов, находившихся первоначально в данном дискретном состоянии, может быть теперь истолкован как пропорциональность вероятности ве- величине /vi + /rv3/c2, где /vi — интенсивность падающего излучения на единичный интервал частоты в окрестности частоты испускаемого фотона, если излучение имеет ту же поляризацию 1, что-и испускаемый фотон. Следовательно, при отсутствии падающего излучения все же существует испускание в определенных размерах; испускание увеличи- увеличивается или стимулируется падающим излучением, имеющим то же направление и ту же самую частоту и поляризацию, что и испускаемое излучение. Настоящая теория излучения дополняет несовершенную теорию § 45, поскольку она дает как вынужденное (стимулированное), так и самопроизволь- самопроизвольное (спонтанное) излучение. Отношение, которое дает тео- рия для этих двух типов испускания, именно, /vi : —j- согласуется с тем, какое дается эйнштейновской теорией статистического равновесия, упомянутой в § 45. Вероят- Вероятность рассеяния фотона из состояния р'Г в состояние р" пропорциональна произведению nP'c (reP"i" + 1), где п — числа фотонов, имевшихся первоначально в со- соответствующих дискретных состояниях. Можно истолковать этот результат как пропорциональность вероятности ве- величине (^) F0)
§ 63. ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ ФОТОНА С АТОМОМ 315 Аналогично для более общего излучательного процесса, в котором испускается и поглощается несколько фотонов, вероятность пропорциональна множителю Iv\ для каждого поглощенного фотона и множителю /VH—j- для каждого испущенного фотона. Таким образом, процессы стимули- стимулируются падающим излучением, имеющим то же самое напра- направление и ту же частоту и поляризацию, что и испускаемый фотон. § 63. Энергия взаимодействия между фотоном и атомом Определим теперь энергию взаимодействия между ато- атомом и ансамблем фотонов, т. е. величину Hq из уравнения E3), на основании аналогии с классическим выражением для энергии взаимодействия между атомом и полем излучения. Для простоты мы предположим, что атом состоит из одного электрона, движущегося в электростатическом поле. Поле излучения может быть описано скалярным и векторным потенциалом. Эти потенциалы до некоторой степени про- произвольны, и могут быть выбраны так, чтобы скалярный потенциал обратился в нуль. Тогда поле будет описываться одним лишь векторным потенциалом Ах, Ау, Az или А. Как было объяснено в начале § 41, изменение, называемое полем в операторе Гамильтона, имеет вид Такова классическая энергия взаимодействия. Входящая сюда величина А должна быть, строго говоря, значением векторного потенциала в некоторой фиксированной точке атома, например в той точке, где находится ядро. Это будет достаточно хорошим приближением, если мы имеем дело с излучением, длина волны которого велика по сравнению с размерами атома. Рассмотрим сначала поле излучения классически, и, кроме того, будем пренебрегать его взаимодействием с ато- атомом. Вектор-потенциал А удовлетворяет, согласно максвел- ловской теории, уравнениям = 0. divA = 0, F2)
816 гл. х. теория излучения где символ | | обозначает для краткости - 2 ,-а— ч— — д2 52 г-, •—•o-j — o-2- Первое из этих уравнении показывает, что представление А в виде интеграла Фурье будет иметь вид А = \ {Аье-1(кх)+2я;v + Аке'(кх) ~2:dV} ^ F3) Каждая компонента Фурье представляет собой волну, рас- распространяющуюся со скоростью света и описываемую векто- вектором к; направление этого вектора дает направление распро- распространения волны, а абсолютная величина его | k | связана g частотой соотношением 2nvk = c|k|. F4) Вектор к в точности равен деленному на % импульсу того фотона, который по квантовой теории сопоставляется волне. Каждой величине к соответствует амплитуда Ак, являю- являющаяся, вообще говоря, комплексным вектором. Интеграл в F3) берется по всему трехмерному пространству с коорди- координатами kx, ky, kz. Из второго уравнения F2) имеем (к, Ак) = 0. F5) Отсюда видно, что для каждого к вектор Ак перпендикуля- перпендикулярен к к, что означает поперечность волн. Вектор Ак опре- определяется своими двумя проекциями на два направления, перпендикулярные друг к другу и к вектору к, причем эти две проекции соответствуют двум независимым состояниям линейной поляризации. Полная энергия излучения дается объемным интегралом HR = (b*)-*\(& + №)d*x, F6) взятым по всему пространству. Стоящие под интегралом электрическое поле излучения Ш и магнитное К определя- определяются выражениями Ш = -ТЖ* К = го1А- F7) Пользуясь обычными формулами векторного анализа и учитывая второе уравнение F2), имеем div[AxK] = (K, rot A)-(A, rot5C) = *=№-(А, rot rot A) = К2 + (А, у2А).
§ 63. ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ ФОТОНА С АТОМОМ 317 Если не выписывать члена, который может быть преобра- преобразован в интеграл по бесконечно удаленной поверхности, то выражение F6) приводится к виду HR=(8n)-i С {1 (^, ^) - (A, V2A)} d*x. F8) Подставляя сюда значение А из F3), мы можем выразить энергию излучения через амплитуды Фурье Ак. Энергия излучения постоянна (поскольку мы сейчас пренебрегаем взаимодействием излучения с атомом), так что мы можем проводить расчет, полагая t = 0. Это означает, что мы полагаем А = \!\Ак-\-А—к)е х> d k, F9) V2A = — \ к2 (Ак + А_к) е~1 <к*> d3k, ~ = Ic j f к | (Ак - А_ь) е-' <к*> d*k. G0) Подставляя эти выражения в C8), получим с помощью D9) § 23 HR = (8Я) \ \ \ {к'2 ([Ак + А_к], [Ак« + А_к.]) - — | к 11к' | ([Ак - А_к ], [Ак' - А_к'])} е-1 <кх»е-« <к'х> d Здесь б (к + к') есть произведение трех множителей, каж« дый из которых соответствует одной компоненте к. Отсюда получается HR = л21 к2 {([Ак + А_к], [А_к + Ак]) - - ([Ак - А_к], [А_к - Ак])} d'k - ) + (А_к, A_k)}d3?- к2(Ак, Ak)d3k. G1) Мы можем заменить непрерывное распределение значений к «порошком» дискретных значений к аналогично тому, как мы поступали с р в предыдущем параграфе. Интеграл G1)
318 гл. х. теория излучения при этом переходит, согласно формуле E2), в сумму 2> к где Sk — плотность дискретных значений к. Мы можем также записать это в виде ^ G2) kl где Aki — проекция Ак на направление 1, перпендикуляр- перпендикулярное к к. Суммирование по 1 относится к двум направлениям 1, перпендикулярным друг к другу. Таким образом, каждому независимому стационарному состоянию фотона соответ- соответствует в G2) один член. Величины поля I и Й в некоторой точке х можно рас- рассматривать как динамические переменные. Величины = Aki<? k будут тогда динамическими переменными в момент времени /, так как они связаны с Ш и ЗС в различных точках про- пространства х в момент времени t уравнениями, не содержа- содержащими время (это вытекает из F3) и F7)). Величина Aki постоянна, так что Aku изменяется со временем по простому гармоническому закону. Следовательно, величина А^ ана- аналогична переменной r\t для гармонического осциллятора, определяемой уравнением C) § 34, причем со для осцилля- осциллятора соответствует величине 2л\'к. Мы можем считать каж- каждую величину Aki; пропорциональной величине r\t для некоторого гармонического осциллятора, и тогда поле излучения станет совокупностью осцилляторов. Перейдем теперь к квантовой теории и будем считать величины Aki/ и Аы/ динамическими переменными в гейзен- гейзенберговской картине. Выражение G2) для энергии может быть составлено без изменения, поскольку порядок, в кото- котором стоят сомножители Aki и Aki, обеспечивает отсутствие нулевой энергии. Величина А ы/ по-прежнему будет меняться со временем по закону ёы и по-прежнему может считаться пропорциональной величине r\t для гармонического осцил- осциллятора. Множитель пропорциональности может быть опре- определен путем приравнивания выражений G2) и C9) для энергии; при этом значок а в формуле C9) заменяется двумя переменными к и 1, а величина йсоа заменяется на hvk.
§ 63. ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ ФОТОНА С АТОМОМ 319 В результате получаем 4л2 ^ k2AkuAkuSk ' — ^hvkr\kuT\ku. kl kl Индекс t введен для того, чтобы показать, что мы имеем дело с гейзенберговскими динамическими переменными (это требуется при переходе от уравнений классической теории к уравнениям квантовой теории). Отсюда, используя F4) и пренебрегая несущественным произвольным фазовым мно- множителем, получим 1 _ 1 _L Ч % G3) Так вводятся гейзенберговские динамические переменные г)к^, которые описывают поле излучения как совокупность осцилляторов. Перестановочные соотношения между rjki/ и Щш известны и даются выражением A1), так что из уравне- уравнения G3) определяются перестановочные соотношения между Aki/ и Aku. Тем самым оказываются определенными переста- перестановочные соотношения между потенциалами А и перемен- переменными поля Ш и дЪ в различных точках х в момент времени t. (Заметим кстати, что поскольку заданы перестановочные соотношения между Aki и Aki, то тем самым заданы и пере- перестановочные соотношения для двух потенциалов или вели- величин поля в два различных момента времени.) Мы можем использовать соотношение G3) и тогда, когда принимается во внимание взаимодействие между полем излучения и атомом. Это означает предположение, что вза- взаимодействие не изменяет перестановочных соотношений между потенциалами и величинами поля в данный момент времени. Но вследствие взаимодействия переменные цш перестают меняться по простому гармоническому закону и осцилляторы перестают быть гармоническими. Следова- Следовательно, взаимодействие может изменить перестановочные соотношения между двумя потенциалами или величинами поля в два различных момента времени. Мы можем теперь перенести выражение для энергии взаимодействия F1) в квантовую теорию, при этом мы будем писать pt вместо р, чтобы указать, что это гейзенберговская динамическая переменная. Считая, что ядро атома находится в начале координат, положим в F3) х = 0 и подставим результат в F1). Если мы, кроме того, произведем переход
320 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ от непрерывных значений к к дискретным, то мы получим + kk' Итак, 2 ( ) sk tr 2 kk'U' где pi, есть проекция р,. на направление 1. С помощью G3) можно выразить HQt через i]kit и rjku и можно опустить индекс t (что означает переход к шредингеровским динами- динамическим переменным), так что окончательно получаем kl 2 vlr1/2v1?l/2(nk.+%)(rik'I'+i>.-)irSk-1/2s?'/2. G4) kk'll' Согласно принятой нами модели атома энергия взаимо- взаимодействия есть сумма функции, линейной относительно т} и Т\, и функции, квадратичной в этих переменных. Линейные члены приводят к процессам испускания и поглощение, а квадратичные члены — к процессам рассеяния и к таким процессам, когда одновременно поглощается или испускает- испускается два фотона. Порядок множителей г) и т) в квадратичных членах не определяется в нашем способе вывода, исходя- исходящем из классической теории, но этот порядок и не является существенным, поскольку изменение порядка приводит лишь к изменению Hq на постоянную величину. Матричный элемент энергии Hq, относящийся к испуска- испусканию фотона в дискретное состояние kl (или, в другом обо- обозначении, в дискретное состояние рГ), сопровождаемому
§ 63. ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ ФОТОНА С АТОМОМ 321 переходом атома из состояния а0 в состояние а', равен, с учетом su = sptls: <р W | HQ | a«> = -Jj^ <«' | p, | a») m/г Bn -,1/2 Входящая сюда величина pi, относящаяся к импульсу элек- электрона, разумеется, не имеет ничего общего с импульсом р, относящимся к фотону. Во избежание недоразумений мы заменим импульс электрона р на тк, поскольку эти две величины представляют собой одно и то же в невозмущен- невозмущенном атоме. Переходя к непрерывным фотонным состояниям с помощью уравнения, сопряженного с уравнением E6), получим <p'la' | Яо ! а») = ;-^L_ <а' | хх j „„>. G5) Аналогично матричный элемент энергии HQ, соответствую- соответствующий поглощению фотона из состояния непрерывного спек- спектра р°1, сопровождаемому переходом атома из состояния ae в состояние а', равен <aM^!P°l«0>=I^p<a'iilla0>- <76> Наконец, матричный элемент энергии Hq, соответствующий рассеянию из состояния непрерывного спектра р°1° в такое же состояние р'Г, причем атом переходит из состояния а0 в состояние а', равен (p'l'a'l//„!?¦№> = ^—.(Vi*)^.*. G7) ° При вычислении этого матричного элемента играют роль оба члена в G4). Найденные матричные элементы будут использованы в следующем параграфе. Матричные элементы, относящиеся к одновременному поглощению или испуска- испусканию двух фотонов, могут быть выписаны аналогичным образом, но они приводят к физическим эффектам, весьма слабым и не имеющим какого-либо практического значения-
322 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ § 64. Испускание, поглощение и рассеяние излучения Мы можем теперь непосредственно определить коэффи- коэффициенты испускания, поглощения и рассеяния излучения, подставив в формулы гл. VIII величины матричных элемен- элементов G5)—G7). Для определения вероятности испускания можно исполь- использовать формулу E6) § 54. Она показывает, что вероятность спонтанного испускания фотона в единицу времени на еди- единицу телесного угла при переходе атома из состояния а0 в состояние а' с более низкой энергией равна WP е 1 ,_, , , _.ft4 a 7g. h tfi ft BjxvI/3 Далее, энергия и импульс фотона частоты v равны w— и p — hl ' с ' Кроме того, по формуле Гейзенберга B0) § 29 имеем (а' | х\ | с&°> = — 2mv (а°а') (а' | Х\ | а0), где v (а°а') — частота, связанная с переходом из состоя- состояния а0 в состояние а', равная в данном случае частоте v испускаемого излучения. Принимая это во внимание и под- подставляя написанные соотношения в G8), получим для коэф- коэффициента испускания выражение °>12. G9) Для того чтобы получить энергию, испускаемую с данной поляризацией в единицу времени на единицу телесного угла, нужно умножить это выражение на hv. Отсюда получается для энергии, испускаемой в единицу времени во всех напра- направлениях, 4^<а'|«|а»>|\ (80) что согласуется с выражением C4) § 45 и оправдывает пред- предположение Гейзенберга о физическом смысле его матричных элементов.
§ 64. ИСПУСКАНИЕ, ПОГЛОЩЕНИЕ И РАССЕЯНИЕ 323 Аналогичным образом коэффициент поглощения, выра- выражающийся формулой E9) § 53, принимает для фотонов вид h Bnv)m Ч ' ' / 8n3v, | Этот коэффициент поглощения относится к падающему пуч- пучку, в котором один фотон на единичный интервал энергии пересекает в единицу времени единичную площадку. Если рассчитывать не на единичный интервал энергии, а на еди- единичный интервал частоты, как это принято, когда имеют дело с излучением, то коэффициент поглощения принимает вид 1< что совпадает с формулой C2) § 45, если подставить там вместо Ех энергию hv отдельного фотона. Таким образом, элементарная теория § 45, б которой поле трактуется как внешнее возмущение, дает правильную величину коэффици- коэффициента поглощения. О том, что должно быть согласие между элементарной теорией и той теорией, которая развивается здесь, можно было бы заключить на основании общих соображений. Обе теории различаются лишь тем, что в элементарной теории величины, описывающие поле, все коммутируют, а в разви- развиваемой здесь теории они удовлетворяют определенным перестановочным соотношениям. Но для сильных полей это различие становится несущественным. Таким образом, при сильных полях обе теории должны давать одинаковое погло- поглощение и испускание. Так как в обеих теориях коэффициент поглощения пропорционален интенсивности падающего пуч- пучка, то для поглощения должно быть совпадение также при слабых полях. По тем же соображениям вынужденная часть излучения, рассчитанная по данной теории, должна сов- совпадать с излучением, рассчитанным по элементарной теории. Рассмотрим теперь рассеяние. Коэффициент прямого рассеяния дается формулой C8) § 50. Такое рассеяние фотонов не будет сопровождаться никаким изменением состояния атома в силу присутствия множителя 6a<ao в выра- выражении матричного элемента G7). Таким образом, конеч- конечная энергия фотона W равна его начальной энергии W0.
324 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ Коэффициент рассеяния становится равным Это выражение совпадает с тем, которое получается по клас- классической механике для рассеяния излучения свободным элек- электроном. Мы видим, таким образом, что прямое рассеяние излучения электроном в атоме не зависит от природы ато- атомов и правильно передается классической теорией. Следует напомнить, что этот результат справедлив лишь постольку, поскольку длина волны излучения велика по сравнению с размерами атома. Прямое рассеяние представляет собой математическое понятие и не может быть отделено экспериментально от пол- полного рассеяния, даваемого формулой D4) §51. Посмотрим, что представляет собой это полное рассеяние в случае фотонов. Следует быть внимательным при применении фор- формулы D4) § 51. Сумма ^] в этой формуле может рассматри- k ваться как вклад в рассеяние от двойных переходов, соот- соответствующих переходам сперва из начального состояния в состояние k и затем из состояния k в конечное состояние. Может быть так, что первым переходом будет поглощение падающего фотона, а вторым — испускание, но может оказаться и так, что первым переходом будет испускание, а вторым — поглощение. Из общего характера метода, при- примененного при выводе формулы D4) §51, очевидно, что когда эта формула применяется к фотонам, в сумму ^ к должны быть включены оба эти типа двойных переходов, хотя только первый из них принимался во внимание в вы- выводе, данном в §51, поскольку возможность рождения и аннигиляции частиц там не учитывалась. Обозначим нулем, штрихом и двумя штрихами соответ- соответственно начальное, конечное и промежуточное состояния атома, а нулем и штрихом — состояния поглощенного и излученного фотона. Тогда для двойных переходов, состоя- состоящих из поглощения и последующего испускания, следует в качестве матричных элементов <Уг[У|р°а°), (p'a'\V\k) формулы D4) § 51 взять выражения {k j V jpV) = (a"j HQ jp°l°a°>, <p'a' \V\k) = (p'Va'\HQ\a").
§ 64 ИСПУСКАНИЕ, ПОГЛОЩЕНИЕ И РАССЕЯНИЕ 325 Кроме того, следует учесть, что Е' - Ек = ftv° + НР (а0) - НР (а") = h [v° - v (а"а0)], где hv (а"а°) = Яр (а") - НР (а0). Аналогично для двойных переходов, состоящих из испуска- испускания и последующего поглощения, мы должны взять k\V\ р°а°> = <р'1'а" | HQ j а"), <р'а' | У | ?> = (а' | //Q | р°1°а") и учесть, что Е'-Е„ = ftv° ЯР (а°) - НР (а") - 7iv° - hv' = = — A[v' + v(a'a0)]. В промежуточном состоянии здесь будут два фотона с часто- частотами v° и v'. Подставляя в D4) §51 значения матричных элементов из G5)—G7), мы получим для коэффициентов рассеяния величину е4 у' h?c* v ° ' <a'|i,,|a»)(a»|ilt|ao) _ (а' | *„ | а») (и* | i,, а" ° — v(a"a°) v'+v(a"a°) (81) Если выражать величину (81) через х, а не через х, то получится V 7,2D ^0 X \ v° —v(a"a°) <a'1*i°ia")(a"l*r v' + v (a"a°) • (82) Выражение (82) можно упростить с помощью квантовых условий. Имеем Xt'Xi» — x\oX\- = 0, откуда °> - <а' | х,. | а") <а" | х,- j а0)} = 0, а также (83) m =^(l'1° 1°),
326 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ откуда 21 {(а' | xv |а") v (а"а°) <а" | *,. |а0) - - v (а'а") <а' | xv |а") <а" ] *.- |а0)} = o. (84) = iS(llN^ = 2L(llNa'ao. (84) Умножая равенство (83) на v' и прибавляя к (84), получаем ? {<а' | xv | а") <а" | х, | а°) [v' + v (а"а°)] - а" [v'+v (а'о")]} = ^ Если подставить это выражение для к— A'1°Nа'ао в фор- формулу (82), то после преобразований, использующих соотно- соотношения между частотами v, получится следующий результат: Bле)*л о ,. a' " — v ( <а'| xv "/ (85) Это выражение дает коэффициент рассеяния в виде рассчи- рассчитанного на единицу телесного угла эффективного сечения. Найденное выражение известно под названием дисперсион- дисперсионной формулы Крамерса ¦— Гейзенберга. Оно впервые было получено этими авторами из аналогии с классической теорией дисперсии. Тот факт, что различные члены в выражении (82) могут быть скомбинированы таким образом, чтобы получилось вы- выражение (85), оправдывает сделанное при выводе формулы D4) § 51 предположение, что из матричных элементов энер- энергии взаимодействия элементы типа ф'сс' | V \ р"сх") имеют второй порядок малости по сравнению с элементами типа (р'а' | V | k), по крайней мере в том случае, когда рассеи- рассеиваемыми частицами являются фотоны. § 65. Ансамбль фермионов Ансамбль фермионов можно рассматривать с помощью метода, аналогичного использованному в §§ 59 и 60 для бозо- бозонов. К вектору A) § 59 можно применить антисимметри*
§ 65. АНСАМБЛЬ ФЕРМИОНОВ 327 зующий оператор А, определяемый равенством А=и'\-и*'?±Р, B') где суммирование производится по всем перестановкам Р, а знак + или — берется в зависимости от того, четна или нечетна данная перестановка Р. Действие оператора B1) на вектор A) § 59 дает в результате вектор, соответствующий состоянию совокупности и' фермионов и'!-ш 2 ± Р | afafcS... ади.) = А | aacAzc. ..«»>. C') Вектор состояния C') нормирован, если только векторы ин- индивидуальных фермионов \аа), \аь) все различны; в про- противном случае он равен нулю. В этом отношении вектор C') проще вектора C). Однако вектор C') сложнее вектора C) в том отношении, что C') зависит от порядка, в котором в него входят величины аа, a", ac ..., так как он меняет знак при применении нечетной перестановки к расположению этих величин. Мы можем, как и раньше, ввести числа пъ я2, п3 ... фермионов в состояниях аA), аB>, а|3) ... и рассматривать их как динамические переменные или наблюдаемые. Каждая из них имеет в качестве собственных значений только 0 и 1. Они образуют полный набор коммутирующих переменных для собрания фермионов. В качестве базисных векторов представления с диагональными п' можно взять те, которые связаны с векторами C') уравнением А |aW...а») = ± [п[п&...}, F') соответствующим F), причем переменные п' связаны с пере- переменными аа, аь, ас ... уравнением D). Знак ± необходим в F') в силу того, что при данном п' фиксированы только занятые состояния a", ab, ас ..., но не их порядок, так что знак левой части F') не фиксирован. Для того чтобы уста- установить правило, определяющее знак в F'), нужно располо- расположить все состояния фермионов а. в некотором порядке, при- принимаемом за нормальный. Величины а, входящие в левую часть F'), образуют некоторую выборку из всех а, и стан- стандартный порядок для всех а даст и нормальный порядок для выборки. Примем за правило, что в формуле F') нужно брать знак +, если величины а в левой части могут быть приведены к нормальному порядку четной перестановки и знак —, если для этого необходима нечетная перестановка.
328 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ Ввиду сложности этого правила представление с помощью базисного вектора \ п\п'2п'3 ...) мало пригодно. Если число фермионов в ансамбле переменно, то можно ввести полный набор векторов |>, К), Л|сЛсь), А\ааа»ас)..., (9') соответствующий (9). Вектор состояния общего вида может быть выражен как сумма различных векторов (9'). Продолжая дальше, мы введем набор линейных опера- операторов tj, % причем каждому фермионному состоянию аа соответствует одна пара ца, ца. Операторы должны удов- удовлетворять перестановочным соотношениям ЧаЧ Ь + Чь Ча = 0, [ (И') J Эти соотношения похожи на A1), но имеют в левой части знак + вместо знака —. Они показывают, что при а ^=Ь операторы Ца и ца антикоммутируют с операторами ць и г\ь; если же положить b = а, то из AГ) следует Для доказательства совместности соотношений A1') заме- заметим, что линейные операторы х\, % удовлетворяющие усло- условиям AГ), могут быть построены следующим образом. Для каждого состояния аа мы возьмем набор линейных операто- операторов оха, оуа, aza, аналогичных тем операторам ах, ау, аг, которые были введены в § 37 для описания спина электрона, и таких, что при b Ф а операторы аха, ауа, ага коммути- коммутируют с axb, oyh, огЬ. Мы введем также независимую сово- совокупность линейных операторов ?а по одному на каждое со- состояние аа и потребуем, чтобы они антикоммутировали друг с другом, чтобы квадрат каждого из них был равен единице и чтобы они коммутировали со всеми переменными т. Тогда, если положить Па = у la {Vxa ~ Шуа), Ча = у ?<* (а*а + iaya)> то все соотношения AГ) будут удовлетворяться. Из AГ) следует (¦ПаЛаJ = 11о;Пв'По''По = Ча A — ЧаЛа) Ча = ЧаЧа>
§ 65. АНСАМБЛЬ ФЕРМИОНОВ 329 Это есть алгебраическое уравнение для ч\пг\,.; оно показывает, что Ча% является наблюдаемой с собственными значениями О и 1. Кроме того, цаца коммутирует с чьЧь при b ^ а. Этот результат позволяет положить ЦаЦа = Па, A2') что совпадает с формулой A2). Из формулы (И") мы получим тогда ЧаЧа = 1 - Па, A3') что соответствует формуле A3). Обозначим через | 0) нормированный вектор, являю- являющийся общим собственным вектором всех п, для собствен- собственных значений нуль. Тогда будет ««!О) = о и на основании A2') <0|Twne|0> = 0, отсюда т|а|0> = 0 A5') аналогично A5). Кроме того, имеет место равенство <0|vi«|0> = <0|(l-ne)|0>==<0|0>=l, означающее, что вектор ца | 0) нормирован, и равенство ПаЦа | 0) = ЧаЧаЧа | 0> = Ца A - Па) j 0) = Ца | 0>, означающее, что вектор ца | 0) является собственным векто- вектором па для собственного значения единица. Он является вместе с тем собственным вектором других п для нулевых собственных значений, так как другие п коммутируют с Ча- Обобщая доказательство, можно заключить, что вектор ¦ПаЛг^с ¦¦¦ 4g I 0) нормирован и является общим собственным вектором всех п, соответствующим собственным значениям, равным единице для па, пь, пс, ..., ng и равным нулю для других п. Следовательно, можно считать, что ..г)?.|0>. A7') Обе части равенства антисимметричны в индексах а, Ь, с g. Мы имеем здесь аналогию с A7). Если перейти к другому набору базисных векторов | |3Л) для фермиона, то можно ввести новый набор линейных one-
330 ГЛ. X. ТЕОРИЯ ИЗЛУЧЕНИЯ раторов г\д, соответствующих этим базисным векторам. На основании тех же соображений, что и в случае бозонов, мы найдем тогда, что новые г\ связаны с первоначальными г\ соотношением B1). Отсюда видно, что возможна процедура вторичного квантования и для фермионов. Эта процедура аналогична процедуре для бозонов с единственной разни- разницей, что для фермионов должны использоваться переста- перестановочные соотношения AГ) вместо перестановочных соотно- соотношений A1) для бозонов. Симметричный линейный оператор V j вида B2) может быть выражен через переменные т), fj с помощью метода, аналогичного тому, который применялся для бозонов. По- прежнему будут справедливы уравнения B4) и B5), только оператор S заменяется в B5) на оператор А. Вместо урав- уравнения B6) мы теперь имеем UfbJU, ¦ ¦ • 10) = 2 2 (-)г~\гпг\Лх, ¦ ¦ ¦ 10) (а | U | х,) = а г = 2 г\а % (-Г'тц.Чл*. • • • I 0) bbXr (a\U\b). B6') ab т Символ т]!1 означает, что множитель r\Xf должен быть опу- опущен, причем до его вычеркивания положение его относи- относительно других ч]х должно оставаться прежним. Вместо соот- соотношения B7) имеем теперь %ЪЛхг ¦ ¦ ¦ 10> = 2 (-Г"V>Jk, • • • 10) 6Ьv B7') г Таким образом, формула B8), а значит и B9), сохраняется без изменения. В случае фермионов мы имеем для 0т тот же окончательный вид B9), что и в случае бозонов. Так же точно симметричный линейный оператор Vt типа C0) может быть выражен в виде C5') abed что соответствует одной из форм записи равенства C5). Предыдущее рассмотрение показывает, что имеется глу- глубокая аналогия между теорией фермионов и теорией бозонов; при переходе одних к другим нужно сделать в общих урав- уравнениях лишь небольшие изменения.
§ 65. АНСАМБЛЬ ФЕРМИОНОВ 331 В теории фермионов имеется, однако, деталь, не имею- имеющая аналогии в теории бозонов. Для фермионов суще- существуют только две возможности: занятое и свободное состоя- состояние, и между этими двумя возможностями существует симметрия. Эту симметрию можно показать математически, произ- производя преобразование, меняющее местами понятия «занято» и «свободно», именно n* = Ti*Tj|=l —па. Операторы рождения для переменных, не отмеченных зве- звездочкой, являются операторами уничтожения для перемен- переменных, отмеченных звездочкой, и наоборот. Переменные, от- отмеченные звездочкой, удовлетворяют тем же квантовым условиям и имеют все те же свойства, что и переменные без звездочки. Если имеется только несколько незанятых состояний, то удобным стандартным вектором будет такой, для которого все состояния заняты, именно, | 0*). Этот вектор удовлет- удовлетворяет соотношению «а|0*> = |0*>. Следовательно, он удовлетворяет и соотношению л!|0*) = 0 или Прочие состояния системы будут тогда представлены век- векторами типа В них входят переменные, относящиеся к незанятым фер- мионным состояниям а, Ь, с ... Можно рассматривать эти незанятые фермионные состояния как дырки в занятых со- состояниях, а переменные г\* — как операторы рождения дырок. Дырки являются объектами столь же физическими, как и исходные частицы, и сами являются фермионами.
ГЛАВА XI РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА § 66. Релятивистское рассмотрение частицы Теория, которую мы строили до сих пор, была суще- существенно нерелятивистской. Мы работали все время в одной и той же лоренцевой системе отсчета и строили теорию по аналогии с классической нерелятивистской динамикой. Попытаемся теперь сделать теорию инвариантной относи- относительно преобразований Лоренца так, чтобы она удовлетво- удовлетворяла частному принципу относительности. Это необходимо для того, чтобы теорию можно было применять к быстро движущимся частицам. Нет нужды согласовывать излагае- излагаемую теорию с общей теорией относительности, так как общая теория относительности нужна только при рассмот- рассмотрении тяготения, а в атомных явлениях силы тяготения совершенно несущественны. Посмотрим, как можно приспособить основные положе- положения квантовой механики к релятивистской точке зрения, согласно которой четыре измерения пространства, времени должны рассматриваться единообразно. Общий принцип суперпозиции состояний в том виде, как он изложен в гл. I, является релятивистским принципом, поскольку он приме- применим к «состояниям» в пространственно-временном понима- понимании, соответствующем теории относительности. Однако общее понятие наблюдаемой не согласуется с теорией отно- относительности, поскольку наблюдаемая может быть связана с физическими объектами в удаленных друг от друга точках в один и тот же момент времени. Следовательно, если иметь дело с общим представлением, относящимся к какому- нибудь полному набору коммутирующих наблюдаемых, то в теории не может проявиться релятивистская симметрия времени и пространства. В релятивистской квантовой меха- механике приходится довольствоваться одним представлением,
§ 66. РЕЛЯТИВИСТСКОЕ РАССМОТРЕНИЕ ЧАСТИЦЫ 333 в котором проявляется эта симметрия. Можно затем перейти к другому представлению, относящемуся к частной лорен- цевой системе отсчета, если это полезно для конкретных расчетов. В задаче о движении одной частицы, для того чтобы проявлялась симметрия пространства и времени, нужно пользоваться шредингеровским представлением. Мы будем писать хъ х2, х3 вместо х, у, г и х0 вместо ct. Зависящая от времени волновая функция принимает вид г|з (х^х^) и дает нам основание для единообразного рассмотрения всех четы- четырех х. Мы будем употреблять релятивистские обозначения, запи- записывая четыре величины х в виде Хц (ц = 0, 1, 2, 3). Про- Пространственно-временной вектор с четырьмя компонентами, преобразующимися при преобразованиях Лоренца, как четыре величины dx^, будем обозначать буквой с греческим индексом внизу, например а^. Можно поднять индекс по правилу а° = а0, а1 = — а1, Ф = — аг, а3 = — а3. A) Величины а^ называются контравариантными компонентами вектора а, а а? — ковариантными *). Два вектора имеют скалярное произведение aobo — a1b1 — аф2 — a3b3 = аР-b^ = а^, где по дважды повторяющимся индексам подразумевается суммирование. Это скалярное произведение инвариантно по отношению к преобразованию Лоренца. Определим фунда- фундаментальный тензор равенствами ^v = Q ПрИ ji,^V. Пользуясь им, можно записать правила A), связывающие контравариантные и ковариантные компоненты, в виде В шредингеровском представлении импульс (компоненты которого мы будем обозначать рг, р2, р3 вместо рх, ру, р:) соответствует оператору *) Обычно для ковариантных компонент употребляются, наоборот, нижние значки, а для контравариантных — верхние. (Прим, В. А. Фока,)
334 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА С другой стороны, четыре оператора д/дх^ образуют кова- риантные компоненты четырехмерного вектора, у которого контравариантные компоненты имеют вид д/дх^. Для того чтобы перенести C) в релятивистскую теорию, мы должны сначала написать это соотношение с согласованными индек- индексами и затем дополнить его до четырехмерного векторного урав- уравнения Следовательно, нужно ввести новую динамическую пере- переменную р0 с оператором д/дх0. Так как в комбинации с импульсами рг она образует четырехмерный вектор, то она должна иметь смысл энергии частицы, деленной на с. Мы можем приступить к построению теории, в которой четыре величины р рассматриваются рав- равноправно, аналогично четырем величинам х. В теории электрона, которая будет здесь развита, нам придется ввести новые степени свободы, описывающие внут- внутреннее движение электрона. Следовательно, волновая функ- функция должна содержать наряду с четырьмя х новые пере- переменные. § 67. Волновое уравнение для электрона Рассмотрим сначала случай движения электрона в отсут- отсутствие электромагнитного поля, т. е. задачу о движении сво- свободной частицы, аналогичную рассмотренной в § 30, но с возможным добавлением внутренних степеней свободы. Релятивистская функция Гамильтона для рассматриваемой системы, даваемая классической механикой, выражается уравнением B9) § 30 и приводит к волновому уравнению {р0 - (mV + р\ + р\ + pi)*'*} у = о, E) где уже нужно толковать величины р, как операторы, со- согласно уравнениям D). Хотя в уравнении E) и учтена реля- релятивистская связь между импульсом и энергией, оно все же неудовлетворительно с точки зрения релятивистской тео- теории. Оно столь несимметрично относительно р0 и других р, что невозможно обобщить его релятивистским образом на
§ 67. ВОЛНОВОЕ УРАВНЕНИЕ ДЛЯ ЭЛЕКТРОНА 335 случай, когда имеется поле. Мы должны поэтому искать другое уравнение. Если умножить волновое уравнение E) слева на оператор {р0 + (т2сг + pi + pi + plI/2}, то получится уравнение {fi-m*c*-pl-p\-pl}$ = 0, F) которое релятивистски инвариантно и является удобным в качестве основы для построения релятивистской теории. Уравнение F) не вполне эквивалентно уравнению E), потому что, хотя каждое решение E) есть решение F), но обратное неверно. Только те решения F), которые соответствуют положительным значениям р0, являются также решениями E). Вид волнового уравнения F) не согласуется с общими положениями квантовой теории, поскольку оно квадратично относительно t, тогда как в § 27 мы из весьма общих сообра- соображений вывели, что волновое уравнение должно быть линей- линейным относительно оператора d/dt или р0, т. е. должно быть вида G) § 27. Поэтому мы будем искать уравнение, линейное относительно р0 и в общих чертах эквивалентное F). Для того, чтобы это волновое уравнение преобразовывалось простым образом при преобразовании Лоренца, попытаемся сделать его рациональным и линейным относительно plt р2, р3 и рй. Другими словами, положим {ро-а1р1-а2р3-а3р3-Р}^ = О, G) где а и р не зависят от р. Так как мы рассматриваем слу- случай отсутствия поля, всеточки пространства-времени должны быть равноправны, и оператор в волновом уравнении не должен содержать величин х. Следовательно, аиE также не должны зависеть от величин х, так что они коммутируют с р и с х. Поэтому аир описывают некоторые новые степени свободы, относящиеся к какому-то внутреннему движению электрона. Мы увидим позднее, что они позволяют ввести спин электрона. Умножая уравнение G) слева на оператор {р0 + а{рх + а2рг + а8р3 + РЬ мы получим — S [™*Р' + («i**» + «s»!) P iPa + («iP + P«i) Pi] — Pa\4l=0» 123 ' где 2] берется по циклической перестановке индексов 123 1, 2, 3. Это выражение совпадает с F), если а и р будут
336 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА удовлетворять соотношениям «1=1, a1a2-f-«2ai = 0, а также соотношениям, получающимся отсюда циклической перестановкой индексов 1, 2, 3. Если положить f>=ammc, то эти соотношения могут быть объединены в одно os /а, Ь=\, 2, 3\ ._. = 28ab „_„ m • (8) \ Ht/Irl III I Четыре величины а антикоммутируют друг с другом, и квадраты их равны единице. Итак, придавая величинам аир подходящие свойства, можно сделать волновое уравнение G) эквивалентным F), по крайней мере, поскольку дело касается движения элек- электрона как целого. Мы можем теперь предположить, что G) есть правильное релятивистское волновое уравнение для движения электрона, в отсутствие поля. Это приводит, однако, к одной трудности, вызванной тем фактом, что урав- уравнение G), аналогично F), не является в точности эквивалент- эквивалентным уравнению E), но допускает также и решения, соответ- соответствующие отрицательным значениям р0, а не только поло- положительным. Первые, разумеется, не соответствуют какому- либо действительно наблюдаемому движению электрона. Пока мы будем рассматривать только решения с положи- положительной энергией и отложим обсуждение решений с отри- отрицательной энергией до § 73. Представление для четырех величин а получается легко. Эти величины имеют алгебраические свойства, аналогичные величинам, введенным в § 37 и допускающим представление матрицами с двумя строками и столбцами. Пока мы огра- ограничиваемся двухрядными матрицами, мы не можем полу- получить представление более чем для трех антикоммутирующих величин, и для того, чтобы получить представление для четырех антикоммутирующих величин а, мы должны перей- перейти к четырехрядным матрицам. Удобно сначала выразить величины а через о и через другой аналогичный набор трех антикоммутирующих переменных р1э р3, р3, квадрат кото-
§ 67. ВОЛНОВОЕ УРАВНЕНИЕ ДЛЯ ЭЛЕКТРОНА 337 рых равен единице и которые не зависят от о и коммути- коммутируют с ними. Можно взять, например, (9) и тогда легко показать, что а будут удовлетворять всем соотношениям (8). Если ввести представление, в котором диагональны р3 и ст3, то мы получим следующую схему матриц: а, = 0 10 0 10 0 0 0 0 0 1 0 0 10 -("О 0 0 0 0 0 0—/ 0 ( 0 о о -1 0 0 1 о о 0 0 10 0 0 0 1 10 0 0 0 10 0 Г Р11 — 1 о о о — 1 О 0 — t 0ч 0 0 0 — (\ /о о о О t 0 oj о о о Следует заметить, что матрицы р и а являются эрмитовыми, так что матрицы а также эрмитовы. Соответственно четырем строкам и столбцам волновая функция \|) должна содержать переменную, принимающую четыре значения; тогда можно умножать на нее матрицу. Иначе говоря, можно считать волновую функцию четырех- компонентной, причем каждая компонента есть функция только от четырех величин х. Мы видели в § 37, что спин электрона требует двухкомпонентной волновой функции. Тот факт, что наша теория дает четырехкомпонентную функцию, вызван тем, что волновое уравнение G) имеет вдвое больше решений, чем должно быть, и половина из них соответствует состояниям с отрицательной энергией.
338 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА С помощью (9) волновое уравнение G) может быть пере- переписано в трехмерных векторных обозначениях следующим образом *): {Ро - Pi (ff> P) - Рз гпс) о|з = 0. A0) Для того чтобы обобщить это уравнение на случай присут- присутствия электромагнитного поля, мы, следуя классическому правилу, заменим р0 и р на ро + -—Ао и р + --А, гдеЛ0 и с с А — скалярный и векторный потенциалы поля в месте нахождения электрона. Это дает нам уравнение 0, A1) которое и является основным волновым уравнением реля- релятивистской теории электрона. Четыре компоненты ij: в A0) или A1) следует представ- представлять себе написанными одна под другой так, чтобы полу- получилась матрица с одним столбцом. Тогда квадратные матри- матрицы р и а умножаются на столбцы г|з согласно правилу умно- умножения матриц, и произведение в каком случае опять будет матрицей с одним" столбцом. Сопряженную волновую функцию, которая является бра-вектором, следует изобра- изображать в виде четырех компонент, написанных одна рядом с другой, так, чтобы получилась матрица с одной стро- строкой. Обозначим сопряженную волновую функцию, изоб- изображаемую матрицей с одной строкой через ty+, употребляя знак + для обозначения транспонирования матрицы, т. е. замены строк столбцами. Тогда сопряженное по отношению к A1) уравнение будет иметь вид ))} 0, A2) где операторы р действуют на функцию, стоящую слева. Оператор дифференцирования, действующий налево, сле- следует интерпретировать согласно B4) §22. *) Уравнение A0) и его обобщение на случай присутствия электро- электромагнитного поля было установлено Дираком и носит его имя. Четы- Четырехрядные матрицы ос,-, (J (а также р;, а;) называются матрицами Дирака. {Прим, перев.)
§ 68. ЛОРЕНЦ-ИНВАРИАНТНОСТЬ 339 § 68. Инвариантность относительно преобразований Лоренца Прежде чем переходить к обсуждению физических след- следствий волнового уравнения A1) или A2), мы проверим, действительно ли наша теория инвариантна относительно преобразований Лоренца, или, точнее говоря, что физичес- физические результаты, к которым приводит теория, не зависят от используемой лоренцевой системы отсчета. Это ни в какой мере не является очевидным. Нужно показать, что если выписать волновое уравнение в другой лоренцевой системе, то решение нового уравнения может быть приведено во взаимно однозначное соответствие с первоначальным таким образом, что соответствующие решения могут считаться представляющими одно и то же состояние. Для каждой из этих двух лоренцевых систем квадрат модуля волновой функции, просуммированный по четырем компонентам, должен давать рассчитанную на единицу объема вероятность нахождения электрона в определенной точке в данной лоренцевой системе. Можно назвать эту величину плот- плотностью вероятности. Ее значения, вычисленные в различ- различных лоренцевых системах с помощью волновых функций, представляющих то же самое состояние, должны быть свя- связаны друг с другом так же, как временные компоненты некоторого четырехмерного вектора. Далее, четырехмерная дивергенция этого вектора должна исчезать, что означает сохранение электрона, т. е. тот факт, что электрон не может появиться или исчезнуть в некотором объеме, не проходя через границу. Для краткости удобно ввести обозначение а0 = 1 и пред- предположить, что индексы ajt (\i = 0, 1, 2, 3) могут быть под- подняты согласно правилам A), хотя эти четыре ад и не обра- образуют компонент четырехмерного вектора. Можно написать теперь уравнение A1) в виде = О. A3) Четыре а» удовлетворяют соотношениям m, A4) где gw определено в B); это можно проверить, рассматри- рассматривая раздельно случаи, когда ц и v оба равны нулю, когда
340 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА одно из них равно нулю и когда ни одно из них не равно нулю. Произведем бесконечно малое преобразование Лоренца и отметим величины, относящиеся к новой системе, звездоч- звездочкой. Компоненты четырехмерного вектора р^ будут пре- преобразовываться согласно уравнениям вида A5) где av — величины первого порядка малости. Будем пре- пренебрегать величинами, квадратичными по а и имеющими второй порядок малости. Для того чтобы имели место пре- преобразования Лоренца, должно быть выполнено условие отсюда следуют соотношения которые дают 0. A6) Компоненты А^ преобразуются по тому же закону, так что Следовательно, волновое уравнение A3) принимает вид {(с/ - a V) (pt + ~At)- аттс} г|> = 0. A7) Введем величину М = \арааРата°. A8) Тогда из соотношения A4) с помощью A6) получим = 1 ара {аРа„рР + aPamc^) affla° и, следовательно, а" A + атМ) = A + Мат) (а11 - а?ар). A9) Умножив A7) слева на A + Мат), получаем ~ А$) ~ (ат + М) тс) -ф = 0.
§ 68. ЛОРЕНЦ-ПНВАРИЛНТНОСТЬ 34.1 Таким образом, если мы положим A + атМ),р = Г, B0) то получим {«" {pl + ~A*J- аттс} Г = 0. B1) Это уравнение имеет тот же вид, что и уравнение A3), в котором переменные р1Х, Alit i]; снабжены звездочкой р?, /4?, ty*. Оно показывает, что уравнение A3) инвариантно относительно бесконечно малого преобразования Лоренца при условии, что г|? преобразуется согласно правилу B0). Конечное преобразование Лоренца может быть построено из бесконечно малых, и поэтому уравнение A3) инвариантно также и по отношению к конечным преобразованиям Лорен- Лоренца. Заметим, что матрицы а^ вообще не меняются. Инвариантность, доказанная выше, означает, что реше- решения ty исходного уравнения A3) находятся во взаимно однозначном соответствии с решениями ф* нового уравне- уравнения B1), причем соответствующие решения связаны соотно- соотношениями B0). Мы полагаем, что соответствующие решения представляют одно и то же физическое состояние. Теперь нужно убедиться в том, что физические интерпретации соот- соответствующих решений, отнесенных каждое к своей лоренце- вой системе, согласуются друг с другом. Нужно, чтобы •ф+ф давало плотность вероятности в исходной системе, а г|з*+г|)* — плотность вероятности, отнесенную к новой системе. Рассмотрим соотношение между этими величинами. Символ а|)+ф означает то же самое, что и ij)+a°x|), и представ- представляет собой одну из четырех величин, которые должны рас- рассматриваться совместно. Уравнения A8) и A6) показывают, что величина М чисто мнима. Следовательно, уравнение, сопряженное с уравнением B0), будет иметь вид Отсюда, учитывая A9), имеем ^*+ац^* = ^+ A _ Мат) а» A + атМ) г|э = = Ч>+ A - Мат) A + Мат) (aw - Это сводится с помощью A6) к соотношению
342 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА Если спустить здесь индекс ц, то получится уравнение такого же вида, как и A5), откуда видно, что четыре вели- величины ^аД* преобразуются как контравариантные компо- компоненты четырехмерного вектора. Следовательно, т|Л|) пре- преобразуется как временная компонента четырехмерного век- вектора, что является правильным законом преобразования для плотности вероятности. Пространственные компоненты четырехмерного вектора, именно i|;+ari|), будучи умножен- умноженными на с, дают поток вероятности или вероятность про- прохождения электрона через единичную площадку в единицу времени. Следует отметить, что выражение i|>+ami|) является инва- инвариантным в силу соотношения ^*+ат-ф* = ^ A - Мат) ат A +атМ) i|j = фату. В заключение нужно проверить выполнение закона сохра- сохранения, состоящего в том, что дивергенция -^№+М>) B2) обращается в нуль. Для того чтобы это сделать, умно- умножим A3) слева на г[>+, Получим ih 4~ + i Л^\ - фаттс$ = 0. Сопряженное уравнение имеет вид .. <ЭгЬ+ . —, е . \ ,, —, _ - ш -к~- -f- г))+ — Лм) а^яЬ — \j)+ammcij3 = 0. v OX' ' С i Вычитая одно из другого и разделив на ih, получим что как раз и выражает обращение B2) в нуль. Таким образом, мы завершили доказательство того, что наша тео- теория дает согласующиеся результаты, в какой бы системе отсчета она ни применялась. § 69. Движение свободного электрона Интересно рассмотреть движение свободного электрона согласно вышеизложенной теории в гейзенберговской кар- картине и исследовать гейзенберговские уравнения движения.
§ 69. ДВИЖЕНИЕ СВОБОДНОГО ЭЛЕКТРОНА 343 Эти уравнения можно проинтегрировать точно, что впервые сделал Шредингер *). Для краткости будем опускать ин- индекс t, который, если следовать обозначениям § 28, дол- должен был бы выписываться при динамической переменной, изменяющейся во времени по гейзенберговской картине. В качестве оператора Гамильтона следует взять выра- выражение, которое, действуя на ij), удовлетворяющее уравне- уравнению A0), дает то же, что оператор ср0, примененный к \р. Это выражение есть H = c9l(a, p) + p3mc2 = c(a, p) + p3mc\ B3) Сразу видно, что импульс коммутирует с Я и, следовательно, является интегралом движения. Далее, проекция скорости на ось Xi равпа *i = [*i, Н] = сах. B4) Это результат довольно неожиданный, так как он означает совершенно другое соотношение между скоростью и им- импульсом, чем в классической механике. Он, однако, согла- согласуется с выражением jip+ccc1\jj для компоненты потока вероят- вероятности. Величина хъ даваемая B4), имеет собственные значения ± с, соответственно собственным значениям ± 1 дляо^. Поскольку аналогичный результат получается для х.г и х3, мы можем заключить, что измерение проекции ско- скорости свободного электрона всегда приводит к резуль- результату ± с. Легко убедиться, что это заключение остается в силе также в присутствии поля. Поскольку электроны, наблюдаемые на практике, имеют скорости существенно меньшие скорости света, то может показаться, что мы имеем здесь противоречие с эксперимен- экспериментом. Это, однако, не является действительным противоре- противоречием, поскольку теоретическая скорость в вышеприведенном заключении есть скорость в определенный момент времени, тогда как наблюдаемые скорости всегда являются средними скоростями по некоторому конечному интервалу времени. В дальнейшем при рассмотрении уравнений движения будет показано, что скорость вообще не является постоянной, но быстро осциллирует вокруг среднего значения, которое согласуется с наблюдаемой величиной. *)Schrodinger, Sitzungsb, d, Berlin, Akad., 1930, p. 418.
344 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА Можно легко убедиться с помощью элементарного при- применения принципа неопределенности § 24, что измерение проекции скорости должно давать в релятивистской теории результат ± с. Для измерения скорости мы должны изме- измерить координату в два слегка различных момента времени и затем разделить изменение координаты на интервал вре- времени (измерение импульса и вычисление скорости по им- импульсу не годится, поскольку обычное соотношение между скоростью и импульсом здесь несправедливо). Для того чтобы измеренная нами скорость служила приближением для мгновенного значения скорости, интервал времени между двумя измерениями координаты должен быть очень мал, и, следовательно, эти измерения должны быть очень точными. Большая точность, с которой известна коорди- координата электрона в течение данного интервала времени, должна приводить, согласно принципу неопределенности, к почти полной неопределенности импульса. Это значит, что почти все значения импульса вероятны, так что импульс почти наверняка бесконечен. Бесконечная же величина проекции импульса соответствует величине с для соответствующей проекции скорости *). Посмотрим теперь, как меняется со временем скорость электрона. Имеем Так как оператор ах антикоммутирует со всеми членами в операторе Н, за исключением сос^, то мы имеем B5) *) Описанная автором процедура не есть измерение скорости в квантовомеханическом смысле; действительно, эта процедура, с одной стороны, не позволяет делать предсказаний, относящихся к результатам будущих измерений скорости, а с другой стороны, она не может дать и проверки предшествовавших предсказаний. Далее, если отрицать обычную связь между скоростью и количеством движения (импульсом), то здесь нельзя применять и принцип неопределенности § 24, т. е. соотношений Гейзенберга. Следует также отметить, что рассуждения ав- автора, будучи применены в теории Шредингера, привели бы к выводу, что скорость электрона всегда бесконечна, (Прим, В. А, Фока.) atH + H и, следовательно, ihax = 2< al — «iCOi1p1 -f C*Xxf. XyH - 2cpt = — 2h № = 2cpx !a1 + 2cp1.
§ 69. ДВИЖЕНИЕ СВОБОДНОГО ЭЛЕКТРОНА 345 Так как величины Н и р1 постоянны, то из первого уравне- уравнения B5) вытекает ihax = 2ах#. B6) Это дифференциальное уравнение относительно dx может быть сразу проинтегрировано; результат имеет вид di=aje-2'm/;i, B7) где а? — постоянная, равная значению &х при t = 0. Множи- Множитель e~2iHt!n должен в B7) стоять справа от множителя d°, поскольку в B6) Н стоит справа от аг. Второе из уравне- уравнений B5) дает аналогичным образом результат Теперь можно легко завершить интегрирование уравнения движения для хх. Из B7) и первого из уравнений B5) имеем а, = 1 fftajg" iiHmH~x + ср.Н'1 B8) и, следовательно, интеграл по времени от уравнения B4) есть хх = - 1 сй'а^- "Н'/ЙЯ-г + с2Р1Н-Н + а, B9) где ах — постоянная. Из B8) видно, что проекция скорости на ось хъ рав- равная саъ состоит из двух частей: постоянной части с2ргН~г, связанной с импульсом классической релятивистской фор- формулой, и осциллирующей части частота которой равна 2H/h и велика, поскольку эта вели- величина по меньшей мере равна 2тс2/1г. Только постоянная часть может наблюдаться в действительном измерении ско- скорости, поскольку такое измерение дает среднюю скорость за интервал времени, значительно превышающий h/2mc%. Осциллирующая часть и приводит к тому, что мгновенное xt будет иметь собственные значения ± с. Осциллирующая часть координаты хх мала. В самом деле, согласно B9) она равна - | с/Г'аГ W/Г2 = |ich fa-cpji-*)H\ что имеет порядок величины Н/тс, так как величина ai—сРхН'1 порядка единицы.
346 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА § 70. Существование спина В § 67 мы видели, что правильное волновое уравнение электрона в отсутствие электромагнитного поля, а именно уравнение G) или A0), эквивалентно волновому уравне- уравнению F), которое подсказано аналогией с классической тео- теорией. Эта эквивалентность нарушается если имеется поле. Из аналогии с классической теорией можно было бы ожи- ожидать, что уравнение в этом случае будет иметь вид {(ро + -~ Л0 J - (р +1 АK - т*с*} гр = О. C0) Здесь оператор в точности соответствует классической реля- релятивистской функции Гамильтона. С другой стороны, можно умножить уравнение A1) слева на некоторый множитель, чтобы добиться как можно более близкого сходства с C0), именно, на множитель Мы получим тогда > = 0. C1) Воспользуемся теперь общей формулой, справедливой для двух трехмерных векторов В и С, коммутирующих с а: (а, В) (а, С) = 2 {olBjCj, + с,а,В А + о^ВАЬ 1-23 где сумма берется по циклической перестановке индексов 1, 2, 3; эту формулу можно также записать в виде (а, В)(а, С) = (В, C) + i^]a3(B1C2-B2C1) = 123 = (В, С) + г(а, [В х С]). C2) Полагая В = С = р Н—Аи принилтая во внимание равенство = — ih — rot A = — ih — 3FC, с с
§ 70. СУЩЕСТВОВАНИЕ СПИНА 347 где К — магнитное поле, мы получим (а, (р+±a))'= (p+-f АI+ ?(*,«). C3) Имеем также = — Г- (т Ж + grad Ло)) = - » Т К 8), где Ш — электрическое поле. Следовательно, уравнение C1) принимает вид Ьр 1 Это уравнение отличается от C0) двумя добавочными чле- членами в операторе. Эти добавочные члены вызывают некото- некоторые новые физические эффекты, но поскольку они не яв- являются вещественными, то сами по себе они не приводят сразу к физической интерпретации. Для того чтобы понять, какие физические свойства ото- отображаются различием между C4) и C0), лучше проводить рассмотрение в гейзенберговской картине, которая всегда является более удобной для сопоставления классической и квантовой механики. Гейзенберговские уравнения движения определяются оператором Гамильтона # = — еА0 + ср1[а, (р + ~А)) + р3тс2, C5) являющимся обобщением B3) на случай присутствия поля. Из уравнения C5) при учете C3) получаем = (а, (р +1 А)K + т^ = (р + .1 АI + mV + Ц- (а, Щ. C6) Мы имеем здесь вещественную часть добавочных членов в уравнении C4), и они появляются без чисто-мнимой части.
348 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА Можно ожидать, что для медленно движущегося электрона (т. е. при малом импульсе) гейзенберговские уравнения дви- движения будут определяться оператором Гамильтона вида тс1 + Нъ где Н1 мало по сравнению с тс2. Полагая в фор- формуле C6) Н = тс2 + Нъ пренебрегая величиной Н\ и дру- другими членами, содержащими с'2, и разделив на 2т, получим + -^-(в, Щ. C7) Оператор Гамильтона Нъ определяемый формулой C7), совпадает по виду с классической функцией Гамильтона для медленного электрона, за исключением члена Пе 2тс (в, Щ. Этот член можно рассматривать как дополнительную по- потенциальную энергию, которую по квантовой теории имеет медленный электрон. Добавочный член можно приписать наличию у электрона магнитного момента Пе а Это как раз тот магнитный момент, который был предпо- предположен в §§ 41 и 47 в связи с рассмотрением эффекта Зее- мана и который согласуется с опытом. Спиновый момент количества движения не дает никакой потенциальной энергии, и поэтому не проявляется в преды- предыдущих расчетах. Простейший способ показать существова- существование спинового момента количества движения состоит в рас- рассмотрении движения свободного электрона в центральном силовом поле и в определении интеграла момента количества движения. Это означает, что нужно взять оператор Гамиль- Гамильтона B3) или же оператор Гамильтона C5), в котором А = 0 и Л0 есть функция от радиуса г, т. е. положить Я = -еЛ0(г) + ф1(<т, р)+Рзтс2, C8) и затем получить уравнения движения Гейзенберга для мо- момента количества движения. С тем или другим оператором Гамильтона мы находим с помощью перестановочных соот- соотношений § 35 для скорости изменения проекции орбиталь- орбитального момента количества движения на ось хх, т. е. для
§ 70. СУЩЕСТВОВАНИЕ СПИНА 349 величины т1 = хгр3 — х3рг, следующее выражение: = ср! (а, Таким образом, тх =/= 0 и орбитальный момент количества движения не является интегралом движения. Этот результат можно было предвидеть на основании проинтегрированного уравнения движения B9), так как в нем обнаруживается осциллирующая часть движения, которая приводит к осцил- осциллирующему члену в моменте количества движения. Далее, имеем с помощью уравнений E1) § 37 Ша1 = о1Н — На1 = ср1{а1(а, р) — (а, р)ст1} = = Ф1 (К<* - ocri). P) = 2tcpi Kp, - сг2р3}. Следовательно, так что вектор т-\--^-Ив является интегралом движения. Этот результат можно толковать как существование у элек- электронов спинового момента количества движения 2^а' который нужно прибавить к орбитальному моменту т, чтобы получить интеграл движения. Спиновый момент коли- количества движения мог бы быть получен и путем рассмотре- рассмотрения операторов вращения для состояний со спиновой сте- степенью свободы в соответствии с общим методом § 35. Один и тот же вектор а определяет собой направления как спинового магнитного момента, так и спинового момента количества движения. Если электрон в определенном спино- спиновом состоянии имеет в данном направлении спиновый момент количества движения -,у Н, то он будет иметь в том же на- „ " еП правлении магнитный момент — Мы получили величину у ft для спина электрона из соо- соображений, связанных с общими принципами квантовой тео- теории и теории относительности. Можно было бы применить те же соображения к другим видам элементарных частиц; мы получили бы тот же результат, а именно, что спиновый момент количества движения равен половине кванта. Это подходит для протона и нейтрона. Но есть некоторые типы
350 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА элементарных частиц (например, фотоны и некоторые виды мезонов) спин которых, как известно из опыта, отличается от у Й, так что мы имеем здесь противоречие между нашей теорией и экспериментом. Ответ следует искать в сделанном нами неявном допу- допущении. Наши соображения имеют силу только в предполо- предположении, что положение частицы есть наблюдаемая. Если это допущение справедливо, то частица должна иметь спин, равный половине кванта. Для тех же частиц, которые имеют другой спин, это предположение должно быть ложным; всякие динамические переменные хъ хг, х3, которые можно ввести для описания положения частицы, не могут быть наблюдаемыми в смысле общей теории. Для таких частиц не существует настоящего шредингеровского представле- представления. Если и окажется возможным ввести квазиволновую функцию, содержащую динамические переменные хъ х2, х3, то она не будет допускать правильной физической интер- интерпретации волновой функции, состоящей в том, что квадрат ее модуля дает плотность вероятности. Для таких частиц все же имеется импульсное представление, и для практиче- практических целей оно доста.точно. § 71. Переход к сферическим координатам Для дальнейшего изучения движения электрона в цен- центральном силовом поле с оператором Гамильтона C8) целесо- целесообразно перейти к сферическим координатам, как было сде- сделано в § 38 в нерелятивистском случае. Можно, как и прежде, ввести переменные г и рг, но вместо k — величины орбитального момента т, который уже не является интегра- интегралом движения, нужно теперь пользоваться величиной пол- полного момента количества движения M = m + -2- ho. По- Положим +Mi+~h2. C9) Собственные значения т3 являются целыми кратными Н, а собственные значения у На3 равны ±у Следовательно, собственные значения М3 должны быть нечетными крат- кратными Н. Из теории § 36 следует, что собственные значения | / | должны быть положительными целыми числами.
§ 71. ПЕРЕХОД К СФЕРИЧЕСКИМ КООРДИНАТАМ 351 Если в формуле C2) положить В = С = т, то получится (a, mJ = m2 -J- i (or, [m x т]) = т2 — %(в, т) = Следовательно, имеем {(а, п Итак (or, т) -\- Я является величиной, квадрат которой ра- равен М2 -J-^-Й2, и мы могли бы, в согласии с уравнением C9), положить jh равным величине (<т, т) -J- П. Это, однако, не является наиболее целесообразным определением, по- поскольку было бы желательным иметь в качестве / интеграл движения, а выражение (в, т) + Я не является таковым. Из C2) следуют равенства (a, т)(а, p) = i(a, [тхр]) и (а, р)(ог, т) = Ца, [рхт]), так что имеет место соотношение (or, т) (о, р)-\-(о, р) ((Т, ш) = = 1У, OTj_ \tTi2P3 — №зР% ~Ь PiP^z — P'i^-i} == ^"Z-i ^i2i»pi== 123 123 = —2A(a, p) или, иначе, {(о, т)+Н}(а, p) + (<J, P){K т) + Й} = 0. Следовательно, (а, т) -\- П антикоммутирует с одним из чле- членов в выражении C8) для Н, именно, с членом срг (о, р) и коммутирует с двумя другими. Отсюда следует, что р3 {(<т, т) + Щ коммутирует со всеми тремя членами в Н и является интегралом движения. Но квадрат р8 {(а, т) + + %} есть также M.2-\--j-h2. Поэтому мы можем положить /Й = рз{(<7, т)+Щ, D0) что дает нам удобное, рациональное определение /, согла- согласующееся с C9), притом такое, что величина / становится интегралом движения. Собственными значениями этого /
352 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА являются все положительные и отрицательные целые числа, исключая значение нуль. Пользуясь еще раз соотношением C2) и учитывая ра- равенства D0) и E8) § 38, получим (а, х)(<т, р) = (х, p) + i(a, m) = rpr + ipsjh-ifl. D1) Введем линейный оператор е, определив его выражением re = Pl(<r, х). D2) Так как переменная г коммутирует с оператором рх и (а, х), то она должна коммутировать также и с е. Поэтому имеем Га8а=[Р1, ((Г, х)]2 = (СГ, хJ = Х2 = Г2 или е2=1. Далее, оператор рх (о, р) коммутирует с оператором /, а так как между величинами х и р имеется симметрия по отношению к моменту количества движения, то оператор рх (а, х) должен тоже коммутировать с оператором /. Сле- Следовательно, операторы ей/ коммутируют. Кроме того, оператор е должен коммутировать с рп так как в силу соотношения (а, х)(х, р)-(х, р)(о, х) = (<т, (х(х, р)-(х, р)х)) = = /ft(<r, х), мы имеем rerpr — грггг = Шгг, откуда следует гЧрГ — г%рге=0. Из D1) и D2) получаем или Pi (о. Р) = е [рг -~)+ Щз ~ Таким образом, выражение C8) принимает вид — = - ~с- Ао + &[Рг— — J + tep37- + P3mc и представляет собой оператор Гамильтона, выраженный в сферических координатах. Следует отметить, что опера- операторы е и р3 коммутируют со всеми другими переменными,
§ 72. ТОНКАЯ СТРУКТУРА УРОВНЕЙ ЭНЕРГИИ ВОДОРОДА 353 встречающимися в операторе Гамильтона, и антикоммути- руют друг с другом. Это значит, что можно взять представ- представление, в котором операторы ей р3 выражаются матрицами /о _/\ п сп {43) О }' \0 -1 Если переменная г также диагональна в рассматриваемом представлении, то представитель (г'рз| } вектора состояния будет иметь две компоненты, скажем (г', 1 | ) = г|зя (/¦') и (г1, —1 | ) = \|)u (r'), относящиеся к двум строкам и столб- столбцам матриц D3). § 72. Тонкая структура уровней энергии водорода Рассмотрим теперь случай атома водорода, для которого Л0 = у,и найдем его уровни энергии, определяемые соб- собственными значениями Н' оператора Н. В рассмотренном выше представлении, в котором ей р выражаются матри- матрицами D3), уравнение (//' — Н) \ ) = 0 принимает вид ih Г .... D4) Если положить й Я' ~ ; . Я' тс тс -\ с с то уравнения приводятся к следующим: ) 'Фа ~~ 1 ~л Г" 11Рй = U, D5) 1 , а \ , I д В них величина а = т— является малым числом. Мы будем решать эти уравнения методом, аналогичным использован- использованному в G3) § 39. Положим qa = r-ler-r/aft ^b = r-le-r/agt D6)
354 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА где fug — две новые функции or r и где введено обозна- обозначение « = (W* = *(m*-?)-1''. D7) Уравнения D5) принимают вид D8) Будем искать решение в виде степенных рядов для / и g / = 2V, g = 2^, D9) где последовательные значения s отличаются на единицу, хотя сами эти числа могут и не быть целыми. Подставив эти выражения для / и g в D8) и собирая коэффициенты при г5, мы получим — cs-x — acs — (s + /) c's +—c's _ i = 0, — cs'_ i + ac's — (s - j) cs-h — cs-t = 0. E0) Умножая первое из этих уравнений на аъ второе на аг и вычитая, мы исключим как cs_x, так и c's_u потому что из D7) вытекает равенство — = —. Остается, следовательно, [аа -a,(s- /)] с, + [a.u + a(s + /)] c's = 0. E1) Это соотношение показывает связь между штрихованными и нештрихованными коэффициентами с. Краевые условия при г = 0 требуют, чтобы пра и г\рь стремились к нулю, когда г стремится к нулю так, что из D6) следует / и g-*- 0, когда r-v 0. Таким образом, ряд D9) должен обрываться со стороны малых s. Если s0 означает наименьшее значение s, при котором коэффициенты cs и c's не обращаются оба в нуль, то, полагая s = s0 и cSo_! = = с^ = 0, мы получаем из E0) '= 0 )
§ 72. ТОНКАЯ СТРУКТУРА УРОВНЕЙ ЭНЕРГИИ ВОДОРОДА 353 откуда следует равенство Так как краевое условие требует, чтобы минимальное зна- значение s было больше нуля, мы должны положить Для исследования сходимости рядов D9) мы определим отношение с5/с3_г для больших s. Из уравнения E1) и вто- второго уравнения E2) имеем приближенно при больших s a2cs = ac's и _ l l , scs —~rCs-i "Г 77" Cs — l! отсюда cs _ 2 cTi ~"as" Следовательно, ряд D9) будет сходиться подобно ряду y± Ls\ S равному еъ'1а. Этот результат аналогичен результату, полу- полученному в § 39, и, так же как и там, дает возможность за- заключить, что в том случае, когда Н' чисто-мнимое, т. е. когда, согласно D7), Н' > тс2, дозволены все значения а. Если же Н' < тс2, то, выбирая а положительным, мы нахо- находим, что дозволены только значения Н', для которых ряды D9) обрываются со стороны больших s. Если ряды D9) обрываются на членах cs и c'it так что Cs+i = c's+i = 0. то. заменяя в E0) s + 1 на s, получаем c + cs = 0, E3) В силу D7) эти два уравнения эквивалентны. В соединении с E1) они дают flj. [аа — а2 (s — /)] = а [а2а -f а (s -f /)]. Это соотношение с помощью D4) приводится к следующему: 2ахаф = a(aL — а2) ос.
356 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА Отсюда следует s 1/1 1 \ Н' а 2 \ а2 fli / ся Возводя в квадрат и пользуясь D7), мы получим , / , , Н'г\ 2 Я'2 Следовательно, A^ Здесь величина s, представляющая значок при последнем члене в ряду, должна быть больше, чем s0 на некоторое неотрицательное целое число. Обозначая это число через п, получим и, следовательно, Н' E4) Эта формула дает дискретные уровни энергии спектра водорода. Она была впервые получена Зоммерфельдом на основе боровской теории орбит. В формуле E4) содержатся два квантовых числа: пи/, но в силу малости а2 энергия зависит почти исключительно от п + | у |. Величины п и |у'|, дающие одно и то же я + I / |, приводят к системе уровней энергии, лежащих близко друг к другу. Если вы- вычесть из них постоянную величину, то эти уровни лежат близко к уровню энергии, определяемому нерелятивистской формулой (80) § 40 с s = п + | / |. Мы использовали уравнения E3), комбинируя их с E1), при этом, однако, уравнения E3) использовались не пол- полностью, так как не было учтено, что коэффициенты cs и c's в E1) могут оба обратиться в нуль. В этом случае мы по- получаем, умножая первый коэффициент на аъ второй на а и складывая, a (aL -f- a2) a -J- 2а1а2} = 0. Итак, / должно быть в этом случае отрицательно. С помощью D4) и D7) получаем далее 2/ а а 2тса Ъпс се ~~ а2 °i ~ й
§ 73. ТЕОРИЯ ПОЗИТРОНОВ 357 откуда Так как величина Н' должна быть положительна, то Н' Ур—и? /ге, ~ш = "ТЛ—" ( ^ Это совпадает со значением Н' из E4) при я = 0. Случай п = 0, / < 0 нуждается, таким образом, в дальнейшем ис- исследовании, а именно, в выяснении вопроса о том, удовлет- удовлетворены ли тогда условия E3). При п = 0 наибольшее значение s совпадает с наимень- наименьшим; поэтому уравнения E3), в которых вместо s подста- подставлено s0, должны быть в согласии с E2). Уравнение E5) дает в силу D4) и D7) 1 __ тс I. Ур — а2^ 1 тс а 1/1 Г а Я |/| ' так что первое из уравнений E3) с s0 вместо s приводится к виду A Это согласуется со вторым из уравнений E2), только если / положительно; таким образом, случай п = 0, / < 0 к ре- решению не приводит. Мы можем заключить, что для п = 0 / должно быть положительным целым числом, тогда как при других значениях п для числа / допустимы все ненулевые целые значения. § 73. Теория позитронов В § 67 было упомянуто, что волновое уравнение для электрона допускает вдвое больше решений, чем следовало бы, причем половина из них относится к состояниям с отри- отрицательными значениями кинетической энергии ср0 + еА0. Эта трудность появилась сразу же, как только мы перешли от уравнения E) к уравнению F), и она свойственна любой релятивистской теории. Она также встречается в классиче- классической релятивистской теории, но там она не является серь- серьезной. Вследствие непрерывности изменения всех классиче- классических динамических переменных, если кинетическая энергия ср0 + еА0 вначале положительна (для этого она должна быть
358 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА большей или равной тс2), то она не может потом стать отрицательной (для этого она должна была бы стать меньшей или равной —тс2). В квантовой теории, однако, возможны скачкообразные переходы, так что если электрон первона- первоначально находился в состоянии с положительной кинетиче- кинетической энергией, то он может перейти в состояние с отрица- отрицательной кинетической энергией. Поэтому становится невоз- невозможным игнорировать состояния с отрицательными энер- энергиями, как это можно делать в классической теории. Рассмотрим несколько ближе те решения уравнения \[Po + ~jAoj a^Pl , T/lij- — а* р.2-\— АЛ — оц рчА— АЛ — аттс \гЬ = 0, E6) \ с ] \ с 1 ) которые соответствуют отрицательной энергии. Для этой цели удобно воспользоваться таким представлением мат- матриц а, в котором все элементы матриц а:, а2 и а3 вещест- вещественны, а все элементы матрицы ат чисто-мнимы или нули. Такое представление может быть получено, например, из представления § 67 путем перестановки в (9) выражений для а2 и ат. Если записать уравнение E6) как матричное уравнение в этом представлении и заменить везде i на —i, то мы получим ^ = 0. E7) Здесь учтено, что величины D) содержат i. Таким обра- образом, каждому решению "ф уравнения E6) соответствует ксмплексно-сопряженное ty, являющееся решением уравне- уравнения E7). Далее, если решение тр уравнения E6) при- принадлежит отрицательному значению ср0 + еА0, то соответ- соответствующее решение гр уравнения E7) принадлежит положи- положительному значению ср0 — еА0. Но оператор в E7) может быть получен из оператора в E6) путем замены е на —е. Отсюда следует, что каждое решение с отрицательной энер- энергией уравнения E6) является комплексно-сопряженным к ре- решению с положительной энергией того волнового уравнения, которое получается из E6) заменой е на —е. Последнее же решение описывает электрон с зарядом -\-е (вместо —е,
§ 73. ТЕОРИЯ ПОЗИТРОНОВ 359 как было до сих пор), движущийся в электромагнитном поле. Итак, нежелательные решения E6) связаны с движением электрона с зарядом +е. (При наличии произвольного электромагнитного поля невозможно,разумеется, строго раз- разделить решения E0) на те, которые относятся к поло- положительным значениям ср0 + еА0, и те, которые относятся к отрицательным значениям. В самом деле, такое разделение означало бы, что переходы от одного вида к другому невоз- невозможны. Поэтому вышеизложенные соображения являются приближенными, применимыми к случаю, когда такое разде- разделение приблизительно возможно.) Таким образом, мы приходим к выводу, что соответст- соответствующие отрицательные энергии решения уравнения E6) от- относятся к движению нового сорта частиц, имеющих массу электрона и противоположный заряд. Такие частицы наблю- наблюдались экспериментально и названы позитронами. Мы не мо- можем, однако, просто утверждать, что решения с отрицатель- отрицательной энергией представляют позитроны; это сделало бы неправильными все динамические соотношения. Например, определенно неверно, что позитрон имеет отрицательную кинетическую энергию. Мы должны поэтому строить теорию позитрона на несколько ином основании. Мы введем пред- предположение, что почти все состояния с отрицательной энергией заняты, причем в соответствии с принципом Паули в каждом состоянии имеется один электрон. Незанятое со- состояние с отрицательной энергией будет выглядеть, как нечто с положительной энергией, так как для того, чтобы уничтожить его, т. е. заполнить, мы должны добавить к нему электрон с отрицательной энергией. Мы предположим, что незанятые состояния с отрицательной энергией являются позитронами. Эти предположения требуют распределения электронов с бесконечной плотностью во всем мире. Абсолютный вакуум есть область, в которой все состояния с положительной энергией свободны, а все состояния с отрицательной энер- энергией заняты. В абсолютном вакууме должно быть, очевидно, справедливо уравнение Максвелла divS = 0. Это значит, что бесконечное распределение электронов с отрицательной энергией не влияет на электрическое поле. Только отклонение от распределения в вакууме будет влиять
360 ГЛ. XI. РЕЛЯТИВИСТСКАЯ ТЕОРИЯ ЭЛЕКТРОНА на электрическую плотность /0 в уравнении Максвелла divg=4n/0. E8) Каждое занятое состояние с положительной энергией бу- будет вносить вклад — е, а каждое незанятое состояние с от- отрицательной энергией вклад + <?. Благодаря принципу Паули электрон с положительной энергией удерживается обычно от перехода в состояние с отрицательной энергией. Однако возможен еще переход такого электрона в незанятое состояние с отрицательной энергией. В этом случае мы имели бы одновременное исчез- исчезновение электрона и позитрона с испусканием энергии в форме излучения. Обратный процесс состоял бы в рожде- рождении позитрона и электрона из электромагнитного излучения. Из симметрии между занятыми и свободными состояния- состояниями фермионов, которая обсуждалась в конце § 65, следует, что данная теория существенно симметрична относительно позитронов и электронов. Мы имели бы эквивалентную теорию, если предположили бы, что основными части- частицами являются позитроны, описываемые волновым урав- уравнением A1), в котором вместо —е стоит е, и предположили бы затем, что все состояния позитронов с отрицательной энер- энергией заняты. Тогда дырка в распределении позитронов с от- отрицательной энергией толковалась бы как электрон. Такую теорию можно было бы развить в согласии с гипотезой, что все физические законы симметричны относительно электро- электронов и позитронов *). *) Изложенная ь § 73 теория была развита Дираком еще до откры- открытия позитрона и по существу представляла собой предсказание существо- существования античастиц. Это — один из самых сильных и нетривиальных ре- результатов синтеза квантовой механики и теории относительности. В ходе дальнейшего развития физики элементарных частиц было установлено, что античастицы существуют как у фермионов, так и у бозонов. Для объяснения существования античастиц у бозонов теория, изложенная здесь, недостаточна, так как для бозонов принцип Паули не ограни, чивает числа частиц в одном состоянии, (Прим. персе.)
ГЛАВА XII КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА § 74. Электромагнитное поле в отсутствие вещества Теория излучения, развитая в гл. X, содержала некото- некоторые пренебрежения в трактовке взаимодействия излучения с веществом. Задача настоящей главы состоит в том, чтобы устранить эти пренебрежения и получить, насколько это возможно, точную теорию электромагнитного поля, взаимо- взаимодействующего с веществом, причем вещество считается со- состоящим только из электронов и позитронов. О других формах вещества — протонах, нейтронах и др. известно слишком мало, для того чтобы пытаться в настоящее время построить точную теорию их взаимодействия с электромаг- электромагнитным полем. Точная же теория электронов и позитронов существует в той форме, как она изложена в предыдущей главе. Эту теорию и можно использовать для построения точной теории взаимодействия электромагнитного поля с этим видом вещества. Теория должна позволить вывести кулоновское взаимодействие электронов и позитронов друг с другом и их взаимодействие с электромагнитным излу- излучением и должна, разумеется, согласоваться с частной тео- теорией относительности. Для краткости мы в этой главе бу- будем считать с = 1. Прежде всего следует рассмотреть электромагнитное поле без взаимодействия с веществом. В § 63 уже рассма- рассматривалось поле излучения без взаимодействия с веществом. Для описания поля были введены динамические переменные и для них были установлены перестановочные соотношения; кроме того, был найден оператор Гамильтона, который давал правильную зависимость от времени этих динамических пе- переменных. При этом не было сделано никаких пренебреже- пренебрежений. Полученная теория могла бы поэтому рассматриваться как удовлетворительная точная теория излучения, не взаи-
362 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА модействующего с веществом, если бы не одно обстоятель- обстоятельство — предположение о том, что скалярный потенциал ра- равен нулю. Это обстоятельство нарушает релятивистскую форму теории и -делает ее неподходящей в качестве исход- исходного пункта для развития точной теории электромагнитного поля, взаимодействующего с веществом. Мы должны, следовательно, обобщить построение § 63, сохранив потенциал Ло п рассматривая его наравне с дру- другими потенциалами Аъ Л2, Л3. Следовательно, будет четыре Лц, и они будут удовлетворять уравнению, являющемуся обобщением F2) § 63, а именно: ПЛ^ = 0, A) Мы не будем пока обращать внимание на второе из этих уравнений и рассмотрим только первое. Из уравнения A) следует, что каждая компонента Лц может быть разложена на волны, распространяющиеся со скоростью света. В соответствии с уравнением F3) § 63 мы имеем поэтому Л^ (х) = \ (Афе1^ + А^е- ik-x) d'k, C) где к.х означает четырехмерное скалярное произведение причем кп — четырехмерный вектор, пространственные ком- компоненты которого совпадают с компонентами трехмерного вектора к § 63, а временная компонента равна к0 = |к|; символ d3k означает, как и в § 63, &кхйк^къ. Компонента Фурье А^ имеет часть Лоь, происходящую от Л0 (х), и часть Аги (г = 1,2, 3), представляющую собой трехмерный вектор. Последний можно разложить на две части: продольную, лежащую в направлении к, т. е. в на- направлении распространения волны, и поперечную, перпен- перпендикулярную к. Продольная часть равна k k Поперечная же часть равна lsk=^k. D)
§ 74. ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ОТСУТСТВИЕ ВЕЩЕСТВА 363 Она удовлетворяет соотношению krerfrk = 0. E) Из максвелловской теории света известно, что только поперечная часть существенна для электромагнитного излу- излучения. Глава X относится только к этой поперечной части, причем величина Аги, рассмотренная в § 63, есть то же самое, что вновь введенная величина Аги, а уравнение F5) § 63 соответствует уравнению E) настоящей главы. Тем не менее в полной электродинамической теории продольной частью пренебрегать нельзя, так как продольная часть свя- связана с кулоновскими силами (это будет показано ниже). Теперь можно разложить трехмерный вектор Аг (х) на две части: поперечную часть, имеющую только поперечные компоненты Фурье, и продольную часть, имеющую только продольную компоненту Фурье. Поперечная часть равна &tr (х) = J ?г и удовлетворяет соотношению a^fW=0. F) Продольная часть может быть представлена как градиент скаляра V, определяемого выражением V = i J || (Askeik-X - Aske~ik-X) d3k. G) Следовательно, имеем Л, = ^ + Ц. (8) Магнитное поле определяется поперечной частью Аг Величину Ао (х) удобно причислять к продольным вели- величинам, так что полный потенциал А]Х (х) делится на попереч- поперечную часть от€г (х) и продольную часть, состоящую из Ао и из dV/dxr. Это разделение, разумеется, относится к одной определенной лоренцевой системе отсчета и не должно использоваться там, где желательно сохранить релятивист- релятивистскую форму уравнений. Каждый коэффициент Фурье Лйк встречается в C) в ком- комбинации с временным множителем е'*0*». Произведение (9)
364 ГЛ. Х1Г. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА образует гамильтонову динамическую переменную в класси- классической механике и гейзенбергову динамическую переменную в квантовой механике. Вычислим СП для этих переменных. Результаты § 63 дают нам СП для поперечной части A^kt. Для того чтобы установить соответствие с этими результа- результатами, перейдем к дискретным значениям вектора к в трех- трехмерном пространстве с координатами kxkyk2 и рассмотрим в качестве примера такое значение к, для которого kt = kz= — О, k3 = k0 > 0. Тогда поляризационная переменная 1 мо- может иметь два значения, относящиеся к двум направлениям 1 и 2. Из уравнений G3) § 63 с учетом перестановочных соот- соотношений A1) § 60 для операторов т} и т), вытекает тогда [Аш, Alkt] = [Aibt, Aik,] = — isk/in%. A0) Результаты § 63 не дают никаких сведений о величинах Askt и AOkt. Можно, однако, получить СП для величин А3ы и Аоы из соображений теории относительности. Соотношения A0) могут быть записаны в релятивистском виде. Единственный простой способ, которым это можно сделать, состоит в том, чтобы добавить к ним еще два соотношения [А3к>, A3kt] = — [A0kt, Aw] = — isk/in2k0. (llj Четыре уравнения A0) и A1) вместе с условием, что при (я =5^= v величины Avikt и Avkt коммутируют (они должны ком- коммутировать, поскольку они относятся к разным степеням свободы), можно объединить в одно тензорное уравнение [А»к1, Лук/] = tenvSk/4jT2&0. A2) Таким образом, мы получили СП для всех динамических переменных. Уравнение A2) можно обобщить, написав . A3) Вернемся к случаю сплошного спектра величины к. Для того чтобы преобразовать бкк' к случаю сплошного спектра величины к, заметим, что для произвольной функции / (к) в трехмерном пространстве к имеет место соотношение (k-k')d8ft, (И) где б (к —к') — трехмерная дельта-функция, определяемая равенством б (к - к') = 8 (к, - к[) б (kt - К) б (к, - %).
§ 74. ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ В ОТСУТСТВИЕ ВЕЩЕСТВА 365 Для того чтобы равенство A4) согласовалось с общей фор- формулой, связывающей сумму и интеграл (уравнение E2) § 62), нужно положить Sk6kk' = S(k-k'). A5) Таким образом, соотношение A3) принимает вид [A*, ^vw] = ^v~a(k-k'). A6) Это уравнение совместно с уравнениями ^ = 0 A7) определяют СП в теории, оперирующей со сплошным спек- спектром к. Следует отметить, что эти соотношения остаются справедливыми, если опустить индекс t, так что они будут относиться к постоянным коэффициентам Фурье А^, Ахь. Определим теперь оператор Гамильтона из условия, чтобы в гейзенберговской картине он приводил к той зави- зависимости каждой динамической переменной А^м от времени t ¦= х0, какую дает формула (9) при А^к постоянном. Обо- Обозначив этот оператор через Н, мы, таким образом, требуем, чтобы было [/W fff] = % = 'V*. A8) Легко видеть, что это соотношение удовлетворяется, если положить HF = — \n*\klAmAUzk, A9) которое мы примем в качестве оператора Гамильтона для электромагнитного поля в отсутствие вещества (с точностью до аддитивной постоянной, не содержащей динамических переменных). В § 63 мы воспользовались свойствами поперечной части оператора Гамильтона для того, чтобы определить СП для поперечных переменных. Здесь мы поступили в обратном порядке, именно, из СП для продольных переменных, уста- установленных на основании соображений релятивистской инва* риантности, мы нашли часть оператора Гамильтона, относя- относящуюся к этим переменным, требуя, чтобы удовлетворялось уравнение A8).
366 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Выпишем подробно оператор Гамильтона A9) НР = 4я2 \ k\ (А1ЫА1к/ + АмАм + A3utAaut - A^A^t) d3k. Поперечная часть первых трех членов в подынтегральном выражении в точности равна поперечной энергии G1) § 63. Последний член в подынтегральном выражении, представля- представляющий собой ту часть Hf, которая откосится к скалярному потенциалу /1„, входит со знаком минус. Этот отрицатель- отрицательный знак вытекает из требований теории относительности и означает, что динамическая система, образованная пере- переменными Aokt, AOkf, представляет собой гармонический ос- осциллятор с отрицательной энергией. Кажется несколько странным, что такое нефизическое понятие, как отрицатель- отрицательная энергия, входит в теорию подобным образом. Мы уви- увидим, однако, в §77, что отрицательная энергия, относящаяся к степеням свободы, связанным с Ао, всегда компенси- компенсируется положительной энергией, относящейся к другим про- продольным степеням свободы, так что она практически никогда не проявляется. § 75. Релятивистская форма квантовых условий Теория, развитая в предыдущем параграфе, содержит релятивистские уравнения поля, именно, уравнения A). Для того чтобы установить, что теория полностью удовлетворяет требованиям теории относительности, мы должны показать, что им удовлетворяют перестановочные соотношения. Это вовсе не очевидно из равенства A6), где СП написаны для компонент Фурье. Релятивистскую форму перестановочных соотношений мы получим, вычислив СП [Аи (х), Av (x')], где х и х — любая пара точек в пространстве-времени. Предварительно мы должны, однако, рассмотреть некоторую инвариантную сингулярную функцию, определенную в про- пространстве-времени. Функция б (ХуХУ), очевидно, инвариантна относительно преобразований Лоренца. Она обращается в нуль везде, кроме светового конуса с вершиной в начале координат, т. е. кроме трехмерной гиперповерхности х^хР = 0. Этот световой конус состоит из двух различных частей: буду- будущего, для которого х0 > 0, и прошедшего, для которого х0 < 0. Функция, равная 8 (х^х11) для будущего и равная —б (ХрХ*1) для прошедшего, также инвариантна относительно
§ 75. РЕЛЯТИВИСТСКАЯ ФОРМА КВАНТОВЫХ УСЛОВИЙ 367 преобразований Лоренца. Эта функция, равная 6 (ХмХ^) -рЧ» играет важную роль в теории полей, так что мы введем для нее специальное обозначение. Мы положим ^ B0) Эта формула определяет функцию А для любого четырех- четырехмерного вектора х. Принимая во внимание (9) § 15, мы можем выразить б (х^) в виде б №) = -1 х j-1 {6 (х0 - | х 1) + б (х0 + | х |)}, B1) где |х|—длина трехмерной части х^. Тогда А (л:) при- принимает вид А(х) = |х|-1{б(х0-|х|)-б(х0-]х|)}. B2) По определению А (х) равно нулю в начале координат, и очевидно, что А(—х) = — А(х). Разложим функцию А (х) в интеграл Фурье. Обозначая dxudxxdx^dx% через d^x и dxxdx^dxz через сРх, получим для любого четырехмерного вектора ) = \ | х |-i {б (*„ - [ х |) - б (*„ +1 х | = J | xI {e"»i d3x. Вводя полярные координаты |х |, 8, ф в трехмерном простран- пространстве хгх^ха с полярной осью вдоль трехмерной части k^, имеем А (х)eikx \x\sinQ sin Q rfe == ОЭ = 2m|kj- 4Jt2t i kj-1 {S(й0 — 1 k i) — = 4tc2 iA(/e). B3)
368 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Таким образом, коэффициентом Фурье оказывается снова та же функция, но с множителем 4я2г. Меняя местами k и х в B3), получаем ^l(k)etk-xd4i. B4) Некоторые важные свойства А (х) могут быть легко выведены из ее разложения Фурье. Прежде всего фор- формула B4) показывает, что функция А (х) может быть пред- представлена совокупностью волн, движущихся со скоростью света. Для того чтобы выразить этот результат в форме уравнения, применим оператор ? к обеим частям B4). Мы получим D А (х) = - ~ J A (k) U elk-* d*k = ± J k^b. (k) &¦* d4t. Если учесть, что имеет место соотношение k^kPA (k) = 0, то отсюда получается D А (х) = 0. B5) Зто уравнение справедливо во всем пространстве-времени. Можно придать смысл значению QA (х) в точке, где А (х) имеет особенность, беря интеграл от uA (x) по малой области четырехмерного пространства, окружающей особую точку, и преобразуя его по теореме Гаусса к интегралу по трехмерной гиперповерхности. Уравнение B5) показывает, что интеграл по трехмерной гиперповерхности всегда ис- исчезает. На трехмерной гиперповерхности х0 = 0 функция А (х) к гл дА (х) обращается в нуль. Определим величину -д на этой гиперповерхности. Она, очевидно, равна нулю везде, за ис- исключением точки Xj = х2 = х3 = 0, где имеется особен- особенность. Эту особенность можно определить следующим обра- образом. Дифференцируя обе части B4) по х0, найдем
§ 75. РЕЛЯТИВИСТСКАЯ ФОРМА КВАНТОВЫХ УСЛОВИЙ 369 Полагая в обеих частях равенства х0 = О, получаем д (*) [ = дх0 >о = о ~'<кх> ^ = 4лб ^ б (*«) б (хз) = 4лб (х). B6) Таким образом, в точке xt — х2 = х3 = 0 имеется особен- особенность в виде обычной дельта-функции с коэффициентом 4л. Вычислим теперь выражение [А^ (х), Av (x')]. Из соот- соотношений C), A6) и A7) имеем fe' = i|g J J feo1 {e-'*-V*'-*' - в**-*е-«'.*'} х X8(k-k')d3kd3k' = •' {er-'*-(Jt-*')-e'*-(*-*')}d3A. B7) Здесь й0 определено так, что оно равно | k | и поэтому всегда положительно. Заменяя к на—к во втором члене подынтегрального выражения, находим, что B7) равно четырехмерному интегралу i S J Iк I {б (^о -! к!) - б (й0 +! к |)} *-«• (*-*'> d*A = где ^0 принимает все значения, как положительные, так и отрицательные. Пользуясь B4), мы получаем окончательно [А^х), Av(x')} = gilvA(x-x'). B8) Этот результат и показывает инвариантность СП относи- относительно преобразований Лоренца. Формула B8) означает, что потенциалы в двух точках пространства-времени коммутируют всегда, за исключением случая, когда линия, соединяющая эти точки, является нулевой, т. е. лучом света. Эта формула совместна с урав- уравнениями поля пЛц (х) = 0, так как, согласно уравнению B5), оператор П, примененный к правой части, дает нуль.
370 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА § 76. Шредкнгеровские динамические переменные Для того чтобы установить инвариантность квантовой теории поля относительности преобразований Лоренца, наи- наиболее подходящим является гейзенберговское представле- представление. Оно и было использовано в двух предыдущих парагра- параграфах. Но для рассмотрения конкретных примеров необхо- необходимо шредингеровское представление. Шредингеровское представление теории выглядит далеко не релятивистским, так как оно относится к состоянию в определенный момент времени, так что шредингеровское представление сущест- существенно связано с определенной лоренцевой системой отсчета. Однако если с помощью гейзенберговской формы уже был установлен релятивистский характер теории, то можно не смущаться тем, что теория выглядит нерелятивистской в шредингеровской форме, поскольку известно, что эти две формы эквивалентны. Для того чтобы производить рассмотрение в шредин- шредингеровской форме, нужно ввести подходящие динамические переменные, которые бы описывали поле в данный момент времени. Как вытекает из уравнений поля A), задание вели- чин An. (х), —-з—для всех значении хг, х2, х3 и данного х0 достаточно для определения А^ при всех временах. Эти величины и могут быть поэтому взяты в качестве дина- динамических переменных в данный момент времени, а, тем самым, и в качестве динамических переменных в шредин- шредингеровской картине. Положим Шредингеровскими переменными будут тогда АцХ и В^х (где х обозначает хъ хъ х3). Разложение Фурье этих переменных имеет, согласно C) и (9), вид А^=\(А^ + А»Ы)е-1^с1Ч | 3й/ Преобразование Фурье можно обратить и выразить вели- величины Лйк/ + Ар~ы и Лмк, — A^ut через А!1Х и Д1Х соот- соответственно. Таким образом, величины Аиы и А^ опре-
§ 76. ШРЕДИНГЕРОВСКИЕ ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ 37 1 деляются значениями Ау1Х и Бдх при всех х (и при данном х0). Поэтому в качестве динамических переменных в данный момент времени можно было бы использовать также вели- величины A\&t и A^ut, которые и могли бы служить в качестве другой возможной совокупности шредингеровских динами- динамических переменных. Если оперировать с переменными А^х и В^, то нужно знать СП для них. СП могут быть получены либо из раз- разложения Фурье C0), совместно с A6) и A7), либо из об- общего выражения B8). Второй путь приводит к результату быстрее. Полагая в B8) х'о — х0, мы получаем соотношение [А»х, Лта-] = 0. C1) Дифференцируя B8) по х0 и затем полагая х'о = х0, по- получим, учитывая B6), [В^, ^vx'] = 4n^v6(x-x'). C2) Наконец, дифференцируя B8) как по х0, так и по х'ъ и полагая затем х'о = х0, получим соотношение [Яцх, 5Vx'] = 0, C3) так как dJ,x = 0 Для хо = ®- Равенства C1)—C3) дают все СП для переменных АцХ и В^. Они показывают, что с точностью до численного множителя переменные ЛЙХ можно рассматривать как совокупность динамических коор- координат, а переменные BiXX — как сопряженные с ними им- импульсы, причем дельта-функция в правой части C2) стоит вместо символа 8 с двумя индексами ввиду того, что степени свободы рассматриваемой системы образуют бесконечное и притом непрерывное множество. Можно разложить, согласно (8) и F), величину Агх на поперечную и продольную части. То же самое можно сде- сделать и с величиной Вгх, причем получится соотношение Вг = ^г + д~, C4) где величины &®г удовлетворяют равенству f^O. C5) Если в формуле G) заменить во втором члене подынте- подынтегрального выражения к на — к, то получится V = i J № {Ам + Л,,_к/) е-'<кх> d% C6)
372 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА В силу того, что U = dV/dx0, соответствующее уравнение для U напишется U = — \ksk?(Aski-As,-kt)e-t<Md3k. C7) Электрическое поле дается выражением br = — Br-Wr = — ^r gj—• C8) Следовательно, div8 = -^-VM0 = -V»D0 + ?/). C9) Очевидно, что любая продольная переменная коммутирует с любой поперечной переменной. Мы выведем также не- некоторые полезные перестановочные соотношения. Будем пользоваться для любой функции поля fx обозначениями Если положить в C2) [i = г, v = s и продифференцировать по хг, то получится [#х, Аа>] = 4"я^„бг (х - х') = - 4лб5 (х - х'), откуда, согласно C9), вытекает [div8x, Л„-] = 4я6*(х-х'). D1) Соотношение C9) показывает, что div 8 является функцией только от продольных переменных, так что из D1) следует [div gx, Ух'] = 4лб5 (х - х') = — 4лб5' (х - х'). Интегрируя это соотношение по x's, получаем [div8x, Ух.] = —4пб(х-х'), D2) причем постоянная интегрирования отсутствует, так как функции поля 8Х и Ух составлены из волн с отличной от нуля длиной волны. Из D2) и C9) имеем V2[^x, Ух-]=4л8(х-х'). Интегрируя с помощью формулы G2) § 38, получаем [Ux, Уж.] = -|х-х'1-\ D3)
§ 76. ШРЕДИНГЕРОВСКИЕ ДИНАМИЧЕСКИЕ ПЕРЕМЕННЫЕ 373 причем в правой части нет ни постоянной интегрирования, ни других членов, не исчезающих на бесконечности, по- поскольку Ux и Vx складываются из волн с длиной волны, отличной от нуля. Из C8) и D3) имеем [&„, V.0 = -[?/;. Vx] = -{xr-x'r)\x-x'\-\ D4) Выразим теперь оператор Гамильтона через перемен- переменные ЛцХ и Бцх- Из второго уравнения C0) имеем X е-'<кх>е~«к'х> dsk d3k' d3x = — 8л3$ J ife^J(Л^ - Лд,_к,) X X (Л&< - ЛИк'/) б (к + к') d3* d3yfe' = - - 8jx3 $ ftj (Л„ь, - Лд. -к,) Ulik, - ЛЬ) d3fe. Аналогично из первого уравнения C0) имеем X (Л^ + ЛИк'<)в~'(кх>е~'(к'х) d"kd3k'd'x = = 8л3 ^ ^ (Лдк, + Лд. _ы) (Л^к, + ЛИ d*k. Складывая и деля на — 8л, получим = -2ла $ AJ (Л №иЛЬ + Лц.-к^и) d3ft. Это совпадает с выражением A9) для Я/? с точностью до бесконечного численного слагаемого. Поскольку формула A9) уже содержит произвольное численное слагаемое, мы можем положить В* + А^) d\ D5) где произвольное слагаемое уже не то, какое входит в фор- формулу A9). Оператор Гамильтона D5), разумеется, может быть использован для получения гейзенберговских уравнений движения, причем произвольное численное слагаемое не будет играть никакой роли.
374 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА При помощи C1)—C3) легко проверить справедливость равенств \ D6) дВ,, которые согласуются с B9) и A). Оператор D5) дает также шредингеровское уравнение движения для вектора | Р), представляющего состояние в шрединге- ровской картине. Произвольное численное слагаемое в Нр приводит лишь к умножению вектора | Р) на физически не- несущественный фазовый множитель. Выражение D5) для Нр может быть разложено на попе- поперечную часть НрТ и продольную часть HFi. Из C4) имеем \ BrBr d3x = I {33 г + Ur) {33 г + Ur) <Px = = \S3rS3rdzx + \UrUr d?x. Перекрестные члены исчезают, поскольку в силу C5) имеет место равенство \ Ur33r d3x = — ] US3r d'x = 0. Аналогично из (8) имеем $ AsrAsr d'x = $ <^\а,Гг dh + $ VrsVrs d*x, причем перекрестные члены опять исчезают. Таким образом, выражение D5) принимает вид где НРТ = (8я)~' \ iS3rS3r + e?sMf) dzx D7) и HFL = (8л)-1 \ (UrUr + VrsVrs - В0В0 - АГЛ) ctx. D8) Следует отметить, что член
§ 77. ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ в Нрт может быть преобразован к виду: /Qtt\—1 С j? v^s^ /7^v /Qtt\ ^ С ^,^? ( #ss — I ОЛ J \ S^ rQ/C r U X = — uJll \ QsC r \QXU r — { — оУо s) (* X == (ojx) 375 что как раз представляет собой магнитную энергию. Поль- Пользуясь формулой \VrsVrsdsx = \VrrVssdH, получаемой в результате интегрирования по частям, можно привести выражение D8) к виду Нп = (8л) J {(U - Л0У (U + Аоу + }dsx. D9) § 77. Дополнительные условия Мы должны теперь вернуться к уравнению Максвелла B), которого мы пока не учитывали. Это уравнение нельзя непосредственно перенести в квантовую теорию, так как при этом возникает противоречие. Согласно квантовым усло- условиям B8), левая часть уравнения B) не коммутирует с опе- оператором Av (x'), так что она не может обращаться в нуль. Способ, с помощью которого можно обойти эти трудности, был указан Ферми *). Он состоит в принятии, вместо B), менее жесткого условия, а именно: 0, . E0) причем это условие должно выполняться для любого кет-ве- ктора | Р), который соответствует состояниям, существую- существующим в природе. Для каждой точки пространства-времени имеется свое уравнение вида E0), и эти уравнения должны все выпол- выполняться для произвольного вектора, соответствующего физи- физически возможному состоянию. Будем называть условие типа E0), которому должен удо- удовлетворять вектор, соответствующий действительному состо- состоянию, дополнительным условием. Существование дополни- *) Е, Fermi, Reviews of Mod. Phys., 1932, v. 4, p. 125,
376 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА тельных условий в данной теории не означает какого-либо отступления от общих принципов квантовой механики или модификации этих принципов. Принцип суперпозиции и вся общая теория состояний динамических переменных и наблю- наблюдаемых в том виде, как она изложена в гл. II, будут при- применимы также и в том случае, когда имеются дополнитель- дополнительные условия, если только наложить на линейный оператор, долженствующий представлять наблюдаемую, следующее требование. .Уы определим линейный оператор как физиче- физический, если в результате его действия на кет-вектор, удовлет- удовлетворяющий дополнктельнкм условиям, получается другой кет, также удовлетворяющий дополнительным условиям. Для того чтобы линейный оператор мог представлять наблю- наблюдаемую, он, очевидно, должен быть физическим; это требо- требование добавляется к требованиям § 10. Мы уже имели пример дополнительных условий в теории систем, содержащих несколько одинаковых частиц. Мы имели там условие, что только симметричные или только антисимметричные волновые функции представляют состо- состояния, действительно встречающиеся в природе. Это есть условие точно такого.же типа, как и E0), и оно подходит под только что данное определение дополнительного условия. В теории систем одинаковых частиц требование, чтобы линейный оператор был физическим, означает, что он дол- должен быть симметричным по отношению к одинаковым час- частицам. Когда в теорию введены дополнительные условия, то нужно проверить, что они согласуются друг с другом, т. е. что они не являются настолько жесткими, что им нельзя удовлетворить. Если имеется более чем одно дополнитель- дополнительное условие, то из них можно вывести еще другие условия, составляя СП для входящих в них операторов. Так, если имеются уравнения U\P) = 0, 1/|Р> = 0, E1) то можно вывести из них как следствие уравнения [U, F]|P)=0, [U,[U, V]\\P) = 0 E2) и т. д. Для того чтобы убедиться в совместности допол- дополнительных условий, мы должны рассмотреть все дополни- дополнительные условия, получаемые подобным путем, и показать, что, начиная с некоторого места, все дальнейшие дополни-
§ 77. ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ 37? тельные условия либо удовлетворяются тождественно, либо являются повторением предыдущих. Нужно также убедиться в том, что дополнительные усло- условия согласуются с уравнениями движения. В гейзенбергов- гейзенберговской картине, для которой кет-вектор состояния | Р) в E1) фиксирован, мы будем иметь различные дополнительные условия, относящиеся к различным временам, и они все должны быть совместны в том смысле, который был разъяс- разъяснен выше. В шредингеровской картине, где кет \ Р) ме- меняется со временем согласно уравнению Шредингера, мы потребуем, чтобы вектор | Р) удовлетворял дополнитель- дополнительному условию всегда, если он удовлетворяет ему в началь- начальный момент. Это означает, что дополнительным условиям должно удовлетворять выражение ^ 1^}, т. е. что им дол- должен удовлетворять кет-вектор Н \Р)\ значит оператор Н должен быть физическим. В том случае, когда имеется дополнительное условие вида U | Р) = 0, будем писать для удобства Ь'^0 E3) и называть E3) слабым равенством, в отличие от обычного или сильного равенства. Слабое равенство дает другое сла- слабое равенство, если умножить его на некоторый множитель слева, но не приводить, вообще говоря, к правильному урав- уравнению при умножении справа. Следовательно, слабое равен- равенство нельзя использовать при вычислении СП. Условие со- совместимости дополнительных условий (т. е. равенство E2)) может быть формулировано как требование, чтобы СП динамических переменных с каждым из операторов, входя- входящих в дополнительные условия, обращались в нуль слабым образом. Для того чтобы динамическая переменная ? была физи- физической, нужно, чтобы для каждого дополнительного усло- условия U | Р) — О имело место соотношение */?!/>> = о, откуда [и, б]Ю = о. Таким образом, СП динамической переменной с каждым опе- оператором, входящим в дополнительные условия, должна об- обращаться в нуль слабым образом.
378 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Вернемся теперь к электродинамике. Будем считать урав- уравнение B) слабым, так что его следует писать в виде В гейзенберговской картине для каждой точки х имеется одно такое уравнение. Для того чтобы проверить совме- совместность уравнений, возьмем две произвольные точки х и х' в пространстве-времени и образуем СП V (х) дАх (х Принимая во внимание B8) и B5) и производя вычисление, получим для СП равенство g d** (*-*') = _ q д (д. _ х') = о, так что требование совместности выполняется сильным обра- образом. Поскольку установлена совместность дополнительных условий во все моменты времени в гейзенберговской кар- картине, то тем самым доказана согласованность дополнитель- дополнительных условий с уравнениями движения. Так как соотношение E4) является лишь слабым уравне- уравнением, любое его следствие, имеющее место в теории Мак- Максвелла, будет справедливо в квантовой теории только как слабое уравнение. Уравнения являются следствиями определения S и 3FC через потенци- потенциалы, так что в квантовой теории они выполняются сильным образом. Остальные максвелловы уравнения для вакуума, именно divS^O, -J-^rotJC E5) являются в квантовой теории слабыми уравнениями, по- поскольку для их вывода нужно пользоваться не только урав- уравнением A), но и соотношением E4). Напряженности полей 8 и К являются компонентами антисимметричного тензора -^ ^-. СП тензора с
§ 77. ДОПОЛНИТЕЛЬНЫЕ УСЛОВИЯ 379 оператором E4) в произвольной точке х равна f,-MvW dAv- (х)\ дАа (х'У\ __ dxv I дха Отсюда вытекает, что величины I и К являются физиче- физическими. Потенциалы же ЛA не являются физическими. Дополнительные условия, которым подчиняются дина- динамические переменные в некоторый определенный момент времени, имеют вид Дальнейшее дифференцирование по х0 не дает новых неза- независимых уравнений, а дает лишь уравнения, являющиеся следствием E6) и сильного уравнения A). Будучи выражен- выраженными через шредингеровские переменные § 76, дополни- дополнительные условия имеют вид ^0, E7) ^0. E8) Уравнение E8) есть то же самое, что первое из уравне- уравнений E5) и может быть также записано с помощью C9) в виде vz(Ao + U)^0. Так как оно выполняется во всем трехмерном пространстве, то из него следует A0 + U^0. E9) Замечая, что Arr = Vr, можно вывести из D9) соотно- соотношение HPL ^ 0. F0) Таким образом, для состояний, встречающихся в природе, энергия продольного поля отсутствует. Для того чтобы установить удобное представление, вве- введем стандартный кет | 0F), удовлетворяющий дополни- дополнительным условиям
380 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА а также удовлетворяющий соотношению F2) Эти условия совместны, потому что оператор е^гк комму- коммутирует с операторами в F1); они достаточны для полного определения вектора | Of) с точностью до числового мно- множителя, потому что единственными независимыми динамиче- динамическими переменными, которые мы имеем, являются величины AQ,B0, U, Агг, ,@^гк,Агк, а составленные из них комбинации Ао + U, Во + А'г, е^гкобразуют полный набор коммутирую- коммутирующих переменных. Исходя из этого стандартного кет-вектора, мы можем выразить любой кет в виде Во, &*г*)\0г). F3) Это представление есть как раз фоковское представление по отношению к понеречным динамическим переменным 3sfrk, e^>k, так что W должно быть степенным рядом по перемен- переменным es?ru, причем различные члены ряда соответствуют раз- различным числам фотонов. Переменные, входящие в ?, обра- образуют непрерывное бесконечное множество, и, таким обра- образом, 4я есть то, что математики называют «функционалом». Если кет F3) удовлетворяет нашим дополнительным условиям, то W не должно зависеть от Ао и Во, и должно быть функцией только от &?гк. Таким образом, физические состояния представляются кет-векторами вида P), F4) где 4я есть степенной ряд по переменным &#гк. Сам по себе стандартный кет | 0Р) представляет физическое состояние без фотонов, т. е. абсолютный вакуум. До сих пор наш оператор Гамильтона HF и его части HFT, Hfi содержали произвольные численные слагаемые. Удобно выбрать эти последние так, чтобы Hfl и Нгг давали нуль для абсолютного вакуума. Результат F0) показывает, что в выражениях D8) или D9) для HFl числовое слагаемое выбрано правильно и именно так, что Hpi равно нулю для абсолютного вакуума так же, как и для любого другого фи- физического состояния. В качестве HFT следует взять выра- выражение \1% F5)
§ 78. ЭЛЕКТРОНЫ И ПОЗИТРОНЫ В ОТСУТСТВИЕ ПОЛЯ 381 представляющее собой поперечную часть A9); этим дости- достигается исчезновение нулевой энергии фотонов. Выражение D7) отличается от F5) на бесконечное численное слагаемое, составленное из нулевых энергий по половине кванта энер- энергии на каждое фотонное состояние. § 78. Электроны и позитроны в отсутствие поля Рассмотрим теперь электроны и позитроны в отсутствие электромагнитного поля. Состояние электрона описывается, как в гл. XI, волновой функцией ф с четырьмя компонен- компонентами фа (а = 1,2, 3, 4), удовлетворяющей волновому урав- уравнению + Для того чтобы перейти к многоэлектронной теории, нужно применить метод вторичного квантования § 65, в котором одноэлектронная волновая функция заменяется совокуп- совокупностью операторов, удовлетворяющих определенным соот- соотношениям антикоммутации. Когда мы будем иметь дело со значениями ф в разных точках в данный момент времени, мы будем писать фх> где х означает хх, хг, х3. Компоненты фх будут фах. Переход к импульсному представлению, характеризуемому волновой функцией фр, достигается с помощью трехмерного разло- разложения Фурье Функция фр имеет четыре компоненты фар, соответствующие четырем компонентам фах. В этом представлении оператор энергии имеет вид ро = агрг-\-атт, где действие операторов импульса рг сводится к умножению. Можно разбить ф на положительно-энергетическую часть \ и отрицательно-энергетическую часть ?> причем каждая имеет четыре компоненты подобно самой функции ф. В им- импульсном представлении величины | и ? равны б I
382 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА В самом деле, эти уравнения приводят к соотношениям — , , . , 2 Отсюда видно, что ?р и ?р являются собственными функ- функциями оператора р0 с собственными значениями (р2 + /и2I/» и —(р2 + т2)*1* соответственно. При вычислениях с опера- операторами (p»+m*) следует иметь в виду, что квадраты их равны им самим, а их произведения в любом порядке равны нулю. Вторичное квантование превращает функции г|) в опера- операторы, аналогичные операторам т] § 65 и удовлетворяющие соотношениям антикоммутации вида A1) § 65. Пользуясь обозначением для антикоммутатора MN + NM = [M, N]+, F9) имеем { Функция б (х — х') появляется в последнем уравнении вследствие того, что х меняется непрерывно. После преобра- преобразования к импульсному представлению, согласно F7), получаем [tap %p']+ = 0 Йар гр4р']+ = °» | - J Для величин | и ^, определяемых выражениями F8), по- последнее из уравнений G1) дает LSaP> ЬЬр'\+ — , asP's+amm\ G2)
§ 78. ЭЛЕКТРОНЫ И ПОЗИТРОНЫ В ОТСУТСТВИЕ ПОЛЯ 383 а также [U, ^']+ = -A -(p2 + m2)v2}a/(P-P ) G3) и Liapi Sup'J+== [gopi ЬЬр']+ = 0. Согласно толкованию § 65 операторы ifnp представляют операторы аннигиляции электрона с импульсом р, atj)ap — операторы рождения электрона с импульсом р. Для того чтобы избежать нефизического понятия электронов с отри- отрицательной энергией, нужно перейти к новой интерпретации, основанной на теории позитронов § 73. Аннигиляцию элек- электрона с отрицательной энергией следует понимать как образование дырки в море электронов с отрицательной энергией, т. е. как образование позитрона. Таким образом, операторы ?пр становятся операторами рождения позитрона. Позитрон имеет импульс — р, поскольку импульс р уничто- уничтожается. Аналогично ?яр становится оператором аннигиля- аннигиляции позитрона с импульсом — р. Величины |„„ и ?ар явля- являются операторами аннигиляции и соответственно рождения обычного электрона с положительной энергией и импуль- импульсом р. Следует отметить, что хотя ?р имеет четыре компоненты, только две из них являются независимыми; в самом деле, четыре компоненты связаны соотношением ll_arPr+a m I (p2 + m2)' приводящим к двум независимым уравнениям. Две независи- независимые компоненты ?„ соответствуют аннигиляции электрона в каждом из двух независимых спиновых состояний. Ана- Аналогично ?р имеет только две независимые компоненты в силу соотношения и они соответствуют рождению позитрона в двух незави- независимых спиновых состояниях. Состояние вакуума, в котором нет ни электронов, ни позитронов, представляется кет-вектором | 0р), удовлет- удовлетворяющим условиям U|0p) = 0, U|0p> = 0. G4)
384 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Этот вектор может быть использован в качестве стандарт- стандартного кет-вектора данного представления. Тогда любой кет может быть выражен в виде YflU U)|0p>, где функция, или, вернее, функционал W, является степен- степенным рядом по переменным ?ар, ?ар. Каждый член в W ана- аналогичен A7') § 65. Он не должен содержать какую-либо из переменных в степени выше первой. Каждый член со- соответствует существованию некоторого числа электронов (с положительной энергией) и некоторого числа позитронов в состояниях, характеризуемых индексами при переменных. Согласно формуле A2) § 65 полное число электронов равно интегралу § фар'Фар d3p, просуммированному по а. Если пользоваться теми же обозначениями, что в уравне- уравнении A2) § 67, это число можно записать в виде JiJ)piJ)pd3p. Переходя с помощью F7) к координатному представлению, имеем И S d3x' d3p = $ фЭД>х d*x. откуда видно, что плотность электронов есть if^x. Это вы- выражение включает бесконечную постоянную, представляю- представляющую плотность моря электронов с отрицательной энергией. Более непосредственный физический смысл имеет полный заряд Q, равный разности числа электронов с положитель- положительной энергией и числа дырок или позитронов, умноженной на —е. Мы имеем Q = -e\m,-tilP)d% G5) Можно преобразовать это выражение с помощью уравне- уравнений F8). Транспонируя второе из этих уравнений, имеем Используя это соотношение, получаем для Q выражение
§ 78. ЭЛЕКТРОНЫ И ПОЗИТРОНЫ В ОТСУТСТВИЕ ПОЛЯ 385 Далее, для любой матрицы а, у которой сумма диагональ- диагональных элементов равна нулю, соотношения антикоммутации G1) дают = «аа6(р-р')=0. G6) Можно считать, что этот результат остается в силе и в точке р' = р. Следовательно, выражение для Q сводится к Переходя к координатному представлению, получаем откуда видно, что плотность заряда равна /ох — ггб(фхТ|>х — i|?xi|>x). G7) Интерпретация одноэлектронной волновой функции в § 68 дает наряду с плотностью вероятности 'ф+'ф также поток ве- вероятности ijrcc/ф. После вторичного квантования мы должны получить соответственный поток электронов с оператором $|>х+см|)х- Море электронов с отрицательной энергией в целом не создает потока электронов по соображениям симметрии, так что электрический ток равен jrx = — е№аг1рх. G8) Полная энергия электронов по формуле B9) § 60, спра- справедливой также для фермионов, равна Нр> = ] $;p0y>pd3p = J ijjp- (arpr + атт) %(Рр. G9) После преобразования к координатному представлению это выражение принимает вид Щ ) d3x. (80) Это выражение для полной энергии содержит бесконечное численное слагаемое, представляющее энергию моря элек- электронов с отрицательной энергией.
386 ГЛ XII КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Мы получим величину, имеющую больший физический смысл, если вычислим энергию всех электронов и пози- позитронов, считая энергию вакуума нулем. Эта величина равна НР = $ (р2 + m»)v. (i?p + ?&,) d*p. (81) Пользуясь выражениями F8), имеем = 3 (p2 + т*)"" 1 (^p + г|)^р) d3p. (82) В силу G6) первый член (82) совпадает с G9) и в точности равен НР'. Второй член является бесконечной постоянной и представляет собой взятую со знаком минус энергию всех электронов с отрицательной энергией в вакууме. В качестве оператора Гамильтона можно принять либо НР, либо Нр. Гейзенберговское уравнение движения для я|)ох имеет вид и если раскрыть выражения в правой части, то мы вер- вернемся как раз к уравнению F6) для г|з. Теперь нужно выяснить вопрос, является ли теория ре- релятивистской. Она построена из операторов tp, удовлетво- удовлетворяющих уравнениям поля F6). Эти уравнения совпадают с уравнением для одноэлектронной волновой функции и являются инвариантными относительно преобразований Лоренца при условии, что if> преобразуется по закону B0) § 68. Наша теория идет дальше одноэлектронной теории в том смысле, что в ней вводятся соотношения антикомму- антикоммутации для г|з и г|5, и поэтому возникает необходимость прове- проверить, инвариантны ли эти соотношения антикоммутации относительно преобразований Лоренца. Будем действовать по методу, аналогичному § 75. Вы- Выберем две произвольные точки х и х' в пространстве-
§ 78. ЭЛЕКТРОНЫ И ПОЗИТРОНЫ В ОТСУТСТВИЕ ПОЛЯ 387 времени и образуем антикоммутатор К„ъ{х, дО = Ы*)Ы*')+Ы*')Ы*)- (83) Его можно было бы вычислить, используя непосредственно соотношения антикоммутации G1) для компонент Фурье от яр и гр. Более простой путь основан на использовании неко- некоторых свойств, которые должно иметь выражение Каь (х, х'). I. КаЬ (х, х') содержит х^ и х^ только в виде разности Х\х -Цх- П. Каь должно удовлетворять волновому уравнению Кьс (х, х') = 0, (84) это следует из того, что \|з (x) удовлетворяет уравне- уравнению F6). III. При х0 — х'о величина Каь имеет значение бо*б (х — х'); это вытекает из третьего уравнения G0). Этих свойств достаточно для полного определения ве- величины Каь (х, х'), так как свойство (III) фиксирует значе- значение К»ь ПРИ х0 — х'о; свойство (II) показывает зависимость Каь °т х0, а свойство (I) показывает тогда зависимость КаЬ от х{). Как легко видеть, определение Каь по этим условиям приводит к следующему результату: -^}аье-'<*-*">¦<>¦'*(Pp. (85) Здесь 2 означает суммирование по обоим значениям р0, равным ± (р2 4- т2)'/г, при данных pL, p2, ps. Это выраже- выражение удовлетворяет требованию (II), так как оператор в (84) создает в подынтегральном выражении (85) множитель (/?0 — агрг — атт), который дает нуль при умножении слева на выражение в фигурных скобках. Оно удовлетворяет требованию (III), поскольку при х0=х'о вторые члены в фигурных скобках при суммировании по р0 сокращаются. Закон преобразования для \)з и \|), полученный в § 68, приводит к тому, что величины т()+ (х')а^ (х) преобразуются как четыре компоненты четырехмерного вектора, а вели-
388 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА чина ty+ (x')amty (x) является инвариантом. Следовательно, выражение />Чр+ (X1) а^ (х) + 5^+ (*') «т-ф (х) (86) инвариантно при любом четырехмерном векторе № и при любом скаляре S. Условие инвариантности (86) должно быть достаточно для того, чтобы обеспечить правильный закон преобразования ф и f, так как, если положить /•*= = 1Й д—, S =¦¦ —т, оно позволяет вывести инвариантность волнового уравнения для г}). Инвариантность (86) приводит к инвариантности выра- выражения (/% + Sam)ab {ца (х1) ^ь (х) + $ь (хЦа (х1)}. Значит, выражение m)abKha(x, x'), (87) в котором Кьа (х, х') определено формулой (85), тоже должно быть инвариантно. Инвариантности выражения (87) должно быть достаточно для обеспечения инвариантности соотношений антикоммутации. Из (87) имеем ьа X .¦¦¦')-р -g- {(/0 ~ tsas -г 5а„) (р0 Ч-а^ + атт)} аа X X е~' с-х')-р/я p = /г3 J2 2 (^Ро - КРг + Sm) e~l (* - *'> -р/л ро1 d3p. (88) Это выражение инвариантно относительно преобразований Лоренца, так как величина РогсРр инвариантна. Итак, ре- релятивистская инвариантность теории доказана. § 79. Взаимодействие Полный оператор Гамильтона для электронов и пози* тронов, взаимодействующих с электромагнитным полем, имеет вид (89)
§ 79. ВЗАИМОДЕЙСТВИЕ 389 где Нр есть оператор Гамильтона для электромагнитного поля в отсутствие частиц (он определяется выражением A9) или D5)), а НР есть оператор Гамильтона электронов и по- позитронов в отсутствие поля, определяемый выражениями (80) или (81); наконец, HQ есть энергия взаимодействия, со- содержащая как динамические переменные электронов и по- позитронов, так и динамические переменные электромагнит- электромагнитного поля. Мы положим Hq^Avj^x, (90) где /р. определяется выражениями G7) и G8), и увидим далее, что это дает правильные уравнения движения. Итак, отбрасывая бесконечные численные слагаемые, имеем Н = С d3x - (8л) J (В»ВР + А^А»1) d?'x. (91) Рассмотрим гейзенберговские уравнения движения, к ко- которым приводит оператор Гамильтона (91). Мы имеем Ш -яг- = "ФахЯ - Н^„ = фах (НР + HQ) - (НР + HQ) V = . ^бк' ]+{«г (— iH< — еAx'i| Таким образом, ~ + еА») - атт } т|) = 0. (92) Это согласуется с одноэлектронным уравнением A1) гл. XI. Так как оператор Н вещественный, то уравнение движения для 1]) будет сопряженным с уравнением движения для i|> и, следовательно, будет соответствовать уравнению A2) § 67. Таким образом, взаимодействие (90) правильно вы- выражает действие поля на электроны и позитроны. Далее, используя соотношения D6), имеем дА -? = [А», Н] = [Л„ HF] = ?„ (93)
390 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА а также OXq ^ Уравнения (93) и (94) приводят к следующему: (95) Этот результат согласуется с теорией Максвелла и пока- показывает, что взаимодействие (90) правильно описывает дей- действие электронов и позитронов на поле. Для того чтобы завершить теорию, нужно ввести до- дополнительные условия E4). Мы должны проверить, согла- согласуются ли они с уравнениями движения. Метод, использо- использованный в § 77 и состоящий в том, что доказывается совместность дополнительных условий для различных мо- моментов времени в гейзенберговской картине, здесь не- неприменим по следующей причине. Квантовые условия, свя- связывающие динамические переменные в различные моменты времени, под влиянием взаимодействия видоизменяются, притом так, что вычисления оказываются слишком слож- сложными. Поэтому мы поступим иначе: мы получим все до- дополнительные условия, которым подчиняются динамические переменные для данного момента времени, и затем про- проверим, являются ли они совместными. Обратимся опять к уравнениям E6). Дальнейшее диф- дифференцирование по х0 дает ?^¦~0. (96) С другой стороны, из уравнения движения для \р, именно, из (92) следует, как в § 68, что д /т. дх^ ^ Это равносильно уравнению -ejr=0' (97) поскольку разность между величинами — еф+tj; и /0 посто- постоянна во времени, даже если она и бесконечна. Теперь
§ 79. ВЗАИМОДЕЙСТВИЕ 391 из (95) видно, что уравнение (96) выполняется как сильное уравнение. Следовательно, уравнения E6) являются един- единственными независимыми дополнительными условиями для динамических переменных в данный момент времени. Пер- Первое из них приводит к E7), как и ранее, а второе из них дает теперь, с учетом (95) при |li =0, уравнение (Ar0 + BrY + inj0^0. (98) Последнее уравнение может быть записано в виде (Л0+{/)" + 4л/0*«0 (99) или, принимая во внимание C9), в виде dive-4n/0^0, A00) что как раз и есть одно из уравнений Максвелла. Можно видеть без подробных вычислений, что для любых двух точек х и х в один и тот же момент времени спра- справедливо соотношение [/V, /ох'] = О, так как, согласно G0), СП должна быть пропорциональна б (х — х') и не может содержать производных от б (х — х'), а в то же время СП должна быть антисимметрична отно- относительно х и х'. Таким образом, члены 4лу'0Л. в уравне- уравнении (98), являющиеся добавочными по отношению к уравне- уравнению E8), коммутируют друг с другом при всех х и х', а также коммутируют со всеми другими динамическими пе- переменными, входящими в условия E8) и E7). Отсюда сле- следует, что добавочные члены не нарушают совместности E8) и E7), и, следовательно, условия (98) и E7) совместны. Наш метод введения взаимодействия в теорию не был релятивистским, так как энергия взаимодействия (9Q| со- содержит динамические переменные, относящиеся к данному моменту времени в некоторой лоренцевой системе. Поэтому возникает вопрос, является ли теория со взаимодействием релятивистской. Уравнения поля, именно (98) и (95), оче- очевидно, релятивистские, равно как и дополнительные усло- условия E4). Остается невыясненным, являются ли реляти- релятивистски инвариантными квантовые условия. Нам известны условия, связывающие все динамические переменные А^х, В^, г|>ах, г|зах в данный момент времени х0. Как было упомянуто ранее, мы не можем установить общие
392 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА квантовые условия, связывающие динамические переменные в двух произвольных точках пространства-времени, так как взаимодействие делает вычисления слишком сложными. Поэтому мы совершим бесконечно малое преобразование Лоренца и найдем квантовые условия в данный момент времени в новой координатной системе. Если можно будет установить инвариантность квантовых условий относительно бесконечно малых преобразований Лоренца, то отсюда будет следовать инвариантность и относительно конечных пре- преобразований Лоренца. Пусть х% будет время в новой системе отсчета. Оно связано с координатами в исходной системе отсчета соот- соотношением xt = xo-\-wrxr, A01) где е — бесконечно малая, a vr — трехмерный вектор, так что evr представляет собой относительную скорость двух систем отсчета. Будем пренебрегать членами порядка г', Величина k, описывающая поле, взятая в точке х и в момент времени х%, имеет в новой системе координат значейие dk k (х, 4) = k (х, х0) + (х0* — хо)-— = ил о = /г(х, xo) + evrxr[kx, H]. A02) СП этой величины с другой подобной величиной Я (x',Xq), описывающей поле, равна [k(x, х2), Я(х', 4)] = Н], K>] = [k(X, Х0), К(Х', Х0)] + k, [К', H]] + EVrXr[[kx, Кх.], Н). A03) Если k и X представляют собой переменные типа г|з или я|), то нас интересует не СП, а антикоммутатор. Используя обозначение F9) для антикоммутатора, имеем A04) ftp (у у \ + evrxr[[kx, , (х'г — Xr) [kx Я(х', ^0)]+ + е Я], А,0+ = [*1 . [V, Я]]+ + б угл;г [[k , [К>, Я(х', X, К' Хо)]+- 1, Я].
§ 79. ВЗАИМОДЕЙСТВИЕ 393 Если k и % представляют собой любую пару из числа основ- основных переменных А^, В^, i()a, 1|за, то СП [kx, Хх<], или соот- соответственно антикоммутатор [kx, ЯХ']+, является числом, так что последний член в A03) или A04) исчезает. Остается выражение [k(x, xS), Я(х', *J)]± = [*(x, х0), Х(х', хо)]± + + wr(xr-x'r)[kx, [K-, HQ]]±, A05) где ± означает.СП или антикоммутатор, смотря по обстоя- обстоятельствам. Из выражения (90) для Hq видно, что выраже- выражение 1ХХ', Hq] может содержать лишь динамические перемен- переменные Л^х'. tyax-, 'Фах' и не может содержать их производных. Следовательно, выражение [А:х, [А,Х', Hq]]±, если только око не обращается в нуль, будет пропорционально б (х — х') и не будет содержать членов с производными от б (х — х'). Следовательно, последний член в A05) равен нулю. Можно, следовательно, заключить, что выражение [k (x, х%), % (х', Aro)]i; имеет то же самое значение, что и в отсутствие взаимодействия, и поэтому, как вытекает из прежних вы- вычислений, оно является релятивистски инвариантным. Следует отметить, что против вышеприведенного доказа- доказательства возможно следующее возражение. В нескольких местах мы вычисляли различные выражения, расположенные по степеням е, и пренебрегали величинами порядка е2. Эта процедура не может быть, однако, применена для вычисле- вычисления выражений [k (x), K(x')]t, если точки х и х' в про- пространстве-времени лежат близко друг к другу, так что раз- разность х^ — х'р, будет порядка е. В самом деле, результат расчета должен быть функцией от (х^ — x'J), имеющей осо- особенность, когда четырехмерный вектор х — х' лежит на све- световом конусе, а такую функцию, разумеется, нельзя раз- разлагать в степенной ряд по (х^ — x{i). Для того чтобы сделать доказательство убедительным, нужно переформулировать его так, чтобы избежать исполь- использования дельта-функций. Вместо вычисления [k (х, х'о), X (х\ *o)]-i- следует вычислять выражение хг, xt)d3x']±, A06) где ах и Ьх — две произвольные непрерывные функции от х1г х2, х3. Тогда все величины, которые подлежат разложению
394 ГЛ. ХП. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА по степеням е, будут изменяться непрерывно при непрерыв- непрерывном изменении направления оси времени, и разложения бу- будут оправданы. Уравнения, которые теперь получатся, бу- будут те же, что и в прежнем доказательстве, но умноженные на axbX'dsxd3x' и проинтегрированные. Мы приходим к пре- прежнему заключению, что СП или антикоммутаторы имеют те же значения, что и в отсутствие взаимодействия. Причина, по которой взаимодействие не изменяет пере- перестановочных соотношений, состоит, очевидно, в том, что оно имеет очень простой вид, а именно, оно содержит только динамические переменные, но не содержит их производных. СП и антикоммутаторы имеют те же значения, что и в от- отсутствие взаимодействия, если только они относятся к зна- значениям переменных в таких двух точках пространства-вре- пространства-времени, которые для некоторого наблюдателя являются одно- одновременными. Это означает, что каждая из двух точек должна лежать вне светового конуса другой и может приближаться к ней только вдоль пути, лежащего вне этого светового конуса. § 80. Физические переменные Кет-вектор | Р), представляющий физическое состоя- состояние, должен удовлетворять дополнительным условиям (В0+А$\Р) = 0, (div8-4n;/0)|/>>=0. A07) Динамическая переменная является физической, если в ре- результате ее умножения на любой вектор, удовлетворяющий этим условиям, получится другой кет, удовлетворяющий тем же условиям. Следовательно, динамическая переменная должна коммутировать с величинами B0 + Ar, divg-4n/0. A08) Посмотрим, какие динамические переменные из числа наибо- наиболее простых обладают этим свойством. Переменные поперечного поля ет?г, <&г, очевидно, ком- коммутируют с величинами A08) и являются физическими. Пе- Переменная tya коммутирует с первой из величин A08), но не коммутирует со второй, и поэтому не является физической. Однако можно вместо 1|за ввести величину, которая является физической. Произведем с этой целью некоторые выкладки.
§ 80. ФИЗИЧЕСКИЕ ПЕРЕМЕННЫЕ 395 Так, мы имеем = 6aft8 (X — X') У1рьх' = Фйхб (X — X'). Отсюда следует соотношение [%x, /Ox']=|-^X6(X-X'). A09) Далее, из соотношения D2) вытекает Следовательно, имеем Таким образом, если мы положим %x = eieV*l%x, (ПО) то величина i|)*x будет коммутировать с обоими выраже- выражениями A08), и поэтому будет физической. Подобно этому и величина t|)*x также будет физической. Переменные &#г, <?®r ty*, 4>i являются единственными независимыми физиче- физическими переменными, не считая самих величин A08). В силу соотношений /о = — уе(г|з*+г|5*-г1)*+;ф*); /Г = — е^*+агг|)* A11) плотность заряда и плотность тока являются физическими. Легко также видеть, что & и JC являются физическими, так же, как и в случае отсутствия электронов и позитронов. Физическими переменными являются все те, на которые не влияет существующий в теории Максвелла произвол в вы- выборе потенциалов. Оператор ^„х описывает рождение позитрона или анни- аннигиляцию электрона в точке х. Посмотрим, каков физический смысл оператора г[)*х. Из D4) имеем ifl[eieV*'n, &„'] = eeieV->n (xr-x'r)\x-xr j~3
896 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА и, значит, \Ь Till* й ,1 Pill* (Y Y'\ I Y v' I ИЛИ Возьмем состояние [ P ), в котором ёг в некоторой точке х' имеет численное значение сп так что будет Тогда из A12) следует так что в состоянии, описываемом вектором г|)*х j P), вели- величина 9>г в точке х' имеет численное значение сг-\-е(х'г —хг)\\' — х |~3. Это означает, что оператор т|зах, кроме рождения позитрона или аннигиляции электрона в точке х, увеличивает электри- электрическое поле в точке х' на величину е (х'г — хг) | х' — х | ~3, которая в точности равна классическому кулоновскому полю в точке х', от позитрона с зарядом е, расположен- расположенного в точке х. Итак, оператор г|з*х создает позитрон в точке х вместе со своим кулоновским полем или уничтожает эле- электрон в точке х вместе с его кулоновским полем. Для электронов и позитронов, взаимодействующих с эле- электромагнитным полем, физическим процессам рождения и аннигиляции позитронов и электронов соответствуют вели- величины if*, я)?*, а не ijj, ijj; действительно, эти процессы должны всегда сопровождаться соответствующим кулоновским изме- изменением в электрическом поле вокруг точки, где рождается или аннигилируется частица. Легко видеть, что переменные ip*xi 'фХх удовлетворяют тем же соотношениям антикоммута- антикоммутации G0), что и переменные, не отмеченные звездочкой. После перехода к импульсному представлению будут важны не величины typ, определяемые формулами F7), и не явля- являющиеся физическими, а физические переменные г|5р, опреде- определяемые соотношениями й8*. A13)
§ 80. ФИЗИЧЕСКИЕ ПЕРЕМЕННЫЕ 397 Нужно также заменить формулы F8) выражениями и принять следующее условие: оператор ?р представляет аннигиляцию электрона с импульсом р; оператор \% — рож- рождение электрона с импульсом р; оператор Ц — рождение позитрона с импульсом —р; оператор I* — аннигиляцию позитрона с импульсом —р. Все переменные Ц, ip1, ?р, ?р, Ч>р. 'Фр удовлетворяют тем же соотношениям антикоммута- антикоммутации, что и величины, не отмеченные звездочкой. Оператор Гамильтона может быть выражен целиком че- через физические переменные. Замечая, что у*г = eiev/n Ur _j_ Е. y имеем г [— ihY - е {&€r - Vr) q] + q+ammy + Л%} d3x =¦ ctmmi|3* + Л%} d3x. Последний член в подынтегральном выражении следует объе- объединить с HfL. Из D9) и E7) с помощью (99) выводим Иfl я« - (8л)-1 \ (U - Ло) (U -j- Л0)" d3x т Следовательно, Интегрируя (99) с помощью формулы G7) § 38, будем иметь X J j X — X' j и, следовательно, Таким образом, получаем
398 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА где Н* = ] {^*+ar (— Щ*г -езЛгу*) + y*+ammty*} d3x + В уравнении Шредингера для кет-вектора | Р), представля- представляющего физическое состояние, можно пользоваться опера- оператором Н* вместо Н. В самом деле, такой вектор удовлет- удовлетворяет уравнению Ш±\Р) = Н\Р)*=Н*\Р). A15) Оператор Я* содержит только физические переменные, тогда как переменные продольного поля в него не входят. Вместо переменных продольного поля мы имеем последний член в A14), который как раз равняется кулоновской энергии взаимодействия всех имеющихся зарядов. Появление такого члена в релятивистской теории несколько странно, так как он представляет собой энергию, связанную с мгновенным взаимодействием. Он появляется в результате преобразова- преобразований, далеко уводящих нас от гейзенберговской формы тео- теории, в которой релятивистская инвариантность очевидна. Можно было бы построить представление, взяв в каче- качестве стандартного вектора произведение двух стандартных векторов: определяемого формулами F1) и F2) кет-вектора | О/?) для электромагнитного поля и определяемого форму- формулой G4) кет-вектора | 0Р) для электронов и позитронов. Это представление, однако, не будет удобным, так как его стандартный вектор не удовлетворяет второму из дополни- дополнительных условий A07). Более удобное представление получится, если взять дру- другой стандартный кет-вектор |0q), удовлетворяющий соот- соотношениям (B0 + A$\0Q) = 0, (div8-4n/0)|0Q)=0, A16) е^лк 10Q> = 0, Цр 10Q> = 0, L*P I 0Q> = 0. A17) Эти условия совместны, поскольку все операторы, действу- действующие на кет-вектор | 0q), коммутируют или антикоммути- руют друг с другом. Кроме того, число таких условий доста- достаточно для определения вектора | 0Q> с точностью до числен- численного множителя, так как это число равно числу условий,
§ 81. ТРУДНОСТИ ТЕОРИИ 399 налагаемых на \0F)\0P). Соотношения A16) показывают, что вектор |0q> удовлетворяет дополнительным условиям и, следовательно, представляет физическое состояние. Соот- Соотношения же A17) показывают, что | Oq) представляет состояние, в котором фотоны, электроны и позитроны отсут- отсутствуют. Любой кет-вектор | Р), который удовлетворяет дополни- дополнительным условиям A07) и, следовательно, представляет физическое состояние, может быть выражен как результат умножения некоторой физической переменной на | Oq). Единственными независимыми физическими переменными, которые дают отличный от нуля результат при действии на вектор | Oq), являются &#ru, tap, йр- Следовательно, имеем \Р) = У(а^гк, |*р, ЙР)|00>. A18) Таким образом, вектор | Р) представляется волновым функ- функционалом ?, содержащим переменные е^>к, 1*р, ?*р. Это есть степенной ряд по указанным переменным, причем различ- различные члены соответствуют наличию различных чисел фото- фотонов, электронов и позитронов вместе с кулоновским полем вокруг электронов и позитронов. Если пользоваться представлением A18) и оператором Гамильтона //*, можно не принимать во внимание усло- условий A16), так как они не играют роли при решении урав- уравнений Шредингера A15). При этом продольные переменные в теории больше не появляются. § 81. Трудности теории Стандартный кет-вектор | Oq) представляет состояние, в котором нет ни фотонов, ни электронов, ни позитронов. Можно было бы думать, что это состояние является совер- совершенным вакуумом, но этого не может быть, так как оно ив является стационарным. Чтобы оно было стационарным, должно было бы выполняться равенство Н* | Oq) = С[ Oq), где С есть число. Но оператор Н* содержит члены -Л y*+ar&fry* d3x + ~ С | '"^gj d*xd*x', A19) которые при действии на | Oq) не дают числовых множите- множителей и поэтому нарушают стационарный характер | Oq).
400 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Эти члены можно было бы рассматривать в соответствии с теорией § 44 как возмущение, благодаря которому воз- возникает возможность перехода из состояния 0р в другое со- состояние. Разложение в интеграл Фурье первого члена из A19) содержит часть -e(ar)ab \\<^и\*аЛь, v+utd3kd3p, A20) вызывающую переходы с испусканием фотона и одновремен- одновременным образованием пары электрон — позитрон. Спустя ко- короткий промежуток времени вероятность перехода будет пропорциональна квадрату длины вектора, получаемого при умножении A20) на исходный вектор 1 0q). Результат умножения равен la, | 0q) X X dsk d3p d?k' d*p' = e* (ar)ab (as)cd \\\\ <0Q | ih [<^frk, в**к] х X fep, U? ]+ [It, p+k n, й. р'+к'л]+1 0Q) d*k d*p d*k' dsp'. Пользуясь выражениями для СП и антикоммутаторов D), A6), G2), G3), получим подынтегральное выражение, кото- которое для больших кик' будет зависеть от переменных к, к' по закону | к Г1 б'(к — к'). Это дает расходящийся инте- интеграл, так что вероятность перехода бесконечна. Разложение в интеграл Фурье второго члена A19) содер- содержит выражения типа ЩрЧрЧр+р'-р" - соответствующие одно- одновременному образованию двух электронно-позитронных пар. Можно определить, как и выше, вероятность перехода, и она опять оказывается бесконечной. Из этих вычислений можно заключить, что состояние 0q не является даже приближенно стационарным. Более серь- серьезной трудностью является то обстоятельство, что метод воз- возмущений нельзя считать применимым для решения волно- волнового уравнения в том случае, когда вероятности переходов, к которым он приводит, оказываются бесконечными, как это всегда бывает в квантовой электродинамике незави- независимо от исходного состояния. Но мы не знаем метода, который можно было бы использовать вместо этого. Сле- Следовательно, решение волнового уравнения квантовой элек- электродинамики остается неизвестно. Источником трудностей являются флуктуации плотно- плотности моря электронов с отрицательной энергией. Эти флук-
§ 81. ТРУДНОСТИ ТЕОРИИ 401 туации возникают уже в теории электронов и позитронов в отсутствие электромагнитного поля. Плотность всех элек- электронов как с положительной, так и с отрицательной энер- энергией равна Px=^M>x = fe + &)(Ex + ?x). Следовательно, согласно G4) будем иметь Рх 1 0р> = Ш% | 0р> + (?& + Щ | 0Р>. A21) Соотношения антикоммутации G3) для ? и ? приводят к тому, что выражение Kk + ?L A22) оказывается числом, хотя и бесконечным, так что второй член в правой части A21) равен вектору | 0Р), умноженному на числовой множитель. Первый же член определенно не сводится к кратному | 0Р), так что | 0Р)не является соб- собственным вектором рх. Значит, плотность распределения в вакууме электронов с отрицательной энергией не явля- является постоянной, но испытывает непрерывные флуктуации. Физический смысл имеет плотность электронов с поло- положительной энергией минус плотность позитронов, так как эти величины определяют плотность заряда, используемую в уравнении Максвелла E8) § 73. Согласно идее § 73, для того чтобы получить эту величину, имеющую физический смысл, нужно вычесть из плотности всех электронов плот- плотность вакуумного распределения. В точной квантовой элек- электродинамической теории вычисляемая величина должна была бы быть вполне определенным оператором, который можно было бы ввести в наши уравнения. Лучшее, что мы можем сделать, — взять в качестве такого оператора посто- постоянную часть A22) плотности вакуумного распределения и не вычитать флуктуирующую часть. Это дает /ох = - е {^хфх - (SSx + ЙЁх)} • A23) С помощью соотношения !х?х + 1х|х="?х?х -f- Six (которое получается из перестановочных соотношений G2) и G3), если положить в них а = b и просуммировать) легко видеть, что величина A23) согласуется с нашим прежним выражением G7) для /0. Но поскольку флуктуирующая часть плотности вакуумного распределения не была вычтена, она остается в плотности заряда, действующей на вакуумный вектор, т. е. /ох 10Р) = — е|??х | 0Р>.
402 ГЛ. XII. КВАНТОВАЯ ЭЛЕКТРОДИНАМИКА Таким образом, плотность заряда в вакууме не равна ну- нулю. Мы получили явно парадоксальный результат; хотя сос- состояние вакуума определено как состояние без позитронов и электронов, все же оно имеет отличную от нуля плотность заряда. Этот результат является прямым следствием того обстоятельства, что нам не удалось вычесть флуктуации фона электронов с отрицательной энергией даже предполо- предположив, что нет взаимодействия с электромагнитным полем. Имеется некоторая трудность и в связи с постоянной частью A22) плотности вакуумного распределения. Из сооб- соображений симметрии можно ожидать, что постоянная часть тока, вызванного движением вакуумного распределения электронов, должна отсутствовать, так что мы имеем плот- плотность заряда в отсутствие тока. Но это обстоятельство дало бы нам выделенную лоренцеву систему отсчета, что, однако, не может быть в релятивистской теории. Выход из этого противоречия состоит в учете того обстоятельства, что ток, вызванный движением вакуумного распределения электронов, в действительности представляет собой разность двух бесконечных величин и поэтому не имеет однозначного определения. С помощью предельного перехода, относящегося к определенной лоренцевой системе отсчета, можно подсчитать постоянную часть этого тока и получить для нее некоторое определенное значение; но этому значению нельзя отдавать предпочтение перед другими. Про- Произвол в величине постоянной части тока не является серьез- серьезной трудностью теории, так как его можно избежать, введя иное определение jr, а именно, положив вместо G8). Это определение приводит величину /гх к тому же виду, что и выражение G7) для /„ и позволяет написать релятивистски симметричное уравнение h = - у ^ (Ф+М> ~ ^Xt>- A24) Трудность с флуктуациями является более серьезной. Если ввести взаимодействие с электромагнитным полем, то флуктуирующая плотность заряда в вакууме создаст флук- флуктуирующее поле согласно уравнению Максвелла A00), а это поле будет оказывать обратное действие на фон электронов с отрицательной энергией, вызывая рождение электронно-
§ 81. ТРУДНОСТИ ТЕОРИИ 403 позитронных пар. Попытки рассчитать это обратное дейст- действие приводят к появлению расходящихся интегралов, что делает невозможным решение волнового уравнения с уче- учетом взаимодействия. Бесконечности появлялись в теории и ранее, но они не вызывали серьезных затруднений, так как они не играли в уравнениях важной роли; их можно было избежать, изме- изменив подходящим образом определение соответствующих величин. Так, определяя НРТ выражением D7), мы имели бесконечную нулевую энергию поперечного электромагнит- электромагнитного поля, но ее можно было устранить, используя F5). Далее, при определении Нр, согласно (80), мы имели бес- бесконечную нулевую энергию электронов и позитронов и бесконечный член, входящий в явном виде в выражение (82) для НР, Эти бесконечности можно было устранить, принимая для НР выражение (81). Появилась также беско- бесконечная постоянная часть A22) вакуумной плотности элек- электронов, но ее можно было исключить из теории, пользуясь для /A формулой A24). Но не существует простого способа видоизменить теорию так, чтобы можно было избежать флук- туационных бесконечностей. Удалось достичь успеха в выработке некоторых правил, дающих возможность самосогласованным образом отбрасы- отбрасывать бесконечности, вызванные флуктуациями. Таким путем была получена более или менее удовлетворительно действую- действующая теория, которая позволяет выполнять вычисления ве- величин, допускающих сравнение с экспериментом. Было найдено хорошее согласие теории с экспериментом, свиде- свидетельствующее о некоторой законности предложенных пра- правил. Но эти правила применимы только к частным задачам, обычно задачам столкновений, и они плохо согласуются с логическими основами квантовой механики. Их нельзя поэтому рассматривать как удовлетворительное решение трудностей. Нам представляется, что мы следовали по пути логи- логического развития идей квантовой механики в их современ- современном понимании настолько далеко, насколько это возможно. Встреченные трудности ввиду их глубокого характера могут быть устранены лишь радикальным изменением основ тео- теории, вероятно, столь же радикальным, как и переход от теории боровских орбит к современной квантовой механике.
ПРИЛОЖЕНИЕ О КАНОНИЧЕСКОМ ПРЕОБРАЗОВАНИИ В КЛАССИЧЕСКОЙ И КВАНТОВОЙ МЕХАНИКЕ*) (В. А. Фок) В § 26 книги Дирака формулируется следующее утверждение. Для систем, имеющих классический аналог, унитарное преобразо* вание операторов представляет аналогию с касательным преобразова- преобразованием классической механики. Мы проследим здесь эту аналогию несколько подробнее. Пусть qx, q2, ..., qn и ръ рг, ..., рп — первоначальные координаты и импульсы системы, a Qlt Q2 Qn и Ръ Р.,, ..., Рп — преобразован- преобразованные координаты и импульсы. Мы рассмотрим случай, когда функция преобразования S зависит от старых и новых координат S = S(qu ..., qn; Q,, .... Qn). A) Касательное преобразование определяется соотношением между диф- дифференциалами 2 Prdq,-^ PrdQr = dS, B) из которого следует П dS р ds m P P () Выражения для величин q, р через величины Q, Р и обратные выраже- выражения получаются решением уравнений C). Это решение всегда воз- возможно, так как определитель предполагается отличным от нуля. В квантовой механике такому касательному преобразованию соответствует унитарное преобразование от представления, в котором «диагональными» являются величины q, к представлению, в котором «диагональными» являются величины Q. Это унитарное преобразование имеет следующий вид: обозначим для краткости **) через г|э0 (q) общие *) См. Фок В. А., Вестник ЛГУ— 1959, № 16, с. 67. **) Совокупность переменных qt, ..., qn мы будем часто обозначать одной буквой q; аналогичный смысл будут иметь обозначения р, Q, Pt
О КАНОНИЧЕСКОМ ПРЕОБРАЗОВАНИИ 405 собственные функции операторов Qlt ..., Qn, выраженные в переменных Пусть F есть преобразуемый оператор. Тогда ядро (или матрица) преобразованного оператора F* будет иметь вид . (g) dq, E) где под dq разумеется произведение дифференциалов dq = dq1 ... dqn. F; В обозначениях Дирака и формула E) напишется (Q'\F*\Q) = \{Q'\q)F{q\Q)dq. (8) Собственную функцию i|jq (q) можно рассматривать как ядро {q I V | Q) унитарного оператора U = U~l и писать формулу (8) в виде F* = UFU~K (9) При F = 1 формула E) приводится к условию ортогональности, причем слева должно получиться ядро единичного оператора в переменных Q, т. е. (Q' | 1 j Q) = 60(Q —Q') se (Qi — Qi) ... 6(Qn — Qn), A0) где б есть дельта-функция Дирака. В полуклассическом приближении мы можем взять в качестве ¦фл (q) выражение (И) Постоянная с равна с= Bя/гГ"/2. A2) Проверим, что эти функции приближенно удовлетворяют условию ортогональности. Подстановка выражений A1) в интеграл E) при F = 1 дает под интегралом быстропеременный показательный множи- множитель exp [i(S—S')/h], где S' получается из S заменой Q на Q'. Этот множитель перестает быть быстропеременным только если Q' близко к Q. Только при таком условии интеграл будет заметно отличен от нуля. Поэтому мы можем заменить в показателе разность S — S' выражением A3, или r = 1 где Рг имеет значение (З). Формулу A4) можно для краткости записать
406 в виде ПРИЛОЖЕНИЕ -S' = (Q'-Q)P. A5) Во всех множителях при показательной функции мы можем положить Q' = Q. Мы получим тогда I _ iQ' — Q) p ж<г „(V " ¦ A6) dQdq dq. Но если Рг имеет значение C), то определитель под интегралом в A6) есть якобиан преобразования от Р к q, так что = dPl ... dPn = dP. A7) dQdq Поэтому формулу A6) можно записать в виде dP. A8) Но оставшийся интеграл (умноженный на с2) есть просто произведение дельта-функций A0). Отсюда окончательно l%>(qLQ(q)dq=80(Q~Q') A9) и, следовательно, условие ортогональности и нормировки выполняется. Рассмотрим теперь матрицу для произвольного оператора F, выраженного через qr и pr= — ih d/dqr. Пусть F = F(q, p) = F (q, - ih д/dq). B0) Результат действия такого оператора на функцию exp (iS/h) бу- будет в рассматриваемом приближении равен B1) То же справедливо и по отношению к функции A1). Поэтому в формуле E) мы можем разуметь под F не дифференциальный оператор, а функ- функцию, стоящую в правой части B1). Полагая, как и раньше, в множите- множителях при показательной функции Q' = Q, будем иметь Ю'. dQdq\ dq. B2) В качестве переменных интегрирования возьмем, как и в A8), величины Р. Преобразуя к ним функцию F, будем иметь F(q, p)=F(q(Q, P), p(Q, p)) = F*(Q, P), B3) где под р и Р разумеются классические выражения C). Вследствие приближенного равенства A5) мы можем написать L (Q» — Q) р (Q' J F* | Q) =C2\ F* (Q, P) eh dP. B4) Чтобы вычислить этот интеграл, заметим, что умножение содержащейся
О КАНОНИЧЕСКОМ ПРЕОБРАЗОВАНИИ 407 в нем показательной функции на Р равносильно применению к ней оператора—ihd/dQ'. Поэтому Я> 'Й ~Q)P dP. B5) Вынося оператор F* за знак интеграла и пользуясь результатами A8) и A9), получим (Q' \F*\Q)=F* [Q, - ih ~ J б0 (Q - Q'). B6) Здесь (как, впрочем, и в предыдущих формулах) можно было бы взять в качестве первого аргумента F* величину Q'. Так как результат применения оператора F* к некоторой функции Y (Q) определяется формулой $dQ', B7) то, пользуясь выражением B6), для элемента матрицы будем иметь (Q). B8) Таков будет вид преобразованного оператора F* (с точностью до членов, зависящих от порядка множителей в нем). Наши вычисления можно резюмировать следующим образом. При- Применение приближенного равенства B1) позволило нам перейти от опе- оператора F (q, — ih djdq) к функции F (q,p)\ затем эта функция была выра- выражена по классическим формулам для касательного преобразования через новые переменные Q, Я; от полученной новой функции F* (Q, Р) мы затем вновь перешли к оператору F* (Q, — ih d/dQ), когда применяли метод дифференцирования по параметру к вычислению интеграла. Таким путем мы пришли к следующему результату. Пусть дан опе- оператор F = F{q,p); р = -(Нщ, B9) выраженный в переменных q. После унитарного преобразования к пере- переменным Q оператор F переходит в F*. Пусть оператор F*, выраженный аналогично B9), имеет вид F*=F*(Q,P); P=— ihd/dQ. C0) Предположим, что собственные функции, при помощи которых совер- совершается унитарное преобразование от q к Q, имеют в полуклассическом приближении вид A1), так что их фаза равна S(q, Q)lh. Тогда вид функ- функции F* может быть получен из F с точностью до членов, зависящих от порядка множителей, путем простого алгебраического преобразования при помощи равенств F(q, p)=F*(Q, P), p=dS/dq; P=-dS/dQ, C1) где S есть функция, входящая в фазу унитарного преобразования. Последние формулы представляют касательное преобразование клас- классической механики.
ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ*) ЛЕКЦИЯ 1 МЕТОД ГАМИЛЬТОНА Я чрезвычайно рад тому, что нахожусь здесь, в Иешив- ском университете, и имею возможность рассказать вам о некоторых математических методах, развиваемых мною в течение ряда лет. Прежде всего я хотел бы в нескольких словах онисать общее направление этих методов. В атомной теории мы имеем дело с различными полями. Здесь есть ряд очень хорошо известных полей таких, как электромагнитное и гравитационное; однако в последнее время мы сталкиваемся также с рядом иных полей, посколь- поскольку, согласно общим идеям де Бройля и Шредингера, каждой частице сопоставляется волна и эти волны можно рассмат- рассматривать как поле. Таким образом, в атомной физике перед нами стоит задача построить теорию, описывающую раз- различные поля, взаимодействующие друг с другом. Она долж- должна находиться в согласии с принципами квантовой механики, однако создать такую теорию — весьма нелегкая задача. Можно получить значительно более простую теорию, если перейти к соответствующей классической механике, которая представляет собой частный случай квантовой механики при стремлении постоянной Планка % к нулю. Наглядно показать, как строится теория, намного легче в терминах классической механики. Поэтому то, о чем я буду говорить в этих лекциях, будет в основном относиться к классической механике. Вы можете подумать, что такой способ на самом деле не очень хорош, ибо классическая механика недостаточно пригодна для описания Природы. Природа описывается квантовой механикой. Зачем же нужно тогда обращаться к классической механике? Дело в том, что квантовые теории поля, как я уже сказал, весьма сложны, и до сих пор ока- оказалось возможным построить квантовые теории лишь для *) Перевод с английского А. Г. Миронова.
1. МЕТОД ГАМИЛЬТОНА 409 полей довольно простого типа с простыми взаимодействиями между ними. Вполне вероятно, что эти простые поля с про- простыми взаимодействиями между ними не дают адекватного описания Природы. Успехи квантовых теорий поля до- довольно ограничены? Мы непрерывно сталкиваемся с труд- трудностями и хотели бы расширить общие рамки подхода, что позволит рассматривать поля более общего типа. Например, мы хотели бы учесть возможность того, что уравнения Максвелла будут не всегда справедливыми. Вполне ве- вероятно, что при переходе к областям в непосредственной близости от зарядов, создающих поля, необходимо будет модифицировать теорию Максвелла так, чтобы она стала нелинейной электродинамикой. Это только один пример обобщений, которые полезно рассмотреть в нашем тепереш- теперешнем состоянии незнания основных идей, основных сил и основного характера полей атомной ^теории. Чтобы можно было приступить к зтой задаче, т. е. рассмотреть более общие поля, необходимо перейти к клас- классической теории. Далее, если нам удастся придать класси- классической теории гамильтонову форму, то мы всегда сможем, применив некоторые стандартные правила, получить первое приближение квантовой теории. Мои лекции в основном будут посвящены задаче преобразования общей классичес- классической теории к гамильтоновой форме. Сделав это, мы вступили на путь получения последовательной квантовой теории. Во всяком случае, мы будем иметь первое приближение. Конечно, настоящую работу следует рассматривать только как предварительный этап. Окончательным результатом этого этапа должно быть построение последовательной квантовой теории, однако на пути к этой цели встречаются весьма серьезные трудности, трудности фундаментального характера, над преодолением которых люди мучаются немало лет. Трудности перехода от гамильтоновой класси- классической механики к квантовой механике настолько подав- подавляют некоторых, что они начинают думать: а может быть, и весь метод, основанный на классической теории Гамиль- Гамильтона, является неудовлетворительным? Особенно в послед- последние несколько лет предпринимались попытки развить иные методы построения квантовых теорий поля. На этом пути был достигнут вполне ощутимый прогресс. Был получен ряд условий, которые должны удовлетворяться. Однако эти альтернативные методы, хотя и позволили значительно
НО ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ продвинуться в объяснении экспериментальных результа- результатов, едва ли приведут к окончательному решению проблемы. Мне кажется, что при таких подходах всегда будет теряться нечто такое, что можно получить только при использовании гамильтониана или, возможно, некоторого обобщения поня- понятия гамильтониана. Поэтому я придерживаюсь той точки зрения, что гамильтониан действительно очень существен для квантовой теории. В самом деле, без использования гамильтоновых методов нельзя решить некоторые из простейших задач квантовой теории, например получить формулу Бальмера для водорода, самый первый из результатов квантовой механики. Следо- Следовательно, гамильтониан появляется в теории при самых элементарных подходах, и мне кажется, что и по существу очень важно исходить из гамильтониана; поэтому я хочу рассказать вам о том, насколько далеко можно развить гамильтоновы методы. Мне хотелось бы начать с элементарного подхода, и в качестве отправной точки я возьму принцип действия. Именно, я полагаю, что существует интеграл действия, зависящий от вида движения системы, такой, что из условия его стационарности при изменении движения мы получаем уравнения движения-. Метод, исходящий из принципа дейст- действия, обладает одним большим преимуществом: он позволяет легко согласовать теорию с принципом относительности. Необходимо, чтобы наша атомная теория была релятивист- релятивистской, ибо в общем случае мы имеем дело с частицами, дви- движущимися с большими скоростями. Если мы хотим ввести в рассмотрение гравитационное поле, то мы должны согласовать нашу теорию с общим принципом относительности, а это означает, что нам придется работать с искривленным пространством-временем. Однако гравитационное поле не очень существенно в атомной физике, так как гравитационные силы чрезвычайно слабы по сравнению с другими силами, действующими в атомных процессах, и для практических целей можно пренебречь гравитационным полем. Вопрос о введении гравитацион- гравитационного поля в квантовую теорию был исследован до некоторой степени в последние годы, и я думаю, что основным стиму- стимулом этой работы была надежда, что учет его может помочь преодолеть некоторые трудности. Насколько можно судить в настоящее время, эта надежда не оправдалась, и введение
1. МЕТОД ГАМИЛЬТОНА 411 гравитационного поля, по-видимому, скорее добавляет осложнения, нежели устраняет их. Таким образом, введе- введение гравитационных полей в атомную теорию не дает особых преимуществ. Однако методы, которые я намерен описать, являются мощными математическими методами, пригодными независимо от того, учитывается гравитационное поле или нет. Начнем с интеграла действия, который я обозначу I = \Ldt. A.1) Он выражен в виде интеграла по времени, причем подын- подынтегральное выражение L представляет собой лагранжиан. Таким образом, вместе с принципом действия мы имеем лагранжиан *). Теперь нужно выяснить, как перейти от лагранжиана к гамильтониану. Когда мы получим га- гамильтониан, мы сделаем первый шаг на пути к построению квантовой теории. Вы могли бы задать следующий вопрос: а нельзя ли взять в качестве исходной величины гамильтониан и тем самым сократить работу, связанную с получением из ин- интеграла действия, взятого в качестве отправного пункта, лагранжиана и с переходом от лагранжиана к гамиль- гамильтониану? При попытке провести такое сокращение наталки- наталкиваются на трудность — оказывается, совсем нелегко сфор- сформулировать в терминах гамильтониана условия, при кото- которых теория является релятивистской. С помощью интеграла действия эти условия сформулировать очень легко: нужно просто потребовать, чтобы интеграл действия был реляти- релятивистски инвариантен. Нетрудно привести сколько угодно примеров интегралов действия, релятивистски инвариант- инвариантных. Все они автоматически приведут к уравнениям движе- движения, согласующимся с требованиями теории относитель- относительности, и поэтому любой вывод, основанный на таком интег- интеграле действия, будет также находиться в согласии с теорией относительности. Получив гамильтониан, мы можем применить стандарт- стандартный метод и найти первое приближение квантовой теории; *) Английский термин «Lagrangian» на русский язык часто пере- переводят как «функция Лагранжа» (см. напр. стр. 175). Слово «лагран- «лагранжиан» означает в этом случае пространственную плотность функции Лагранжа. Поскольку в этих лекциях последняя не встречается, мы сочли возможным перевести «Lagrangian» как «лагранжиан». {Прим, ред.),
412 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ если нам повезет, то, возможно, мы окажемся в состоянии продвинуться дальше и построить строгую квантовую тео- теорию. Вы снова могли бы спросить: нельзя ли до некоторой степени сократить эту работу? Может быть, можно перей- перейти прямо от лагранжиана к квантовой теории и вовсе обой- обойтись без гамильтониана? Что ж, в некоторых простых слу- случаях это можно сделать. Для некоторых простых типов по- полей, рассматриваемых в физике, лагранжиан квадратичен по скоростям и подобен лагранжиану, используемому в нерелятивистской динамике частиц. Применительно к таким ситуациям, когда лагранжиан квадратичен по скоростям, разработаны некоторые методы непосредственного перехода от лагранжиана к квантовой теории. Однако это ограниче- ограничение случаем только квадратичных по скоростям лагранжи- лагранжианов является чрезвычайно жестким. Я хочу избежать этого ограничения и работать с лагранжианом, который может быть совершенно произвольной функцией скоростей. Чтобы получить общий формализм, который будет приме- применим, например, к нелинейной электродинамике, упомянутой мною выше, по моему мнению, нельзя никоим образом сократить процедуру, связанную с получением из интеграла действия, взятого в качестве исходной величины, лагран- лагранжиана, с переходом от лагранжиана к гамильтониану и затем с переходом от гамильтониана к квантовой теории. Это и есть та процедура, которую я хочу обсудить в настоя- настоящем курсе лекций. Чтобы выразить все наиболее простым образом, я хотел бы начать с динамической теории систем, имеющих только конечное число степеней свободы и подобных тем, с которыми вы знакомы из динамики частиц. После этого переход от системы с конечным числом степеней свободы к системе с бесконечным числом степеней свободы (что нам нужно для теории поля) есть уже чисто формальная задача. Рассматривая систему с конечным числом степеней сво- свободы, введем динамические координаты, которые я обозначу через q или qn, где п = 1, .... N (N — число степеней свободы). Затем мы имеем скорости dqnldt --= qn. Лагранжиан L = L (q, q) является функцией координат и скоростей. На этом этане вас может до некоторой степени смутить то значение, которое придается временной переменной в этом формализме. Временная переменная t появляется уже, как только мы вводим лагранжиан. Она снова ветре-
1. МЕТОД ГАМИЛЬТОНА 413 чается в определении скоростей, и, таким образом, при переходе от лагранжиана к гамильтониану имеется одна выделенная временная переменная. С релятивистской точки зрения это означает, что мы выбираем одного определенного наблюдателя и на всех этапах нашего формализма ведем отсчет времени по часам этого наблюдателя. Это, конечно, не очень уж приятно физику-релятивисту, который пред- предпочел бы рассматривать всех наблюдателей на равных осно- основаниях. Однако такова характерная черта данного форма- формализма, и я не вижу, как ее устранить, если мы хотим сохра- сохранить общность рассмотрения, допуская, что лагранжиан может быть произвольной функцией координат и скоростей. Мы можем быть уверены, что содержание теории является релятивистским, даже если форма уравнений не является явно релятивистской из-за наличия одного выделенного времени, играющего доминирующую роль в теории. Давайте теперь разовьем эту лагранжеву форму дина- динамики и перейдем затем к гамильтоновой форме, следуя возможно более близко тем идеям, с которыми мы встре- встречаемся в динамике при использовании координат общего вида. Мы имеем лагранжевы уравнения движения, получаю- получающиеся в результате варьирования интеграла действия d Чтобы перейти к гамильтонову формализму, мы введем импульсные неременные р„, определив их как 0L ,, „, р»=ж- (L3) В обычной динамической теории делается предположение, что импульсы являются независимыми функциями скоро- скоростей, но это предположение является слишком жестким для тех приложений теории, которые мы намерены рас- рассмотреть. Мы хотим допустить возможность того, что эти импульсы не являются независимыми функциями скоростей. В таком случае существуют некоторые соотношения типа Ф (q, p) — О, связывающие импульсные переменные. Может быть несколько независимых соотношений этого типа; з таком случае мы перенумеруем их, снабдив индексом т — 1, ..., М, так что мы будем иметь Ф*(<7, P) = 0. A.4)
414 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Величины q и р являются динамическими переменными теории в гамильтоновой форме. Они связаны соотношениями A.4), которые называются первичными связями в гамильто- новом формализме. Эта терминология введена Бергманном, и она представляется мне вполне удачной. Рассмотрим теперь величину pnqn — L. (Всякий раз, когда встречается повторяющийся индекс, я подразумеваю, что проводится суммирование по всем значениям этого индекса.) Возьмем вариации переменных q и q — координат и скоростей. Эти вариации приведут к появлению вариаций импульсных переменных р. В результате этого варьирования, с учетом определения A.3), получим б (pnqn - L) = bpnqn + рпЦп - {-Jz-) bqn— (-к^-) bqn = \°Ц I \ °Чп I = bpnqn-(~jbqn. A.5) Теперь мы видим, что вариация величины pnqn — L содержит только вариации координат q и импульсов р. Она не содержит вариаций скоростей. Это означает, что такую величину pnqn — L можно выразить через q и р независимо от скоростей. Выраженная таким образом, она называется гамильтонианом Н. Однако гамильтониан, определенный таким способом, задан неоднозначно, ибо мы можем добавить к нему любую линейную комбинацию величин ср, равную нулю. Таким образом, мы перешли бы к другому гамильтониану Я*=Я + стфт, A.6) где коэффициенты ст могут быть произвольными функция- функциями q и р. Гамильтониан Н* ничем не хуже Н; наша теория не может провести различия между Я и Я*. Гамильтониан определен неоднозначно. Можно записать A.5) в виде bH = qnbpn — [-^—\bqn. Это уравнение справедливо для произвольной вариации q и р, подчиненной тому условию, что связи A.4) сохраня- сохраняются неизменными. Переменные q и р нельзя варьировать независимо ввиду того, что они ограничены условиями A.4), но для любой вариации q и р, удовлетворяющей этим условиям, данное уравнение выполняется. Согласно общему методу вариационного исчисления, примененному к вари-
1. МЕТОД ГАМИЛЬТОНА 415 ационному уравнению со связями данного типа, находим ja=sjM_ + Um<!Vm и ^L==^!L+Um^ni A 7) или, используя A.2) и A.3) где ит — неизвестные коэффициенты *). Здесь мы имеем гамилыпоновы уравнения движения, описывающие изме- изменение во времени переменных q и р, но эти уравнения содер- содержат неизвестные коэффициенты ит-. Удобно использовать специальное обозначение, которое позволит нам кратко записать эти уравнения, а именно скобки Пуассона. Смысл этого обозначения таков: если мы имеем две функции q и р, скажем, f (q, p) и g (q, p), то скобка Пуассона [/, g] для них определяется как "' si- dqn дРп дРп dqn- u-y; Скобки Пуассона обладают некоторыми свойствами, выте- вытекающими из их определения, а именно: скобка [/, g] анти- антисимметрична по / и g: [Д g] = -[g, f], A.Ю) линейна по каждому члену: [fi + h, g] = [flt g] + [L g] и т. д.; A.11) при этом справедливо следующее правило для произведений Uif2, g] = fiU» g]+Ui, §)h- A.12) Наконец, существует соотношение, известное как тож- тождество ^коби, связывающее три величины: [/. \g, h]] + [g, [h, f]] + lh, [f, g]\ = 0. A.13) С помощью скобок Пуассона мы можем иначе записать уравнения движения. Для произвольной функции g пере- переменных q и р мы имеем *) В отличие отст, ит — числовые коэффициенты. (Прим. ред.).
416 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Если подставить вместо qn и рп их значения, заданные урав- уравнениями A.7) и A.8), то мы найдем, что величина A.14) равна просто rnk, фт]. A.15) Таким образом, все уравнения движения записываются в компактном виде в формализме, использующем скобки Пуассона. Можно записать их в еще более краткой форме, если несколько обобщить понятие скобок Пуассона. В том виде, в каком я определил скобки Пуассона, они имеют смысл только для таких величин fug, которые можно выразить как функции переменных q и р. Величина более общей природы, например обобщенная переменная скорости, кото- которая не выражается через q и р, не имеет скобок Пуассона с другой величиной. Расширим понятие скобок Пуассона и будем считать, что они существуют для любых двух вели- величин и что они удовлетворяют правилам A.10) — A-13), но в остальном не определены, когда входящие в них ве- величины не являются функциями переменных q и р. Тогда мы можем записать A.15) как итц>т]. A.16) Как видите, коэффициенты и появляются здесь в одном из членов скобки Пуассона. Коэффициенты ит не являются функциями q и р, поэтому мы не можем использовать опре- определение A.9) для вычисления скобки Пуассона в A.16). Однако мы можем продолжить исследование ее, используя правила A.10) — A.13). Согласно правилу A.11) имеем [g, H + umym] = [g, H] + [g, umrpm], A.17) а используя правило для произведений A.12), получаем [g, Um<pm] = [g, Um]Vm + Um[g, фт]. A.18) Последняя скобка в A.18) вполне определена, так как g и Фт обе являются функциями переменных q и р. Скобка Пуассона [g, um] не определена, но она умножается на величину фт, обращающуюся в нуль. Поэтому первый член в правой части A.18) исчезает. В результате [g, H + umym] = [g, H] + um[g, фт], A.19) так что A.16) совпадает с A.15).
1. МЕТОД ГАМИЛЬТОНА 417 Существует одно обстоятельство, из-за которого мы должны быть осторожны при использовании формализма скобок Пуассона. Мы имеем связи A.4), но мы не должны пользоваться ни одним из условий связи до вычисления скобок Пуассона. Если мы сделаем это, то придем к невер- неверному результату. Поэтому мы примем, как правило, что все скобки Пуассона должны быть раскрыты до использо- использования условий связи. Чтобы помнить о наличии в форма- формализме этого правила, я запишу связи A.4) в форме уравне- уравнений со знаком равенства в виде двух волнистых линий ж, т. е. со знаком, отличающимся от обычного. Таким образом, они записываются как фт^0. A.20) Я буду называть такие уравнения слабыми, чтобы отличать их от обычных, или сильных уравнений. Условие A.20) можно использовать только после того, как раскрыты все интересующие нас скобки Пуассона. При условии выполнения этого правила скобка Пуассона A.19) вполне определена, и мы имеем возможность записать наши уравнения движения A.16) в весьма сжатой форме: g^lg, HT] A.21) с гамильтонианом, который я буду называть полным гамиль- гамильтонианом, Нг = Н + итЧ>т. A.22) Рассмотрим теперь, каковы следствия из этих уравнений движения. Прежде всего, появятся некоторые условия непротиворечивости. Мы имеем величины ср, которые должны быть равны нулю в каждый момент времени. Мы можем применить уравнение движения A.21) или A.15), взяв в качестве g одну из функций ср. Мы знаем, что для непроти- непротиворечивости метода величина g должна быть равна нулю, и, таким образом, получаем некоторые условия непротиво- непротиворечивости. Посмотрим, как они выглядят. Полагая в A.15) g — ф„ и g = 0, получаем [фт, Щ + ит.[Ц>т, фт']^0. A.23) Мы имеем здесь несколько условий непротиворечивости, по одному для каждого значения индекса т. Мы должны исследовать эти условия и выяснить, к чему они ведут.
418 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Возможно, что эти условия непосредственно приводят к противоречию. Они могут привести к противоречию типа 1 = 0. Если такое случается, то это означает, что наш исходный лагранжиан таков, что лагранжевы уравнения движения противоречивы. Можно легко построить пример со всего лишь одной степенью свободы. Если мы возьмем L — q, то лагранжево уравнение движения A.2) немедленно даст 1 = 0. Таким образом, как вы видите, нельзя задавать лагранжиан совершенно произвольно. Мы должны при выборе лагранжиана потребовать, чтобы лагранжевы урав- уравнения движения не содержали внутреннего противоречия. С учетом этого требования условия, выражаемые уравне- уравнениями A.23), можно разбить на три класса. Условия первого класса сводятся к тождеству 0 = 0, т. е. они удовлетворяются автоматически при учете пер- первичных связей. Условия второго класса сводятся к уравнениям, не зави- зависящим от коэффициентов и, т. е. содержащим только пере- переменные q и р. Такие условия не должны зависеть от первич- первичных связей, иначе они относились бы к условиям первого класса. Таким образом, они имеют вид %(q, P) = 0. A.24) Наконец, существуют среди условий A.23) такие, кото- которые невозможно отнести ни к какому из рассмотренных классов; они представляют собой условия, налагаемые на коэффициенты и. Условия первого класса не должны больше нас беспокоить. Каждое условие второго класса означает, что мы имеем еще одну связь между гамильтоновыми переменными. Связи, возникающие таким путем, называются вторичными свя- связями. Они отличаются от первичных связей тем, что первич- первичные связи являются просто следствиями уравнений A.3), определяющих импульсные переменные, тогда как для полу- получения вторичных связей нужно использовать также и лаг- лагранжевы уравнения движения. Если в нашей теории появляется вторичная связь, то мы получаем еще одно условие непротиворечивости, потому что мы можем вычислить величину х с помощью уравнения движения A.15) и потребовать, чтобы % »0. Таким образом, мы приходим еще к одному условию IX, Щ+ит[ъ Фт]^0. A.25)
1. МЕТОД ГАМИЛЬТОНА 419 Это условие нужно исследовать с тех же позиций, что и A.23). Мы снова должны выяснить, к какому из трех клас- классов оно относится. Если оно представляет собой условие второго класса, то мы должны продолжить процесс клас- классификации еще на один этап, поскольку здесь мы имеем добавочную вторичную связь. Мы продолжаем подобным образом до тех пор, пока не исчерпаем все условия непроти- непротиворечивости, и в качестве конечного результата у нас оста- останется ряд вторичных связей типа A.24) вместе с набором условий типа A.23), налагаемых на коэффициенты и. Во многих случаях мы будем рассматривать вторичные связи на равных основаниях с первичными. Удобно исполь- использовать для них следующее обозначение: ф/г^0, k = M + \,..., M + K, A.26) где К — полное число вторичных связей. Их следует запи- записывать, так же как и первичные связи, в виде слабых урав- уравнений, поскольку они также представляют собой уравнения, которыми мы не должны пользоваться до вычисления скобок Пуассона. Таким образом, всю совокупность связей можно записать так: J. A.27) Обратимся теперь коставшимся условиям третьего класса. Мы должны выяснить, какие ограничения они налагают на коэффициенты и. Эти условия суть [Фу, Я] + «т[фу, Фт1^0, A.28) где по индексу т суммирование проводится от 1 до М, а / принимает любое значение от 1 до </. Эти уравнения содер- содержат условия, которым должны подчиняться коэффициен- коэффициенты и, коль скоро данные уравнения не сводятся просто к связям. Посмотрим на эти уравнения с другой точки зрения. Предположим, что коэффициенты и неизвестны и A.28) представляет собой систему неоднородных линейных урав- уравнений относительно этих неизвестных и, коэффициентами в которых служат функции переменных q и р. Будем искать решение этой системы уравнений, которое даст нам и как функции от q и р, скажем, um = Um(q, p). A.29)
420 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Решение такого типа должно существовать, ибо обратное означало бы, что лагранжевы уравнения движения проти- противоречивы, и этот случай мы отбрасываем. Решение оказывается неоднозначным. Если у нас есть одно решение, мы можем прибавить к нему произвольное решение Vm (q, p) однородной системы уравнений, соответ- соответствующей A.28): Vm[<pJt Ф„] = 0, A.30) и получим таким способом другое решение неоднородной системы уравнений A.28). Мы хотим получить общее реше- решение уравнений A.28), а это означает, что мы должны рас- рассмотреть все независимые решения системы A.30), которые мы можем обозначить через V'ат (q, р), а = 1, ..., А. Тогда общее решение системы A.28) имеет вид Um=Um+VaVam, A.31) где коэффициенты va могут быть произвольными. Подставим эти выражения для и в полный гамильтониан A.22) нашей теории. Это даст нам следующее выражение для полного гамильтониана: Um4>m + VaVam<pm. A.32) Мы можем записать его как #г = Я' + иафа, A.33) гдз H' = H + Um<pm A.33а) и 4>a=Vam(fm. A.34) Используя полный гамильтониан A.33), мы по-прежнему будем иметь уравнения движения A.21). Проведенный анализ показывает, что мы удовлетворили всем требованиям непротиворечивости теории и все еще имеем произвольные коэффициенты и. Их число обычно меньше числа коэффициентов и. Коэффициенты и не произ- произвольны — они должны удовлетворять требованиям непроти- непротиворечивости, тогда как коэффициенты v являются произволь- произвольными величинами. Мы можем взять в качестве v произволь- произвольные функции времени, и тем не менее все требования нашей динамической теории будут выполняться.
1. МЕТОД ГАМИЛЬТОНА 421 В этом состоит отличие обобщенного гамильтонова фор- формализма от того, с которым мы знакомы из элементарной динамики. Здесь мы имеем произвольные функции времени, входящие в общее решение уравнений движения с заданными начальными условиями. Наличие этих произвольных функ- функций времени означает, что мы используем математический аппарат, содержащий произвольные характеристики, на- например координатную систему, которую можно выбрать некоторым произвольным образом, или калибровку в элек- электродинамике. В результате наличия этого произвола в мате- математическом аппарате динамические переменные в последую- последующие моменты времени не полностью определяются их началь- начальными значениями, и это проявляется в наличии произволь- произвольных функций в общем решении. Нам нужно ввести терминологию, которая отражала бы характер величин, встречающихся в формализме. Мне кажется полезной следующая терминология. Я называю, по определению, некоторую динамическую переменную R, являющуюся функцией от q и р, динамической переменной первого рода, если ее скобки Пуассона со всеми ф равны нулю: [R, Ф;]^0, /=1,..., J. A.35) Достаточно, если эти условия выполняются в смысле слабых равенств. В противном случае R относится к переменным второго рода. Если R является переменной первого рода, то величина [R, ц>,-] должна быть равна в сильном смысле некоторой линейной функции от ф, так как все, что слабо исчезает в настоящей теории, в сильном смысле равно некоторой линейной функции от величин ф. По определению Ф являются единственными независимыми величинами, слабо равными нулю. Поэтому мы имеем сильные уравнения [#, Фу] = О/'ФУ- A-36) Прежде чем переходить к дальнейшему, я хотел бы доказать следующую теорему. Теорема. Скобка Пуассона двух величин первого рода также является величиной первого рода. Доказательство. Пусть R и S — переменные первого рода. Тогда, согласно A.36), мы имеем [S, ф;]=$у/.фЛ. A.36а)
422 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Составим скобку Пуассона [[/?, S], (p;j. Мы должны раскрыть ее с помощью тождества Якоби A.13): Здесь мы использовали уравнения A.36) и A.36а), затем правило произведений A.12) и уравнение A.20). Вся эта величина слабо исчезает. Таким образом, мы доказали, что [/?, 5] является величиной первого рода. Мы имеем уже четыре различных типа связей. Мы можем разделить их на связи первого и второго рода совершенно независимо от их разделения на первичные и вторичные. Я хотел бы обратить ваше внимание на то, что величины Н' и (fa, определяемые согласно A.33а) и A.34), представ- представляют собой величины первого рода. Составив скобку Пуас- Пуассона фа с ф;-, мы получим, согласно A.34), Vam [фт, ф;1 плюс слабо исчезающие члены. Поскольку Vam по способу определения удовлетворяет уравнению A.30), фо есть вели- величина первого рода. Аналогично уравнение A.28) с заменой ит на Um показывает, что Н' — величина первого рода. Таким образом, выражение A.33) задает полный гамильто- гамильтониан в виде комбинации гамильтониана Н' — величины первого рода — и некоторых функций ф — также величин первого рода. Любая линейная комбинация ф, конечно, также является связью *), и если мы возьмем линейную комбинацию пер- первичных связей, то в результате получим еще одну первичную связь. Поэтому каждая из величин фа является первичной связью, и она относится к первому роду. Таким образом, в итоге мы выразили полный гамильтониан в виде суммы гамильтониана — величины первого рода — и линейной комбинации первичных связей первого рода. Число независимых произвольных функций времени, входящих в общее решение уравнений движения, равно числу значений, которые принимает индекс а. Оно равно *) Автор, введя выше понятие связей, т. е. соотношений типа Ф (q, p) = 0 (например, A.4)), здесь и далее применяет этот термин (связи) также и для обозначения самих величин ф (q, p). В прееводе эта особенность сохранена. (Прим. rupee.)
I. МЕТОД ГАМИЛЬТОНА 423 числу независимых первичных связей первого рода, потому что все независимые первичные связи первого рода входят в сумму A.33). Итак, мы обрисовали общую ситуацию. Мы пришли к ней, исходя именно из уравнений движения Лагранжа, переходя к гамильтониану и раскрывая вид условий непро- непротиворечивости. С практической точки зрения можно, исходя из свойств преобразования интеграла действия, указать, какие про- произвольные функции времени войдут в общее решение урав- уравнений движения. Каждой из этих функций времени должна соответствовать некоторая первичная связь первого рода. Поэтому мы можем заранее сказать, какими будут первич- первичные связи первого рода, не проводя вовсе подробного вы- вычисления скобок Пуассона; в практических приложениях данной теории мы, очевидно, сможем сберечь немало сил, используя этот метод. Я хотел бы продвинуться несколько дальше и рассмотреть еще одну характерную черту теории. Попытаемся понять с физической точки зрения такую ситуацию: мы исходим из заданных начальных значений переменных и получаем решение уравнений движения, содержащее произвольные функции. Нужные нам начальные значения переменных задаются для переменных q и р. Нам не нужно задавать начальные значения коэффициентов v. Начальные значения q и р соответствуют, как говорят физики, начальному физи- физическому состоянию системы. Физическое состояние опре- определяется только переменными q и р, а не коэффициен- коэффициентами V. Далее, начальное состояние должно определять состоя- состояния и в последующие моменты времени. Но значения пере- переменных q и р неоднозначно определяются в последующие моменты времени по начальным значениям, поскольку у нас появляются произвольные функции v. Это означает, что состояние неоднозначно определяет набор значений пере- переменных q и р, несмотря на то что этот набор q и р однозначно определяет состояние. Должно существовать несколько ва- вариантов выбора q и р, соответствующих одному и тому же состоянию. Таким образом, перед нами стоит задача отыскать все наборы значений переменных q и р, кото- которые соответствуют одному частному физическому сос- состоянию.
424 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Все эти значения переменных q и р в определенный мо- момент времени, которые могут получиться в результате раз- развития из одного начального состояния, должны соответ- соответствовать одному и тому же физическому состоянию в этот момент. Давайте возьмем некоторые частные начальные значения переменных q и р в момент времени t = 0 и по- посмотрим, какими будут значения q и р через небольшой про- промежуток времени 67. Значение произвольной динамической переменной g, имевшей начальное значение g0, в момент времени 6^ есть [g, фа]}. A.37) Коэффициенты v совершенно произвольны и находятся в нашем распоряжении. Предположим, что мы возьмем для этих коэффициентов иные значения, например и'. Это привело бы к другому значению g (8t), отличающемуся на , Фв]. A.38) Эту величину можно записать как где ea = M(va-v'a) A.40) представляет собой произвольное малое число, малое из-за наличия коэффициента 6( и произвольное ввиду того, что величины о и о' могут быть какими угодно. Мы можем изме- изменить все наши гамильтоновы переменные согласно правилу A.39), и новые гамильтоновы переменные будут описывать то же самое состояние. Это изменение гамильтоновых пере- переменных осуществляется путем бесконечно малого контакт- контактного преобразования с производящей функцией еафа. Мы приходим к тому заключению, что величины фа, впервые появляющиеся в теории как первичные связи первого рода, имеют следующий смысл: они в качестве производящих функций (генераторов) бесконечно малых контактных пре- преобразований приводят к таким изменениям переменных q и р, которые не связаны с изменением физического состояния. Однако это еще не конец. Можно продвинуться дальше в том же направлении. Предположим, что мы применяем
1. МЕТОД ГАМИЛЬТОНА 423 последовательно два таких контактных преобразования. Проведем сначала первое контактное преобразование с производящей функцией еасра, а затем второе контактное преобразование с производящей функцией уа'<р,у, где IV — некоторые новые малые коэффициенты. Мы получим окончательно g' = go + ea[g, 4>a] + ya'[g + Ha[g, фа], фа']. A.41) (Я сохраняю члены второго порядка, содержащие произве- произведения еу, но пренебрегаю членами второго порядка, про- пропорциональными е2 или у2. Это приближение является законным, и оно достаточно для наших целей. Я не хочу выписывать больше, чем мне на самом деле нужно для получения искомого результата.) Если последовательно применить два преобразования в обратном порядке, то мы получим a'[g, 4>a'] + ?a[g + ya'[g, фа'], фа]. A-42) Давайте, теперь вычтем один результат из другого. Разность будет равна &g=eaya' {[[g, фо], фа' - [[g, фа'], фа]}. A-43) На основании тождества Якоби A.13) это выражение сво- сводится к &g = Zaya'[g, [фа, фа']]- A.44) Величина Ag также должна соответствовать такому изме- изменению переменных q и р, которое не связано с изменением физического состояния, поскольку эта величина возникает в результате комбинации ряда процессов, в каждом из которых по отдельности физическое состояние остается неизменным. Таким образом, ясно, что можно использовать величину [Ф„, Фа-1 A.45) в качестве производящей функции бесконечно малого кон- контактного преобразования, которое не связано с изменением физического состояния. Вспомним теперь, что фа являются величинами первого рода, а поэтому скобки Пуассона для них слабо равны нулю и, следовательно, равны в сильном смысле некоторой
426 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ линейной комбинации величин ф. Эта линейная комбина- комбинация величин ср также должна быть первого рода согласно доказанной несколько ранее теореме, по которой скобка Пуассона двух величин первого рода также есть величина первого рода. Таким образом, мы видим, что преобразования, получае- получаемые таким путем и не связанные с каким-либо изменением физического состояния, представляют собой преобразова- преобразования, производящими функциями (генераторами) которых являются связи первого рода. Эти преобразования оказы- оказываются более общими, по сравнению с рассмотренными выше, лишь в одном отношении. Производящие функции, которые мы имели прежде, должны были быть первичными связями первого рода. Производящие функции, которые мы полу- получаем теперь, могут быть вторичными связями первого рода. Этот расчет показывает, что мы могли бы иметь вторич- вторичную связь первого рода в качестве производящей функции бесконечно малого контактного преобразования, которое приводит к изменению переменных q и р, но не связано с изменением состояния. Нам нужно было бы, ради полноты, провести еще одно небольшое исследование, которое показывает, что скобка Пуассона [#', ц>а] гамильтониана Н' (величины первого рода) со связью первого рода ф опять является линейной функцией связей первого рода. Снова можно показать, что эта величина оказывается возможной производящей функ- функцией для бесконечно малых контактных преобразований, которые не связаны с изменением состояния. Окончательный вывод состоит в том, что преобразова- преобразованиями динамических переменных, которые не связаны с изменением физических состояний, являются бесконечно малые контактные преобразования, производящая функция которых представляет собой первичную связь первого рода или, возможно, вторичную связь первого рода. Значитель- Значительная часть вторичных связей первого рода получается как A.45) или как \Н'', ц>а]. Возможно, по моему мнению, что все вторичные связи первого рода следует отнести к классу генераторов преобразований, которые не связаны с изме- изменением физического состояния, но мне не удалось доказать это. Мне также не удалось найти ни одного примера, в кото- котором имелись бы вторичные связи первого рода, порождаю- порождающие изменения физического состояния.
2. ПРОБЛЕМА КВАНТОВАНИЯ 427 ЛЕКЦИЯ 2 ПРОБЛЕМА КВАНТОВАНИЯ Мы пришли к представлению о том, что существуют опре- определенные преобразования переменных р и q, которые не связаны с изменением состояния и производящими функци- функциями которых служат вторичные связи первого рода. Это наводит на мысль о том, что уравнения движения следует обобщить так, чтобы изменения со временем динамической переменной g включали не только любые изменения, описы- описываемые уравнением A.21), но также и любые изменения, не связанные с изменением состояния. Таким образом, мы должны рассмотреть более общее уравнение движения k = lg, «в], B.1) где НЕ — обобщенный гамильтониан, являющийся суммой прежнего гамильтониана Нт и всех тех производящих функций (или генераторов) с произвольными коэффициен- коэффициентами, отвечающих преобразованиям, не связанным с изме- изменением состояния: HE = HT + v'0,ya,. B.2) Те генераторы <рО', которые не содержатся уже в Нт, будут вторичными связями первого рода. Присутствие новых чле- членов в гамильтониане приводит к добавочным изменениям динамической переменной g, но добавочным изменениям не соответствует никакое изменение состояния, поэтому такие члены определенно должны быть включены в гамильтониан, даже если мы не получаем добавочных изменений g при работе непосредственно с лагранжианом. Итак, мы приходим к обобщенной гамильтоновой теории. В том виде, в каком теория развита мною здесь, она приме- применима в случае конечного числа степеней свободы, однако ее нетрудно обобщить на случай бесконечного числа степеней свободы. Индексом, нумерующим степени свободы, у нас служит п = 1, ..., N; без особого труда можно сделать N бесконечным. Дальнейшее обобщение теории мы получим, считая, что число степеней свободы континуально беско- бесконечно. Этим я хочу сказать, что в качестве наших q и р можно взять переменные qx, рх, где х — индекс, который принимает непрерывные значения в некоторой области. Используя этот индекс х, мы должны заменить все наши
428 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ прежние суммы по п интегралами. С таким изменением можно непосредственно использовать все предыдущее рас- рассмотрение. Имеется только одно уравнение, с которым мы должны поступить несколько иначе, —это уравнение A.3), которое определяет импульсные переменные, Если п принимает все значения непрерывного спектра, то мы должны понимать под этим частным дифференцированием операцию частного функционального дифференцирования, которую можно точно определить следующим образом. Придадим скоростям в лагранжиане вариации bqx и поло- положим затем Ы^\рхЬЦх. B.3) Коэффициент при bqx, стоящий в подынтегральном выраже- выражении для 6L, есть по определению рх. После изложения этой общей абстрактной теории, я думаю, было бы полезно привести простой пример в качестве иллюстрации. Я возьму для этого электромагнитное поле Максвелла, заданное потенциалами А^. Динамические коор- координаты теперь представляют собой значения потенциалов во всех точках пространства в определенный момент вре- времени. Иными словами, динамическими координатами яв- являются АцХ, где индекс х отвечает трем координатам х1, х2, х3 точки в трехмерном пространстве в заданный момент вре- времени х° (а не четырем координатам х, используемым в теории относительности). Тогда в качестве динамических скоростей мы будем иметь производные по времени от динамических координат, и я буду обозначать их индексом 0 после запятой. Любой индекс с запятой перед ним означает дифференци- дифференцирование по общему правилу: Мы имеем дело со специальной теорией относительности, поэтому можно поднимать и опускать индексы согласно правилам этой теории: поднимая или опуская индексы 1, 2 или 3, мы должны менять знак, но, поднимая или опус- опуская индекс 0, знак менять не нужно.
2. ПРОБЛЕМА КВАНТОВАНИЯ 429 В качестве нашего лагранжиана для электродинамики Максвелла мы имеем (в единицах Хевисайда) ^F^ d3x. B.5) Здесь d?x означает произведение дифференциалов интегрирование ведется по всему трехмерному пространству и F^y — тензор электромагнитного поля, определяемый через потенциалы выражением ' (iv = "v, ц — "ц, V- B-6) Величина L является лагранжианом, поскольку интеграл от нее по времени есть интеграл действия максвелловского поля. Возьмем теперь этот лагранжиан и, применяя правила нашего формализма, перейдем к гамильтониану. Прежде всего мы должны ввести импульсы. Сделаем это посредством варьирования скоростей в лагранжиане. Взяв вариации скоростей, получим 8L = — у J F^ б/^ d3x = J Л10 6А^ 0 d'x. B.7) Далее, импульсы В^- определяются из выражения 6L = \ В» ЪАт dsx, B.8) и эти импульсы будут удовлетворять основному соотноше- соотношению со скобками Пуассона *) [А»х, ВЪ\=&Ь*\х-х'); ц, v = 0, 1,2, 3. B.9) Здесь А берется в точке х трехмерного пространства, В — в точке х' трехмерного пространства; g^ — просто символ Кронекера, а б3 (х — х') представляет собой трехмерную дельта-функцию от х — х'. *) Соотношения типа B.9) автор называет Poisson bracket relations, что в буквальном переводе звучит очень громоздко: соотношения со скобками Пуассона. Поскольку далее в тексте они многократно исполь- используются, то при переводе было принято сокращение: СП-соотношения, Такое решение этой небольшой терминологической проблемы, воз- возможно, не является лучшим, но оно представляется нам естественным, будучи близким по форме к своему квантовому аналогу — перестано' вочным соотношениям, (Прим. перге.)
430 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Сравнив выражения B.7) и B.8) для 6L, найдем В» = Я*°. B.10) Учтем, что тензор F^v антисимметричен: F^ = — Fv^. B.11) Таким образом, если мы возьмем jj, = 0 в B.10), то получим нуль. Итак, величина В1 равна нулю. Это — первичная связь. Я запишу ее в виде слабого равенства Д?я«0. B.12) Другие три импульса Вг (г — 1,2, 3) равны просто компонен- компонентам электрического поля. Я хотел бы напомнить вам, что равенство B.12) выражает не просто одну первичную связь — оно включает в себя утроенное бесконечное число первичных связей ввиду наличия индекса х, отвечающего некоторой точке трехмер- трехмерного пространства, и каждое значение х дает нам свою первичную связь. Введем теперь гамильтониан. Мы определим его обычным образом: d*x - L = j (РМЛ 0 т F rsFrs ~ i Fr°Fr0) ^ B.13) Окончательный вид этого выражения получен после выпол- выполнения интегрирования по частям. Это выражение для га- гамильтониана вовсе не содержит скоростей. В него входят только динамические координаты и импульсы. Правда, величины Frs содержат частные производные потенциалов, но эти частные производные берутся только по переменным хх, х2, Xs. При этом никаких скоростей не появляется. Такие частные производные являются функциями динамических координат. Мы можем теперь вывести условия непротиворечивости с помощью первичных связей B.12). Поскольку условия
2. ПРОБЛЕМА КВАНТОВАНИЯ 431 B.12) должны выполняться всегда, величина [В0, Н] обязана равняться нулю. Это ведет к уравнению В;^0. B.14) Оно снова является связью, так как в него вовсе не входят скорости. Это — вторичная связь, возникающая таким путем в теории Максвелла. Продолжая проверять условия непротиворечивости, мы должны раскрыть равенство [в;_ //] = 0. B.15) Мы найдем, что оно сводится к тождеству 0 = 0. Это равен- равенство не дает нам ничего нового и выполняется автомати- автоматически. Мы, следовательно, получили все связи в нашей зада- задаче. Условие B.12) дает первичную связь; B.14) выражает вторичную связь. Нам нужно выяснить теперь, первого или второго рода эти связи; мы найдем без труда, что все они первого рода. Действительно, величины Во являются импульсными пере- переменными. Скобки Пуассона их друг с другом все равны нулю. Также и для В,гг и Во скобки Пуассона их друг с дру- другом обращаются в нуль. Это же справедливо и для В,ггх с В/г ,. Поэтому все эти величины являются связями первого рода. В электродинамике Максвелла связи второго рода отсутствуют. Выражение B.13) определяет Н как величину первого рода, поэтому гамильтониан Н можно взять в качестве Н' в формуле A.33). Посмотрим теперь, чему равен полный гамильтониан: Нт = J A F"Frs + \ BrBr) l \ B.16) Функция vx представляет собой произвольный коэффициент в каждой точке трехмерного пространства. Мы всего лишь добавили здесь первичные связи первого рода с произволь- произвольными коэффициентами, что мы обязаны были сделать, согласно правилам построения полного гамильтониана. Зная полный гамильтониан, мы получаем уравнения дви- движения в стандартной форме A.21): *«*[*, Яг].
432 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Величина g здесь может быть какой-либо характеристикой поля в некоторой точке х трехмерного пространства или может быть также функцией переменных поля в различных точках трехмерного пространства. Она может быть, напри- например, интегралом по трехмерному пространству. Эта величина g в самом общем смысле может быть любой функцией q и р во всем трехмерном пространстве. Допустимо взять g — Ао, и тогда мы получим A0,0 = v, B.17) поскольку скобки Пуассона для Ло с любой величиной, за исключением В0, входящей в последний член в B.16), обращаются в нуль. Отсюда выясняется смысл произволь- произвольного коэффициента vx, имеющегося в полном гамильтониане. Это производная по времени от Ао. 'Далее, чтобы получить физически допустимое движение самого общего вида, мы должны перейти к обобщенному гамильтониану. Для этого мы добавляем вторичные связи первого рода с произвольными коэффициентами их и полу- получаем обобщенный гамильтониан НЕ = Нт + \ихВ'г&гх. B.18) Включение в гамильтониан добавочного члена делает воз- возможным движение более общего типа. При этом становятся допустимыми новые изменения переменных q и р такие, как преобразования калибровки. Это добавочное изменение переменных q и р приводит к новому набору q и р, который должен соответствовать тому же самому состоянию. К такому результату мы приходим, преобразуя в соот- соответствии с нашими правилами теорию Максвелла к гамиль- тоновой форме. После того как мы дошли до рассматривае- рассматриваемого этапа этой процедуры, мы видим, что имеется возмож- возможность некоторого упрощения. Это упрощение возможно потому, что переменные Ао и Во не имеют никакого физичес- физического смысла. Посмотрим, что вытекает для Ло и Во из урав- уравнений движения. Переменная Во = 0 в любой момент вре- времени. Это неинтересно. Переменная Ло есть величина, про- производная по времени от которой совершенно произвольна. Это снова неинтересно. Переменные Ао и Во, следовательно, не представляют для нас никакого интереса. Мы можем устранить их из теории, и это приведет к упрощенному гамильтонову формализму, в котором у нас меньше степе-
2. ПРОБЛЕМА КВАНТОВАНИЯ 433 ней свободы, но по-прежнему сохранены все степени свободы, интересные с физической точки зрения. Чтобы провести это «изгнание» переменных Ао и Во, опустим член ихВ° в гамильтониане. Этот член просто обес- обеспечивал возможность произвольного изменения Ао. Член ¦— А0В,гг в гамильтониане Hj можно скомбинировать со сла- слагаемым ихВ/г в обобщенном гамильтониане. В любом случае коэффициент их является произвольным. Скомбинировав эти два члена, мы просто заменяем коэффициент их на столь же произвольный коэффициент и'х = их — Ао. Таким обра- образом, мы получаем новый гамильтониан Н = I (т Frsprs + y BrBr) dH + J uxB,rr dsx. B.19) Этот гамильтониан вполне позволяет найти уравнения дви- движения для всех физически интересных переменных. Пере- Переменные Ло и Во уже больше не входят в него. Таков гамиль- гамильтониан теории Максвелла в его простейшем виде. Обычный гамильтониан, с которым работают в квантовой электродинамике, не вполне совпадает с этим. Его форма основывается на теории, развитой первоначально Ферми. Теория Ферми содержит ограничение, налагаемое на потен- потенциалы, ДЦ = О. B.20) Наложение такого ограничения на выбор калибровки вполне допустимо. Гамильтонова теория, развиваемая мною здесь, не содержит такого ограничения, так что в ней разрешен совершенно произвольный выбор калибровки. Таким обра- образом, данная теория несколько отличается от формализма Ферми. В нашем формализме во всей полноте выявляются трансформационные свойства теории Максвелла при самых общих градиентных преобразованиях. Теория Максвелла здесь иллюстрирует общие идеи относительно первичных и вторичных связей. Я хотел бы теперь вернуться к общей теории и рассмот- рассмотреть проблему квантования гамильтоновой теории. Чтобы обсудить этот вопрос о квантовании, возьмем сначала слу- случай, когда все связи являются связями первого рода, а связи второго рода отсутствуют. Мы считаем наши динамические переменные q и р операторами, удовлетворяющими переста- перестановочным соотношениям, соответствующим СП-соотноше-
434 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ ниям классической теории. Это совершенно ясно. Затем мЫ вводим уравнение Шредингера И1-$ = Н% B.21) где if> — волновая функция, на которую действуют опера- операторы q и р. Оператор Н' представляет собой гамильтониан — величину первого рода в нашей теории. Далее мы налагаем на волновую функцию некоторые дополнительные условия, а именно: Ф;1|; = 0. B.22) Каждая из наших связей, таким образом, приводит к допол- дополнительному условию для волновой функции. (Напомним, что все связи сейчас первого рода.) Первое, что мы должны сделать теперь, — это проверить, согласуются ли между собой уравнения для ip. Возьмем два из дополнительных условий и посмотрим, нет ли противоре- противоречия между ними. Рассмотрим B.22) и ф/<г|> = 0. B.22а) Умножив B.22) на qy, получим Ф/'ФЛ|> = 0, B.23) а умножив B.22а) на ф;-, найдем Ф;.ф,,г|з = О. B.23а) Вычитая одно равенство из -другого, имеем [ф/. ФгИ> = 0. B.24) Это есть дополнительное условие, налагаемое на г|з, которое должно выполняться для непротиворечивости. Но мы не хотим иметь никаких новых условий для \р. Мы хотим, чтобы все требования, которым должна подчиняться г|з, содержа- содержались в B.22). Иначе говоря, мы хотим, чтобы B.24) следо- следовало из B.22), а это означает, что мы требуем выполнения равенства [ф/. Ф/'] = с//'/"ф/". B.25) Если равенство B.25) действительно выполняется, то B.24) является следствием B.22), а не новым условием, налагае- налагаемым на волновую функцию. Далее мы знаем, что в классической теории все связи ф первого рода, а это значит, что в этом случае скобка Пуас-
2. ПРОБЛЕМА КВАНТОВАНИЯ 435 сона любых двух связей ср равна линейной комбинации ср. Переходя к квантовой теории, мы должны получить подоб- подобное равенство, справедливое для коммутатора, но при этом совсем не обязательно должно следовать, что все коэффи- коэффициенты с стоят слева. Нам нужно, чтобы все коэффициенты с находились слева, ибо в общем случае они будут функциями координат и импульсов и не будут коммутировать с ф в квантовой теории; B.24) будет являться следствием B.22) только при условии, что все коэффициенты с стоят слева. При введении в квантовую теорию величин ф может появиться некоторая неоднозначность. Соответствующие классические выражения могут содержать величины, не коммутирующие в* квантовом" случае, и тогда мы должны решить вопрос, в каком порядке ставить множители в кван- квантовой теории. Нужно попытаться подобрать такое располо- расположение этих множителей, чтобы было справедливо равенство B.25) и все коэффициенты с в правой части B.25) стояли бы слева. Если мы сможем это сделать, то тогда все дополни- дополнительные условия будут согласованы друг с другом. Если же это сделать не удастся — тогда нам не везет и мы не в состоя- состоянии построить последовательную квантовую теорию. Во всяком случае, мы имеем первое приближение квантовой теории, ибо наши уравнения вполне удовлетворительны,если рассматривать их только с точностью до первого порядка по постоянной Планка К и пренебречь величинами порядка Ь,г. Я обсудил сейчас требования, предъявляемые к допол- дополнительным условиям для согласования их друг с другом. Подобное же рассмотрение следует провести, чтобы прове- проверить непротиворечивость дополнительных условий уравне- уравнению Шредингера. Если мы возьмем волновую функцию г|), которая удовлетворяет дополнительным условиям B.24), и предположим, что она изменяется со временем согласно уравнению Шредингера, то будет ли наша функция г|) по истечении небольшого промежутка времени по-прежнему удовлетворять дополнительным условиям? Мы можем уста- установить, что это имеет место при выполнении следующего требования: [Фу, #]г|) = 0; B.26) оно означает, что если мы не хотим получить новое до- дополнительное условие, коммутатор [фу, Я] должен быть
436 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ некоторой линейной функцией величин ф, т. е. [Ф„ Н] = Ь,^,, B.27) Снова мы пришли к уравнению, выполняющемуся, как нам известно, в классической теории. Величины ф7- и Н отно- относятся к первому роду, поэтому скобка Пуассона для них слабо исчезает. Таким образом, скобка Пуассона в класси- классической теории равна в сильном смысле некоторой линейной функции величин <р. Снова мы должны попытаться найти такое взаимное расположение величин, чтобы в соответ- соответствующем квантовом уравнении все наши коэффициенты стояли слева. Это необходимо для построения последова- последовательной квантовой теории, но, вообще говоря, для того чтобы это сделать, нужна известная доля удачи. Рассмотрим теперь задачу о квантовании гамильтоновой теории^ в которой есть связи второго рода. Этот вопрос мы сначала обсудим на простом примере. В качестве последнего мы можем взять две связи второго рода ^я«0 и pj.^0. B.28) Если в теории появляются эти связи, то, так как они отко- откосятся ко второму роду, их скобка Пуассона будет отлична от нуля. Что можно сделать с ними при переходе к кванто- квантовой теории? Мы не можем налагать B.28) в качестве допол- дополнительного условия на волновую функцию, как это мы делали со связями первого рода. Если мы попытаемся положить <7i»|> = 0 и Pi$ ='0, то мы немедленно придем к противоречию, поскольку мы должны были бы иметь Следовательно, так поступать нельзя. Мы должны принять какой-то другой план действий. В данном простом случае совершенно очевидно, каким должен быть этот план. Переменные qx и рх не представляют интереса, раз они могут иметь только нулевые значения. Поэтому степень свободы с номером 1 не имеет никакого значения. Мы можем отбросить степень свободы 1 и рабо- работать с другими степенями свободы. Это сводится к другому определению скобок Пуассона. Нам нужно использовать следующее определение скобок Пуассона в классической теории: rt пл _ К ат1 _ dL iH (9 29)
2. ПРОБЛЕМА КВАНТОВАНИЯ 437 Здесь суммирование проводится по п — 2, ..., N. Этого будет достаточно, поскольку здесь учитываются все физи- физически интересные переменные. После этого мы могли бы просто взять qx и pj тождественно равными нулю. В этом нет никакого противоречия, и мы можем переходить к кван- квантовой теории, формулируя ее только для системы со сте- степенями свободы п = 2, ..., N. В данном простом случае совершенно ясно, что нужно сделать для построения квантовой теории. Попытаемся теперь рассмотреть более общий случай. Предположим, что мы имеем pi^O, qx^f{qr, Pr), r = 2, ..., N; здесь / является произвольной функцией всех других пере- переменных q и р. Мы можем подставить / (qr, pr) вместо qx в гамильтониан и во все другие связи и таким образом устранить степень свободы с номером 1. О ней можно забыть и просто рассматривать другие степени свободы, а затем перейти к квантовой теории для системы с этими остальными степенями свободы. Нам снова придется использовать скобки Пуассона типа B.29), в которых учитываются только остающиеся степени свободы. Этот прием используется при квантовании теории, содер- содержащей связи второго рода. Существование связей второго рода означает, что' имеются некоторые степени свободы, несущественные с физической точки зрения. Мы должны выявить эти степени свободы и определить новые скобки Пуассона, в которых учитываются только остающиеся сте- степени свободы, имеющие физическое значение. Тогда с по- помощью этих новых скобок Пуассона мы сможем перейти к квантовой теории. Я хотел бы обсудить общую процедуру выполнения этой задачи. Вернемся пока к классической теории. Мы имеем ряд связей ф;- я« 0; некоторые из них относятся к первому роду, некоторые — ко второму. Мы можем заменить эти связи независимыми линейными комбинациями их, которые будут ничем не хуже первоначальных связей. Попытаемся подо- подобрать линейные комбинации таким образом, чтобы свести как можно больше связей к связям первого рода. Может остаться некоторое число связей второго рода, составляя линейные комбинации которых мы уже не сможем получить связей первого рода. Эти оставшиеся связи второго рода
138 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ я обозначу через %s, s = 1, ..., S. Таким образом, 5 есть число связей второго рода, никакая линейная комбинация которых не относится к первому роду. Рассмотрим такие оставшиеся связи второго рода и соста- составим скобки Пуассона для всех их друг с другом, а затем построим из этих скобок Пуассона детерминант А: О [Ха- Xil Хи Ха] О Г/!- Хз] 1X2- Хз] [Х2 [Xs-Хг] [Xs-Хз] Теперь я хочу доказать следующую теорему. Теорема. Детерминант "Д не обращается в нуль даже в слабом смысле. Доказательство. Предположим, что детерминант обра- обращается в нуль. Я хочу показать, что это допущение приво- приводит к противоречию. Если детерминант исчезает, то его ранг равен Т < S. Построим тогда другой детерминант: Xi Ха О [Ха. Xi] [Xi> 7л] О 1X2. Xil tX r+i' Xal [X Г+1' Он имеет 7+ 1 строк и столбцов. Число Г+ 1 может рав- равняться 5 или может быть меньше S. При разложении детер- детерминанта А по элементам его гГервого столбца каждый из этих элементов умножается на один из миноров А. Мне нужно, чтобы не все эти миноры обращались в нуль. Может все же случиться так, что они исчезают все. В таком случае следует выбрать иным образом набор величин %, входящих в А. Всегда должен существовать некоторый способ такого выбора х, входящих в А, при котором не все миноры исче- исчезают, ибо ранг А равен Т. Поэтому мы выбираем % таким образом, чтобы коэффициенты при элементах первого стол- столбца не все обращались в нуль. Теперь я покажу, что скобки Пуассона детерминанта А с любой из величин ср равны нулю. Если мы хотим составить скобку Пуассона <р с детерминантом, то искомый результат мы получим, взяв скобку Пуассона ср с первым столбцом детерминанта, прибавив к этому скобку Пуассона ф со
2. ПРОБЛЕМА КВАНТОВАНИЯ 439 вторым столбцом, и т. д. Таким образом, имеем [ф- [ф. [ф. Х [7.2. Xi Ул О [ф'[Х2- Xi Ха О 7а. Xil [ф> Хг + i fXr+i- Xi] [ф' hr + v XalJ Результат выглядит довольно громоздко, но нетрудно заме- заметить, что каждый из этих детерминантов обращается в нуль. Прежде всего исчезает первый детерминант в правой части. Действительно, если ф относится к первому роду, то тогда обращается в нуль первый столбец; если ср относится ко второму роду, то тогда ф представляет собой одну из вели- величин %, и мы имеем детерминант, являющийся частью детер- детерминанта Д из Т -f- 1 строк и столбцов. Но, по предположе- предположению, ранг Д равен Т, поэтому любая его часть с Т + 1 строками и столбцами обращается в нуль. Далее, второй детерминант в правой части слабо исчезает, ибо слабо исчезает его первый столбец. Аналогичным образом все другие детерминанты слабо обращаются в нуль. В резуль- результате вся правая часть равна нулю в слабом смысле. Таким образом, детерминант А является величиной, скобки Пуас- Пуассона которой с любой из величин ф слабо равны нулю. Кроме того, мы можем разложить детерминант А по элементам его первого столбца и получить А в виде линей- линейной комбинации величин %. Таким образом, мы пришли к тому результату, что скобки Пуассона некоторой линей- линейной комбинации % со всеми ф равны нулю. Это значит, что данная линейная комбинация ф относится к первому роду. Такой вывод противоречит нашему предположению о том, что мы выявили все, какие только есть, связи первого рода. Тем самым теорема доказана. Попутно выясняется, что число остающихся связей %, которые нельзя отнести к первому роду, должно быть чет- четным, потому что детерминант Д антисимметричен. Любой антисимметричный детерминант с нечетным числом строк и столбцов обращается в нуль. Рассматриваемый детерми-
440 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ нант не исчезает, а потому должен иметь четное число строк и столбцов. Ввиду того что детерминант Д не равен нулю, мы можем ввести матрицу css<, обратную той, чей детерминант есть Д. Определим матрицу css- с помощью уравнения Дадим теперь новое определение скобок Пуассона, соот- соответствующее этому формализму: для любых двух величин | и г) новая скобка Пуассона определяется как [S, Л]* = К, T|]-[S. ts]Css' [Xs't Т|]. B.31) Нетрудно проверить, что определенные таким образом новые скобки Пуассона подчиняются всем правилам обычных скобок Пуассона: скобка [|, г\\* антисимметрична относи- относительно | и т), линейна по | и по т), для нее имеет место правило произведений [^Е2, т]]* = ^ [?2, т]]* + Hi, i\l*l2, и она удовлетворяет тождеству Якоби [[?, т)]*, ?]* -f + [[т], ?К ?1* + [[?. II*. л]* = 0. Я не знаю никакого изящного способа доказательства тождества Якоби для новых скобок Пуассона. Если мы просто подставим соот- соответствующие выражения и раскроем их путем довольно сложных выкладок, то найдем, что все члены взаимно уничтожаются и левая часть будет равна нулю. Я думаю, что должен существовать какой-то более прозрачный спо- способ доказательства этого тождества, но мне не удалось его отыскать. Прямой метод описан мною *). Эту задачу также рассматривал Бергманн **). Посмотрим теперь, что можно сделать, имея эти новые скобки Пуассона. Прежде всего я хотел бы отметить, что уравнения движения по-прежнему справедливы с новыми скобками Пуассона, коль скоро они верны при первоначаль- первоначальном определении скобок Пуассона. Так как все члены вида [%S', HT\ слабо обращаются в нуль и Нт является величиной первого рода, то [g, HT]* = [g, Hr]-[g, Xs]Css'[b', HT]^\g, Hr]. *) D i г а с Р. А. М. — Can. Journ. of Math., 1950, v. 2, p. 147, **) Bergmann P. G., Goldberg I, — Phys, Rev., 1955, v. 98, p. 531,
2. ПРОБЛЕМА КВАНТОВАНИЯ 441 Таким образом, мы можем написать g**[g, Яг]*. Теперь, если мы возьмем произвольную функцию 1 любых переменных q и р и составим новую скобку Пуассона ее с одной из величин %, скажем ^», то с учетом определения B.30) получим [I, Xs"]* = [l, %s]-[l, Xs]Css'[b',Xs"] = = [1. эИ-Е, x*]6s,- = o. Следовательно, мы можем положить величины % равными нулю до вычисления новых скобок Пуассона. Это означает, что равенство Х» = 0 B.32) можно рассматривать как равенство в сильном смысле. Модифицируя таким способом нашу классическую теорию и вводя эти новые скобки Пуассона, мы подготавливаем почву для перехода к квантовой теории. Затем мы ставим перестановочные соотношения в соответствие новым СП- соотношениям и считаем сильные равенства B.32) уравне- уравнениями для операторов квантовой теории. Тем самым осу- осуществляется переход к квантовому случаю. Остающиеся слабые уравнения — все первого рода; они снова становятся дополнительными условиями, налагаемыми на волновые функции. Ситуация оказывается теперь аналогичной преды- предыдущему случаю, в котором имелись только связи ср первого рода. Следовательно, мы опять развили метод квантования нашей общей классической теории в гамильтоновой форме. Конечно, снова нужно, чтобы нам повезло, и тогда мы смо- сможем сделать так, чтобы все коэффициенты стояли слева в условиях непротиворечивости. Этим завершается построение общего метода квантова- квантования. Отметим, что при переходе к квантовой теории разли- различие между первичными и вторичными связями теряет всякое значение; оно в значительной мере зависит от вида исход- исходного лагранжиана. Коль скоро мы перешли к гамильтопову формализму, мы фактически можем забыть о различии между первичными и вторичными связями. Различие же между связями первого и второго рода является очень важ-
442 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ ным. Мы должны отнести как можно больше связей к пер- первому роду и ввести новые скобки Пуассона, которые позво- позволят нам рассматривать остающиеся связи второго рода как сильные. лекция з КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ Мы исходили из классического принципа действия. Наш интеграл действия мы взяли лоренц-инвариантным. Из этого интеграла действия получили лагранжиан. Затем мы перешли от лагранжиана к гамильтониану и далее, следуя определенным правилам, к квантовой теории. Таким образом, мы начали с классической теории поля, в основе которой лежит принцип действия, и пришли в конце концов к квантовой теории поля. Вы могли бы подумать теперь, что на этом наша работа завершена. Имеется, однако, еще один важный вопрос, который необходимо рассмотреть, а именно: является ли наша квантовая теория поля, по- построенная таким способом, релятивистской теорией? При обсуждении можно ограничиться специальной теорией отно- относительности. Итак," мы должны выяснить, согласуется ли наша квантовая теория со специальной теорией относитель- относительности. Мы исходили из принципа действия и требовали, чтобы наш интеграл действия был лоренц-инвариантным. Этого достаточно для обеспечения релятивистского характера на- нашей классической теории. Уравнения движения, вытекаю- вытекающие из лоренц-инвариантного принципа действия, обязаны быть релятивистскими уравнениями. Правда, когда мы преобразовываем эти уравнения движения к гамильтоновой форме, то нарушаем четырехмерную симметрию. Мы пред- представляем наши уравнения в виде A.21) g^[g, Нг]. Здесь точка сверху означает операцию d/dt и относится к одному абсолютному времени, так что классические урав- уравнения движения в гамильтоновой форме не являются реля- релятивистскими по внешнему виду, но мы знаем, что они должны быть релятивистскими по существу, потому что они выве- выведены на основе релятивистских допущений.
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 443 Однако при переходе к квантовой теории мы делаем новые предположения. Выражение для Нт, которое мы имеем в классической теории, не определяет квантовый гамильто- гамильтониан однозначно. Мы должны решить, в каком порядке расположить некоммутирующие сомножители в квантовой теории. Выбор этого способа упорядочения находится в нашем распоряжении, и поэтому мы принимаем новые допущения. Эти новые допущения .могут нарушить реляти- релятивистскую инвариантность теории, так что квантовая теория поля, полученная с помощью этого метода, не обязательно будет согласовываться с требованиями теории относитель- относительности. Теперь перед нами стоит задача выяснить, каким образом мы можем обеспечить релятивистский характер нашей квантовой теории. С этой целью вернемся к исходным принципам. Уже недостаточно рассматривать только одну временную пере- переменную, отвечающую одному частному наблюдателю; мы обязаны включить в рассмотрение различных наблюдателей, движущихся друг относительно друга. Мы должны построить квантовую теорию, в равной мере пригодную для любого из этих наблюдателей, т. е. для произвольного выбора оси времени. Чтобы создать теорию, которая могла бы включать различные временные оси, мы должны сначала получить соответствующую классическую теорию и затем по стандарт- стандартным правилам перейти от этой классической теории к кван- квантовой. Я хотел бы вернуться к начальной стадии развития на- нашего гамильтонова формализма и рассмотреть частный слу- случай. Мы начинали с того, что выбирали лагранжиан L, являющийся функцией динамических координат и скоростей q и ц, вводили импульсы, а затем определяли гамильтониан. Возьмем теперь частный случай, когда L представляет собой однородную функцию первого порядка от скоростей д. Тогда по теореме Эйлера **wrL- (ЗЛ) Отсюда сразу следует, что pnqn — L = 0. Таким образом, мы получаем здесь гамильтониан, равный нулю. В этом случае у нас обязательно есть первичные связи. Одна первичная связь определенно существует, так как импульсы р являются однородными функциями нулевого порядка от скоростей, т. е. функциями только отношений
444 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ скоростей. Число импульсов р равно N — числу степе- степеней свободы, а число отношений скоростей есть N — 1. Af функций от Л' — 1 отношений скоростей не могут быть неза- независимыми. Должна быть по крайней мере одна функция р и q, которая равна нулю, т. е. должна существовать по крайней мере одна первичная связь. Их вполне может быть больше, чем одна. Ясно также, что если при равном нулю гамильтониане мы имеем вообще какое-нибудь дви- движение, то должна существовать по крайней мере и одна первичная связь первого рода. Для полного гамильтониана мы имеем выражение A.33) - цт = Н' + иафа- Гамильтониан Н' должен быть величиной первого рода, и, так как 0, несомненно, является величиной первого рода, мы можем взять Н' = 0. В таком случае наш полный га- гамильтониан целиком составлен из первичных связей первого рода с произвольными коэффициентами #т- = »«Ф«, C.2) откуда видно, что должна существовать по крайней мере одна первичная связь первого рода, если мы вообще хотим иметь какое-нибудь движение. Уравнения движения выглядят тогда следующим обра- образом: g^Valg, фа]- Очевидно, все величины g можно умножить на произволь- произвольный множитель, так как коэффициенты v произвольны, и, следовательно, в них всегда можно включить этот множи- множитель. Умножение же всех dg/dt на некоторую величину означает, что мы переходим к другой шкале отсчета вре- времени. Таким образом, в этом случае мы имеем гамильтоновы уравнения движения, в которых шкала отсчета времени произвольна. Мы могли бы ввести другую временную пере- переменную т. вместо t и получить, используя т, уравнения дви- движения вида i%~Va[g, Фа]- C.3) Итак, мы имеем теперь гамильтонову систему уравнений движения, в которой отсутствует абсолютная временная переменная. Любую переменную, монотонно возрастающую
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 445 с увеличением t, можно использовать в качестве времени, и уравнения движения останутся той же самой формы. Та- Таким образом, для гамильтоновой теории, в которой гамиль- гамильтониан Н' равен нулю и вообще любой гамильтониан слабо равен нулю, характерной чертой является отсутствие абсо- абсолютного времени. Мы можем подойти к рассматриваемому вопросу также с точки зрения принципа действия. Если / — интеграл действия, то / = JL(9, q)dt = $L(q, ?)dx, C.4) ибо L является однородной функцией первого порядка от dq/dt. Поэтому мы можем выразить интеграл действия через т совершенно в том же виде, как и через t. Это показывает, что уравнения движения, вытекающие из принципа дейст- действия, должны быть инвариантны относительно перехода от t к т — уравнения движения не связаны ни с каким абсолют- абсолютным временем. Мы имеем, таким образом, специальную форму гамиль- гамильтоновой теории; однако на самом деле эта форма является не такой уж специальной, ибо при любом исходном гамиль- гамильтониане всегда можно взять временную переменную в ка- качестве добавочной координаты и преобразовать теорию к такой форме, в которой гамильтониан слабо равен нулю. Делается это по следующему общему правилу. Мы берем время t и считаем его новой динамической координатой, обозначаемой q0. Строим новый лагранжиан L - dx L\q' dqo/dx)~L \q>" dx j' F-°> k = 0, 1, 2,..., N. Здесь L* содержит на одну степень свободы больше, чем исходный лагранжиан L. Лагранжиан L* не равен L, но Поэтому действие оказывается тем же самым, выражается ли оно через L* и т или через L и t. Таким образом, для любой динамической системы мы можем рассматривать время как добавочную координату q0 и затем перейти к новому лагранжиану L*, содержащему на одну степень свободы больше и представляющему собой однородную функцию
446 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ первого порядка от скоростей. Лагранжиан L* дает нам гамильтониан, равный нулю в слабом смысле. Этот специальный случай гамильтонова формализма, когда гамильтониан слабо обращается в нуль, и есть то, что нам нужно для релятивистской теории, поскольку мы не хотим в релятивистской теории иметь какое-нибудь одно выделенное время, играющее особую роль; желательно иметь возможность рассматривать различные времена т, которые все должны быть равноправны. Посмотрим теперь более подробно, как можно воспользоваться этой идеей. Мы хотим рассмотреть со- состояния в некоторых заданных системах отсчета времени, от- отвечающих различным наблю- наблюдателям. Теперь изобразим пространство-время так, как показано на рис. 1. Состоя- Состояние в определенный момент времени задается физическими условиями на трехмерной пло- плоской пространственноподобной поверхности Sb ортогональ- ортогональной оси времени. Состояние в другие моменты времени ха- характеризуется физическими условиями на других по- поверхностях 52, S3, ... Далее мы хотим ввести другие системы отсчета времени, отвечающие различным наблюда- наблюдателям, и состояние, рассматриваемое относительно новых временных осей, будет характеризоваться физическими условиями на других плоских пространственноподобных поверхностях типа 51. Мы хотим иметь такую гамильтс>нову теорию, которая давала бы нам возможность переходить от состояния, скажем, Slt к состоянию 51. Исходя из задан- заданных начальных условий на поверхности S± и используя уравнения движения, мы должны суметь получить физичес- физические условия на поверхности 5[. Таким образом, движению поверхности должны отвечать четыре степени свободы; одна, соответствующая перемещению поверхности парал- параллельно самой себе, и, кроме того, три степени свободы, соот- соответствующие произвольному изменению направления нор- нормали к этой плоской поверхности. Это означает, что в реше- S, х'хгх3 Рис. 1.
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 447 ние уравнении движения, которые мы стремимся отыскать, будут входить четыре произвольные функции. Таким обра- образом, нам нужна гамильтонова теория с (по крайней мере) четырьмя первичными связями первого рода. Могут существовать и другие первичные связи первого рода, если имеются степени свободы движения иного типа, например, если возможны градиентные преобразования электродинамики. Чтобы упростить обсуждение, я прене- пренебрегу этой возможностью существования других первичных связей первого рода и буду рассматривать только те связи, которые обусловлены требова- требованиями теории относительности. Мы могли бы продолжить построение теории, относящейся к этим плоским пространствен- ноподобным поверхностям, кото- которые могут двигаться с четырь- четырьмя степенями свободы, но мне бы хотелось рассмотреть снача- сначала более общую теорию, в кото- которой мы будем интересоваться состоянием, определенным на произвольной искривленной про- странственноподобной поверх- поверхности типа S на рис. 2. Она представляет собой трехмерную поверхность в простран- пространстве-времени, обладающую тем свойством, что она везде пространственноподобна, т. е. нормаль к поверхности нахо- находится внутри светового конуса. Мы можем построить гамильтонову теорию, описывающую изменение физических условий при переходе от какой-либо одной искривленной пространственноподобной поверхности к другой, близлежа- близлежащей. Вводить в рассмотрение искривленные поверхности, однако, вовсе не обязательно с точки зрения специальной теории относительности. Если бы мы хотели включить в нашу теорию гравитационные поля и принципы общей теории относительности, то тогда использование этих искривленных поверхностей имело бы полный смысл, но в случае специальной теории относительности искривлен- искривленные поверхности не обязательны. Однако я предпочитаю ввести их на данном этапе уже при обсуждении в рамках Рис. 2.
448 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ специальной теории относительности, так как я считаю, что объяснить основные идеи легче при использовании искрив- искривленных поверхностей, а не плоских. Объясняется это тем, что, работая с такими искривленными поверхностями, мы можем производить локальные деформации поверхности, подобные 8S на рис. 2, и исследовать изменения уравнений движения, связанные с этими локальными деформациями поверхности. Один из возможных путей дальнейшего развития таков: мы можем задать интеграл действия на совокупности искрив- искривленных поверхностей типа 5, найти разность интегралов действия для двух соседних поверхностей, разделить эту разность на некоторый параметр бт, служащий мерой рас- расстояния между двумя соседними поверхностями, взять этот результат в качестве нашего лагранжиана и затем, при- применив наш стандартный метод, перейти от лагранжиана к гамильтониану. Наш лагранжиан обязательно был бы однородной функцией первого порядка от скоростей, выра- выраженных в виде производных по временному параметру т, характеризующему переход от одной из этих пространствен- ноподобных поверхностей к другой, соседней. В результате мы пришли бы к гамильтоновой теории с гамильтонианом, слабо равным нулю. Однако я не хочу проделывать всю эту работу и вда- вдаваться в подробности процедуры, в основе которой лежит принцип действия. Я хочу сократить этот путь и обсудить характер получающейся в конечном счете гамильтоновой теории. Мы можем извлечь довольно много сведений отно- относительно характера гамильтоновой теории просто из того, что, как мы знаем, должны существовать степени свободы, отвечающие произвольному движению пространственно- подобной поверхности, при условии, что она всегда остается пространственноподобной. Этим степеням свободы, отвечаю- отвечающим движению пространственноподобной поверхности, дол- должны соответствовать в гамильтониане первичные связи первого рода, по одной первичной связи первого рода для каждого типа элементарных движений поверхности, кото- которые можно ввести. Я разовью теорию с этой точки зрения. Прежде всего мы должны ввести подходящие динамичес- динамические переменные. Будем описывать точку на пространственно- пространственноподобной поверхности 5 тремя криволинейными координа- координатами (х1, х2, Xs) = (л:'). Чтобы задать положение этой про-
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 449 странственноподобнои поверхности в пространстве-времени, введем другой набор координат уА (Л = 0, 1,2, 3), в ка- качестве которых мы можем взять прямолинейные ортого- ортогональные координаты специальной теории относительности. (Я использую заглавную букву для индекса, относящегося к {/-координатной системе, и строчную букву, например г, для индекса, относящегося к х-координатной системе.) Четыре функции уА переменных хг будут характеризовать поверхность 5 в пространстве-времени, а также и способ ее параметризации, т. е. систему координат х\ х2, х3. Мы можем использовать эти уА в качестве динамических координат q. Введем величину Ул, = Ц~ (г = 1, 2, 3); C.6) она будет функцией динамических координат q. Далее введем где т — параметр, изменяющийся при переходе от одной поверхности к другой, соседней; это даст нам скорость q. Итак, переменныеуА являются динамическими координатами, необходимыми для описания поверхности, и jiA — скоро- скоростями. Нам понадобится ввести импульсные переменные wA, сопряженные с этими динамическими координатами. Им- Импульсные переменные будут связаны с координатами СП- соотношениями [Уах,мгХ'] = ВатЬ3(х-х'). C.8) Нам будут нужны другие переменные для описания любых физических полей, имеющихся в задаче. Если мы имеем дело со скалярным полем V, то функция V (х) для всех значений х1, х2, х3 даст нам новые динамические координаты q. Частные производные V,r будут функциями q. Величина dV/дт будет скоростью. Производная от V по любому на- направлению выражается через dV/dx и V,r, т. е. выражается через динамические координаты и скорости. Лагранжиан бу- будет содержать эти производные V по произвольным напра- направлениям и потому будет функцией динамических координат и скоростей. Для каждого V нам потребуется сопряженный
450 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ импульс U, удовлетворяющий СП-соотношениям [V(x), U(x')] = 6s(x-x'). C.9) Таким способом трактуется скалярное поле. Аналогич- Аналогичный метод с введением необходимых добавочных индексов пригоден для векторных, тензорных или спинорных полей. Нам нет нужды рассматривать это особо. Исследуем теперь, каким будет гамильтониан. Гамильто- Гамильтониан должен быть линейной функцией первичных связей первого рода типа C.2). Прежде всего мы должны выяснить, каков вид первичных связей первого рода. Должны суще- существовать первичные связи первого рода, соответствующие произвольным деформациям поверхности. Чтобы обеспечить изменение динамических координат у, эти связи должны содержать переменные w, сопряженные с у, и в них будут входить другие переменные поля. Мы можем выразить такие связи в виде О, (ЗЛО) где Кл — некоторая функция гамильтоновых переменных q и р, не зависящая явно от w. Мы можем утверждать, что гамильтониан представляет собой просто произвольную линейную функцию всех вели- величин C.10) \ d3x. C.11) Интегрирование здесь проводится по трем координатам х, определяющим точку на поверхности; с — произвольные функции трех х и времени. Общее уравнение движения, конечно, выглядит как g *=« lg, Нт]. Смысл коэффициента сА можно выяснить, если взять это уравнение движения и положить в нем функцию g равной одной из переменных у. Для g — уА в некоторой за- заданной точке х\ х2, х3 мы получаем $а = [уа, \Cr(w'r+Kr)d3x'} = ]c'r[yA, w'r+ЩсРх. C.12) Здесь штрих при переменных поля сг, шг или Кт означает, что берутся значения этих величин в точке х1', х2', х3'. Скобка Пуассона уА с Кт равна нулю, так как Кт не зави- зависит от w, поэтому нужно взять скобку Пуассона уА только с wp — wi (x'). Это даст нам дельта-функцию, и,
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 451 следовательно, Ул = С\- C.13) Таким образом, коэффициенты сА оказываются величи- величинами типа скоростей, описывающими изменение нашей поверхности с изменением параметра т. Выбирая эти сА произвольным образом, мы можем получить произвольное изменение поверхности в зависимости от т. Это позволит нам представить вид гамильтониана в тео- теории поля, развитой для состояний на искривленных поверх- поверхностях. Мы можем несколько глубже проанализировать свой- свойства этого гамильтониана, разлагая входящие в него век- векторы на компоненты, нормальные и тангенциальные к по- поверхности. Для любого вектора ?л можно определить его нормальную компоненту где /Л — единичный вектор нормали, и тангенциальные компоненты (отнесенные к х-координатной системе) Векторы / определяются величинами у,Л и поэтому являются функциями динамических координат. Любой вектор можно разложить таким путем на составляющие — нормальную к поверхности и тангенциальные. Скалярное произведение определяется как rl\s, C.14) где yrsdxrdxs — элемент метрики поверхности, записанный в я-координатной системе. Матрица yrs является обратной по отношению к yrs (r, s — 1, 2, 3). Используя определение скалярного произведения C.14), мы можем выразить наш полный гамильтониан через тан- тангенциальные и нормальные компоненты w и К: C.15) Здесь ул = уА1А и уг = ухуА,г- Нам понадобится знать СП-соотношения между нор- нормальными и тангенциальными членами выражения C.15). Я выпишу сначала СП-соотношения для различных
452 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ компонент w. Мы имеем, очевидно, [шА, а?]«=0; C.16) эта форма записи связана с внешними координатами у, но когда мы разложим наши величины w на нормальные и тангенциальные компоненты, скобки Пуассона их друг с другом уже больше не будут равны нулю. Скобки Пуас- Пуассона нетрудно раскрыть путем прямого расчета. Я не хочу вдаваться в детали этой выкладки. Упомяну только, что подробный расчет можно найти в моей работе *). Результаты таковы: [wr, w's] = ws8,r(x-x') + w'r8iS(x-x'), C.17) [wx,w'r] = w'Ar(x-x'), C.18) [w±, w'l] = — 2wr8,r(x-x')-w'r6(x-x'). C.19) Мы знаем также, что [иОц + Кц, Wv + K'v]^=>0 для ц, v = r, s или J_. C.20) Отсюда можно вывести следующее: C.21) [wx+Kx, w',+K',]=(wx+K'±)b,(x-x'), C.22) r&(x-x'). C.23) Эти результаты можно было бы получить непосредственно на основе определений нормальных и тангенциальных компонент величин w, но проще их вывести с помощью следующих соображений. Так как все величины wr + Кг, kj_I_ -j- /Cj_ относятся к первому роду, их скобки Пуассона слабо обращаются в нуль. Поэтому [Wr + Kn W's + K's], [WX+KX, W'r + K'r) и [wx+Kx, ffi>i+/C'i] все должны быть равны нулю в слабом смысле. Мы можем теперь выяснить, чему они равны в сильном смысле. Мы *) Р. А. М. D j г а с, Сап. Journ, of Math,, 1951, v. 3, p, 1.
8. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 453 должны добавить в правые части C.21) — C.23) величины, слабо равные нулю и, следовательно, построенные из wr-\-Kr и да_[_+ -/<Cj_ с некоторыми коэффициентами. Далее, раскрывая члены в правых частях, содержащие w, мы смо- сможем найти эти коэффициенты. Члены, содержащие w, могут появиться только из скобок Пуассона w с w (см. C.17) — C.19)). Составив скобку Пуассона [w, К'], мы не получим никаких членов с w, ибо при этом мы имеем скобку Пуассона ш-импульса с некоторыми функциями динамичес- динамических координат и импульсов, отличающихся от w, а это не может дать импульсных переменных w. Аналогично скобка Пуассона К с К не будет содержать никаких переменных w. Поэтому единственными величинами w, появляющимися в правой части C.21), будут те, которые стоят справа в C.17). Нужно ввести еще некоторые члены в правую часть C.21), чтобы все выражение в целом слабо обращалось ? нуль. Какие именно члены мы должны добавить, совер- совершенно ясно — это (ws + Ks) б.г (х — х') + (w'r + Кг) X X 6,s (х — х). Аналогичным образом определяются правые части C.22) и C.23). Другой вопрос, которого стоит коснуться, связан с чле- членами ws + Ks в полном гамильтониане C.15). Они соответ- соответствуют такому движению, при котором изменяется система координат на искривленной поверхности, но не сама поверх- поверхность. Этому отвечает движение каждой точки поверхности ПО касательной к ней. Положим у i = 0. Это означает, что поверхность не дви- движется в направлении, перпендикулярном к ней, а просто происходит изменение координат поверхности. В таком случае мы имеем уравнения движения типа U = \yrsyr[g, ws + Ks]dsx. C.24) Такой вид должно иметь уравнение движения, описы- описывающее изменение g при преобразовании системы координат fia неподвижной поверхности. Однако такое изменение g должно быть тривиальным; его можно определить, просто используя геометрические свойства динамической перемен- переменной g. Если g — скалярная величина, то тогда нам известно, как она изменяется при изменении системы координат fc1, х2, х3. Если g —¦ компонента вектора или тензора, харак- характер ее изменения установить несколько сложнее, но все же Можно; аналогично, если g — спинор. В любом случае это
454 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ изменение g, по существу, тривиально. Это означает, что Ks можно определить из одних только геометрических соображений. Я покажу это на одном или двух примерах. В случае скалярного поля V с сопряженным импульсом U в Кг имеется член VJJ. C.25) Для векторного поля, скажем, трехмерного вектора As, сопряженным которому является Bs, в Кг имеется член As,rB>-(ArB*U C.26) аналогично получаем для тензоров; выражения для спино- спиноров несколько сложнее. Первое слагаемое в C.26) описы- описывает изменение As, возникающее из-за трансляции, связан- связанной с изменением координатной системы, второе слагаемое описывает изменение As за счет вращения, также связанного с преобразованием системы координат. В случае скаляра подобный член, отвечающий вращению, в C.25) отсутствует. Мы можем получить полное выражение для К,г, сумми- суммируя вклады от всевозможных полей, имеющихся в задаче. В результате мы увидим, что эту тангенциальную компо- компоненту К можно найти просто из геометрических соображе- ний. Отсюда ясно, что тангенциальная компонента К не имеет реального физического значения, она определяется только формой математического аппарата. Величиной, существенной с физической точки зрения, является нор- нормальная компонента /С в C.15). Эта нормальная компонента К в сумме с нормальной компонентой w даст нам связь пер- первого рода, отвечающую движению поверхности нормально к себе самой. Это уже величина, важная с точки зрения динамики. Проблема построения гамильтоновой теории поля для состояний на этих искривленных поверхностях включает вопрос об определении выражений для К,, удовлетворяющих необходимым СП-соотношениям C.21) — C.23). Танген-. циальную составляющую можно, как мы обсудили, найти из геометрических соображений; она, конечно, должна удовлетворять СП-соотношению C.21). В СП-соотношение C.22) К\ входит линейно; этому соотношению будет удовлет- удовлетворять любая величина K,j_, представляющая собой скаляр-
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 455 ную плотность. Таким образом, для выполнения этого СП-соотношения вполне достаточно, чтобы величина /Cj_ преобразовывалась подходящим образом при изменении системы координат х1, х2, ха. Соотношению C.23), квадра- квадратичному по /е_[, удовлетворить трудно. Поэтому проблема формулировки гамильтоновой теории поля в случае искрив- искривленных пространственноподобных поверхностей сводится теперь к задаче отыскания нормальной компоненты вели- величины К, являющейся скалярной плотностью и удовлетво- удовлетворяющей СП-соотношению C.23). Один из возможных путей определения такой нормальной компоненты К основан на использовании лоренц-инвариант- ного принципа действия. Исходя из принципа действия, мы могли бы получить все компоненты К- Действуя таким образом, мы получили бы тангенциальную компоненту К не обязательно такой же, как прежде, составленной из членов типа C.25) и C.26), из-за возможного изменения, связанного с контактным преобразованием. Однако эффект такого контактного преобразования можно исключить, переписав принцип действия, добавляя в интеграл действия полный дифференциал. Это не окажет влияния на уравнения движения. С помощью такого изменения принципа действия можно добиться того, чтобы тангенциальная компонента К, полученная из принципа действия, точно совпала со значе- значением, найденным с помощью простых геометрических со- соображений. Затем мы можем определить нормальную компо- компоненту К, используя наш общий метод перехода от принципа действия к гамильтониану. Если принцип действия реляти- релятивистски инвариантен, то нормальная компонента К, полу- полученная таким способом, должна удовлетворять условию C.23). Мы можем теперь обсудить переход к квантовой теории. В процессе квантования мы преобразуем величины w и переменные, входящие в /С, в операторы. Теперь мы должны быть осторожны при выборе способа определения танген- тангенциальных и нормальной компонент w, и я определяю их следующим образом: wr = yAirW*, C.27) т. е. помещаю импульсную переменную w справа. (Вы зна- знаете, что в квантовой теории результаты будут различными в зависимости от того, справа или слева мы поставим w.)
458 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Аналогично C.28) Тем самым эти величины полностью определены. Далее, в квантовой теории мы имеем слабые уравнения wr +Kr ~ 0 и wj_ + /(j_ ss 0, дающие нам, согласно B.22), дополнительные условия для волновой функции: = 0, C.29) = 0. C.30) Потребуем, чтобы эти дополнительные условия были непро* тиворечивы. Согласно B.25) мы должны добиться того, чтобы в перестановочных соотношениях C.21) — C.23) коэффициенты в правых частях стояли перед связями (слева от них). В случае тангенциальных компонент условия C.21) будут выполнены, если мы подберем порядок следования сомножителей в К. г так, чтобы импульсные переменные всегда находились справа. В C.21) у нас есть ряд величин, которые линейны по импульсным переменным, причем последние находятся справа; коммутатор любых двух таких величин снова будет линеен по импульсным переменным, и они снова будут стоять справа. Поэтому импульсные переменные всегда будут оказываться справа, и все входя- входящие сомножители всегда будут располагаться в желатель» ном порядке. Теперь мы должны рассмотреть задачу упорядочения в компоненте К±, с которой столь просто разделаться не удается. Нормальная компонента К\_ обычно содержит произведение некоммутирующих сомножителей, и нужно расставить их так, чтобы условия C.22) и C.23) выполня- выполнялись, причем в каждом члене в правой части коэффициенты должны находиться слева. С уравнением C.22) особых затруднений не возникает. Все, что нам нужно, это просто взять /e_i_ в виде скалярной плотности, так как стоящая в правой части величина w'j_ + К] не имеет при себе ника* ких некоммутирующих с ней коэффициентов; единственным коэффициентом служит дельта-функция, которая является с-числом, а не оператором. Однако с соотношением C.23) дело обстоит уже не так просто. Его правую часть при рассмотрении квантовой
3. КВАНТОВАНИЕ НА ИСКРИВЛЕННЫХ ПОВЕРХНОСТЯХ 457 теории следует выписать в более развернутом виде: = - 2ys [ws + Ks) б,, (x - x') - (Ys (ws + Ks)).r б (x - x'). C.31) Я записал это соотношение с коэффициентами yrs, стоящими слева, и именно таким образом они должны быть располо- расположены в квантовой теории. При построении квантовой теории поля для состояний на произвольных искривленных поверхностях необходимо определить такую величину К\, для которой имеет место СП-соотношение C.31) с коэффициентами yrs, стоящими слева. Если C.31) выполняется, то дополнительные условия C.30) непротиворечивы, а мы уже выяснили, что условия C.29) не противоречат друг другу и что C.30) согласуется с C.29). Итак, мы сформулировали условия, при выполнении которых наша квантовая теория будет релятивистской. Нужно, конечно, известное везение, чтобы нам удалось удовлетворить этим условиям. Мы не можем сделать это в общем случае. Имеется одно важнее общее правило, которое состоит в том, что если нам удалось найти вели- величину К. [_, удовлетворяющую этим и некоторым другим условиям, то нетрудно построить и другие /С_[_, удовлет- удовлетворяющие рассматриваемым условиям. Допустим, что мы имеем решение, в котором /("i содержит только недифферен- цируемые импульсные переменные вместе с динамическими переменными, которые могут находиться под знаком произ- производной. Существует ряд простых полей, для которых К±_ удовлетворяет СП-соотношениям C.22) и C.23) и имеет указанный простой вид. Тогда мы можем прибавить к /Cj_ произвольную функцию недифференцируемых переменных q. Иначе говоря, мы берем новую величину Очевидно, что добавление к Кi этого члена ср может повлиять на правую часть C.31) и там появится величина, пропор- пропорциональная дельта-функции. Мы не можем получить ника- никаких производных от дельта-функции, ибо добавочные члены происходят от скобок Пуассона функции ср (q) с недиф- ференцируемыми импульсными переменными. Поэтому единственным изменением правой части в результате добав-
4E8 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ ления к К\_ члена ф может быть появление слагаемого, кратного дельта-функции. Но правая часть должна быть антисимметричной относительно перестановки х и х', ибо левая часть, очевидно, обладает этим свойством. Это обстоя- обстоятельство как раз и исключает возможность появления вели- величины, пропорциональной дельта-функции, в правой части C.31), так что она вовсе не изменится. Поэтому, если исход- исходная величина Ki удовлетворяет СП-соотношению C.31), то тогда и новая величина К\_ будет обладать тем же свой- свойством. Чтобы завершить доказательство, нужно принять во внимание еще одно обстоятельство. Величина ср может также содержать Г= У— detgra. Прямым расчетом не- нетрудно проверить, что [wj_, Г'] содержит недифференци- руемую б (л; — х'), и поэтому наше рассуждение останется в силе, если включить Г в ср. Фактически мы должны это сделать, иначе мы нарушим справедливость соотношения C.22), требующего, чтобы К* и К± были скалярными плот- плотностями. Мы таким образом, обязаны добавить Г в нужной степени, чтобы сделать ф скалярной плотностью. Этот метод обычно используется на практике при введе- введении в рассмотрение взаимодействия между полями, не нарушающего релятивистского характера теории. Для различных простых полей указанные условия оказываются выполненными. В таких случаях мы имеем необходимый нам элемент удачи, так что мы можем учесть взаимодействие между полями описанного простого вида, и условия, обес- обеспечивающие релятивистский характер квантовой теории, не будут нарушены. Существует несколько примеров, в которых нам не сопутствует необходимое везение, и нам не удается так рас- расположить сомножители в f(j_, чтобы было справедливо соотношение C.31) с коэффициентами, стоящими слева. В таком случае мы не знаем, как провести квантование теории для состояний на искривленных поверхностях. Но на самом деле мы пытаемся достичь значительно большего, чем необходимо, когда ставим перед собой задачу построе- построения квантовой теории для состояний на искривленных поверхностях. В целях развития теории, согласующейся со специальной теорией относительности, вполне было бы достаточно ограничиться состояниями, определенными толь- только на плоских поверхностях. Это приведет к некоторым
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 459 условиям, налагаемым на К±, не столь жестким, как те, что я сформулировал здесь. И, по всей вероятности, мы сможем удовлетворить этим менее жестким условиям, не будучи в состоянии удовлетворить условиям, приведенным выше. Таким примером служит электродинамика Борна —• Инфельда, которая является модификацией электродина- электродинамики Максвелла и основывается на интеграле действия, совпадающем с максвелловским в случае слабых полей, но отличающемся от него для сильных полей. Электро- Электродинамика Борна — Инфельда приводит к классическому выражению для К±, содержащему квадратные корни. Это выражение имеет такой вид, что удовлетворить условиям, необходимым для построения релятивистской квантовой теории на искривленных поверхностях, кажется невозмож- невозможным. Однако представляется возможным построить теорию на плоских поверхностях, когда эти условия оказываются менее ограничивающими. ЛЕКЦИЯ 4 КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ Мы имели дело с состояниями, определенными на произ- произвольных пространственноподобных искривленных поверх- поверхностях в пространстве-времени. Я подытожу полученные нами результаты, касающиеся тех условий, при выполнении которых квантовая теория поля, сформулированная в тер- терминах этих состояний, будет релятивистской. Для описания поверхности мы вводим переменные, представляющие собой четыре координаты ул для каждой точки хг = (х1, х2, х3) на поверхности. Переменные х образуют криволинейную систему координат на поверхности. Величины у тогда рас- рассматриваются как динамические координаты, и существуют сопряженные им импульсы wA (х), также являющиеся функциями переменных х. Далее мы получаем набор первич- первичных связей первого рода, возникающих в гамильтоновом формализме, типа 0. C.10) Величины К не зависят от w, но могут быть функциями любых других гамильтоновых переменных. В эти К будут
460 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ входить имеющиеся в наличии физические поля. Мы анали- анализируем полученные связи, разлагая их на компоненты, тангенциальные и нормальные к поверхности. Тангенци- Тангенциальные компоненты суть ^0, D.1) тогда как нормальная компонента — ^0. D.2) В результате этого анализа мы находим, что величины Кг можно получить лишь из геометрических соображений. Эти Кг следует рассматривать как нечто довольно тривиаль- тривиальное, связанное с такими преобразованиями, при которых изменяются координаты поверхности, но сама поверхность не движется. Связям первого рода D.2) отвечает движение поверхности в направлении, нормальном к ней, и они яв- являются физически существенными. Для непротиворечивости теории должны быть выполнены СП-соотношения C.21) — C.23). Некоторые из этих соот- соотношений содержат просто Кг и автоматически удовлетво- удовлетворяются в том случае, когда величины Кг выбираются в соот- соответствии с геометрическими требованиями. Некоторые из условий непротиворечивости линейны по К± и автомати- автоматически удовлетворяются, если мы выберем /\Г [_в виде скаляр- скалярной плотности. Далее, наконец, мы имеем условия непротиво- непротиворечивости, квадратичные по Ki> и эти последние сущест- существенны, ибо им нельзя удовлетворить с помощью тривиаль- тривиальных соображений. Этим важным условиям непротиворечивости можно удовлетворить в классической теории, если исходить из лоренц-инвариантного принципа действия и вычислять К\, следуя стандартным правилам перехода от принципа дей- действия к гамильтониану. Проблема построения релятивист- релятивистской квантовой теории сводится тогда к задаче подходящего выбора некоммутирующих сомножителей, входящих в кван- квантовую величину К±, т. е. такого выбора, чтобы выполнялись условия непротиворечивости, а это означает, что комму- коммутатор двух величин вида D.2), взятых в двух точках про- пространства х1, х2, Xs, должен быть линейной комбинацией связей с коэффициентами, стоящими слева. Таким кванто- квантовым условиям непротиворечивости обычно бывает довольно трудно удовлетворить. Это оказывается возможным в неко-
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 461 торых простых примерах, но в более сложных случаях удовлетворить этим условиям, по-видимому, нельзя. Мы приходим к выводу о невозможности построить квантовую теорию для таких более общего типа полей, используя состояния, определенные на произвольных искривленных поверхностях. По-видимому, стоит упомянуть, что величины К имеют простой физический смысл: Кг можно интерпретировать как плотность импульса, K_i — как плотность энергии. Таким образом, плотность импульса, выраженная через гамильтоновы переменные, представляет собой величину, которую всегда легко найти просто из геометрического характера проблемы, а плотность энергии является сущест- существенной величиной, которую необходимо выбрать правильно (удовлетворив определенным перестановочным соотноше- соотношениям), чтобы выполнялись требования релятивистской инвариантности. Даже если не удается построить квантовую теорию, используя состояния, определенные на произвольных искривленных поверхностях, может все же оказаться воз- возможным построить такую теорию, используя состояния, определенные только на плоских поверхностях. Соответствующую классическую теорию можно полу- получить, наложив просто условия, которые сведут искривлен- искривленные поверхности, рассматривавшиеся нами ранее, к плос* ким. Эти условия будут следующими. Поверхность характе* ризуется функциями уА (х); чтобы она была плоской, ука- указанные функции должны иметь вид Ул.(х) = аА + ЬАгхг, D.3) где коэффициенты а и Ь не зависят от переменных х. Если функции уА (х) имеют такой вид, то поверхность будет плос- плоской и система координат хг станет прямолинейной. На дан» ном этапе мы не требуем, чтобы система координат хг была ортогональной — я введу эти условия несколько позже. Таким образом, мы рассматриваем произвольную косо- косоугольную прямолинейную систему координат хг. Теперь наша поверхность задана величинами аА, ЬА„ и эти величины будут выступать в качестве динамических переменных, нужных для задания поверхности. Их стало значительно меньше, чем прежде. Фактически у нас здесь только 4 + 12 =г 16 переменных. Мы имеем эти 16 динами-
462 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ ческих переменных, определяющих поверхность, вместо прежних у а (х), эквивалентных совокупности 4-оо3 дина- динамических координат. Ограничив таким способом класс поверхностей, мы можем рассматривать это ограничение как введение ряда связей в каш гамильтонов формализм — связей, которые выра- выражают 4-оо3 координат у через 16 переменных. Эти связи будут связями второго рода. Введение таких связей озна- означает сокращение числа эффективных степеней свободы для поверхности с 4-со3 до 16 — весьма кардинальное сокра- сокращение! В предыдущей лекции я обрисовал общий метод трак- трактовки связей второго рода. Сокращение числа эффективных степеней свободы приводит к новому определению скобок Пуассона. Этот общий метод не обязателен в данном случае, поскольку здесь условия достаточно просты и можно вос- воспользоваться более прямым методом. В самом деле, мы можем непосредственно установить, что эффективные им- импульсные переменные остаются в теории и после сокраще- сокращения числа эффективных степеней свободы для поверхности. Ограничив таким образом наши динамические перемен- переменные, мы должны, конечно, наложить ограничение и на скорости: хг. D.4) Точка сверху означает дифференцирование по некоторому параметру т. С изменением т изменяется рассматриваемая плоская поверхность — она перемещается параллельно са- самой себе и при этом изменяется направление ее нормали. Поверхность, таким образом, движется с четырьмя степе- степенями свободы, и зависимость аА 4- ЬАг от параметра t отражает это движение. Полный гамильтониан теперь есть = 'аА $ (wA + К a) ctx +'bf\xr (wA + К a) d\. D.5) (Я вынес величины ал и b'f- за знак интеграла, поскольку они не зависят от переменных х.) Выражение D.5) содержит переменные w только в виде комбинаций $ wAd3x и $ xrwAd3x,
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 463 Здесь мы имеем 16 комбинаций переменных w, которые будут служить новыми импульсными переменными, сопря- сопряженными 16 переменным а и Ъ, требующимся для описания поверхности в данном случае. Мы можем снова выразить Нт через нормальные и тан- тангенциальные компоненты этих величин: ] ?\xr(w*+K°)d3x. D.6) Теперь введем условие: координатная система хг ортого- ортогональна. Это значит, что bArb* = grs = -8rl. D.7) Дифференцируя D.7) по т, получаем (Я совершенно свободно поднимаю индексы Л, так как Л-координатная система является просто координатной системой специальной теории относительности.) Из этого уравнения видно, что величина bArb^ антисимметрична по индексам г и s. Поэтому последний член в выражении D.6) равен \ЪАГЬ? J {xr (W + Ks) - xs (wr + Kr)} d3x. Теперь вы видите, что в Нт входит не столь много, как прежде, линейных комбинаций переменных w. Единствен- Единственными остающимися линейными комбинациями до являются следующие: Pi^lfflift, D.9) PrBz\wrd»x, D.10) а также D.11) Mrs = \{XrWt - xswr) d*x. D.12) (Теперь мы можем совершенно спокойно поднимать и опус- опускать индексы г, так как они относятся к прямолинейным ортогональным осям.) Эти величины представляют собой импульсные переменные, сопряженные переменным, тре-
464 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ бующимся для задания поверхности в том случае, когда, согласно наложенному ограничению, поверхность является плоской относительно прямолинейной ортогональной сис- системы координат. Весь набор импульсных переменных, определяемых выражениями D.9) — D.12), можно записать как Pv и М^у — — Mxv, где индексы ц и v принимают 4 значения, причем значение 0 соответствует нормальной компоненте, а значения 1, 2, 3 отвечают трем х-компонентам. Индексы ц и v, относящиеся к х-координатной системе, обозначены строчными буквами, чтобы отличить их от индекса Л, относящегося к фиксированной г/-координатной системе. Итак, теперь число наших импульсных переменных со- сокращено до 10, и соответственно этим 10 импульсным пере- переменным мы имеем 10 первичных связей первого рода, кото- которые можно записать как где pL^\Ktd4, Pr~\Krd4, "Vi = $ xrKid3x mrs == \ (xrKs — xsKr) d3x. D.13) D.14) D.15) D.16) D.17) D.18) Мы имеем теперь 10 первичных связей первого рода, отвечающих движению плоской поверхности. В третьей лекции я упомянул, что необходимо иметь 4 первичные связи первого рода C.10), чтобы плоская поверхность могла произвольно двигаться. Сейчас мы видим, что огра- ограничиться четырьмя связями неудобно. Это число нужно увеличить до 10, потому что 4 элементарных движения поверхности (нормально к самой себе и изменение направ- направления ее нормали) не образуют группу. Чтобы получить набор элементарных движений, составляющих группу, мы должны расширить его с 4 до 10, причем 6 добавочных эле- элементов группы включают трансляции и повороты поверх- поверхности. Эти последние движения сводятся просто к преобра- преобразованию системы координат на поверхности, но не влияют на поверхность как целое. Таким путем мы пришли к га-
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 465 мильтонову формализму, содержащему 10 первичных связей первого рода. Мы должны теперь обсудить условия непротиворечи- непротиворечивости, выраженные посредством СП-соотношений. Они должны выполняться для того, чтобы все связи были свя- вями первого рода. Рассмотрим сначала СП-соотношения, связывающие друг с другом импульсные переменные Рц и МцУ. Эти импульсные переменные заданы, согласно D.9) —• D.12), через w, а нам известны СП-соотношения переменных ш друг с другом, а именно C.17) — C.19), следовательно, мы сможем найти СП-соотношения для переменных Р и М. Однако нет необходимости продолжать здесь проце- процедуру определения СП-соотношений для переменных Р и М. Достаточно уяснить себе, что эти переменные в точности со- соответствуют операторам трансляций и поворотов в четырех- четырехмерном плоском пространстве-времени, и потому СП- соотношения для них должны точно соответствовать переста- перестановочным соотношениям между операторами трансляций и поворотов. В любом случае мы получаем следующие СП-соотношения: [/V, Р„Н0 D.19) (это означает, что различные трансляции коммутируют), D.20) D.21) Теперь рассмотрим условия, при выполнении которых первичные связи D.13) и D.14) будут первого рода. Скобка Пуассона любых двух из них должна быть величиной, кото- которая слабо равна нулю, и, следовательно, она должна пред- представлять собой линейную комбинацию этих связей. Таким образом, мы приходим к СП-соотношениям D.22) D.23) +gvP Wva + m^+gw (Mvp+mvp) -gvoiMw + mw). D.24) Для получения этих соотношений использовалось сле- следующее соображение: в правой части каждого соотношения должна стоять величина, которая слабо равна нулю, и нам
466 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ известны члены в правых частях, в которые входят перемен- переменные Р, М, так как эти члены происходят только от скобок Пуассона D.19) — D.21). (Я уже использовал то же самое соображение в случае искривленных поверхностей при выводе соотношений C.21) — C.23), так что нет необходи- необходимости подробно рассматривать это здесь. В качестве при- примера разберем, как выводится D.23). Члены, содержащие Р, являются как раз теми же самыми, что и в D.20). Они получаются из скобки Пуассона Р и М. Остальные члены добавлены для того, чтобы полное выражение слабо равня- равнялось нулю.) Соотношения D.22) — D.24) представляют собой условия непротиворечивости. Мы можем провести дальнейшее упрощение, невозмож- невозможное в случае криволинейных координат, следующим обра- образом. Предположим, что наши основные характеристики поля выбраны таким образом, что они связаны только с х-координатной системой. Они являются характеристиками поля в некоторых частных точках х на поверхности, и мы можем выбрать их так, чтобы они вовсе не зависели от (/-координатной системы. Тогда величины К±, Кг совер- совершенно не будут зависеть от (/-координатной системы, а это означает, что скобки Пуассона К\_, Kr с переменными Р, М будут равны нулю. В таком случае скобки Пуассона каждой из переменных р, т и каждой из Р, М равны нулю. Этой свойство вытекает из естественного выбора динами- динамических переменных для описания имеющихся физических полей. Мы не можем провести соответствующего упрощения при использовании искривленных поверхностей, потому что в величины K_i, Kr войдут переменные grs, с помощью которых задается метрика. Из-за этого мы не можем пред- представить К±, Кг в такой форме, которая совсем не была бы связана с (/-координатной системой, поскольку координаты у входят в переменные ?„. Однако для плоских поверхностей это упрощение осуществимо и приводит к тому, что соотно- соотношения D.22) — D.24) принимают более простой вид: [/V Pv]-=0, D.25) D-26) g^m^p. D.27) Величины Р и М выпали из этих соотношений, так что условия непротиворечивости содержат теперь только харак-
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 467 теристики поля, но не содержат переменных, вводимых для описания поверхности. Фактически эти условия просто означают, что переменные р и т удовлетворяют СП-соотно- СП-соотношениям, соответствующим операторам трансляций и поворо- поворотов в плоском пространстве-времени. Проблема построения релятивистской теории поля сводится теперь к отысканию величин р, т, удовлетворяющих СП-соотношениям D.25) — D.27). Вспомним, что эти величины определены с помощью К i и /Сг •— плотности энергии и плотности импульса. Выражение для плотности импульса точно такое же, как и в случае криволинейных координат. Эта величина опре- определяется только из геометрических соображений. Наша задача сводится к нахождению плотности энергии К±, приводящей к таким р и т, при которых соотношения D.25) — D.27) выполняются. Если мы исходим из лоренц-инвариантного интеграла действия и выводим из него Кi с помощью стандартных гамильтоновых методов, то плотность энергии /Cj_ автомати- автоматически будет удовлетворять указанным условиям в класси- классической теории. Проблема построения релятивистской кван- квантовой теории сводится тогда к задаче правильного выбора порядка сомножителей, входящих в К±, а именно такого, чтобы соотношения D.25) — D.27) удовлетворялись также и в квантовой теории, когда скобки Пуассона переходят В коммутаторы, а р и т содержат некоммутирующие вели- величины. Рассмотрим соотношения D.25) — D.27) и выразим в них р и т через величины К- Тогда мы увидим, что неко- некоторые из этих соотношений окажутся независимыми от К.Х.- Они автоматически удовлетворяются при должном выборе Кг, согласующемся с геометрическими требованиями. Некоторые из соотношений линейны по /Cj_. Им можно удовлетворить, взяв /Cj_ в виде трехмерной скалярной плотности в пространстве переменных х. Итак, будем счи- считать, что задача о выполнении соотношений, линейных по /Cj, решена. Трудно удовлетворить условиям, квадратич- квадратичным по /Cj_. Они имеют следующий вид: [ $xrKLdH, \K'Ld3x'] = $ K4sx, D.28) D.29)
468 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ Уравнение D.28) получено из D.26), где мы положили ц = _1_. р = г и о = 1, а уравнение D.29) получено из D.27), где мы взяли v=J_ и о = _|_. Таким образом, проблема получения релятивистской квантовой теории поля сводится теперь к задаче нахождения такой плотности энергии /Cj_, которая удовлетворяет условиям D.28) и D.29) с учетом некоммутативности сомножителей. Мы можем проанализировать эти условия еще несколько детальнее, приняв во внимание, что скобка Пуассона, связывающая К± в одной точке и /С1 в другой, будет пред- представлять собой сумму членов, содержащих дельта-функции и производные от дельта-функций: [К±, K'1] = a8 + 2br5,r + crs8,rs + ... D.30) (Символ 5 означает трехмерную дельта-функцию, содержа- содержащую три координаты х и три координаты х' первой и второй точек соответственно.) Здесь а = а (х), b=b (x), с=с (х),... Можно было бы написать коэффициенты, зависящие также от л;', но в таком случае их можно заменить коэффициентами, зависящими только от х, ценой некоторых изменений ука- указанных коэффициентов ряда. Нет никакой глубокой асим- асимметрии между переменными хил;', асимметрия имеется только в отношении способа записи уравнения. Уравнение D.30) является общим соотношением, свя- связывающим значения плотности энергии в двух точках. Далее, во многих случаях, включающих все наиболее из- известные поля, производные от дельта-функции порядка выше второго не появляются. Исследуем этот случай подробнее. Примем, что производных порядка выше чем второй нет. Это означает, что ряд D.30) обрывается на третьем члене. В этом частном случае мы можем получить довольно много сведений относительно коэффициентов a, b и с, используя свойство антисимметрии скобки Пуассона D.30) по отноше- отношению к перестановке точек х и х'. Переставляя местами х и х' в D.30) и учитывая, что dbr (х')/дхг = 0 и т. д., полу- получаем =с'б - 2 (#6)., + (c'rs8),rs = аб - 2 ф,й),г + (с„б),„= «= (а - 2br>r -{- с„.„ ) 6 + (- 2ЬГ + 2crSiS) б,, + с«б,„. D.31)
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 469 Выражение D.31) должно тождественно равняться выраже- выражению D.30) с обратным знаком. Чтобы коэффициенты при 8,rs отвечали такому требованию, мы должны иметь с„ = 0. D.32) При этом оказываются согласованными и коэффициенты при 6,г. Наконец, чтобы коэффициенты при б отвечали этому требованию, мы должны иметь a = br<r. D.33) Это дает [Ки K'±] = 2br6,r + brtr8. D.34) Подставим теперь этот результат в соотношения D.28) и D.29). Они примут следующий вид: $ КАЧ = \\хг B&Д, + bs,s8) d4 d'x' = \, D.35) = \ \ xrx's B6,6,, + bt.fi) dH d3x' - = \ (— 2xrbs + Xrxjbtj) dsx = \ (—xrbs + Xsbr) d*x. D.36) (Заметим, что xns= dxrldxs = — 8rs.) Таким образом, наши условия непротиворечивости сводятся к D.35) и D.36), и мы видим, что они удовлетворяются, если взять Ъг — Кг- Это не самое общее решение; в более общем случае мы могли бы иметь s, D.37) где brs — произвольная величина, удовлетворяющая усло- условию l(Bn-Bsr)d»x = O. D.38) Таким образом, 6 может обладать произвольной симметрич- симметричной частью, а ее антисимметричная часть должна пред- представлять собой дивергенцию некоторой величины. В этом заключается общее требование, обеспечивающее релятивистский характер теории поля. Мы должны найти плотность энергии К±, удовлетворяющую СП-соотношению
470 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ D.34), где величины Ъг связаны с плотностью импульса согласно D.37). Если мы находим плотность энергии из лоренц-инвариантного действия, то это условие определенно будет выполнено в классической теории. Оно может не выполняться в квантовой теории из-за неверного располо- расположения сомножителей. Релятивистски инвариантную кван- квантовую теорию мы получим только в том случае, если нам удастся выбрать порядок сомножителей в выражении для плотности энергии таким образом, чтобы точно удовлетво- удовлетворить условиям D.34) и D.37). Условия, которые обеспечи- обеспечивают здесь релятивистский характер квантовой теории, не столь строги, как те, что мы получили, рассматривая со- состояния, определенные на произвольных искривленных поверхностях. Я хотел бы проиллюстрировать это на примере электро- электродинамики Борна—Инфельда. Эта электродинамика согла- согласуется с электродинамикой Максвелла в случае слабых полей, но отличается от нее в случае сильных полей. (Мы относим здесь величины, описывающие электромагнитное поле, к некоторым абсолютным единицам, определенным через заряд электрона и его классический радиус, так что можно говорить о Сильных и слабых полях.) Общие урав- уравнения электродинамики Борна—Инфельда вытекают из принципа действия, причем интеграл действия равен )d4*. D.39) На этом этапе мы можем использовать криволинейные координаты. Тензор g^v задает метрику в криволинейных координатах, а тензор F^ определяет электромагнитное поле, измеряемое в абсолютных единицах. С помощью общей процедуры мы можем перейти от этого интеграла действия к гамильтониану. В результате получим гамильтониан, в который входят, помимо перемен- переменных, нужных для описания поверхности, динамические координаты Аг, г= 1, 2, 3. Компонента Ао оказывается несущественной, точно так же, как и в случае поля Максвел- Максвелла. Сопряженные Аг импульсы Dr представляют собой компоненты электрической индукции, и они удовлетво- удовлетворяют СП-соотношениям [Ап D's] = gsb(x-x'). D.40)
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 471 Оказывается, что величина А входит в гамильтониан только под знаком ротора, а именно, через переменные поля: Br = ±e>-*'Fsi = e"tAitS. D.41) Символ erst = 1 при (rst) = A, 2, 3) и антисимметричен по всем индексам. Перестановочные соотношения между В и D таковы: [Br, D's] = Erst8j(x-x'). D.42) Плотность импульса в этом случае равна Kr = FrsDs. D.43) Она точно такая же, как в теории Максвелла. Это согла- согласуется с тем общим принципом, что плотность импульса определяется только из геометрических соображений, т. е. задается геометрией полей, которые мы используем, и не зависит от принципа действия. Плотность энергии теперь равна KL = {Г2-yrs (DrDs + BrBs)~yrsFriFsuD'D"Y'K D.44) Здесь yrs — метрический тензор трехмерной поверхности, и -Tt = detyrs. D.45) Работая с искривленными поверхностями, мы требуем, чтобы /Cj_ удовлетворяла СП-соотношению C.31). В классической теории это требование обязано выполняться, поскольку величина /Cj_ получается из лоренц-инвариантного интеграла действия. Но нам не удастся добиться того, чтобы она удов- удовлетворяла необходимому перестановочному соотношению в квантовой теории. В выражении для К± имеется квадрат- квадратный корень, из-за чего с ним очень неудобно обращаться. Кажется совершенно безнадежным пытаться точно удовлет- удовлетворить перестановочным соотношениям с коэффициентами yrs, стоящими слева. Поэтому, по-видимому, невозможно построить квантовую электродинамику Борна—Инфельда для состояния, определенного на искривленной поверх- поверхности. Перейдем, однако, к плоским поверхностям. В этом случае нам нужно рассмотреть СП-соотношение D.34). Мы знаем, что в классической теории с этим условием все обстоит благополучно. Следовательно, в классическом
472 лекции по квантовой механике случае должно выполняться СП-соотношение [Ki, K'L] = 2KAr + Kr,A D-46) И без подробного расчета ясно, что это соотношение должно остаться в силе и в квантовой теории, так как Кг построена целиком из Ds и В'. Действительно, переходя к квантовой теории, мы получаем величины D и В, расположенные некоторым образом, но все D и В, взятые в одной и той же точке, коммутируют друг с другом. Это видно из формулы D.42). Если положить в ней х' = х, то мы найдем [Br, Ds] = zrstS,t(O) = O D.47) (производная от дельта-функции при значении аргумента, равном нулю, считается равной нулю). Таким образом, нас не должен беспокоить вопрос о некоммутативности D и В, входящих в Кг- Поэтому мы должны получить клас- классическое выражение, так что условия непротиворечивости выполняются. Таким образом, в случае электродинамики Борна—Ин- фельда условия непротиворечивости в квантовой теории на плоских поверхностях выполняются, хотя они не выпол- выполняются на искривленных поверхностях. Физически это означает, что мы можем сформулировать основные уравне- уравнения квантовой электродинамики Борна—Инфельда в согла- согласии со специальной теорией относительности, но мы столк- столкнемся с затруднениями, если захотим согласовать эту теорию с общей теорией относительности. Этим завершается обсуждение условий непротиворечи- непротиворечивости, обеспечивающих релятивистский характер кванто- квантовой теории. Однако, даже удовлетворив этим условиям, мы еще не избавимся от всех затруднений. На нашем пути имеется еще ряд вполне внушительных препятствий. Если бы мы имели дело с системой только с конечным числом степеней свободы, то все препятствия были бы преодолены и перед нами стояла бы задача непосредственно решить дифференциальные уравнения для i|). Но в теории поля имеется бесконечное число степеней свободы, и эта бесконеч- бесконечность может привести к неприятности. Как правило, так оно и бывает. Мы должны решить уравнения, в которых искомая вели- величина — волновая функция ч|) — зависит от бесконечного числа переменных. Обычным методом решения уравнений
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 473 такого типа является применение теории возмущений, в которой волновая функция разлагается в ряд по степеням некоторого малого параметра, и решение ищется методом последовательных приближений. Но мы сталкиваемся с тем осложнением, что на некотором этапе уравнения приводят к расходящимся интегралам. На разрешение этой проблемы затрачены огромные уси- усилия. Развиты методы обращения с этими расходящимися интегралами, которые, по-видимому, удовлетворительны с точки зрения физика, даже если их невозможно обосновать математически *). Создана техника перенормировок, позво- позволяющая устранить расходимости в некоторых случаях теории поля. Поэтому, даже удовлетворив формально требованиям непротиворечивости, мы можем столкнуться еще с тем затруднением, что не будем знать, как найти решения волно» вого уравнения, удовлетворяющие необходимым дополни* тельным условиям. Если мы сможем получить такие реше* ния, то останется еще дальнейшая проблема введения ска* лярных произведений для них, т. е. мы должны будем рассмотреть эти решения как векторы в гильбертовом про* странстве. Ввести эти скалярные произведения необходимо, так как это позволит дать физическую интерпретацию нашей волновой функции по обычным правилам физической интер- интерпретации квантовой механики. Скалярные произведения необходимо задать для волновых функций, удовлетворяю- удовлетворяющих дополнительным условиям, но мы не обязаны беспо» коиться об определении скалярных произведений для вол- волновых функций общего вида, не удовлетворяющих допол* нительным условиям. Может оказаться, что для этих общих волновых функций нет никакого способа ввести скалярные произведения, но это не имеет никакого значения. Для физической интерпретации в квантовом случае требуется только, чтобы эти скалярные произведения существовали для волновых функций, удовлетворяющих всем дополни- дополнительным условиям. Вы видите, что в задаче построения гамильтоновой теории в квантовом аспекте имеются весьма внушительные *) Процедура перенормировок в квантовой теории поля строго обоснована математически в работах Н, Н, Боголюбова и его последо- последователей, (Прим, ред.)
474 ЛЕКЦИИ ПО КВАНТОВОЙ МЕХАНИКЕ трудности. Что касается классической формулировки, раз- развитый метод, по-видимому, в значительной мере завершен, и мы ясно представляем себе положение вещей; в случае же квантовой механики мы фактически только приступили к исследованию проблемы. Имеются трудности в нахожде- нахождении решений, даже когда дополнительные условия формаль- формально непротиворечивы, и затруднения возможны также при введении скалярных произведений для решений. Затруднения весьма серьезны, и это привело к тому, что ряд физиков подвергает сомнению ценность всего метода Гамильтона. Довольно много физиков работают сейчас над проблемой построения квантовой теории поля без использования какого бы то ни было гамильтониана. Их общий метод состоит в следующем. В рассмотрение вводят величины, имеющие физический смысл; далее используют общие принципы для того, чтобы наложить условия на рас- рассматриваемые величины, и надеются, в конце концов, что условий, налагаемых на физически важные величины, окажется достаточно для вычисления их. Сторонники этого метода все еще очень далеки от цели, и, по моему мнению, обойтись вовсе без метода Гамильтона невозможно. Метод Гамильтона доминирует в механике при классическом подходе. Возможно, что наш метод перехода от классиче- классической механики к квантовой механике еще не является кор- корректным. Тем не менее я думаю, что любая будущая кван- квантовая теория должна содержать элемент соответствия га- мильтоновой теории, может быть, даже и не в такой именно форме, как это представлено здесь. Я довел изложение метода Гамильтона до той стадии, до которой он разработан к настоящему времени. Это очень общий и мощный метод; его можно использовать в самых разных задачах. Он может быть приспособлен к задачам, в которых поле имеет сингулярности (в точке или на поверх- поверхности). При таком развитии гамильтоновой теории мы дол- должны руководствоваться следующей общей идеей. Нужно найти такое действие /, зависящее от некоторых параметров q, что при варьировании q мы будем иметь вариацию б/, линейную по bq. Линейность б/ по 8q необходима для того, чтобы можно было применить рассмотрение, описанное в настоящих лекциях. Способ, с помощью которого можно ввести свойство линейности при наличии сингулярностей, состоит в следую-
4. КВАНТОВАНИЕ НА ПЛОСКИХ ПОВЕРХНОСТЯХ 476 щем. Нужно использовать криволинейные координаты и не варьировать никаких уравнений, определяющих положе- положение сингулярной точки или сингулярной поверхности. Например, если мы имеем дело с сингулярной поверхностью, заданной уравнением / (х) = 0, то мы должны иметь вари- вариационный принцип, в котором / (х) не варьируется. Если мы позволим функции / (х) изменяться и будем считать, что / сама определяет некоторые из параметров q, то в этом слу- случае вариация 81 не будет линейной по 8q. Но мы можем фиксировать / (х) относительно некоторой криволинейной системы координат х и затем варьировать поверхность путем варьирования криволинейной системы координат при равной нулю вариации функции /. В таком случае общий метод, который я здесь обсудил, оказывается вполне удовлетворительным в рамках классической теории. При переходе к квантовой теории возникают затруднения, о которых я говорил.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Амплитуда вероятности 103 — — относительная 104 Аналогия классическая 117 Ансамбль Гиббса 177 Антикоммутативность 201 Антилинейность 39 Бозе статистика 278 Бозон 278 Борна — Инфельда электродинамика 459, 470 — 472 Вра-вектор 28, 35 — — стандартный 113 Дисперсионная формула Крамерса — Гейзенберга 326 Дополнительное условна Ферми 375 Дырка 360 Зеемана эффект 222, 242 Зоммерфельда формула 356 Импульсное представление 133 Интеграл действия 411 — по путям 176 Вектор 28 — антисимметричный 276 — базисный 88 — длина 33 г- симметричный 276 Весовая функция представления 95 Волновая функция 112, 152 Волновой пакет 164 Волны де Бройля 163 Вторичное квантование 303 — — фермионов 331 Гамильтона метод 415, 481 — оператор 156 Гамильтониан 155, 156, 414 — полный 417 Гамильтонов формализм 413 — — обобщенный 421 Гейзенберга картина 153 — представление 159 Гиббса ансамбль 177 Гильберта пространство 59 Действие 173 Дельта-функция 84 Динамическая переменная 27, 40, 41 — — вещественная 48 ••- — второго рода 421 «•> — гейзенберговская 154 »- — наблюдаемая 55 — — первого рода 428 — — шредингеровская 154 — система 27 Дирака матрица 337 *•- представление 231 •>- уравнение 338 Канонические переменные 118 Картина движения гейзенберговская 153 — — шредингеровская 152 Касательное преобразование 144, 145, 404 — 407 Квантовые условия 117 •— — основные 121 Кет-вектор 28, 29 — — стандартный 111 Классическая аналогия 117 Лагранжа функция 173, 411 Лагранжиан 411 Ланде формула 244 Магнитная аномалия спина 222 Магнитный момент электрона 348 Матрица 96 — обобщенная 98 — унитарная 143 — эрмитова 97, 98 Матричный элемент 96 Момент орбитальный 191 — спиновый 191 Наблюдаемые 55 — коммутирующие 72 — —, полный набор 82 Несобственная функция 84 Нулевая энергия 307
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Оператор антисимметризующий 327 — вращения 191 — Гамильтона 156 — линейный 37 — — вещественный 42, 48 — — самосопряженный 42 — — сопряженный 41 — сдвига 136 — симметризующий 297 — унитарный 143 — физический 376 Орбитальный момент 191 Паули принцип 279 Переменная динамическая — см. Ди- Динамическая переменная Перенормировки 471 Перестановка 276 Перестановочная функция электро- электромагнитного поля 367 — — электрон-позитронов 387 Перестановочные соотношения 117 Планка постоянная 120 Плотность вероятности 339 Позитрон 359 Полная система 55 Поляризации состояние 15 Правила отбора 213—220 Представитель 77 Представление 77 — взаимодействия 231 — гейзенберговское 159 — Дирака 231 — импульсное 133 — ортогональное 79 — симметричное 275 — фоковское 187 — шредингеровское 129 Преобразования унитарные 143 Принцип действия 173, 410 — неопределенности 135 — Паули 279 — суперпозиции 15, 27 Промежуточные состояния 233 Пространство векторов состояний 28, 59 — Гильберта 59 Рассеяния коэффициент 250 Связи 422 — вторичные 418 — второго рода 422 — первичные 413 — первого рода 422 — суперпозиционные 26 Система атомная 23 — вырожденная 228 Система динамическая 27 — невырожденная 228 Скобки Пуассона 118, 415 — — квантовые 120 — —, соотношения 427 Слабое равенство 377 Собственная энергия 237 Собственные векторы 46 — значения 46 Состояние 23, 24 — антисимметричное 276 — движения 24 — динамической системы 27 — квантовое 24 — нестационарное 249 — поглощения 249 — поляризации 15 — промежуточное 233 — симметричное 276 — стационарное 159, 264 Спин электрона 200 Суперпозиции принцип 15, 23, 27 — —, математическая формулировка 30 Суперпозиция 15, 19, 21, 24, 26 Унитарное преобразование 143 Уравнение Гамильтона — Якоби 166 — Дирака 338 — неразрывности 168, 177 — Шредингера, волновое 152 Уравнения движения гамильтоновы 415 — —, гейзенберговская форма 154 — —, шредингеровская форма 150 Условие дополнительное 375 — квантовое 117 — частот Бора 160 Фазовое пространство 177 Фазовый множитель 36 Фермионы 278 Функция Гамильтона 155 — Лагранжа 173 — преобразования 106 — упорядоченная 176 Электромагнитное поле 365 и д. — —, дополнительное условие 375 — —, оператор Гамильтона 366 — —, перестановочная функция 367 — 369 — —, поперечная часть 362 — —, продольная часть 362 Элемент диагональный 96 — матричный 96
ОГЛАВЛЕНИЕ Предисловие редактора серии 5 От редактора русского издания 6 Из предисловия автора к русскому изданию 8 Из предисловия к первому изданию . . . 9 Г лава I. Принцип суперпозиции , . . , , 11 § 1. Потребность в квантовой теории 11 § 2. Поляризация фотонов 15 § 3. Интерференция фотонов ....,,,., 18 § 4. Суперпозиция и индетерминизм 21 § 5. Математическая формулировка принципа 27 § 6. Векторы бра и кет 32 Глава //. Динамические переменные и наблюдаемые .... 37 § 7. Линейные операторы , 37 § 8. Соотношения сопряженности 41 § 9. Собственные значения и собственные векторы 45 § 10. Наблюдаемые 52 § 11. Функции наблюдаемых , , . . 60 § 12. Общее физическое толкование 67 § 13. Коммутативность и совместность 71 Глава III. Представления 77 § 14. Базисные векторы . 7 7 § 15. Дельта-функция 84 § 16. Свойства базисных векторов 88 § 17. Представление линейных операторов 95 § 18. Аплитуды вероятности , , . . 102 § 19. Теоремы о функциях наблюдаемых ........... 107 § 20. Усовершенствование обозначений 110 Глава IV. Квантовые условия 117 §21. Скобки Пуассона 117 § 22. Шредингеровское представление 123 § 23. Импульсное представление 130 § 24. Принцип неопределенности Гейзенберга 134 § 25. Операторы сдвига 136 § 26, Унитарные преобразования >.,..........•¦« 141
ОГЛАВЛЕНИЕ 479 Глава V. Уравнения движения . 148 § 27. Шредингеровская форма уравнений движения 148 § 28. Гейзенберговская форма уравнений движения 152 § 29. Стационарные состояния , . . 158 § 30. Свободная частица 160 § 31. Движение волнового пакета 164 § 32. Принцип действия , 169 § 33. Ансамбль Гиббса , 177 Глава VI. Элементарные приложения 183 § 34. Гармонический осциллятор 183 § 35. Момент количества движения 188 § 36. Свойства момента количества движения 193 § 37. Спин электрона 200 § 38. Движение в центральном силовом поле 204 § 39. Уровни энергии атома водорода 210 § 40. Правила отбора 213 § 41. Явление Зеемана для атома водорода 220 Глава VII. Теория возмущений 223 § 42. Общие замечания 223 § 43. Изменение уровней энергии, вызываемое возмущением 224 § 44. Возмущение как причина переходов 229 § 45. Приложение к излучению 234 § 46. Переходы, вызываемые возмущением, не зависящим от времени 237 § 47. Аномальный эффект Зеемана 240 Глава VIII. Задачи о столкновениях 246 § 48. Общие замечания 246 § 49. Коэффициент рассеяния 250 § 50. Решение задачи в импульсном представлении 256 § 51. Дисперсионное рассеяние 263 § 52. Резонансное рассеяние 266 § 53. Испускание и поглощение 269 Глава IX. Системы, содерллщие несколько одинаковых частиц 274 § 54. Симметричные и антисимметричные состояния 274 § 55. Перестановки как динамические переменные 280 § 56. Перестановки как интегралы движения 281 § 57. Определение уровней энергии 286 § 58, Применение к электронам . , , 290 Глава X. Теория излучения 297 § 59. Ансамбль бозонов , 297 § 60. Связь между бозонами и осцилляторами 300 § 61. Испускание и поглощение бозонов 307 § 62. Применение к фотонам 310 § 63. Энергия взаимодействия между фотоном и атомом . . 315 § 64. Испускание, поглощение и рассеяние излучения . . . 322 § 65, Ансамбль фермионоз ..,,.,,,......,.... 326
ОГЛАВЛЕНИЕ Глава XI. Релятивистская теория электрона .,,.,.. 332 § 66. Релятивистское рассмотрение частицы .,...;. 332 § 67. Волновое уравнение для электрона 334 § 68. Инвариантность относительно преобразований Лоренца 339 § 69. Движение свободного электрона 342 § 70. Существование спина ...,....,.,.. 346 § 71. Переход к сферическим координатам ....... 350 § 72. Тонкая структура уровней энергии водорода .... 353 § 73. Теория позитронов •....;.. 357 Глава XII. Квантовая электродинамика 361 § 74. Электромагнитное поле в отсутствие вещества .... 361 § 75. Релятивистская форма квантовых условий ..... 366 § 76. Шредингеровские динамические переменные ..... 370 § 77. Дополнительные условия 375 § 78. Электроны и позитроны в отсутствие поля .-,,.. 381 § 79. Взаимодействие • . . > . 388 § 80. Физические переменные 394 § 81. Трудности теории 399 Приложение. О каноническом преобразовании в классической и квантовой механике (В. А. Фок) 404 Лекции по квантовой механике . , ..-.,..,..¦ 408 Лекция. 1. Метод Гамильтона . , .;,...... 408 Лекция 2. Проблема квантования . , 427 Лекция 3. Квантование на искривленных поверхностях 442 Лекция 4. Квантование на плоских поверхностях 459 Предметный указатель . ............,-¦ 476