Author: Шредингер Э.  

Tags: физика  

ISBN: 5-93972-030-7

Year: 2001

Text
                    Э. Шредингер
ЛЕКЦИИ ПО ФИЗИКЕ
Научно-издательский центр
«Регулярная и хаотическая динамика»
2001


УДК 530 Интернет-магазин http://rcd.ru/shop Интересующие Вас книги, выпускаемые нашим издательством, дешевле и быстрее всего приобрести через наш интернет-магазин. Регистрация в магазине позволит вам • подписаться на регулярную рассылку сообщений о книгах; • самое быстрое приобретение новых книг до поступления их в магазин; • индивидуальный подход к каждому заказчику. Внимание! Зарубежных авторов (в т. ч. из стран СНГ) просим направлять свои заказы по адресу subscribe@uni.udm.ru Шредингер Э. Лекции по физике. — Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001, 160 стр. В книге представлены лекции крупнейшего физика Э. Шредингера по статистической термодинамике и квантовой механике, также включена нобелевская лекция. В них содержатся оригинальные обсуждения, интересные комментарии, многие результаты получены самим автором. Изложение является кратким, ясным и доступным. Для студентов и аспирантов, специалистов по теоретической физике. ISBN 5-93972-030-7 © НИЦ «Регулярная и хаотическая динамика», 2001 http://rcd.ru
Содержание СТАТИСТИЧЕСКАЯ ТЕРМОДИНАМИКА 5 Глава 1. Общее введение 5 Глава 2. Метод наиболее вероятного распределения .... 9 Глава 3. Обсуждение теоремы Нернста 19 Глава 4. Примеры ко второй главе 22 Глава 5. Флуктуации 26 Глава 6. Метод средних значений 31 Глава 7. Проблема п частиц 46 Глава 8. Оценка формул. Предельные случаи 58 Глава 9. Излучение 86 Каноническое распределение квантовомеханических амплитуд 94 ЧЕТЫРЕ ЛЕКЦИИ ПО ВОЛНОВОЙ МЕХАНИКЕ 102 Лекция первая 102 1. Вывод основных идей волновой механики из гамильтоно- вой аналогии между обычной механикой и геометрической оптикой 102 2. Обыкновенная механика — только приближение, не действительное для очень малых систем 106 3. Боровские стационарные энергетические состояния как собственные частоты колебания волн 108
4 Содержание Лекция вторая 112 4. Краткое описание волновой системы водородного атома. Вырождение. Возмущение 112 5. Физическое значение волновой функции. Вывод правила отбора и правил поляризации спектральных линий .... 113 6. Вывод собственного временного волнового уравнения . . . 118 7. Возмущение атома переменным электрическим полем . . 119 Лекция третья 122 8. Теория вторичного излучения и дисперсии 122 9. Теория резонансного излучения и изменения атомных состояний под влиянием падающего света, частота которого точно или почти совпадает с частотой естественного излучения 125 10. Распространение волновой механики на системы с несколькими материальными точками 128 11. Примеры: осциллятор, ротатор 131 Лекция четвертая 135 12. Учет движения ядра водородного атома 135 13. Возмущение произвольной системы 136 14. Взаимодействие между двумя произвольными системами 139 15. Физическое значение обобщенной ^-функции 141 ФУНДАМЕНТАЛЬНАЯ ИДЕЯ ВОЛНОВОЙ МЕХАНИКИ . 143
СТАТИСТИЧЕСКАЯ ТЕРМОДИНАМИКА1 Глава 1 Общее введение Эта книга ставит своей задачей развить вкратце простой единый метод, применимый без изменения общего подхода ко всем случаям (классическому, квантовому, случаю Бозе-Эйнштейна, случаю Ферми-Дирака и т.д.) и к любой новой проблеме, способной в дальнейшем возникнуть. При этом интерес сосредотачивается на общем методе, а примеры разбираются лишь как иллюстрации. Эта книга не может служить первым введением для начинающих, являясь скорее курсом повторения. Те вопросы, которые можно найти в любом из сотни учебников, рассматриваются здесь в максимально сжатой форме; с другой стороны, существенным моментам, излагаемым лишь в наиболее подробных монографиях (таких, как книги Фау- лера и Толмена), уделяется большое внимание. В статистической термодинамике имеется, в сущности, лишь одна проблема: распределение заданного количества энергии Е между N тождественными системами. Или, точнее: требуется найти распределение ансамбля, состоящего из N тождественных систем, по состояниям, в которых этот ансамбль может находиться, при условии, что энергия ансамбля Е является постоянной. При этом основная идея состоит в том, что между системами существует только слабое взаимодействие, настолько слабое, что энергией взаимодействия можно пренебречь, так что можно говорить о «частной» энергии каждой системы; сумма этих 1 Перевод с английского и редакция Н.А.Толстого и П. П. Феофилова.
6 Статистическая термодинамика «частных» энергий должна быть равна Е. Особая роль энергии заключается, следовательно, попросту в том, что она является интегралом движения — всегда существующим и, вообще говоря, единственным. Обобщение, рассматривающее также и другие интегралы (количество движения, момент количества движения), является очевидным; такое обобщение иногда делают, хотя в земной термодинамике, в противоположность астрофизической, оно до сих пор не приобрело сколько-нибудь существенного значения. «Найти распределение» означает в принципе следующее: необходимо выяснить все возможные распределения энергии (или состояния ансамбля), классифицировать их соответствующим образом (т.е. в соответствии с поставленной задачей) и подсчитать числа в классах так, чтобы было возможно судить о вероятности тех или иных свойств ансамбля. Разнообразие вопросов, могущих возникнуть в этой связи, столь велико, что классификации, необходимые в каждом частном случае, могут чрезвычайно сильно различаться, в особенности в отношении степени их детальности. На одном конце шкалы мы сталкиваемся с общим вопросом о нахождении таких черт, которые были бы общими для почти всех возможных состояний ансамбля; это позволяет с уверенностью утверждать, что они имеют место «почти всегда». В этом случае мы получаем практически лишь один класс (в действительности имеются два класса, однако содержание второго исчезающе мало). На другом конце шкалы мы встречаемся с такой детализированной задачей, как нахождение объема (т.е. числа состояний ансамбля) «класса», один из элементов которого находится в заданном состоянии. Хорошо известным примером служит максвелловский закон распределения по скоростям. Такова математическая сторона проблемы — всегда одна и та же. Мы дадим вскоре общее решение ее, из которого каждая частная классификация может быть получена как частный случай. При физическом приложении этих математических результатов возможны два различных подхода. Позднее, в силу очевидных соображений, мы решительно предпочтем один из них; пока мы должны пояснить оба. Более старым и более наивным является приложение этих результатов к N реально существующим физическим системам, находящимся в реальном физическом взаимодействии друг с другом, например к молекулам газа, к электронам, к планковским осцилляторам или к степе-
Глава 1. Общее введение 7 ням свободы пустого пространства («осцилляторам эфира»). N таких элементов составляют рассматриваемую реальную физическую систему. Эта точка зрения связана с именами Максвелла, Больцмана и др. Она применима, однако, лишь к очень ограниченному классу физических систем — в сущности только к газам. Она неприменима к системе, которая не состоит из большого числа тождественных частей, обладающих «частными энергиями». В твердом теле взаимодействие между соседними атомами настолько велико, что мы не можем представить полную энергию тела в виде суммы частных энергий его атомов. И даже «полость» (эфирный «ящик», рассматриваемый как пространство, в котором разыгрываются электромагнитные процессы) может быть разложена лишь на осцилляторы многих (бесконечно многих) различных типов, так что в этом случае пришлось бы иметь дело по меньшей мере с ансамблем из бесконечного числа различных ансамблей, состоящих в свою очередь из различных частей. В связи с этим была развита вторая точка зрения (или, точнее, другое приложение тех же математических результатов), которой мы обязаны Вилларду Гиббсу. Обладая большим внутренним изяществом, она применима самым общим образом к любой физической системе и имеет некоторые преимущества, о которых будет сказано далее. Здесь N тождественных систем являются мысленными копиями рассматриваемой системы — макроскопического объекта на нашем лабораторном столе. Что же это, в самом деле, физически означает — распределить заданное количество энергии Е по этим N мысленным копиям? По моему мнению, идея состоит в допустимости представления о том, что мы действительно имеем N копий нашей системы и что они действительно находятся в слабом взаимодействии друг с другом, но изолированы от всего остального мира. Сосредоточив наше внимание на какой-либо одной системе, мы находим ее помещенной в своеобразный «тепловой резервуар», состоящий из N — 1 других систем. Итак, с одной стороны, мы знаем, что при термодинамическом равновесии поведение физической системы, помещенной в тепловой резервуар, всегда одинаково, какова бы ни была природа теплового резервуара, поддерживающего температуру постоянной, при условии, разумеется, что тепловой резервуар химически нейтрален по отношению к нашей системе, т. е. что между ними не происходит ничего, кроме теплового обмена. С другой стороны, при статистическом расчете не принимается во внимание механизм взаимодействия; предполагается
8 Статистическая термодинамика лишь, что он является «чисто механическим», т.е. что он не влияет на природу индивидуальных систем (например, не разбивает их на куски), а просто переносит энергию от одной системы к другой. Эти рассуждения наводят на мысль о том, что поведение любой из этих N систем может служить прообразом поведения одной реально существующей системы, помещенной в тепловой резервуар с заданной температурой. Более того, поскольку все N систем одинаковы и находятся в сходных условиях, мы, очевидно, можем, на основании их одновременной статистики, судить о вероятности нахождения нашей системы, помещенной в тепловой резервуар с заданной температурой, в том или ином из ее частных состояний. Таким образом, все вопросы, относящиеся к системе, помещенной в тепловой резервуар, могут быть разрешены. Эту точку зрения мы принимаем за основу; впрочем, все последующие рассуждения могут быть, с необходимыми предосторожностями, отнесены также и к первой из указанных точек зрения. Преимущество принятой точки зрения состоит не только в ее общей приложимости, но связано также со следующими двумя обстоятельствами: 1) N может быть сделано сколь угодно большим. Действительно, в затруднительных случаях мы всегда считаем, что limTV = сю (бесконечно большой тепловой резервуар). Следовательно, приложимость, например, формулы Стирлинга для N1 или для факториалов «чисел заполнения», пропорциональных N (и, таким образом, обращающихся в бесконечность одновременно с N), не может вызвать никаких сомнений. 2) Вопрос об индивидуальности членов ансамбля, подобный вопросу об индивидуальности частиц в «новой статистике», здесь не возникает. Наши системы суть макроскопические системы, поддающиеся индивидуальному распознаванию. Таким образом, два состояния ансамбля, отличающиеся, например, тем, что система №6 и система №13 поменялись ролями, следует рассматривать как различные. Для двух одинаковых атомов системы №6, поменявшихся своими ролями, этого различия может не быть. Впрочем, в последнем случае мы имеем дело лишь с вопросом правильной нумерации состояний отдельной системы, правильного описания ее квантово-механической природы.
Глава 2 Метод наиболее вероятного распределения Рассмотрим ансамбль из N идентичных систем. Мы описываем природу любой из этих систем, перечисляя ее возможные состояния, обозначаемые нами через 1, 2, 3, 4, ... , I, ... В принципе мы всегда имеем в виду квантово-механическую систему, состояния которой должны описываться собственными значениями замкнутой системы коммутирующих переменных. Собственные значения энергии на этих состояниях мы будем обозначать через е±, £г, £з5 • • • , £г> • • • > располагая их так, чтобы £/_|_1 ^ £/. В случае необходимости эта схема может быть применена также и к «классической системе», состояния которой следует описывать как ячейки фазового пространства (pk, Qk), имеющие равный объем, причем независимо от того, являются они бесконечно малыми во всех направлениях или нет, они должны быть во всяком случае такими, чтобы энергия не менялась существенно в пределах ячейки. Впрочем, это применение является более или менее второстепенным, а более существенно следующее. При рассмотрении состояния ансамбля мы будем всегда задавать его, указывая, что система №1 находится в состоянии, например /i, система №2 — в состоянии l^-, ..., система №iV — в состоянии lN. Мы будем поступать так в дальнейшем, хотя в сущности делать этого нельзя, ибо квантово-механическая система не находится в том или ином состоянии, которое должно описываться замкнутой системой не- коммутирующих переменных, выбранных раз и навсегда. Становясь на эту точку зрения, мы мыслим в строго «классическом» духе. При выбранной совокупности состояний можно считать, что индивидуальная система имеет лишь определенную амплитуду вероятности и, следовательно, определенную вероятность быть найденной при наблюдении в состояниях №1, №2, №3 и т.д. Я подчеркиваю: лишь амплитуду вероятности. Даже такая детерминированность отдельной системы является здесь излишней. Действительно, для приписывания отдельной системе «чистого состояния» вообще нет достаточных оснований. Если бы мы углубились в рассуждения этого рода, то это завело бы нас в область очень тонких квантово-механических вопросов. Это
10 Статистическая термодинамика было сделано Нейманом, Вигнером и другими, однако их результаты не отличаются существенно от тех, которые получаются при указанных нами выше более простых и более наивных рассуждениях, которыми мы и воспользуемся. В таком случае некоторый класс состояний ансамбля будет характеризоваться тем, что ai, аг, аз, ... , щ систем из общего числа N систем находятся соответственно в состояниях 1, 2,3,...,/,... и все состояния ансамбля охватываются — без перекрытия — классами, описываемыми всеми различными допустимыми совокупностями чисел щ: № состояния 1 2 3 ... / Энергия £i £2 £з • • • Si ... (2.1) Число заполнения а± а^ аъ • • • Щ Число отдельных состояний, относящихся к этому классу, равно, очевидно, Р= , , Т , • (2-2) Совокупность чисел щ должна, разумеется, удовлетворять условиям 5>,=ЛГ, Y,£M = E- (2-3) i i Выражениями (2.2) и (2.3) наш расчет в сущности заканчивается. Однако в этой форме результаты совершенно недоступны для исследования. В настоящем методе предполагается, что, поскольку N чрезвычайно велико, общее число распределений (т. е. сумма всех Р) почти полностью исчерпывается суммой тех Р, для которых совокупности чисел щ не отличаются существенным образом от совокупности, дающей максимальное значение Р [разумеется, из числа тех, которые удовлетворяют соотношениям (2.3)]. Другими словами, считая, что такая совокупность чисел заполнения может быть получена всегда, мы пренебрегаем лишь очень малой долей всех возможных распределений, которая имеет «исчезающе малые шансы быть когда-либо реализованной». Это предположение строго выполняется в пределе iV—>■ сю (т.е. в применении к «мысленному» или «виртуальному» ансамблю, в сомнительных случаях мы всегда подразумеваем этот предельный переход, физически соответствующий «бесконечному тепловому резервуару»; мы еще раз убеждаемся в крупных преимуществах точки зрения Гиббса).
Глава 2. Метод наиболее вероятного распределения 11 Мы принимаем здесь это положение без доказательства; последнее будет дано позднее при рассмотрении другого метода — «метода средних значений» Дарвина-Фаулера. При большом, но конечном N это положение справедливо только приблизительно. Действительно, в больцмановском случае мы уже не можем пренебрегать распределениями, в которых «числа заполнения» образуют совокупности, отклоняющиеся от совокупности, соответствующей максимуму. Они дают сведения о термодинамических флуктуа- циях больцмановской системы, поддерживаемой при постоянной энергии Е, находящейся в условиях идеальной тепловой изоляции. Мы не будем, однако, останавливаться на этом подробно — отчасти ввиду весьма ограниченной применимости самой больцмановской точки зрения, а также по следующей причине: поскольку условие идеальной тепловой изоляции практически не может быть осуществлено, результаты, полученные для термодинамических флуктуации при этом нереализуемом условии, применимы к действительности лишь отчасти, а именно в той мере, в какой можно доказать или принять, что эти результаты таковы же, как и для случая теплового резервуара. Флуктуации системы, помещенной в тепловой резервуар при постоянной температуре, могут быть получены значительно проще — непосредственно из концепции Гиббса. Таким образом, нам незачем рассматривать более сложный случай, из которого могут быть получены данные, применимые лишь к идеальным, нереализуемым условиям. Возвращаясь к (2.2) и (2.3), выберем в качестве функции, максимум которой мы ищем, логарифм Р, учитывая дополнительные условия обычным методом множителей Лагранжа А и ц, т.е. будем искать абсолютный максимум выражения logP-A^az-м^егаг- (2.4) i i Для преобразования логарифмов факториалов воспользуемся формулой Стирлинга в виде: log(n!) = n(logn — 1). (2-5) Разумеется, мы рассматриваем величины щ как непрерывные переменные. Для вариации (2.4) имеем: - ^2 log щ Sa{ - X^Sai - ц^2 ?i 6щ = О, i i i
12 Статистическая термодинамика причем мы должны приравнять нулю коэффициенты при каждом бсц, так что (при любом /): log щ + А + \i£i = О или а/ = а-А-Д£<, А и ц должны быть определены из добавочных условий: •^2 е-А-^< =N, Y, <r,e-A-"e< = Е. I i Путем почленного деления мы исключаем А, хотя можно получить е_А также и непосредственно из первой формулы. Обозначив через E/N = U среднюю долю энергии, приходящуюся на одну систему, мы можем выразить полученный нами результат следующим образом: ^ (2.6) Совокупность уравнений второй строки выражает распределение наших N систем по их энергетическим уровням. Можно сказать, что эти уравнения содержат в зародыше всю термодинамику, которая целиком зиждется на этом основном распределении. Само выражение совершенно прозрачно — экспонента е_ДЕ( выражает число заполнения в виде доли общего числа N систем, а сумма в знаменателе является лишь «нормирующим множителем». Разумеется, ц следовало бы определять из первого уравнения в зависимости от средней энергии и от характера системы (т.е. величин ej). Естественно, что решить это уравнение в общем виде относительно ц невозможно. В самом деле, очевидно, что функциональная зависимость между ц и U не является универсальной, а целиком зависит от характера системы. К счастью, однако, мы можем дать нашим соотношениям вполне удовлетворительную общую физическую интерпретацию, не решая это уравнение относительно /х, так как последняя величина (введенная первоначально лишь как множитель Лагранжа, т. е. как математическое вспомогательное средство) оказывается значительно более фундаментальной величиной, чем само U; поэтому физик предпочитает получать
Глава 2. Метод наиболее вероятного распределения 13 в каждом частном случае U как функцию ц, а не наоборот, что было бы совершенно нецелесообразным. Чтобы объяснить это без излишних околичностей, мы решительно станем на точку зрения Гиббса, т.е. будем считать, что мы имеем дело с виртуальным ансамблем, отдельный элемент которого представляет собой самое рассматриваемую систему. Поскольку все отдельные элементы равноправны, мы можем, переходя к физической интерпретации, представлять себе а/, или, вернее, -^, как частоты, с которыми отдельная система, погруженная в большой тепловой резервуар, будет встречаться в состоянии ei; U является в этих условиях средней энергией отдельной системы. Применим наши результаты (2.6) к трем различным ансамблям систем: А В А + В уровни: ак /Зт ех = ак + /Зт. При этом мы подразумеваем, что в первом и втором случаях отдельные элементы будут являться любыми двумя рассмотренными ранее различными системами общего типа. В третьем же случае отдельный элемент будет состоять из одной системы А и одной системы В, находящихся в слабом энергетическом взаимодействии, так что общий энергетический уровень в третьем случае будет суммой любого ак и любого fim (индекс I заменяет два индекса кит). Нетрудно видеть, что в третьем случае сумма распадается на произведение двух сумм: у^ е-д£! = у^ у^ е-д(а*;+/3т) _ у^ е~да*! У^ е-1113"1. (2.8) / km km Тогда, на основании (2.6), — речь идет о третьем случае, — общее число заполнения щ (которое может быть обозначено и как a,k,m) равняется р — ц(ак+/3т) а^а(^>=ЖЕе-^Ее-^- (2-9) k m Продолжим рассмотрение третьего случая и будем искать число систем А + В, в которых А находится на определенном уровне ак. Оно, очевидно, находится суммированием (2.9) по всем т. В результате ^ е_д/3 исчезает в числителе и в знаменателе, и мы получаем Е a(k,m) = N Ее" к
14 Статистическая термодинамика Таким образом, мы видим, что общее статистическое распределение систем А в третьем случае (включающее среди многого другого среднее значение их энергии) в точности такое же, как и в ансамбле А (первый случай), при условии, что мы обеспечиваем (надлежащим выбором E/N в случае А) одинаковость значений ц в обоих случаях. Поскольку те же рассуждения применимы и к системе В, то, согласно вышеизложенному, получается следующее: если привести системы А и В в слабое взаимодействие друг с другом и поместить их в тепловой резервуар, то обе системы будут вести себя в точности так, как если бы каждая из них в отдельности была помещена в тепловой резервуар, при условии, что все три тепловых резервуара выбираются такими, чтобы значения ц были во всех трех случаях одинаковыми. Иначе говоря, если это осуществлено, установившаяся энергетическая связь оказывается достаточно слабой, вследствие чего взаимное влияние или обмен энергией в среднем отсутствуют. Равенство значений ц означает равенство температур. Вряд ли можно интерпретировать это иначе. А так как мы можем выбрать раз и навсегда стандартную систему А («термометр») и привести во взаимодействие с любой другой системой В, то ц должно быть универсальной функцией температуры Т. Это заключение может быть сделано значительно более убедительным, если нам удастся определить явный вид зависимости ц от температуры. Для этой цели полезно обратить внимание на самоочевидный и в то же время весьма существенный побочный результат наших предшествующих рассуждений. Мы видели, что в случае А + В / k m Следовательно, функция от ц, играющая, как мы увидим, весьма важную роль, а именно функция log^V"Ei (2.10) / [ее значение явствует из рассмотрения последних членов (2.6)] является аддитивной для двух систем, находящихся в слабом энергетическом взаимодействии. В этом и состоит то очевидное, но существенное положение, о котором я упоминал выше. Каково же функциональное соотношение между ц и Т? Чтобы выбрать из множества монотонных функций /(Т) ту, которая является
Глава 2. Метод наиболее вероятного распределения 15 «истинной» температурой Т, имеется, как известно, лишь один критерий: 1/Т является универсальным интегрирующим множителем бесконечно малого приращения тепла dQ в состоянии термодинамического равновесия — универсальным в том смысле, что он пригоден для любой системы. Других функций от Т, обладающих этим свойством, не существует — в этом заключается определение Т (Кельвин). Наша модель является еще недостаточной, чтобы мы могли воспользоваться этим определением, ибо если «природа» каждой системы (т. е. ее уровень £;) фиксирована раз и навсегда, все зависит от одного параметра: ц или U, или Т. В случае одной переменной рушится понятие «интегрирующего множителя», так как при некотором dx любое (p(x)dx также будет «полным дифференциалом». Поэтому, чтобы установить Т, мы должны ввести в рассмотрение другие параметры или, что то же самое, ввести понятие о механической работе, совершаемой нашей системой. Положим, для краткости, log ^ е-"6' = F, (2.11) i где F должно рассматриваться как функция ц и всех £;, и напишем, пользуясь (2.6), бесспорно правильное математическое соотношение, приводящее в дальнейшем к физическим приложениям: dF=^d^ + Y,^ldei = ~Ud^~N^aideh (2Л2) и, таким образом, d(F + Ufi)=ti(dU-±Y,aid£l)- (2ЛЗ) i Применим это к следующему физическому процессу, которому мы подвергаем наш ансамбль из N систем. Пусть с каждой из этих систем связан в точности одинаковый «механизм» — цилиндры, поршни и прочие приспособления, с помощью которых мы можем управлять системой и изменять ее характер (т.е. уровни £/). При этом, разумеется, мы изменяем £/ одинаковым образом во всех системах так, чтобы основное условие тождественности N систем (условие, на котором покоятся наши рассуждения) было выполнено. Кроме того, мы обеспечиваем также непосредственное «изменение температуры», связывая наш ансамбль с большим тепловым резервуаром
16 Статистическая термодинамика (имеющим ту же температуру), изменяя общую температуру очень медленно и затем снова изолируя ансамбль от теплового резервуара. При применении (2.13) к этому процессу щ dei является работой, которую мы должны совершить над поршнями и т.д. этих щ систем, чтобы «поднять» эти системы со старого уровня £; на измененный уровень £/ + dei. ^aidei есть работа, совершаемая при этом над ансамблем; — ^2 щ dei — работа, производимая ансамблем, и — j^^aidei — средняя работа, производимая одним из членов ансамбля. Следовательно, поскольку dU является средним приращением энергии, выражение, стоящее в скобках в правой части (2.13), должно быть средним приращением тепла dQ, сообщаемого ансамблю, ц должно при этом рассматриваться как интегрирующий множитель. Одного этого уже вполне достаточно, чтобы заключить, что ц неизбежно должно равняться 1/Т, ибо не существует другой функции от Т, обладающей этим свойством для всех систем. Таким образом, F + 11ц должно представлять собой энтропию. Для более прямого доказательства обозначим F + U/j, = G. (2.14) Тогда согласно общей математической теореме отношение двух интегрирующих множителей 1/Т и ц является функцией G: Yj, = *{G). (2Л5) Тогда из (2.13) <p(G)dG = ^-=dS, (2.16) где S — энтропия. Это дает, после интегрирования, G в виде некоторой функции от S: G = X(S). (2.17) Далее, из (2.14), (2.11) и (2.6), функция G = log^V"e' -//^-log^V"6' i ^ i оказывается «аддитивной» при комбинировании двух систем (вследствие аддитивности log \] е_ДЕ(). Обозначая функцию \ из (2-17) че- i рез Ха в случае системы Л, через Хв в случае системы В и через Хав
Глава 2. Метод наиболее вероятного распределения 17 в случае системы А + В и обозначая энтропии в этих трех случаях соответственно через Sa, Sa и Sab, получим Xa(Sa) +Хв($в) = Xab(Sab)- С другой стороны, энтропия также является аддитивной функцией или, во всяком случае, $ав = ^а + SB + С, где С не зависит от SA и SB. Следовательно, Ха($а)+Хв(Зв) =Xab(Sa+Sb+C). Если продифференцировать это уравнение один раз по SA и второй раз по SB и сравнить результаты, то получим х'а(За) = х'в(Зв) = универсальная постоянная = —. к Таким образом, из (2.17), (2.16) и (2. 15). и S = kG + const = k log^e kT + ^ + const, (2.19) / где const во всяком случае не зависит от Т и от «параметров» (объем и т.д.), от которых зависят £;. Мы отбрасываем const, не вдаваясь пока в анализ того, что означает такое приравнивание нулю постоянной. Тогда fclog^e ^ =S-^ = Ф. (2.20) / Мы получили, таким образом, общее правило вывода термодинамики системы, исходя из ее механики. Это правило применимо ко всем случаям (включая так называемую «новую» статистику). Образуем «функцию распределения» (называемую также «суммой по состояниям» или «статистической суммой») __£(_ Z = Y,e kT- (2-21) i
18 Статистическая термодинамика Тогда klogZ (где к — постоянная Больцмана) есть свободная энергия, взятая с обратным знаком и деленная на Т. (Следуя Планку, мы обозначаем эту функцию буквой Ф). Из замечаний, сделанных по поводу (2.13), легко видеть, что fclogZ является термодинамической Ф-функцией не только по отношению к изменению температуры, но также и по отношению к параметрам (например, объему V), от которых могут зависеть £;. Таким образом, средние силы, с которыми система стремится увеличить эти параметры (например, давление р в случае, когда в качестве параметра берется объем), находятся с помощью известных из термодинамики формул, прототипом которых является соотношение p = Tw = kTwl0g^e~^' (2-22) тогда как первое уравнение (2.6) является столь же хорошо известной формулой общей термодинамики. (Во всем вышесказанном Ф следует рассматривать как функцию от Т и от параметров типа V, т.е. от которых могут зависеть £;; макроскопически эти параметры должны удовлетворять тому требованию, что при поддержании их постоянными система не совершает механической работы1.) Таким образом, статистическая трактовка, давая в принципе Ф как функцию Т и параметров, подобных V, дает исчерпывающую информацию о термодинамическом поведении объекта. [Как известно, термодинамическая функция дает полную информацию только в том случае, если она известна как функция некоторых определенных переменных. Этим свойством не обладают, например, функции Ф(Т, р, ...) или S(T, V, ...), в то время как S(U, V, ...), например, дает исчерпывающую информацию.] 1 Против этой трактовки может быть выдвинуто то возражение, что экспериментально затруднительно поддерживать постоянство объема V и реализовать полную тепловую изоляцию. Статистическая трактовка, предпочитающая вводить в качестве параметров вместо величин V такие величины, как р, вполне возможна, быть может, даже предпочтительна, однако значительно более сложна.
Глава 3 Обсуждение теоремы Нернста Обратимся к вопросу о том, каков смысл приравнивания нулю const в (2.19). Формально это означает, что мы во всех случаях выбираем определенный нулевой уровень энтропии. Элементарная термодинамика определяет энтропию (если отвлечься на время от теоремы Нернста) лишь в виде « = «, т.е. лишь с точностью до аддитивной постоянной. Более того, так установленный нулевой уровень является весьма простым и общим. Действительно, если мы напишем более подробно: fclog Но мы можем проследить поведение S вблизи Т = 0. Полагая для общности, что первые п уровней одинаковы (е^ = е2 = • • • = £п) и что следующие m уровней также одинаковы (e„+i = £п+2 = ... = еп+т), мы, конечно, можем для отыскания предельного значения оборвать сумму на (п + т)-м члене и получить: S = k\og\ne кТ +те кТ + ^ z • пе кт + те кТ Учитывая, что второй экспоненциальный член становится вблизи предела очень малым по сравнению с первым, мы легко получим: (Sn + l— El) (Sn + l—Sl) SJ ' кТ + 1 т Е^е i Sl kT si ' kT
20 Статистическая термодинамика и, следовательно. lim S = k log п. Это выражение практически равно нулю, если только п не слишком велико. Приведем пример: если бы система представляла собой один моль газа (скажем, L молекул) и п имело бы лишь тот же порядок, что и L, то klogL равнялось бы практически нулю, так как порядок величин, с которым здесь следует считаться, равен kL (= R = газовой постоянной); по сравнению с ним klogL исчезающе мало. Однако, если мы положим, что каждая молекула газа может иметь два различных «наинизших» состояния с совершенно одинаковой энергией, то получим п = 2L и 5(0) = kLlog2 = i?log2, т.е. получим уже вполне ощутимую величину. Современная теория газов считает этот случай невозможным. Известно, что общепринятую и наиболее удобную формулировку знаменитой тепловой теоремы Нернста, называемой иногда третьим началом, получают, полагая для всех систем S = 0 при Т = 0. Не дали ли мы в установленном нами уравнении (2.19) и последующих рассуждениях этой главы квантово-статистического обоснования тепловой теоремы? На первый взгляд может показаться, что нет, так как приравнивание const = 0 было вполне произвольным шагом. Тем не менее, это так, ибо в действительности, вопреки нередко высказываемому обратному утверждению, численное значение этой постоянной не существенно и даже не имеет смысла. Существенно лишь то, что это — постоянная; другими словами, что та часть энтропии, которая не исчезает при Т = 0, не зависит от «параметров». Это обстоятельство связывает тепловую теорему со статистикой (как мы сейчас объясним) в каждом частном случае, а тем самым и вообще, при условии, что мы всегда используем идею «изменяющихся параметров» в ее наиболее широком смысле. Математическая часть доказательства достаточно проста: поскольку const не зависит от параметров, одна и та же система при охлаждении до нуля приближается к одному и тому же значению энтропии, каковы бы ни были значения параметров системы. Другими словами, разность энтропии двух термодинамических состояний одной и той же системы, отличающихся значениями параметров, стремится к нулю при Т —>• 0. Исчезновение же этой разности энтропии составляет единственное эмпирическое содержание теоремы Нернста. Однако во всех подлинно существенных применениях теоремы оба «термодинамические состояния» различаются столь сильно, что нужно некоторое
Глава 3. Обсуждение теоремы Нернста 21 мысленное усилие для того, чтобы представить себе, что эти состояния могут быть охвачены понятием одной и той же системы с различными значениями параметров. В качестве типичного примера можно было бы указать на систему, состоящую из L атомов железа1 и L атомов серы. В одном из двух термодинамических состояний они образуют компактное тело, одну грамм-молекулу FeS; в другом состоянии, когда один грамм-атом Fe и один грамм-атом S разделены перегородкой таким образом, что они ни при каких обстоятельствах не могут объединиться, наиболее низкие энергетические уровни химического соединения становятся недоступными. Во всех подобных случаях нам приходится допускать возможность перехода из одного состояния в другое малыми обратимыми ступенями; при этом система никогда не покидает состояния термодинамического равновесия, к которому относятся все наши рассуждения. Все небольшие медленные этапы этого процесса могут тогда рассматриваться как небольшие медленные изменения определенных параметров, приводящие к изменениям значений величин е/. При этом const во всех этих процессах изменяться не будет, и наше утверждение будет применимо. Например, в рассмотренном случае следовало бы постепенно нагревать грамм-молекулу FeS до ее испарения, затем продолжать нагревание до тех пор, пока не будет достигнута сколь угодно полная диссоциация, затем разделить газы с помощью полупроницаемой перегородки, сконденсировать их по отдельности путем понижения температуры (введя, разумеется, между ними непроницаемую перегородку) и охладить их до нуля. После неоднократного повторения таких рассуждений мы можем не воспроизводить их более в деталях, а просто считать их «мыслимыми», и наше утверждение будет применимо. Тщательно продумав вышесказанное, мы убеждаемся в том, что наиболее простой способ подытожить это раз и навсегда получится, конечно, путем приравнивания постоянной нулю для всех случаев. Возможно, что это единственный путь избежать путаницы — иные возможности не усматриваются. Не следует, однако, рассматривать это «приравнивание нулю» как существенный момент, так как это, несомненно, способно лишь спутать и отвлечь внимание от действительного существа дела. 1Под L мы понимаем число Лошмидта, называемое часто числом Авогадро, т. е. число молекул в одном моле. Мы обозначаем его через L, так как буква N нами уже использована.
Глава 4 Примеры ко второй главе Начнем с одного простого, но полезного замечания. Мы установили, что функция i является «мультипликативной» и, следовательно, * = fclogZ = fclog^V"£< и все прочие термодинамические функции строго аддитивны при условии, что рассматриваемая система состоит из двух (или большего числа) систем, связанных между собой небольшой энергией взаимодействия, так что ее уровни е\ являются суммами любого уровня первой системы (а„) и любого уровня второй системы {(Зт) и т.д. Математически тривиальным, но физически существенным является следующее замечание: такая же «мультипликативная», или «аддитивная», схема получается также и в том случае, когда уровни суть суммы двух или более уровней различных родов, взятых во всех возможных комбинациях, хотя бы даже сама система и не представляла собой реального соединения двух или более систем. Например, если система представляет собой одну молекулу газа, энергия которой является суммой ее трансляционной, ротационной и вибрационной энергий, то все термодинамические функции построены аддитивно из трансляционных, ротационных и вибрационных частей: с математической стороны это будет то же самое, как если бы эти три типа энергии относились к трем независимым системам, соединенным друг с другом. Подобным же образом мы можем трактовать идеальный газ (L молекул с малой энергией взаимодействия), рассматривая сначала в тех же условиях одну молекулу и умножая затем термодинамические функции на L. Впрочем, это является не чем иным, как приложением
Глава 4- Примеры ко второй главе 23 первоначальной идеи «аддитивности» к двум или более слабо взаимодействующим системам. Приводимые ниже простые примеры охватывают далеко не всю область применимости этих замечаний. а) Свободная материальная точка (идеальный одноатомный газ) Рассмотрим материальную точку «классически», рассуждая обычным старомодным образом. Не заботясь о возможном квантовании, выберем в качестве уровней ячейки фазового шестимерного пространства х, у, z,px,py,pz. Энергия равна -^— (рх + pi +P2Z), где т — масса точки. Z является статистическим интегралом (заменяющим здесь статистическую сумму) от е 2т dx dy dz dpx dpy dpz по всему фазовому пространству (и сокращенно обозначает -г=). Интеграл по первым трем переменным равен объему V, по остальным переменным интегрирование производится от —оо до +оо. Тогда Z = V e 2™ dpxdpydpz и после очевидного преобразования переменных: z=v{¥Y/2 ///>uw+c2) <wc. — оо Интеграл является постоянной величиной, которая нас не интересует, поскольку сейчас нам нужны лишь производные от логарифма Z. Итак, Ф = klogZ = klogV + ^ logT +const.
24 Статистическая термодинамика Эти формулы относятся к одному атому. Для L атомов (kL = R) Ф = RlogV + |i?logT + const. Отсюда, с помощью (2.23) и (2.22), получаем хорошо известные формулы с/ = т2§| = §дт, Р = т^. Эта трактовка в настоящее время считается ошибочной. Современная трактовка будет приведена ниже. Она требует математических методов, которые будут развиты в следующей главе. Ь) Осциллятор Планка Уровни суть: £l=(l+Qhu (/ = 0,1,2,3,...)- Отсюда оо Z = ^ e'^U + V) = (если положить фу = ^ = х) = 1=0 оо = е-х/2 V^ е-1х = с-х/2 1 = 1 — 1~е~х 2shW Далее, /=о Ф = fc log Z = —k log sh ^ж — fc log 2, ch ж ^" shi, 2 1-й*;- _ /u/ еж/2 + е"ж/2 _ /ц/ еж + 1 _ hv hv 2 ex/2 _ e-x/2 2 еж - 1 2 hv_ ekT _! В этих хорошо известных выражениях «нулевая энергия» -hv обычно опускается.
Глава 4- Примеры ко второй главе 25 с) Осциллятор Ферми Эта система является особенно простой (как мы увидим далее, она создана для того, чтобы сформулировать статистику Ферми). Этот осциллятор может иметь лишь один из двух уровней — 0 или е. Тогда € и = т2^ = кт2 е~кТ -?- = -^—. дТ _JL_ кТ2 -?- 1+е кт ект +1 Сравним это выражение со вторым членом правой части последнего уравнения раздела Ь) (полагая там е = hv). Различие заключается лишь в знаке перед единицей в знаменателе. В дальнейшем мы увидим, что это является основой существенного различия между статистикой Эйнштейна -Бозе и статистикой Ферми-Дирака. Термодинамические функции системы, состоящей из L осцилляторов Планка или из L осцилляторов Ферми, могут быть, разумеется, получены умножением на L.
Глава 5 Флуктуации Для того чтобы сделать совершенно удовлетворительным вышеис- пользованный нами «метод наиболее вероятного распределения», который зарекомендовал себя своей простотой, следует привести строгое доказательство того, что заключающееся в нем молчаливое допущение справедливо, т.е. что, по крайней мере в пределе N —>• оо (рассматривая виртуальные гиббсовские ансамбли, мы всегда имеем в виду этот предел), отклонениями от «наиболее вероятного распределения» можно пренебречь без какой-либо погрешности. Стоит привести одно очень правдоподобное, но не вполне безупречное доказательство. (Даже весьма солидные учебники преподносят его как полное, маскируя его недостатки более тщательно, чем это будет сделано здесь.) Возвращаясь к формулам (2.1), (2.2) и (2.3), заметим, что среднее значение любого ат во всех распределениях равно _ /_, ат" Се 1 \ а™ = ур , (5.1) где суммирование ведется по всем совокупностям а/, совместным с (2.3). Величины атР в числителе означают, что каждое Р должно быть умножено на определенное значение, которым обладает число заполнения ат при данном Р. Дадим теперь Р формально иное определение, написав Ш -«'...оС-... (5.2) oi!o2!...om!... 1 2 и подразумевая, что все и> должны быть, в конечном счете, приравнены единице. Тогда (5.1) может быть написано в виде _ _ dlogSP О-т — Шт (д-З)
Глава 5. Флуктуации 27 (с той же оговоркой) и -о" _ Е а2тР _ изт д ( . д Е Р Un J2P J2P д"™\ т ди. д ( ит dY,P\ ( u)m dY^P 2 Ш ди)т V Е Р дш™ ) V Е Р дшг, Тогда, на основании (5.3), -=г ,- ч2 д ( #bgX)P\ дат ,г .л < - ^ =^ot {ит-*£-) = ^ъй- (5-4) (Здесь снова все и>т должны быть, в конце концов, приравнены единице.) Все это является совершенно строгим. Теперь, однако, мы долж- ны составить суждение о производной — , т.е. о характере измене- du)m ния ~ат при изменении шт. Для этой цели мы должны рассмотреть предыдущую формулу также и со значениями и>, отличными от единицы (по крайней мере, с и>, немного отличающимися от единицы). Выражение (5.2) для Р часто используется в рассуждениях, подобных тем, которые приводились во второй главе, причем величины из означают веса, приписываемые различным уровням в соответствии с их предполагаемой вырожденностью. Если бы мы поступали так во второй главе, то это привело бы к незначительному формальному изменению, — что величинам е_де' сопутствовали бы всегда величины u>j, т.е. «наиболее вероятные» щ выражались бы в виде: ат = N^ (5.5) i [вместо второй строки в (2.6)]. Предыдущее уравнение позволяет предположить, что если все u>i = 1, кроме иэт (которое слегка меняется в окрестности единицы), то ат с весьма хорошим приближением пропорционально шт. Если принять это предположение, то из (5.4) вытекает, что при переходе к пределу N —>• оо имеем ат — йт
28 Статистическая термодинамика (где вторая величина является «наиболее вероятной»). Действительно, тогда дат дат (5.6) а2т - (fflm)2 = am. (5.7) Это значит, что «дисперсия» или флуктуация является «нормальной» и практически исчезает, когда N и тем самым все ат стремятся к бесконечности. В большинстве случаев интуиция подсказывает нам с очевидностью, что среднее число заполнения с большой точностью пропорционально весу уровня даже при больших изменениях в весе уровня, например, когда он удваивается или утраивается. Действительно, в случае большой системы последнее означает такое изменение системы в целом, которым можно пренебречь; два или три уровня одного и того же сорта примут на себя в два или три раза большее число членов ансамбля. Неполная строгость наших заключений выявляется, однако, из рассмотрения первой строки (5.4), а именно: -Г ,_ ,2 dlogSP , 294og£P _ 2#4og£P »™ Ы =ит—q- +wm —-2 = ат+шт — .(5.8) Здесь мы видим член, которым мы пренебрегли. (Достаточно было бы показать: либо что он отрицателен, либо что он имеет, самое большее, порядок величины ~ат.) Примером (впрочем, тривиальным) системы, для которой (5.7) не имеет места, когда дисперсия еще меньше, может служить отдельный осциллятор Ферми (он образует систему, а N таких осцилляторов образуют ансамбль Гиббса). Мы имеем в этом случае: P=^-v (5-9) a0!ai! при ао + ai = N и 0 • а0 + £ • а,\ = Е, откуда ai = y и ао = N ~ Y' Поскольку числа являются фиксированными, дисперсия в точности равна нулю. Ясно, что если система будет состоять из двух или
Глава 5. Флуктуации 29 четырех, или пяти осцилляторов Ферми, соотношение (5.7) все еще не будет выполняться в точности, будучи справедливым лишь по порядку величины. Метод средних значений, излагаемый в следующей главе, дает еще одно доказательство этого «соотношения порядка величин», т. е. того, что дисперсия или флуктуация исчезают в пределе N —>• оо. Следует тщательно различать эти (исчезающие в пределе) флуктуации состава гиббсовского ансамбля от флуктуации, происходящих среди членов ансамбля. Адекватным представлением этих флуктуации служит сам ансамбль, поскольку он содержит системы, находящиеся во ВСеВОЗМОЖНЫХ раЗЛИЧНЫХ СОСТОЯНИЯХ £i, £2, ...,£/,.. . Простейшим и наиболее важным случаем является флуктуация энергии или, попросту говоря, тот факт, что различные системы обладают различными энергиями £i, £г, ...,£/,..., не все из которых равны U. Мы имели1 Продифференцируем это выражение по /х (при постоянных £/ «без внешней работы»): Это дает или dU = _ Ё2 - £1 V [и через Ee""Ei V Ee""Si . (ё,)2 - -<№ _ kT2dU [£l) ~ dii~ dT e2 - (ё,)2 = VkT ■ CT, n dU с~дт теплоемкость «при отсутствии внешней работы». Уравнение (5.10) для средней квадратичной флуктуации дает обильную пищу интуиции. Для многих макроскопических систем при 1 Черточка (е;) имеет теперь совершенно иной смысл; читатель поймет его и без введения нового обозначения.
30 Статистическая термодинамика не слишком низкой температуре СТ может рассматриваться как величина, грубо указывающая на «теплосодержание»; последнее по порядку величины примерно равно пкТ, где п — число степеней свободы системы. Мы видим, что в этих случаях флуктуации имеют, грубо говоря, порядок кТ^/п, что вполне понятно для всякого занимающегося статистикой. Слова «при отсутствии внешней работы» будут, как правило, обозначать: «при постоянстве таких параметров, как объем». Я сформулировал это таким образом для того, чтобы иметь возможность рассмотреть один интересный случай с «бесконечной» теплоемкостью и, следовательно, с «бесконечными» флуктуациями. Если мы заключим жидкость и находящийся над ней насыщенный пар в цилиндр (рис. 1), закрытый поршнем, нагруженным таким образом, чтобы уравновесить давление пара, и скользящим без трения внутри цилиндра, и поместим цилиндр в термостат, то мы будем вправе считать, что поршень и груз составляют часть того, что мы называем системой; тогда, даже при передвижении поршня, внешняя работа производиться не будет. При этих условиях С —>• оо, так как любое количество тепла, воспринятое или отданное системой, не изменит ее температуры, а будет вызывать, соответственно, лишь испарение или конденсацию. Таким образом, в системе смогут происходить флуктуации любой величины, пока все вещество не сконденсируется или не испарится. Вакуум Q У//////////Л Пары Рис. 1
Глава 6 Метод средних значений Вернемся теперь к задаче, поставленной во второй главе, и рассмотрим ее, пользуясь новым методом. Мы делаем это по ряду причин. Во-первых, потому, что рассуждения в пятой главе показали, что «метод наиболее вероятных значений» не является вполне строгим; настоящий метод, которым мы обязаны Дарвину и Фаулеру, многим представляется более убедительным, может быть, даже совершенно точным. Во-вторых, всегда заманчиво и поучительно видеть, что в точности тот же результат может быть получен путем совершенно иных рассуждений, в особенности, если речь идет о весьма общей теореме, имеющей фундаментальное значение. В-третьих, развиваемый здесь математический метод окажется очень полезным также и в других приложениях. Нашей целью является вычисление средних значений щ в ансамбле Гиббса, определяемых соотношением (5.1). Воспользуемся приемом, который мы применили в (5.2), (5.3) и (5.4) и в силу которого все, что мы хотим знать, может быть получено из величины У Р = у Nl ^^ ...и;?'..., (6.1) где суммирование производится по всем совокупностям величин щ, удовлетворяющим (2.3). Таким образом, нам достаточно вычислить эту сумму. Если бы единственным ограничением для щ являлось условие ^2 Щ = N, то эта задача решалась бы немедленно с помощью формулы для полинома, и сумма, по крайней мере формально, была бы равна (а>1 + ш2 + u)z + • • • + Щ + • • • )N ■ (Чтобы результат был конечным, следует обрывать ряды уровней на каком-либо очень высоком уровне.) Второе условие ^ ще\ = Е автоматически ограничивает число членов в (6.1), в силу невозможности
32 Статистическая термодинамика существования уровня £/ > Е — (N — l)ei; однако в то же самое время оно же и определяет трудность задачи, состоящую в необходимости выбора лишь тех членов, которые удовлетворяют этому условию. Чтобы преодолеть эту трудность, мы воспользуемся следующим ухищрением. Не принимая во внимание второго из указанных ограничений, вычислим такую сумму: Т.** za,! Ei + a2E2 + ...+а(£( + . Е N\ а1\а2\...щ\... -(LjlZei)ai(u;2ZS2)a2 ... {u>izSl)ai ...= = faz'1 + u;2zs* +... ^zs' +...)N = f(z)N, (6.2) где f(Z) = L0lZei + L02Ze2 +... LJtZei +... (6.3) Если бы все Е\ и Е были целыми числами, то искомая сумма ^Р была бы, очевидно, коэффициентом при zE в функции отгв (6.2); она может быть вычислена методом теории вычетов в комплексной плоскости z. Чтобы осуществить этот план, мы должны — в этом и заключается наше ухищрение — объявить с самого начала выбранную нами единицу энергии столь малой, что можно считать с любой желаемой степенью точности все уровни £/, и заданную полную энергию Е целыми кратными этой единицы или, если угодно, даже заменить их целыми кратными этой единицы, не меняя сколько-нибудь существенно самой физической задачи. Имеются, конечно, случаи, в которых это оказывается невозможным, в частности, когда густота уровней £; становится бесконечной вблизи некоторой конечной энергии е; это, например, имеет место для электронных уровней свободного атома водорода. Мы исключаем такие случаи, которые, как можно показать, вообще недоступны статистическому исследованию без специальных предосторожностей (например, атом водорода должен был бы быть заключен в большой, но конечный ящик, препятствующий удалению электрона в бесконечность). Представляется удобным ввести два дальнейших ограничения, касающиеся е/. Во-первых, если Е\ ф 0, то мы пользуемся вместо уровней е1, е2, ... , £/, ... уровнями 0, £2 — £i, £3 — £1, ••• , £; — £1, ..., заменяя одновременно Е на Е — Nei. Рассмотрение (6.3) и следующей формулы (6.4) убеждает нас в том, что это не вносит никаких изменений, являясь лишь более удобным математическим способом выражения.
Глава 6. Метод средних значений 33 Предположим, для простоты, что Е\ = 0. Во-вторых, мы предполагаем, что величины £/ не имеют общего делителя. (Этого всегда можно достигнуть, так как в противном случае Е также должно было бы его содержать, чтобы условие ^ а/£/ = Е могло бы в точности быть выполнено.) Таким образом, если общий наибольший делитель равен т, то мы выбираем единицу энергии в т раз большей, что уничтожает делитель, оставляя, однако, все значения целыми числами. Приняв это условие, получаем простое и очевидное решение 1> 1 2тгг z-E-1f(z)Ndz. (6.4) Здесь интегрирование ведется вдоль любого замкнутого контура (рис. 2), охватывающего начало координат в комплексной плоскости z и, кроме того, лежащего внутри круга сходимости f(z), что позволяет избежать аналитического продолжения. Интеграл оценивается методом наиболее крутого спуска (метод седловидной точки). Рассмотрим поведение подынтегрального выражения, двигаясь от нуля до бесконечности вдоль действительной положительной оси и учитывая, что все и> в (6.3) виртуально равны единице и что 0 = £i ^ £2 ^ £з- Первый сомножитель в подынтегральном выражении z~E~x убывает быстро и монотонно, начиная с бесконечного положительного значения. Второй множитель f(z)N, начиная со значения 1 при z = 0, монотонно возрастает, стремясь к бесконечности по мере приближения z к границе круга сходимости f(z), где бы она ни была расположена. Кроме того, относительное уменьшение первого сомножителя Е + 1 Рис. 2 само убывает монотонно от +оо при z = 0 до нуля при z тельное возрастание второго сомножителя оо; относи- N /'(*) т N- i
34 Статистическая термодинамика обнаруживает противоположное поведение. Эта величина равна нулю при z = 0 и монотонно возрастает. В самом деле, A(NIW\=NJ k V™ У (?*")' Числитель этого выражения может быть переписан в виде 2 £ 2Г \ ; / + >0, откуда видно, что он положителен. При этих обстоятельствах подынтегральная функция обнаруживает один и только один минимум (не принимая других экстремальных значений) внутри круга сходимости f(z). Этот минимум, как можно ожидать и как будет показано в дальнейшем, является очень острым; это вытекает из того, что обе экспоненты, т. е. Е + 1 и N — весьма большие числа; действительно, не следует забывать, что нас интересует переход к пределам N —>• оо, Е —>• оо при сохранении постоянства Е отношения ^, поскольку последнее выражает среднюю энергию, которой обладает одна система, входящая в ансамбль. Другими словами, в этой точке на действительной положительной оси (обозначим ее пока через Zq, опустив впоследствии индекс 0) первая производная подынтегральной функции обращается в нуль, вторая же производная должна быть положительной, и можно думать, что она очень велика. Следовательно, если мы будем двигаться от этой точки в направлении, перпендикулярном действительной оси, давая чисто мнимые приращения, подынтегральная функция будет проходить (оставаясь вначале действительной) через очень острый максимум. Возьмем в качестве контура интегрирования в (6.4) окружность с центром в точке О, проходящую через точку z = zq, рассчитывая, что основную долю в значение интеграла будет вносить только непосредственная окрестность этого чрезвычайно острого максимума. В свое время мы это докажем.
Глава 6. Метод средних значений 35 Определим прежде всего значение zq, полагая первую производную равной нулю, и определим значение второй производной при z = Zq. При этом будет удобно воспользоваться логарифмическими производными. Пусть на действительной положительной оси Z -E-\f(z)N = es{z) (6.5) [мы берем, разумеется, главную ветвь, т. е. действительную часть g(z)]. Тогда zq будет определяться выражением ^о) = -^+^ = 0; (6.6) и, далее, Это показывает, во-первых, что при достаточно больших Е и N Zq не будет изменяться при пропорциональном возрастании Е и N; во-вторых, поскольку величина g"(zo) в этом случае изменяется пропорционально Е и N, она может быть сделана, таким образом, сколь угодно большой (то, что она положительна, не нуждается в доказательстве, так как это вытекает из общих соображений). Следовательно, для очень малого, чисто мнимого приращения гу, сообщаемого z вблизи z = Zq, подынтегральное выражение может быть написано следующим образом: 4о B-1/^o)JVe-^''(^)/2+...5 (68) и ближайшая окрестность окружности, по которой производится интегрирование, приведет [с любой желательной точностью, если с увеличением N величина g"(zo) делается достаточно большой] к результату: + оо е-у g"(*o)/2idy -E-if(z0)N—J== (6.9) у/2*8"Ы
36 Статистическая термодинамика Мы заключили ^Р в скобки, ибо нам предстоит еще доказать, что вычисление можно считать оконченным, т.е. что долей, вносимой остальной частью окружности, можно пренебречь при больших N. Образно говоря , это происходит потому, что отдельные члены ряда (6.3), «усиливающие» друг друга на действительной оси, будут по мере перемещения г по окружности «поворачиваться» вокруг начала координат с различными скоростями, определяемыми различными целыми числами ej; в результате |/(г)| будет, вообще говоря, значительно меньше, чем /(го) (если не рассматривать область, лежащую непосредственно вблизи г = го, что мы уже оговорили). Отношение абсолютного значения подынтегральной функции, взятой в произвольной точке г на окружности, к значению ее в г = го равно I /Ы J (6.10) и становится для больших N сколь угодно малым по сравнению с последним (тоже малым) множителем в (6.9), т.е. с [2^"(го)]-1 , порядок малости которого равен iV-1'2. Чтобы сделать это заключение строгим, мы должны показать, что максимальное значение |/(г)|, скажем, М существенно меньше, чем /(г0): М < /(го). Действительно, при этом доля, вносимая в интеграл остальной частью окружности, наверное, не превышает величины ^г0-вМЛГ27г = г0-в/(го)ЛГ(7^у) , (6.12) которой при N —> сх> можно пренебречь по сравнению с (6.9). Чтобы доказать (6.11), обратим внимание на то, что равенство М = /(го) могло бы иметь место только в том случае, если в какой-нибудь точке окружности г, существенно отличной от го, все члены (6.3) снова складывались бы наиболее благоприятным образом. Поскольку первый член действителен и положителен (ei = 0), то и все остальные должны были бы быть действительными и положительными в этой точке. Пусть <р (^ 27г) — фазовый угол в этой точке. Тогда все произведения eiip, e2ip, ••• , £ip, ••• должны были бы быть целыми кратными 2-7г, а все целые числа ej — целыми кратными ——; т.е. 2тг ' т. е. 1 Читатель при желании может полностью не знакомиться с этим растянутым доказательством (набранным петитом).
Глава 6. Метод средних значений 37 Однако это возможно только, если ip = 2п (т.е. при г = го), ибо если —^ р больше единицы, то оно должно быть рациональной дробью — с числителем больше единицы, даже если эта дробь образована наименьшими целыми числами р и q. Тогда р было бы общим делителем всех ej, что противоречит нашему предположению об отсутствии такового. Это доказательство довольно искусственно и не очень импонирует физику, которому трудно поверить, что отдельный уровень ej может испортить все дело. Действительно, мы можем себе представить, что все уровни, кроме одного, имеют довольно большой общий делитель р, который не может быть устранен вследствие того, что один уровень им не обладает. Приходится удовлетвориться тем, что даже один единственный «нарушитель» может воспрепятствовать неограниченному приближению максимума М к /(го). Действительно, поскольку не все ei имеют общий делитель, они должны приобретать это свойство (не иметь делителя) в некоторой конечной точке ряда, например ет. Предполагаемый «нарушитель» может тогда оказаться лишь членом ряда с ei ^ ет, что, очевидно, устанавливает также верхний предел величины предполагаемого общего делителя р остальной части. Не полностью действительный (частично мнимый) член ряда будет обладать фазовым ., „ 27Г углом, равным, по крайней мере, ——, и будет выражаться в виде ei 27гг/р uJiz0'e ". Это, очевидно, вызывает конечные отклонения |/(г)| от |/(го)|, хотя при достаточно больших £; и р отклонение может быть достаточно малым; остальное может быть учтено путем перехода к пределу N —У оо в (6.10) или (6.12). Вернемся теперь к нашим основным результатам (6.6), (6.7) и (6.9). Перепишем их, отбросив для краткости индекс в zq, так как нас будет интересовать именно это действительное положительное значение z. В уравнении (6.3) мы также будем подразумевать под z эту величину. Таким образом, подводя итог нашим результатам, получаем: f(z) = ojlZei + Gj2ze* +...+ ojiZEi +... , (6.13) J(z) = -^+n£Q=0, (6.14) E + i , >г/7"(*) /Ч*)2 ^) = ^+2V(^-^_L), (6.15) У P = 7-E-lf(^N_A (g 16)
38 Статистическая термодинамика log^ P = -{Е + 1) log* + Nlogf(z) - \ log(27rg"(*))- (6.17) Даже последний член в последней формуле оказывается пренебрежимо малым, и мы могли бы опустить его на том основании, что он имеет лишь порядок logiV. Однако для осторожности мы все же удержим его на некоторое время. Теперь мы получим из (5.3) средние числа заполнения 01 = w'—&^— = W'^ZW + ~Ш ~ 2 &^ {Z)- (6Л8) Первый член равен нулю в силу (6.14). (Нам следовало, конечно, принять во внимание неявную зависимость z от u>j.) Рассматривая последний член, введем среднюю энергию § = U, (6.19) которая не меняется при предельном переходе N —>• оо, Е —>• оо. Тогда (6.15) принимает вид: 'и , Г_/'2 / / Следовательно, последний член в (6.18) при предельном переходе является также постоянным, и мы получаем (полагая, согласно намеченному плану, все u>i равными единице): 5' = iV+^+- + ^- (6-21) Если учесть (6.19) и положить все и> равными 1, то уравнение (6.14), определяющее z, может быть написано следующим образом: и = £iz61 + e2z62 + ...+ £izei + ... . 22 zei + ze2 + ... + zei + ... ' \ ■ ) Если мы положим log£=-/x, (6.23) то последние два уравнения будут тождественными копиями основного соотношения (2.6), исходя из которого мы начали построение термодинамической теории. Отличие состоит лишь в том, что средние значения щ заменены теперь наиболее вероятными значениями. Наша f(z) играет роль статистической суммы, таким образом, мы можем теперь утверждать, что мы обосновали теорию новым, независимым способом. ■>(Z)=N[^ + J-T-LT). (6.20)
Глава 6. Метод средних значений 39 «>'=«&W<'>&+!w-h&'«"<4 Посмотрим теперь, что дает (5.4) для флуктуации. Используя (6.18), образуем д i „,, ч dz , miVze' l a Первый член не дает здесь ничего, так как g'(z) = 0. Уравнение (6.14) следует считать выполняющимся тождественно относительно ш/. Последний член может быть опущен, так как согласно (6.20) он имеет «нулевой порядок» относительно N, и члены, имеющие порядок N, окажутся преобладающими. Дифференцируя средний член, мы снова должны принять во внимание, что z зависит от u>j (хотя, как правило, не очень сильно и согласно (6.14) и (6.19) независящим от N образом). Мы получаем: (fli) 2 ^2=4+^-^f-ll- ^ Полагая все и> равными единице и пользуясь (6.14), (6.19) и (6.21), без труда получаем: , dlogz щ - doji Поскольку в квадратных скобках несомненно нет членов, имеющих порядок N, среднее квадратичное отклонение если и не является в точности «нормальным», то во всяком случае имеет «нормальный порядок», т.е. порядок aj. Таким образом, относительная флуктуация стремится к нулю, когда N и все а/ стремятся к бесконечности. Распределение становится бесконечно острым. Средние значения, наиболее вероятные значения и вообще любые значения с неисчезающей вероятностью — все становятся одними и теми же. Можно, впрочем, дать среднему члену в (6.24) точную оценку. Это довольно поучительно, хотя и не имеет особенно важного значения. Этот член оказывается всегда отрицательным. Для этой цели представляется несколько более удобным перейти от величин z к величинам /х или Т, пользуясь соотношением (6.23): logz = -» = -w Тогда дlogz _ дц /_ i dlogT\ 7i\ kf диц )' ди, ди.
40 Статистическая термодинамика Эта зависимость /л от одного из ш\ вычисляется из (6.14), которое может быть переписано в виде: v-^ -U£, При этом подразумевается, что U = const. Следовательно, ,. dax ds0 d\ogU=—- — =0, где мы полагаем для краткости e* = 5>*o;/e-'ie'. Далее, варьируя только /л и одну из величин и>[: ds\ = £/e-fle' dwi — S2 dfi, dso = e_fle' du>i — si dji. Тогда E;e-M£( dWl _ S2 d^ g-дег (1Ш{ _ Sl d^ ^ si 55 ~ °- Отсюда мы легко получаем: dfj, (^-^У'161 дщ (a-t sl 'So Принимая во внимание смысл входящих сюда величин, можно написать1: _ о/л _ ei — U щ d"i ~ (£p[/)2 N' Таким образом из (6.24) получаем: (ei - U)2 щ аП (аг) = щ 1 (e~U?N Ni Будем называть дисперсию нормальной, если средний член равен нулю. Это имеет место для уровней, достигающих средней энергии (ej — U). Во всех прочих случаях дисперсия является, субнормальной2. 1 Волнистая черта указывает на усреднение по членам ансамбля: об этом уже говорилось в конце предыдущей главы. 2Напомним случай отдельного осциллятора Ферми, где флуктуации щ оказались в точности равными нулю.
Глава 6. Метод средних значений 41 Одной из привлекательных сторон статистической термодинамики является то, что величины и функции, введенные первоначально как чисто математические понятия, почти неизменно приобретают фундаментальный физический смысл. Примером этого являлись множитель Лагранжа /л, максимум z, статистическая сумма (или функция распределения). Каков же смысл ^Р? Мы установим его, рассмотрев выражение (6.17). Откинем последний член этого выражения как малый, используем обозначения (6.19) и (6.23) и, вспомнив, что /х = —-, полу- K-L N Тогда ^1>= £ + >-№> = £ + |(s-?Hs- £log$> = S (6.25) будет энтропией отдельной системы. Этот результат уже сам по себе достаточно интересен, однако он оказывается еще более заслуживающим внимания, если вернуться на некоторое время ко второй главе и вычислить логарифм максимума Р (мы могли сделать это там же, но не воспользовались этой возможностью). Из (2.2) и формулы Стирлинга имеем: logP = TV(logTV - 1) - Y,ai(logat - 1) = TV log TV - ^aj logo,. i i Пользуясь величинами щ, соответствующими «максимуму», — p—pei a, = N- и логарифмируя их: log щ = log TV - fj£t - log ^2 e~ I получим logPmax = TV log TV - Y; ai logTV + /x^] вд + ^ a, log^] e »E I = HE + Nlog^e-^'
42 Статистическая термодинамика и, далее, logPmax=-§ +Nl(s-%). fa W Умножая на ^- и вспоминая, что Щ = С/, получим: ^logPmax=|+5-| = 5. (6.26) Сравнивая это с (6.25), видим, что энтропия может быть вычислена с равным успехом либо как log^P, либо как logPmax. Дело в том, что хотя число тех Р, которые сравнимы с Ртах, и очень велико, оно, тем не менее, исчезающе мало по сравнению с величиной самого Ртах. Следовательно, разница логарифмов исчезающе мала. На это обстоятельство указал Г. А. Лорентц в своем знаменитом мемуаре «Нечувствительность термодинамических функций». Существуют и другие статистические аналогии энтропии, не имеющие, однако, столь общей применимости. Понятие энтропии, выведенное из статистической суммы, приложимо к любой системе как большой, так и малой, как к отдельному осциллятору, так и к газу, твердому телу или гетерофазной системе. Один из аналогов, на котором следует остановиться (указанный В.Гиббсом), предполагает, что система, будучи помещена в тепловой резервуар, обнаруживает лишь малые флуктуации энергии, что, как мы знаем, свойственно любой большой системе. Заняты лишь уровни, весьма близкие к средней энергии U. Но что же показывает статистическая сумма e-^i + е-^2 + ... + e-^i + ... ? Поскольку е расположены в арифметическом порядке, экспоненты непрерывно убывают. А ведь они являются мерой частоты заполнения! На первый взгляд кажется удивительным — как может возникнуть острый максимум, да и почему он вообще возникает? Объяснение этого кроется в характере увеличения е% при увеличении /, а именно — в том, что по мере передвижения по ряду это увеличение становится все более и более медленным, притом с чудовищно возрастающим замедлением. Другими словами, число уровней, приходящихся на единичное приращение £;, т.е. плотность уровней колоссально возрастает. Максимум возникает в результате компромисса между возрастающей плотностью уровней и убыванием экспонент.
Глава 6. Метод средних значений 43 Обсудим результат с этой точки зрения. Мы можем рассматривать £; как функцию индекса I, т.е. как е(1), и, следовательно, также и I как функцию е, 1(e), выражающую число уровней, достигших предела е. Рассмотрим теперь l(U), где U — средняя энергия (отклонения от которой очень малы). Тогда klogl(U) является энтропией. Нетрудно разобраться в том, что это значит; однако приведем сначала еще одно определение энтропии. Выберем какое-нибудь подходящее малое приращение Ае и соберем вместе все уровни, лежащие внутри этого приращения, обозначив их число через Д/. Тогда статистическая сумма может быть написана в виде: £е"МЕД/> где £ — значение энергии внутри интервала Д/. Мы можем также написать ^ Д£ Область максимального заполнения, т. е. область, в которой £ ~ U, определяется максимумом подынтегральной функции или, если угодно, ее логарифма Д/ l_fdfcl°gf Т V de e=U -£М + 108Д£. Итак, ^ \de bAeJe=u T V de bAeJE=u Отсюда, разумеется, следует, что играет роль энтропии. Причина, по которой мы можем брать саму функцию /([/) вместо Д/ dl{U) ^ или —^> Де dU
44 Статистическая термодинамика заключается в том, что /([/) практически возрастает всегда как чрезвычайно высокая степень U: l(U) = CUn, jj-=nCUn-1, logZ = logC + nlog£/, logj|=log(nC) + (n-l)log[/. Как видно, практически разницы нет никакой. Мне хотелось бы указать путь к интуитивному пониманию причины экспоненциальной зависимости частоты заполнения от £ в условиях теплового резервуара. Пусть ei, £2, ...,£/ и т. д. суть энергетические уровни системы, a 6i, 62, ... , 6|t и т.д. — уровни теплового резервуара. Тогда полная энергия (Е) (сумма энергии системы и энергии резервуара) будет постоянной, а уровни объединенного целого (т.е. системы и резервуара) будут равны ei+bk. Поскольку полная энергия постоянна, обмен происходит только между вырожденными уровнями, т.е. в случае £i +bk = (почти) const = Е («почти» — ввиду наличия энергии связи!). Все эти уровни si + bu для всех комбинаций (/, к) имеют, конечно, равную частоту заполнения, что попросту означает равную априорную вероятность для любого отдельного уровня. Причина уменьшения частоты заполнения для более высоких ei заключается в том, что число уровней теплового резервуара, обозначаемых через Ьк=Е- £;, экспоненциально убывает с уменьшением Е — £/, т.е. с уменьшением энергии, приходящейся на долю теплового резервуара. Это становится совершенно ясным в случае, когда число уровней резервуара равно, например, С(Е - ei)n = CEn (l-jX я СЕпе-ПЕ,/Е (п — очень велико). Этот вывод не претендует на строгость (строгий вывод был дан ранее), однако он поясняет суть дела: чем больше часть общей энергии (Е), которая приходится на долю самой системы (£/), тем мень-
Глава 6. Метод средних значений 45 ше (Е — £;) приходится на долю теплового резервуара. А это экспоненциальным образом уменьшает число используемых уровней теплового резервуара (даже в случае бесконечного теплового резервуара или, вернее, именно в этом случае). Характеризующий это уменьшение экспоненциальный множитель является не чем иным, как уже знакомым нам соответствующим членом статистической суммы, другими словами, относительной вероятностью нахождения нашей системы в состоянии ei условиях теплового резервуара.
Глава 7 Проблема п частиц Итак, начиная с этого момента, мы можем (рассматривая гибб- совский ансамбль, N —>■ оо) не проводить различия между методом наиболее вероятных значений и методом средних значений, ибо они привели к совершенно одинаковому результату. Более того, поскольку результат, будучи найденым, может быть применен самым общим образом к любой системе, можно вообще не прибегать ни к одному из этих методов! Оглядываясь назад, мы убеждаемся в том, что можно было бы вовсе откинуть первый метод, который, так сказать, узаконивается лишь вторым методом. Единственной причиной, по которой я не отбросил первый метод, является то, что математическая его сторона, заключающаяся в сущности в двух-трех строках, несравненно более доступна обозрению; это обстоятельство играет немаловажную роль в области, представляющей столь большие трудности для понимания. Однако, несмотря на только что данное мной обещание не возвращаться к этим двум методам, все же математическая идея Дарвина-Фаулера, справляющаяся с трудностью, вносимой добавочным условием, путем образования вычета, является столь изумительной находкой, что мы воспользуемся ею вновь, на этот раз для того, чтобы оценить статистическую сумму в тех случаях, когда другие методы не позволяют преодолеть возникающие трудности. Тем не менее, я прошу читателя не смешивать эти две вещи; с общим доказательством мы уже покончили. Когда мы будем пользоваться в дальнейшем интегрированием в комплексной плоскости, то будем делать это не для того, чтобы привести пример применения общего метода, а лишь для того, чтобы воспользоваться сходным математическим приемом для оценки некоторых статистических сумм. Это обстоятельство необходимо подчеркнуть, ибо когда, после изложения общего метода, начинают многократно пользоваться тем же математическим приемом, разбирая частные примеры, то почти всегда создается впечатление, что дело идет о приложении общего метода к частному случаю! Перейдем теперь к проблеме п частиц (простейший случай — идеальный газ).
Глава 7. Проблема п частиц 47 Согласно современным воззрениям газ не может рассматриваться как состоящий из п тождественных, слабо взаимодействующих систем, поскольку энергетические уровни газа не являются суммами энергетических уровней п его составляющих, взятых во всех комбинациях. Численно они, разумеется, равны им1. Однако любые два уровня в газе, отличающиеся только тем, что два (или более) из п тождественных атомов или молекул поменялись местами, должны рассматриваться как один и тот же уровень газа. Краткое размышление подскажет, что это приводит к совершенно отличной статистической сумме газа как целого. Лежащая в основе этого физическая идея заключается в том, что частицы суть кванты энергии, лишенные индивидуальности; первым «квантовым физиком» был не Макс Планк, а Демокрит из Абдеры! Отложим несколько обсуждение физического смысла этой совершенно новой точки зрения и тех экспериментальных фактов, которые вынудили нас принять ее. Займемся сначала построением с помощью нашей общей теории новой термодинамики системы п частиц. Если обозначить через а±, о?2, £*з? уровни одной частицы, то определенный уровень (а не класс уровней!) ei системы п частиц (мы будем называть ее для краткости газом) задается числами п\, п2, и3, ... , ns, ... частиц, находящихся, соответственно, на уровнях а±, а2, ..., и этот уровень £; равен ei = щаг + П2(Х2 + ... + nsas + ... = 2J nsas. (Не следует путать эту схему со схемой, приведенной ранее для величин а\ и £;, — между ними существует лишь формальное сходство.) Следовательно, статистическая сумма равна ш= т^): Z = ^е-^"л. (7.1) {п„} Знак ^2 означает, что суммирование ведется по всем допустимым со- вокупностям чисел ns. Это выражение охватывает ряд различных физических случаев: теорию обычных бозе-эйнштейновских газов и тем 1В случае отсутствия взаимодействия между частицами. Мы рассматриваем здесь только этот случай.
48 Статистическая термодинамика самым теорию так называемой химической постоянной, а также теорию ферми-дираковского газа, важнейшим приложением которой является электронная теория металлов. Вычислим величину Z для всех этих случаев. Из log Z получим искомую термодинамику. Другой интересующей нас величиной является среднее значение ns. Заметим для дальнейшего, что оно всегда равно ldlogZ . в чем можно убедиться с первого взгляда. Следует, однако, иметь в виду, что если система конечна, то флуктуациями этих п8 пренебрегать полностью нельзя. Этот случай совершенно отличен от случая флуктуации величин щ в виртуальном ансамбле. При вычислении Z возможны следующие различные случаи: 1) п8 могут принимать следующие значения: a) п8 = 0, 1, 2, 3, 4, ... (газ Бозе-Эйнштейна), b) п8 = О, 1 (газ Ферми-Дирака, запрет Паули). 2) Условие постоянства общего числа частиц £< (7.3) может выполняться или не выполняться. Известен, впрочем, лишь один случай, когда это условие не выполняется, — это случаи Бо- зе-Эйнштейна, т.е. случай излучения абсолютно черного тела (фотоны). Разумеется, этот случай наиболее прост. Положим *в = е-"а% (7.4) что справедливо для всякого случая. Тогда {«4 должно суммироваться по всем допустимым совокупностям чисел пе. Принимая во внимание сначала лишь ограничения случая 1, а) или, соответственно, случая 1, Ь), легко получим 1) a) Z = ТТ г. (Бозе-Эйнштейн), г zs s Ъ) Z = JJ(1+ zs) (Ферми-Дирак).
Глава 7. Проблема п частиц 49 Удобно объединить эти формулы следующим образом: Z = J[(l=FztF1. (7.6) 8 В этой формуле следует брать либо оба верхних знака, либо оба нижних; верхний знак относится к случаю Бозе-Эйнштейна. До сих пор мы не обращали внимания на (7.3). Как я уже указывал, это допустимо только в одном частном случае (тепловое излучение; верхний знак). Можно было бы рассмотреть в первую очередь этот простейший случай. Это кажется заманчивым, однако изложение при этом удлинилось бы. Если наложить условие (7.3), то результат (7.6) оказывается еще не окончательным, так как исходное выражение (7.5) показывает, что мы должны выбрать из (7.6) только однородные члены с показателем однородности п во всех zs. Это осуществляется удобнее всего методом теории вычетов. Положим ЛС) = П(1ТС^)Т1. (7.7) S Тогда точное значение Z выражается совершенно строго следующим интегралом: Z=±-.fcn-1f(C)dC, (7.8) где контур интегрирования расположен вокруг начала координат в комплексной плоскости £ и проведен так, что внутрь него попадает лишь одна сингулярность подынтегрального выражения в точке С = 0. Не представляет особого труда показать, что в обоих случаях подынтегральное выражение имеет при С = 0 большое положительное значение, а его логарифмическая производная — большое отрицательное значение, которое по мере продвижения вдоль действительной положительной оси непрерывно возрастает, становясь, в конце концов, положительным. Следовательно, подынтегральная функция имеет на этом пути один и только один минимум, что позволяет попытаться применить метод наиболее крутого спуска. Полагая на действительной положительной оси С-п-1/(С) = е*Ю, (7.9)
50 Статистическая термодинамика получаем следующие два выражения: g/(C) = _»±l + ^=o, (7.10) н/*\ И + 1 /"(С) /'(С) /7ГП ^(C) = ^ + W--^, (7.11) первое из которых определяет действительный положительный корень С (мы опускаем индекс 0), а второе дает величину g"(C) B этой точке. Тогда мы имеем Z = Сп-7К)-л==, (7-12) V27r^'(C) logZ = -(n + l)logC + log/(C) - |log(27rg"(C)). (7.13) Остается доказать, что g"(() весьма велико также и в этом случае. Хотя в настоящем случае строгий переход к пределу п —>■ оо осуществить нельзя, мы можем совершить его виртуально. Заменим прежде всего в (7.10) п + 1 на п и получим с помощью (7.7) и (7.9) » = £r^— {" = шУ (7Л4) С Т В дальнейшем мы заменим эту сумму интегралом, который окажется пропорциональным объему V вследствие того, что для достаточно больших п число уровней as, расположенных между какими-либо близкими значениями энергии, пропорционально V. Следовательно, характеристический корень £ зависит только от объемной плотности частиц |^. Это не является строго справедливым для конечного и, но мы претендуем лишь на то, чтобы исследовать предельный характер поведения достаточно больших «газовых тел». Если £ фиксировано указанным образом, то (7.11) показывает, что g"(Q действительно сколь угодно велико при неограниченно большом п. Это оправдывает, следовательно, не только тот способ, каким были получены выражения (7.12) и (7.13), но также и отбрасывание последнего члена в (7.13), поскольку он имеет лишь порядок logn; таким образом logZ = -nlogC + log/(C) = -nlogCTX)log(lTCe-,'a')- (7-15)
Глава 7. Проблема п частиц 51 (Если бы мы отказались от виртуального перехода к пределу п —>• оо, то это вовлекло бы нас в рассмотрение не интересующих нас в настоящий момент газовых тел, имеющих столь малую величину, что их термодинамическое поведение зависит от их размеров и формы. Экспериментатор назвал бы наблюдаемые при этом своеобразные явления «поверхностными».) Параметр £ в (7.15) определяется выражением (7.10), которое удобнее исследовать в форме (7.14). С другой стороны, убеждаемся, что мы поступили целесообразно с точки зрения экономии времени, не рассматривая отдельно случай, когда общее число частиц не задается заранее, а когда ему позволяют установиться самому по себе. В этом случае Z получалось прямо из (7.6) с помощью (7.4). Легко видеть, что этот случай формально охватывается только что полученной формулой для logZ, а именно — (7.15), в которой достаточно положить £ = 1 [вместо того, чтобы определить ее, как прежде, посредством (7.14). Это не делает, однако, полностью бесполезным последнее уравнение; оно дает нам число п наличных частиц, которое может изменяться.] Частная производная от (7.15) по £ исчезает согласно (7.10). Следовательно [хотя С, как показывает (7.10), зависит от а8], из (7.2) имеем: 1 Slog Z 1 ^s = — — —jt = - . (7.16) с т Это выражение раскрывает смысл уравнения (7.14). Согласно последнему уравнению средняя энергия нашего газового тела, очевидно, равна: и = Т,т-^—• (7Л7) Читатель может сам убедиться в том, что этот результат может быть также получен из (7.15) с помощью общего соотношения: Если не считать одного любопытного исключения (случай бозе-эйн- штейновской конденсации, который мы подробно рассмотрим в дальнейшем), суммы в выражениях (7.14), (7.15) и (7.17) и им подобные
52 Статистическая термодинамика могут быть заменены интегралами. При этом мы можем не беспокоиться о точных значениях уровней as; нас интересует лишь их плотность на единицу приращения энергии. Ограничимся случаем, когда as представляет собой лишь трансляционную энергию. (При низких температурах, когда «новая» статистика дает результаты, отличные от «старой», все газы становятся «одноатомными», так как колебания и молекулярные вращения полностью «замерзают», и их можно не учитывать.) Число состояний (отдельной частицы), присущих «физически бесконечно малому» элементу фазового пространства, равно dx dy dz dpx dpy dpz ft» ' Интегрируя первые три переменные по объему V и, кроме того, интегрируя по всем телесным углам (4-л") импульса, получим ^P4dp, (7.19) ftd где р — абсолютное значение импульса. Если частицы обладают спином, это число должно быть, кроме того, помножено на небольшое целое число, 2 или 3, соответственно различным возможным направлениям спина [2 — для спина ^, а при отсутствии массы покоя также и для спина 1 (фотон); 3 — для спина 1 при наличии массы покоя (мезон)]. Выражение (7.19) является распределением состояний отдельной частицы по оси импульсов р. Нам же для оценки наших сумм необходимо знать распределение по оси энергий а. Общее соотношение между а и р для свободной частицы, очевидно, имеет вид: а = с^/т2с2 +р2. (7.20) Это выражение распространяется на все случаи. Наличие квадратного корня делает его, однако, неудобным. Это неудобство, впрочем, не является существенным, поскольку практически приходится иметь дело лишь с двумя предельными случаями: 1) т = 0 (фотоны), 2) р <С тс для всех занятых уровней. (Это имеет место для всех частиц, кроме фотонов, при практически встречающихся температурах.)
Глава 7. Проблема п частиц 53 В первом случае имеем а = ср (фотоны). (7-21) Во втором случае с превосходным приближением получим: 2 а = тс2 + £-. (7.22) Энергия покоя тс2 может быть опущена, поскольку она постоянна, а нулевая энергия нас не интересует. Величина (7.19) может быть получена совершенно сходным образом из волновой механики. Согласно асимптотической формуле, данной Г. Вейлем, для любого волнового движения, происходящего в объеме V, определяемом любыми граничными условиями, число собственных колебаний с длиной волны > А будет равно выражению: Эта величина должна быть умножена на небольшое целое число, 1, 2 или 3, в зависимости от того, каковы тензорные свойства волн, определяемые различными возможными состояниями поляризации плоской волны. Термин «асимптотическая» означает, что формула становится точной в пределе -^ —>• оо. С помощью данного де Бройлем универсаль- ного соотношения между импульсом и длиной волны h Р = из (7.23) получаем р-\ 4тг V_ з 3 h*P ' что дает для числа состояний между р и р + dp выражение (7.19). Итак, мы можем рассматривать (7.19), во-первых, как выражение, дающее число квантовых состояний частицы, и, во-вторых, как выражение, дающее число волново-механических собственных колебаний внутри ящика. Эти два эквивалентных способа интересуют нас здесь по следующей причине: вторая из этих точек зрения позволяет нам трактовать «п8 частиц, находящихся в состоянии as)> как собственное колебание (или осциллятор полого пространства, если пользоваться принятым термином) на своем пв-м квантовом уровне. (Эта точка зрения
54 Статистическая термодинамика соответствует так называемому вторичному квантованию или квантованию поля.) ns становится квантовым числом, и наше утверждение о том, что система квантовых чисел п\, п2, п3, ... , ns определяет одно-единственное состояние газа, а не класс из ni!n2! ...nal... состояний, перестает казаться нововведением, укладываясь в обычные представления о квантовых состояниях и их статистическом весе (одинаковом для любых двух состояний). Часто употребляемый термин «новая статистика» возник именно в связи с первой точкой зрения, основанной на представлении о частицах. Этому же соответствует и то обстоятельство, что идея новой статистики не возникла первоначально в связи с тепловым излучением, так как в этом случае волновая точка зрения была исторической, классической, — никто и не думал вначале о чем-либо ином. Волновая картина считалась (и исторически действительно была) классическим описанием явлений. Квантование волн выступило, таким образом, в роли «первичного» квантования, и никто и не помышлял о чем-либо вроде «вторичного» квантования. Только после того, как идея фотонов стала достаточно обоснованной, Бозе (около 1924 г.) указал, что наряду со статистикой «осцилляторов полого пространства» можно говорить о статистике фотонов. Эта другая статистика и есть статистика Бозе. Вскоре после этого Эйнштейн сделал то же для частиц идеального газа. Поэтому я и указал, что можно также и в этом случае говорить об обычной статистике, примененной к волново-механическим собственным колебаниям, соответствующим движению частиц газа. В связи с волновой точкой зрения в обоих случаях или, по крайней мере, во всех «случаях Бозе» возникает еще один интересный вопрос. Поскольку в случае Бозе мы, очевидно, встречаемся с простым осциллятором планковского типа, для которого ns служит квантовым числом, мы вправе спросить, не следует ли нам выбрать для ns не целые, а полунечетные значения 13 5 1 2' 2' 2''"' 2'"' Вопрос этот, по моему мнению, следует признать открытым. По аналогии с предыдущим было бы весьма желательно остановить выбор
Глава 7. Проблема п частиц 55 на полунечетных числах, так как нулевая энергия планковского осциллятора -^hu не только вытекает из непосредственного исследования кристаллических решеток, но связана настолько тесно с соотношением неопределенностей Гейзенберга, что было бы крайне нежелательно расстаться с ней. С другой стороны, приняв ее безоговорочно, мы попадаем в затруднительное положение, в особенности при рассмотрении изменений объема (например, при рассмотрении адиабатического сжатия заданного объема черного излучения), так как в этом процессе приращения (бесконечной) нулевой энергии оказываются бесконечно большими! Поэтому мы не приписываем нулевой энергии значение =-hv и продолжаем считать ns целыми, начиная с нуля. После этого отступления вернемся к нашей проблеме. Мы не будем рассматривать случай фотонов, он слишком хорошо известен, и читатель легко может познакомиться с ним сам. Поэтому мы воспользуемся выражением (7.22) [совместно с (7.19)], опуская в нем несущественную постоянную тс2. Это дает ^Щ-р2йр состояний отдельной частицы с им- h , Р2 пульсом, лежащим между р и р + ар. а = -^ кинетическая энергия отдельной частицы. Используя эти выражения, превращаем суммы (7.14), (7.15) и (7.16) в интегралы; при этом сразу же вводим повсюду безразмерную переменную интегрирования р 2т V2m~kT' так что интегралы сводятся к функции одного параметра £. При этом получаем 4тгУ, ^-(2mkTfl2 [ x2dx , (7.24) h6 J 1„ж2 -г- i о £е + -1 оо * = HogZ = -пк\о£С^Щ^(2ткТ)3/2 f\og(l^Ce-x2)x2dx, (7.25) h6 J о оо ^(2m)3/2(fcT)5/2 / xUx . (7.26) h I \e*2Tl u~^V< о /•" "F
56 Статистическая термодинамика Сразу же видно, что первое из этих уравнений (определяющее £ как функцию (-^)Т3/2) выражает тот факт, что частная производная от Ф по ( исчезает. Заметим, что с помощью интегрирования по частям интеграла, содержащего логарифм, для Ф может быть получено следующее выражение: оо Ф = fclogZ = -nk\ogC> + ^Y^{2mkTfl2 f x\dx . (7.27) Oil J *_£>& -Г- 1 0 £K + 1 Отсюда (используя замечание относительно -j— = 0) легко доказать справедливость (7.26), если образовать С/ = Т2||. (7.28) Столь же просто может быть вычислено и давление Р = Т2§- (7.29) Из (7.24) и (7.25) сразу видим, что С, а следовательно, и Ф являются лишь функциями от VT3/2 (при постоянном п). Отсюда и из предыдущих двух уравнений без труда заключаем, что PV = §t/ (7.30) имеет место в обоих случаях, а также, между прочим, и в классической теории идеального одноатомного газа (для теплового излучения pV = = jrU; это означает, что р относительно очень велико, так как в случае теплового излучения U представляет собой полную энергию, а в случае газа — только кинетическую). Из (7.27) вытекает еще одно общее соотношение: pV Ф = -п£1оёС + ^г, а так как это эквивалентно S-V- ° гр 1
Глава 7. Проблема п частиц 57 то nkTlogC = U -TS+pV; другими словами, пкТ log С является термодинамическим потенциалом. (Еще один пример вспомогательной математической величины, приобретающей физический смысл! В то же самое время это подтверждает то обстоятельство, что наши рассуждения не являются простым приложением физического метода Дарвина и Фаулера, так как в последнем log z был равен тЬ.)
Глава 8 Оценка формул. Предельные случаи Чтобы определить истинное поведение вырожденного газа, необходимо дать численную оценку двум определенным интегралам при различных значениях £. Укажем общий план этой процедуры. Прежде всего из (7.24), оо 4ж(2тк)3/2 у /2 f x2dx 1) о Г =F получаем функциональную зависимость между ^Т3/2 и С- (8-2) Далее, из (7.26) и (7.30) получаем: 2 _U_ = PV_ = 2 4?r(2mfc)3/2 у 3/2 3 пкТ пкТ 3 /j3 n /ж4 rfa; -е*2 =F 1 (8.3) Выражение в правой части дает нам отклонение от обычных законов газов, ибо в случае последних оно равно единице. Действительно, если разделить почленно (8.3) на (8.1), х dx 2 U PV 2 ° ^ / 1 ех'2 =F 1 3 пкТ пкТ 3 °J Ж2* 1 „2 /x2dx -е*2 =р 1 (8.4)
Глава 8. Оценка формул. Предельные случаи 59 При очень малом (, получаем для отношения двух интегралов: оо /e-Vcfc О оо о Итак, при очень малом (, приходим (в обоих случаях) к классическому поведению (£ также носит название параметра вырождения). Оба интеграла при этом очень малы, а это, согласно (8.1), означает, что Т/" о fry j-T ' очень велико. Это значит: высокие температуры, низкие плотности. Полученный результат способен в одно и то же время удовлетворить, разочаровать и удивить. Удовлетворяет потому, что при высоких температурах и низких плотностях мы должны прийти к классическому поведению (по крайней мере, в случае Бозе) для того, чтобы не вступить в противоречие со старыми, прочно установленными экспериментальными фактами. Разочаровывает, ибо для получения заметных отклонений необходимы столь высокие плотности и столь низкие температуры, что ван- дер-ваальсовы поправки сливаются с возможными эффектами вырождения, причем перспективы возможности разделения обоих эффектов весьма сомнительны. Удивительным является то, что «новая статистика», заменяющая единицей множитель ni!n2! ...nal... (который в «старой статистике» очень велик, и это ее характерная черта), приводит к тому же результату, что и старая (этого еще можно было, пожалуй, ожидать при Т —>• 0, когда множитель в старой теории приближается к единице). Разрешение этого парадокса заключается в том, что этот множитель, если вычислять его, применяя классическую статистику к квантовым уровням отдельных частиц, равен не единице, а п\. В этом еще (8.5)
60 Статистическая термодинамика «нет беды», поскольку он постоянен (в чем заключается «беда» мы вскоре увидим). Другими словами, при высоких температурах и низких плотностях квантовые ячейки столь многочисленны, что в среднем, даже в «наиболее населенных» областях, лишь 1П»ПП или их числа оказывается занятой. Числа ns равны либо нулю (большинство из них), либо единице, либо, в очень редких случаях, двум. В этом и заключается причина того, почему, независимо от того, исключается ли последняя возможность вовсе (Ферми-Дирак), или же ей приписывается значительный статистический вес (Бозе-Эйнштейн), ею все равно можно пренебречь. Вышеприведенное утверждение относительно чисел заполнения подкрепляется следующими рассуждениями. Напомним выражение для среднего числа заполнения ns (7.16): Щ=- - • (8.6) Поскольку epas > 1, то для £ <С 1 мы можем опустить q=l и получить откуда сразу можно видеть, что Щ <С 1 при ( < 1, что доказывает наше утверждение. Более того, поскольку в «действительно наиболее населенной» области, определяемой условием fias = —^ ?s 1, экспонента K-L имеет все еще порядок единицы (но не меньше), мы можем утверждать, что Щ и С (8.7) дает правильный порядок величины также и во всей интересующей нас области. Проверим теперь, насколько эта величина мала в действительности. (Выше я утверждал, что она составляет около или .) Ответ на этот вопрос легко получить из (8.1): Значение интеграла г = 47r(2mfc)3/2 утз/2 yfr h3 n * 4 HW^- (8-8)
Глава 8. Оценка формул. Предельные случаи 61 Следует ожидать, что это число велико. Вычислим его при нормальных условиях (0°С и одна атмосфера) для гелия, наиболее легкого из одноатомных газов, взяв для удобства 1 моль: l0g27T logmH log^ ь тн logfc log 273,16 = 0,79 818 = 0,22 337- = 0,60 206 = 0,14 003- = 2,43 642 0,20 006- 0,64 226- -24 -16 -36 -53 0,55 780+16 0,27 890+ 8 0,83 670 + 24 log h log ft,2 logF logn Число 0,82113 0,64 226 27 53 4,35 054 23,77 973 0,57 081-20 0,83 670 + 24 5,40 751 255 570 Примечание: mH raHe fc h V n 1,6 725 x 10"24 3,9 716 1,3 805 x 10"16 6,6 242 x 10"27 2,2 415 x 104 6,0 228 x 1023 VC.G.S.°C Следовательно, при этих условиях, 255 570. j.9) Заполнение будет оставаться крайне редким даже при сильном сжатии и значительно более низкой температуре [см. (8.7) и (8.8)]1. В то же 1 самое время, однако, можно подсчитать, что если бы сжатие до 100 объема и охлаждение в 100 раз (т. е. до 2 + 3°К) могли быть осуществлены без сжижения, то множитель равнялся бы , и мы достигли бы области, в которой £ перестает быть «очень малым». Таким образом, 1 Следует заметить, что относительная флуктуация этих небольших чисел заполнения пе ~ £ исключительно велика, а именно —— ~ 500 или 50 000 %.
62 Статистическая термодинамика область заметного вырождения газа безусловно находится в пределах возможностей опыта, однако эти эффекты вырождения (как я уже сказал) неотделимы от ван-дер-ваальсовых поправок. Постоянная энтропия. Уравнение (8.8) находит себе также прямое и важное практическое применение. Оно используется для вычисления так называемой постоянной энтропии или химической постоянной, или же, более конкретно, для получения формулы давления пара, рассматриваемого как идеальный газ. При этом тот факт, что уравнение дает правильный результат (тогда как классическая теория приводит к чистой бессмыслице), является прямым подтверждением новой точки зрения. Вспомним, что мы получили: nfcT log С = термодинамический потенциал = U — TS + pV, (8.10) откуда энтропия S = nfclog ^ + U +TPV = nfclog j: + |nfc. (8.11) [Таким образом, оказывается, что в (8.9) мы виртуально вычислили энтропию; именно поэтому мы вычислили ее точно, вместо того, чтобы ограничиться простой ее оценкой.] Теперь же нас интересуют общие соотношения и, пользуясь (8.8), получаем S = nfclog^ + |nfclogT + nfclog(2^^)3 2+|nfc. (8.12) Прежде всего обращаем внимание на то, что это выражение зависит разумным образом от У и в; при помножении в и У на некоторый множитель S возрастает во столько же раз. Это замечание может показаться тривиальным, однако (в этом как раз и заключается его главное значение) именно в этом пункте классическая точка зрения, как мы увидим, терпит фиаско. Отметив разумный характер полученной зависимости, перейдем к рассмотрению одной граммолекулы; в этом случае nk = R (газовая постоянная). Помножим аргумент первого логарифма на j- (внося соответствующую поправку в постоянную) и воспользуемся соотношением У- = У- = Т nk R Р:
Глава 8. Оценка формул. Предельные случаи 63 так как в этой связи (а именно, в случае насыщенного пара, к которому мы сейчас перейдем) более привычно говорить не об объеме, а о давлении. Тогда S = -Rlogp + %R\ogT + R\og ± '— + %R. Если измерять R в кал/град и приравнять полученную величину S теплу Ар, необходимому для испарения (эта величина берется из эксперимента)1, разделенному на Т: S=^, (8.13) то получаем знаменитую формулу Саккур-Тетроде, справедливую для температур столь низких, что энтропией конденсированного состояния можно пренебречь. Переходим к области более высоких температур, где эта формула перестает быть справедливой, поскольку газ перестает вести себя как «одноатомный» в результате возникающих вращений и колебаний. Проследим теоретически или экспериментально ход теп- лоемкостей как газа, так и конденсированного состояния. Эти теплоемкости характеризуют все дальнейшие изменения соответствующих энтропии и теплот испарения. Все это относится к классической термодинамике, из которой хорошо известно, каким образом можно предсказать, исходя из давлений пара, любые химические равновесия, включающие газовую фазу. Существенным моментом явилось здесь нахождение значения постоянной для любого газа. Эта постоянная зависит только от массы частицы, что дает возможность предсказать эти равновесия из чисто тепловых или энергетических измерений (без необходимости опытного осуществления хотя бы одного равновесия). Теплота испарения при заданной температуре должна быть, разумеется, взята из опыта, сводящегося, впрочем, лишь к измерению разности энергий, что не требует обязательного осуществления обратимого перехода. Эта разность энергий может быть получена при любой температуре и затем пересчитана на любую другую температуру с помощью данных, получаемых из тепловых измерений; она может быть получена каким угодно способом, в том числе, например, взрывом в бомбе калориметра; ее можно оценить даже теоретически из лю- 1 Индекс р указывает, что р остается постоянным в процессе испарения. Сообщаемое тепло включает также и ту часть, которая идет на работу pV(= RT), совершаемую при испарении.
64 Статистическая термодинамика бых имеющихся в распоряжении данных о силах, удерживающих атомы в кристаллической решетке (рассматриваемого конденсированного тела). Следует, однако, предостеречь от одной возможной ошибки. В самом деле, казалось бы, можно сказать так: «при тех низких температурах, о которых мы говорим, энергия твердой фазы практически равна нулю, и пар ведет себя как идеальный (невырожденный) одноатомный о газ, так что его энергия равна ^RT и теплота испарения равна, следовательно, |ЛГ + RT = |ЛГ. Это было бы, однако, ошибкой, связанной с установившейся терминологией, что, впрочем, вряд ли порочит последнюю. Дело заключается в следующем. Говоря, что энергия конденсированной фазы равна нулю1, или говоря, что энергия пара равна ^RT, мы пользуемся различными нулевыми уровнями энергии. Мы не учитываем того, что частицы газа должны были высвободиться из сфер взаимного притяжения. Это та часть теплоты испарения, которая, разумеется, не может быть получена из какой-либо общей теории. Крах классической теории. Парадокс Гиббса. Приведем вкратце соответствующие классические рассуждения, которые при поверхностном рассмотрении приводят, казалось бы, почти к тем же самым результатам. Для этого достаточно повторить рассуждения четвертой главы, относящиеся к свободной материальной точке. Там нашей целью являлось получение элементарных классических результатов для идеального газа; в качестве меры числа квантовых состояний мы брали сам фазовый объем и вовсе не оценивали аддитивную постоянную в logZ. Вводя теперь множитель, получаем для статистической суммы отдельной материальной точки: + 0О ZOTa = ^(2mfcT)3/2 /77"e-«2+"2+<2>ded4dC= ^(27rmfcT)3/2, — оо 4 V ' (vM3 *OTfl = fclogZOTfl = fclogy + ^logT + fclog(2^)3 2. (8.14) 1Это, кстати говоря, уже само по себе не вполне точно, так как в кристалле имеются значительные колебания в нулевой точке.
Глава 8. Оценка формул. Предельные случаи 65 Следовательно, для п материальных точек, образующих газ, мы получим (в согласии с установленными там несомненными принципами): Фгаз = nklogV + ^logT + nfclog(^g^)3/2. (8.15) Далее, совершенно общим образом, Ф = S — ^, а так как в нашем о случае U = ^пкТ, то: Sra3 = nfclogy + ^logT + nHog(^g^)3 2 + |nfc. (8.16) Укажем сразу на одно могущее возникнуть ложное возражение, связанное с тем, что при Т —>• 0 это выражение стремится к —оо, а не к нулю. Это возражение столь же мало обосновано, как и в случае (8.12). Выражение (8.16) не претендует на справедливость при очень низких температурах, так как простой подсчет числа квантовых уровней при этом уже недостаточен. Напротив, мы убедились в том, что рассматриваемая «больцмановская» точка зрения точно так же, как и более новый взгляд, приводит к5 = 0 при Т —>• 0, когда все частицы опускаются на свои низшие состояния. Действительно, п! ni!n2! • • -пе\ обращается в этом случае в единицу, а логарифм этой величины — в нуль. Подлинным недостатком выражения (8.16), делающим его совершенно непригодным, несмотря на большое сходство с (8.12), является то, что оно дает неправильную зависимость от п и V. Постоянная не удваивается, когда п и V увеличиваются вдвое. В то же время она удваивается при удвоении одного лишь п. Пытаясь применить это выражение, как ранее, для получения формулы, определяющей давление пара, мы пришли бы к ошеломляющему результату: мы не только не получили бы правильного значения для давления пара — мы его не получили бы вовсе! Действительно, пусть теплота испарения, приходящаяся на одну частицу, равна Л и пусть (8.16) равно п\. Т ' (8.17)
66 Статистическая термодинамика тогда мы можем повсюду сократить п, в результате чего получится (при заданной температуре) не давление пара, а его объем, абсолютный объем пара, не зависящий от того, каково число п частиц, образующих пар. В заданный таким образом «правильный» объем может испариться любое количество жидкости или, наоборот, сконденсироваться из объема в жидкость любое количество пара, причем равновесие не будет нарушаться! Производя сравнение выражений (8.12) и (8.16), устанавливаем, что лишний аддитивный член в последнем из них имеет вид: nklogn — nk = kn(\ogn — 1) = fclogn!. (8.18) Ясно, что это не что иное, как умноженный на к логарифм числа перестановок (8.17), получаемого при условии, что все ns равны либо О, либо 1. Это показывает, что «новая статистика» не повторяет ошибки старой или, если угодно, исправляет эту ошибку, делая важный шаг, именно — отказываясь подсчитывать перестановки и полагая этот множитель всегда равным единице. (На стр. 56 мы упомянули, что п\ не портит уравнения состояния и т.д., и обещали указать, в чем именно заключаются вносимые им неудобства.) Следует указать также и на некоторые другие интересные стороны рассматриваемого вопроса. Наличие излишнего члена (8.18) приводит к тому, что если, скажем, соединить две граммолекулы газа, не производя с ними никаких других операций, то энтропия возрастает не в два раза, а несколько более. Это добавочное увеличение, как легко убедиться, равно 2i?log2. Это обстоятельство очень интересно, ибо добавочное увеличение энтропии равно в точности увеличению энтропии при соединении двух граммолекул двух различных, химически не реагирующих газов, осуществляемом путем удаления разделяющей их перегородки. При этом с течением времени происходит диффузия, и, как известно, увеличение энтропии каждого из газов будет таково, как если бы каждый из газов удваивал объем. В.Гиббс впервые показал, что это приводит к парадоксу, состоящему в том, что такое возрастание энтропии не должно приниматься во внимание в том случае, когда обе грамм-молекулы являются грамм-молекулами одного и того же газа, хотя (согласно наивным газокинетическим взглядам) диффузия происходит также и в этом случае, впрочем, незаметным для нас образом, так как все частицы газов равноценны. Современная точка зрения находит разрешение этого парадокса в том,
Глава 8. Оценка формул. Предельные случаи 67 что во втором случае реальная диффузия не имеет места, поскольку взаимозамена тождественных частиц не является реальным событием — в противном случае мы должны были бы учесть его статистически. Всегда считалось, что парадокс Гиббса таит в себе глубокий смысл, однако то, что он оказывается тесно связанным с чем-то чрезвычайно важным и совершенно новым, едва ли можно было предвидеть. После железнодорожной катастрофы, пожара или другого подобного бедствия всегда принято задавать вопрос: как это могло случиться? Как могло случиться, что, даже пользуясь неверной моделью газа, мы пришли к неаддитивному результату (8.16) для энтропии? Вспомним, что, развивая нашу теорию совершенно общим образом, мы приняли все меры предосторожности для того, чтобы логарифм статистической суммы и, следовательно, все термодинамические функции были строго аддитивными. Даже сама формула, приведшая нас к катастрофе, была выведена из logZOTfl простым умножением его на п. Как же она может не быть пропорциональной п1 Взглянув на нее, видим, что она, конечно, пропорциональна п, однако при постоянном объеме! Что произойдет, если мы удвоим теперь также и объем? Мы непроизвольно изменяем дозволенные квантовые состояния отдельной частицы, ибо мы удваиваем их плотность вдоль всей шкалы энергий. Но в наших общих рассуждениях, с помощью которых мы доказали, что при соединении двух систем А и В (с квантовыми уровнями ат и (3k) их термодинамические функции оказываются аддитивными, мы молчаливо предполагали, что сами ат и /3^ не изменяются при этом соединении и что поэтому совокупная система имеет квантовые уровни £i = am +/3fc. Это объясняет причину неудачи. Правда, в новой теории это своеобразное изменение уровней, относящихся к отдельной частице (при соединении двух объемов одного и того же газа) также имеет место. Однако здесь отдельные уровни являются лишь вспомогательными представлениями, удобным способом обозначения уровней газа. Что касается последних, то хотя требование того, чтобы уровни совокупной системы получались аддитивно из уровней составных частей во всевозможных комбинациях, выполняется и не строгим образом1, но все же, очевид- 1Все комбинации совокупности ni, П2, ... , ns, ... с совокупностью п^, п'2, ..., n's, ... являются, разумеется, уровнями совокупной системы. Кроме этих, однако, существуют и другие уровни, так как после соединения требование постоянства предъявляется не к отдельным суммам ^ п3 и Х]пя> а лишь к сумме их сумм. S S
68 Статистическая термодинамика но, с достаточным приближением, чтобы объяснить аддитивность всех термодинамических функций. Отступление. Аннигиляция вещества? В этом месте, пожалуй, будет наиболее своевременно поговорить об одном интересном аспекте соотношения (8.1), возникающем, когда мы опускаем условие ^2 ns = const в случае частиц с неисчезающей массой покоя, что поз- s воляет частицам, так сказать, возникать или аннигилироваться в результате столкновений, причем энергия ±тос2 либо заимствуется из кинетической энергии, либо идет на ее пополнение. В этом случае, разумеется, следует пользоваться выражением (7.22) в его полном виде: 2 Р2 а = тс + ^—. 2т тс2 Легко видеть, что это дает добавочный множитель е НТ перед величиной - как в (8.1), так и в (8.2). Если бы мы не отбросили условие для ^2ns, то получили бы лишь несущественное изменение в опреде- 8 лении С (поэтому-то мы и смогли отбросить тс2 в предыдущих формулах). Но теперь мы отбрасываем это условие. Тогда С = 1- Уравнение (8.1) определяет уже не С, а п или ^, т.е. плотность частиц. Кроме того, формально (8.1) остается тем же, что и прежде, только вместо £ тс2 стоит е кТ . Для всех интересующих нас температур эта величина чрезвычайно мала; она значительно меньше, чем число, указываемое формулой (8.9), а именно С = . Поэтому мы должны быть го- zoo о I и товы к тому, что отбрасывание упомянутого условия будет означать при обычной температуре крайнюю степень разрежения. Мы получаем, вполне аналогично (8.8), тс ff (2жткТ\3/2У ) Vn- (8-19) [Логарифмируя и умножая на пк, получаем формально, по аналогии с (8.12) и (8.13), формулу для давления пара вещества с огромной теплотой испарения, равной величине птс2, деленной на механический эквивалент теплоты.] В качестве примера воспользуемся случаем гелия при нормальных условиях, точными данными для которого мы уже
Глава 8. Оценка формул. Предельные случаи 69 пользовались ранее. Число частиц в кубическом сантиметре ^ будет теперь, очевидно, меньше за счет множителя1: тс2 255 570e~273fc. (8.20) Вычисление экспоненты дает: 10-6,9 343...xlOe (821) Другим множителем, 255 570, следует пренебречь, так как вычисление экспоненты в (8.21) не производится с точностью до 9-го десятичного знака. В пределах полученной точности оказывается даже несущественным, говорим ли мы о плотности в «грамм-молекулах на литр» или в «отдельных атомах на вселенную», так как получающиеся значения будут отличаться лишь в ~ 10110 раз. Подобный же типичный результат получаем и при рассмотрении любых других возможностей аннигиляции весомой материи, например при рассмотрении перехода материи в тепловое излучение. Если не считать такие переходы невозможными, то остается только удивляться, как могло остаться во вселенной так много весомой материи. Единственный выход из этого затруднения заключается, по-видимому, в предположении, что переход является очень медленным процессом и что сравнительно недавно режим вселенной сильно отличался от теперешнего. Отступление, касающееся соотношения неопределенностей. Прежде чем перейти к случаю собственно вырождения (т. е. когда нельзя считать, что ( <С 1), рассмотрим с новой точки зрения величину, стоящую в правой части выражения (8.8): 1 = (2тгткТ\3/2У С v h2 ) "' последнее, как мы помним, является формой, которую принимает (8.1) при С <С 1. Заметное отклонение от классического поведения начинается при тех температурах и объемах, при которых член в правой части уже не является очень большим числом, а становится сравнимым с единицей. Еще более близким к единице будет при этом кубический корень 1 Меньше, чем 6 X 1023 в 22 литрах.
70 Статистическая термодинамика из этой величины, г- г— / —h—V"- (8-22) Это выражение допускает очень простую интерпретацию, поскольку среднее значение энергии имеет порядок величины й ~ ifcT' а средний квадрат импульса — порядок величины р2 ~ ЗткТ. Квадратный корень последней величины является, несомненно, верхним пределом неопределенности импульса или, скорее, в известном смысле самой неопределенностью импульса частицы, выхваченной наугад1. Следовательно, из соотношения неопределенностей Гейзенберга нижний предел неопределенности Ах в координате частицы будет Ах> h 2жу/ЗткТ Таким образом, (8.22) является по порядку величины отношением сред- него расстояния между частицами y-J-к величине максимальной точности, с которой частица может быть локализована, тЬ^ <8"23> Когда эта величина перестает быть большой, т.е. когда она по порядку величины становится равной единице, мы можем, как мне кажется, сказать, что частицы полностью расплываются и что корпускулярный аспект теряет силу; мы не можем более говорить о гранулированной структуре материи. Это замечание может быть отнесено к области гораздо более широкой, чем та, о которой мы здесь говорили. Я берусь утверждать, что оно непосредственно подтверждается экспериментом. Везде, где при интерпретации опыта корпускулярный аспект выявляется бесспорным образом (например, в опытах с камерой Вильсона или при счете космических частиц), мы имеем дело с крайне разреженными частицами, 1 Независимо от того, верно последнее или нет, утверждение относительно верх- него предела неоспоримо, так как если бы неопределенность была большей, то р2 также было бы больше, а это означало бы, что температура выше, чем в действительности.
Глава 8. Оценка формул. Предельные случаи 71 обладающими большой скоростью. Дело в том, что присущий частице импульс всегда устанавливает верхний предел величины неопределенности импульса и тем самым устанавливает предел точности локализации, а также предел сгущенности тождественных частиц, если эта сгущенность не такова, чтобы вообще воспрепятствовать индивидуальному распознаванию частиц. Что же можно сказать о сгущенности частиц в жидкостях и твердых телах? Объем, приходящийся на одну частицу (jr), здесь, грубо говоря, в 1 000 раз меньше, чем в газе при нормальных условиях. Следовательно, если рассматривать кристалл при температуре примерно в 100 раз меньшей (т.е. между 2 и 3° К), то эти два обстоятельства уменьшат значение (8.8) примерно в миллион раз по сравнению с полученным ранее численным значением (8.9). Это уменьшение частично компенсируется за счет массы т в том случае, если последняя превышает 4тн [вспомним, что (8.9) было вычислено для гелия]. Все же ситуация в целом складывается не в пользу корпускулярного аспекта. Не опровергается ли в таком случае точка зрения, выдвинутая в предыдущих абзацах, тем, что корпускулярные модели строения кристаллических решеток отнюдь не перестают быть пригодными при очень низких температурах? — Скорее как раз наоборот. Мне кажется, что можно указать на две причины, по которым это противоречие не имеет места. Во-первых, как из теории, так и из эксперимента1 следует, что колебательная энергия частиц кристалла, становясь все менее и менее зависящей от температуры, все же не стремится к нулю при Т —>■ 0. Энергия эта приближается по порядку величины к кв (на одну частицу), где в (так называемая дебаевская температура) — параметр, которым пользуются для теоретического описания быстрого падения теплоемкости от значения, предписываемого формулой Дюлон- га и Пти, до значения, практически равного нулю. Этот параметр грубо указывает ту область температур, в которой происходит основное спадание кривой теплоемкости. в всегда значительно больше, чем те низкие температуры Т, которые мы рассматривали выше. Она варьирует от 88 (РЬ) примерно до 2 000 (С), причем существуют вполне объяснимые основания к тому, чтобы она была мала лишь в случае тяжелых атомов и особенно 1 Относящегося к распределению интенсивности в лауэграммах, снятых при очень низкой температуре; пятна, полученные в результате рассеяния под тупыми углами, остаются более слабыми, чем пятна, полученные при рассеянии под острыми углами (углы отсчитываются от направления падающего луча).
72 Статистическая термодинамика рыхлых решеток (например, К, для которого в = 99 при постоянной решетке, равной 4,5 А) и велика для легких атомов. [Это дает дополнительную компенсацию в нашем выражении (8.8), в котором Т должно быть теперь заменено на в и которое должно давать, конечно, лишь порядок величины.] Во-вторых, следует указать еще на одно обстоятельство. Несмотря на ценность моделей кристаллических решеток, термодинамика кристаллов обязана своими значительными успехами не корпускулярной, а волновой точке зрения. Эти успехи связаны с работами П. Дебая, который в своей упомянутой выше теории теплоемкостей твердых тел приписал определенные квантовые уровни не отдельным частицам, а собственным колебаниям решетки как целого. (В свое время это казалось ошеломляющим приемом!) При очень низких температурах энергия кристалла и его теплоемкость выражаются формулами, выводы из которых почти тождественно совпадают с выводами из формул теории излучения абсолютно черного тела. Я имею в виду известный закон Т3 или Т4. Если рассматривать ту весьма точную локализацию атомов внутри кристалла, которая достигается с помощью рентгеновских методов (речь идет об измерениях постоянной решетки и так называемых «параметров»), как локализацию индивидуальных атомов, то следует признать, что пределы точности далеко превосходят те пределы, которые ставятся соотношением неопределенностей. Однако мы не имеем права рассматривать эти данные как относящиеся к отдельным атомам. Эти весьма точные измерения межатомных расстояний становятся возможными и целиком определяются лишь тем фактом, что расстояния эти повторяются в кристалле миллионы и миллионы раз, совершенно подобно тому, как расстояния между соседними гребнями волн снова и снова воспроизводятся вдоль направления распространения волны. Я склонен, в самом деле, рассматривать все строение кристаллической решетки как нечто весьма родственное стоячей де-бройлевской волне. По-видимому, решетка и может трактоваться подобным образом; однако такая задача необыкновенно сложна вследствие очень сильного взаимодействия между этими волнами. (При обычном подходе учитывается взаимодействие в виде сил, действующих между частицами, строится кристаллическая решетка, исходя из корпускулярной точки зрения, а затем рассматриваются и квантуются звуковые волны, установившиеся в этой решетке и весьма слабо взаимодействующие друг с другом.)
Глава 8. Оценка формул. Предельные случаи 73 Некоторые соотношения, однако, могут быть намечены уже сейчас. Например, вторичные пучки, выявляемые на рентгенограммах, определяются квантами импульса, которые могут быть сообщены световой волне кристаллической решеткой благодаря периодической структуре последней, если рассматривать ее как стоячую волну. (Это не новая математическая теория дифракции рентгеновских лучей, а просто иная интерпретация, допускаемая существующей теорией.) Вырождение газа как таковое. Количественное изучение отклонений от классических газовых законов, имеющих место при не очень малых (, не представляет большого практического интереса, если не считать одного случая электронной теории металлов. Следует, однако, указать вкратце на математические методы решения этой задачи; они очень просты и легко применимы ко всем сколько-нибудь интересным случаям. Прежде всего имеется случай слабого вырождения — ( мало, но не очень мало; первых отклонений от классических законов следует ожидать при увеличении плотности и понижении температуры. Несмотря на то, что эти отклонения сопровождаются, как я уже отмечал, эффектами также и иного характера, представляется интересным выяснить, какая часть наблюдаемых отклонений может быть объяснена новыми законами идеального газа. Далее имеется случай сильного вырождения, который для случая Ферми полностью покрывает содержание электронной теории металлов (Зоммерфельд, Zs. Phys., 47, 1928). В случае Бозе он связан с явлением «бозе-эйнштейновской конденсации», представляющим, по крайней мере для теории, большой интерес, ибо мы сталкиваемся с совершенно неожиданным скачкообразным изменением статистической суммы, а следовательно, и самой материальной системы; это будет подробно рассмотрено ниже. Слабое вырождение. Рассматривая уравнения (8.1) и (8.4), содержащие законы в наиболее сжатой форме, оо 47r(2mfc)3/2 у /2 Г _ h3 n J 1 x2dx 2 U _ PV сеж Tl 2 3 / 0 оо Г **./ VVtij 1 т2 1 ±ех =Fl х2 dx 3 nkT nkT J lex~ =р 1
74 Статистическая термодинамика видим, что нам нужно знать оба интеграла в виде функций от £. Для не слишком больших С, (фактически для ( С 1) можно воспользоваться разложением 1 - Сб Х -Се"ж2(1±Се"ж2+С2е_2ж2±...) (8.24) Ie*2Tl 1т Се~' и затем проинтегрировать его почленно. Если обозначить его интегралы соответственно через 1^ и Ц, то £(<± §£(< 23/2 С2 25/2 С3 33/2 с3 + —— 35/2 С4 43/2 + -- С4 45/2 т •)• ...). .25) о .In / Г* Г° Г* \ /4 Чтобы иметь возможность судить о начале вырождения, следует подставить первый ряд в (8.1), преобразовать его, шаг за шагом, известным способом и получить разложение £ по степеням малого числа h3 •_rp—Z/2 4тг(2т&)3/2 V Это разложение следует подставить в (8.4), заменив второй член в последнем степенным рядом Vi = 1*w><+-> (8-26) полученным из (8.25) делением второго степенного ряда на первый. Детали этого вывода нас здесь не интересуют. С увеличением ( сходимость ухудшается, однако продолжает иметь место вплоть до С, = 1. (Кстати, для С = 1 ряды выражают с точностью до множителей рима- новы ^-функции с аргументами ^ и |. Эти функции могут быть взяты из таблиц1.) Так обстоит дело со слабым вырождением. Среднее вырождение. Этот случай до сих пор не приобрел практического интереса. Математически он характеризуется, естественно, 1См., например, Янке-Эмде. Таблицы функции. Харьков-Киев. 1934.
Глава 8. Оценка формул. Предельные случаи 75 плохой сходимостью обоих рядов, выведенных для случая слабого вырождения, и того ряда, который мы получим для случая сильного вырождения. Я рассматриваю случай среднего вырождения только для того, чтобы указать на небольшое упрощение, которым можно пользоваться при любых С ^ 1- Можно подумать, что нам следует произвести как в случае Бозе, так и в случае Ферми численную оценку четырех интегралов, а именно, интегралов с ж2 и ж4 в виде функции от С,. В действительности, однако, число этих интегралов может быть сведено к двум. Дело не в том, что интеграл с ж4 сводится к интегралу с ж2, а в том, что функции Бозе и Ферми могут быть сведены друг к другу, так как 1 1 2 откуда V2 -1 с 1 у +1 у +1 1 1 ж2 1 рж -1 1р2ж2_ С 2 1р2ж2_ С -1 -1 и, в результате итерации, 1 1 1е*2 + 1 1е*2-1 4е2ж2-1 4е4ж2-1 с с с2 с Отсюда легко получить соотношения между интегралами, если ( ^ 1. (При С > 1 интеграл Бозе теряет смысл; см. ниже.) Сильное вырождение. Здесь мы должны строго различать два случая, ибо крайняя степень вырождения в случае Бозе-Эйнштейна означает нечто совершенно иное, чем в случае Ферми-Дирака. Действительно, поскольку согласно (8.1) интеграл выражает число частиц [см. (8.6)], подынтегральное выражение не может быть отрицательным. Поэтому, беря это выражение с верхним знаком (Бозе-Эйнштейн), мы должны иметь £ ^ 1, и крайнее вырождение в случае Эйнштейна характеризуется, таким образом, значением £ = 1. Мы рассмотрим этот случай во вторую очередь. Если мы берем нижний знак (Ферми-Дирак), то С может превышать единицу. Крайнее вырождение в случае Ферми характеризуется условием ( —>■ сю. а) Сильное вырождение в случае Ферми -Дирака. (Повсюду берется нижний знак.) Первое приближение для очень больших ( может быть
76 Статистическая термодинамика получено без труда, так как характеристический множитель подынтегрального выражения, а именно дробь - - Х—, (8.24') "12 ' U* +1 являющаяся, как мы помним, средним числом заполнения уровня as 2 (при х2 = —^ = 1т)' паДает почти сразу от единицы до нуля при том значении ж, при котором дробь равна ^, т.е. при х = yioic (8.27) или вблизи этого значения. Наши два интеграла принимают, таким образом, значения: h = f(logC)3/2, /4 = |(logC)5/2, (8.28) . _ 1Ппо-Л3/2 Т. = 1Ппо-Л5/2 а (8.1) и (8.4) дают: i=4^2^^3/2i(logC)3/2; 2 " - ^ -2logC. .29) . 3 nkT nkT 5 Из первого выражения: Следовательно, из второго выражения (8.29): __2tf _1/3\2/3Л2/п\5/3 .оо-п Последнее уравнение содержит полное описание термодинамического поведения газа Ферми в состоянии крайнего вырождения. Наиболее замечательным при этом является то, что из формул исчезает температура. Это — неизбежное следствие теоремы Нернста. Газ ведет себя
Глава 8. Оценка формул. Предельные случаи 11 как «чисто механическая система», что и должно иметь место согласно теореме Нернста для любой системы в пределе при Т —>■ 0. Заметим, кстати, что уравнение состояния, а именно р\п) = const' в точности совпадает с получаемым в классической теории уравнением адиабаты для идеального одноатомного газа при любой температуре1. То, что плотность энергии оказывается независящей от температуры и, следовательно, теплоемкость обращается в нуль, является основным достоинством этой теории при объяснении поведения электронов в металле. В течение многих лет оставалась неразрешенной проблема, связанная со следующими обстоятельствами: 1) Высокая электро- и теплопроводность указывает на то, что плотность электронов по порядку величины равна одному свободному электрону на атом. 2) Тем не менее, теплоемкость металлов подчиняется при комнатных температурах закону Дюлонга и Пти без каких-либо признаков участия электронов (что должно было бы увеличить ее значение на 50%, если бы электроны вели себя подобно классическому идеальному газу). 3) Электроны, испускаемые раскаленными металлами в эффекте Ричардсона, имеют строго максвелловское распределение по скоростям, соответствующее данной температуре. Это, казалось бы, говорит в пользу того, что они образуют внутри металла классически идеальный газ; этого же предположения, как казалось, нельзя было избежать для количественного объяснения электро- и теплопроводности металлов, знаменитого отношения между ними и его температурного коэффициента (= ^3). Современная теория объясняет все это удовлетворительным образом. Доля, вносимая участием электронов в теплоемкости, сводится к нулю вследствие того, что U не зависит от Т. Тем не менее, частицы, даже при наиболее низких температурах, сохраняют значительные скорости, так как принцип Паули вынуждает их занимать п наинизших состояний, наивысшее из которых имеет энергию, значительно более 1Уравнение адиабаты, связывающее р aV, одинаково для всех температур (а также для газов Бозе-Эйнштейна и Ферми-Дирака). Это действительно вытекает 2 из dQ = dU + pdV = 0 при pV = -^U. Лишь в случае крайнего вырождения газа Ферми-Дирака это уравнение совпадает с уравнением состояния.
78 Статистическая термодинамика высокую, чем ^кТ. Объяснение электро- и теплопроводности и их отношения получается вполне удовлетворительным (так же, как и объяснение целого ряда эффектов, как, например, эффекта Холла, термоэлектричества и т.д.). Парадокс, связанный с эффектом Ричардсона, оказывается неизбежным следствием термодинамики: «электронный пар», испускаемый металлом, вследствие своей значительно меньшей плотности, должен обладать свойствами невырожденного газа при той же самой температуре, подобно тому, как, например, насыщенный пар над холодным кристаллом является классическим идеальным газом, хотя атомы внутри кристалла могут практически находиться уже в состоянии с нулевой энергией. Механическое объяснение того, почему электроны, вылетающие из металла в эффекте Ричардсона, обладают совершенно иным распределением по скоростям (они имеют скорости много меньшие, чем внутри металла), заключается в том, что при выходе они должны преодолевать потенциальный барьер в несколько вольт, совершенно так же, как атомы, испаряющиеся из твердого тела или жидкости. Этот потенциальный барьер играет по отношению к электронам ту же самую роль, что и стенки сосуда по отношению к обычному газу; он сдерживает частицы в замкнутом пространстве. Сильное вырождение электронного газа при комнатной температуре и даже при высоких температурах, необходимых для эффекта Ричардсона, является следствием совместного действия двух причин: 1) сравнительно высокой плотности электронов |^, примерно такой же, как и плотность атомов в твердом теле, и 2) их небольшой массы, составляющей примерно * массы ядра водорода. Согласно (8.30) это приводит к высоким значениям log С, требуемым для вырождения в случае Ферми. Макроскопические свойства металлов, обусловленные свойствами электронов — за исключением, как я полагаю, лишь случая диамагнетизма и, может быть, сверхпроводимости, которую мы пока еще не понимаем, — не связаны с теми электронами, которые находятся в области плотной упаковки, где они занимают подряд все уровни. Переход на соседний уровень предопределяется здесь принципом Паули; например, электрическое поле, приложенное к металлу «слева направо», заставит (отрицательные) электроны предпочесть те уровни, которые обладают импульсом, направленным «справа налево». Выбора нет, «автобус полон» — все места заняты. Таким образом, мы убеждаем-
Глава 8. Оценка формул. Предельные случаи 79 ся в громадной важности этой «переходной области», в которой числа заполнения п8 (8.24') изменяются при возрастании х{ - Ps \ 2mkTJ' как я указывал, очень резко, тем не менее, непрерывно от единицы до нуля. Эта область расположена по обе стороны от значения х, указанного в (8.27). Поэтому в рассматриваемом случае требуется лучшее приближение, чем то, которым мы пользовались до сих пор. Хотя я не собираюсь вдаваться в дальнейшие детали теории Зоммерфельда, мне хотелось бы разъяснить математическую сторону вопроса. Возьмем в качестве примера интеграл I^. Интеграл 1± и другие могущие нам встретиться подобные интегралы рассматриваются тем же способом. Основная идея состоит в следующем. В подынтегральном выражении интеграла 1 [ х2 J Ip*2 dx 1 множитель 1 -(=na) О y+i x=Vlog^ Рис. 3 ведет себя так, как показано на рис. 3. До сих пор мы аппроксимировали это выражение ломаной линией, ординаты которой равнялись либо 1, либо 0. Мы продолжаем рассматривать это в качестве первого приближения, однако вводим поправку в окрестности критического значения абсциссы д/log С- Несколько более удобно пользоваться переменной и = х2, (8.32) где «о = log£ является критической абсциссой (и есть, разумеется, энергия). Тогда 2/2 J e«-«o + 1 J ^'Чи «о /(; 1 + 1 у^Чи J еи-и0 + 1 J eu-u0 Чи 2 2/3 зи° •
80 Статистическая термодинамика Последний член является первым приближением интегралом ломаной линии; остальные два члена выражают две «треугольные» площадки, которые следует, соответственно, прибавить и вычесть, чтобы получить истинное значение. Введем в оба интеграла положительную переменную t; в первый интеграл — посредством подстановки и — и0 = uot, во второй — посредством подстановки щ—и = u^t. Тогда, меняя порядок написания членов, получим: 2I2 = lur + u^(f'dt^T~t f'dtVY^~e 1 + t _ Г dtVY^l\ + 1 J eUot + 1 ) ' о о Выбирая верхний предел интегрирования в первом интеграле также равным t = 1, допускаем лишь очень малую ошибку (имеющую относительный порядок величины е-"0 = -). Теперь мы можем объединить оба интеграла. Пользуясь разложением VTTt - y/l-t = t+h3 + ^-rt5 ' 128 получаем 2/2 = |«- 2„з/2 , „з/2 / f __Ш eu0t + г 1 f t3 2 J еи»1 0 dt : + i + 1 128 J; 0 t5dt oU0t _i_ ^ .33) Распространяя верхние пределы интегрирования всех этих интегралов до бесконечности, совершаем столь же малые ошибки, как и только что сделанная. После этого везде вводим переменную интегрирования щЬ, но обозначаем ее по-прежнему через t. Тогда о г 2 з/2 , ОО ОО
Глава 8. Оценка формул. Предельные случаи 81 Поскольку интегралы являются теперь отвлеченными числами, мы получили разложение по убывающим степеням параметра и2, = (logС)2? который следует считать достаточно большим (эти же обстоятельства одновременно оправдывают допущенное выше пренебрежение величиной j). Наши интегралы суть простые численные кратные римано- вой (-функции. Например, и, в общем случае, / J 0 оо / 0 оо Г tdt е'-Н t3dt е'-Н t5dt km IT 12' 7,31 С(4) 31 32 5! С(6) 111 120' 31тг6 252 ОО (8.34) р — любое натуральное число, не обязательно простое. Для получения выражений, содержащих ж, пользуемся формулой С(2р) = 22*" -1 7Г 2р (2р!) -В р> 3.35) где Вр — числа Бернулли. Ii и другие подобные интегралы получаются совершенно аналогичным образом. Мы не будем на этом останавливаться. б) Сильное вырождение в случае Бозе - Эйнштейна. Мы уже указали, что в том случае, когда в выражениях (8.1) и (8.4) выбирается верхний знак, наибольшее допустимое значение Q составляет £ = 1, поскольку подынтегральное выражение, по самому своему смыслу, не может быть отрицательным. Тогда в этом предельном случае из (8.1) получаем: -2 dx 1 47r(2mfc)3/2 у /2 Г ^2 h3 n J е*2 1 .1а)
82 Статистическая термодинамика Интеграл является отвлеченным числом и, кроме того [см. (8.25)], оо f x2dx V^ ( 1,1,1, \ V^,fS\ Л9К19 J ^n = ^l1 + ^ + ^ + i^ + ---J = ^42j = ^2'612' о так что 1= hz ^612- (8Лб) Удивительно здесь то, что это — наибольшее значение, которое интеграл принимает при С, ^ 1. Вспомним, однако, уравнение, выведенное для определения (изии других данных. Оно являлось уравнением для минимума в методе наиболее крутого спуска. Этот минимум, несомненно, имелся во всех случаях. Однако мы сталкиваемся с тем фактом, что если при данной температуре в данном объеме число частиц превышает число п, определяемое из (8.16), то С, определено быть не может. Не остается ничего другого, как вернуться к исходной форме уравнения [см. (7.14)]: Отсюда сразу видно, что верхний предел суммы отсутствует. Независимо от того, будет ли первый, наинизший уровень as в точности равен нулю (как мы принимаем) или нет, первый член суммы может быть сделан сколь угодно большим без того, чтобы какой-либо член становился отрицательным при приближении ( снизу к значению ем™8 (при этом безразлично, будет последнее в точности равно или немного больше единицы). Чтобы не запутывать вопрос, положим ао = 0 и ем™° = 1, хотя это не имеет особенного смысла и не совсем правильно с точки зрения квантовой механики. Полагая £ очень близким к 1, а именно, считая, что С = 1 - тр при тГ1/3 < /3 < 1, (8.36) мы можем расположить на наинизшем уровне любую значительную долю, например fin общего числа частиц. (В случае, если первые 2, 5 или 20 уровней в точности одинаковы — вырождены, следует ввести
Глава 8. Оценка формул. Предельные случаи 83 небольшое видоизменение; оно достаточно просто, и мы предоставляем произвести его самому читателю.) Что же можно сказать о следующем члене суммы? Для наинизших уровней произведение импульса1 р и размеров сосуда У1/3 равно, по порядку величины, £-: таков же порядок величины и наинизших ступеней энергии, т.е. разностей между соседними а в наинизшей области. Таким образом, для члена, следующего за а0: получаем: откуда энергия ца a h _у-2/з кТ 8тт2ткТ Эта величина все еще очень мала, однако имеет порядок не и-1, а лишь и-2/3, как можно видеть из выражения (8.1), остающегося справедливым по порядку величины. Тогда из (7.14) и (8.36) мы можем уже уверенно положить в этом члене ( = 1, что приведет к числу заполнения, имеющему порядок и2/3. Будучи большим, это число составляет все же лишь бесконечно малую часть п (ср. с первым числом заполнения /Зи, которое может составлять значительную долю и). Следующие числа заполнения будут еще меньшими, так как они убывают монотонно. Пропуская следующие 50 или 1 000 чисел заполнения, мы вскоре достигаем области, где относительное изменение при переходе от уровня к уровню столь мало, что аппроксимация интегралом делается вполне оправданной (дей- 4-nV 1 1 ствительно, наше «подсчитывающее» выражение ^4rV dp не является Вт справедливым в наинизшей области, в которой, впрочем, нас интересует лишь самый низкий уровень или уровни). В интеграле же мы, конечно, можем спокойно считать Q = 1. Одним словом, выражение (8.16) остается справедливым, независимо от того, равно ли число действительно имеющихся частиц значению и, получаемому из (8.16), или же оно превышает эту величину. 1Ие следует смешивать встречающуюся в следующих строках величину р с давлением.
84 Статистическая термодинамика функцию распределения плотности В «живых», если можно так выразиться, останутся только п частиц, они будут распределены вдоль оси энергии по закону, близкому к закону излучения абсолютно черного тела, в то время как остальная часть, так сказать, «сконденсируется» на наинизшем состоянии (рис. 4). Если температура поддерживается постоянной, то при сжатии или расширении тело будет вести себя подобно насыщенному пару, соприкасающемуся со своей конденсированной фазой. Термодинамическое состояние (например, давление, плотность энергии) не будет меняться до тех пор, пока все вещество не сконденсируется или не испарится (это означает не то, что наинизшее состояние вовсе перестает быть занятым, а то, что «горб» исчезает). «Теплота испарения», разумеется, в точности совпадает с энергией частиц в «живом» состоянии; мы получаем ее из (8.4), полагая С, = 1: Рис. 4 2 U 3 пкТ f х4 dx о ' ех2-1 2 о 3 °° [ х2 dx Интеграл в знаменателе был уже рассмотрен. Интеграл, стоящий в числителе, равен оо / **./ VVtij зЛ/,, 1 2 4 1+ 1 1 25/2 д5/2 ^5/2 О 2 4 42/ 3 А 2 4 1,341. Следовательно, 2 U 1,341 0,5134. 2>пкТ 2,612 Мы видим, что энергия в насыщенном бозе-эйнштейновском состоянии лишь немногим превосходит половину классического значения энергии (то же относится и к давлению). Если бы при изотермическом сжатии мы могли достигнуть этого состояния и пройти далее него (что, конечно, неосуществимо вследствие того, что идеальные законы сильно
Глава 8. Оценка формул. Предельные случаи 85 нарушаются влиянием объема частиц и сил взаимодействия), то частицы теряли бы приблизительно половину своей энергии постепенно, вследствие изменения функции распределения, а вторую половину — скачком, вследствие бозе-эйнштейновской конденсации. Область этого сильного вырождения отнюдь не лежит за границами возможностей эксперимента. Например, для гелия требуется плотность меньшая, чем та, которую имеет жидкий гелий при температуре Т = = 1°К [расчет произвести нетрудно, если воспользоваться результатом, даваемым (8.9), и сравнить (8.8) с нашим теперешним (8.1)]. Ф.Лондон указал, что эти любопытные особенности могут проявляться в том стран- С,, ном переходе, который происходит в жидком гелии при некоторой низкой температуре, составляющей несколько градусов Кельвина, в так называемой Л-точке, где кривая теплоемкости обнаруживает при охлаждении внезапный подъем и падение в виде буквы Л (рис. 5). Это как раз то, что мы могли бы ожи- Рис- 5 дать в случае некоего завуалированного аллеломорфного перехода со скрытой теплотой перехода, проявляющейся не при какой-то определенной температуре, а размазанной в небольшом интервале. То, что гелий при атмосферном давлении остается жидким даже при Г = 0, показывает, что это состояние, будучи жидким, должно тем не менее обладать особенно высокой степенью упорядоченности, раз его энтропия равна нулю.
Глава 9 Излучение Как я указал ранее (в начале седьмой главы), наши рассуждения охватывают частный случай электромагнитного излучения, которое характеризуется следующими чертами: 1) масса покоя исчезает, что делает энергию as линейной функцией импульса ps; до сих пор мы считали эту функцию квадратичной; 2) С = 1 или, другими словами, число частиц или квантов является неопределенным. Эти два свойства не взаимонезависимы. Действительно, в разделе, посвященном аннигиляции материи, мы показали, что кванты, имеющие массу покоя, практически исчезают, если число их остается неопределенным. Между излучением и случаем бозе-эйнштейновской конденсации существует, разумеется, формальная аналогия, так как оба случая характеризуются условием С = 1- Для получения обычной теории достаточно рассмотреть нашу общую формулу для средних чисел заполнения в случае Бозе, а именно: 1 ipM«e _ 1 С положив в ней ( = 1 и as = hvs (и, разумеется, ц = т4т)- Таким rv-L образом, ns = —± (9.1) ект - 1 дает среднее число квантов hvs, в s-м состоянии (или число s-x осцилляторов полого пространства). Принимая во внимание, что имеется (см. гл. 7)
Глава 9. Излучение 87 уровней (или осцилляторов) с р8, лежащим между р и р + dp, получаем для плотности энергии (т.е. для V = 1) монохроматического излучения в интервале между р и р + dp выражение ^ —^—d», (9.3) С hv еит _ 1 т. е. знаменитую формулу Планка. Есть, однако, одна сторона дела, которую следует обсудить подробнее. Я умышленно указал в предыдущих фразах на тесную аналогию между состоянием, отмечаемым индексом s и способным «вместить» один, два, три, ... квантов hps, и квантовомеханическим осциллятором. Если принять эту точку зрения (которая, кстати сказать, является исторически наиболее ранней), то количества энергии nshvs, или О, hvs, 2hps, ihvs, ... (9.4) приобретают смысл энергетических уровней этого осциллятора. Но уровни осциллятора являются в квантовой механике не целыми, а «полунечетными» кратными некоторой единицы классической частоты, умноженной на h. Этот результат теории был подтвержден опытом во всех подвергавшихся проверке случаях. Теоретику трудно удержаться от вопроса: будет ли какая-нибудь разница, если заменить схему уровней (9.4) схемой \hva, \hps, \hva, ...? (9.5) Это новое предположение не покрывается нашей формулой (7.1): е - (в которой суммирование производится по всем допустимым комбинациям щ, иг, ••• , ns, ...), так как во всех рассуждениях, основанных на этой формуле, мы всегда должны были считать ns целыми числами. Однако нетрудно оценить изменения, вызываемые новым предположением. Дело в том, что в общем методе «статистической суммы» (т. е. суммирование по состояниям) абсолютное значение нулевого уровня энергии не играет роли. Если прибавить ко всем уровням системы постоянную С, то эта постоянная выпадет из всех результатов, если, конечно, не считать того, что средняя энергия U будет больше
88 Статистическая термодинамика на величину этой постоянной. Но выражение (9.5) отличается от (9.4) лишь тем, что все уровни системы увеличены на постоянную £^ = f£".- (9-6) 8 8 Правда, эта постоянная бесконечна. Мы можем сказать только следующее: если изменить схему уровней согласно (9.5) вплоть до уровня с индексом s = г (где г — какое-нибудь большое число), считая, разумеется, при этом нулевую энергию, равную г IS".. 8=1 чем-то неизменно присутствующим и не могущим проявиться ни в каком опыте по испусканию и поглощению, то ничего не изменится, каким бы большим ни было выбрано число г, и, быть может, можно пойти на то, чтобы г —>■ сю. Однако нет никакой необходимости ломать себе голову над тем, допустимо ли вводить эту «бесконечную нулевую энергию». Совершенно очевидно, что вся эта процедура не может восприниматься серьезно и введена лишь для того, чтобы удовлетворить «квантового теоретика», которого полунечетные квантовые числа устраивают больше, чем целые. С совершенно новой точкой зрения мы встречаемся в недавней работе Пенга и Борна, ставящей себе целью преодоление значительно более серьезных трудностей, возникающих в теории излучения (и вообще в квантовой теории поля), когда мы переходим от рассмотрения состояния термодинамического равновесия к квантово-механическому исследованию индивидуальных процессов взаимодействия. Сможет ли теория Борна и Пенга действительно преодолеть эти трудности — в настоящий момент еще нельзя сказать. Здесь я хочу лишь кратко показать, как эти авторы подходят к проблеме равновесия. Борн и Пенг приписывают в своей теории любому из осцилляторов полого пространства (характеризуемому индексом s) две фундаментально различные «ситуации» (я говорю «ситуации» потому, что термин «состояние» уже использован). Осциллятор может быть не возбужден вовсе — когда его энергия равна нулю, либо он может быть возбужден, и тогда его энергия равна одной из энергий (9.5). Во втором случае мы можем сказать, что он «вмещает» О, 1, 2, 3, ... квантов или «атомов излучения» (мы будем для простоты считать числами заполнения осциллятора числа ^, ^, |, ...). Так же, как и в обычной теории, число
Глава 9. Излучение 89 квантов остается неопределенным. Однако число осцилляторов, которые вообще возбуждены, должно быть равно заданному числу, которое мы обозначим через N. Теория должна быть построена заново; впрочем, она очень проста. Начнем с (7.1), где, как и в (7.4), снова положим -fia3 Zs м = т^; (7-4) fcr' тогда 2 = $>Г*2П2 ■•■*."■•■• (9-7) (п.) Новые предположения сводятся к тому, что каждому ns приписываются значения п8 = 0, \, §, §,..., (9.8) впрочем, с тем добавочным условием, что N, и только N, из всех п8 отличны от нуля. Чтобы ввести это условие, пользуясь, как и в предыдущих случаях, комплексным интегрированием, прежде всего умножим каждую степень z"r (с пг ф 0) на величину С, и затем образуем сумму, не обращая внимания на добавочное условие. В результате получим: ЛС) = П(1 + С4/2 + С^/2 + ...) = П(1 + ^1/2Г^;) = Li с \ ^/ " - (9-9) zs ~ zs' I e I 2sh m. Наше Z является, очевидно, коэффициентом при (N в /(C)- Следовательно, в результате процесса, который мы уже дважды детально излагали, получим: logZ = -(7V + l)logC + log/(C), (9.10) где С является действительным положительным корнем уравнения 0 = -£±1 + Ш (9Л1) (в выражении (9.10) опущен некоторый поправочный член, читатель, если захочет, может сам легко убедиться в допустимости этого). Из
90 Статистическая термодинамика последнего выражения (9.9) и из (9.11), где мы опускаем несущественную единицу в N + 1, без труда получаем N = Y -J— . (9.12) cshb 1 Легко догадаться, что означает выражение под знаком суммы: поскольку N есть число возбужденных осцилляторов, это выражение является средним «числом возбуждения» (противопоставляемым среднему числу заполнения ns). Вычислим оба эти числа, начиная с последнего, поскольку оно нам более знакомо. Рассмотрим статистическую сумму (9.7). Отдельные ее члены являются, как мы знаем, относительными вероятностями различных возможных состояний целого (каждое состояние характеризуется совокупностью чисел ns). Величина ns для данного s находится путем умножения каждого члена на соответствующее число ns суммирования и деления на само Z. Это может быть сделано следующим образом1: _ _ dlogZ _ \d\ogZ dzs Iх das (9.13) Воспользуемся теперь выражением (9.10) для logZ. Согласно (9.11) неявное (через посредство () дифференцирование не дает ничего, и из (9.9) имеем: С iog/(o = $>g/i + —^ттУ (9Л4) Следовательно, 1 dlogZ _ 1 С i-ch^" V2 ^ е»а> - 1) т 2sh 1 cth fia. _ 1 (^)+12 2 |sh(^ + l) С (9.15) 1Это выражение известно из (7.2), и мы можем позаимствовать его оттуда.
Глава 9. Излучение 91 Полученное выражение имеет вполне прозрачный смысл, однако мы отложим его обсуждение. Среднее число возбуждения s-ro осциллятора (обозначим это число через ё8) получается из (9.7) суммированием по всем членам, у которых ns отлично от нуля, и делением на само Z. Так как рассматриваемые члены исчезают в случае zs = О, а другие остаются неизменными, то мы получаем: _ Z-Z(zs = 0) Z(zs = 0) е* = z = 1 z~- Отсюда log(l - ё.) = log Z(za = 0) - log Z. Так как zs = 0 означает, что cts = ею, то из (9.10) и (9.9) получаем log(l - ё.) = - log Л + £-—\ (9.16) или 2sh т Н") (9.17) Действительно, это выражение и есть выражение, стоящее под знаком суммы в (9.12); оно же является первым множителем в (9.15). Обсуждение этих результатов не представляет трудности. Числа возбуждения образуют нечто, весьма похожее на распределение Ферми, с той лишь малосущественной разницей, что вместо ем™а стоит 2 sli ——-. Если мы хотим, чтобы (9.15) представляло виртуально формулу Планка, то ё8 должно быть сильно вырожденным, т.е. С должно быть очень большим. Согласно (9.12) это имеет место при очень больших N. Тогда ё„ будет очень близко к единице, вплоть до некоторого s (и N), где оно падает до нуля. Выражение (9.15), которое мы можем писать в виде '(1+еТ^Ьг)' (9Л8) не будет при этом существенно отличаться от распределения Планка при условии, что N достаточно велико, чтобы виртуально охватить
92 Статистическая термодинамика все распределение Планка. (Прекращая процесс около s яз N, мы лишь прекращаем вносить в нулевую энергию доли -^hvs, вследствие чего нулевая энергия остается конечной.) На этом мы и закончим, сделав лишь одно дополнительное замечание. Нулевая энергия остается конечной не в силу условия для N, а в силу допущения нулевого уровня для каждого осциллятора. Условие для N необходимо для ограничения общего числа возбужденных уровней снизу, а не сверху. Действительно, ничто не изменится, если заменить это условие неравенством: число возбужденных уровней должно быть Js TV (условие ^ N, напротив, не годится). Чтобы убедиться в этом, вспомним, что коэффициент £N в f(Q был изолирован посредством образования вычета С1"'1 ПО, (9-19) что это приводит к (9.10) и что, в результате, £ должно быть очень большим. Если бы мы теперь вместо этого воспользовались условием неравенства (^ N), то нам следовало бы собрать коэффициенты при всех CN 1 Для которых N' Js N. Однако, чтобы избежать второго бесконечного процесса, соберем вместо этого те коэффициенты, для которых N' < N, и вычтем их из /(1) (являющейся суммой всех коэффициентов). Таким образом мы составляем 1 _ — N 1 — С~ ^ (С-1 + С-2 + • • • + CN)f(C) = C'Y^-nO = -jz^-ПО и для Z в нашем случае получаем: Следует указать, что подынтегральное выражение не имеет сингулярности при С = 1 (вообще имеется лишь одна сингулярность в начале координат); следовательно, мы можем выбрать для интегрирования окружность с |С| > 1 и притом сколь угодно большую. После этого мы разбиваем интеграл на сумму двух интегралов соответственно двум членам в числителе. Первый, согласно теореме Коши, сокращается с /(1) и
Глава 9. Излучение 93 То, что теперь при £ = 1 имеется сингулярность, несущественно, так как уравнение уже получено; нам остается только оценить его. Мы делаем это, пользуясь методом наиболее крутого спуска. Тогда, очевидно, для очень большого N: 1) при С > 1 будет иметься седлообразная точка при условии, од- нако, что если бы множители равнялись не -J—-, а С^-1? т0 она находилась бы при С, значительно большем единицы; 2) при этом результат будет практически тем же, что и ранее (изменение не может быть большим, чем в случае изменения N на единицу)- Если бы условие для N было опущено вовсе, то мы получили бы, как и в предыдущих случаях, £ = 1. Это недопустимо, так как легко видеть, что результат сильно отличался бы от формулы Планка.
КАНОНИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ КВАНТОВОМЕХАНИЧЕСКИХ АМПЛИТУД1 Определение статистической энтропии термодинамической системы всегда основывается на подсчете числа перестановок при тех или иных определенных ограничениях. На физическом языке это означает подсчет числа различных микросостояний, которые неразличимы для макроскопического наблюдателя — одинаковы с точки зрения макроскопических свойств, единственно доступных для такого наблюдателя. Среди таких свойств главную роль обычно играет полная энергия системы. Для подсчета упомянутых состояний обычно применяемый метод обосновывается предположением о том, что каждая система — будь она большая и мы реально экспериментируем с ней, или она — одна из огромного множества микросистем, на которые мы подразделяем большую систему, — всегда находится в состоянии сколь угодно точно определенной энергии, т.е. находится на одном из своих «квантовых энергетических уровней», если данная система подчиняется законам квантовой механики. Нас интересует рассмотрение именно этого случая. Предположение о вполне определенных энергетических уровнях нельзя, однако, примирить с самими основами квантовой механики. Такое предположение все же принимают, ибо оно привычно, весьма удобно и дает в сущности тот же результат, что и последовательная точка зрения на энергию как на величину, которая почти всегда является не вполне определенной, испытывает некоторый разброс, относительно малый в случае большой системы, но зачастую большой для малых систем. Здесь будет показано, что для одиночной системы в условиях тепловой бани разброс энергии очень близок к статистической флуктуации 1 Впервые опубликовано как приложение ко 2-му изд. книги «Статистическая термодинамика» (Кембридж, 1952) (Е. Schrodinger. Statistical Thermodynamics. Cambridge University Press, 1957, p. 89-95). Перевод В. А. Белоконя.
Каноническое распределение квантовомеханических амплитуд 95 во времени, вычисляемой из упрощенных не слишком обоснованных соображений. В связи с этим мне хотелось бы изложить обобщенное доказательство того, что последовательная точка зрения приводит к тому же термодинамическому результату, что и куцый, но удобный метод «развешивания» одиночных микросистем по своим собственным точно заданным энергетическим уровням. Такое доказательство очень важно. Ибо можно придерживаться любого мнения о том догмате всякого ортодоксального квантового теоретика, что мы реально и физически «вешаем» объект на один из этих энергетических уровней, когда измеряем энергию объекта. Но догмат этот едва ли оправдывает даже мысленную процедуру такого рода для бесчисленных микросистем, энергию которых мы не только не измеряем, но даже и не думаем о возможности подобного измерения. В буквальном смысле подобный догматический подход означал бы, что физический процесс состоит из цепи «припадков и судорог» — последовательных передач порции энергии между микросистемами, даже без каких-либо помех со стороны наблюдающего «субъекта». Подобная точка зрения, если ее рассмотреть всерьез, может сойти разве что за метафору, иногда удобную. Состояние объекта мы будем ассоциировать с волновой функцией. Тем самым мы приписываем объекту «чистое состояние» — в противоположность «смешанному состоянию», математическим эквивалентом которого является матрица плотности. Слитком строгие теоретики могут оспаривать такое использование волновой функции, не определяемой экспериментально. Но тогда они должны были бы перестать совершенно пользоваться волновыми функциями, поскольку ни одна волновая функция не определяется экспериментально. Здесь я не вижу никаких возражений против использования волновой функции в указанном смысле и считаю такой подход достаточно общим для выяснения нашего главного пункта — того, что числа перестановок и статистическая энтропия, вычисляемая по этим числам, — все эти величины следуют непосредственно из самой схемы собственных значений энергии. Тогда становится ясным, что привычная, но незаконная процедура изучения возможных распределений ансамбля по дозволенным уровням (и аналогичные методики) просто не нужна. Для этого мы должны начать все сначала. Отождествление статистических концепций нашей модели с термодинамическими концепциями для физического объекта не может обойтись без некоторых фундаментальных предположений.
96 Каноническое распределение квантовомеханических амплитуд Квантовомеханические энергетические уровни большой (по лабораторной шкале) системы сильно вырождены. Пусть мультиплетность собственного значения Ег энергии составляет тг. Предположим, что энтропия большой системы с энергией Ег равна S = klnmr, (1) где к — постоянная Больцмана. Такое определение находится, разумеется, в полном соответствии с тем, чем мы обычно пользуемся, поскольку mr это, очевидно, «число различных способов, которыми энергия Ег может быть размещена в системе». Однако в данном изложении мы должны называть именно это утверждение основным, фундаментальным предположением №1. Предположение №2 будет более рискованным: оно принимает на себя всю ответственность — в данном контексте — за извечную загадку «молекулярного беспорядка». Речь идет о том, что мы предполагаем следующее: в большой системе при определенных обстоятельствах (при малых неконтролируемых непрекращающихся возмущениях — см. ниже) квадраты квантовомеханических амплитуд или «интенсивности возбуждения» в среднем по времени одинаковы для каждой из mr собственных функций, принадлежащих одному и тому же собственному значению Ег. Достаточно, чтобы это предположение имело силу только в весьма широком понимании, а именно: что за длительную историю системы не обнаружится никакого предпочтения для какой-либо собственной функции из этого, как правило бесконечного, множества вырожденных функций. Более того, квантовомеханические уравнения движения таковы, что справедливость предположения №2 не нарушается с течением времени, т.е. «условие хао- тизованности» в квантовой механике является инвариантным. В частном случае задачи об электронных уровнях в электрическом поле это условие приводит к корректным результатам при вычислении интен- сивностей спектральных компонент при штарк-эффекте, когда мультиплетность уровней мала и условия возмущения представляются более контролируемыми, чем при термодинамическом рассмотрении. Теперь, кроме системы с собственными значениями энергии Ег с мультиплетностью mr, нам предстоит рассмотреть вторую систему — с собственными значениями энергии Fs с мультиплетностью ps. Мы складываем обе системы, но сперва только мысленно, рассматривая их как одну «комбинированную» систему.
Каноническое распределение квантовомеханических амплитуд 97 Общее для двух составляющих собственное значение энергии Er + Fs (2) обладает по меньшей мере мультиплетностью mrps, поскольку любая из тг собственных функций энергии Ег (назовем ее пока «/>), если ее умножить на любую из ps собственных функций энергии Es (скажем, Ф), даст собственную функцию собственного значения энергии Ег + Es комбинированной системы. Более того, при любом состоянии комбинированной системы интенсивность возмущения, т. е. квадрат абсолютной величины любой амплитуды вида Ф-ф, складывается с квадратом амплитуды собственного значения ЕТ первой системы и, разумеется, с квадратом амплитуды значения Fs второй системы. Далее мы продолжим следующим образом: 1) разрешаем любой контакт между двумя системами при том лишь ограничении, что описание состояния этих систем может остаться таким же, как и до контакта, т. е. системы описываются так же, как если бы контакта не было. Такое приближение допустимо и нередко в квантовой механике используется; 2) пусть комбинированная система пребывает в своем энергетическом состоянии Е = ЕГ + Е,; (3) 3) вторая система считается столь обширной (тепловой баней!), что для любого значения Ет найдется энергетическое состояние «бани» Fs, удовлетворяющее (3) при данном фиксированном значении полной энергии двух систем Е, мультиплетность которой составляет, таким образом, 53 mrP» (4) г — сумму по всем г, где s удовлетворяет соотношению (3). Строго говоря, значение Ет следует ограничить сверху1, но в предельном случае очень большой тепловой бани это ограничение становится ненужным. Для комбинированной системы из предположения № 2 следует, что квадраты ее амплитуд собственных волновых функций, характеризующихся собственными значениями энергии первой системы Е\, 1Для выполнения условия Ег -С Е, см. ниже. — Прим. перев.
98 Каноническое распределение квантовомеханических амплитуд i?2, • • • , Er,..., относятся друг к другу, соответственно, как mips>, m2ps", ... , mTps,... , (5) где обозначения, надеюсь, недвусмысленны. Следовательно, эти произведения с таким же успехом выражают отдельно для первой системы относительные величины квадратов ее амплитуд с различными Ег; более того, в согласии с нашим предположением № 1 имеем k\nps = S(Fs)=S(E-Er), (6) где S — энтропия тепловой бани как функция энергии ее. Поскольку энергию рассматриваемой системы Ег можно считать малой по сравнению с энергией комбинированной системы Е, то достаточно ограничиться таким приближением: к Ыр8 = S(E) - Щ^ЕГ = S(E) - Ег/Т, (7) где Т — температура. Следовательно, mrPs = mT{ex-p(-Er/kT)} ■ {exp(S\E)/к)}. (8) Множитель в первых фигурных скобках зависит от индекса г и поэтому может быть опущен, поскольку мы интересуемся только отношениями величин. Абсолютные величины — это вопрос нормировки, а сумма всех квадратов абсолютных величин амплитуд отдельно для первой системы обычно при этом нормируется на единицу. Таким образом, в тепловой бане, задающей температуру для нашей рассматриваемой системы (с энергией Ег, которая может быть и большой, и малой), мы получили точно такое же каноническое распределение квадратов амплитуд, как и при обычной трактовке вероятностей пребывания системы на том или ином энергетическом уровне. И в самом деле, тот, кто остается верен ортодоксальным догмам квантовой механики, может найти лишь незначительную разницу между этими двумя утверждениями, поскольку для него квадраты амплитуды имеют точный смысл нахождения данной системы на данном интересующем нас (энергетическом) уровне, если он измеряет энергию системы;
Каноническое распределение квантовомеханических амплитуд 99 если же ортодокс измерением энергии не занимается, то он вам ответит, что вопрос этот просто его не касается. Я не могу согласиться с таким отношением к обсуждаемой проблеме. Ибо при теоретическом анализе конкретного эксперимента мы должны, как правило, рассматривать довольно много физических данных, которые не подлежали измерению во время проводимого и анализируемого эксперимента. Чтобы проиллюстрировать уменьшение числа основных предположений, достигаемое при нашем методе рассуждений, предположим, что системой (с ЕТ) является электромагнитная радиация в полости, образованной толстыми стенками, обеспечивающими однородную температуру. В таком случае планковская формула черного излучения может быть выведена просто методом приписывания каждому «излучательно- му осциллятору» (т. е. классической собственной частоте полости) хорошо известных равноотстоящих энергетических уровней квантового осциллятора и рассмотрения уровней всего «излучательного тела» как аддитивно составленных из всевозможных комбинаций осцилляторных уровней. Я бы сказал так: просто эта структура из уровней является необходимой и имеет непосредственное отношение к рассматриваемой задаче. Нет никакой необходимости в более категорическом предположении, которое обычно делается, а именно, что каждый индивидуальный излучающий осциллятор всегда вмещает в себя целое число квантов hi/, или, как иногда говорят, что в любом состоянии, отмечаемом у данного индивидуального излучающего осциллятора, всегда имеется целое число фотонов данного специфического сорта. Концепция фотонов как «порций лучистой энергии», понимаемая вне рамок фундаментальной идеи о структуре спектра собственных значений, становится необязательной, почти делом вкуса, во всяком случае для задачи построения статистической термодинамики. В нашем выводе канонического распределения (8) имеется некоторая непоследовательность: комбинированная система «тепловая баня + рассматриваемая система» предполагалась с определенной энергией Е. Наш вывод в этом отношении следовал старому образчику — начинать с «микроканонического распределения» для большой системы и получать каноническое распределение для малой ее подсистемы, свободно контактирующей (обменом энергии) с остальной частью большой системы. Я не думаю, что эта традиционная непоследовательность
100 Каноническое распределение квантовомеханических амплитуд очень серьезна. Вполне очевидно, что почти любое умеренно острое (например, то же каноническое) распределение комбинированной системы приводит к тому же результату. Вся термодинамика данной системы может быть выведена из канонического распределения (8) квантовомеханических амплитуд. Для включения в теорию «внешней работы» следует допустить, что уровни Ег зависят от наблюдаемых параметров (таких, как объем; с макроскопической точки зрения эти параметры должны удовлетворять требованию, что система не совершает механической работы, если эти параметры остаются постоянными). Теперь мне хотелось бы показать, что наше основное предположение (1) для больших систем может быть апостериори если не оправдано, то, по меньшей мере, согласовано с тем, что следует из (8). Для этого запишем среднее значение энергии системы m _ E-Ermrexp(-.E,./fcT) _ 2dlnZ 1 Гоч { )r~ J2mreM-Er/kT) dT ' {У) где Z = Y^mr ещ>(-Ег/кТ) (10) называется «статистической суммой». Таким образом, (E)rdT = kT2dlnZ ■(E) а в итоге d(E)r = Td(^ + fclnZ). (11) Поэтому энтропию рассматриваемого объекта логично приравнять следующему выражению: S={-^ + k\nZ = k^(T\nZ). (12) Внешние параметры предполагаются неизменными. — Прим. перев.
Каноническое распределение квантовомеханических амплитуд 101 Если система достаточно велика, то статистическую сумму можно заменить ее максимальным членом, т.е. среднюю энергию — ее наиболее вероятным значением Ег. Тогда из (10) и (12) получаем S = fclnmr, (13) где индекс г относится к упомянутому максимуму. Это совпадает с (1). Можно рассуждать и по-иному. Максимальный член статистической суммы (10) при фиксированной температуре может быть определен приравниванием нулю производной от общего члена по г, т. е. из уравнения dhimr — T7^dEr = 0 kl или dEr =Td(klnmr). (14) С точки зрения термодинамики этот результат вполне согласуется с (13), и это согласие имеет глубокий смысл. Ибо соотношение (14) между двумя приращениями в окрестности главного члена суммы сохраняет силу для любой заданной температуры. Следовательно, это же соотношение должно иметь силу и для реальных приращений, когда максимум распределения сдвигается из-за изменений температуры.
ЧЕТЫРЕ ЛЕКЦИИ ПО ВОЛНОВОЙ МЕХАНИКЕ1 Лекция первая 1. Вывод основных идей волновой механики из гамильтоновой аналогии между обычной механикой и геометрической оптикой Если материальная точка то, движущаяся в консервативном силовом поле, описанном потенциальной функцией V(x, у, z) вышла из некоторой точки А с данной скоростью, т.е. с данной энергией, то ее можно заставить пройти через другую точку В, сообщив ей соответствующее начальное «направление». Вообще, существует только одна траектория, ведущая от А к В при данной энергии. Эта траектория удовлетворяет условию: в Рис. 1 '/ 8 / 2Tdt = 0 (1) и определяется им (принцип Гамильтона в формулировке Мопертюи). Здесь Т означает кинетическую энергию материальной точки, а уравнение следует понимать следующим образом. Рассмотрим многообразие всех возможных путей, ведущих от Ак В и подчиняющихся закону сохранения энергии. Среди них действительно пройденная траектория отличается тем, что для нее и для всех бесконечно близких к ней траек- в !■■ торий многообразия интеграл / 2Т dt имеет одно и то же значение до А 1 Перевод с немецкого под редакцией К. Р. Иршенко.
Лекция первая 103 бесконечно малых величин второго порядка (причем, обозначение «бесконечно близкое» выражает бесконечно малые первого порядка). Если w = Ц^ — скорость материальной точки, то 2T = mw2 =т(Щ = 2{Е -V) = jffV2m - (Е - V). Таким образом, уравнение (1) принимает вид: в 8 А Г ^2m(E - V)ds = 0. (2) Этот вид уравнения имеет то преимущество, что, во-первых, вариационный принцип применяется к чисто геометрическому интегралу, который не содержит переменной времени, и, во-вторых, автоматически выполняется условие постоянства энергии. Гамильтон сопоставил уравнение (2) с принципом Ферма, согласно которому в оптически-неоднородной среде действительные световые лучи, т.е. пути, вдоль которых движется энергия, определяются законом кратчайшего распространения света. Если рис. 1 отнести теперь к любой оптически неоднородной среде, например, к земной атмосфере, то можно, поместив в точке А источник света, который дает соответственный луч, осветить произвольно выбранную точку В. Существует определенный световой путь, от А к В, который соответствует уравнению (3) и определяется им однозначно: '/#=0. (3) в S 'а Здесь, как и раньше, ds означает элемент пути, а и — скорость света, зависящую от координат х, у, z. Оба принципа, уравнения (2) и (3), становятся идентичными, если мы потребуем, чтобы С (4) ^/2m(E - V) где С не должно зависеть от х, у, z, но зависит от Е. Таким образом, мы мысленно сконструировали оптическую среду, где многообразие возможных световых лучей совпадает с динамическими путями
104 Четыре лекции по волновой механике материальной точки то, движущейся с данной энергией в силовом поле V(x, у, z). При этом очень важным является тот факт, что скорость света и зависит не только от координат, но также и от Е — полной энергии материальной точки. Это дает нам возможность продолжить аналогию, толкуя зависимость от Е как дисперсию, т. е. как зависимость от частоты. Для этой цели мы должны допустить, что наши световые лучи имеют строго определенную частоту v, зависящую от энергии Е. Мы полагаем (произвольно): E = hv (5) (h — квант действия Планка), не останавливаясь на этом допущении, столь знакомом каждому современному физику. Тогда эта неоднородная дисперсирующая среда даст посредством своих световых лучей картину всех динамических путей нашей частицы. Мы можем пойти еще на шаг далее, задавая вопрос: можно ли создать маленький «точкооб- разный» световой сигнал, который двигался бы точно так же, как наша материальная точка? (До сих пор мы определили только геометрическую идентичность путей, вопрос же зависимости движения от времени оставили пока без внимания). На первый взгляд это кажется невозможным, ибо скорость материальной точки: w=±y/2m(E-V) (6) (вдоль пути, т. е. при постоянном Е) обратно пропорциональна скорости света и (см. уравнение 4; С зависит только от Е). Однако нужно помнить, что и — обыкновенная фазовая скорость, тогда как маленький световой сигнал распостраняетея с так называемой групповой скоростью g, определяемой уравнением: g dv\uJ или, в нашем случае, согласно уравнению (5), 1 = jL(e\ (7) g dE\u) K> Попробуем теперь допустить, что g = w. Для этого нужно только соответственным образом выбрать имеющуюся в уравнении (4) произвольную функцию энергии С. На основании (4), (6) и (7) требование
Лекция первая 105 g = w дает: d (E^2m{E-V), m d отсюда следует: (^ - l) ^/2m(E - V) = const относительно Е. Так как V содержит координаты и С зависит только от Е, то, очевидно, уравнение выполняется, вообще говоря, только в том случае, если выражение в первой скобке равно нулю. Поэтому (f-0 0 или С = Е, вследствие чего уравнение (4) получает вид: и= Е y/2m(E - V)' (8) Это — единственная формула для фазовой скорости, дающая в нашем воображаемом случае распространения света полное совпадение между динамическими законами движения материальной точки и оптическими законами движения светового сигнала. Следует еще указать, что соответственно уравнению (4): энергия . . и = имп ьс материальной точки. (8а) Определение и имеет, правда, еще следующую произвольность: очевидно, Е определено только до произвольной аддитивной постоянной, так как только до этой постоянной определено V(x, у, z). Эта неопределенность не может быть устранена в нерелятивистском толковании проблемы (релятивистская трактовка в этих лекциях излагаться не будет). Основная идея волновой механики следующая. Явление, которому классическая механика, казалось, дала адекватное описание тем, что изображала движение материальной точки, т.е. рассматривала ее координаты х, у, z как функцию от времени, — это явление по новым представлениям должно быть изображено некоторым волновым движением, составляющимся из волн только что описанного вида, т.е. определенной частоты и скорости (и, следовательно, определенной длины
106 Четыре лекции по волновой механике волны), которое мы выше определили как «свет». Математически, волновое движение изображается неограниченным числом функций от одной переменной t, а, так сказать, непрерывным многобразием таких функций, т.е. одной функцией (или, возможно, нескольким функциями) от х, у, z и t. Эти функции удовлетворяют диференциальному уравнению с частными производными типа волнового уравнения. Если я говорю, что действительный процесс может быть точно описан только волновым движением, то это не означает, что такое волновое движение действительно существует. В дальнейшем мы увидим, что при обобщении на любую механическую систему, то, что в ней действительно происходит, описывается волновым процессом в обобщенном координатном пространстве ((/-пространстве). Хотя последнее имеет определенное физическое значение, нельзя сказать, что оно «существует», так что и о волновом движении нельзя говорить, что оно «существует» в обычном смысле этого слова. Возможно, что и в рассматриваемом нами случае одной материальной точки не следует буквально говорить о волновом движении, как о чем-то реальном, хотя в этом частном случае координатное пространство случайно совпадает с обыкновенным пространством. 2. Обыкновенная механика — только приближение, не действительное для очень малых систем Цель, которую мы преследуем, заменяя обычное механическое описание волномеханическим, — установить теорию, охватывающую как обыкновенные механические явления, где квантовые условия не играют заметной роли, так и типичные квантовые явления. Возможность достичь этой цели основана на следующей аналогии. Вышеупомянутая волновая картина Гамильтона содержит нечто, соответствующее обычной механике, а именно: лучи соответствуют механическим траекториям, а световые сигналы движутся как материальные точки. Но описание волнового движения посредством лучей есть лишь приближение (именуемое в случае световых волн «геометрической оптикой»), уместное только в том случае, когда структура рассматриваемого нами волнового явления является грубой по сравнению с длиной волны, и до тех пор, пока мы интересуемся только грубой структурой. Тонкая структура волнового явления никогда не может быть изображена с помощью лучей (геометрической оптики), и всегда существуют волновые
Лекция первая 107 явления, которые так малы на всем своем протяжении, что описание их посредством лучей безрезультатно и не дает о них никакого представления. Следовательно, заменив обычную механику волновой, мы можем надеятся, с одной стороны, снова получить обыкновенную механику как приближение, описывающее грубые макромеханические явления и, с другой, — получить объяснение для тех тонких «микромеханических явлений» (движение электронов в атоме), для которых старая механика не могла, вообще, дать никакого объяснения; по крайней мере, не могла его дать без очень искусственных дополнительных предложений, составлявших в действительности далеко более существенную часть теории, чем собственно механическое рассмотрение1. Путь, ведущий от обычной механики к волновой, аналогичен методу, установленному Гюйгенсом, когда он предложил свою теорию света вместо теории Ньютона. Можно установить следующее символическое соотношение: обычная механика = геометрическая оптика волновая механика волновая оптика Типичные квантовые явления вполне аналогичны типичным волновым явлениям, как диффракция и интерференция. Для установления этой аналогии важно то, что обычная механика неприменима как раз для очень малых систем. Можно непосредственно испытать порядок величины, при которой следует ожидать полной неприемлемости обычной механики. Значение длины Л наших волн следует из уравнений (5) и (8): л _ и _ h _ h ~ v~ Jlm(E-V)~mw' т. е. длина волны равна частному от деления кванта действия Планка на импульс материальной точки. Рассмотрим для простоты круговую орбиту водородного атома с радиусом а, которая не обязательно должна 1 Приведем пример: странным образом фактическому применению квантовых правил к проблеме многих тел не противоречило то, что эти правила нельзя было формулировать для неусловно периодической системы. Просто рассматривали проблему многих тел как условно периодическую, хорошо зная, что она таковой не является. Это, я думаю, показывает, что обычную механику применяли недостаточно строго, в противном случае упомянутое выше примечание было бы также невозможно, как, скажем, распространение уголовных законов на движение планет.
108 Четыре лекции по волновой механике быть «квантованной». Тогда по обычной механике получается соотношение (без каких-либо квантовых условий): mwa = n—, (9) где п — произвольное вещественное положительное число (которое приняло бы для квантованных боровских орбит значения 1,2,3, ..., наличие h в последнем уравнении является в данный момент лишь удобным способом выражения порядка величины). Объединение последних двух уравнений дает: А = 2тг а п ' Обычная механика применима, если размеры вычисленных таким образом траекторий велики по сравнению с длиной волны. Из последнего равенства видно, что это будет в том случае, если квантовое число п велико по сравнению с единицей. С уменьшением п отношение ^ становится все менее благоприятным. Обычная механика должна, таким образом, оказаться несостоятельной как раз в той области, которой мы заняты, а именно: если п принимает значения порядка единицы, что бывает при атомных орбитах нормальной величины (10_8см). 3. Боровские стационарные энергетические состояния как собственные частоты колебания волн Рассмотрим теперь с помощью волновой механики случай, недоступный обычной механике, а именно случай, который характеризовался как движение электрона в атоме водорода. Как нам приступить к такой проблеме? — Таким же образом, как мы рассматривали бы проблему определения всевозможных движений (колебаний) упругого тела, с той лишь разницей, что последняя проблема, благодаря существованию двух видов волн — продольных и поперечных, принимает более сложную форму. Чтобы обойти это затруднение, представим себе упругую жидкость в замкнутом сосуде. Для давления р получится волновое уравнение Ар - \р = 0, (10)
Лекция первая 109 где и — постоянная скорость распространения продольных волн, единственно возможных в случае жидкости. Нужно найти общее решение этого дифференциального уравнения с частными производными, удовлетворяющее известным граничным условиям на поверхности сосуда. Обычный способ решения дается подстановкой: р(х, у, z, t) = ф(х, у, z) ■ е2жМ, откуда для ф получается следующее уравнение: Аф+Щ^ф = 0, (10а) причем ф подчиняется тем же граничным условиям, что и р. Здесь мы встречаемся с известным фактом, что не для всех значений коэффициента при ф, т. е. не для всех частот v, существует регулярное, однозначное решение, удовлетворяющее уравнению и граничным условиям, но только для дискретной бесконечной последовательности частот щ, 1/2, ••• , Vki называемых характеристическими или собственными частотами проблемы или тела. Пусть фь будет решением, относящимся к V]. (в общем случае, для каждого щ существует с точностью до некоторого произвольного множителя только одно фк). Так как уравнение и граничные условия однородны, то более общее решение равно: Р = 5><А* • е2™(1-*<+,Ч (И) к где Ск,$к — произвольные постоянные; (11) является общим решением, если последовательность фк,^к — полная. (Для физических применений пользуются, конечно, вещественной частью выражения 11). В случае волн, которые должны заменить движение электрона, также встретится величина р, подчиненная волновому уравнению вида (10), хотя мы еще ничего не можем сказать о физическом значении р. Оставим на момент этот вопрос в стороне. В уравнении (10) мы должны положить для и значение [см. уравнение (8)]: Е y/2m(E - V) и теперь не является постоянной, а зависит, во-первых, от Е, т. е. в сущности от частоты v = 1 — 1, и, во-вторых, от координат х, у, z, через
по Четыре лекции по волновой механике потенциальную энергию V. Это те усложнения, которые появляются по сравнению с простым вышерассмотренным случаем колеблющегося жидкого тела. Ни одно из них не является существенным. Зависимостью и от Е мы ограничены в том, что можем применить волновое уравнение только к такой функции р, зависимость которой от времени дана в виде: р „ e2*iEt/h так что р= ^—р- (Щ Но это то же допущение, которое вводится и при обычном методе решения. Если мы подставим (12) и (8) в (10) и букву р заменим на ф (чтобы выразить, что здесь точно также, как и раньше, мы исследуем лишь функцию координат), то найдем: 8Л/ h2 ^ф+^Р1(Е-У)ф = 0. (13) Итак, мы видим, что второе усложнение уравнения (10) (зависимость скорости и от V и, следовательно, от координат) придает уравнению (10а) только более интересную форму [(ср.(13) с (10а)], выражающуюся в том, что коэффициент при ф уже не постоянный, а зависит от координат. Этого действительно можно было ожидать, так как уравнение, выражающее механическую проблему, должно в сущности содержать потенциальную функцию. Упрощение в случае волномехани- ческой проблемы (по сравнению с рассмотренной проблемой жидкости) заключается в отсутствии граничных условий. Когда я впервые занялся этим вопросом, мне это упрощение казалось неблагоприятным, так как я не был достаточно математически подготовлен и не мог себе представить, каким образом могут получиться собственные частоты без граничных условий. Позже я понял, что более сложная форма коэффицентов, а именно, появление V(x, у, z) до известной степени дает то, что обычно достигается граничными условиями — отбор определенных значений Е. Я здесь не могу углубляться в эту несколько длительную математическую дискуссию, а также не могу останавливаться подробно на том, как находятся эти решения. Скажу только, что метод практически тот же, как и в обычной проблеме колебания: вводят соответствующие координаты (сферические, эллиптические, смотря по форме функции V) и полагают ф равным произведению функций, из которых
Лекция первая 111 каждая содержит лишь одну координату. Сообщу лишь результаты для случая атома водорода. Здесь нужно положить: V = -^r+ const, (14) где 1 расстояние от ядра. Тогда находим, что простые, регулярные и конечные решения ф существуют не для всех, а только для следующих значений Е: 1)Еп = const -Цр^; п = 1,2,3,... h n 2) Е > const. Константа та же, что и в (14), и в нерелятивистской волновой механике не имеет определенного значения. Правда, ее нельзя принять равной нулю, как это обычно делается ради простоты, — в этом случае все значения в 1) были бы отрицательны, а отрицательная частота означает (если она, вообще, что-нибудь означает) то же, что и положительная частота того же абсолютного значения. Тогда было бы непонятно, почему допускаются все положительные частоты, а из отрицательных — только дискретный ряд. Однако вопрос об этих постоянных здесь несущественен. Видите, таким образом, что наше дифференциальное уравнение автоматически отбирает следующие допустимые значения Е: 1) энергетические уровни квантованных по теории Бора эллиптических орбит; 2) все энергетические уровни, относящиеся к гиперболическим орбитам. Это весьма замечательно, ибо показывает, что, независимо от физического значения волн, теория дает метод квантования, совершенно свободный от необходимости постулирования целочисленности той или иной величины. Для того, чтобы дать представление о том, как здесь выступают целые числа, приведу пример. Если ф — азимутальный угол, а амплитудная функция содержит множитель cos ту,, где т — произвольная константа, то последняя должна быть целым числом, иначе волновая функция не была бы однозначной. Теперь вам интересно, какой вид имеют волновые функции, относящиеся к характеристическим значениям Е, и способны ли они объяснить какие-либо экспериментальные факты. Это, действительно, имеет место, хотя представляется несколько сложным делом.
Лекция вторая 4. Краткое описание волновой системы водородного атома. Вырождение. Возмущение Главная особенность амплитудных функций состоит в том, что те из них, которые относятся к дискретному ряду значений Еп (эллиптические орбиты), очень быстро убывают с удалением от ядра, а именно: как e-const-r- поэтому они практически ограничиваются областью, имеющей точно такой же порядок величины, как соответствующие орбиты Бора. Амплитудные функции, соответствующие гиперболическим орбитам, убывают гораздо медленнее, а именно, лишь как г-1. Точное поведение «функции эллипсов» нельзя описать однозначным способом по следующей причине: одному значению Еп соответствует, вообще, не одно, а ровно п2 независимых решений волнового уравнения. С математической точки зрения это есть исключение, обусловленное особой формой потенциальной энергии, а именно: ее сферической симметрией. Многозначность решений, относящихся к одному собственному значению, соответствует хорошо известной многозначности орбит в теории Бора, относящихся к тому же энергетическому уровню. Там это явление называется «вырождением». Мы перенесем это название в волновую механику. Так как волновое уравнение является линейным и однородным, то решением, соответствующим одному собственному значению, может быть каждая линейная функция указанных п2 решений с произвольными коэфициентами. В таком случае, как известно, никакой ряд решений не имеет преимущества перед другим, получающимся из первого путем образования стольких же независимых линейных выражений. Этим процессом образования линейных выражений можно получить решения, обладающие различными свойствами. Например, из ряда решений, узловыми поверхностями которых являются: 1) концентрические шары, 2) коаксиальные конусы и 3) плоскости, проходящие через оси конусов, можно образовать другие решения, где на месте концентрических шаров и коаксиальных конусов возникают два рода конфокальных параболоидов. Это — только один из
Лекция вторая 113 простейших случаев. Вообще же, если взять произвольные коэффициенты, то система узловых поверхностей намного усложняется. Эта многозначность решений, или, как обычно говорят, собственных значений (которые, между прочим, известны из обычной проблемы колебания), имеет для случая атома очень большое значение. Если многозначности нет (как, например, для самой малой частоты, п = 1), то небольшое изменение потенциальной энергии V, которое может быть вызвано слабым внешним электрическим полем, вызывает ни что иное, как небольшой сдвиг собственного значения и собственной функции, точно также, как небольшой кусочек металла, прикрепленный к камертону, изменил бы высоту его тона и форму его колебаний. Но многократно вырожденное (скажем, а-кратное) собственное значение проявляет в данном случае свою многократность тем, что оно расщепляется на а собственных значений, которые мало отличаются друг от друга. Каждому из них соответствует вполне определенная собственная функция, мало отличная от определенного линейного выражения из собственных функций, соответствующих многократно вырожденному собственному значению. Это расщепление теоретически может быть вызвано самым малым возмущением, однако может сильно отличаться для двух, разных по своему характеру, возмущений. Например, однородное электрическое поле создает вышеупомянутые параболические поверхности, а магнитное поле — шаровые и конусные поверхности. Расщепление в этих двух случаях соответствует расщеплению спектральных линий водорода в эффектах Зеемана и Штарка. Количественно сдвиг линии описывается новой теорией также, как и старой. Однако получается также то, что было невозможно для классической теории: состояние поляризации спектральных линий, их интенсивность и, в особенности, отсутствие известных линий, которые ожидались бы, если бы образовать все возможные разности расщепленных энергетических уровней. Сейчас мы это рассмотрим ближе. 5. Физическое значение волновой функции. Вывод правила отбора и правил поляризации спектральных линий Большое значение эффекта возмущения заключается в том, что он дает возможность иметь дело с однозначно определенными собственными функциями фк, и что теперь мы легче можем испытать гипотезу о физическом значении величины ф.
114 Четыре лекции по волновой механике Обозначим через Ek = hvk и фк(х, у, z) соответственно собственные значения, частоты и функции проблемы, потенциальную энергию которой полагаем настолько несимметричной, что никакого вырождения нет. Тогда выражение ф = YJ^ke2*i{v*t+i)k) (15) к с произвольными постоянными с/г и $j. представляет самое общее «колебание» системы1. Так как каждое фк определено только до произвольного множителя, то, во избежание неопределенности, подчиним фк нормирующему условию: ipldxdydz = 1. (16) Пожалуй, здесь уместно упомянуть об очень важном свойстве, которое автоматически выполняют фк — они ортогональны друг к другу: фкфг dx dydz = 0 для к ф I (17) и образуют полную ортогональную систему, т. е. функция, которая ортогональна ко всем функциям, должна равняться нулю (эти свойства важны при разложении любой функции в ряд по фк, но нам на этом пока нет нужды останавливаться). Вернемся теперь к общей функции (15) и спросим, можно ли величине ф приписать определенное физическое значение, чтобы объяснить световое излучение частоты Vkw = vk — v'h. Это, действительно, можно сделать, правда, только в том случае, если применить комплексную ^-функцию, а не ее вещественную часть, к чему мы привыкли в обычных проблемах колебаний. 'Мы здесь оставили без рассмотрения «непрерывный спектр», соответствующий гиперболическим орбитам. Мы можем положить, что его колебания не возбуждены или что ^ уже содержит интефал, как предельный случаи, который, собственно говоря, следовало бы добавить, чтобы принять во внимание непрерывную область собственных функций. Я не хотел сверх необходимости усложнять формулы. // ///
Лекция вторая 115 Гипотеза, которую нужно сделать, очень проста. Именно, нужно постулировать, что квадрат абсолютной величины ф пропорционален электрической плотности заряда, который, сообразно с законами обычной электродинамики, выбивает излучение. Так как квадрат абсолютного значения ф получается умножением ф на ее комплексно сопряженное значение (которое мы обозначим через ф), то из уравнения (7) видно, что ф действительно составлено из выражений, временная зависимость которых дана косинус функциями желаемых частот vk — vk* ■ Представим теперь точнее плотность заряда в виде р= -ефф= -e^^CfcC^VfcV'fc'e2"1^^'^^^01, (18) к к' где е означает абсолютное значение электрического заряда. Интегрируя это выражение по всему пространству и используя уравнения (17) и (16), находим для всего заряда: к Это показывает, что надо положить ^ (?к = 1, чтобы достигнуть равен- к ства полного заряда заряду электрона, чего мы и добиваемся. Еще раньше было отмечено, что ф, а вместе с ней и р, практически ограничены в очень малой области в несколько А — Е. Так как длины волн световых лучей по сравнению с этой областью очень велики, то можно приближенно рассматривать излучение колеблющейся плотности заряда как излучение электрического диполя, электрический момент которого имеет ^-компоненту: Mz = 111 Zpdxdydz (и соответственно составленные х, у-компоненты). Для Mz получается из (18) после простого преобразования: Mz = -^2ск2акк' -2^2скск>акк* cos27r[(i/fc - vv)t + (i?fc -№')]. (19) к кк' Здесь аик' есть сокращенное обозначение для следующей постоянной: Ukk' = е / / / гфк фк> dx dy dz, (20)
116 Четыре лекции по волновой механике а ^ берется по всем парам (к, к'). Квадраты этих интегралов (соот- кк' ветствующие выражения для направлений х, у) определяют, следовательно, интенсивность светового излучения частоты v — vy ■ Правда, оно определяется не только ими одними, но, как нужно ожидать, играют роль и амплитудные постоянные с&. Это вполне понятно, потому что интегралы а^к' определяются механической природой системы, т. е. ее соответственными функциями, не учитывая ее состояния. a,kk' есть амплитуда соответствующего диполя, которая была бы вызвана собственными колебаниями фк, Фк', если бы возбуждались только они И С ОДИНаКОВОЙ СИЛОЙ (Сь = Сь' = — ). Для исследования излучения первая сумма (19) несущественна, ибо она представляет составляющую постоянного во времени электрического момента. Правильность нашей гипотезы ф была проверена тем, что были вычислены a,kk' B таких случаях, где фк определено с достаточной степенью точности, а именно, в Зееман- и Штарк-эффектах. Так называемые правила отбора, поляризации и распределения интенсивности в явлениях расщепления описываются путем а^к' следующим образом, в полном согласии с опытом. Отсутствие ожидаемых спектральных линий («правило отбора») описывается обращением в нуль соответствующего ctkk' и двух других, постоянных для направлений х, у. Линейная поляризация линии в определенном направлении выражается тем, что только постоянная, соответствующая этому напрарлению, отлична от нуля, тогда как обе другие постоянные исчезают. Подобным образом характеризируется и круговая поляризация, скажем, в ху-ипос- кости: 1) исчезновением ^-постоянной; 2) равенством жу-постоянных и 3) разностью фаз на ^ между соответствующими косинус-функциями в уравнении (19). Наконец, отношение интенсивностей между неисчезающими компонентами Штарк-эффекта или Зееман-эффекта атома водорода выражается отношением квадратов, соответствующих a,kk' • Этого достаточно, так как весьма правдоподобно предположение, что си компонентов тонкой структуры уровня равны, несмотря на наши в общем недостаточные знания Cfc. Конечно, невозможно дать в этой лекции все расчеты, ведущие к описанным результатам. Они заполнили бы большое количество страниц и были бы, хотя и не трудны, но очень утомительны. Несмотря на
Лекция вторая 117 это, прямо поражает, когда видишь, как все хорошо известные, однако непонятные «правила» одно за другим оказываются результатом хорошо известного, очень элементарного и абсолютно убедительного вычисле- ния, вроде того, что / cos rmp cos tup cos dip исчезает во всех случаях, о кроме п = то. Если однажды установить гипотезу фф, то тут невозможно и не нужно никаких дополнительных допущений. Ни одно из них не могло бы помочь, если бы «правила» точно не оправдались. К счастью, они оправдываются. Я бы хотел еще обратить внимание ваше на другой пункт, о котором говорилось только вкратце в начале лекции, а именно на тот факт, что и основное условие частот Бора Vkk' = vu — Vk' = т {Ek — Ej.') объясняется гипотезой фф. Есть нечто в атоме, что колеблется точно с наблюдаемой частотой, а именно известная часть распределения электрической плотности, или, если угодно, фф. Это могло бы привести к предположению, что реальное значение имеют не ^-функции сами по себе, а только квадрат их абсолютного значения. А это предположение могло бы снова вызвать желание заменить волновое уравнение другим, непопосредственно описывающим поведение фф. Чтобы не возбуждать у вас этого желания, я вам напомню другой случай, где вы по подобным причинам могли бы выразить аналогичное желание, в то время как вы все должны согласиться, что это было бы невыполнимо. Уравнения Максвелла описывают поведение электромагнитных векторов. Однако последние недоступны наблюдению. Единственно, что поддается наблюдению, — это пондеромоторные силы или, если угодно, энергия, потому что силы вызываются разностью энергии при возможном перемещении. Но все эти величины (энергия, максвеллов- ские напряжения) суть квадратичные функции векторов поля. Поэтому может возникнуть желание заменить уравнения Максвелла другими, непосредственно определяющими квадратичные функции векторного поля, поддающиеся наблюдению. Но всякий согласится, что это, во всяком случае, означало бы громадное усложнение и что в действительности невозможно было бы обойтись без уравнений Максвелла.
118 Четыре лекции по волновой механике 6. Вывод собственного временного волнового уравнения Аф+Щ^(Е-У)ф = 0, (13) Уравнение 8ttV, h2 которым мы воспользовались для исследования атома водорода, дает только пространственное распределение амплитуд колебания, причем зависимость от времени всегда задана в виде: Частотный параметр Е явно содержится в уравнении, так что мы в действительности имеем дело с рядом уравнений, из которых каждое действительно только для определенной частоты. Дело обстоит точно так же, как и в обыкновенных проблемах колебания, наше уравнение соответствует так называемому амплитудному уравнению [см. § 3, уравнение (10а)]: Аф + Щ^-ф = 0, (10а) а не уравнению Ар - \р = 0, (10) из которого предыдущее выведено вышеуказанным способом (а именно, тем, что р рассматривается как синус-функция времени). В нашем случае остается сделать соответствующий шаг в обратном смысле, а именно, удалить параметр Е из амплитудного уравнения и на его место ввести производные по времени. Это легко сделать. Берут одно из уравнений (13) с определенным значением Е и получают из (21): ф = Щ^-ф или Еф = J^-.ф. h 27И Применяя это выражение, получаем из (13): Аф j^—ф —2—ф = 0. (22) Получается всегда одно и то же уравнение, независимо от того, какое значение имеет при этом Е (так как Е исключено). Следовательно, уравнение (22) действительно также для произвольного линейного
Лекция вторая 119 агрегата собственных колебаний, а, стало быть, и для самого общего волнового движения, которое является решением проблемы. Пойдем еще дальше и попытаемся использовать уравнение для случая, когда потенциальная энергия V явно содержит время. Вовсе не очевидно, что это обобщение правильное, потому что выражения с V и т. д. могли от нас ускользнуть — они могли бы не войти в уравнение (22) при таком способе, каким мы его вывели. Но результат оправдывает наше предприятие. Конечно, было бы бессмысленным предположить, что уже в уравнении (13) V явно содержит время, так как условие (21), которым это уравнение ограничено, сделало бы невозможным удовлетворить его в случае произвольной переменной функции V. 7. Возмущение атома переменным электрическим полем Это обобщение дает нам возможность ответить на следующий вопрос: как ведет себя атом под влиянием внешнего переменеого поля, т. е. под влиянием падающей световой волны? Это очень важный вопрос, потому что он охватывает не только механизм вторичного излучения и, в частности, резонансного излучения, но и теорию изменения состояний в атоме под влиянием падающего излучения соответственной частоты, а также теории преломления и дисперсии, ибо, как известно, дисперсия (я имею в виду показатель преломления) вызывается наложением на первичное излучение всех тех вторичных элементарных волн, которые излучают каждый отдельный атом тела под влиянием первичного излучения и в связи с его фазой. Если электрический вектор падающего света € заставляет каждый атом излучать вторичную волну так, как она излучалась бы диполем с электрическим моментом М = а€ (23) (где а — константа), и если в единице объема имеется Z атомов, то они вызывают увеличение показателя преломления на величину 2nZa. (24) Поэтому изучение значения а (которая обычно является функцией частоты) означает изучение явлений преломления и дисперсии. Чтобы исследовать поведение атома во внешнем электрическом переменном поле, предположим, что V в (22) состоит из двух частей, из
120 Четыре лекции по волновой механике которых одна — Vq — описывает внутреннее электростатическое поле атома, а вторая изображает световое поле Aez cos 2я"г4; А и v — амплитуда и частота светового поля, которое мы предположим поляризованным в направлении z (отрицательный знак электронного заряда учтен; наше е — положительное число). Тогда из (22) следует: щ _ ^Шф - Щп . (Vb + Aez cos 2пи1)ф = 0. (25) Положим А малым сравнительно с внутренним полем (описываемым через Vq) и решим уравнение приближенно. Если бы А = 0, мы получили бы, учитывая (21), уравнение (13) (только с Vq вместо V). Предположим, что задача невозмущенного атома вполне разрешена. Пусть его нормированные собственные функции и собственные значения энергии соответственно равны: фк и Ek{=hvk), тогда для А = 0 самым общим решением уравнения (25) является Ф = У£скфке2™*\ (26) к причем Ск — произвольные комплексные постоянные. Попытаемся решить уравнение (25) также для случая А ф 0 с помощью формулы (26), причем предположим, что Ск медленно изменяется со временем (метод вариации постоянных). Если это сделать и одновременно принять во внимание, что фи, hvu — собственные функции и собственные значения невозмущенного уравнения, то при подстановке (26) в (25) легко получается: Y, СкФке2™к1 = ЩАег cos 2i:vt ^ cfcVfce2*'"*'. (27) к к Это уравнение выполняется при условии, что при одинаковых значениях времени все коэффициенты разложения левой части по функциям фк равны соответствующим коэффициентам разложения правой части. Если обе части умножить на ф\ и проинтегрировать по всему пространству, положив для сокращения (см. §5): aki=e ipk&zdxdydz, (20)
Лекция вторая 121 то, учитывая нормировку и ортогональность функций «/>;,, получаем: с/е2™'* = ^р A cos 2тгг4 ^ аыс^2™^', / = 1,2,3,... (28) к Этот бесконечный ряд обыкновенных диференциальных уравнений эквивалентен уравнению (27). Исключая с/ и заменяя конусы экспоненциальными функциями, получим: с, = +2[М ^аыСл[е2«(^-^1+И* + е2«(^-^,-И*]. (28а) к До сих пор мы еще не приступили к непосредственной задаче возмущения. Сделаем это теперь двумя различными способами: один из них ведет к теории вторичного излучения (кроме случая резонанса) и к дисперсии, другой дает процесс резонанса и изменения атомных состояний.
Лекция третья 8. Теория вторичного излучения и дисперсии Предположим, что все выражения Vk — щ ± v, встречающиеся в показателях уравнения (28а), велики по сравнению с величиной: АаыСк h ' Это означает, что разность между поглощенной частотой и какой- либо частотой спонтанного излучения велика по сравнению с частотой, соответствующей потенциальной энергии атома во внешнем поле (исключение для случая сильного или приближенного резонанса). При этом предположении уравнения (28а) показывают, что все производные по времени от q малы по сравнению с производными экспоненциальных функций. Рассмотрим для этого случая одну из экспоненциальных функций в правой части одного из уравнений (28а). Ее коэффициент си можно рассматривать как постоянный во время периода экспоненциальной функции. Тогда этот член суммы вызовет лишь небольшое периодическое колебание с; (в левой части), которое через период экспоненциальной функции точно или с достаточной точностью снова вернется к исходному значению. То же действительно для всех экспоненциальных функций. Поэтому все с производят большое число малых колебаний вокруг своего среднего значения — колебаний, которые, конечно, исчезают с исчезновением А. Поэтому можно в правой части уравнения (28а) заменить с постоянными, а именно — их средними значениями, так как если здесь пренебречь малыми колебаниями, то отпадают только выражения с А2. Введем для упомянутых постоянных обозначение с^. Тогда уравнения легко интегрировать. Получается: п ^4 V^ П Г e2Ki(vk-vi+v)t 2-Ki(vk-vi-v)t~\ С = с, +й±.аЫ ъ-щ + v + vu-щ-у I к
Лекция третья 123 Следовательно, 1-Й член в нашем решении (26) будет: **«-" = с?*«"— + ^ £ «,,cj [^^ + £^±. (29) к Хотя мы еще не достигли результатов, которые можно было бы сравнить с опытом, все же, руководствуясь уравнением (29), дадим описание того, что происходит под влиянием подающей световой волны. Каждое собственное колебание «/>/, будет ли оно сначала возбуждено, или нет, должно совершить много малых вынужденных колебаний, а именно, два, так сказать, «в честь» каждого заметно возбужденного собственного колебания фк, (с^ ф 0). Частоты обоих вынужденных колебаний, которые ф\ совершает, как мы сказали, «в честь» фк, равны Vk ± v, т. е. сумме и разности поглощенной частоты и частоты свободного собственного колебания. Их амплитуды пропорциональны, во- первых, амплитуде внешнего поля и, во-вторых, амплитудам свободных колебаний фк; кроме того, они содержат в качестве сомножителя константу аы, т.е. ту самую постоянную, которая определяет интенсивность спонтанного испускания частоты \vk — vi\- Далее, в обеих вынужденных амплитудах встречаются два «резонансных знаменателя», которые вызывают быстрое увеличение одной из амплитуд, если частота падающего света приближается к частоте спонтанного излучения К -Ы- Прежде, чем составить из (26) и (29) полное решение, ограничимся важным случаем, когда возбуждено только одно собственное колебание, скажем фк: с°к = 1; c°i = 0 при / ф к. Мы можем предположить, что фк соответствует нормальному состоянию. Тогда в правой части уравнения (29) отпадает первое: выражение (кроме случая I = к) и знак суммы, и мы для полного решения получаем [уравнение (6), где к нужно заменить через /]: Ф = фке^ + А £ акф [£-^ + ^^]. (30) (Обратите внимание, что теперь экспоненты независимы от суммацион- ных индексов /; имеется только две частоты вынужденного колебания.) Чтобы определить вторичное излучение, образуем из (30) компоненту1 Mz результирующего электрического момента. Если пренебречь 1 Вообще, для анизотропного атома будут еще Му и Мх, перпендикулярные к направлению поляризации поглощенного излучения. Сейчас мы ими не занимаемся.
124 Четыре лекции по волновой механике малыми выражениями второго порядка (пропорциональными А2), то после приведения находим: Mz = -e /// ффгdxdy dz=- akk + -Acos2iTvt\K ~, N9 "• (31) .1.1.1 h ~ {vi-vuY-v1 Первый член (—auk) независим от времени. Он равен постоянному электрическому моменту, соответствующему возбуждению свободного колебания фр,- Этот постоянный момент нас здесь не интересует. Второе выражение определяет вторичную волну. Видно, что ее частота совпадает с частотой электрического вектора поглощаемого колебания (Acos2Tri't). Обе имеют равные или противоположные фазы в зависимости от того, имеет ли место v > щ — v\, или v < щ — v\, — точно как в классической механике. Это имеет место в том случае, если фи соответствует нормальному состоянию, так что щ — Vk всегда положительны. Если же они становятся отрицательными, то справедливо обратное (члены Крамера в формуле дисперсии). Величина а в уравнении (26), определяющая по (24) увеличение показателя преломления, получится из второго члена (31), если отбросить AcosZirvt. Знаменатели [ух — г/д,)2 — v2 дают явление аномальной дисперсии вблизи всех тех эмиссионных (или абсорбционных) частот, где имеет место к-е собственное колебание. (Вспомним наше предположение о том, что возбуждено только это единственное свободное колебание). Величина а2ы в числителе та же, которая определяет интенсивность спонтанного испускания \vk —vi\. Во всех этих пунктах формула является точным отображением старой формулы Гельмгольца (дополненной «отрицательными» членами Крамера), и, как полагают, находится в полном согласии с экспериментом. Следует упомянуть о двух дальнейших обстоятельствах. Известно, что Томас и Кун выдвинули гипотезу, согласно которой сумму всех коэффициентов формулы дисперсии, в нашем случае ш П ~ »к)а2ы, следует приравнять значению коэффициента для одного квазиупруго связанного электрона, т. е. положить равной: е2 47г2т
Лекция третья 125 (в нашем случае, значению для одного электрона, ибо мы занимаемся атомом с одним электроном; в общем случае — целому кратному этого значения). Равенство обеих упомянутых величин может быть доказано для нашей дисперсионной формулы. Но доказательство несколько кропотливо, поэтому я здесь его не приведу. Второе обстоятельство следующее. Вы, вероятно, помните допущение, впервые сделанное Смекалем, что существует и такое вторичное излучение, частоты которого отличны от частоты v поглощаемых лучей (так что отсутствует связь между фазами, а с ней и влияние на показатель преломления). Частоты, которые можно было бы ожидать, следующие: v± (yk -vk<). Вторичное излучение точно таких же частот дает и настоящая теория, если отказаться от нашего упрощающего предположения, что возбуждено только одно свободное колебание, а имеется, по меньшей мере, два таких колебания, скажем, фи и фи. 9. Теория резонансного излучения и изменения атомных состояний под влиянием падающего света, частота которого точно или почти совпадает с частотой естественного излучения В начале предыдущего раздела мы должны были сделать предположение, что все выражения вида г/д, — щ ± v имеют значительную величину. Это означает, что частота поглощаемого света v не находится в непосредственном соседстве с каждой естественной частотой излучения атома. Предположим теперь, что частота падающего света лежит очень близко к одной из естественных частот. Пусть для определенности V{ > vp, и пусть г/д, — щ + v очень мало (т. е. порядка величины м или менее, или равно нулю). Возвратимся к уравнениям (28а). В правой части этой системы уравнений найдем две медленно изменяющиеся экспоненциальные функции, а именно: 2izi(vk-vi+v)t и e2-Ki(vk-vi-v)t Первая появляется в 1-м уравнении, вторая — в k-м. Эти выражения обусловливают, как мы сейчас увидим, весьма значительные «вековые»
126 Четыре лекции по волновой механике изменения обеих величин ск и q, как бы ни была мала амплитуда А падающей волны. Все другие экспоненциальные функции вызывают, как и раньше, только небольшие периодические возмущения. Поэтому можно оставить их без внимания, так как мы здесь заняты более грубым явлением (именно, значительными «вековыми» изменениями ск и q). Мы могли бы даже принять равными нулю все другие с; это не повредило бы, так как в пределах той точности, к которой мы здесь стремимся, они, наверное, постоянны. Для определения ск и с/ из (28а) получаем два простых уравнения: с/ = iackeiet; ck = iacte~iet (32) с сокращенными обозначениями: а = —-—; e = vk-vi + v. (66) Чтобы их решить, мы вводим новые переменные х, у, полагая сА = хеш'2; ск = уе-ш1\ (34) Результат преобразования мы можем написать в виде: (d . ie\ ■ (d ie\ {Jt + YJx = l<7y; {dt-J)y = U7X- Эти уравнения имеют постоянные коэфициенты и легко могут быть решены известным методом. Решение можно написать в следующем виде: X = peiht+V) +мр'е-<(7*-¥>')5 у = ppe^t+^ + p>e-ibt-v') с сокращениями: где р, р', ip, <p' — произвольные вещественные положительные постоянные. Мы можем (35) придать форму: Г х = e^-**')/2[(р + рр') cos ■& + г(р - рр') sinЩ \у = eHv-v')/* [(рр - р>) cos •& + i(pp + ft) sin 0]
Лекция третья 127 с сокращенным обозначением: V = jt+V±^. (38) Из (37) можно легко образовать квадраты абсолютных значений х и у, т.е. [см. уравнение (34)] с/ и с^, и, таким образом, выяснить изменяющееся распределение интенсивности двух рассматриваемых колебаний, что интересует нас в первую очередь. Имеем: \х\2 = \р-рр'\2+4ррр'cos2 #, \у\2 = \рр-р'\2+4ррр'sin2 V. Сумма интенсивностей, как и следовало ожидать, постоянна. Можно себе представить ее состоящей из трех частей: две из них тесно связаны с обоими состояниями колебания, а третья (именно ^ррр') медленно осциллирует между ними. Чтобы сделать это положение вещей более ясным, рассмотрим случай, когда в определенное время вся интенсивность сконцентрирована в одном колебании, скажем, в нижнем, си- Выберем значение времени t так, чтобы cos# = 0; тогда р' = Р = jr, и для отношения между осциллирующей частью интенсивности и полным ее значением имеем: 4 _ а" _ а" Аррр' _ 4 -2 -2 (рр + рГ (Л + I/V)2 72 <т2+£2/4' используя ясное из (36) обстоятельство, что 7 + ^/2 а (40) р -У + Ф' Мы видим, что при £ = 0 полное значение интенсивности осциллирует. Но е = 0 означает согласно (33) сильный резонанс. Если резонанс неполный, то (40) показывает, что колеблется лишь определенная часть интенсивности, которая уменьшается, если отклонение от резонанса велико по сравнению с величиной <т, определяемой уравнением (33). Величина <т такого же порядка, как и деленная на h потенциальная энергия, которую атом получает в световом волновом поле посредством электрического момента, соответствующего взаимодействию fc-ro и 1-го колебаний. Эта величина дала бы некоторым образом меру естественной
128 Четыре лекции по волновой механике резкости резонансной линии, если бы можно было найти общую, действительную для всех случаев, формулу для амплитуды А падающего света. На этом мы не будем останавливаться. Теория, которую я здесь изложил в общих чертах, описывает как изменение атомного состояния, вызванное поглощением излучения соответствующей частоты, так и появление резонансного излучения, потому что одновременное наличие обоих колебаний -фр, и г/ц вызывает спонтанное излучение. Следует еще отметить, что в виду наличия в уравнении (34) экспоненциальных функций это излучение имеет не частоты щ — г/д,, а точно частоту v поглощенной световой волны. 10. Распространение волновой механики на системы с несколькими материальными точками До сих пор мы применяли метод волновой механики только к очень простой системе, а именно, к единственной материальной точке, движущейся в постоянном или переменном во времени силовом поле. Перейдем теперь к любой механической системе. Это можно было сделать и раньше: все сказанное о влиянии переменного поля — с небольшими изменениями было бы действительно и для любой системы, например, для многоэлектронного атома. Но я считал, что лучше предложить вам сперва простой и ясный случай. Вывод основного волнового уравнения, который я изложил в первой лекции, легко обобщить на любую систему. Единственная разница заключается в том, что «пространство», в котором распространяется волна, уже не обычное трехмерное, а «пространство обобщенных координат» (q — пространство). Вспомним принцип Гамильтона-Мопертюи, из которого мы исходим: в sf2Tdt = 0. (1) А Приравняв 2T = mw2=m(^\ = 2(E-V) = j-- ^2т(Е - V),
Лекция третья 129 мы привели т к виду: в S J ^2т(Е - V)ds = О (2) i/f = 0, (3) А и затем сравнили с принципом распространения волн Ферма: в S 'а благодаря чему мы пришли к уравнению: и= С ^2т(Е - V)' В общем случае Т не имеет такого простого выражения: m (ds\ 2 \dt) ' а приобретает вид: (4) 2т = J2J2biki"i^ (41) / k где bik — некоторые функции обобщенных координат щ. Элемент длины ds в g-пространстве мы определяем из выражения: 2T = ££w = (fy ds2 =^^blkdqidqk. (42) l k Обобщенная неевклидова геометрия, определенная последней формулой, — это та самая геометрия, которой пользовался в своей знаменитой механике Г. Герц, формально рассматривая движение любой системы как движение одной материальной точки (в неевклидовом многомерном пространстве). Если ввести ее здесь, то, очевидно, все наши соображения первой лекции, приведшие к основному волновому уравнению, могут быть перенесены сюда даже с небольшим формальным
130 Четыре лекции по волновой механике упрощением, а именно: можно положить т = 1. Так же, как и там, мы получаем: Е у/ЦЕ - V) и, наконец, для волнового или (лучше) амплитудного уравнения имеем: А^+т? (E-V)i/> = 0. (43) Для собственно волнового уравнения мы, как и раньше (§6), получаем: д^ _ Ц±ф - ^ф = о. (44) Д теперь, конечно, не просто трехмерный оператор Лапласа и не обычный оператор в многомерном евклидовом пространстве (т. е. сумма вторых производных по координатам) — теперь его нужно рассматривать как хорошо известное обобщение оператора Лапласа для общего линейного элемента вида (42). При решении общих проблем мы обходимся без явного выражения для этого оператора — нам нужно знать только, что он является самосопряженным дифференциальным оператором второго порядка (впрочем, в данный момент неважно, если вы и не знаете, что означает самосопряженный). Ради полноты я все же дам обобщенное выражение оператора. Пусть щи будет соответствующий Ьц. минор, деленный на определитель ^2±bik и далее пусть а будет детерминант матрицы щи- Тогда В случае единственной материальной точки массы т и при евклидовых координатах Д сводится к произведению — на элементарный В2 В2 В2 оператор Д (именно, -^—z + -^-z + -^-z). Или, если вы предпочитаете Вх By Bz выразить движение отдельной материальной точки в других координатах, например, эллиптических или полярных, то вы получите произведение щ на выражение элементарного оператора Д, соответствующего взятым координатам. Если система состоит из п свободных материальных точек, то получается сумма их элементарных Д операторов, каждый из которых делится на соответствующую массу. В такой форме
Лекция третья 131 теорию можно применить к системам с любым числом степеней свободы — большим, меньшим или равным трем. Я дам несколько примеров, не приводя подробных вычислений, разве только том случае, если они представляют какой-нибудь физический интерес. я=4 ~---^-2 \я=3 я= =iV /-1 п- /я=3„. /\п: =0 4я=}> -1 1/ / '2 Рис. 2 11. Примеры: осциллятор, ротатор Рассмотрим одномерный гармонический осциллятор. В обычной механике выражение для его энергии гласит: T + V= ^q2+2irv2mq2. (Мы выразили коэффициент потенциальной энергии через классическую собственную частоту щ). Это легко приводит к амплитудному уравнению: Можно показать, что решения этого уравнения — непрерывные и конечные для всей вещественной (/-оси — существуют только для следующих значений Е: Еп [п+ 2Jhl/o, п = 0, 1, 2, 3 , _!_, AJ, ^, (46) Собственными функциями здесь являются так называемые ортогональные функции Эрмита: фп = {2пп\)-1'2е-х212Нп{х) (47)
132 Четыре лекции по волновой механике где Нп(х) представляет так называемый и-й полином Эрмита. Графическое изображение первых пяти функций (47) дано на рис. 2. Хотя теоретически фп простираются до бесконечности, практически они ограничены экспоненциальными функциями в области такого же порядка величины, как амплитуда соответствующей классической материальной точки (что очень легко доказать). Мы еще ничего не сказали о физическом значении нашей обобщенной функции ф. Прежде всего интересно следующее соображение: если фп — собственные функции одноэлектронной проблемы, ад — одна из прямоугольных координат, то интенсивность эмиссии частоты т\Еп — Ек\, поляризованной в g-направлении, можно выразить (сообразно нашей гипотезе фф) квадратом интеграла: Чфкфп dq. /• Применив это здесь, мы получим весьма удовлетворительный результат, а именно: интеграл исчезает, кроме случая (к — п) = 1. Это означает, что все частоты испускания света, кроме 1 • щ, исключены. Мы в дальнейшем вернемся к вопросу о физическом значении ф для общего случая. В качестве второго примера возьмем снова одномерную проблему: простой ротатор с неподвижной пространственной осью. Здесь полная энергия состоит только из кинетической, а именно: А((кр\2 2\dt) ' где А — момент инерции, а <р — угол вращения. Амплитудное уравнение получает вид: 1 &Ф , 8тг2£ А ^+^^ = °' и решениями будут: sin ф = cos Ыж2ЕА ,9 <Р
Лекция третья 133 Очевидно, ф должно быть периодическим в <р с периодом, равным 2-7Г, вследствие чего квадратный корень должен быть целым числом. Это дает собственные значения £» = Йт « = 0,1,2,3,... (48) в полном согласии со старой квантовой теорией. Попытаемся таким же формальным способом, как и раньше, вычислить интенсивность излучения. Если в обычной механике электрическая частица тесно связана с ротатором, находясь на расстоянии а от центра тяжести, то ее прямоугольные координаты будут: х\ г cos 1 у ) I sin I ip. Составим выражение: 27Г 27Г о о Так как произведение первых двух ^о" > функций всегда можно выразить суммой или разностью ^о" >(п ± k)tp, то, очевидно, восемь выражений, изображенных данной формулой, отличны от нуля только в том случае, если |n + fc| или \п — к\ ф 1. Это хорошо известное для ротатора правило отбора. Интересно еще раз рассмотреть ротатор без ограничения, что его ось неподвижна в определенном направлении. Для амплитудного уравнения находим: л , . 8тг2АЕ i n Ai?,¥>VH тъ—W = 0- Здесь A#;V, представляет ту часть элементарного Д-оператора (выраженного в полярных координатах), которая содержит дифференцирование только по углам # и <р. Как известно, настоящее уравнение имеет конечные и однозначные решения только в том случае, если ф является произведением двух последовательных целых чисел: 8тг2АЕ , , ,, h2 =п(п+1),
134 Четыре лекции по волновой механике а решением является поверхностная шаровая функция и-й степени [собственное значение Еп вырождено (2и+ 1) раз, ибо имеется (2и+ 1) независимых шаровых функций и-й степени]. Это дает собственные значения: = „(„ + !)* 8тг2Л v ; Последнее означает, в сущности, что п входит в классическую формулу (48) половинным числом. [Так как п(п + 1) = (п + - ) — -г, а общая постоянная, прибавленная ко всем Еп при образовании разности выпадает]. Как известно, рассмотрение полосатых спектров часто неизбежно приводило к применению «половинных» квантовых чисел. Все эти спектры, по-видимому, совместимы с новой формулой. [Само собой разумеется, что нужно применять формулу (49), а не (48), так как ось молекулы не может быть искусственно закреплена]. Правило отбора получается точно так же, как и раньше, но путем немного более сложных вычислений.
Лекция четвертая 12. Учет движения ядра водородного атома В первой лекции мы рассматривали атом водорода как задачу одного тела, предполагая ядро неподвижным в пространстве. Как известно, в обычной механике проблема двух тел с массами Мит распадается на две части, а именно, на: 1) прямолинейное движение центра тяжести (центра инерции), и 2) кеплерово движение тела с результирующей массой ц вокруг неподвижного центра, причем ц удовлетворяет соотношению: По теории Бора, эта поправка к уравнению для атома водорода количественно подтверждается небольшой разностью частот между линиями иона гелия и линиями водорода, которые точно совпали бы, если бы ядро имело бесконечно большую массу. (Иными словами, количественно получается разница между постоянными Ридберга для Не+ и Н, если учесть незначительное движение ядра. — Зоммерфельд.) Такое же положение вещей встречается и в волновой механике. Шестимерное амплитудное уравнение для проблемы двух тел гласит: ±А1ф+±А2ф + ^-(Е-У)ф = 0. (51) Под Дх и Дг разумеется элементарный оператор Лапласа в отношении координат электрона (х±, у±, z±) или ядра (жг, г/2; Z2). Относительно V следует предположить, что она зависит только от г, причем г = y/(xi - х2)2 + (j/i - г/г)2 + (zi - z2)2. Введем теперь на место х±, ... , z2 координаты центра тяжести (С: 4i С) и относительные координаты т относительно М (назовем их х, у, z). Тогда простое вычисление показывает, что
136 Четыре лекции по волновой механике Значение Д ясно, ц определяется уравнением (50). Подставим его в (51). Полученное уравнение распадается на два, если представить ф в виде произведения двух функций (скажем <р и %), каждая из которых соответственно зависит только от £, то ( и х, у, z. При разделении переменных появляется произвольная постоянная, которая в нижеследующих уравнениях обозначается через Е. Для <р получается: ^TMA^CV+^V + 0 (52) и для х- lAx,y,zX+^-(E-Et-V)X = 0. (53) Первое уравнение волномеханически описывает свободное движение центра тяжести. Постоянная Et соответствует его энергии поступательного движения и может принимать любое положительное значение. E — Et соответствует внутренней энергии. Второе уравнение точно представляет проблему одного тела для материальной точки массы //, движущейся в постоянном силовом поле V. Единственным отличием в собственных значениях, соответствующих внутренней энергии, является, следовательно, то, что в постоянную Ридберга входит ц вместо то. Таким образом, упомянутый выше важный результат Зоммерфельда опять достигается волновой механикой. Так как вывод этого результата очень прост, то в литературе на нем много не останавливались. Но это является одним из непосредственных подтверждений того, что существует доля истины в методе многомерных волн, каким бы неприятным на первый взгляд не казалось такое многомерное толкование. 13. Возмущение произвольной системы Теория возмущения любой системы не имеет существенных новых черт по сравнению с теорией возмущения атома с одним электроном, частный случай которого мы рассмотрели в § 7-9. Однако для ясности представим ее еще раз в сжатом виде. Общее волновое уравнение по § 10 можно написать в виде: ф=^(-^Аф + Уф). (54)
Лекция четвертая 137 Введем оператор h2 Н = --Q—A + V. 8тг2 (V в качестве оператора означает «умножение на У».) Тогда по уравнению (43) собственными функциями фи являются те же самые собственные функции и воспроизводятся до постоянного множителя применением к ним оператора Н. Эта постоянная равна соответственному собственному значению; следовательно: НШ = Екфк. (55) При этом уравнение (54) принимает простой вид: Ф = ™ЩФ]- (56) Приложение к V небольшого возмущения, независимо от того, содержит ли оно явно время или нет, означает небольшое изменение оператора Н. (Конечно, изменение Н можно получить и иным путем, например, изменением одной из масс и т. п. Этот общий случай можно включить в наше рассмотрение.) Обозначим возмущенный оператор через Н + Н', учтя при этом, что Н' должно быть «малым» оператором. Нам нужно, следовательно, решить уравнение: Ф=^(Н[ф]+НШ (57) Если ввести: ^ = Х^е2™**; "* = ^, (58) к где cj; — медленно изменяющиеся со временем функции, то получим: p2irivkt _ 2ni ~ h к к £>*е2™»* = Ш^сьН'Ше2™**. Это уравнение удовлетворяется, если оно ортогонально ко всем -ф^1 Умножая на ф\ и интегрируя по всему координатному пространству, 'Мы принимаем, что относительно полноты и ортогональности собственных функций общий случай ведет себя аналогично простому случаю с водородом. Так же, как и там, мы избегаем усложнения наших формул непрерывным спектром собственных значений.
138 Четыре лекции по волновой механике ci где имеем: ^ 5>*°'*e2,ri(,'*",")<> / = 1,2,3,..., (59) к alk = J' dqH'[il>k]il>, (60) и J dq — многократный интеграл по всему координатному пространству, аы — малые величины. Предположим, что возмущение консервативно; тогда аы постоянны. Так же, как и в рассмотренных частных случаях, заметное изменение с/ вызывают только экспоненциальные функции с исчезающими показателями. Предположим сперва, что система невырождена. Тогда, отбросив остальные члены, дающие только небольшие колебания, получим для каждого с/: с{ = Щ^сг, с, = С?е2™»*/Л, (61) что, будучи введено в (58), означает ничто иное, как небольшое изменение частоты — на величину ^. Рассмотрите теперь случай вырождения. Тогда одному собственному значению Е[ и частоте щ соответствуют амплитуды a, c/+i, ... , q+q,_i разных собственных функций, и в каждом из соответствующих уравнений получается не один, а а исчезающих экспонентов, являющихся причиной вековых изменений. Эти а амплитуд определяются следующим рядом уравнений: el+p = ~тР^2ci+xa'-P'i+x> р = °'1'2'--- (б2) А=0 Они показывают, что под влиянием незначительного возмущения обычно происходит обмен между амплитудами вырожденных колебаний, относящихся к одному и тому же собственному значению. Следует говорить об обмене, так как из уравнения (62) можно легко показать, что а-1 ^2(ci+p)2 = const. р=0 Однако, говоря об обмене, не нужно забывать, что ряд собственных функций Ф1+Р (р = 0, 1, ... , а - 1) является произвольным вплоть до ортогональной линейной подстановки с детерминантом 1. Последняя приводит к подобной замене амплитуд с/. Если задано определенное возмущение, т.е. определенные
Лекция четвертая 139 значения щ+\^+р, то всегда возможно найти по меньшей мере одну ортогональную подстановку xj)i+p, приводящую уравнение (62) к простому виду невырожденного случая (61). Тогда эти специальные собственные функции, выбранные так, чтобы соответствовать особой форме возмущения, имеют под влиянием возмущения постоянные квадраты амплитуд, но в общем соответствуют различным собственным частотам, а-кратное собственное значение расщеплено на а несколько отличных друг от друга собственных значений. Вырождение уничтожено полем возмущения; специально выбранные собственные функции вырожденной проблемы являются невырожденными функциями «нулевого приближения» для отдельных собственных значений возмущенной проблемы. Можно показать, что небольшие изменения в собственных значениях являются а-корнями векового уравнения: ЯП — X Щ,1+1 ■ • ■ Щ,1+а Щ+1,1 Щ+1,1+1 — X ••• Щ+1,1+а _ г. Щ+а,1 Щ+а,1+1 ••• dl-a,l+a — X Может случиться, что не все эти корни между собой различны; тогда вырождение уничтожено не полностью. Следовательно, утверждение о том, что в произвольно выбранном ряду все вырожденные функции колеблются с невозмущенной частотой, но меняют свои амплитуды, или что соответственно выбранный ряд имеет постоянные амплитуды, но каждая функция обладает несколько отличной частотой — это, естественно, одно и то же. Это можно понимать так: либо колебание с переменной амплитудой имеет в действительности не ту частоту, которую мы ему приписываем, либо две или более малоотличные между собой частоты при наложении приводят к явлению «биения», т. е. к переменной амплитуде. 14. Взаимодействие между двумя произвольными системами Рассмотрим теперь, сперва без взаимодействия, две произвольные системы, каждая из которых описывается волномеханически [см. уравнение (56)].
140 Четыре лекции по волновой механике Умножая первое уравнение на <р, а второе на ф и складывая их почленно, получим: так как оператор Н не действует на <р, a L не действует на ф. Последнее выражение является волновым уравнением «комбинированной» системы, образованной мысленным соединением обеих систем. (Этот процесс обратен тому, который так часто делают при разделении уравнения, допуская, что решением является произведение двух функций, зависящих от различных частей системы.) Собственными функциями комбинированной системы являются произведения каждой из собственных функций системы на каждую собственную функцию второй системы. Легко видеть, что собственное значение такого произведения и системы равно сумме собственных значений отдельных уравнений. (Это отвечает в обычной механике факту аддитивности энергии.) Сложение собственных значений мо- F 1 жет вызвать новое вырождение комбиниро- Е г ванной системы даже в том случае, если отдельные системы не были вырождены (последнее мы предположим для простоты). pt \ Пусть теперь Е и Е' — два соб- pi \ ственных значения первой системы, a F и F' — собственные значения второй сис- Рис. 3 темы, имеющие то свойство, что E + F = E' + F' = G или Е-Е' = F - F'. Следовательно, если в обеих системах существует такая одинаковая разность собственных значений, это ведет к дважды вырожденному собственному значению G комбинированной системы. Предположим, для простоты, что другие соотношения подобного рода отсутствуют и имеется слабое взаимодействие обеих систем, которое оператор H + L превратит в Н + L + J, где J, конечно, содержит переменные первой и второй системы. Тогда амплитуды, соответствующие Е + F' и Е' + F проявят медленный «вековой» обмен, тогда как остальные останутся в основном постоянными. Сумма квадратов обеих рассматриваемых амплитуд тоже постоянна.
Лекция четвертая 141 В отношении отдельных систем это может означать лишь то, что амплитуда F возрастает за счет амплитуды F', и, так сказать, для компенсации этого амплитуда Е' увеличивается за счет Е. Это кажется подходящим волномеханическим описанием того, что в старой форме квантовой теории называлось перенесением кванта энергии Е — Е' = (F — F') от одной системы к другой. 15. Физическое значение обобщенной ^-функции Полному выяснению изложенного мешает, вероятно, то обстоятельство, что мы избегали до сих пор делать какое-либо определенное предположение о физическом значении функции ф{д\, дг, ••• , <?», t), принадлежащей к системе, описываемой в обычной механике обобщенными координатами gi, ... , qn. Эта интерпретация представляет, действительно, щепетильный вопрос. «Размазывание» заряда электрона соответственно функции фф, приведшее в проблеме одного электрона к удовлетворительным результатам (см. §5), позволяет, в случае любой механической системы сделать следующее естественное обобщение: действительно, существующая в природе система не ведет себя так, как классическое механическое изображение (например, не так, как система материальных точек в определенной конфигурации), но скорее как образ этой системы, который получится, если распространить («размазать») классическую систему, описанную через gi, дг, • • • , ди, на все ее координатное пространство, причем фф снова будет функцией плотности или весовой функцией. Это означало бы, если вообще воспользоваться классической картиной, что поведение действительной системы описывается классической механической картиной, которая мыслится одновременно существующей во всех вообще возможных конфигурациях, однако в одних «сильнее», в других «слабее». Этого объяснения я некоторое время придерживался. Что оно может быть полезным, видно из проблемы одного электрона (см. § 5). Никакая иная интерпретация ^-функции не способна дать понять нам, почему постоянные aui дают такое полное объяснение интенсивности и поляризации излучения. Несмотря на это, такое понимание не вполне удовлетворительно. Ибо, что означает в предыдущем предложении выражение «вести себя»? «Поведение» ^-функции, т. е. зависимость от времени t, никоим образом не определяется законами классической механики, а только волновым уравнением.
142 Четыре лекции по волновой механике Была предложена близкая к истине статистическая интерпретация функции ф, а именно, что ф распространяется не на отдельную систему, а на сумму систем, определяя ту часть из них, которая в данном случае находится в определенной конфигурации1. 1 Статистическое понимание функции ф считается в настоящее время общепризнанным, но оно несколько сложнее, чем в краткой формулировке автора. (Ред.)
ФУНДАМЕНТАЛЬНАЯ ИДЕЯ ВОЛНОВОЙ МЕХАНИКИ1 Нобелевская лекция, 12 декабря 1933 г. Когда луч света проходит через оптический прибор, например трубу или фотографический объектив, он испытывает на каждой преломляющей или отражающей поверхности изменение направления. Мы можем построить ход луча, если известны оба простых закона, которые управляют этими изменениями направления: закон преломления, открытый двести лет назад Снеллиусом, и закон отражения, известный уже больше чем две тысячи лет назад Архимеду. На рис. 1 показан простой пример луча А — В, который испытывает преломление, подчиняющееся закону Снеллиуса на каждой из четырех граничных поверхностей двух линз. Рис. 1 Ферма сформулировал закон распространения луча света с гораздо более общей точки зрения. Свет распространяется в различных средах с различной скоростью, и путь луча определяется так, как будто бы лучу было важно возможно быстрее достигнуть той точки, в которую он приходит. (Заметим при этом, что за начальную и конечную точки можно взять любые две точки вдоль луча.) Малейшее отклонение от действительного пути означало бы замедление. В этом заключается знаменитый принцип кратчайшего оптического пути Ферма, замечательным образом определяющий всю судьбу светового луча в одном единственном положении, даже и в том случае, если свойства среды 1 Перевод с английского Д.Иваненко.
144 Фундаментальная идея волновой механики Рис. 2 изменяются не скачком на какой-либо поверхности, а постепенно, от точки к точке. Примером последнего является земная атмосфера. Чем глубже проникает в нее падающий извне луч света, тем медленнее распространяется он во все более и более плотном воздухе; хотя разница в скорости распространения и будет чрезвычайно незначительной, принцип Ферма все же требует при этом, чтобы путь луча света был вогнутым по отношению к земле (см. рис. 2), ибо тогда луч несколько дольше будет задерживаться в высших, «более быстрых» слоях и придет к цели скорее, чем на более коротком прямом пути (на рисунке нанесен пунктиром; небольшой четырехугольник WWWW пока не играет роли). Я думаю, вы все замечали, что солнце, находясь у горизонта, кажется не круглым, а сплющенным, так что его вертикальный диаметр представляется укороченным. Это также следствие искривления лучей. Согласно волновой теории света лучи имеют, собственно говоря, только фиктивное значение. Они не являются физическими траекториями каких бы то ни было световых частиц, но лишь математическим вспомогательным построением, так называемыми ортогональными траекториями волновых поверхностей, т. е. также воображаемыми линиями; последние направлены в каждой точке перпендикулярно волновой поверхности в ту сторону, в которую двигается последняя (см. рис. 3, на котором изображен простейший случай концентрических шаровых волновых поверхностей, и, следовательно, прямых лучей, тогда как рис. 4 разъясняет случай криволинейных лучей). Представляется удивительным, что столь важный всеобщий принцип относится непосредственно к этим математическим вспомогательным линиям,
Фундаментальная идея волновой механики 145 Рис. 3. Рис. 4. а не к волновым поверхностям, в виду чего принцип Ферма можно было бы рассматривать как некоторый математический курьез. На самом деле все обстоит совершенно иначе. Только с точки зрения волновой теории принцип Ферма становится вполне понятным и перестает быть чудом. Действительно, с волновой точки зрения так называемая кривизна луча света является гораздо более понятной, чем поворот волновой поверхности, который тривиальным образом должен иметь место, если соседние части волновой поверхности распространяются с различной скоростью; точно также, например, если рота солдат выполняет команду «захождения направо», то солдаты делают шаги различной величины: правофланговый — наименьший, левофланговый — наибольший шаг. В нашем примере с преломлением луча в земной атмосфере (рис. 2) кусочек волновой поверхности WW должен обязательно проделать поворот направо к WW', так как его левая часть лежит в более высоком слое менее плотного воздуха и поэтому движется быстрее, чем правая часть, лежащая ниже1. При ближайшем рассмотрении оказывается, что принцип Ферма по своему содержанию совершенно эквивалентен тривиальному и само собой разумеющемуся утверждению, что при заданной переменной от точки к точке скорости света фронт волны должен загибаться указанным образом. Я не имею возможности доказывать это здесь, но попытаюсь сделать указанное утверждение правдоподобным. Вернемся 1Укажем, кстати, здесь на случай, для которого представление Снеллиуса оказывается неприменимым. Направленный горизонтально луч света, казалось, должен был бы оставаться горизонтальным, ибо ведь в горизонтальном направлении показатель преломления не меняется. В действительности же горизонтальный луч искривляется больше всякого другого, что непосредственно видно из представления о загибающемся волновом фронте.
146 Фундаментальная идея волновой механики опять к примеру марширующего отряда солдат. Пусть для того, чтобы сохранить полную правильность фронта, солдаты соединены длинной палкой, которую каждый твердо держит в руках. Сейчас ничего не будет говориться о захождении, команда гласит просто: «пусть каждый идет или бежит как можно быстрее». Если характер рельефа почвы медленно меняется от точки к точке, то сначала, скажем, правое, затем левое крыло фронта будет двигаться быстрее, и сами собой будут осуществляться повороты фронта. Через некоторое время мы заметим, что пройденный путь не является прямолинейным, а был как-то искривлен. Тот факт, что этот криволинейный путь в точности совпадает с кратчайшим в смысле времени прибытия в данный пункт при заданном рельефе, является по меньшей мере весьма правдоподобным, так как каждый солдат старался двигаться как можно быстрее. Отметим также, что поворот фронта всегда происходит в том направлении, в котором рельеф становится более тяжелым, поэтому в конце концов все выглядит так, как будто солдаты нарочно «обошли кругом» то место, где они должны были бы двигаться медленнее. Таким образом, принцип Ферма представляется просто тривиальной квинтэссенцией волновой теории. Поэтому совершенно удивительным показалось открытие, сделанное в один прекрасный день Гамильтоном, что и действительное движение материальных точек в силовом поле (например, планет вокруг Солнца или брошенного камня в поле тяжести Земли) подчиняется совершенно такому же общему принципу, получившему имя своего автора и сделавшему последнего знаменитым. Хотя принцип Гамильтона и не говорит совсем точно, что материальная точка выбирает наиболее быстрый путь, но его утверждение столь близко, аналогия с принципом кратчайшего оптического пути столь непосредственна, что является загадочной. Казалось, что природа как будто осуществила одну и ту же закономерность двумя различными способами. Один раз, в случае света, при помощи довольно ясной игры волн, другой раз, в случае материальных точек, где положение вещей было непонятно, если только не стараться и здесь также говорить о волновой природе. Последнее предположение казалось сперва совершенно исключенным, ибо «материальные точки», на которых были подтверждены законы механики, в то время были просто большими видимыми телами, частью очень большими, например, планетами, и говорить о чем-то вроде их «волновой природы» вовсе не представлялось возможным.
Фундаментальная идея волновой механики 147 Мельчайшие последние частицы материи, которые мы сейчас с гораздо большим правом называем «материальными точками», казались тогда еще чем-то совершенно гипотетическим. Только после открытия радиоактивности развитие экспериментальной техники привело к тому, что оказалось возможным изучать свойства отдельных корпускул или частиц; в настоящее время возможно даже остроумным способом Вильсона фотографировать и (при помощи стереофотографии) весьма точно измерять пути отдельных частиц. В пределах точности этих измерений для движения корпускул подтверждаются те же механические законы, что и для больших тел, планет и т. д. Впрочем, выяснилось, что, конечно, ни молекула, ни отдельный атом не могут считаться «последними камнями» материи, но что и атом является весьма сложной системой. В нашем представлении возникли картины строения атомов из частиц, по-видимому, аналогичные картине планетной системы. Вполне естественно было попытаться сперва сохранить здесь те же законы движения, которые столь замечательно оправдались для больших тел. Это значит, что к внутреннему поведению атома также была применена механика Гамильтона, которая, как я указал выше, формулируется в гамильтоновом принципе. То обстоятельство, что этот принцип весьма аналогичен оптическому принципу Ферма, было почти совсем забыто. Если об этом и вспоминали, то усматривали здесь только забавную случайность математической теории. Весьма трудно, не вдаваясь в детали, составить правильное представление о том, насколько успешно или неуспешно было применение этой классически-механической картины к атому. С одной стороны, принцип Гамильтона оказался надежнейшим и лучшим проводником, без которого просто нельзя было обойтись; с другой стороны, для правильного описания опытных фактов необходимо было допустить вмешательство совершенно новых, непонятных требований, так называемых квантовых условий и квантовых постулатов. Они звучали как грубые диссонансы в симфонии классической механики и все же странным образом казались созвучными ей. Математически можно выразить это положение вещей следующим образом: в то время как принцип Гамильтона требует только, чтобы некоторый интеграл был минимумом, но не определяет значений этого минимума, квантовые условия ограничивают значение минимума целыми кратными универсальной мировой постоянной, именно план- ковской постоянной действия. Но это только побочное замечание. По-
148 Фундаментальная идея волновой механики ложение вещей было довольно безнадежным. Если бы старая механика была совсем отброшена, дело не обстояло бы еще столь скверно, у нас были бы открыты возможности для создания новой механики. Мы же стояли перед трудной задачей спасти сущность механики, чье дыхание ясно чувствовалось в микрокосме, и в то же время, так сказать, выпросить у нее признания квантовых условий в качестве вытекающих из ее оснований положений, а не грубых внешних требований. Выход был найден в упоминавшейся уже возможности усмотреть в принципе Гамильтона такой же результат игры волн, который собственно и лежит в основе движения материальных точек, точно так же, как мы уже давно привыкли видеть волны в явлениях света с их принципом Ферма. Отдельная траектория материальной точки теряет, впрочем, вследствие этого свой непосредственный физический смысл и становится чем-то фиктивным, вроде отдельного изолированного луча света. Но сущность теории, минимальный принцип, не только остается незатронутым, но лишь при волновом способе рассмотрения раскрывает свое истинное простое значение, как уже указывалось выше. Новая теория, собственно говоря, вовсе не является новой; она представляет собой органическое продолжение, хотелось бы сказать, более тонкое толкование старой теории. Но каким же образом могло привести это новое, более «тонкое» толкование к заметно иным результатам, как смогло оно устранить трудности, встретившиеся в атоме, с которыми старая теория не могла справиться? Каким образом прежнее «грубое вмешательство» квантовых условий стало терпимым или даже оказалось связанным с развитием новых идей? Эти вопросы лучше всего разъяснить также путем оптической аналогии. Я назвал выше с полным правом принцип Ферма квинтэссенцией волновой теории света. Несмотря на это, он не может избавить нас от более точного изучения самого волнового процесса. Так называемые явления дифракции и интерференции можно понять, только проследив в деталях движение волн, так как при этом речь идет не только о том, куда в конце концов придет волна, но также о том, в какой фазе придет она туда в данный момент времени. При старых, более грубых экспериментах эти явления играли роль только незначительных деталей и ускользали от наблюдения. Как только, однако, на них было обращено внимание и они были правильно, волновым образом, истолкованы, оказалось нетрудным придумать опыты, в которых волновая природа
Фундаментальная идея волновой механики 149 Рис. 5 света проявляется не только в деталях, но совсем ясно во всем характере явления. Позвольте мне разъяснить это на двух примерах таких оптических инструментов, как телескоп, микроскоп и т.д. Мы хотим получить при помощи последних резкое изображение, т. е. стремимся заставить сойтись в одной точке, так называемом фокусе, все лучи, исходящие из некоторой точки рассматриваемого объекта (см. рис. 5). Сначала казалось, что здесь имеются только трудности геометрической оптики, впрочем, достаточно серьезные. Позднее выяснилось, однако, что даже у лучше сконструированных оптических приборов соединение лучей гораздо хуже, чем следовало ожидать, принимая, что каждый луч, независимо от соседних, точно следует принципу Ферма. Свет, исходящий из некоторой точки объекта и воспринимаемый оптическим прибором, не соединяется позади последнего опять в одну точку, но распространяется на маленькой, так называемой дифракционной, окружности, которая, впрочем, оказывается в большинстве случаев кругом лишь потому, что края линз и экранов являются окружностями. Причиной этого явления, называемого дифракцией, является то, что не все шаровые волны, исходящие из данной точки, могут быть восприняты прибором. Края линз или экраны выделяют только часть волновых поверхностей (см. рис. 6), и, если позволено будет употребить наглядное выражение, пораженные части волн противятся строгому соединению в одной точке и порождают несколько размазанную или размытую картину. Размазанность самым тесным образом связана с длиной волны света и, ввиду этой глубокой теоретической причины, является совершенно неизбежной. Вначале едва отмеченная, эта принципиальная размазанность ограничивает разрешающую силу современного микроскопа, столь успешно поборовшего все остальные трудности, стоявшие на пути к идеальному изображению. От объектов, которые не
150 Фундаментальная идея волновой механики Рис. 6 превосходят размерами длину волны или даже являются более тонкими, мы получаем изображения, имеющие отдаленное сходство с оригиналом или даже вовсе ему не соответствующие. Вторым, еще более простым примером является тень, которую дает небольшой точечный источник света от непрозрачного предмета. Чтобы построить форму тени, мы должны проследить каждый луч света и посмотреть, не мешает ли ему непрозрачное тело достичь экрана. Край тени образуется теми лучами света, которые, проходя мимо, еще касаются края предмета. Из опыта известно, что край тени даже при точечном источнике света и совершенно резкой границе предмета, дающего тень, в действительности не будет резким. Причина этого совершенно та же, что и в прежнем случае. Фронт волны, так сказать, разрезается предметом (см. рис. 7), что приводит к образованию нерезкого края тени, который был бы непонятен, если бы отдельные лучи света являлись самостоятельными и распространялись независимо друг от друга. Рис. 7
Фундаментальная идея волновой механики 151 Это явление, которое также называется дифракцией, у больших тел вообще не слишком ярко выражено. Но если тело, дающее тень, имеет незначительные размеры, хотя бы в одном направлении, то дифракция будет проявляться тогда, прежде всего, в том, что собственно тень вообще не будет наблюдаться, во-вторых же, и значительно ярче, в том, что этот небольшой предмет сам окажется светящимся и испускающим свет по всем направлениям (впрочем, преимущественно под малыми углами к падающему свету). Конечно, каждый из вас наблюдал так называемую «солнечную пыль» на пути луча света, проникающего в темную комнату. Небольшие стебли травы и паутинные нити на вершине холма, за которым прячется солнце, или волосы человека, стоящего против солнца, светятся часто замечательно красиво в дифрагированном свете, на чем покоится также возможность видеть дым и туман. Дело идет, собственно, не о самом теле, но о небольшой области в его непосредственной близости, в которой тело вызывает значительное возмущение падающего волнового фронта. Интересно и важно для дальнейшего отметить, что область возмущения всегда в каждом направлении имеет размеры одной или немногих длин волн, как бы ни был мал возмущающий предмет. Таким образом, здесь мы опять встречаем тесную связь явлений дифракции с длиной волны. Последнее будет, пожалуй, наиболее ясным образом иллюстрировано путем сравнения с другим волновым процессом, именно звуком. Благодаря значительно большей длине волны, измеряемой здесь сантиметрами и метрами, образование тени в случае звука отступает на задний план, а дифракция играет большую и также практически важную роль; действительно, мы можем хорошо слышать человека, стоящего за высокой стеной или за углом большого дома, даже если мы его не можем видеть. Возвратимся опять от оптики к механике и постараемся полностью использовать аналогию между ними. Старой механике в оптике соответствует мысленное оперирование с изолированными, независимыми друг от друга световыми лучами. Новой волновой механике соответствует волновая теория света. Переходя от старого к новому представлению, мы выигрываем в возможности учитывать явление дифракции или, лучше сказать, нечто весьма аналогичное явлению дифракции света; эти явления в механике, как и в оптике, говоря вообще, не должны играть особой роли; в противном случае старое представление механики не могло бы столь долгое время нас удовлетворять. Но не трудно догадаться, что в известных случаях явление дифракции, которым
152 Фундаментальная идея волновой механики пренебрегали, должно быть весьма заметным, целиком управляющим механическим процессом и представляющим для старой теории неразрешимую трудность; это будет иметь место тогда, когда вся механическая система по своим размерам сравнима с длиной «материальных волн», играющих для механических процессов ту же роль, какую световые волны для процессов оптических. Дифракция является причиной того, почему в этих крошечных системах атомов старое представление оказалось непригодным; оно остается применимым с большой точностью к грубым механическим процессам, но уже не в тонкой игре в областях порядка одной или немногих длин волн. Чрезвычайной неожиданностью было открытие, что здесь при новом волновом представлении сами собой исчезают все те странные добавочные требования, которые были насильно втиснуты в старую теорию, чтобы приспособить последнюю к описанию атома и суметь как-нибудь понять его реальное поведение. Мы видим, существенным пунктом является то обстоятельство, что размеры атома и длины гипотетических волн материи являются величинами примерно одного порядка. Вы, конечно, спросите, является ли чистой случайностью, что при нашем исследовании строения материи мы как раз в этом месте сталкиваемся с величиной порядка длины волны. Вы спросите затем, откуда вообще известно об этих длинах волн материи, представляющих совершенно новый инструмент теории, никогда и нигде прежде не наблюдавшийся. Может быть, мы просто должны сделать это предположение? Конечно, это совпадение размеров отнюдь не является простым случаем, и нам не нужно делать никакого нового предположения. Размеры длин волн получаются сами собой из теории, а величина их приводит к следующему замечательному факту. Опыты Резерфорда и Чадви- ка над рассеянием альфа-лучей, можно сказать, доказали, что тяжелое ядро атома значительно меньше самого атома и может поэтому рассматриваться в дальнейшем как точечный центр притяжения. Вместо электронов мы вводим гипотетические волны, оставляя их длину волн пока что совершенно неопределенной, ибо мы о ней ничего не знаем. Тогда в наших вычислениях будет стоять некоторая буква, например а, обозначающая какое-то еще неизвестное число. К этому мы уже привыкли, и ничто не мешает нам вычислить, что атомное ядро должно вызвать дифракцию этих волн, аналогично небольшой пылинке в случае света. Также, как там, мы получим, что размеры области возмущения,
Фундаментальная идея волновой механики 153 окружающей ядро, тесно связаны с величиной длины волны и будут одного порядка с последней. Теперь мы должны проделать решающий шаг: мы отождествляем область возмущения, или арену дифракции, с атомом; мы утверждаем, что атом в действительности является ничем иным, как дифракционным явлением электронных волн, так сказать, пойманных атомным ядром. Тот факт, что величина атома и длина волны будут одного порядка, не является уже больше случайностью, но представляется очевидным. Однако мы не знаем еще значений ни той, ни другой величины, так как в наших расчетах все еще стоит одна неопределенная постоянная, которую мы назвали через а. У нас имеются две возможности, взаимно контролирующие друг друга, для определения этой неизвестной. Во-первых, мы можем выбрать ее так, чтобы внешние проявления атома и, прежде всего, испускаемые им спектральные линии, как известно, измеренные весьма точно, получались бы в количественном согласии с опытом. Во-вторых, можно выбрать неизвестную величину так, чтобы арена дифракции оказалась совпадающей с размерами атома. Оба эти определения (из которых второе, впрочем, будет гораздо менее точным в виду неясности понятия «величина атома») вполне согласуются друг с другом. Мы можем, наконец, заметить, что неопределенная постоянная физически имеет на самом деле размерность не длины, но величины действия, т. е. энергии, умноженной на время. В таком случае весьма естественно взять для нее значение универсальной постоянной кванта действия Планка, хорошо известное из законов теплового излучения. Оказывается, что при всей возможной в настоящее время точности мы возвращаемся к первому (наиболее точному) определению. Таким образом, теория обходится с минимумом новых предположений. В ней содержится единственная произвольная постоянная, которой мы должны придать численное значение, хорошо известное из старой квантовой теории; таким путем мы получаем, во-первых, правильную величину дифракционной площадки, которую мы можем разумным образом отождествить с атомом, и можем, во-вторых, количественно правильно вычислить все проявления атома — испущенный им свет, работу ионизации и т. д. Я попытался здесь развить перед вами основную идею волновой теории материи в возможно более простой форме. Разрешите мне сознаться теперь, что, стремясь достичь возможной простоты, я несколько приукрасил положение вещей. Это не относится к полноте, с ко-
154 Фундаментальная идея волновой механики Рис. 8 торой были подтверждены экспериментом все достаточно осторожно сделанные выводы теории; но речь идет о принципиальной легкости и простоте, с которой все эти следствия были получены. Я не имею здесь в виду трудности математические, всегда в конце концов тривиальные, на именно трудности основных принципов. Конечно, легко заявить, что мы должны перейти от представления траектории к системе волновых поверхностей, перпендикулярных к ней. Но эти волновые поверхности, даже если мы будем рассматривать их небольшой участок (см. рис. 8), охватывают все же некоторый узкий пучок возможных траекторий и находятся со всеми ними в одинаковом соотношении. Согласно старому представлению одна из этих траекторий выделяется в каждом конкретном случае как «действительная» из всех остальных «просто возможных». В новой теории дело обстоит иначе. Мы сталкиваемся здесь со всей глубиной логической противоположности между случаем: «или — или» (механика точки) и случаем «и — и» (волновая механика). Дело не обстояло бы так плохо, если бы мы должны были вовсе оставить старую теорию и заменить ее новой. К сожалению, речь идет не об этом. С точки зрения волновой механики бесконечное множество возможных траекторий точки является чем-то фиктивным, ни одна из них не имеет преимущества быть реально осуществленной в каком- либо конкретном случае, но, как я уже упоминал выше, мы во многих опытах действительно наблюдаем пути отдельных частиц. Волновое представление может это объяснить только с большим трудом или вообще не в состоянии дать на это ответ. Нам дьявольски трудно объявить эти следы траекторий, которые мы видим, только узкими пучками равноправных возможных путей, которые связаны друг с другом волновыми поверхностями. Однако эти связи необходимы, чтобы понять явление дифракции и интерференции, которые можно наглядно продемонстрировать на той же частице с такой же отчетливостью, а не только заключить о них на основании теоретических представлений об атоме, о чем была речь выше. Хотя дело и обстоит таким образом, что мы в каждом конкретном частном случае можем отве-
Фундаментальная идея волновой механики 155 тить на вопрос, не впадая в противоречие с какой-либо из двух точек зрения, но мы не можем более оперировать с такими приятными и как будто необходимыми понятиями, как «действительный», или «только возможный»; никогда нельзя сказать, что в действительности имеет место или в действительности происходит, но лишь указать, что будет наблюдаться в данном частном случае. Должны ли мы навсегда удовлетвориться подобным положением вещей? Принципиально, конечно, да. Принципиальное требование, что точная наука в конце концов должна стремиться к описанию действительно наблюдаемого, вовсе не является новым. Вопросом является лишь то, должны ли мы будем отныне отказаться связывать это описание с какой-либо ясной гипотезой о том, как в действительности устроен мир. Многие хотят уже сегодня заявить об этом отказе. Но мне кажется, что тем самым мы несколько уклоняемся от трудностей. Я охарактеризовал бы современное состояние наших знаний следующим образом. Луч или траектория частицы отвечает продольной связи процесса распространения (т.е. в направлении распространения), волновая же поверхность соответствует поперечной связи, т. е. перпендикулярно направлению. Оба способа связи, без сомнения, являются реальными: один доказывается фотографиями Вильсона, другой — интерференционными опытами. Охватить их единой картиной нам до сих пор еще не удалось. Только в крайних случаях перевешивает поперечная, слоистая, или же, наоборот, лучевая, продольная, связь настолько, что мы надеемся обойтись при помощи одной волновой или одной корпускулярной картины.