Предисловие редактора перевода
СТРУКТУРА ПРОСТРАНСТВА-ВРЕМЕНИ
ЧАСТЬ I. МНОГООБРАЗИЕ БЕЗ СВЯЗНОСТИ
Глава 2. Интегралы. Плотности. Производные
Производные
ЧАСТЬ II. МНОГООБРАЗИЕ С АФФИННОЙ СВЯЗНОСТЬЮ
Глава 4. Некоторые соотношения между обычными и инвариантными производными
Глава 5. Понятие параллельного переноса
Глава 6. Тензор кривизны
Тензор кривизны
Глава 7. Геодезические в многообразиях с аффинной связностью
Глава 8. Общие геометрические гипотезы относительно тяготения
Закон тяготения
ЧАСТЬ III. МНОГООБРАЗИЕ С МЕТРИЧЕСКОЙ СВЯЗНОСТЬЮ
Некоторые важные факты и соотношения
Геодезические координаты
Глава 10. Смысл   метрики с точки зрения специальной теории относительности
Глава 11. Законы сохранения и вариационные принципы
Законы сохранения в общей теории относительности
Вариационный принцип Эйнштейна
Неинвариантная форма законов сохранения
Глава 12. Обобщения теории Эйнштейна
Теория Эйнштейна-Штрауса
Чисто аффинная теория
Обсуждение теорий, изложенных до сих пор
Математическое приложение к главе 12
РАСШИРЯЮЩИЕСЯ ВСЕЛЕННЫЕ
Глава I. Вселенная де Ситтера
§ 2. Упрощенная модель. Геодезические
§ 3. Эллиптическая интерпретация
§ 4. Статическая система отсчета
§ 5. Определение параллаксов
§ 6. Система отсчета Леметра-Робертсона
Глава II. Теория геодезических
§ 8. Свободные частицы и световые лучи в расширяющихся пространствах общего типа, плоских или гиперсферических
Глава III. Волны в римановом пространстве—времени общего вида
§ 10. Теория Гамильтона-Якоби в гравитационном поле
§ 11. Нахождение приближенных решений уравнения Гамильтона-Якоби из волновой теории
Глава IV. Волны в расширяющейся вселенной
§ 13. Собственные колебания и волновые пакеты
Список литературы
Text
                    Э. ШРЕДИНГЕР
ПРОСТРАНСТВЕННО-
ВРЕМЕННАЯ
СТРУКТУРА
ВСЕЛЕННОЙ
Перевод с английского
А.В. РАДЮШКИНА
Под редакцией
Р.А. АСАНОВА
МОСКВА "НАУКА"
ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ
ЛИТЕРАТУРЫ
1 986


ББК 22.313 Ш85 УДК 530.12 Space-time structure by Ervin Schrodinger Cambridge at the University Press 1950 Expanding Universes by Ervin SchroMinger Cambridge at the University Press 1956 Шрединтер Э. Пространственно-временная структура Вселенной: Пер. с англ./Под ред. Р.А. Асанова. - М.: Наука. Гл. ред. физ.-мат. лит., 1986. - 224 с. Данная книга представляет собой перевод двух известных книг -курсов лекций одного из крупнейших физиков XXвека Э. Шредингера (1887-1961) - "Структура пространства-времени" (1950 г.) и "Расширяющиеся вселенные" (1956 г.). Ранее эти книги на русский язык не переводились. Содержит краткий очерк аксиоматического построения римановой геометрии четырехмерного пространства-времени. В дополнение к традиционному материалу детально рассматриваются: законы сохранения в общей теории относительности, обобщения этой теории на случаи несимметричной связности и метрики и т.д. Приведены решения де Ситтера космологических уравнений Эйнштейна. С большим изяществом рассмотрены геометрия и физика вселенных де Ситтера. Для научных работников, аспирантов и студентов, специализирующихся в области теоретической физики а астрофизики. Ил. 17. Библиогр. 13 назв. Ш 1704020000-137 053 (02)-86 103-86 Издательство "Наука". Главная редакция физико-математической литературы, Перевод на русский язык, 1986
ОГЛАВЛЕНИЕ Предисловие редактора перевода 8 СТРУКТУРА ПРОСТРАНСТВА-ВРЕМЕНИ Введение 10 ЧАСТЬ I МНОГООБРАЗИЕ БЕЗ СВЯЗНОСТИ Глава 1 Инвариантность; векторы и тензоры 13 Глава 2 Интегралы. Плотности. Производные 23 Интегралы. Плотности 23 Производные 31 ЧАСТЬ II МНОГООБРАЗИЕ С АФФИННОЙ СВЯЗНОСТЬЮ Глава 3 Инвариантные производные 37 Глава 4 Некоторые соотношения между обычными и инвариантными производными . 44 Глава 5 Понятие параллельного переноса 49 Глава 6 Тензор кривизны 52 Проблема интегрируемости 52 Тензор кривизны 57 5
Глава 7 Геодезические в многообразиях с аффинной связностью 62 Глава 8 Общие геометрические гипотезы относительно тяготения 65 Основополагающая идея 65 Закон тяготения 68 ЧАСТЬ III МНОГООБРАЗИЕ С МЕТРИЧЕСКОЙ СВЯЗНОСТЬЮ Глава 9 Метрические аффинные связности 72 Общее исследование 72 Некоторые важные факты и соотношения 79 Геодезические координаты 82 Глава 10 Смысл метрики с точки зрения специальной теории относительности 84 Глава 11 Законы сохранения и вариационные принципы 97 Элементарное понятие о законах сохранения 97 Каким образом законы сохранения следуют из вариационного принципа в классических (дорелятивистских) теориях 101 Законы сохранения в общей теории относительности 104 Вариационный принцип Эйнштейна 108 Неинвариантная форма законов сохранения 111 Глава 12 Обобщения теории Эйнштейна 118 Другой вывод эйнштейновых полевых уравнений 118 Теория Эйнштейна-Штрауса 120 Чисто аффинная теория 124 Обсуждение теорий, изложенных до сих пор 128 Математическое приложение к главе 12 129 РАСШИРЯЮЩИЕСЯ ВСЕЛЕННЫЕ Предисловие 134 Глава I Вселенная де Ситтера 136 § 1. Синтетическое построение 136 § 2. Упрощенная модель. Геодезические 138 6
§ 3. Эллиптическая интерпретация . 142 § 4. Статическая система отсчета 149 § 5. Определение параллаксов 156 § 6. Система отсчета Леметра-Робертсона 162 Глава II Теория геодезических 174 § 7. О нулевых геодезических 174 а) Нахождение параметра для нулевых геодезических в частных случаях (177). б) Сдвиг частоты (180). § 8. Свободные частицы и световые лучи в расширяющихся пространствах общего типа, плоских или гиперсферических 186 а) Плоские пространства (186). 15) Сферические пространства (189). в) Красное смещение для сферических пространств (194). Глава III Волны в римановом пространстве—времени общего вида 196 § 9. Суть нашего приближения 196 § 10. Теория Гамильтона-Якоби в гравитационном поле 197 §11. Нахождение приближенных решений уравнения Гамильтона- Якоби из волновой теории 201 Глава IV Волны в расширяющейся вселенной 206 §12. Общие соображения 206 §13. Собственные колебания и волновые пакеты 209 Список литературы 223
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Предлагаемая книга является переводом двух книг - курсов лекций, прочитанных Э. Шредингером, выдающимся австрийским физиком, одним из создателей квантовой механики. Э. Шредингер, будучи современником возникновения общей теории относительности, глубоко понимал ее смысл и значение. Он был автором одной из первых и важнейших статей о понятии энергии и эйнштейнова псевдотензора энергии-импульса в ОТО (1918 г.). Первая из книг - "Структура пространства—времени" (1950 г.) - посвящена в основном построению аппарата римановой геометрии с целью приложения его к физике. Риманова метрическая геометрия строится аксиоматически введением сначала понятия континуума с группой произвольных преобразований, затем - понятия многообразия и, наконец, пространства аффинной связности. Значительное внимание уделено несимметричной аффинной связности и обобщениям на этой основе ОТО (теории Эйнштейна-Штрауса 1946 г. и Вейля 1918 г.). Подробно рассмотрен вывод из вариационного принципа эйнштейновского псевдотензора энергии-импульса и предлагается его толкование. Вторая из книг, "Расширяющиеся вселенные" (1955 г.), посвящена в основном решению де Ситтера космологических уравнений Эйнштейна - одному из возможных решений для вселенной, наполненной только гравитационным полем (без вещества и других полей). Решению де Ситтера посвящено много исследований. Среди них книга Э. Шредингера занимает достойное место, она весьма совершенна по форме и содержанию. Автор непосредственно не связывает содержание обеих книг между собой. Первая из них, значительно более простая для восприятия, содержит необходимый минимум сведений но геометрии, достаточный для чтения второй книги. Р. А. А санов
Э. ШРЕДИНГЕР СТРУКТУРА ПРОСТРАНСТВА- ВРЕМЕНИ
ВВЕДЕНИЕ В эйнштейновской теории гравитации представление о материи и ее динамических взаимодействиях базируется на понятии геометрической структуры, внутренне присущей пространственно-временному континууму. Идеальным устремлением этой теории, ее конечной целью является не более не менее как доказательство следующего утверждения: четырехмерный континуум, наделенный определенной внутренней геометрической структурой, структурой, которая подчинена определенным, присущим ей чисто геометрическим законам, должен представлять собой адекватную модель, или картину "окружающего нас реального мира в пространстве и времени" со всем, что он содержит, описывающую его поведение как целого, - картину всех событий, разыгрывающихся в нем. Действительно, концепция, предложенная Эйнштейном в 1915 году, с самого начала (а не только в многочисленных последующих попытках ее обобщения) охватывала все виды динамических взаимодействий, а не только гравитацию. То, что последняя обычно выходит на передний план и что теорию 1915 года мы обычно называем теорией гравитации, обусловлено двумя фактами. Во-первых, считалось, что ее ранние большие успехи - новые явления, правильно ею предсказанные, — относятся главным образом к гравитации, хотя это, строго говоря, справедливо только для прецессии перигелия Меркурия. Отклонение лучей света, проходящих вблизи Солнца, не является чисто гравитационным явлением, оно обусловлено тем фактом, что электромагнитное поле обладает энергией и импульсом, а следовательно, и массой. И также очевидно, что смещение спектральных линий на Солнце и на очень плотных звездах ("белых карликах") представляет собой результат взаимодействия между электромагнитными явлениями и гравитацией. Во всяком случае, сам фундамент теории, т.е. основополагающий принцип эквивалентности ускорения и гравитационного поля, ясно означает, что здесь нет места для каких-либо "сил", производящих ускорение, кроме гравитации, которую, однако, следует 10
рассматривать не как силу, а как свойство геометрии пространства—времени. Таким образом, фактически, хотя и не всегда словесно, мистическая концепция силы полностью отвергается. Любая "причина", чем бы она ни была, производящая "кажущееся" ускорение, делает это в меру своего вклада в тензор энергии—импульса и через посредство гравитационного поля, связанного с последним. Случай "чисто гравитационного взаимодействия" выделяется только тем, что он является простейшим в своем роде, поскольку можно считать здесь, что тензор энергии-импульса (или материи) сосредоточен в мельчайших крупицах материи (частицах или материальных точках) и имеет исключительно простую форму, тогда как, например, электрически заряженная частица связана с тензором материи, распределенным в окружающем ее пространстве и имеющем довольно сложную форму, даже когда частица находится в покое. Из этого, конечно, следует, что в подобном случае мы явно нуждаемся в полевых законах для тензора материи (например, для электромагнитного поля), законах, которые также хотелось бы представить себе как чисто геометрические ограничения на структуру пространства^-времени. Теория, предложенная в 1915 году, не давала таких законов, кроме как в простом случае чисто гравитационного взаимодействия. Здесь этот дефект может быть, по крайней мере, замаскирован или рецептурно дополнен простыми добавочными предположениями, такими как: "частица не должна распадаться на части", "не должно быть отрицательных масс" и т.д. Но в других случаях, таких как электромагнетизм, чтобы породить полевые законы для тензора энергии—импульса естественным образом, требуется дальнейшее развитие геометрических представлений о пространстве-времени. Это явилось второй причиной того взгляда, что теория 1915 года относится только к чистой гравитации. Геометрическая структура пространственно-временной модели, рассмотренной в теории 1915 года, воплощена в следующих двух принципах, гласящих, что: I. Все четырехмерные системы координат, полученные посредством произвольного (точечного) преобразования любой из них, эквивалентны. II. Континуум обладает наложенной на него метрической связностью, т.е. в каждой точке некоторая определенная квадратичная форма дифференциалов координат gikdXidxk, называемая "квадратом интервала" между двумя рассматриваемыми точками, имеет фундаментальный смысл, инвариантный относительно указанных выше преобразований. Эти два принципа имеют совершенно различный статус. Первый - принцип общей инвариантности - воплощает идею Общей 11
Относительности. Я не берусь утверждать, что он непоколебим. Порой его пытались обобщить, и трудно судить, сможет ли когда-нибудь квантовая физика серьезно потребовать его обобщения. Представляется, однако, что принцип в таком виде, как он есть, проще, чем любое его обобщение, которое только можно предположить, и, кажется, нет никакой причины отступать от него с самого начала. Что касается второго принципа, не очевидно, что сразу принять метрическую связность — это самый простой способ прийти к ней в конечном итоге, даже если в наши намерения не входит ничто большее, чем изложение теории 1915 года. Дело в том, что концепции, на которых зиждется эта теория (инвариантное дифференцирование, тензор Римана-Кристоффеля, кривизна, вариационные принципы и т.д.), совсем не являются характерными признаками именно метрической связности. Они приходят гораздо более простым, более естественным и обозримым путем, если сначала связность вводится только в той, и в точности в той мере, в какой этого настоятельно, ввиду принятой нами общей инвариантности, требует введение понятия "дифференцирования". Это будет так называемая аффинная связность. После этого легко, если нужно, конкретизировать ее, чтобы породить метрику. Важная группа попыток обобщения теории 1915 года (начатая Г. Вейлем еще в 1918 году) основана на этом более общем типе связности. Таким образом, мы будем изучать геометрию нашего континуума в три этапа или стадии: 1) когда на него наложена только общая инвариантность; 2) когда вдобавок наложена аффинная связность; 3) когда последняя конкретизируется так, чтобы нести метрику. Мы обнаружим также, что полезно обращать внимание на то, какие понятия характерны для каждой стадии, я имею в виду на то, какие понятия допустимы и имеют смысл на данной стадии, не требуя при этом перехода на следующую стадию, но не имеют никакого смысла на предыдущей. Многие из утверждений и теорем, которые будут выведены в дальнейшем, справедливы для любого числа измерений. Но поскольку мы не имеем дела с чистой математикой, а только намереваемся показать простейший подход к возможным геометрическим моделям пространства—времени, мы всегда будем иметь в виду случай п = 4. Было бы скучно повторять снова и снова: эта теорема справедлива в любом числе измерений. Гораздо интереснее и важнее случаи, когда теорема имеет место только для п =4; этот факт будет всегда подчеркиваться явно.
ЧАСТЬ I МНОГООБРАЗИЕ БЕЗ СВЯЗНОСТИ ГЛАВА 1 ИНВАРИАНТНОСТЬ; ВЕКТОРЫ И ТЕНЗОРЫ Рассмотрим (четырехмерный) континуум, точки которого отличаются друг от друга четверкой непрерывных меток xlf х2, х3, x4i которыми наделена каждая из них. Эта исходная разметка не имеет, однако, никаких преимуществ перед любой другой: *1 = х1 (х1 > •• ч**), х2 = *2(*1 » -., А'4), ' Ч \ '- Ч л (11) где xl — четыре непрерывные дифференцируемые функции от х^ такие, что их функциональный детерминант нигде не обращается в нуль *). Но, конечно, если производится такое преобразование, об этом надо объявить и указать вид функций, чтобы разметка не полетела ко всем чертям, а точки не были "потеряны". Займемся теперь поиском математических объектов — чисел или наборов чисел, которым в таком многообразии можно придать какой-то смысл. Числовые значения координат не являются объектами такого рода, поскольку они изменяются при преобразованиях, как и любая заданная математическая функция от них, например, сумма их квадратов. Но, с другой стороны, если вообще имеет какой-то смысл заботиться о сохранении каждой точкой своей индивидуальности даже при преобразованиях, то мы должны согласиться с тем, что точке может быть сопоставлено некое свойство, которое, конечно, не изменяется при преобразованиях. Ведь если мы не собираемся делать утверждений о фактах, имеющих отношение к конкретной точке пространства—времени, то какая польза от того, что они тщательно размечены - так, чтобы можно было найти их снова в любой системе отсчета? Наш список меток будет тогда рав- *) Это необходимо для того, чтобы гарантировать взаимно однозначное соответствие между двумя наборами меток. Но хорошо известно, что довольно часто приходится мириться и с исключениями, например, при переходе от декартовых к полярным координатам.
нозначен списку подлежащих без сказуемых или перечню адресов, выписанному тщательно, но без какого бы то ни было намерения хоть когда-нибудь осведомиться о том, кого или что можно найти по этим адресам. В простейшем случае такое свойство будет выражено одним числом, сопоставляемым точке, и, по определению, не изменяющимся при преобразованиях. В качестве иллюстрации можно представить себе, например, температуру в данной точке тела в данное время. Свойство, выраженное числом, которое "в приказном порядке" не изменяется при преобразованиях системы координат отсчета, называется инвариантом или скаляром. Говорят об инвариантном, или скалярном, поле, если не только с одной конкретной точкой, но и с каждой точкой определенной области связано некоторое число, причем все эти числа относятся к одному и тому же инвариантному свойству. Таким образом, скалярное поле будет задано некоторой функцией координат ф(.х\* Х2> Х3* хл)у но совсем не какой-то определенной математической функцией. После преобразования (1.1) тоже самое поле будет описываться подстановкой в качестве хк их значений (функций), полученных из уравнений (1.1) путем их решения; так что, если назвать эти решения хк(х[9 x'2f *з, хЛ ), то поле теперь, в новой системе отсчета, будет даваться выражениями </>[*i(*b х'г, *з> **)> х2(х[,..., *i), x3(x[,..., *i), х4(*ь »., х'л)1 А этот вид функциональной зависимости поля от координат хк, конечно, совершенно отличается от того, который в координатах хк был задан функцией у. Строго говоря, мы должны бы обозначить ее другой буквой, скажем, ф(х1р х2,хэ,х4). Физик, однако, привык считать, что определенная буква (<р в нашем случае) относится к конкретному полю в любой системе координат. Его наиболее важные общие рассуждения обычно относятся к "общей системе координат", которую он не конкретизирует и поэтому не должен на самом деле очень часто менять, хотя принцип инвариантности относительно преобразований постоянно подразумевается. Всякий раз, когда он должен рассматривать две или более систем отсчета одновременно, скажем, хк, х£, х£,..., он выбирает для функций, описывающих одно и то же скалярное поле в этих различных системах координат, буквы i п 14
так что, например, в обозначениях, использованных выше, </>[*l(*!,...,*4)> *2(*Ь-...*4)> *з(*Ь..-,*4), Х4(х[ *i)] = = if (Xlf Х2, Х$, ДС4). Для краткости в будущем мы будем писать <р(хк) вместо <р(*ь х2, х3, х4), если вообще нужно будет указывать аргументы. Обычно они будут подразумеваться. Так же штрих у <р' будет указывать, что имеется в виду полевая функция в хк-системе координат, поэтому не будет никакой необходимости писать у' (хк). Если заданы (в одной системе координат) две точки: Р с координатами xjc и Р с координатами хк, то разность </>(**) - Я>(хк) также инвариантна относительно преобразований. Следовательно, и (взяв точку Р бесконечно близкой к Р) dip dxk = инвариант. (1.2) Ъхк (На протяжении данных лекций будет использовано соглашение, что сумма от 1 до 4 подразумевается всякий раз, когда один и тот же индекс дважды присутствует в некотором произведении.) В самом деле, поскольку при преобразованиях координат dip Ъф дх, -тя ——г- О-3) Ъхк bxj Ьхк t дхк **к = —~dxm, (1.4) охт то Э<р Ъу bxt Ъхк Ъ<р —- ахк= dxm = dxj. Ъхк bxj Ъхк Ъхт Ъх1 Последнее равенство (доказывающее утверждение (1.2)) полу- 3jc7 дхк чается в результате суммирования по к, поскольку —- яв- Ъхк Ъхт ляется частной производной от координаты xt (рассматриваемой как функция от нештрихованных дс-ов) по хт. А это есть 1 или О в зависимости от того, совпадают индексы / и т или отличаются. 15
Набор четырех величин д^/Ьхк сам по себе является математическим объектом, обладающим определенным смыслом, при условии, что он должен преобразовываться по закону (1.3), подобно тому, как скаляр у должен не преобразовываться, а просто "пересчитываться" (по-немецки: wnrcchnen). Смысл b\pjbxk состоит в том, что - в любой системе координат - она дает нам приращение \р (при переходе к соседней точке) в виде указанной в (1.2) суммы произведений, причем приращения коррдинат берутся, конечно, в этой же системе отсчета. Величина, описываемая этими четырьмя частными производными, называется градиентом <р и является первым примером свойства, относящегося к определенной точке, задаваемого не одним числом, как скаляр, но набором чисел, четырех в данном случае. Градиент служит прототипом ковариантного вектора, или точнее, кова- риантного векторного поля. Общее понятие ковариантного вектора состоит в том, что это набор четырех величин Аку которые "в приказном порядке" должны преобразовываться согласно (1.3), и таким образом, Ьх. К = Г7^'' 0.5) Ъхк Природа этой величины может (как в случае градиента) быть такой, что каждой точке сопоставлена четверка чисел, изменяющихся от точки к точке. Тогда мы говорим о поле. Или конкретный вектор может относиться лишь к какой-то одной точке. Но в любом случае каждый вектор должен относиться к одной определенной точке, в противном случае предписание (1.5) было бы бессмысленным, поскольку мы не знали бы, какие коэффициенты использовать в нем. (Только что сказанное точно так же и по тем же самым причинам относится ко всем векторам и тензорам, которые будут сейчас введены.) Способ, по которому согласно (1.4) преобразуются дифференциалы координат, является в некотором роде альтернативой к (1.3). Мы определим контравариантный вектор как набор четырех величин Вк , которые преобразуются таким же образом, как и dxk: В'к = МГ (16) Ъхт По общему соглашению, написание индекса снизу или сверху служит для различения "ковариантного" и "контравариантного" поведения соответственно. Сами по себе величины <1хк являются, таким образом, (бесконечно малым) контравариантным вектором, 16
в действительности — его прототипом. Учитывая наше соглашение, некоторые пишут для координаты хк вместо хк. Я не думаю, что это способствует согласованности, поскольку: (а) сами по себе хк вовсе не являются вектором и (б) символы Э/Эл* могут во многих отношениях рассматриваться как некоторая (символическая) ковариантная величина. Поэтому лучше помнить, что во всех этих случаях положение всего дифференциала (стоит ли он в числителе или в знаменателе) заменяет, так сказать, положение индекса. Из (1.5) и (1.6) немедленно следует, что A'kB'k = AkBk = инвариант. (1.7) Это называется внутренним или скалярным произведением. Когда оно равно нулю, некоторые называют эти два вектора псевдоортогональными. Если заданы несколько (s) векторов в одной и той же точке, часть из которых ковариантны, часть контравариантны, то набор 4s величин AkBlCn\.GPHq... (1.8) подчиняется линейному закону преобразования, который может легко быть выведен из (1.5) и (1.6), но нам нет никакой необходимости выписывать его явно. Набор 4s величин, подчиняющихся такому закону преобразования, называется тензором ранга s и обозначается символом вида Tkim■■>„... , (1.9) где, конечно, число нижних индексов и число верхних индексов должно быть задано отдельно, чтобы полностью охарактеризовать природу величины Т. Произведение (1.8) является частным случаем такого тензора, но не наиболее общим тензором такого вида, поскольку оно зависит только от 45 независимых чисел, а 4s < 45 при s > 1. Порядок верхних индексов в обозначении (1.9) существен. В самом деле, jlkm "pq... в конкретном случае (1.8) означает AlBkCm ...GpHQmtm, что отличается от (1.8). Это не тот же самый тензор, но тензор того же самого вида. Стоит показать, что он действительно имеет в точности тот же закон преобразования. Достаточно будет одного примера. Возьмем кон- травариантный тензор третьего ранга Tklm. Он преобразуется таким образом: ,. . dxl Эх/ дх,'п Ъхг дх5 дхг 2. Э. Шредингер 17
Поменяем местами к и / и одновременно поменяем обозначения индексов суммирования г, s: j'klm = ^[^к Ъх'т Tsrt bxs Ъхг bXf Коэффициент не изменился, но в объектах Т первые два индекса поменялись местами. Это означает, что вы можете рассматривать компоненту Г123 как (213)-компоненту другого тензора и т.д. То же самое было бы справедливо для любой перестановки при условии, что вы делаете одинаковую перестановку во всех компонентах. То же самое справедливо, конечно, для нижних индексов. Но в данный момент порядок следования нижних индексов относительно верхних не существен. Векторы указанных двух типов являются, очевидно, частными случаями тензоров, а именно тензоров ранга 1. Скаляр может быть назван тензором нулевого ранга. Перемножая компоненты любых двух тензоров во всевозможных комбинациях rpklm... ^abc... 1 РЯ-- ° rst... » вы снова получаете тензор, что очевидно из законов преобразования. Это называется внешним или прямым произведением двух тензоров. Если в (1.9) вы проведете суммирование по верхнему и нижнему индексам, например, Tklm~kq... , (1.10) то снова легко показать из закона преобразования (который мы указали, но не выписали явно), что это будет тензор ранга на две единицы меньшего, чем ранг исходного тензора. Он может быть обозначен символом вида Slm'~q... • (1.11) Процесс образования из данного тензора, имеющего по меньшей мере по одному индексу каждого сорта, тензора низшего ранга называется сверткой (по-немецки: Verjungung). Заметьте, что (1.9) допускает различные свертки. Например, тензор rklm... pk... заметно отличается от (1.10), хотя он имеет тот же самый общий вид, т.е. тот же самый ранг и то же самое число верхних и нижних индексов. 18
Тензоры можно складывать и вычитать, или, говоря более общо, из них можно составлять линейные комбинации с постоянными либо инвариантными (скалярными) коэффициентами, если и только если они в точности одного и того же типа и относятся к одной и той же точке континуума. Под "можно" мы подразумеваем, что в этом и только в этом случае результат будет снова иметь простую формулу преобразования, свидетельствующую о том, что это тензор того же самого типа, относящийся к той же самой точке. Наиболее важным числом в математике является нуль. Знак, используемый для него в настоящее время, так же как и слово zero *), имеют арабское происхождение. (Этимологически, между прочим, zero — это то же самое, что и английское cipher, французское chiffre, немецкое Ziffer **), хотя эти слова приобрели другой смысл.) Но понятие нуля старше, оно появилось в вавилонской математике вскоре после 1000 года до н.э.***) и, может быть, было получено из Индии. Позвольте мне задержаться на важности этого понятия. Большое число наших предложений и утверждений в математике имеет форму уравнения. Сущностью же утверждения, сформулированного в уравнении, является следующее: что определенное число равно нулю. Нуль является единственным числом, обладающим хартией - одной из королевских привилегий. В то время как любое другое число может быть подвергнуто любой из элементарных операций, запрещено делить на нуль - точно так же, как, например, во многих парламентах может обсуждаться любой предмет, за исключением персоны суверена. Если выделите на нуль, результат обычно является бессмысленным. Эта прерогатива существенна, вы должны думать о ней каждую минуту; всякий раз, когда вы делите, вы должны удостовериться, что делитель "не королевской крови", что он не является нулем. Другим следствием является то, что королевская кровь не может (путем умножения) быть получена иначе как из королевской крови. Произведение не может обращаться в нуль, если не обращается в нуль по меньшей мере один из его сомножителей. Не случайно, чаше всего ход доказательства идет следующим образом: АВ = 0, Точно так же наиболее важным тензором любого вида является нулевой тензор этого вида, т.е. тензор, все компоненты которого обращаются в нуль. Он представляет собой численно инвариантный тензор, поскольку формулы преобразований являются линейными *) Zero (англ.) - нуль. {Примеч. пер.) **) А также русское "цифра". {Примеч. пер.) ***) V. Gordon Childe. Man Makes Himself (London: Watts and Co., 1936), pp. 222 and 255. 2* 19
и однородными. Именно по этой причине тензоры играют такую наиважнейшую роль. Ибо эта причина имеет своим следствием то, что равенство следующего вида между двумя тензорами S и Т * pq... ~ * pq... не зависит от системы координат (поскольку оно означает, что S ... ~ Т "... является нулевым тензором) - при условии, конечно, что S и Т - одинакового типа и относятся к одной и той же точке. Если же это условие не было бы выполнено, то наше утверждение было бы несправедливо, а вышеупомянутое равенство было бы бессмысленным, и мы поэтому никогда не будем рассматривать вещи подобного рода. Возможно, в этом месте стоит упомянуть о соглашении, которое всегда делается неявно, хотя оно заслуживает, чтобы его упоминали явно, точно так же как и "соглашение о суммировании", двойником которого оно является. Согласно последнему индекс, который фигурирует дважды в одном произведении, должен подразумевать суммирование от 1 до 4. А индекс, который фигурирует только однажды, но тогда, конечно, в каждом члене равенства, подразумевает, что равенство справедливо для любого значения этого индекса от 1 до 4. С помощью первой конвенции мы несколько членов равенства запихиваем в один, а с помощью второй мы несколько уравнений запихиваем в одно уравнение. Например, если вы пишете riklm _ nkl «Э ш - /\ , то это представляет собой в общем случае 16 уравнений, каждое из которых имеет четыре члена в левой части. Важным является приложение инвариантности тензорных уравнений к исследованию симметрийиых свойств тензоров. Если для тензора S одно из следующих двух уравнений akl... _ + elk.-- * pq... " -^ pq... выполняется в одной системе координат, то оно выполняется в любой системе координат. Мы тогда называем S симметричным или антисимметричным соответственно по отношению к его первой паре верхних индексов. То же самое может иметь место для пары р и q, но не для пары А; и q, например. (Может случиться, что симметрия будет достигнута в одной конкретной системе координат, но тогда она не будет представлять никакого интереса, являясь лишь случайным фактом.) Позднее мы узнаем о более сложных свойствах симметрии. В качестве следствия отметим, что тензор общего вида всегда может быть представлен в виде суммы двух тензоров, один из которых симметричен, а другой антисимметричен по отно- 20
шению к определенной паре индексов одного сорта. Сходные теоремы справедливы также для более сложных форм симметрии. Пусть задан тензор с t контравариантными и г ковариантными индексами; рассмотрим любые / ковариантных и г контрава- риантных векторов и образуем свернутое произведение SkL~pq...AkBLm.F*,Gq„. . (1.13) Тогда, согласно правилам для внешнего и внутреннего произведений, это произведение (представляющее собой просто какое-то одно число, ведь все индексы "убиты" свертками) является инвариантом. Интересно и полезно знать, что обратное утверждение также верно: если вы не знаете ничего о наборе чисел S " ., кроме того, что "произведение" (1.13) есть инвариант для любого множества векторов AG, то величины S \ являются компонентами некоторого тензора, относящегося к типу, определяемому его индексами. Эта обратная теорема (которую мы немедленно докажем) может служить в качестве альтернативного определения тензора; но более важно то, что она часто используется с целью установить, что свойства тензора имеет некоторый набор чисел, для которого это заранее неизвестно. Чтобы доказать эту обратную теорему, рассмотрим конкретное преобразование, скажем, S', при котором компоненты S преобразуются, как если бы S '"_ было тензором, и S '"_ -любой набор чисел, обладающий, как и S "' , тем свойством, что оно делает (1.13) инвариантным относительно этого конкретного преобразования для любого множества векторов А .,.6... • Взяв разность двух равенств, выражающих то, что как S ''"_ , так и S " "... делают (1.13) инвариантом, вы получите (S'k'-pq.-S"kl-pq...)A'kB'F'pG">... = 0. Теперь, поскольку исходные компоненты векторов AG были совершенно произвольными, то же самое справедливо и для штрихованных компонент, поскольку формулы преобразований (1.5) и (1.6) имеют ненулевые детерминанты. Следовательно, вы можете выбрать векторы так, что у А1 только £-тая, у В1 только /-тая, ..., у G' только q-тгя компоненты отличны от нуля. Тогда вы получите равенство r,tkl... ~nkl... _ Л ^ pq... ~ ^ pq.- и< говорящее о том, что эти конкретные числа из наборов S' и S " равны. Очевидно, при надлежащих других выборах векторов то же 21
самое можно показать для любой пары из 5' и S" , и, таким обра' зом, наше предположение доказано. Простые следствия нашей теоремы иллюстрируются следующим примером. Если мы знаем, что л А{- контравариантныи вектор kl при любом выборе ковариантного вектора А, тогда S есть контравариантныи тензор второго ранга. Это естественно. Поскольку, если вышеприведенная комбинация есть контравариантныи вектор при любом выборе вектора А , то SklAtBk = инвариант при любом выборе векторов А и В. Как видно из нашего доказательства, жизненно важно то, что инвариантность произведения гарантирована для произвольных векторов. Однако определенное послабление может быть сделано, если кое-что еще известно о наборе S. Например, если гарантировано лишь только то, что SklAkAt = инвариант при любом выборе вектора А , но вдобавок известно, что в любой системе Ski = sik (симметрия), то тензорные свойства S могут быть доказаны так, как это было очерчено выше. (В отсутствие симметрии можно показать лишь, что Skl + Slk есть тензор.) В качестве примера приложения общего метода мы докажем наличие тензорных свойств у смешанного единичного тензора, который сам по себе является важной величиной. Рассмотрим набор 16 чисел принимающих численные значения 0 или 1 в соответствии с тем, / Ф к или / = к. Тогда для любой пары векторов в любой точке континуума dkAiBk: = АкВ = инвариант согласно (1.7). Следовательно, Ьк есть смешанный тензор и он правильно написан с одним верхним и одним нижним индексом. Он представляет собой один из (очень немногих) численно инва- 22
риантных*) тензорных величин, т.е. даже его компоненты одинаковы в любой системе отсчета. Хотелось бы назвать его симметричным тензором. Однако это не было бы правильно, потому что симметрия по отношению к индексам разного характера в общем случае не сохраняется при преобразованиях. То, что здесь симметрия сохраняется, является исключительным явлением. Заметим, между прочим, что даже более тривиальное утверждение, что Ф, = вк есть вектор для любого Я/, достаточно для вывода тензорных свойств Ьк. ГЛАВА 2 ИНТЕГРАЛЫ. ПЛОТНОСТИ. ПРОИЗВОДНЫЕ Интегралы. Плотности Предмет предыдущей главы называется тензорной алгеброй. Он характеризуется тем, что рассматриваются только соотношения между инвариантами, векторами или тензорами, относящимися к одной и той же точке континуума. С принятой здесь точки зрения**) алгебраические соотношения между векторами и тензорами, относящимися к разным точкам, бессмысленны. Вспомним, однако, что мы основывали понятие тензора на понятии вектора, а последнее на понятии градиента, и вряд ли имеется какая-либо простая и естественная альтернатива этой процедуре. Но при формировании градиента мы в действительности должны были сравнить значения некоторого инварианта в разных точках, и в этот момент мы сделали первый шаг на пути введения анализа в наш континуум. В этой и последующих главах мы должны развить его. Анализ влечет за собой производные и интегралы. Мы *) И одновременно постоянных, так как это - тензорное поле. (Примеч. ред.) **) Только совсем недавно были сделаны попытки рассмотрения связности, в которой используются алгебраические соотношения между тензорами в разных точках. См. A. Einstein and V.Bargmann. - Ann. Math., 1944, v. XLV, Pp. 1,15. См. также E. Schrodvnger and F. Mautner. - Proc. R. Irish. Acad., 1945, v. L, pp. 143, 223. Эти попытки не включены в настоящее изложение. 23
должны будем изучить те и другие с точки зрения общей инвариантности. Однако это не означает, что мы должны искать только инварианты, следует искать также и величины тензорного характера, потому что, как мы видели, уравнения между ними (или, другими словами, система уравнений, гласящая, что тензор равен нулю) сохраняются при преобразованиях. Мы начнем с пространственно- временных интегралов. Это приводит к определенному расширению понятия тензора, т.е. к тензорным плотностям. Мы подчеркивали, что нет никакого смысла производить сложение (или, в более общем случае, образовывать линейные комбинации) тензоров или векторов, относящихся к разным точкам. Такая операция не имела бы никакого простого смысла. Например, уравнение, гласящее, что вектор А в точке Р равен вектору В в другой точке Q, совершенно не представляет никакого интереса, даже если в одной системе отсчета равенство достигается, потому что оно будет нарушено при преобразованиях. Или еще: пусть Ак — контра- вариантное векторное поле и рассматриваются четыре интеграла ffffAkdxl dx2 dx3 dx4, взятые по данной области пространств а-времени и, конечно, по в точности соответствующей ей области в любой другой системе отсчета. (Для интегралов такого типа в будущем будет использоваться сокращенное обозначение fAkd4x.) Вышеприведенные интегралы не являются ни инвариантами, ни компонентами контра- вариантного тензора - они лишены всякого смысла и интереса. Но если бы А было инвариантом (скаляром) и мы бы образовали тем же способом интеграл fAd4x (берущийся всегда по инвариантным образом зафиксированной области), был бы он инвариантом? Очевидно, нет. Хотя нет никаких возражений против сложения инвариантов, относящихся к разным точкам, тем не менее мы знаем, что при преобразованиях fAd*x = fA а это в общем случае *) *) Чтобы сделать этот интеграл инвариантным, необходимо ограничить допустимые преобразования условием, что их функциональный детерминант должен быть равен единице. Но это было бы неудобно. Ъхк Ъх! d4x\ 2А
Чтобы выполнялось равенство fA d4x = fA'dAx\ или, иными словами, чтобы интеграл был инвариантен, нужно, чтобы "законом преобразования" для А было бы не А'- -А, А' = дхк Эх, А, т.е. величина А должна была бы по определению приобретать в качестве множителя функциональный детерминант, возникающий в преобразованном интеграле вследствие преобразования 'произведения дифференциалов". Величину, ведущую себя подобным образом, мы назовем скалярной плотностью * ). Плотности обычно обозначают готическими буквами. Окажется удобным распространить понятие "плотности" и на многокомпонентные объекты **), имеющие такую же связь с тензорами, какую скалярная плотность имеет со скаляром, а именно, формулы их преобразования должны быть удлинены на множитель, равный детерминанту | Ъхк1Ъх\ |, - и всегда только на этот множитель, независимо от характера других индексов. Для большей ясности давайте выпишем incxtenso ***) формулу преобразования для тензорной плотности общего вида ^к1'"ря.... Она имеет вид « '*/.. рд... Ъх{ Эдг,- dxk dxj Ъхг bxt Ъхт Ъхп ЪХр ЪХд *' (2.1) ") Теперь обычно скалярной плотностью с весом т называют величину, преобразующуюся так: В' = \J \тВу где J Эх», Эл7 . Лксиапьной (или псевдоскалярной) плотностью с весом т - такую величину, что С9 =' Ul\J\) \J I m С. (Для тензорной плотности определение аналогично.) В соответствии с этим величину Л назвали бы аксиальной скалярной плотностью веса +1, \gfk I = g - скалярной плотностью веса 2 и т.д. (Примеч.ред.) **) Не нужно делать отсюда вывод, что интеграл от компоненты тензорной плотности (отличающейся от скалярной плотности) имеет какой-то смысл. Он его не имеет. ***) In extenso (лат.) - в подробной записи. (Примеч. пер.) 25
Плотности, очевидно, обладают, как и обычные тензоры, тем свойством, что они (т.е. все их компоненты) обращаются в нуль в любой системе отсчета, если это имеет место хотя бы в одной, ибо это важное свойство основано только на однородности и линейности закона преобразования. Следовательно, они в равной мере полезны. Уравнения между такими величинами, относящимися к одной и той же точке, не зависят от системы координат и сохраняются после преобразований. Чтобы добыть скалярную или тензорную плотности, нам не нужно доставать их с неба, подобные объекты могут быть построены из уже введенных нами тензоров. Рассмотрим ковариантпый антисимметричный тензор четвертого ранга 'klmn • Под антисимметричностью мы подразумеваем то, что перестановка любых двух нижних индексов приводит только лишь к изменению знака компоненты. Если мы обозначим численное значение компоненты 7^,2 34 заглавной готической буквой Z (сейчас станет ясно, почему готической), то любая другая компонента Tkimn будет, следовательно, равна ± % в зависимости от того, является ли престанов- ка klmn четной или нечетной, тогда как компоненты, у которых не все их индексы отличаются друг от друга, обращаются, конечно, в нуль. Запишем теперь формулу преобразования компоненты ^1234: _дхк Э.у7 Ъхт дхп 1234 Ay-' Ay-' Avf Av' Tkhnn' OX i OX 2 OX з OX 4 С учетом величины компонент Тк!тп это дает т\ 234 ЪХь dx'j т1: дхк dx'i г . Или, если для 7,'12з4 воспользоваться соответствующим обозначением %'у ТО £' = Ъхк Эдс,- Таким образом, альтернативная точка зрения на наш инвариантный антисимметричный тензор четвертого ранга состоит в том, чтобы рассматривать его как объект всего с одной компонентой, но не как скаляр, а как скалярную плотность. Эта теорема может быть, в некотором роде, обращена. Пусть Л - скаляр. Рассмотрим объект Qklmn (сейчас немедленно станет 26
ясно, почему мы выбрали готическую букву), по определению равный в любой системе отсчета либо ±А, в соответствии со знаком перестановки (kltnn), либо нулю, если не все его четыре индекса различны. Странным, но правильным способом выражения того факта, что А является инвариантом А' = А, будет тогда е tklmn ЪХ( bx'j fo'k Ъх\ Ъх'т дх'п и Ъхг bxs bxt Ъхи В самом деле, предписанные суммирования дают функциональный детерминант, который в точности сокращает детерминант, стоящий первым множителем, и остается уравнение <g'*/ш,, = <g*''"" \\0 эта "странная, но правильная" формула говорит нам, что 6 является контравариантной антисимметричной тензорной плотностью ранга 4. В частном случае, когда А = 1, ее обычно обозначают klmn Эта е-плотность является полезным приобретением и очень часто используемым орудием. Между прочим, она представляет собой еще один численно инвариантный объект, с которым мы встретились. Можно, например, образовать из е и ковариантного антисимметричного тензора второго ранга <рк1 следующий объект je"m"%fc»> (2.2) являющийся, очевидно, скалярной плотностью, имеющей в явной записи вид ^12^34 +^23^14 +^31^24. (2.3) Также и уе*'""Ч/ = Г" (2.4) является контравариантной антисимметричной плотностью второго ранга. Попросту говоря, если задан (антисимметричный) тензор </>л/, вы можете рассматривать ^12 как (34)-компоненту, </>2з — как (14)-компоненту, . . . ,<£34 — как (12)-компоненту другого объекта, но этот объект является контравариантным, и не просто тензором, а плотностью. Если принять во внимание ту большую роль, которую играют антисимметричные тензоры второго ранга, уже этих одних фактов достаточно, чтобы показать полезность расширения понятия плотности на другие плотности, отличные от просто скалярной. 27
Утверждения, что величины в (2.2) или (2.3) являются скалярными плотностями, представляют собой частные случаи более общей теоремы об образовании скалярной плотности из любого ковариантного тензора второго ранга. Пусть gik будет одним из них, так что закон его преобразования имеет вид ' -bXl bXm ,п<\ 8ik "77 ТТ 8lm- (2.5) дх{ Ъхк Будем теперь рассматривать правую часть этого выражения как "матричное произведение" матриц Элг//Эх), glm и дхт/дхк (именно в этом порядке!). Тогда из хорошо известной теоремы о детерминанте матричного произведения, обозначив через g детерминант g'iki а через g — детерминант gjk, вы получите а*, I2 1 g, (2.6) 8 = и, следовательно, VF"=|^t|\/£ (2.7) I ax j I Словами: корень квадратный из детерминанта любого ковариантного тензора второго ранга является скалярной плотностью. Случай симметричного тензора gik очень важен для метрической геометрий (эйнштейновской теории 1915 года). В случае антисимметричного тензора квадратный корень может быть извлечен и приводит в точности к (2.2) или (2.3), что легко проверить непосредственно. Воспользуемся этим случаем, чтобы продемонстрировать другой важный факт. Примем, что g Ф 0. Минор компоненты gik в детерминанте g обозначим М1к, не предполагая заранее наличия у него тензорных свойств. Тогда с помощью хорошо известной теоремы о детерминантах получим gmkMlk=blmg. (2.8) Это равенство выполняется, конечно, в любой системе координат, следовательно, также и для штрихованных величин Г, при условии, что М'1к всегда имеет смысл минора в этой системе отсчета. Но поскольку из (2.8) или, скажем, из М1к ; 8т к = 5\„ (2.9) 8 величины Mlkjgопределяются однозначно и поскольку (в силу, тензорных свойств д1т) предыдущее равенство также выполняется 28
в любой системе координат для таких величин, которые получаются из величин М lk/g путем преобразования последних как контра- вариантного тензора второго ранга, отсюда следует, что величины М tk/g действительно образуют такой тензор. "Нормированные" миноры любого ковариантного тензора второго ранга образуют контравариантный тензор второго ранга. Легко доказать, что в данном утверждении термины "ковариантный" и "контравариантный" можно поменять местами. Более того, если из тензора = glk (2.10) снова образовать нормированные миноры, то опять получится тензор glk. Если вместо (2.10) рассмотреть набор величин М' н в'\ VS" то они, конечно, образуют контравариантную тензорную плотность второго ранга. Стоит отметить, что в случае антисимметричного тензора yik эта плотность совпадает с полученной в (2.4) другим способом, в чем легко убедиться с помощью непосредственного вычисления миноров для данного случая. Выше мы упомянули, что g в этом случае является квадратом скалярной плотности (2.3), для которой мы введем обозначение 32: ~€ mn*PkltPmn =^12^34 +</?23</>14 + V?31</>24 = 32. (2.11) о Следовательно, применяя (2.9) к этому случаю, мы получим Г%,„*=8'ш ' 32. (2.12) Согласно (2.4) это равенство может быть также записано в виде ^"'•'4(.vW=S'„,- 3,. (2.13) Свертывая по индексам / и ту вы снова получите (2.11), поскольку 5'"w = 4. Но, конечно, выражения (2.12) или (2.13) имеют более богатое содержание, чем (2.11). На языке матриц последнее гласит, что матричное произведение матриц flk и \pik пропорционально единичной матрице, что невозможно было усмотреть прямо из определения (2.4). 29
В качестве последних примеров построения плотностей из тензоров даваГте сначала рассмотрим ковариантный антисимметричный тензор третьего ранга Aikl. Если не обращать внимания на знаки, 'он имеет только четыре ненулевые численно отличные друг от друга компоненты, определяемые тем из четырех индексов 1, 2, 3,4, который отсутствует среди /, к, I. С помощью тензорной плотности е можно образовать из А контравариантную векторную плотность ~Г е Ак1т - » • 6 Закон соответствия очень прост, и можно сформулировать его таким образом: ковариантный антисимметричный тензор третьего ранга всегда можно рассматривать как контравариантную векторную плотность, fc/m-компонента которого равна л-компоненте тензора, причем klmn образуют четную перестановку из 1234. И наоборот, из ковариантного вектора Вк можно образовать антисимметричную контравариантную плотность третьего ранга; таким образом, eklmnBn= в*/т, где левая часть состоит всего из одного члена, потому что п должен быть четвертым индексом по отношению к К I, m. Исчерпывающая взаимосвязь между полностью антисимметричными тензорами и тензорными плотностями имеет следующий вид. Из нижеперечисленных ковариантных антисимметричных тензоров*) A, Aj, Am, AiMyAjkipjj в результате умножения их на е-плотность и свертывания по всем индексам исходных тензоров могут быть получены контравариант- ные антисимметричные плотности комплиментарного ранга Miklm qrklm Qf/m Of'7* 9( Если добавить множители 1 1 1 1,lf ТЧ ' 24 ' *) Инвариант может рассматриваться как ко- или контравариантный тензор, а кроме того, как инвариант, так и вектор могут рассматриваться как антисимметричные тензоры, если определить (что возможно) ковариантный/контравариантный тензор как не имеющий ни одного контравариантно- го/ковариантного индекса, а полностью "кососимметрический или антисимметричный" тензор - как меняющий знак при перестановке индекса (если таковой имеется) с любым другим индексом того же типа (если такой другой имеется). 30
то полученная плотность будет иметь те же компоненты, что и тензор, только занумерованные по-другому. Не существует соответствующей теоремы о ко вариантных плотностях и контравариантных векторах просто потому, что нас практически не интересуют тензорные объекты, которые при преобразованиях приобретают отличную от первой степень функционального детерминанта. (Например, объект тина eklmn %imn приобретает вторую степень этого детерминанта.) Для практических целей может оказаться полезным список следующих правил. Любое "произведение" тензоров снова является тензором, причем его тип явствует из набора всех его верхних и нижних индексов, исключая те, которые появляются дважды, по разу в каждой из позиций (индексы суммирования или немые индексы). Надо заботиться о том, чтобы "случайно" не употребить одну и ту же букву дважды, не говоря уже о том, чтобы использовать ее более двух раз! Только объекты в точности одинакового типа можно складывать, вычитать и полагать равными друг другу. Следовательно, индекс должен присутствовать либо в каждом члене уравнения в одинаковой позиции, либо дважды в одном и том же члене в разных позициях (индекс суммирования). Один (но только один) из объектов, входящий "множителем" в один из членов, может быть плотностью; тогда весь этот член является плотностью и все члены уравнения должны быть этого типа. Правило, запрещающее "случайное" повторное использование буквы, не относится к индексам суммирования в различных вкладах. Такое употребление не может вызвать никакой путаницы. Относительно внешнего произведения можно было бы еще раньше сделать следующее утверждение, которое, при всей его простоте, очень важно. Если произведение является чисто "внешним", т.е. если произведение не сопровождается сверткой, оно может обратиться в нуль, только если, по меньшей мере, один из его множителей является нулевым тензором. Другими словами, в алгебре тензоров и тензорных плотностей нет никаких делителей нуля. Производные Для краткости мы будем в дальнейшем иногда обозначать производную по хк с помощью нижнего индекса к и запятой, стоящей перед ним. За исключением случая инварианта, производная компоненты тензора, как, например, Ал ,, не имеет точного смысла, потому что она является результатом вычитания друг из друга тензоров, отно- 31
сящихся к разным точкам, а именно величины Аку взятой в точке Л'7, из величи ibi Ак, взятой в некоторой соседней точке. (Не нужно думать, что такой малый сдвиг "не имеет значения", ибо в производной мы рассматриваем как раз изменение й Ак> порожденное этим малым сдвигом.) Если мы вычислим, например, из Ъ<р Эл*/ Э<р Ъх'к Ъх'к bxt формулу преобразования для второй производной Э2^ Эл'/ Ьхп} Ъ2у b2Xi Ъ$ Ъх'к Ъх\ дхк bx'j Эдг/Эл*,,, Эл'^ dx'j Эл:/ ' то видно, что они не только не образуют тензора, но не обладают даже тем свойством, что их обращение в нуль инвариантно. То же самое справедливо, конечно, для любого ковариантного векторного поля. Из формулы его преобразования A'k= — At (2.15) дхк с помощью дифференцирования получим дАк bXf Ьхт ЪАг b2xi oxj axk oxj oxт oXjdxk что в точности совпадает с формулой (2.14), но только записанной для произвольного Aj (а не только, как там, для градиента). Мы снова видим, что Alf m ведет себя как ковариантный тензор второго ранга, если бы не дополнительный член, содержащий непродиффе- ренцированную величину А{ и вторую производную от закона преобразования. Это опять приведет к тому эффекту, что наш набор производных не обязательно обратится в нуль в штрихованной системе отсчета вследствие его обращения в нуль в исходной. Совершенно аналогично обстоит дело, как нетрудно сообразить, и для любого тензора или тензорной плотности. Существуют, однако, определенные линейные комбинации производных от компонент тензоров, для которых члены, содержащие вторые производные координат вместе с непродифференциро- ванными компонентами исходных тензоров, сокращаются. Эти линейные комбинации, следовательно, являются тензорами, причем индекс производной всегда играет роль ковариантного (нижнего) индеса. Эти комбинации легко запомнить. Все они полностью антисимметричны. Мы начнем с тензоров. Первый из них мы уже знаем & ■•). *) Нет ничего опасного в том, чтобы рассматривать скаляр как один из антисимметричных тензоров. См. ссылку на стр. 29. 32
1) Градиент инварианта: ip.k- Он является ковариантным вектором. Если образовать из него то, что называют (новое определение) ротором V.k.t-V.i.k*0* вы получите нуль. Это означает, что дополнительные члены должны сокращаться для этой разности, что можно усмотреть непосредственно из формулы (2.14). Но можно увидеть также, что они должны сокращаться для ротора любого ковариантного вектора. Следовательно, - . . А оАк oAj 2) Ротор ковариантного вектора Ак: - —>- является ковариантным антисимметричным тензором второго ранга. Игра продолжается. Если образовать из ротора то, что называется (новое определение!) циклической дивергенцией, то получится (1ФкФ1) Э /ЪАк ЪАЛ а*/ \ эдг/ ъхк/ + два циклических члена = 0. Следовательно, также и здесь члены, содержащие непродифферен- цированный тензор второго ранга, должны сократиться. И то же самое должно выполняться для любого ковариантного антисимметричного тензора второго ранга. Следовательно, 3) Циклическая дивергенция ковариантного антисимметричного тензора второго ранга yik bxi Ъх( дхк является полностью антисимметричным ковариантным тензором третьего ранга. Продолжая дальше, необходимо быть осторожным. Если образовать производную Ъ/Ъхт этого тензора и добавить циклическую перестановку, результат не обратится в нуль. Необходимо ввести знак (-) в тех случаях, когда перестановка является нечетной. Следовательно, также 4) Следующая сумма четырех производных от антисимметричного ковариантного тензора третьего ранга Aik! *) X(-\)l^Aikl является антисимметричным тензором четвертого ранга. Это все. Дальше продолжать невозможно, потому что индекс принимает только четыре значения. (В большем числе измерений можно было бы продолжать и дальше.) *) Символический показатель степени (!) должен напомнить вам о том, что было сказано относительно знака. З.Э. Шредингер 33
С учетом соответствия между антисимметричными тензорами и плотностями отсюда следуют четыре аналогичных утверждения о плотностях. Я обозначу их (Г), (2'), (3'), (4'). (4') Дивергенция (новое определение!) контравариантной векторной плотности 91*, а именно ЪШк/Ъхк, является инвариантной плотностью. (3') Дивергенция ("тензорная дивергенция", новое определение!) антисимметричной контравариантной тензорной плотности второго ранга %к\ а именно d%kl/bxh является контравариантной векторной плотностью. (2') Тензорная дивергенция (новое определение!, хотя используется тот же самый термин) антисимметричной контравариантной тензорной плотности %к1т, а именно Ъ Wklmlbxltiy является плотностью второго ранга с тем же самым описанием. И, наконец, (Г) Тензорная дивергенция (см. скобку выше) антисимметричной тензорной плотности четвертого ранга 9J*/WW, а именно 9 91 тп/Ъхп, является плотностью третьего ранга с тем же самым описанием. Насколько мне известно, это — все линейные комбинации из первых производных тензоров и тензорных плотностей, имеющие свойства тензора. Наиболее важными являются случаи (1), (2), (3), (4'),(3'). Обращение в нуль одного из приведенных выше тензоров во всех случаях имеет надлежащий смысл, а именно: в случае (1) скаляр \р постоянен, в случае (2) - вектор Ак является градиентом. Для случаев (3) и (3') примером служат уравнения Максвелла для вакуума, а в случае (4') обращение дивергенции в нуль указывает на то (или выражается в том, что говорят), что ток 91* не имеет источников. Тем не менее приведенных выше тензоров недостаточно, чтобы построить исчерпывающий тензорный анализ в нашем континууме. Не имеет никакого смысла даже такой простой вопрос: когда векторное поле следует рассматривать как постоянное в некоторой определенной области? Ибо обращение в нуль всех его производных Aki (как мы видели) не является свойством, не зависящим от системы координат, потому что Ак ( не является тензором. Геометрическое понятие, позволяющее устранить эту трудность, будет введено во второй части. Но прежде давайте более подробно остановимся на только что упомянутом интересном факте: уже развитых нами аналитических средств достаточно для формулировки основных утверждений теории Максвелла, которую с полным правом можно назвать идейной предшественницей всех полевых теорий, последовавших за ней. В элементарной форме уравнения Максвелла, записанные с помощью хорошо известных обозначений 34
трехмерного векторного исчисления, гласят: rotH-D = I, divD = p; (A) rot Е + В = 0, div В = О (Б) (единицы следует выбрать так, чтобы избежать множителей 4я или с). Поведение, обычно (и естественно) приписываемое току и заряду (I, р) при элементарном изменении масштаба длины, побуждает нас рассматривать их как плотности и, таким образом, считать четверку соотношений (А) уравнениями для плотностей. Мы должны, следовательно, объединить элементарные векторные величины Н и D в контравариантную антисимметричную тензорную плотность второго ранга f lk таким образом, чтобы компоненты Н соответствовали f 2 3, f31, f12; компоненты D соответствовали f41, f42, f43. Тогда уравнения (А) примут вид 4^-= «*, (А') Ъхк где 4-ток 4к заменяет (I, р). В случае второй четверки (Б) нет никаких соображений о желательном их характере (тензоры или плотности), и на самом дЪле выбор между ними не имеет прямого отношения к делу. Это только вопрос наименования, поскольку использование е-плотности позволяет легко переводить одну форму в другую. (То же самое относится и к первой паре. Но если там вместо flk выбрать ковариантный тензор, то мы должны будем вместо ik взять ковариантный антисимметричный тензор третьего ранга, как это было однажды предложено Эйнштейном, и по вполне понятным причинам.) Придерживаясь обычных обозначений, мы объединим Е, В в ковариантный антисимметричный тензор $ik таким образом, чтобы компоненты В соответствовали <р2 з > <£з i»^12, компоненты Е соответствовали <£i 4, ^2 4, ^з 4 • Тогда уравнения (Б) гласят: byik f + (две циклические перестановки) =0. (Б ) Эдг/ С помощью (А;) и (Б') мы установили фундаментальные уравнения Максвелла инвариантным образом в произвольной системе координат, не используя ничего, кроме средств, развитых ранее в этих лекциях, т.е. в рамках пространственно-временного многообразия без связности (ни аффинная связность, ни метрика не были 3* 35
еще введены). Чего мы не можем установить подобным образом, это соотношения между плотностью (Н, D) или f1*, с одной стороны, и тензором (В, Е) или ipik — с другой. (Такие соотношения в элементарной теории называются материальными уравнениями.) Ибо единственное соотношение, какое только можно себе представить, а именно flk =. — elklm ^/m> y превращает уравнение (A') , по крайней мере в отсутствие токов и зарядов ( ik = 0), в следствие уравнения (Б') путем отождествления Н с Е, a D — с В (что совершенно неверно и чего нельзя избежать переходом к другому наименованию). Другой способ получения требуемого соотношения станет ясен в свете общего дальнейшего развития. Мы можем легко разъяснить его здесь непосредственно. Величина 32 из уравнения (2.11) является скалярной плотностью. Следовательно, интеграл / = / 32 dAx, взятый по инвариантно зафиксированной области, является инвариантом. Рассмотрим теперь вместе с исходным полем $ik "бесконечно близкое" поле ^+^^/л- Каждый из членов 5^/Л, будучи разностью двух тензоров, относящихся к одной и той же точке, также является тензорным полем того же самого типа. Кроме того, Ь\52 л 81=1- 6*ik d*x Щк также является инвариантом, поскольку он представляет собой разность инварианта/, образованного из yik + 6<p/fc, и инварианта, образованного из <pik. Отсюда легко вывести, что подынтегральное выражение само по себе является скалярной плотностью, и поскольку это справедливо для любого тензора b$ik, мы имеем, что Э32 — = конгравариантная антисимметричная тензорная ^ik плотность второго ранга. Но, взглянув на (2.11), мы видим, что это то же самое, что мы получили бы путем "поднятия индексов с помощью е-плотности". Так что и эта процедура не дает ничего нового.
Ч А С Т Ь II МНОГООБРАЗИЕ С АФФИННОЙ СВЯЗНОСТЬЮ ГЛАВА 3 ИНВАРИАНТНЫЕ ПРОИЗВОДНЫЕ *) Чтобы найти (или, может быть, точнее — согласовать) некоторый естественный способ, позволяющий инвариантным образом судить о том, изменяется ли и как тензор от точки к точке, давайте вернемся к выражению (2.16) : ЪА'к Эх/ дхт ЪАг Э2х, —г= —г —; + —~,—г Ai. (3.1) Эдг/ Ъхк Ъх( Ъхт Ъх( Ъхк Предположим, у нас есть некоторые причины настаивать на том, что поле Ак следует рассматривать как "действительно" постоянное, если все его 16 производных обращаются в нуль в исходной, нештрйхованной системе координат (тем самым мы временно выделяем эту систему координат). Исследуем подробно, к чему сводится это утверждение в любой другой системе координат. В любой другой (штрихованной) системе координат упомянутое утверждение выражается посредством равенства ЪА'к дх' д2х. Эх,- Эх/ Эх,- Ъхк Но чтобы записать его в штрихованной системе координат самосогласованным образом, нам лучше заменить At на А\ согласно равенству (2.15) (использованному для обратного преобразования.) Таким образом, ЪА'к дх' д2х, _ - 1_,4' =0. Ъх\ bxj Ъх\ Ъх'к Давайте введем, для сокращения записи, обозначение охп Э X/ Эх/ ЭХ|* Ъхк = Г'"*,. (3.2) *) В настоящее время в советской литературе более употребителен термин "ковариантная производная", но мы будем придерживаться терминологии автора. {Примеч. пер.) 37
Тогда уравнения ЪАк —1- Г'*МА'Я = 0 (3.3) выражают в произвольной системе координат тот факт, что набор производных обращается в нуль в исходной, нештрихованной системе координат. Поскольку произвольное преобразование, переводящее исходную систему координат в штрихованную, можно положить равным и тождественному преобразованию, мы должны сказать, что нештрихованные величины Tnik все равны нулю. И, между прочим, то же самое, очевидно, справедливо для всех систем координат, которые получаются из исходной системы-координат чисто линейным преобразованием координат хку поскольку в этом случае все вторые производные в (3.2) обращаются в нуль. Это - единственное остающееся препятствие, противодействующее идее общей инвариантности и заключающееся в том, что одна система координат, или, точнее, некоторое множество систем координат, выделены предположением, что в ней, или в них, все Г обращаются в нуль. Но это препятствие легко преодолеть: мы просто опустим это предположение. Это очень важный шаг, немедленно ведущий к понятию аффинной связности. Поэтому теперь и в дальнейшем мы не будем определять величины Г условием, что они обращаются в нуль в одной конкретной системе координат и даются равенствами (3.2) в любой другой системе координат. Мы будем рассматривать их как нечто того же общего типа, что и тензорные поля или поля тензорных плотностей, но в действительности отличное и от того, и от другого, - как набор функций, которые (а) можно наделить произвольными значениями в одной конкретной системе координат, и (б) подчиняются такому закону преобразования, который превращает выражение ЪАк —±-АпГпи=Ак.; (3.4) Ъх( в тензор. Символ Л^., является новым обозначением, введенным как сокращенная форма записи выражения, стоящего в левой части. Мы назовем этот набор Г аффинной связностью, наложенной с помощью (а) на наш континуум. Величина Ak;i называется инвариантной производной вектора Ак (по отношению к аффинной связности Г%/), в отличие от обычной производной Aki. Наше предыдущее обсуждение следует рассматривать как частный случай, а именно тот, для которого в пункте (а) мы выбираем нулевые значения для всех Г. Отсюда можно легко вывести, что пункт (б) 38
будет выполнен, если мы примем для rnik такой же закон преобразования, как и для тензора, обладающего такими же тремя индексами, однако, с лишним добавочным членом, как в левой части выражения (3.2). Таким образом, г,П1к__,КЬ^^ Г^ + ^^Г- (3-5) Эх/ Э.Х/ Ъхк bxi Эдс,- ох % Добавочный член не зависит от Г. Следовательно, он одинаков для любых связностей; он зависит только от связи между этими двумя системами координат. Он ответствен за тот факт, что Г не обращаются в нуль в любой системе координат, если даже это имеет место в одной из них. Аффинная связность не является тензором. Формулы ее преобразования линейны, но не однородны. Добавочный член симметричен по отношению к ковариантным индексам к и i величин Г, и вся формула преобразования также симметрична по ним. Симметричность по отношению к нижним индексам является, следовательно, инвариантным свойством связности. (Для антисимметричности это не так\) Если аффинная связность не симметрична, тогда в формуле преобразования для ее антисимметричной части,ib(rnik — Г"1*,), неоднородный член выпадает; эта антисимметричная часть поэтому является тензором. В более общем случае тот факт, что неоднородный член одинаков для любых связностей, имеет следующие важные последствия. к Л к Если мы рассмотрим две аффинные связности Г lm и Г1т в одном и том же континууме (что допустимо и очень часто рассматривается), то их разность Гкш '— Г*/т всегда представляет собой тензор. В частности, если нам придется рассматривать бесконечно малое изменение Гк1т +8Гк1т данной аффинной связности Г*/ш (что иногда приходится делать), то величины &Гк1т являются тензором. Наоборот, сумма аффинной связности и тензора Тк1,п, конечно, всегда является аффинной связностью. Сумма двух аффинных связностей не является аффинной связностью, потому что в законе ее преобразования наиболее важный член будет иметь множитель 2. Однако линейная комбинация двух аффинных связностей является аффинной связностью, если X и /i - либо фиксированные постоянные, либо инварианты, и, кроме того, Х + /!=1. Следовательно, несимметричная аффинная связность всегда представляет собой сумму симметричной аффинной связности и 39
антисимметричного тензора третьего ранга, и, таким образом, ''*!« = 7<Г*/т + Г*т|) + у(Г*7т - Г*т,). (3.6) Понятие антисимметричной аффинной связности бесполезно, потому что это свойство не будет независимым от системы координат. Аффинные связности представляют собой второй, или, если хотите, третий, тип важных для нас объектов, кроме тензоров и тензорных плотностей. Понятие инвариантной производной, введенное нами в (3.4), не является абсолютной концепцией, но относится к определенной аффинной связности, которая должна быть указана. Если введено более одной аффинной связности и желательно иметь сокращенные обозначения (типа точки с запятой, использованной, в (3.4)), то необходимо различать их, используя вместо точки с запятой другие символы, такие, как двоеточие, вертикальную черту и т.п. для обозначения производных, относящихся к различным аффинным связностям. Мы хотим теперь распространить понятие инвариантной производной на другие тензоры, в первую очередь на контравариантные векторы. Обобщение никогда не получается само собой, оно подсказывается некоторым простым руководящим принципом. В настоящем случае кажется естественным потребовать, что (1) обычное правило дифференцирования произведения -C&) = -^+/f- дх дх Ьх должно выполняться и для инвариантного дифференцирования произведений тензоров; (2) в случае инварианта инвариантная производная должна совпадать с обычной производной (поскольку, в конце концов, градиент является тензором — безо всяких добавок!) : Начнем с довольно тривиального замечания, которое, однако, должно быть сформулировано раз и навсегда: поскольку Ak=blkAh правило дифференцирования произведения само по себе говорит нам, что Ak-m =^-kAl;m +8lk.mAl=Ak.m +&!kimAh И поскольку это равенство обязано выполняться для любого век- 40
тора, мы должны иметь Следовательно, смешанный единичный тензор, рассматриваемый в качестве поля, имеет нулевую инвариантную производную по отношению к любой аффинной связности. Рассмотрим теперь инвариантное произведение АкВк двух произвольных векторных полей. Согласно сформулированным выше двум руководящим принципам мы хотим, чтобы выполнялось равенство (АкВк) . = (АкВк).., и, таким образом, АкВк91+Ак9(Вк=АкВк.1 + Ак.{Вк = = AkBk;i + (Akti-Anrnki)Bk. Сокращая члены Ак tBk, мы получаем AkBk;i = AkBk$i + AnB*rnki. Запишем это выражение, поменяв местами немые индексы к,п в последнем члене: Ak(Bk.i-Bki-Bnrkni) = 0. Поскольку Ак является произвольным вектором, то Bk;i=Bk ; + ВпГкпГ (3.7) Это дает выражение для инвариантной производной контравариант- ного вектора, являющееся двойником выражения (3.4), то только п слегка измененных обозначениях, причем запятая обозначает обычную производную ЪВк1Ъх(. Если у вас имеются сомнения насчет того, что это Вк t является тензором,- вернитесь назад к более раннему выражению, из которого было выведено равенство (3.7), а именно к (AkBk)9i = AkBk.t+Ak;iBk. Здесь Ак произвольно, а относительно всех членов, за исключением первого в правой части, известно, что они являются векторами, следовательно, В ;|. является тензором. Еще одно замечание: рассмотрим Вк . + BnTkin. (3.7а) ('Мы допустили ошибку с нижними индексами!".) Что это за 41
объект? Если Г симметрично, это не имеет значения. Ну, а что, если оно несимметрично? Конечно же, это - тензор, и, конечно же, он является инвариантной производной вектора Вк9 но только не по отношению к рассматривавшейся нами аффинной связности, а по отношению к другой аффинной связности, получающейся из нее перестановкой нижних индексов. Это тривиально. Но следует заметить также, что не возникает никакой логической несогласованности, если мы решимся принять (3.7а), а не (3.7) в качестве определения инвариантной производной контравариантного вектора по отношению к той же самой аффинной связности, для которой в ковариантном случае было принято выражение (3.4). Но, конечно, при таком выборе правило дифференцирования произведения не будет выполняться для дифференцирования, обозначаемого точкой с запятой! Однако это только замечание в сторону, не влекущее за собой каких-либо последствий. Иными словами, мы будем придерживаться (3.7). В случае тензора общего типа т it/... mn... мы применим аналогичные рассуждения к инварианту TkL~pq AkBL„FPG«~ с произвольными векторами Ак ... Gq ... ; и таким образом мы получим результат для инвариантной производной от Г, который сначала выразим словами, а затем выпишем. К обычной производной добавляется дополнительный член, по одному на каждый индекс тензора Т. Каждый такой член состоит из (свернутого) произведения компоненты тензора Т и компоненты связности Г, причем произведение строится в точности по образцам (3.4) или (3.7) соответственно, при этом с тензором обращаются так, как если бы у него был только этот один индекс, а все другие не принимаются во внимание, т.е. при построении данного конкретного произведения они остаются неизменными. Таким образом, rpkl... _ rpkl... . rpnl... pfc . rpkn... rW 1 pq...\i l pqr...,i * pq... ni^1 pq...1 ni~ -Tk'-nq..rnpi-Tk'-p„..r"qi- ... (3.8) Заметим, что индекс производной всегда является вторым кова- рйантным индексом связности Г, а два остающихся места используются для размещения немого индекса и индекса, отсутствующего в тензоре Т, в котором он был заменен немым индексом. Если запомнить это правило и знаки, то приведенную выше формулу легко выучить наизусть вопреки сбивающей с толку "пляске" индек- 42
сов! Чтобы распространить понятие инвариантного дифференцирования на плотности, мы дополним наш руководящий принцип следующим наиболее естественным образом, а именно потребуем, чтобы: (1) правило дифференцирования произведения было применимо также и в случае, если один из множителей является плотностью; (2) численно инвариантная плотность е,к1т, рассматриваемая как поле, должна иметь нулевую производную. Давайте положим для скалярной плотности ®: где Л' — величина, которую надо найти (мы пока не знаем, что означает величина ® .(, мы как раз и собираемся дать ей определение!). Рассмотрим теперь любую плотность I "* . Если разделить ее на произвольную скалярную плотность в, то вы получите тензор, поэтому вы можете положить, что %" = «Г".., где Т (не считая того, что он является тензором, а не плотностью) имеет тот же тип, что и Z'*' . Мы постулируем, что ST...., =в * Т'\ ,t +6;, Г" = <5 • Т •" ;/ + в j Г" + ЛТ". . Легко видеть, что первый и второй члены в правой части, взятые вместе, составляют как раз "обычные члены", образованные так, как если бы величина £ ... была тензором. Поэтому мы можем записать: I""..../ = "обычные члены" + (Х/&) X Поскольку величина в была совершенно произвольной, а X зависит только от нее одной, множитель X/ в не должен зависеть от £'" и может быть найден из рассмотрения любого частного случая. Мы найдем его из требования q = klmri —Q^^r/m/ipfc ^_ krmtipl + + €k!rnrmri + €klmrVnri + (Х/Ъ)€к1т". При суммировании по г только один член выживает в каждом случае, а именно, члены с г = к, /, т9п соответственно. Поэтому мы выводим отсюда, что 0 = ек1тп(Ггн + Х/&), и, таким образом, ЛУ6«-Г'Г,. 43
Следовательно, в конечном итоге добавочный член в инвариантной производной любой плотности %'" имеет вид -гГп «'".... (3-9) причем все индексы плотности % остаются неизменными. Легко показать, что не только использованные нами руководящие постулаты приводят к однозначным определениям для инвариантных производных тензоров и плотностей, но и наоборот, если принять эти определения, то все приведенные выше требования действительно будут выполняться. ГЛАВА 4 НЕКОТОРЫЕ СООТНОШЕНИЯ МЕЖДУ ОБЫЧНЫМИ И ИНВАРИАНТНЫМИ ПРОИЗВОДНЫМИ До того как мы ввели понятие аффинной связности, мы узнали в конце главы 2, что определенные линейные комбинации обычных производных в любом случае являются тензорами. Они не могут, конечно, утратить данное свойство в результате того, что мы наложим связность и введем понятие инвариантной производной по отношению к этой связности. Однако соответствующие линейные комбинации инвариантных производных также являются тензорами — a fortiori *), поскольку инвариантные производные и по отдельности являются тензорами. Вопрос в том, являются ли они теми же самыми тензорами или нет. Сначала мы исследуем случаи, обозначенные 1—4 в главе 2. В случае градиента от инварианта не возникает никаких вопросов: один из наших руководящих принципов заключался в том, что пдя инварианта </? мы имеем А как насчет ротора от ковариантного вектора? Согласно (3.4) Ak.i-Ai.k=AKi-Aitk-An(rnki-rnik). (4.1) Таким образом, "ковариантный ротор" совпадает с обычным ротором, если и только если связность симметрична. Выводить и помнить общие утверждения (если вам не нужно сдавать экзамен — в этом случае от вас часто ожидают, что вы запомните всякую ерунду, которую больше никто не знает, наизусть) *) A fortiori (лат.) - тем более. (Примеч. пер.) 44
полезно только, если их приходится часто употреблять. Случаи, с которыми не приходится очень часто иметь дело, "дешевле" исследовать только по мере их возникновения. Несимметричные связности используются очень редко. Следовательно, чтобы не обременять читателя неоправданным мертвым грузом, мы ограничим последующие исследования в этом разделе случаем симметричных аффинных связностей, настоятельно подчеркивая, однако, что наши утверждения определенно ограничены этим случаем. Нетрудно убедиться прямым вычислением в том, что две циклические дивергенции, рассмотренные в пунктах (3) и (4), также не зависят от того, образованы они из обычных или из инвариантных производных. Иными словами, если окажется, что эти образования содержат "точки с запятыми", то вместо них можно (как и для ротора) поставить более простые "запятые". Случаи (4') — (l'), относящиеся к плотностям, не требуют дальнейшего исследования, ибо они, в сущности, совпадают с (4)—(1) вследствие общей взаимосвязи между антисимметричными тензорами и тензорными плотностями дополнительного ранга. В самом деле, удостоверившись, например, что Aik.i+ Akl.t+ Аи.к = А1кг + Akli+ Aliki (4.2) мы должны только положить Of m - , с lm ik Л Тогда ЭЯ1т/ 1 ,.„ ЪА1к =T€m,i* — =±(Л/*,/+Л*и+Л|Л*) Ъхг 2 Эл:/ 1 так что 9lm/;/= %m\t. (Знак в обоих случаях совпадает со знаком перестановки mlik: мы воспользовались тем фактом, что emllk ,s = 0, а это, как мы помним, было одним из наших "руководящих принципов".) Поэтому можно считать, что путем прямой проверки мы удостоверились в эквивалентности использования "точки с запятой" и "запятой" для всех восьми случаев. Но от этих вычислений можно избавиться с помощью другого доказательства, которое является более коротким, еще более проясняющим смысл, и применимо ко 45
всем восьми случаям в отдельности. Мы проиллюстрируем его на примере равенства (4.2). Чтобы непосредственно доказать это равенство, заметим, что его первый и второй члены являются тензорами. Кроме того, согласно общему свойству инвариантной производной их разность является линейной комбинацией компонент Тк1т. Будучи разностью двух тензоров, она должна быть тензором. Но не существует отличного от нуля тензора, образованного линейным образом из компонент одной только симметричной связности. (Это может показаться огульным утверждением; но в последнем абзаце данной главы мы приведем простой довод в его пользу.) Из несимметричной связности можно образовать подобный тензор, а именно - взяв ее антисимметричную часть — (Г*/ш — Г*т/). В этом причина того, что наши утверждения в данном случае не справедливы. Равенство, следующее из примера (4'), **;*= «*,*, (4-3) влечет за собой полезное правило для "интегрирования по частям по отношению к инвариантной производной" в четырехмерных, т.е. пространственно-временных интегралах. Это правило очень простое. При интегрировании по частям точка с запятой может трактоваться, как если бы она обозначала обычную производную при условии, что вы строго придерживаетесь того предписания, что только инвариантные плотности могут фигурировать в качестве подынтегральных выражений. Это доказывается следующим образом. Предположим, что вы имеете интеграл следующего вида I=f(A"\J(B"'J.kd4x9 (4.4) где А и В являются тензорными объектами (тензорами или плотностями), индексы которых указаны только точками. Легко усмотреть теперь, что поскольку подынтегральное выражение должно быть скалярной плотностью, то объект, возникающий после отбрасывания ковариантного индекса к (т.е. инвариантного дифференцирования), должен быть контравариантной векторной плотностью *), скажем, Ж*: А'...в '"...= «*• *) Доказательство: ЛВ.^ является скалярной плотностью. HoABF^ (где Fk - произвольный вектор) преобразуется точно так же и, следовательно, также является скалярной плотностью. Поэтому ЛВ является контравариантной векторной плотностью. 46
Кроме того, из правила дифференцирования производной (одного из наших "руководящих принципов"!) следует, что (A "\,B'J.k = (А"\)(В - );fc + (А"' );к(В'\ ). Следовательно, '=/[*";* -04"...).*(* "...)№**■ С учетом формулы (4.3) первый член можно свести к интегралу по (трехмерной) "поверхности". Это доказывает нашу теорему. Во многих приложениях (особенно к вариационному исчислению) первый член обращается в нуль, и мы имеем I=-f(A" ).k(B'\Jd*x. Это правило вовсе не тривиально. В каждом из множителей А или В символ (;) отнюдь не обязан быть эквивалентным простому (,). Например, (4.4) может иметь вид /=-/H/mn).fc(fc"*/m)<*4 где ни тензор А ни плотность SB не обязаны обладать какой-либо симметрией по отношению к своим индексам. Если, как это иногда делалось с намерением упростить положение вещей, отказаться от предписания, допускающего только инвариантные подынтегральные выражения, то упомянутое правило не будет применимо — с печальным следствием чрезвычайного усложнения анализа. Удобно добавить сюда еще один пример, в котором инвариантные производные могут быть заменены — хотя и по совершенно иным соображениям — обычными производными. Всегда можно так ввести систему координат, что эти два вида производных будут совпадать в одной конкретной точке континуума, т.е. можно выбрать систему координат, в которой все компоненты Г'^/ обращаются в нуль в этой точке. Это можно продемонстрировать следующим образом. Мы указывали в главе 3, что упомянутые компоненты преобразуются как тензор, но с добавлением к обычной формуле левой части выражения (3.2). Таким образом, дх'- bxs dxt Ъх) Ъ2хт oxr Ъхк Эх, Ъхт Ъхк dxt Мы хотим, выбрав подходящее преобразование, обратить в нуль в одной точке все величины Г* — скажем, для простоты, в точке хк = 0. Выберем преобразование таким образом, чтобы обратное преобразование имело в этой точке аналитическое разложение хк=х'к+Ъа*тх\х'т+... 47
Предположим, что акт1 = ак1т, поскольку мы, очевидно, ничего не получим нового, предположив обратное. Из формулы (4.5) мы получаем, что в точке л:* = х'к = О 1Л, = г'„+в'„ = о при условии, что мы выбрали Подобный выбор координат соответствует тому, что называется геодезической системой координат (или геодезическими координатами) . Полное словесное описание состоит, конечно, в том, что это — система координат, являющаяся геодезической в определенной точке для определенной симметричной связности. Ясно, что если Г не симметричны, их нельзя "удалить с помощью преобразования" даже в одной точке. В этом нет ничего удивительного, потому что антисимметричная часть является тензором, который нельзя заставить обратиться в нуль в какой-то системе координат, если он не обращается в нуль в другой системе координат. С другой стороны, для данной цели вовсе не требуется, чтобы связность Г была глобально симметричной, т.е. чтобы Г была "симметричной аффинной связностью". Она должна быть симметричной только в рассматриваемой точке. (А это свойство, если оно имеет место, является инвариантным. Оно означает, что антисимметричный тензор в рассматриваемой точке оказался равным нулю.) Геодезическая система часто является очень удобной в расчетах, но необходимо всегда помнить, что она упрощает дело только в одной точке и больше нигде, даже в соседних с ней точках. Я имею в виду то, что производные от Г не обращаются в нуль, и необходимо быть внимательным в ходе расчетов и не отбрасывать такие Г, которые могли бы впоследствии появиться под знаком производной по координатам. Еще одним следствием является доказательство правильности нашего "огульного утверждения" на стр. 45, что не существует ненулевого тензора с компонентами, являющимися линейными комбинациями компонент симметричной аффинной связности. В самом деле, такие линейные комбинации, независимо от того, чему равны их коэффициенты, должны все обращаться в нуль в геодезической системе координат, и следовательно, если они образуют тензор, — то и в любой системе координат. Поскольку это рассуждение применимо в любой точке континуума, то тензор, описанный выше, обращается в нуль тождественно. 48
ГЛАВА 5 ПОНЯТИЕ ПАРАЛЛЕЛЬНОГО ПЕРЕНОСА Имеется и другой способ введения понятия аффинной связности и инвариантной производной. Ввиду фундаментального характера этого понятия во вслех наших рассуждениях мы покажем и этот способ. Набор производных ЬАк/дх( не образует инвариантного объекта, потому что они получены путем "недопустимой" процедуры вычитания вектора Ак в точке Р из вектора Ак +dAk в другой точке, а именно в близлежащей точке Q с координатами xt + dxri (где xt — координаты точки Р). Их разность dAk не является вектором. Следовательно, согласно правильной формуле dAk= dxh Эх,- ЪА k/dXj не может быть тензором, поскольку dxt — вектор. Чтобы исправить этот недостаток, вы должны с целью формирования производной вычесть из Ak +dAk не вектор Ак в точке Р, а некоторый вектор в точке Q, который для данной цели, так сказать, заменяет Ак, т.е. играет роль "неизменного", или "исходного" значения функции при обычном дифференцировании. Другими словами, вы должны оговорить, какое изменение в компонентах вектора Ак при перемещении из точки Р в точку Q вы будете, по определению, рассматривать как "отсутствие изменения". (Простое предположение, что отсутствие изменения в численных значениях компонент как раз и должно означать "отсутствие изменения" для самого геометрического объекта, не вполне удовлетворительно, потому что это требование не является независимым от системы координат.) Пусть этот "заменитель в точке Q вектора Ак из точки Р*\ или этот "по определению не претерпевший изменений объект в точке Q, соответствующий объекту Ак в точке Р" называется Ак + ЬАк. Естественно, величина ЬАк, будучи разностью вектора в Q (а именно вектора Ак + ЬАк) и вектора в Р (а именно Ак), также не является вектором, подобно тому как не является вектором dAk и по той же самой причине; но dAk — ЬАк является вектором. Величину ЪАк необходимо сделать зависящей от двух векторов Ак и dxit и она не может зависеть больше ни от чего другого. Кроме того, необходимо, чтобы она обращалась в нуль одновременно 4.Э. Шредингер 49
с каждым из этих векторов. Однородная линейная зависимость как от Ак, так и от dxt представляется наиболее простым решением. Рассмотрим поэтому билинейную форму от этих двух векторов: dAk = -rkuAldxi9 (5.1) где Г, представляющие собой набор 64 коэффициентов, являются функциями координат, вновь введенных с точки зрения, принятой в данной главе (но, конечно, мы согласовали обозначения с использованными в главе 3). Поскольку Ак и dx{ являются векторами, а ЬАк — нет, коэффициенты Г не образуют тензора. Они подчиняются линейному, но неоднородному закону преобразования, уже указанному в главе 3, уравнение (3.5). Это легко показать, потребовав, чтобы соответствие между векторами Ак в Р и Ак + ЬАк в Q существовало за счет преобразования координат. Доказательство мы здесь опустим. Вектор A*+6Ak=Ak-rkliAldXi (5.2) называется параллельно перемещенным (или параллельно перенесенным) вектором. Инвариантная производная Ак;i теперь определяется таким образом: _{Ak+dAk-Ak-dAk)dx.*0 dx( .w-мч.,,».. (53) dX( что в точности согласуется с (3.7). Коэффициенты Г устанавливают линейное взаимно однозначное отображение друг в друга "векторных ежей" заданных в близлежащих точках. Линейное отображение между двумя наборами четырех функций требует 16 произвольных коэффициентов, но поскольку имеется °°4 близлежащих точек, мы имеем 64 коэффициента. В элементарной геометрии линейное преобразование координат называется аффинным преобразованием. Геометрические фигуры, превращающиеся друг в друга при таких преобразованиях, называются аффинно эквивалентными - например, сфера и концентрический эллипсоид в трех измерениях. Геометрия "при такой группе" называется "аффинной геометрией": в ней рассматриваются только такие свойства, которые инвариантны относительно аффинных преобразований и являются, таким образом, одинаковыми 50
для любых аффинно связанных геометрических фигур, например, все эллипсоиды, включая сферу, рассматриваются как одна и та же фигура. Вот как возникло название "аффинная связность". Это название, в силу двух причин, не, является хорошим. Во-первых, уже в многообразии без связности, в любой точке общее координатное преобразование влечет за собой некоторое аффинное преобразование. С другой стороны, коэффициенты Г указывают вовсе не на произвольную аффинную связь между соседними точками, а выделяют раз и навсегда одну конкретную связь. На этом покончим с объяснением и критикой терминологии. В соответствии с замыслом данной главы мы должны теперь перейти к определению, по аналогии с (5.1), параллельного переноса для любого тензора или тензорной плотности, используя в качестве руководящих принципов: (1) что произведение переносится с помощью переноса всех его сомножителей, (2) что инвариант не должен изменяться при переносе, (3) что б-плотность не должна изменяться при переносе. Таким способом легко вывести, что изменение ЬТк1 "pq„. любого тензора при переносе должно даваться выписанными в (3.8) дополнительными членами, умноженными на (— dXi). В случае тензорной плотности любого типа необходимо добавить член (3.9), умноженный на (— dX(). Инвариантные производные определяются затем в полной аналогии с (5.3) и совпадают, конечно, с производными, заданными выражением (3.8), с "поправкой" (3.9) в случае тензорной плотности. На всем протяжении данной главы ничто не подсказывало нам, что Tklm должны быть симметричными по / и ш. И поскольку также и в предыдущих главах ничто не заставляло нас принять это предположение, мы не будем выдвигать его в общем случае, а будем рассматривать симметричную аффинную связность как частный (хотя и часто встречающийся и важный) случай, и каждый раз указывать, что мы имеем дело именно с ним, а не с общим случаем. То свойство аффинной связности, что она учреждает систему параллельных переносов, является наиболее фундаментальным. Таким образом, подход, в котором оно выходит на первый план, а понятие инвариантного дифференцирования остается на втором плане, является более фундаментальным, чем тот, которому мы следовали в главе 3. Необходимо еще раз подчеркнуть тот факт, каким бы простым и очевидным он ни казался, что параллельный перенос нулевого тензора или нулевой тензорной плотности снова дает нуль. Этот 4* 51
факт имеет своим следствием то, что любое тензорное уравнение всегда сохраняет свой вид при параллельном переносе, точно так же как и при координатном преобразовании. В самом деле, уравнение всегда может быть сведено к утверждению, что некоторая линейная комбинация произведений тензоров равна нулевому тензору того же типа (т.е. имеющему такие же контравариантные индексы и представляющему собой соответственно либо плотность, либо тензор). Но будьте, пожалуйста, осторожны! Уравнение выполняется в другой точке для параллельно перенесенных тензоров. Но тензоры могут быть полями. И их действительные значения в другой точке не обязаны совпадать и, как правило, не совпадают со значениями, полученными с помощью параллельного переноса. Так что уравнение не обязано выполняться для самих тензорных полей в близлежащих точках. Это тем более необходимо подчеркнуть, что фактически эти уравнения очень часто выполняются и там, и вообще везде, а именно в тех случаях, когда они являются полевыми уравнениями, для которых было явным образом установлено или провозглашено, что они выполняются в любой точке. ГЛАВА 6 ТЕНЗОР КРИВИЗНЫ Проблема интегрируемости Наиболее интересным и чрезвычайно важным вопросом, возникающим при изучении аффинной связности и параллельного переноса, скорее всего является следующий. Если вы рассматриваете тензорный объект, например, контравариантный вектор Ак в точке Р (не обязательно принадлежащий какому-то "полю"), и с помощью непрерывного параллельного переноса перемещаете его по замкнутому контуру С обратно в точку Р, то объект в общем случае (т.е. для произвольной аффинной связности) не вернется к своему исходному значению, и вы получите в точке Р другой объект, скажем, вектор Ак Ф Ак. Тот же самый факт можно выразить по- Рис 1 другому, сказав, что результат переноса Ак 52
из Р в любую другую точку Q будет, как правило, зависеть от пути. К примеру, если перенос вектора Ак через S в Q дает, скажем, Ак (S), то перенос через R даст в Q нечто другое, скажем, Ак (R) Ф Ф Ak(S). Ибо перенос туда и обратно вдоль одной и той же кривой, очевидно, является обратимым; поэтому если Ак (R) =Ak(S)y тогда Ак =Ак, и наборот. Ь ^(S) Рис.2 Если перенос не зависит от пути для любого вектора Ак (и тогда, как мы увидим, также и для любой тензорной плотности), то мы будем называть аффинную связность интегрируемой, — или, возможно, интегрируемой в некоторой области, если независимость от пути выполняется только для точек и путей внутри определенной области *). Является ли аффинная связность интегрируемой или нет, определяется, как мы сейчас увидим, тем, равен ли нулю или нет некоторый тензор четвертого ранга, называемый тензором кривизны или тензором Римана — Кристоффеля и играющий центральную роль во всех теориях структуры пространства — времени, так что мы непрестанно будем иметь с ним дело во всех последующих рассуждениях. И, конечно, именно неинтегрируемый случай, когда этот тензор не обращается в нуль всюду (искривленное многообразие), представляет наибольший интерес. Сейчас, однако, мы займемся накоплением информации относительно интегрируемого случая с помощью более непосредственного метода. В этом случае пусть hv будет некоторым вектором (не полем) в точке Р. Поскольку теперь параллельный перенос не зависит от пути, мы можем "размазать" hv, превратив его в поле с помощью параллельного переноса из точки Р, определяя вектор поля hv условием, что его действительное изменение при переходе из одной точки в следующую должно быть равным изменению при параллельном переносе. Воспользовавшись введенными ранее *) Свойство независимости переноса от пути во всем пространстве называют иногда абсолютным параллелизмом. {Примеч. ред.) 53
обозначениями, это можно выразить как dhv = bhv, или, в более подробной записи, Поскольку данное равенство должно выполняться при любых dx\, это равносильно наложению на hv дифференциального уравнения ^=-rV** (6.1) вместе с начальным условием, что в точке Р поле h должно принимать заданное там значение. Некоторая несогласованность, заключающаяся в том, что мы сначала использовали символ hv для обозначения вектора в точке Р, а теперь используем его для векторного поля, полученного интегрированием уравнения (6.1), не существенна. В самом деле, после "размазывания" точка Р больше не является выделенной; векторное поле в любой точке получается с помощью параллельного переноса из любой другой точки по любому пути, соединяющему эти две точки. Такое положение дел (и аналогичное для случая других тензорных полей) можно охарактеризовать, сказав что аффинная связность Г переводит (с помощью параллельной) переноса) векторное поле h само в себя. Заметим, кстати, что в соответствии с определением (3.4) уравнения (6.1) утверждают лишь, что h имеет равную нулю инвариантную производную. Проделаем теперь то же самое с четырьмя линейно независимыми векторами в точке Ру которые мы занумеруем с помощью нижнего индекса а\ таким образом, мы имеем hva с *=1,2,3,4. Мы могли бы с тем же успехом использовать вместо этих индексов, которые не следует путать с тензорными индексами, четыре разные буквы, например, hv t ^\ fv, jv, для обозначения наших четырех векторов. Нумерация является более удобной, потому что с точки зрения целей настоящего исследования оказывается удобным распространить соглашение о суммировании и на эти нижние индексы, в том случае, когда они появляются дважды (хотя они всегда будут писаться внизу, будучи просто метками). Мы выбрали четыре вектора hva линейно независимыми в точке Р. Эта линейная независимость будет, очевидно, выполняться для векторных полей в любой точке просто потому, что линейное соотношение cxh\ + сгК + съНръ + c4hS = 0 (6.2) (где cjc — постоянные числа, не все равные нулю) будет сохраняться при параллельном переносе, и поэтому, если оно выполнялось 54
в некоторой точке поля, оно будет выполняться и всюду, а следовательно, также и в точке Р. Таким образом, мы имеем теперь четыре векторных поля, описываемых соотношениями bhva 17t""r^*e«- (6-3) дхх Они представляют собой 64 линейных неоднородных уравнения с отличным от нуля детерминантом*), из которых 64 величины Г могут быть найдены повсюду. Мы найдем их стандартным способом. Нормированные миноры детерминанта hpa мы назовем hva (под нормированным мы подразумеваем поделенный на детерминант) . Тогда hpah\-b%. {в АЛ (В оправдание данных обозначений: Ира для фиксированного а является ковариантным векторным полем. Это видно из следующих соображений: (а)предыдущие уравнения должны выполняться в любой системе отсчета, причем hpa всегда имеют смысл нормированных миноров; (б)величины hpa однозначно определяются этими уравнениями; (в) уравнения сохраняют свой вид, если hva преобразуются как компоненты векторов.) Мы отметим еще тот факт,1 что и наоборот, величины hva являются нормированными минорами детерминанта hva. Теперь "умножьте" (т.е. умножьте и просуммируйте под) уравнение(6.3) на Лрд, и тогда с помощью (6.4) вы получите г%х = -*р.^. (6-5) Это соотношение показывает, что интегрируемость представляет собой серьезное ограничение на аффинную связность. Оно позволяет выразить 64 функции Г через компоненты четырех векторных полей, т.е. с помощью всего лишь 16 функций. Вышеприведенное представление для интегрируемой связности имеет особенно простые следствия, если величины Г симметричны по двум своим ковариантным индексам. Поэтому мы предположим также, что Теперь согласно (6.4) уравнения (6.5) можно записать в *) Нетрудно показать, что детерминант может обратиться в некоторой точке в нуль тогда и только тогда, когда в этой точке выполняется соотношение типа (6.2). 55
эквивалентной форме: .- =Л. ^1 (6.7) Таким образом, из предположения (6.6) следует, что \ Ъхх Ъхр / и поэтому, поскольку детерминант не обращается в нуль, Эхх Эдср или словами: четыре ковариантных векторных поля hpa имеют равный нулю ротор. Это дает нам возможность следующим образом ввести новую систему координат. Фиксированной точке Р мы припишем координаты 0, 0,0,0. Любой другой точке Q мы припишем координаты Q ya=fheadxp (* = 1,2,3,4). (6.9) р В самом деле, из общего анализа известно, что уравнения (6.8) являются необходимыми и достаточными условиями независимости данного контурного интеграла от пути. Кроме того, производные координат у по дс, очевидно, равны Образуя нормированные миноры для обеих частей уравнения, вы получите = hpa. *Уа " Следовательно, (6.7) может быть выражено таким образом: = J5l J4l . (6Л0) рк Ъуа ЪхрЪхх Сравнивая это равенство с определением (3.2) и принимая во внимание связанный с последним контекст, мы заключаем, что: Наша интегрируемая симметричная аффинная связность Г может рассматриваться как результат преобразования аффинной связности, имеющей нулевые компоненты в ^-системе координат, из ;>-системы координат в х-систему координат. Или, обращая утверждение: все компоненты нашей связности после преобразования к ^-системе координат всюду обращаются в нуль. 56
Таким образом, симметричная интегрируемая аффинная связность является очень простой вещью, ее всегда можно "преобразовать в нуль". Нет ничего удивительного в том, что эта теорема ограничена симметричным случаем. Ибо вспомните, что несимметричная аффинная связность общего вида может быть разбита на сумму симметричной аффинной связности и антисимметричного тензора третьего ранга. Эта два объекта целомудренно остаются разделенными при преобразованиях. И, конечно, антисимметричная часть, будучи тензором, никогда не может быть уничтожена с помощью преобразования, если она не обращалась в нуль с самого начала. В общем случае мы можем сказать только то, что требование интегрируемости в каждом случае приводит к возможности выразить компоненты аффинной связности с помощью 16 компонент четырех векторных полей. Уменьшение было бы еще значительнее в случае несимметричной аффинной связности (которая имеет64независимые компоненты), чем в случае симметричной аффинной связности, которая, вообще говоря, может иметь 40 независимых компонент. Тензор кривизны Если заданы 64 функции Г"аХ, образующие аффинную связность, то трудно сразу сказать, могут ли они быть выражены в форме (6.5) или нет. Поэтому мы займемся поисками критерия интегрируемости, который можно было бы применять прямо к полю Г, если оно задано. Вывести необходимое условие очень легко. Чтобы требование интегрируемости выполнялось, уравнения (6.1) должны допускать решение для векторного поля hv с произвольными начальными значениями. Тогда смешанные вторые производные компонент полей, образованные двумя различными способами, должны, конечно, совпадать. Следовательно, мы должны иметь о = -Г" (Г"ахЛ") + ^-(Г"амл*) = = ( - + S2i)A«-reX + Г* . (6.11) Воспользовавшись уравнением (6.1) для того, чтобы выразить первые производные, мы получаем (помните об обозначениях для немых индексов!) \ *** *** I (6Л2Л 57
где мы ввели сокращенное обозначение В для выражения в скобках. Поскольку это равенство выполняется при произвольном Иа9 мы должны иметь *"«*„= 0 (6.13) в любой Системе отсчета (что оправдывает предположение, что величины В образуют тензор). Таким образом, это - необходимое условие интегрируемости. Оно является также и достаточным, и чтобы понять это, мы заметим, что наше требование (6.11) в точности было бы хорошо известным необходимым и достаточным условием совпадения дифференциала Пфаффа -Г\хЬа<Ьк (6-14) (представляющего собой Sha для параллельного переноса вдоль dx\) с полным дифференциалом, если бы ha были заданными функциями координат. В общем случае они таковыми не являются, но заранее накладывать на них такое требование привело бы нас к порочному кругу, поскольку это как раз то, что мы хотим доказать. Однако в малой окрестности любой точки уравнения (6.1) совместно с (6.11) в действительности достаточны для нахождения первых и вторых производных от ha однозначным и непротиворечивым образом. Следовательно, если заданы начальные значения в некоторой точке, мы можем найти поле ha в малой окрестности этой точки, вплоть до величин второго порядка по разностям координат. Если подставить эти функции ha в выражение (6.14), оно станет дифференциалом Пфаффа, условия интегрируемости которого (6.11) будут выполнены вплоть до первого порядка по разностям координат (только до первого, потому что они содержат производные от ha). Интеграл от выражения (6.14), вычисленный по любому малому циклу, содержащемуся в этой окрестности, будет, следовательно, равен нулю с точностью вплоть до второго порядка, иными словами, интеграл может иметь самое большее третий порядок. Рассмотрим теперь две бесконечно близкие кривые С и С', ведущие из точки Р в удаленную точку Q. Исходя из начальных значений ha9 заданных в Р, мы сначала построим поле ha в окрестности Р, выберем близлежащую точку на С, находящуюся в этой окрестности, проделаем то же самое в ней и так далее, до тех пор, пока мы не достигнем точки Q. При всем этом мы позаботимся о том, чтобы полная сумма наших малых областей покрывала бы также и кривую С'. Тогда, во-первых, величины ha, полученные таким образом в точке Q9 могут быть "неправильными" (по 58
сравнению с точным переносом) только на величину первого порядка малости. Во-вторых, если рассечь полоску, заключенную между С и С', на малые элементы поверхности, интеграл по замкнутому контуру, окружающему его, будет иметь малость по крайней мере третьего порядка, откуда легко вьюести, что линейные интегралы, вычисленные вдоль С и С', не могут отличаться более чем на величину второго порядка малости. Q Q р VV Рис.3 Таким же способом можно постепенно малыми шагами превратить кривую С в любую другую кривую, соединяющую точки Р и Q. Линейные интегралы будут тогда отличаться только на величину первого порядка малости. Делая отрезки на кривых и шаг между последовательными кривыми все меньше и меньше, вы в конечном итоге докажете, что равенство (6.13) является также и достаточным условием юго, что перенос контравариантного вектора является интегрируемым. Доказательство этого и было нашей целью. Независимость переноса от пути для ковариантного вектора следует из выполнения такого требования для контравариантного вектора, потому что инвариант ВкАк остается неизменным при переносе для фиксированного вектора Вк и произвольного Ак. Аналогичным образом можно доказать то же самое для высших тензоров и тензорных плотностей. Если условие (6.13) не выполнено, любой вектор ha, тем не менее, может быть "размазан" в соответствии с (6.1) в окрестности некоторой точки, но только вплоть до величин первого порядка малости. Используя это ha в (6.14), можно указать величину интеграла от соответствующего дифференциала по бесконечно малому замкнутому контуру с помощью известной из математики теоремы Стокса. Для бесконечно малого четырехугольника с вершинами в точках хк, хк + dxk, хк + dxk + 5*^, хк + Ъхк мы получим *"вхдЛв*А (615) 59
в качестве величины, на которую изменяются компоненты вектора hv' при параллельном переносе вокруг четырехугольника. Но эта теорема не может быть распространена на конечный замкнутый контур — просто потому, что в этом случае для конечной области не существует поля /га, к которому ее следовало бы применить! Поскольку комбинация (6.15), будучи разностью двух векторов в точке хк, сама по себе является вектором, и при этом для произвольных векторов па, dxa, 6xa, отсюда следует, что В является тензором четвертого ранга. Другое доказательство этого важного факта возникает в результате использования другого способа получения Z?-компонент, который интересен и сам по себе, основанного на коммутации двух инвариантных дифференцирований для любого тензора. Например, для контравариантного векторного поля вы получите непосредственным вычислением А";К» -А";^= -Плд А*- (Г\д - Г^М";,- (6-16) Второй член в правой части обращается в нуль, если Г является симметричной аффинной связностью, ибо он зависит только от его антисимметричной части. Последняя, однако, будет тензором в любом случае, и поэтому, поскольку поле А произвольно, отсюда немедленно следует, что В — тензор. В наиболее общем случае (несимметричной аффинной связности) тензор В имеет только одно очевидное свойство симметрии — он является антисимметричным по двум последним нижним индексам X и д в используемых нами обозначениях. Легко видеть, что он имеет тогда 4 X 4 X 6 = 96 независимых компонент. Если связность Г симметрична, то мы из явного выражения (6.12) заключаем, что В имеет вдобавок циклическую симметрию *^+*V«+*V»x=0. (6.16а) Чтобы подсчитать для этого случая число независимых компонент, придадим сначала индексу v фиксированное значение. Затем возьмем для нижних индексов некоторый триплет а Ф X Ф ц . Из трех независимых компонент, которые в этом случае оставляет нам явная антисимметричность по последней паре, одна может быть выражена через две другие посредством вышеупомянутого соотношения. Это оставляет две компоненты для каждого трипле- та а Ф X Ф ц и, таким образом, восемь для четырех различных триплетов. В том случае, если два индекса из трех а, X, /i окажутся равными (для чего имеется 2 X 6 = 12 возможностей), явная антисимметричность оставляет только одну независимую компоненту в каждом случае (например, Вь\\г = —В"гг\> а Виi22 = 0)- Кроме того, циклическое условие в этом случае выполняется автоматически; оно повторяет условие антисимметрич- 60
ности, следовательно, мы имеем еще двенадцать компонент — и это все. Таким образом, мы имеем 8 + 12 = 20 при фиксированном v и, следовательно, всего 80; итак тензор Римана—Кристоффеля для симметричной аффинной связности имеет восемьдесят независимых компонент. Позднее мы познакомимся со случаем еще более высокой симметрии и особой важности, когда число компонент уменьшается всего до двадцати. Тензор В может быть свернут по индексам (у, а), или (уу X), или (v, /x), но две последние свертки в силу антисимметричности не являются существенно различными. Возьмем из (6.12) выражение для тензора В и добавим еще выражения для двух его сверток, используя другие обозначения (более привычные), отличающиеся от тех, к которым мы пришли случайно: Di _ kl , km , р,/ р,а pi pa а klm Г + — +1 a/1 km " * am1 kl* oxm dX/ Rkl~B ki0 + — + 1 ali kp-l a/jl ki OXa OX/ (тензор Эйнштейна*)) S,m=B^lm=-^L + iL«L (6.17) oxm dxt (вторая свертка). В последней формуле замечательно то, что простой "ротор" четырех компонент Гаа/ (которые не являются ковариантным вектором) оказывается тензором. Тензор Rki в общем случае не является симметричным даже в том случае, когда связность Г симметрична (второй член мешает даже в этом случае). В любом случае, конечно, его симметричная и его антисимметричная части также являются тензорами. Более того, его антисимметричная часть сводится к — Skl, если связность Г симметрична. Следовательно, в случае симметричной аффинной связности в действительности имеется только одна важная для дальнейшего свертка тензора В, а именно тензор Эйнштейна. Имея под рукой довольно сложные формулы для В и R, мы хотели бы добавить очень полезную простую теорему относительно изменений, которым подвергаются эти тензоры, когда слегка меняется связность: Г*lm -> Tklm + оТ*/т. Следует помнить, что оТ*/т (в отличие от самой Tklm) является тензором. Сле- *) Этот тензор чаще (и исторически правильнее) называют тензором Риччи. (Примеч. ред.) 61
дующая формула может быть доказана непосредственным расчетом: **'*/« = -(«r'fc/):m + (Sr'fcm);/ + (Г"т/ - Га,т)5Г'ка. (6.18) Свертывая, получаем из нее SRkl = -(ИГак1).а + (ЬГ\а).1 + (Г%1 - Гаш)6Г\а. (6.19) Эти выражения особенно удобны при симметричной связности, когда последний член в каждом из них обращается в нуль. ГЛАВА 7 ГЕОДЕЗИЧЕСКИЕ В МНОГООБРАЗИЯХ С АФФИННОЙ СВЯЗНОСТЬЮ Пусть задана аффинная связность Тк 1т\ рассмотрим в точке Р(хк) линейный элемент dxk, ведущий из Р к точке Р'(хк + dxk). Перенесем dxk (являющийся вектором в Р) с помощью этой связности Г из Р в Р\ и результат пусть будет dxk (являющийся вектором в Р'). Перенесем этот вектор из Р' в Р"(хк + dxk + dx'k). Результат dxk перенесем в Р"\хк + dxk + dxk + dxk) и т.д. Рис.4 Таким образом, вы получаете многоугольный путь, который в пределе "истинно бесконечно малых" и бесконечно увеличивающегося числа шагов приближается к некоторой кривой, которая, впрочем, может быть также прочерчена и "назад" от Р в направлении —dxk и которая, очевидно, обладает следующими свойствами: (а) Если мы будем переносить конечный контравариантный вектор, указьшающий направление кривой в любой из ее точек Р, от Р вдоль кривой к любой другой точке Q, мы получим вектор, указьшающий направление кривой в Q. (Под словами "указьшающий направление" подразумевается "касательный к кривой", т.е. "имеющий компоненты, пропорциональные приращениям dxk вдоль кривой".) (б) Наша конструкция дает естественный стандарт для сравнения длин любых двух частей этой кривой {естественный для данной связности Г), а именно, отношение "числа шагов", содержащихся в каждом из них, а если быть аккуратнее — предельное значение этого отношения. 62
Из каждой из °°4 точек в каждом (°°3) направлении выходит одна такая кривая, так что всего имеется °°6 таких кривых (поскольку кривая содержит «^ точек). Вообще говоря, °°3 кривых, выходящих из данной точки, покрывают некоторую определенную конечную окрестность точки ровно один раз, и найдется в точности одна кривая, связывающая точки Р и Q. Эти кривые называются геодезическими. Перейдем к изучению их в аналитической форме. Любая кривая может быть представлена многими способами путем задания четырех ее координат в виде функций некоторого непрерывного параметра X ("многими способами" означает только то, что вместо X мы можем взять любую непрерывную монотонную функцию от X). Если мы проделаем это, то вектор dxkjdX будет указывать в каждой точке направление кривой в поясненном выше смысле. Чтобы удовлетворить пункту (а), мы потребуем, чтобы этот вектор при параллельном переносе в xk + dxk был пропорционален величине касательного вектора, который встретится нам в соседней точке: dxk , dx I* i 7 . „(dxk ^ d 2xk \ — dxm =M[ + r- dX ), \ m \d\ dX2 J d\ Г lm dx где М — некоторый множитель. Разделив на dX, получим d2xk . dx, dxm 1 -M dxk dX2 lm dX dX dX dX Для того чтобы это равенство имела смысл, величина М, как легко понять, должна отличаться от единицы только на величину порядка dX. Ее можно, таким образом, заменить в левой части единицей. В правой части мы должны допустить зависимость величины (1 — М) от X, и поэтому запишем ее в виде <p(X)dX. Таким образом, d2xk . dxi dxm dxk Г-+Г*/т—- = ^\) —• (7.1) dX2 lm dX dX } dX Этим уравнением удовлетворяется наше первое требование. Но является ли X естественной мерой длины вдоль кривой, на что обращалось внимание в пункте (б)? Едва ли, так как выбор X был в большой степени произволен. Посмотрим, во что превратится (7.1), если мы изменим наш выбор, взяв s(X) вместо X. Легко находим, что d2xk ^к d*l dx™ _ *S' - S" dXk <n оч ~7Г +Г lm— " Тг —> {'о) ds ds ds s ds где s', s" означают производные no X. 63
Мы можем добиться того, чтобы правая часть совсем исчезла, и придать нашему уравнению вид d2xk . dxt dxm в том и только в том случае, если потребуем, чтобы выполнялось уравнение ys' - s" = 0, общее решение которого есть s = fexp[f<p(u)du]d\. (7.4) Таким образом, тем требованием, что дифференциальное уравнение для геодезической должно получить упрощенную форму (7.3), выбор переменной s задается с точностью до линейного преобразования с постоянными коэффициентами вида s - as + b — это та свобода, которая содержится в нижних пределах двух интегрирований в (7.4). Уравнение (7.3), очевидно, гласит, что dxk/ds переносится параллельно вдоль геодезической. Вектор {dxklds)\g совпадает с параллельно перенесенным из Р в Q вектором (dxk/ds) \ р. То же самое справедливо и для бесконечно малых векторов (dxk)\p и (dxk) | Q, если ds принимает одно и то же бесконечно малое значение в обеих точках. Следовательно, ds является мерой длины бесконечно малого отрезка, a Jds является мерой (длины) для конечного участка геодезической в смысле, указанном выше в пункте (б). Совершенно замечательно, что чисто аффинная связность дает возможность сравнивать длины (которые являются метрическим понятием), хотя, конечно, только вдоль геодезической. В самом деле, никакое естественное сравнение длин между двумя разными геодезическими невозможно, даже в случае, когда они пересекаются, поскольку упомянутые выше линейные преобразования s порознь независимы на каждой геодезической. Необходимо привлечь внимание также к тому факту, что согласно (7.3) и (7.1) антисимметричная часть связности Tklm не влияет ни на геодезическую, ни на метрику на любой геодезической, поскольку ее вклад уничтожается в силу симметрии уже в (7.1). Любой антисимметричный тензор ®klm (=-0*m/) может быть добавлен к Tk[m, и ничто не изменится — ни геодезическая, ни метрика на ней. Мы знаем, что любая антисимметричная добавка несущественна, поэтому возникает вопрос: имеются ли также и симметричные добавки к аффинной связности, которые не меняют ее систему геодезических? Ответ состоит в том, что добавка вида «Vm+5*^ 64
(где V[ — произвольное векторное поле) является единственной добавкой к Гк1т, которая не изменяет геодезических Тк1т. Она изменяет, однако, "метрику" на некоторых (в действительности на большинстве) геодезических, каким бы мы ни выбрали Vt. Отсюда следует, что никакие изменения в симметричной части аффинной связности невозможны, если и все геодезические, и метрика на них должны быть сохранены. Я предоставляю читателю доказать последнее утверждение. ГЛАВА 8 ОБЩИЕ ГЕОМЕТРИЧЕСКИЕ ГИПОТЕЗЫ ОТНОСИТЕЛЬНО ТЯГОТЕНИЯ Основополагающая идея В план данных лекций вовсе не входит обсуждение процесса развития идей сначала ограниченной*), а затем и общей теории относительности, а также демонстрация того, как они были логически построены на результатах большого числа решающих экспериментов, таких как аберрация света,исходящего от неподвижных звезд, опыт Майкельсона—Морли, некоторые факты, касающиеся света от видимых двойных звезд, эксперименты Этвеша, удостоверившие с удивительно высокой степенью точности универсальный характер гравитационного ускорения - т.е. что в заданном поле оно является одинаковым для любых пробных тел, независимо от их материала. Тем не менее, прежде чем детально заняться метрическим (или римановым) континуумом, я хотел бы показать главное направление идей, подсказывающих выбор подобной модели пространства- времени для объяснения гравитации чисто геометрическим путем. При этом я буду придерживаться не исторического развития идей, каким оно было в действительности, а того, каким оно могло быть, если бы понятие аффинной связности было в то время уже известно физикам. На самом деле общее понятие о ней сложилось постепенно (в работах Г. Вейля, А.С. Эддингтона и А. Эйнштейна) из частного образца аффинной связности, возникшей из метри- *) Здесь в оригинале - "restricted". Более употребительными являются термины "специальная" ("special" - этот термин также используется автором в дальнейшем наравне с "restricted"), или "частная" теория относительности. {Примеч. пер.) 5. Э. Шредингер 65
ческой (римановой) связности, — сложилось только после того, как последняя приобрела широчайшую популярность вследствие огромных успехов эйнштейновской теории 1915 года. Сегодня, однако, кажется более простым и более естественным выдвинуть на передний план аффинную связность, с которой мы сейчас уже знакомы, и прийти к метрике, конкретизируя аффинную связность очень простым образом. Мы знаем уже, что в особенно простом случае симметричной интегрируемой аффинной связности можно найти систему координат, в которой геодезические являются прямыми линиями*). Более того, из обычной механики мы знаем, что путь частицы, на которую не действует никакая сила, является прямой линией, как в пространстве, так и в пространстве—времени (поскольку движение в этом случае является равномерным). Придадим этому утверждению более осторожную, но и более многозначительную в плане наших нынешних целей форму: путь является прямой линией в подходящим образом выбранной системе отсчета, одной и той же для всех частиц, не подвергающихся воздействию силы; такая система отсчета называется инерциальнои. Но путь не был бы прямолинейным в пространстве—времени, иными словами, пространственный путь не был бы прямолинейным, а движение равномерным относительно системы координат, которая сама по себе имеет ускоренное или вращательное движение по отношению к инерциальнои системе отсчета, такое, например, какое имеет пространственная система координат, жестко связанная с вращающейся Землей. Из экспериментов Этвеша мы заключаем теперь, что в заданном гравитационном поле любая частица, какова бы ни была ее природа, двигаясь из заданной точки пространства—времени (т.е. из заданной точки в пространстве в заданный момент времени) в заданном направлении в пространстве—времени (т.е. в заданном направлении в пространстве с заданной скоростью), следует по кривой (мы будем назьюать ее "мировой линией"), которая зависит только от названных начальных условий и от гравитационного поля, но не от природы частицы. Более того, эта кривая не является прямой линией по отношению к инерциальнои системе отсчета. Или точнее, поскольку могут возникнуть сомнения отно- *) Ибо в этом случае величины Г могут быть повсюду обращены в нуль, так что (7.3) определяет прямые линии. Ограничение симметричными интегрируемыми аффинными связностями необходимо даже несмотря на то, что антисимметричная часть не влияет на форму геодезических. Ибо симметричная часть интегрируемой аффинной связности не обязана быть - и, как правило, не является - интегрируемой и, следовательно, не может быть обращена в нуль всюду с помощью преобразования. 66
сительно того, что подразумевается под инерциальной системой отсчета в этом случае, так как не существует частиц, освобожденных от воздействия гравитации: эти кривые не являются прямыми линиями в любой системе отсчета; не существует системы отсчета, в которой все они прямолинейны, за одним незначительным, в силу его искусственности, исключением *). Такое положение дел наводит на мысль попробовать распространить аналогию между геодезическими интегрируемой аффинной связности и путями (или "мировыми линиями") частиц, не подвергающихся воздействию никаких сил, на геодезические общей, неинтегрируемой аффинной связности и пути частиц, подвергающихся действию гравитационного поля. Это искушение является особенно сильным, потому что геодезические, согласно их определению, явно могут быть названы "прямейшими" линиями, так что мы имели бы простой закон; частица во всех случаях следует по прямейшей линии — закон не без прецедентов. Он сильно напоминает хорошо известный результат обычной, классической механики, а именно, что частица, вынужденная оставаться на заданной поверхности, но в остальном не подвергающаяся воздействию никаких сил, движется с постоянной скоростью вдоль геодезической на этой поверхности. Другими словами, мы предположим, что гравитационное поле можно представить себе как чисто геометрическое свойство пространства—времени, а именно как аффинную связность, наложенную на него, и что она равносильна геометрическому ограничению на движение частиц. Эта аффинная связность должна рассматриваться как неотъемлемое свойство пространственно-временного континуума, а не как нечто, возникающее только когда имеется гравитационное поле. Случай, когда гравитационного поля нет, представляет собой просто случай, когда аффинная связность является интегрируемой. В этом обсуждении мы неявно приняли весьма важное обобщение классического понятия "системы отсчета", которое в данном случае нельзя обойти молчанием, хотя оно уже стало привычным для нас из предыдущих глав. Дело не только в том, что мы самым общим способом включили время в закон преобразования координат. Но представитель классической физики, говоря об инерциальной системе отсчета или о любой другой системе отсчета, имеет в виду, что только декартовы координаты точки приписьшаются *) Исключением является случай совершенно однородного гравитационного поля, которого не существует. К сожалению, этот фиктивный случай стал ходовым примером во всех популярных или полупопулярных изложениях. 5* 67
каждой из двух жестких систем осей, двигающихся по отношению друг к другу так, как двигается брошенный камень по отношению к Земле или как Земля по отношению к инерциальной системе отсчета. В этом случае координаты в одной системе отсчета являются конкретными линейными функциями координат в другой системе отсчета с коэффициентами, являющимися некоторыми функциями времени. Мы однако, беспечно переключались на рассмотрение наших совершенно общих законов преобразования, линейных только в ближайшей окрестности некоторой точки, с коэффициентами (равными дх^Ьх'к)9 представляющими собой произвольные функции всех четырех координат и изменяющимися от точки к точке. В оправдание подобного обобщения мы можем сказать, что без него общее понятие аффинной связности вовсе не пригодилось бы и поэтому не могло бы быть использовано для изображения гравитационного поля. Полезно и еще одно замечание. Приняв общее понятие о системе отсчета, мы не хотим отдавать предпочтение какой-либо частной системе отсчета. Следовательно, во всех случаях, когда в некоторой используемой нами системе отсчета не все компоненты аффинной связности равны нулю повсюду, мы обязаны рассматривать их как представляющие некоторое гравитационное поле с точки зрения данной системы отсчета, даже если бы мы были склонны назвать его фиктивным полем в случае интегрируемой аффинной связности, когда можно найти систему отсчета, в которой все они обращаются в нуль. Но если бы, исходя из этого, мы пренебрегли ими и в исходной системе отсчета, в которой они отличны от нуля, мы неправильно вычертили бы геодезические. Мы не хотим вводить дополнительное правило, в силу которого надо всегда следить за тем, может или нет аффинная связность как целое быть сведена к нулю, и если может, то обязательно использовать ту систему отсчета, в которой это происходит. Вероятно, было бы интересно узнать, можно ли, по крайней мере в окрестности некоторой точки, "убрать с помощью преобразования" гравитационное поле. Ответ на данный вопрос очень прост: это всегда возможно. Но мы вернемся к этому позже. Закон тяготения В ньютоновской теории гравитация описывается потенциалом^, градиент которого, взятый с обратным знаком, равен ускорению, сообщенному небольшому пробному телу. Закон, описывающий поле if, имеет вид <р= const (8.1) там, где нет поля; V2(^=0 68 (8.2)
там, где имеется поле, но нет тяготеющей материи; A2ip = 4nkp (8.3) там, где имеется тяготеющая материя с плотностью р, причем к является гравитационной постоянной, равной 6,67 • 10"8 г"1 см3с"2. Очевидным образом уравнение (8.1) в качестве частного случая содержится в уравнении (8.2), а последнее в качестве частного случая содержится в уравнении (8.3). Или, в обратном порядке, уравнение (8.2) является обобщением уравнения (8.1), а уравнение (8.3) - обобщением уравнения (8.2). Поскольку мы хотим, чтобы поле описывалось аффинной связностью Т*кп кардинальный вопрос состоит в том, каковы соответствующие законы, описывающие Г'к1 в этих трех случаях? Нет никаких сомнений относительно того, что является аналогом уравнения (8.1). Когда нет никакого поля, связность должна быть интегрируемой, а геодезические — прямыми линиями. В главе 6 мы узнали, что необходимое и достаточное условие того, что дело обстоит именно так, есть *'*/«= 0; Г'Л; = Г'№, (8.4) (80 уравнений) (24 уравнения) Таким образом, эти уравнения должны выполняться там, где нет никакого поля (и никакой материи). Условие, которое следует наложить на Г там, где имеется поле, но нет материи, должно быть выражено с помощью одного (или нескольких) тензорных уравнений, которые должны, кроме всего прочего, выполняться и в предельном случае отсутствия поля, иными словами, они должны быть математическим следствием уравнений (8.4), но налагать более слабые требования, чем уравнения (8.4). Это оставляет нам все еще широкий выбор, как это обычно и бывает с каждой попыткой обобщения. Например, тензорные уравнения & klmB pqr = 0' RlqRmr+ аВ\1т Вкiqr = 0 (a = некоторая постоянная) и многие другие удовлетворяют указанному требованию. Поэтому давайте руководствоваться принципом простоты, подсказывающим, что стоит попробовать уравнение или уравнения, линейные хотя бы по производным от Г (каковым в действительности является уравнение (8.4)), если таковые имеются. (Заметим, что все классические уравнения (8.1)-(8.3) линейны.) Если мы добавим это требование, то произведения величин В исключа- 69
ются, и единственный способ*) получения из (8.4) чего-то менее ограничительного, чем само уравнение (8.4), состоит в том, чтобы свернуть его. Таким образом, мы получаем Я*/ = 0 (S/m=0). (8.5) Вспомним теперь, с одной стороны, что если Г'к1 является симметричной аффинной связностью, то второе уравнение содержится в первом и может быть вычеркнуто; с другой стороны, кажется весьма заслуживающим внимания проверить, не можем ли мы обойтись симметричными Г, потому что антисимметричная часть никак не влияет на геодезические, которые, в конце концов, и инспирировали всю нашу попытку. Так мы и сделаем, с этого момента мы будем считать, если не оговорено противное, что аффинная связность симметрична: Г',* = Г'„. (8.6) Тогда мы остаемся с Д*/ = 0 (8.7) в качестве общего уравнения, налагаемого на Г там, где не имеется материи. В одном отношении это является весьма удовлетворительным, но в другом отношении не совсем. Давайте сначала обсудим удовлетворительный момент. Он состоит в том, что обращение в нуль тензора второго ранга в пустом пространстве — это как раз то, что мы могли бы ожидать в качестве математического описания концепции "пустоты", т.е. отсутствия материи. Ибо в соответствии со знаменитым отождествлением массы и энергии, которое было выведено Эйнштейном из простого мысленного эксперимента с давлением света и которое настолько поразительно было подтверждено в действительных экспериментах по расщеплению материи в ядерных столкновениях, что его фатальное подтверждение в большем масштабе с помощью "атомной бомбы" было уже излишним, — я говорю, что в соответствии с этим знаменитым открытием Эйнштейна материя описывается не скаляром, а тензором второго ранга, потому что энергия — не скаляр; она является временно- временной компонентой тензора натяжений — энергии — импульса (или потока - энергии — импульса) **). Используя терминологию *) Простое отбрасывание 24 условий в (8.4) приводит к эйнштейновскому "Fernparallelismus". Из этого ничего не вышло. ["Fernparallelismus" (нем.)- далекий параллелизм. (Примеч. ред.)] **) То, что энергия не является инвариантом, можно усмотреть из элементарного соображения, что кинетическая энергия частицы обращается в нуль в некоторой инерциальной системе отсчета, но не во всех из них. 70
ограниченной теории относительности, хотя сейчас мы не можем объяснить ее в деталях, мы имеем, что для частицы с массой покоя т этот тензор равен dxt dxk т— —> (8.8) ds ds где ds является дифференциалом собственного времени (инвариантом) . Поэтому мы можем принять, что наш тензор Rkt, по существу, является тензором материи, что уравнение (8.7) выражает тот факт, что он обращается в нуль (пустое пространство) и что обобщение уравнения (8.7) внутри материи, соответствующее в теории Ньютона переходу от (8.2) к (8.3), будет иметь следующую форму где С — постоянная, а Тк1 — тензор материи. Такая интерпретация все же, как окажется, не совсем правильна; ее потребуется слегка подправить. До детального разбирательства это все удовлетворительно, поскольку дело касается именно этого аспекта. Слегка беспокоит то, что тензор (8.8) является контравариантным, тогда как в (8.9) требуется ковариантный тензор. Еще более беспокоит то, что тензор (8.8), так же как и любой элементарный тензор энергии, к примеру, тензор Максвелла, симметричен, тогда как тензор Rki несимметричен даже для нашей симметричной аффинной связности — мы привлекли внимание к этому факту в главе 6. Но наиболее удручающим является тот факт, что имеется 40 функций Г*к1, которые не могут в достаточной степени описываться уравнениями (8.7) или в общем случае уравнениями (8.9), число которых равняется 16 и которое нужно уменьшить до 10, поскольку мы должны будем каким-то образом избавиться от асимметрии тензора Rki. Как вызывающая беспокойство асимметрия в /?&/, так и недостаток в числе уравнений, видимо, указывают на то, что для описания чисто гравитационного поля необходимо рассмотреть нечто менее общее, чем симметричная связность Г*к1 с 40 независимыми компонентами, или, другими словами, что необходимо наложить дальнейшие ограничения на связность. Сейчас необходимость такого ограничения получила поддержку с совершенно другой стороны, которая и укажет нам путь.
ЧАСТЬ III МНОГООБРАЗИЕ С МЕТРИЧЕСКОЙ СВЯЗНОСТЬЮ ГЛАВА 9 МЕТРИЧЕСКИЕ АФФИННЫЕ СВЯЗНОСТИ Общее исследование Два обстоятельства, взятые вместе, тозволяют нам думать, что с основополагающей аффинной связностью должна быть некоторым способом сопоставлена другая геометрическая сущность, имеющая фундаментальное значение, а именно метрика Римана. В действительности, именно с этой стороны А. Эйнштейн впервые подошел к проблеме структуры пространства—времени. Понятие аффинной связности было введено позже Г. Вейлем *). Первое обстоятельство состоит в том, что, как мы видели, аффинная связность уже порождает инвариант ds на каждой геодезической. Становится возможным сравнение "длин" или "интервалов" (на самом деле это не просто длина, вспомните, что мы находимся в четырех измерениях). Сама собой напрашивается мысль, что это сравнение интервалов не должно быть ограничено случаем одной и той же геодезической. Второе обстоятельство состоит в том, что такой инвариант ds в действительности известен в так называемой ограниченной теории относительности. Подробнее мы будем' говорить об этом позже. Этот инвариант не является просто суммой квадратов, а имеет вид dt2 — do2 (= ds2), где Заимеет смысл пространственного элемента длины. Обобщением, следующим отсюда, является интервал общего вида, который мы и должны рассмотреть: gikdxidxk (где достаточно взять gik = gki). Какова связь между этими двумя ds! Очевидно, мы должны потребовать, чтобы примитивная Г-мет- рика образовывала бы часть этой £/л.-метрики. Обратимся к более тщательному исследованию этих взаимосвязей. Если xlf x2, х3 интерпретируются как пространственные координаты, а дг4 — как время, то компоненты скорости частиц *)#. Weyl. Raum, Zeit, Materie. (Berlin, Springer, 1918.) 72
в точке хк равны dxi dx2 dx3 — , —, —» (9.1) dx4 dx4 dx4 где хк + dxk — соседняя точка на мировой линии частицы. Формулы преобразования трех величин (9.1) легко выводятся из (1.4), но они чрезвычайно громоздкие, а именно, они линейные, но неоднородные и дробные. Поскольку, в конце концов, dxk является вектором, разумно вместо (9.1) рассмотреть определенный вектор с компонентами, пропорциональными dxk (не сам вектор dxk, потому что он не является определенным вектором), из которого величины (9.1), если это когда-нибудь понадобится, могут быть получены с помощью образования частных. Более того, разумно потребовать, чтобы такой вектор всегда имелся в наличии. Для этой цели нам нужен бесконечно малый инвариант, пропорциональный dxk. В главе о геодезических мы узнали, что аффинная связность сама по себе обеспечивает такой инвариант, а именно дифференциал ds параметра s, который для каждой геодезической выделен тем, что он придает уравнению геодезической простую форму (7.3). И мы узнали, что вектор dxk/ds параллельно переносится вдоль геодезической. И все же он не является вполне определенным вектором, потому что выделенная переменная не совсем однозначна —она определяется с точностью до линейного преобразования с произвольными постоянными коэффициентами (s =as+b). Таким образом, ds определено только с точностью до постоянного множителя (я), то же самоё справедливо и для dxk/ds. Этот множитель все еще остается свободным на любой из °°6 геодезических. Можно ли избавиться от этого отсутствия определенности, так чтобы dxk/ds стало определенным вектором на любой геодезической, и таким образом, и для любого элемента длины? В принципе, это кажется легкой задачей: надо просто выбрать s каким-то произвольным, но определенным образом, независимо для каждой геодезической. Ладно, посмотрим, что из этого получается. После того как наш выбор сделан, величина ds для любого элемента длины dxk будет определенной однородной инвариантной функцией первой степени по dxk. Мы не станем исследовать все то огромное количество возможностей, остающихся при этом ограничении, а исследуем только возможность, подсказываемую тем простым способом, с помощью которого измеряются расстояния в косоугольной декартовой системе координат, т.е., по существу, теоремой Пифагора. 73
Иными словами, мы предположим, что ds2=gikdXidxki (9.2) где gik — симметричный тензор, меняющийся от точки к точке. Это очень частое предположение имеет разумное оправдание, основанное на понимании того, что никакое другое не позволит состыковать нашу модель с более элементарными физическими концепциями. Тем не менее мы должны отдавать себе отчет, что это налагает значительные ограничения, которые, по всей вероятности, не будут совместимыми с произвольной аффинной связностью, Мы хотим узнать, каковы необходимые и достаточные условия того, что (9.2) находится в согласии с аффинной мерой длины вдоль каждой из геодезических. Ответ, которого следует ожидать, имеет форму соотношения между тензором и связностью Г*/т. Задача не совсем простая. Мы сначала довольно подробно исследуем достаточное условие, которое не является необходимым, но которое само приведет нас к менее ограничительному необходимому и достаточному условию. Я утверждаю, что достаточное условие состоит в том, что инвариант gikA(Ak, (9.3) где А — любой вектор (не векторное поле) в любой точке, должен сохраняться при любом параллельном переносе вектора А , В самом деле, пусть параметр s (обозначенный так, чтобы отличить его сейчас от параметра s в (9.2)) будет аффинным параметром, выбранным на заданной геодезической. Инвариант dxt dxk ds ds будет тогда сохраняться при параллельном переносе вектора dx{ /ds вдоль этой геодезической. Следовательно, если вы замените, что допустимо, параметр s на этой геодезической параметром s\J~C и назовете эту комбинацию s, то (9.2) будет выполнено. Поскольку вы можете проделать то же самое на любой геодезической, достаточность доказана. Поскольку инвариантное произведение, конечно, сохраняется при параллельном переносе, когда все его сомножители подвергаются параллельному переносу (см. главу 5), это условие, конечно, будет выполнено, если аффинная связность Г'Л/ переносит поле gik в себя, иными словами, если инвариантная производная тензора giki вычисленная по отношению к связности Г'Л/, 74
обращается в нуль: *U4's-£?— «ткТти-81тТтк1 =0. (9.4) Кроме того, легко сообразить, что никакое gik, кроме параллельно перенесенного, не может обеспечить сохранение инварианта (9.3) для произвольного Ак. В самом деле, при произвольном Ак параллельно перенесенное Ак также является произвольным. Следовательно, (перенесенный) инвариант известен для произвольного (перенесенного) вектора, и тем самым тензор gik на новом месте определен однозначно. Таким образом, (9.4) является математическим выражением нашего достаточного условия. Выпишем три уравнения, получающиеся в результате циклической перестановки нижних индексов ikl: Ъх gmki il gimi ki " U -SmlT ki -Skm^ И ~ ® Ъхк -gmiT"1,,, -*"»* ik Ik 1 "I 1 + — 2 1 и образуем из них линейную комбинацию с множителями, указанными после вертикальной черты. При этом мы примем во внимание симметрию тензора gik, но не симметрию связности Tmkl. Другими словами, сейчас мы собираемся найти наиболее общую несимметричную связность, удовлетворяющую нашему достаточному условию. (Причина станет ясной позже. Мы не собираемся в действительности искать несимметричные связности. Но эта процедура облегчит нам нахождение достаточного и необходимого условия.) Мы получаем 2\дх, Ъхк Ъх, I 2SlmK 1 1 + Гт/к) + ki т х ik + ~ Sim <Г"ы - Tmlk) +Jgkm(Tmu - TmH ) = 0. (9.5) Мы можем решить это уравнение по отношению к симметричной части Г с помощью тензора glk y выведенного из тензора gik способом, описанным в главе 2 (см. уравнения (2.8) —(2.10)), и однозначно определенного условием g 8ik Г Ь Г В данном случае он, очевидно, также симметричен. 75
"Умножим" (95) на gsl и положим для краткости 2У Ik l ki> l ikj 1 т « (96) 2 К ik kiJ {*' \ Эд:/ Эх*. Эх, / [fa* J 2_ 2 Получаем (добавив Г5 к обеим частям) Г'""{*} -I'"'1»*"'!! -lgS'gkmTm»* Г'«' (9Ю Эта формула дает полный ответ на вопрос о том, какие аффинные связности переносят заданное поле gik в себя. Заметим, что как фигурные скобки, так и результат сложения второго члена с третьим в правой части являются симметричными по / и к. Следовательно, антисимметричная часть Vs{к может быть выбрана произвольно, а четная часть Tsjk (т.е. первые три члена в правой стороне) тогда однозначно определяется антисимметричной частью и полем gik. Из выражения (9.8) следует, что скобки Кристоффеля г'»-Ц) (99) образуют единственную симметричную связность, согласующуюся с условием (9.4) для заданного поля^/*. Но из выражения (9.8) мы узнаем кое-что еще, даже если мы интересуемся только симметричными связностями. В главе 7 мы видели, что ни геодезические, ни их "аффинно-метрические" параметры не зависят от антисимметричной части аффинной связности. Поэтому давайте просто выбросим ее; тогда мы остаемся с г**{лЬт*',**-г,"*г"Т*',*'кжГ5- (9,10) Это семейство симметричных аффинных связностей, в котором I ki является произвольным антисимметричным тензором, в равной мере хорошо "согласуется" с метрикой gik, хотя оно имеет, конечно, геодезические, отличные от геодезических связности (9.9), и не подчиняется условию (9.4), показывая, что последнее, *) Эти величины называются скобками Кристоффеля. Они не образуют тензора, но согласно (9.9) являются аффинной связностью. 76
хотя и является достаточным, не является необходимым. Теперь легко вывести необходимое и достаточное условие. С одной стороны, тензор, прибавляемый к скобкам Кристоф- феля в (9.10), может быть записан - или, точнее, выражение (9.10) может быть записано - в виде Tiik = Tlkh (9.12) и легко убедиться в том, что (а) этот тензор Г, в дополнение к его симметрии по / и к, удовлетворяет специфическому условию симметрии Тнк + Тш + Тки = 0; (9.12а) (б) этот тензор в остальном остается произвольным, поскольку \mkl произвольно.В самом деле, подставляя, например, Tmkl=\g™{Tksl-Tlsk) в (9.10) и приняв во внимание (9.12) и (9.12а), вы получите (9.11). Три последних соотношения, таким образом, эквивалентны равенству (9.10), и все семейство аффинных связностей, описываемых им, является, если можно так сказать, "совместимым" с метрикой gik, (Пусть это будет кратким выражением - а не жестким постулатом - для некоторого рода согласованности между ними, подробно обсуждавшейся выше.) Обозревая наши результаты, касающиеся этой совместимости, мы будем сейчас говорить только о симметричных аффинных связностях, к которым, как мы знаем, любая антисимметричная часть может быть добавлена без изменения геодезических и их аффинной метрики, и таким образом, без конфликта с совместимостью. Достаточное условие совместимости (9.4) выделяет (9.9) в качестве единственной симметричной аффинной связности, удовлетворяющей ему при заданном gik; но мы только что обнаружили целый класс симметричных аффинных связностей, совместимых с данным gik9 а именно определяемый (9.11), (9.12) и (9.12а). Мы покажем теперь, что это - уже самый широкий класс, иными словами, что последние три соотношения, взятые вместе, представляют собой достаточное и необходимое условие совместимости . Заметим сначала, что даже при фиксированном gik только соотношение (9.12а) вообще приводит к какому-то ограничению на симметричную связность (9.11), поскольку разность двух 77
симметричных связностей - связности Г и связности Кристоффе- гтя - является, во всяком случае, симметричным тензором, а это как раз то, что говорится о ней в соотношениях (9.11) и (9.12). Поэтому остается только показать, что соотношение (9.12а), кроме того, что оно достаточно, является также и необходимым. Совместимость требует, чтобы инвариант (9.3) был равен единице, если в качестве Ак взять аффинный вектор dxk/ds. Это должно выполняться на всей геодезической, и поскольку вдоль нее вектор ее направления переносится параллельно, то отсюда, очевидно, следует, что инвариант (9.3) должен сохраняться, когда Ак параллельно переносится в указываемом им самим направлении (ибо абсолютная величина вектора Ак нам безразлична, и в любой точке имеется геодезическая в любом направлении). Чтобы записать это условие в случае аффинной связности (9.11), возьмем бесконечно малую постоянную т? и осуществим перенос инварианта (9.3) вдоль линейного элемента т/Л*. Известно, что большое число членов сокращается (так что мы можем избавить себя от их вычисления); а именно члены, обусловленные изменением (не перемещением!) тензора giki сокращаются с членами (связанными с перемещением Ак), которые содержат скобки Кристоффеля. Остается лишь 0= -2gikAigksTslmAlAm^ или, иными словами, 0= -2r]AiAlAmTilm. Вспомним теперь, что вектор Ак произволен. Взяв сначала только одну компоненту отличной от нуля, затем две из них, и в конце концов — три из них и используя (9.12), вы легко докажете (9.12а). или, точнее, то из этих соотношений, которое не является простым следствием предыдущего. Этим завершается доказательство того, что соотношения (9.11) —(9.12а) являются необходимыми и достаточными условиями согласованности между симметричной аффинной связностью rk'i и метрическим тензором g(k в том смысле, что полная ^-метрика соответствует неполной Г-метрике, определенной только вдоль каждой аффинной геодезической. И, повторяю еще. раз, добавление к нашей связности Г произвольного антисимметричного тензора ни с чем не вступает в конфликт, потому что оно не изменяет ни аффинных геодезических, ни аффинной метрики на них. От скольких независимых функций зависит наша "метрическая аффинная связность" (что является вполне подходящим для нее названием)? Имеется 10 независимых компонент gik. Тензор Tkim в силу симметрии по / и m ограничиваете^ 40 независимыми компонентами. Тщательный подсчет показывает, что соотноше- 78
ние (9.12а) равносильно 20 независимым условиям. Наш тензор, следовательно, имеет 20 независимых компонент, а наша связность Г оказывается зависящей от 30 произвольных функций. В конце предыдущего пункта мы чувствовали желание ограничить "связность Г так, чтобы она зависела только от 10 функций. Это наводит на мысль, что следует рассматривать, в конце концов, только простейший случай, а именно Тк1т = 0. Это предписание удовлетворяет также и другому нашему желанию, которое мы имели, а именно - желанию получить симметричный тензор Эйнштейна Ям. Для симметричной связности Г единственным членом, нарушающим симметрию, согласно (6.17) является Мы вскоре увидим, что для кристоффелевой аффинной связности (9.9) этот член в самом деле симметричен по к и /. Приняв условие (9.9), а тем самым, и (9.4), мы теперь в точности достигли геометрической точки зрения, лежащей в основе эйнштейновской теории 1915 года, известной как общая теория относительности, которой мы собираемся заниматься на протяжении нескольких глав. Даже не вдаваясь ни в какие касающиеся ее подробности, мы отдаем себе отчет в том, что она представляет собой, с аффинной точки зрения, весьма специальный случай, допускающий обобщения в более чем одном направлении. Некоторые важные факты и соотношения Давайте сразу познакомимся с несколькими простыми фактами и соглашениями, которые все зависят от того факта (9.4), что инвариантная производная метрического тензора gik — часто называемого фундаментальным тензором этой теории - обращается в нуль. Для начала, из (9.4) следует,что также и vik =0 ибо из равенства путем инвариантного дифференцирования можно получить gik;mgU +8ikgil;m =^k;m =0. Умножая это равенство на gks, находим Как указывалось, фундаментальная скалярная плотность является квадратным корнем из детерминанта \/g. Что можно сказать об ее 79
инвариантной производной? Детерминант является полиномом от всех его п2 (=16) компонент. Дифференцируя его по каждой отдельной компоненте g(k и вспоминая, что сомножитель есть ggtk, мы получим *S ik *gik -— = ggtk — . Ъхг bxt Производную в правой части заменим ее выражением, следующим из (9.4), -^ = ggik(gmkrmi^gimrrnkl) = 2gr\l; охг а это мы можем записать в виде ~ -v7r«eI = o, oxt или \65| = 0. Между прочим, мы получили сейчас доказательство того, что метрический тензор Эйнштейна симметричен. Ибо член (9.13), якобы нарушающий симметрию, может быть записан теперь в виде 9Г°ка = ЭМпУГ который симметричен*). Резюмируем: g(k, glk, y/g' имеют равные нулю инвариантные производные. Этот факт делает особенно удобным определенное соглашение относительно "перетаскивания" (или "поднятия" и "опускания") индексов. Мы будем ассоциировать с любым тензором определенного типа rpklm... 1 PQ" много (точнее, 2^-1, если 5 - его ранг) других тензоров, отличающихся от него тем, что один или более его верхних индексов "опущены вниз" и/или один или более из его нижних индексов "подняты вверх". Процедура получения этих тензоров иллюстрируется следующими примерами: J» lm . . . = а rpslm. . . 1 к pq. .. sks1 pq. . .» klm. . . q = -qsrpklm. . . p . . . & A ps. . *) Заметим, что для этого не понадобилась симметрия g^, а только соотношение (9.4). {Примеч. ред.) 80
Поднятие и последующее опускание одного и того же индекса (как и обратная процедура) возвращают назад к исходному тензору. Немедленно становится ясным, что как только введено такое соглашение, необходимо установить и неуклонно поддерживать определенный порядок следования всех индексов, а не только порядок следования индексов одинакового типа, поскольку теперь они могут менять свой тип. Принято рассматривать все эти различные ассоциированные тензоры как один и тот же тензор. Такая точка зрения совершенно разумна, но, конечно, только по отношению к определенному фундаментальному тензору gik, заданному раз и навсегда. Почти таким же способом можно ассоциировать с любым тензором определенную тензорную плотность и наоборот, что достигается умножением или делением на \-g- (He считая редких и необычных исключений в отдельных точках, подразумевается, что детерминант g всегда отличен от нуля и отрицателен.) Легко доказать (но, тем не менее, этот факт заслуживает специального упоминания), что немые индексы некоторой пары могут быть одновременно один поднят, а другой опущен безо всяких дальнейших последствий. Например, мы имеем тождественно (в соответствии с нашими соглашениями) rklm... = т lm.. . к kq... ~ lk q... • Эти соглашения особенно удобны, если учесть тот факт, что фундаментальные тензоры gik, gikf \fg"переходят в самих себя при параллельном переносе, или, что то же самое, имеют нулевые производные. Из первой формулировки этого факта немедленно следует, что обсуждаемые процедуры ассоциирования сохраняются при параллельном переносе. Еще большую практическую пользу имеет то следствие, что "перетаскивание" индексов может осуществляться "под знаком инвариантной производной". Достаточно объяснить это на примере. Скажем, вам дано уравнение **;/ = '*/• Отсюда вы можете заключить, что Bk;i =Oti- Переход основан на том, что Bk;i = (gkiB%=gkl.iBl+gklBl;i = gklBl;i. Аналогично и в силу тех же самых причин "латинизация" и "готизация", т£. деление или умножение на VF* может осуществляться под знаком инвариантной производной. 6. Э. Шредингер 81
Заслуживает упоминания также то, что glk, хотя первоначально он был определен другим способом, в действительности является нашим фундаментальным тензором^,*, у которого оба его нижних индекса были подняты в точном соответствии с нашим соглашением. Если поднят только один индекс Л* =5'*, то результатом будет смешанный единичный тензор, не зависящий от конкретной метрики. В резком контрасте со сказанным только что относительно взаимосвязи между g(k и g*k находится следующий замечательный факт. Иногда необходимо рассматривать произвольную ва- риацию фундаментального тензора gik, скажем, 5gik. Эта вариация автоматически влечет за собой соответствующее приращение Sgik. Если проварьировать теперь предыдущее уравнение, получим «*"&*+*"«*,*= О, или, умножая на gki, bgH= -gkljsbgsk. Можно было бы ожидать знак "+". Как бы то ни было, оказывается, что не bgk и bgtk сопоставляются друг с другом, a —bglk и bgik. Геодезические координаты В главе 6 мы доказали, что всегда существует система координат, в которой все компоненты заданной симметричной аффинной связности обращаются в нуль в заданной точке. Мы назвали их геодезическими координатами в этой точке. Согласно условию (9.4) это означает, в нынешнем случае, что все производные £{*,/ обращаются в нуль в данной точке, или что тензор gik является там стационарным. Иногда оказывается очень удобным временно обратиться к геодезической системе координат, потому что некоторые не зависящие от системы координат соотношения в результате столь сильного упрощения могут быть обнаружены моментально, тогда как в общей системе координат они не настолько очевидны. Для примера рассмотрим тензор Римана-Кристоффеля, образованный из скобок Кристоффеля: в* - f'l Л М Л'И а1-( 'ИМ **" " Mm [km],, \ci\ [km\ 1HM' Из главы 6 мы знакомы с некоторыми из свойств симметрии тензора Римана-Кристоффеля общего типа. Он всегда антисимметричен 82
по его последней паре нижних индексов и для любой симметричной аффинной связности обладает циклической симметрией, выраженной в (6.16а). Заменим теперь скобки с помощью равенства (9.7) и воспользуемся геодезической системой координат, в которой все первые производные обращаются в нуль. Получаем 1 .s Blklm ~ — ZtS(-8ls,k,m +8kl,s,m + 8ms,k,l ~ 8km,l,s) • Ассоциированный полностью ковариантный тензор _ 1. Bsklm ~~Г( -8ls,k,m +8kl,s,m +Sms,k,l ~ Skmtl,s) демонстрирует теперь еще два свойства симметрии в дополнение к только что упомянутым. А именно в дополнение к тому, что тензор Bsklm (а) является антисимметричным по второй паре (/, т), (б) обладает,согласно (6.16а),свойством Bsklm + Bslm к + Bsm kl = 0> он также (в) является антисимметричным по первой паре (s, к) и (г) является симметричным по отношению к одновременной перестановке индексов внутренней пары (к, /) между собой и внешней пары (s, m)y или, другими словами (с учетом пунктов (а) и (в)), по отношению к перестановке первого и второго индексов с третьим и четвертым. Никаких других симметрии, не зависящих от этих, не удается найти, а следовательно, их и нет. Ибо для упрощенной формы их скрыть невозможно, они должны были бы проявиться, поскольку остающиеся четыре вторые производные совершенно очевидно допускают любые произвольные значения. Это отрицательное утверждение явно столь же верно, как и предыдущее положительное, хотя в учебниках, оно, к сожалению, обычно не подчеркивается. Давайте подсчитаем число независимых компонент нашего тензора. В силу (а) и (в) мы должны иметь s Ф к и / Ф m для компонент, не обязанных обращаться в нуль. Поскольку имеется 6 таких пар чисел, мы получаем сначала 6 X 6 = 36 компонент. Среди них имеется 6 таких, для которых обе пары идентичны, так что условие (г) для них становится тривиальным. Для остальных 30 компонент оно тривиально и уменьшает их число в действительности до 15. Поэтому всего остается сейчас 15 +6 = 21 компонента. Внимательное рассмотрение единственного остающегося циклического свойства (б) показывает, что оно уменьшает это число всего на единицу, оставляя нам 20 независимых компонент. 6* 83
ГЛАВА 10 СМЫСЛ МЕТРИКИ С ТОЧКИ ЗРЕНИЯ СПЕЦИАЛЬНОЙ ТЕОРИИ ОТНОСИТЕЛЬНОСТИ Наша геометрическая конструкция — четырхмерный континуум с аффинной и метрической связностями - должна служить моделью реального физического мира. Какую физическую интерпретацию должны мы дать "элементу длины" ds — бесконечно малому инварианту, определяемому каждой парой бесконечно близких точек хк ихк + dx^ В начале главы 9 потребность во введении инварианта ds была вызвана формальным желанием получить для важного понятия трехмерной скорости более удобное представление, поддающееся исследованию в рамках тензорного исчисления. Ее элементарное определение через компоненты dxx dx2 dx3 dxA ' dxA ' dx4 громоздко, поскольку это не тензор. Эти величины не обращаются в нуль в любой системе координат, если они обращаются в нуль в одной из них, и имеют весьма сложные, а именно дробно-линейные формулы преобразования. Очевидно, величина ds должна иметь отношение к некоторого рода "расстоянию" между двумя точками, которые, однако, и об этом нужно помнить, являются не двумя точками в пространстве, а двумя мировыми точками, т.е. двумя близкими точками в пространстве, рассматриваемыми в два бесконечно* близких момента времени (dxA). Согласно хорошо известной алгебраической теореме, исходное метрическое определение ds, а именно ds2 =gikdXidxk, (10.1) с помощью линейного преобразования величин dxk с постоянными коэффициентами и ненулевым детерминантом dxk=aikdx'i (10.2) всегда может быть превращено в комбинацию из одних только квадратов: ds2 = 2 (±)dx'2 (10.3) k=l И, конечно, всегда может быть указано общее координатное преобразование, которое приводит к такой форме в каждой конкретной точке. (Например, в точке хк = 0. Возьмем преобразование 84
таким, чтобы в этой точке оно имело разложение xk=alkxt + + высшие степени от х'к.) Из знаменитой теоремы Эйлера относительно "инерции квадратичных форм" известно, что коэффициенты а'к в (10.2) должны быть вещественными, а число знаков (—) в (10.3) не может быть выбрано нами, оно неизменно определяется исходными коэффициентами £/*. Мы можем утверждать и большее. Вспомним, что детерминант тензора gik, обозначенный нами#, при преобразованиях умножается на квадрат детерминанта матрицы а'к. Поэтому, если эти детерминанты вещественны, четность числа знаков (—) в (10.3) определяется знаком детерминанта £, причем это число является четным при g > 0 и нечетным при g < 0. Поскольку мы исключили возможность g = 0 (кроме совершенно исключительных случаев, когда g = 0 ъ изолированных точках), знак gf а, следовательно, также и обсуждаемая четность, не может никогда изменяться и поэтому точное число знаков (—) не может никогда изменяться, потому что это могло бы, очевидно, произойти только там, где g = 0 (изолированные точки не в счет, их можно избежать). Таким образом, число знаков (—) одинаково во всем мире, и очень важно сделать раз и навсегда надлежащий выбор для нашей модели. Ключ к этому числу и к смыслу величины ds дается специальной теорией относительности. Эта теория исходит из некоторой обычной декартовой системы пространственных координат (инер- циальной системы, если быть совершенно точным, — иными словами, одной из тех, для которых обычные законы механики выполняются, по крайней мере, в пределе малых скоростей движущихся тел) плюс линейный временной параметр, считываемый со старых добрых дедовских часов. В теории затем рассматривается группа некоторых однородных линейных преобразований с постоянными коэффициентами, преобразований, в которые вовлечены все четыре координаты и которые есть все основания интерпретировать как переход к другой инерциальной системе, прямолинейно двужущей- ся с постоянной скоростью относительно первой. Называя ее снова инерциальной системой, мы делаем (обоснованное) предположение, что также и в ней обычные законы механики выполняются в пределе скоростей, являющихся малыми в этой системе. (На этом, между прочим, основан способ, с помощью которого в этой теории обычные законы распространяются на случай больших скоростей. Ибо относительная скорость этих двух пространственных систем координат не обязана быть малой, хотя она, в силу природы преобразования, ограничена сверху скоростью света.) Фактически, сердцевиной этой теории является утверждение, что все законы природы должны быть одинаковыми для любой системы 85
отсчета, полученной указанным способом, включая, конечно, и исходную, с которой мы начали. В принципе, не должно быть никакого различия или отличия между всеми этими инерциальными системами, каждая из которых может быть получена из любой другой с помощью преобразования из этой группы — так называемого преобразования Лоренца. Короче говоря, предполагается, что все законы природы инвариантны относительно преобразований Лоренца. Поскольку все эти линейные преобразования специальной теории относительности (как и наши более общие преобразования) затрагивают все четыре "координаты" хг, х2, *з, *4 > вы можете, конечно, после преобразования идентифицировать ту же самую мировую точку, но нет никакого смысла (как и в нашем более общем случае) говорить после преобразования "о той же самой точке в пространстве", если вы не указываете при этом на момент времени, в который она рассматривается; не имеет также смысла говорить после преобразования "о том же самом моменте времени", без указания на то, для какой точки пространства он рассматривается. То, что в одной системе отсчета являлось одной и той же точкой в пространстве, рассматриваемой в разлитые моменты времени, в общем случае будет представлять собой две разные точки в пространстве в другой системе отсчета, рассматриваемые в два других момента времени, или, возможно, в тот же самый момент времени. И наоборот, то, что в одной системе отсчета рассматривается как один и тот же момент времени для двух различных точек, в общем случае будет в другой системе отсчета зафиксировано как различные моменты времени, относящиеся к различным точкам пространства или, возможно, даже к одной и той же точке. Именно такое положение дел породило все многократно обсуждавшиеся "парадоксы" специальной теории относительности — которые так трудно объяснить не-математикам, тогда как математик готов к некоторому расхождению с обычной точкой зрения, исходя всего лишь из того факта, что преобразования затрагивают все четыре координаты. Исходя из сказанного, следует ожидать, что ни расстояние между двумя точками в пространстве (скажем, расстояние между двумя точками, в которых произошли два хорошо определенных моментальных события), ни временной промежуток между двумя случившимися событиями не являются инвариантными при преобразованиях Лоренца; каждый из них может даже обращаться в нуль в одной системе координат, но не обращаться в нуль в другой системе координат. Если мы примем для удобства, что одно из двух событий произошло в начале координат в нулевой момент времени, а другое в точке х1 ,х2ух3 в момент времени^, то квад- 86
рат расстояния между ними будет даваться теоремой Пифагора: а временной промежуток - величиной хА. Поскольку все системы координат равноправны, такие же выражения будут иметь место в любой другой системе координат, только с координатами хк вместо координат хк. Но ни одно из них не является инвариантом. В общем случае мы будем иметь х[2 +х'22 +*з2 Фх\ +х\ +*! , хА ФхА. Однако — и в этом кардинальный момент — преобразования Лоренца характеризуются тем,, что следующее выражение (которое с тем же успехом может быть приведено и с противоположным знаком) инвариантно -х\ -х\-х\ + xl=-x[2 -x'22 -х'ъ2 +хЛ (10.4) Я сказал, что преобразования характеризуются данной инвариантностью. В самом деле, она дает почти исчерпывающее определение, выделяющее преобразования Лоренца среди всех возможных однородных линейных преобразований четырех координат. Данное положение дел имеет формальное сходство со случаем ортогональных преобразований (вращений декартовой системы координат) в трех измерениях, характеризуемых среди всех линейных преобразований инвариантностью расстояния х\ +х2 + х2. Я должен все-таки прокомментировать это "почти". Во-первых, среди преобразований, ограниченных инвариантностью выражения (10.4), имеются такие, для которых детерминант преобразования равен +1, и такие, для которых он равен —1. Последние обычно исключаются на основе того, что они не могут быть получены из "тождественного преобразования" (хк = хк) непрерывным изменением коэффициентов. Кроме того, обычно требуют, чтобы коэффициент, дающий величину ЪхА/дхА, был положительным по очевидной причине: никто не хочет, чтобы в разных системах координат время текло в противоположных направлениях. Формальное описание требования (10.4) может быть дано следующим образом. Если записать формулы четырех линейных преобразований и переписать каждый член, содержащий х4 илидс^, в виде ахА = (-ia)(ixA ), х А = (- /)(/* \ ), другими словами, если рассматривать эти формулы как преобразование между переменными xlyx2ix3bixA и x\9X2,x'3,ixAi то 87
оно будет ортогональным преобразованием (или "вращением") в четырех измерениях, но с некоторым определенным предписанием каждому коэффициенту: быть ли ему вещественным или чисто мнимым. Инвариант (10.4) для двух мировых точек и "точечных событий", одно из которых было для простоты помещено в начале четырехмерной системы координат, равен квадрату временного промежутка минус квадрат расстояния. Он может быть положительным или отрицательным. В первом случае величина хА никогда не сможет обратиться в нуль, и, следовательно, в силу нашего соглашения о детерминанте и коэффициенте дх4/дх4, она не может изменить свой знак при преобразованиях Лоренца. Второе событие (с координатами хк) называется более Поздним или более ранним по отношению к первому (находящемуся в четырехмерном начале координат) в зависимости рт того, что хА > 0 или хА < 0. В этом случае принято использовать термин "собственное время" (или, в более общем случае, — промежуток собственного времени между двумя событиями) для абсолютной величины квадратного корня из инварианта (10.4). Именно в этом случае имеется такая система координат (получаемая с помощью некоторого преобразования Лоренца), в которой пространственное расстояние между двумя событиями обращается в нуль, другими словами, в которой считается, что эти два события произошли в одном и том же месте. Это fa система координат, в которой материальная точка, в исходной системе координат двигавшаяся прямолинейно с постоянной скоростью и за временной промежуток 0^х4 переместившаяся из пространственной точки (0, 0, 0) в пространственную точку (xl,x2ix3), считается все время покоящейся. Собственное время равно временному промежутку между этими двумя событиями, измеренному лилипутским секундомером "наблюдателя-лилипута", движущегося указанным способом. В силу инвариантности выражения (10.4) временной промежуток является кратчайшим из зарегистрированных между ними в любой системе координат. Обратимся к случаю, когда инвариант (10.4) отрицателен. В этом случае временной промежуток х'А может обращаться в нуль и менять свой знак при преобразованиях Лоренца, несмотря на наше соглашение относительно детерминанта и коэффициента дх'4/д хА. Порядок следования двух событий во времени не определяется инвариантным образом. А смысл инварианта заключается теперь в том, что он равен взятому с отрицательным знаком квадрату расстояния между событиями в системе координат, в которой они являются одновременными. Из расстояний, которые могут быть получены для них в любой системе координат, это расстояние является наименьшим. У меня нет сведений о том, что абсолютное 88
значение квадратного корня из инварианта получило в данном случае какое-либо название, настолько же популярное, как термин "собственное время" в предыдущем примере. Можно было бы назвать его расстоянием одновременности, или одновременным расстоянием. Но эти названия не укоренились. Значительное внимание было уделено несколько более сложному понятию. Если концы ровного стержня соответствующей длины помещены в пространственные точки (0, 0, 0) и (х19х2,х3) и он покоится в исходной системе координат, то его длину, т.е. (х\ + х\ + х2 >* /2, можно найти, определив пространственные координаты его кс еч- ных точек, и несущественно, проделано это одновременно или нет, поскольку стержень покоится. Решим, что мы проделаем измерения в моменты времени 0 их4 соответственно, гдех4 выбрано так, что в некоторой другой системе координат, по отношению к которой стержень находится в состоянии прямолинейного и равномерного движения, мы имеем х\ = 0. В такой системе координат уже существенно, что эти два измерения должны быть в ней одновременными, чтобы {х2 +х22 + х'32)1^2 имело смысл длины стержня в этой системе координат. Наш инвариант, примененный к упомянутым двум событиям (двум измерениям), дает v2 v2 v2 +v2_ '2 '2 '2 — Xi — X2 — X$ "Г Х^ Xi — X2 -лз Следовательно, в общем случае (х2 +х\ +*!)1/2 >(*;2 + х22 +^2)1/2. Стержень имеет максимальную длину в системе координат, в которой он покоится. Эта длина называется длиной в системе покоя (по-немецки: Ruhlange) *). Уменьшение длины в другой системе координат (или также: в результате приведения в движение) представляет собой знаменитое сокращение Лоренца—Фитцджеральда. Хотя понятия длины покоя и "лоренцевского сокращения" тесно связаны с тем, что было названо мной "одновременным расстоянием", они, как я уже говорил, несколько более сложны. Ибо понятие длины стержня относится не к паре заданных точек-событий, одних и тех же в любой системе координат. Оно относится к паре точек-событий, из которых по меньшей мере одно изменяется от системы к системе; а именно к двум измерениям (одновременным в той же системе координат) пространственных координат двух концов стержня. Продолжим исследование двух событий (или мировых точек) с координатами 0, 0, 0, 0 и хх, х2, х3, хА соответственно. Нам остается еще рассмотреть предельный случай, когда их инвариант (10.4) не положителен и не отрицателен, а равен нулю. В этом слу- *) По-английски: rest-length. {Примеч. пер.). 89
чае невозможно ни обратить промежуток времени в нуль, оставив расстояние конечным, ни реализовать обратный вариант. Одновременное обращение в нуль обеих названных величин не вступает в конфликт с инвариантностью выражения (10.4), но противоречит тому факту, что преобразование представляет собой взаимно однозначное соответствие между мировыми точками. С другой стороны, рассматривая этот случай как предельный для любого из двух вышерассмотренных, мы предчувствуем подлинную ситуацию: теперь нет никакого нижнего предела — ни для временного промежутка, ни для расстояния в пространстве. С помощью соответствующего преобразования Лоренца оба могут быть сделаны сколь угодно малыми — причем одновременно, поскольку они должны оставаться равными — но не обращающимися в нуль. (С помощью подходящего преобразования Лоренца время между испусканием и поглощением кванта света может быть сделано сколь угодно малым.) Следовательно, теперь, как и в первом случае, и в отличие от второго, знак компоненты хл инвариантен, и мы знаем, какое из событий является более ранним. Все точки-события, поддерживающие с началом координат (0, 0, 0, 0) отношения, характеризующиеся нулевым инвариантом, лежат на многообразии -х\ -х\ -х\ + х\ =0, (10.5) которое является (трехмерной) поверхностью "сферического" (если бы измерений было на одно меньше, мы сказали бы "кругового") гиперконуса с вершиной в начале координат. В любой системе координат он имеет буквально одно и то же уравнение. Та половина, на которой х4 > °> называется конусом будущего (по- немецки: Nachkegef), а другая — конусом прошлого (Vorkegef) ; все это - по отношению к началу координат, которое, однако, может представлять собой любую мировую точку и было выбрано в качестве одной из наших точек-событий только для удобства. Физической характеристикой любой точки-события на конусе будущего является то, что оно совпадает в пространстве и времени с прибытием светового сигнала, испущенного в начале координат, т.е. из пространственной точки (0, 0, 0) в нулевой момент времени. А физической характеристикой любой точки-события на конусе прошлого является то, что начало координат (0, 0, 0, 0) лежит на ее конусе будущего; другими словами, что "событие в начале координат" происходит одновременно с прибытием светового сигнала, испущенного "из той точки-события", если предположить, что оно и заключалось в испускании светового сигнала. Эти рассуждения суть следствия из: (1) связи "раньше-позже", зависящей от хА ^ 0; (2) равенства временного промежутка и 90
расстояния; (3) замечания, которое нам следовало бы сделать раньше, а именно: всо наши утверждения были упрощены неявным предположением, что наши координаты измеряются в таких единицах, которые дают скорость света равной 1. Например, используя для времени секунды, мы должны измерять расстояние в "световых секундах" (1 световая секунда = 3 X 1010 см). Или, это обычно предпочитают, если мы придерживаемся сантиметра для длины, то для времени мы должны использовать "световой сантиметр" — время, необходимое свету на преодоление расстояния в 1 см, т.е. (1/3) X XIО"10 с. (Кажется, некоторые авторы называют последнюю единицу световой секундой. Но это находится в явном противоречии с тем, что мы называем световым годом, который является мерой расстояния, а не времени.) Световой конус четко отделяет ту область, где наш инвариант (10.4) положителен, или где (х\ +л*1 +л:|)1/2 < 1л:4| (внутренняяобласть светового конуса), от той, где он отрицателен, или где (х\ + х\ +*з)1/2 > 1*4 I (внешняяобласть светового конуса). Последняя называется также областью одновременности или виртуальной одновременности (все это по отношению к нашему четырехмерному началу координат). Терминология ясна из предыдущего обсуждения. Направление, указывающее из начала координат во внутреннюю область, называется времениподобным, а указывающее на точку в области одновременности — пространст- венноподобным, потому что первое может быть выбрано в качестве оси х4 некоторой лоренцевой системы координат, а второе, например, — в качестве оси л:,. Сигнал любого типа (включая движущуюся частицу, "частицу-курьера"), выходящий из начала координат или проходящий через него, может достичь точек, находящихся только внутри конуса будущего либо на его гиперповерхности. И всякому очевидно, что сигнал не может достичь точек, определенно являющихся более ранними (внутри конуса прошлого или на нем). Но и точки, лежащие в облйсти виртуальной одновременности, также исключаются, ибо в некоторых системах отсчета они являются более ранними, чем начало координат. И тогда послание было бы получено до, того, как оно было отправлено. Этого достаточно, чтобы исключить такую возможность в силу принципа равноправности всех лоренцевых систем координат. Необходимым и достаточным условием является то, что никакой сигнал и никакая частица не могут двигаться со скоростью, большей скорости света. Вряд ли мне нужно говорить, что данные следствия, выведенные довольно догматически в нашем кратком изложении, фактически 91
образуют тот базис, на котором была построена вся теория, и они подкрепляются и полностью подтверждаются обширным экспериментальным материалом. В связи с равноправным, в определенном смысле, положением, занимаемым уже в специальной теории относительности временной координатой по отношению к пространственным координатам, уже в специальной теории возникает упомянутое в начале данного пункта желание получить описание скорости движущейся частицы, лучше согласующееся с таким положением, чем описание в терминах ее трех пространственных компонент: dx, dx2 dx3 Т~ ' Т~ ' ~Г • (10"6) dxA dxA dxA Если обозначить через ds2 инвариант (10.4) для двух соседних мировых точек хкихк+ dxk на рассматриваемом пути, ds2 = -dx\- dx\ - dx\ + dx\. (10.7) и снабдить ds (которое всегда вещественно!) знаком величины dx4, то четыре компоненты dxx dx2 dx3 dxA IT' -T-' IT ' -Г- (10-8) ds ds ds ds будут вполне пригодными для данной цели. Во-первых, при преобразованиях Лоренца они преобразуются подобно самим координатам, поскольку это, очевидно, выполняется для^л*, ads является инвариантом. Для этих компонент имеется инвариант, построенный обычным способом и тривиальным образом равный 1: dx2 dx\ dx\ dx2 1? 7? ds2 ~Ts 4 =1. (10.9) Во-вторых, если обозначить сейчас три компоненты пространственной скорости (10.6) через vX9 vV9 vzy ее абсолютное значение через и, то -^- =Vl-»2, (10.10) dxA и четыре компоненты (10.8) имеют вид vx v^ vz JT^F ' JT^F ' ^/T~Jг ' VT (10.11) Следовательно, в очень часто встречающемся случае, когда скорость мала по сравнению со скоростью света (v < 1), первые три компоненты очень слабо, на величины второго порядка малости, 92
отличаются от компонент пространственной скорости, а четвертая компонента очень мало отличается от единицы. В специальной теории относительности набор из четырех чисел, преобразующихся подобно координатам, называется четыре-век- тором, а четыре-вектор (10.8) называется четыре-скоростью. Flo приставка "четыре" часто опускается, если она явствует из контекста. Как видно из формулы (10.11), на компоненты четыре- скорости нет того ограничения, что они < 1. Если исключить условие (10.9), они могут принимать любые вещественные значения. Используя понятия специальной, или ограниченной, теории относительности для физической интерпретации математической схемы общей теории относительности, которую мы обсуждали до сих пор на этих страницах - обсуждали, разумеется, только довольно формальным образом, - нельзя не подчеркнуть решительно, что последняя, с определенной точки зрения, вовсе не является тем, что, по-видимому, указано в ее названии; с определенной точки зрения она на самом деле является не обобщением, а, скорее, ограничением так называемой ограниченной теории. Она ограничивает применимость последней бесконечно малой окрестностью любой — и это означает, конечно, каждой - мировой точки. На практике "бесконечно малая" область часто может быть взята весьма большой, если гравитационное поле в ней весьма слабо и воспринимается как постоянное, что, например, имеет место в наших лабораториях в течение промежутка времени любой длины. Важно подчеркнуть, тем не менее, что в принципе мы принимаем схему специальной теории относительности только для четырехмерного элемента объема, окружающего мировую точку, которая для этой области может выполнять ту же роль, что и "начало координат" в наших предыдущих обсуждениях. Координаты, расстояния, временные промежутки являются дифференциалами координат или образуются из дифференциалов координат только внутри данной малой области. Общее преобразование координат (х'к = четырем произвольным функциям от хк) приводит к линейному преобразованию величин dxk в каждой мировой точке, и, таким образом, сводится как мы немедленно увидим, inter alia *), к преобразованию Лоренца величин dxk в каждой точке, непрерывно изменяющемуся от точки к точке, так что внутри малой области оно может рассматриваться как постоянное. Именно поэтому для малой области мы можем пользоваться специальной теорией относительности. *) Inter alia (лат.) - кроме прочего. (Примеч. пер.) 93
Фактически преобразование величин dxk в любой точке dx^—^dXi (10.12) bxt на самом деле не является преобразованием Лоренца; оно представляет собой нечто немного более общее. Преобразование Лоренца в том, что касается числа постоянных или имеющихся степеней свободы, эквивалентно вращению в четырех измерениях. А вращение в п измерениях зависит от п (п — 1)/1 -2 постоянных (что дает, как мы знаем, правильное значение 3 для п = 3). При п = 4 мы получаем 6 в качестве числа независимых постоянных для преобразования Лоренца. (Другой способ подсчета заключается в следующем: преобразование Лоренца равносильно вращению в пространстве (3 постоянные) плюс произвольная скорость (еще 3 постоянные) новой пространственной системы координат относительно старой.) Но в формуле (10.12) все 16 коэффициентов Ъх,к1Ъх1 произвольны. К чему сводятся десять дополнительных степеней свободы? Ни к чему интересному с точки зрения этой одной мировой точки или мирового элемента объема. Мы охотно обошлись бы без них, если бы могли. Общее линейное преобразование, а именно это представляет собой формула (10.12), включает и четыре независимых изменения единиц, служащих для измерения координат в четырех взаимно ортогональных направлениях *); оно сводится к этому изменению плюс произвольное "вращение" (мы отложим решение вопроса о том, когда и действительно ли являются последние преобразованиями Лоренца). Это замечание позволяет объяснить десять дополнительных степеней свободы. Действительно, мы можем произвольным образом выбрать первое из четырех взаимно ортогональных направлений (3), затем второе, ортогональное ему (2), затем третье, ортогональное им обоим (1), а затем выбрать четыре изменения масштаба (4), что дает 10. Мы должны допустить наличие этих десяти добавочных степеней свободы в нашей мировой точке просто потому, что общее координатное преобразование захватывает все мировые точки, и его дифференциальная форма (10.12), вероятно, не смогла бы сообразовываться с более частным видом, имея только 6 постоянных в каждой мировой точке. И необходимость такого допущения подтверждается тем фактом, что наш инвариант ds2 имеет не фиксированную *) Примем здесь, в данный момент, ортогональность в элементарном смысле слова (обсуждение последует). Для подсчета числа постоянных это несущественно. 94
форму (10.7) в каждой из координатных систем ds2=-dx\ -dx\ -dx\ +dx\, (10.13) а более общую форму ds2=gikdxtdxk (10.14) с десятью функциями #/*, изменяющимися вместе с координатной системой. Невозможно отрицать, что это большое неудобство. Ибо из этой общей формы мы не можем указать величину пространственного расстояния и временного интервала между двумя точками-событиями даже внутри малого объема, и даже по отношению к используемой системе координат. Общие мировые координаты не годятся для непосредственной интерпретации. Если мы хотим дать таковую, мы должны с помощью локального преобразования свести выражение (10.14) к форме (10.13). Давайте обозначим локальные координаты, для которых ds2 принимает эту стандартную форму, через dyk, причем "<2" означает только то, что они являются бесконечно малыми, но не обязательно дифференциалами функций yk(xt). Для другой системы мировых координат, Arjfe, пусть тот же смысл имеют величины dyk. Тогда величины dyk являются,через dxk и dxk, линейными функциями величин dyk, и эта линейная связь обязана представлять собой преобразование Лоренца, по крайней мере в том смысле, что -dy? - dy'22 - dy? +dy'42 =-dyj - dy\ - dy\ +dy\. Можем ли мы быть уверены, что оно является преобразованием Лоренца также и в ограниченном смысле, т.е. что его детерминант I ЪуЦЪу{ | равен +1, а коэффициент Ъу\\Ъу^ > 0? Первое легко гарантировать, если согласиться раз и навсегда, что допустимы только мировые преобразования с положительным детерминантом \дхк/дх{ \, — это небольшая жертва, поскольку знак в любом случае постоянен, — и если воспользоваться теми же мерами предосторожности для преобразованияdxk -*dyki приводящего интервал к стандартной форме. Второе, положительный знак коэффициента ЬуЦду*, был бы гарантирован, если бы мы были также уверены, что в любой мировой системе координат общего вида и в любой мировой точке три из четырех линейных элементов (1) (^,,0,0,0), (2) (О.Ла.О.О), (3) (0,0,</jt3,0), (4) (0,0,0,с/лг4) являются пространственноподобными, а один - и более того, один и тот же для всего мира — времениподобным. 95
Мне не известны случаи, когда использовалась бы мировая система координат, не подчиняющаяся этим требованиям. Но я не вижу никаких общих оснований, и даже на самом деле, никакого простого способа исключить из рассмотрения подобные системы координат. Это не тот случай, когда условие, будучи выполненным в одной мировой точке, должно быть справедливым для всего мира. Верно, что координатный линейный элемент*) может изменить свой характер, только пройдя сквозь световой конус. Но, к сожалению, это не приводит ни к каким сингулярностям. Форма ds2 = -dx2 - dx\ - 2dx3 dx4 является в той же мере регулярной и имеющей хорошее поведение, что и стандартная форма, в которую ее легко перевести с помощью преобразования dy\ =dxlt dy2 =dx2, 1 1 dy3 = ~~— (dx3 + dx4), dy4 = —=:{dx3 - dx4). y/2 V2 Тем не менее в первой форме как элемент (0,0, dx3, 0), так и элемент (0, 0, 0, dx4) лежат на световом конусе. В некоторой близлежащей мировой точке элемент dx4 может оказаться времениподобным, dx3 — пространственноподобным, а в некоторой другой точке ситуация может быть обратной. В первой точке мы были бы склонны интерпретировать как время координату х4, а во второй — координату х3. И ни та, ни другая интерпретация не была бы правильной: чтобы дать правильную интерпретацию, необходимо получить стандартную форму. Отсюда следует, inter alia, что локальная скорость света одинакова повсюду во всем мире, а именно, равна 1 в наших единицах. Но мы опять не должны всерьез рассматривать это как результат чистого разума: теория была построена, inter alia, на этом требовании. Нам не следовало бы заканчивать эту главу, не указав того пункта, в котором общая теория действительно является более общей, чем ограниченная. С помощью преобразования Лоренца мы можем "устранить преобразованием" любую скорость. Не способна ли общая теория на большее, поскольку для интерпретации мы должны в конечном итоге прибегнуть к системе координат ограниченной теории относительности, из которой локальные величины gik, так сказать, исчезли? Разве не предполагается, что именно они описывают гравитационное поле? Не они, но как мы вскоре увидим, их первые производные. И мы увидим, кроме того, что они также могут быть обращены в *) Подразумевается линейный элемент того же типа, что и в (10.15). 96
нуль в любой данной точке с помощью подходящего общего преобразования. Мы, таким образом, "устраняем преобразованием" локальное гравитационное поле. И вовсе не с помощью магического трюка: физический смысл состоит в том, что мы локально выбираем пространственную координатную систему, имеющую такое ускорение, которое испытывало бы пробное тело в локальном гравитационном поле. Примечание при корректуре. Объясняя на стр. 95, что нет никакой необходимости для того, чтобы именно три из четырех линейных элементов (10,15) были пространственного)добными, а один - времениподобным, я добавил, что я не знаю никого, кто когда-либо использовал систему координат, в которой это было бы не так. С того момента, когда это было написано, обратный пример был представлен Куртом Гёделем (Reviews of Modern Physics, 1949, v. 21, p. 447). Гёдель сообщаете восхитительном,совершенно новом типе космологических решений эйнштейновской теории 1915 года. Это решение приобретает самую простую форму, если два из координатных линейных элементов являются времени- подобными (два других пространственного)добны). На мой взгляд, в этом случае невозможно найти такую систему координат, в которой обычное распределение (3+1) выполняется повсюду. Сигнатура геделевского элемента длины, конечно, совпадает с (— +), как и требуется! ГЛАВА 11 ЗАКОНЫ СОХРАНЕНИЯ И ВАРИАЦИОННЫЕ ПРИНЦИПЫ Элементарное понятие о законах сохранения Мы предложили взять в качестве полевых законов для гравитации Rkl = 0 в пустом пространстве-времени, п Rki = Tkl там, где есть "материя", причем Tkl является тензором натяжений-энергии-импульса материи. (Мы сейчас же обсудим, что именно это в точности означает.) Выбирая себе по вкусу полевые уравнения, необходимо соблюдать осторожность в той же, и даже большей, мере, как и при записи системы алгебраических уравнений, определяющих некоторые неизвестные величины. Ибо эти уравнения не обязаны быть со- 7. Э. Шредингер 97
вместными. К примеру, если вы потребуете от jc, >>, чтобы л:+>>=1, 2х + 2у = 5, то это просто невозможно. Вторым, столь же важным, но имеющим совершенно другую природу пунктом является то, что материя должна подчиняться четырем законам сохранения энергии и линейного импульса. Это означает, как я сейчас же объясню, что имеется некоторое условие, которому тензор Тк1 должен удовлетворять, а именно, что его дивергенция должна обращаться в нуль. Мы не должны требовать, чтобы он был равен другому тензору, для которого это не имеет места. (Второе из уравнений (11.1) в действительности должно быть видоизменено с учетом этого требования.) Оба требования — совместность и законы сохранения — выполняются автоматически, если мы примем наши уравнения не сразу, а будем основывать их на вариационном принципе. Такова программа, осуществление которой потребует у нас некоторого времени. Я не имею в виду вопрос совместности; мы примем без доказательства математическую теорему, что так называемые уравнения Эйлера — вариационные уравнения, выведенные из вариационного принципа, — всегда совместны. Но мы должны более подробно рассмотреть законы сохранения. Сначала я буду говорить об элементарных случаях, весьма далеких от общей теории относительности. Прототипом закона сохранения является так называемое уравнение непрерывности движущейся жидкости. Если р — плотность, a Ui, v2, v3 — компоненты скорости, это уравнение имеет вид Эр d(pvx) Э(ри2) Э(ри3) bt Ъхх Ъх2 Ъхъ Интегрируя уравнение непрерьгоности по некоторому объему о" Рис.5 жидкости, зафиксированному в пространстве, и используя теорему Гаусса, вы получите а /р dr = J [puiCos(«, 1) + pu2cos(w, 2) + pu3cos(rt, 3)] df. dt 98
Трехмерный вектор pv является плотностью потока; а уравнение гласит, что количество жидкости, заключенной в определенном пространстве, уменьшается на то количество, которое вытекло из него. Это, таким образом, очень тривиальное, но тем не менее очень важное утверждение, имеющее чисто геометрическую природу; оно не имеет ничего общего с динамическим взаимодействием между частями жидкости или чем бы то ни было еще. В нескольких элементарных теориях, а именно в теории движения идеальной жидкости, или в теории абсолютно упругого тела, или в теории Максвелла, сходные рассуждения применимы к динамическим величинам, характеризующим плотность энергии и плотность импульса. Каждая из четырех величин, плотность энергии и jc-, у-, z -компоненты плотности импульса, могут выполнять роль вышеупомянутой плотности р, и поэтому мы имеем четыре динамических уравнения сохранения, имеющих форму, сходную с формой уравнения (11.2). С каждой из четырех величин ассоциируется тройка компонент, указывающих поток этой величины, так что всего мы имеем 16 величин. Три компоненты, задающие поток компоненты 3-вектора импульса, не могут конечно, образов ьшать 3-вектор. Все 3X3 компоненты потока импульса образуют один объект - трехмерный тензор натяжений. Обозначим через Мк {к = 1, 2, 3) компоненты импульса и через Tik (/, к = = 1, 2, 3) - этот тензор натяжений, тогда уравнение сохранения щ\яМ\ имеет вид ЭЛ/, ЪТп ЪТп ЭГ13 + + + = О, bt dxi дх2 Эдгз что дает, после интегрирования по объему, d — JMtdT^ dt = /[^nCOsO, l) + r12cos(>2, 2) + rI3cos(H, 3)] df. Подынтегральное выражение в правой части представляет собой л-компоненту силы F,, действующей со стороны внешней окрестности площадки d/'на ее внутреннюю окрестность. Уравнение гласит, что эта сила дает вклад в —, а вся совокупность этих сил компенсирует — увеличение полной х-компоненты импульса, заключенного внутри поверхности. Это не обязательно должно привести к движению, потому что может случиться так, что все эти натяжения сбалансированы и имеется равновесие. Рис- 6 7* 99
Но в любом случае эта сила рассматривается как поток импульса. Более того, может существовать скрытое внутреннее движение, приводящее к конвективному переносу импульса через элемент поверхности. Иногда удобно включить их в натяжения. Например, рассматривая процессы внутри некоторого газа, так всегда и делают. В этом случае всегда имеются молекулы, пересекающие площадку в направлении 1 -> 2 и в целом переносящие в этом направлении импульс с тем же направлением. И этот эффект ни в коем случае Рис.7 не компенсируется событиями противоположного типа, наоборот они его удваивают. Ибо частицы, пересекающие площадку из (2) в (1), в целом переносят импульс противоположного знака в противоположном направлении. Ми имеем обыкновение говорить об этом явлении как о внутреннем давлении газа. Мы сейчас должны сделать весьма большой скачок, чтобы избежать кое-чего, что завело бы нас в далекие дебри, ибо это кое-что подразумевало бы построение максвелловской теории электромагнитного поля, исходя из ее экспериментальных оснований. Поэтому я должен просить читателя поверить мне, что с нашей четырехмерной точки зрения имеются веские причины для включения четырех упомянутых уравнений сохранения в одно утверждение относительно четырехмерного тензора второго ранга. Его 16 компонент представляют собой, вообще говоря, 16 только что упомянутых величин, но в действительности их не 16, а только 10, так как тензор симметричен. (Для 9 компонент натяжений этот факт хорошо известен; в теории упругости впервые было обнаружено, что они образуют симметричный тензор и, таким образом, сводятся всего к 6.) Мы должны воспользоваться так называемой галилиеевой метрикой специальной теории относительности (gik = = — 1,— 1, — 1, +1 на диагонали, а остальные элементы равны нулю). Тогда наиболее единообразная форма получается для смешанного тензора, поскольку при этом удается избежать отрицательных знаков. Мы имеем в этом случае ьт\ ът] ът] art _ дх} bx2 dx3 dx4 100
ът\ ът\ ът\ ът\ + + + = 0, Элг! дх2 дх3 Эх4 дТ\ ЪТ\ ЪТ% ЪТ% + + + = 0, d*i Элг2. Элг3 дх4 Ъхх Ъх2 Ъхъ дхА Наиболее эффектное новое свойство состоит в том, что три компоненты импульса являются в то же время компонентами потока энергии. Впервые это стало ясным в теории Максвелла, где указанные три компоненты образуют так называемый 3-вектор Пойн- тинга. Более глубокий смысл заключается в том, что энергия и масса представляют собой одно и то же. Импульс, который в своей исходной концепции был скоростью массы, является здесь потоком массы, а следовательно, и энергии. Поэтому последнее из наших четырех уравнений является одновременно и уравнением непрерывности для плотности массы, что возвращает нас назад к исходной точке. Какую форму будут иметь эти уравнения в общей метрике, иными словами, в гравитационном поле общего типа, должно пока оставаться открытым вопросом. Мы отметим, что мы должны будем получить нечто подобное обращению в нуль дивергенции тензора (или, вероятно, тензорной плотности) второго ранга. Это нечто мы должны будем интерпретировать как законы сохранения в гравитационном поле. Каким образом законы сохранения следуют из вариационного принципа в классических (дорелятивистских) теориях Займемся теперь математическим исследованием путей получения систем уравнений указанного вида из вариационного принципа. Существует один старый и хорошо известный метод - вы найдете его в любом учебнике по вариационному исчислению. Начнем со схематического. изложения этого элементарного метода, не столько с целью его использования в дальнейшем, сколько, наоборот, для того, чтобы подчеркнуть разницу между этим методом и методом, используемым в общей теории относительности и по существу совершенно отличающимся от элементарного метода, хотя и имеющим с ним некоторое внешнее сходство, вследствие чего читатель легко может спутать их друг с другом. *)Или, короче, дТ1к/дх.= 0. 101 (11.3)*)
Элементарная связь получается следующим образом. Пусть /,£,/*>• .. - набор не определенных пока функций координат хк (в наиболее важных приложениях они представляют собой полевые переменные gik или нечто в том же роде). Введем сокращенное обозначение V — =/к и т.д. Ъхк Рассмотрим вариацию 5/четырехмерного интеграла /=/#(/,£, Л,.. .; fkigk.hk ; xk)d*x, вычисленного по любой фиксированной области. Я должна быть заданной функцией от своих многочисленных аргументов (5s + 4, если имеется s функций f,g,h,...). Под вариацией подразумевается то, что функциям /, g, Л, ... даны малые приращения 5/, 6g, 5/г,..., обращающиеся в нуль на границе области интегрирования. Частные производные от Я как функции их 5s + 4 аргументов удобно обозначить с помощью нижних индексов ЪН _ ЪН _ ЪН V ЭД * Ъхк Знак суммирования 2, стоящий впереди выражения, в котором присутствует буква /, будет означать, что нужно добавить еще то же самое выражение для g, для h и т.д. Но сохраняется и наше обычное правило суммирования! Тогда*) ai = fi:(Hf6f+Hfk6fk)d*x = fi:(Hf- ^Hf\sfd4x. Выражение в скобках иногда называют гамильтоновой производной Я по отношению к /, и порой для нее используется сокращение 6 Я/б/ или что-нибудь в этом роде. Чтобы вариация 5/обращалась в нуль при наших условиях варьирования, все эти гамильтоновы вариации должны обращаться в нуль. Система соответствующих уравнений называется системой уравнений Эйлера: ЪН Ъ ft =Hf- дН ~— = Hg~ Bg * *)Мы воспользовались тем, что bfk = Э/Эл^(б/), провели интегрирование по частям в члене, содержащем эту величину, и учли, что на границе б/ = 0, так что поверхностный интеграл обращается в нуль. 102
Если умножить теперь первое уравнение на /,-, второе на£,и т.д., а затем сложить их все вместе, то получится (помните о смысле знака Е!): °-s(*»/-'<£»4)- -i[/'"'*S"*--£wi'4 Э/ bfi bfk Поскольку/,— , — = — , сумма 2, вычисленная для пер- bxj Ъхк bxt вых двух членов, дает просто ЭЯ/Эдс/, при условии, что Я не зависит от jc/ явно. (Мы предположим наличие такой явной зависимости только для того, чтобы сейчас же отказаться от нее и показать тем самым, что весь вывод основан на этой независимости!) Поэтому наше уравнение может быть записано в виде ЪН Э ^ 0=—-— 2(/,Яг). bxt bxk K Используя символ Кронекера bik ( = 1 для / = £, а в противном случае = 0), мы можем записать ^-(5/,Я-2/|Я/) = 0. Ъхк к Эти четыре уравнения относятся к "типу уравнений сохранения". Отметим три момента: (а) Они являются следствиями уравнений Эйлера и выполняются, если и только если 5/= 0. (б) Для каждого из них в отдельности требуется, чтобы функция Я не зависела от соответствующей координаты xt. (в) Выражение в скобках не обязательно симметрично по /, к. В общем случае симметрии нет. В не релятивистских или до релятивистских теориях это явилось обычным способом, объясняющим наличие законов сохранения. То, что их существование целиком основано на отсутствии явной зависимости функции Я от координаты хк, весьма важно. Законы для нашего поля диктуются функцией Гамильтона Я (часто называемой функцией Лагранжа). Упомянутая независимость от хк означает, что эти законы не подвергаются изменениям при перемещениях в пространстве или времени, что они в понедельник такие же, как и во вторник, а в Париже те же самые, что и в Лондоне. Эта независимость (согласно дорелятивистской физике) лежит в основе законов сохранения энергии и импульса. 103
Законы сохранения в общей теории относительности В общей теории относительности все обстоит по-другому. Общая относительность сама по себе порождает законы сохранения - и не в виде следствий из уравнения поля, а в виде тождеств . Происходит следующее. Если вы рассматриваете интеграл /=/SK d4x, в котором SK теперь, конечно, считается инвариантной плотностью (и поэтому обозначается готической буквой), то из одного только факта общей инвариантности данного интеграла вытекают четыре тождественных соотношения между гамильтоновыми производными плотности 81, и эти соотношения - типа законов сохранения; но как я сказал, они являются тождествами, а не как ранее — уравнениями, возникающими в результате приравнивания нулю гамильтоновых производных. Мы покажем, что четыре соотношения между гамильтоновыми производными выполняются независимо от того, равны ли нулю эти производные сами по себе или нет, если же да, то соотношения становятся тривиальными. Существование четырех тождеств не вызывает удивления. И по следующей причине. Если вы примете вариационный принцип Ы= О для нахождения функций f,g,h,... (плотность JR должна зависеть от них и их производных), то вы получите столько дифференциальных уравнений 581 — = 0 и т.д., of сколько имеется функций /, g, hy. .. А в общей теории относительности это означает - на четыре больше, чем нужно, потому что здесь функции f,g, h, . .. обязаны быть компонентами некоторого тензора и, следовательно, подвергаются изменению при общих преобразованиях системы координат. Такое преобразование содержит четыре произвольные функции. Следовательно, наши s функций не могут полностью описываться этими s уравнениями. И поэтому последние не могут быть совершенно независимыми друг от друга. Подобная зависимость и заключается в наличии упомянутых четырех тождеств между левыми частями этих уравнений. Перейдем к выводу таких уравнений в случае метрики gik. Это означает, что скалярная плотность SR зависит теперь только от десяти компонент gik (берущих на себя роль функций /, g,h, ... ), их производных gikti и, возможно, также от более высоких производных (это не приводит ни к каким усложнениям и потребуется в дальнейшем). Таким образом, мы рассмотрим плотность ^(gikyiik.bSik^my • • • )• 104
Вычислим вариацию 5/ и проведем, следуя указанному выше образцу, интегрирование по частям, необходимое для приведения ее к виду 5SK 5/=/ 3gik d*x. (11.4) Sgik Для наших нынешних целей, заключающихся не в том, чтобы потребовать равенства 5/= 0, а в том, чтобы вывести тождества, связывающие величины 8fR/dgik, не обязательно на самом деле вычислять последние, достаточно знать, что они легко могут быть найдены. Для краткости мы положим bgik и, таким образом, SI=ffRik8gik d*x. (11.5) Вариация 5/является инвариантом, будучи разностью двух инвариантов. Следовательно, подынтегральное выражение является скалярной плотностью. Более того, вариация bgiky будучи разностью двух тензоров, является тензором, причем совершенно произвольным. Поэтому SRlk является симметричной контрава- риантной плотностью второго ранга*). Соответственно были выбраны и наши обозначения. Применим теперь (11.5) к такой вариации bgik, для которой 5/ должно обращаться в нуль тождественно, в силу того факта, что / — инвариант. А именно, мы осуществим "вариацию" величин gik путем простого изменения системы координат (что не может изменить величины инварианта /). Пусть преобразование зависит от некоторого параметра X такого, что при Х^Ооно превращается в тождественное: xt = х/(*,', X) = х\ + \^(х'() + X2 ф1 (x'i) + ... Наш инвариантный интеграл приобретет тогда следующий вид: *)Нет никакого смысла делать в (11.4) различие между 89t/8gik и 8Л/б^Л/, так как они совпадают в силу симметрии величин 8gik. Следовательно, величина Stik с необходимостью является симметричной, и именно поэтому факт произвольности симметричного тензора 8gik достаточен для доказательства наличия у Л '* тензорных свойств. Наше общее исследование на стр. 21 было основано на использовании произвольного произведения вида AjAk с произвольным вектором А{. Для произвольного тензора Aik (например, для 8g-k) оно справедливо a fortiori 105
где плотность W является, конечно, такой же точно функцией от величин t , bxt Ъхт OXj OXk и их производных по х\ какой ранее она была от величин gik и их производных по х. Пределы интегрирования по х будут совпадать с пределами интегрирования по х, если мы потребуем, чтобы на границе преобразование превращалось в тождественное при любом X. Поскольку вид обозначений для переменных интегрирования несуществен, единственное формальное изменение заключается в том, что аргументом теперь является не gik (jcj), a gik (x's) . Теперь, разлагая в ряд по X, легко вычислить, что gik(Xs)-iik(x's) = *lk Йу' gim Av' Йу' OXj 0Xk ОХп sMferi+ft«TT +r-r*n) + 0(\2), причем все функции зависят от х'. Поскольку на границе это выражение должно обращаться в нуль при любом X, мы можем воспользоваться выражением (11.5), удерживая в bgik лишь члены первого порядка по X. Опуская излишние теперь штрихи, мы получим \ Ъх( Ъхк Ъхп ] Для сокращения записи мы воспользуемся правилом опускания индексов с помощью gik и произведем указанное выше интегрирование по частям / эк; ыякт bgik \ 0 = / - —- *,-- *т + *'* -г— *n)d4* = \ bxt дхк Ъхп J \ Ъхк Ъхт I Величина ут совершенно произвольна, поэтому 11!!= _!.***-о. Ъхк 2 Ъхт Таковы искомые четыре тождества. Они должны, конечно, являться тензорными уравнениями. Мы можем непосредственно показать это, приведя их к нашим обозначениям для инвариантной производной через точку с запятой. В самом деле (два члена, которые мы добавляем, антисимметричны по (/, к) и поэтому исчезают 106
после суммирования с симметричным w ): JL «'* 9gik = -L nik ( bgim + bgik + ^gkm 2 Ъхт 2 \ Ъхк Ъхт дх( Таким образом, мы получаем О sK w к i к л ~ - & i^km= $R m;* = 0- Ъхк к (Это следует из общей формулы для £Я w;/, в которой имеется три дополнительных Г-члена; два из них сокращаются при свертывании по (к, I).) Конечно, пользуясь правилом поднятия индекса под знаком точки с запятой, вы можете записать также Таким образом, дело обстоит следующим образом: инвариантная дивергенция равна нулю для тензорной плотности, которая образована из гамильтоновых производных любой скалярной плотности $Я , зависящей только от величин gt k и их производных по координатам вплоть до любого конечного порядка. Это, конечно, очень приятно, потому что инвариантная производная, несомненно, является двойником, и единственным инвариантным двойником, обычной дивергенции в элементарной теории. И поэтому у нас была хорошая надежда на то, что в общей теории некоторая подходящая скалярная плотность выдаст нам законы сохранения в виде тождеств. Необходимо все же сделать несколько замечаний, чтобы охладить наш энтузиазм. В сказочном подарке, полученном нами, имеется кое-что лишнее, а кое-чего и не хватает. Во-первых, эти тождества не единственны. Любая скалярная плотность породит некоторую систему тождеств. Мы предпочли бы получить некоторое утверждение, касающееся только одной конкретной плотности SK, и даже не обязательно тоэвдество. На самом деле, мы не очень-то и стремились получить тождество, а с другой стороны, законы сохранения представляют собой один отдельный факт, а не класс фактов. Во-вторых, имеется, по-видимому, следующая альтернатива: или плотность SR, из которой возникают "истинные" законы сохранения, совпадает с той, которая порождает наши полевые уравнения, или не совпадает. В первом случае законы сохране- km ния становятся тривиальными, поскольку сами величины зк по отдельности обращаются в нуль, а не только их дивергенция. Во втором случае, когда имеются две различные плотности SK для 107 ■
этих двух целей, может показаться, что законы сохранения совсем не имеют ничего общего с полевыми уравнениями, как бы стоят в стороне от них. И третье, несколько огорчительное замечание. Хотя инвариантная дивергенция и является единственным действительно инвариантным двойником элементарной дивергенции, она не является истинной дивергенцией в математическом смысле слова. Интегрируя ее по трехмерному объему, вы не сможете вывести интегральные законы сохранения, которые именно и апеллируют непосредственно к нашему воображению. Чисто формальное замечание, которое очень полезно, заключается в следующем. Мы взяли вариацию в виде 6I = f&ik6gikd4x. А что было бы, если вместо функций ,gl мы воспользовались бы функциями gik ? Ответ достаточно прост. Оба множителя являются тензорами, и поэтому можно одновременно поднять и опустить немые индексы любой пары. Кроме того, мы знаем, что подняв оба индекса в bgik, мы получим -bglk. Следовательно, M=-f*t*6gikdAx. Другими словами, 5й bg Вариационный принцип Эйнштейна Простейшей скалярной плотностью, которую можно образовать из величин giky является \/-g. Давайте поэтому рассмотрим сейчас величину I = fy/~d*x. (11.6) Теперь имеем 5* «* *(-*) _ g -g 8\n(-g) = 28\ny/~^g =2 и поэтому SI = ^-fy/~^gikdgikd4x. sT4 108
Следовательно, гамильтонова производная дается выражением = -\T£Y* = —91 6ft* 2 2 Но уравнение 81к = 0 не может служить в качестве полевого. Кроме того, тождества в'*-, к = О являются тривиальными ослабленными утверждениями. Ибо мы знаем, что даже в'*;/= 0. Следующая по сложности скалярная плотность является уже гораздо более сложной, она образуется из скалярной кривизны R =gikRik с помощью умножения на y/^g . Рассмотрим поэтому интеграл 1=1 ЯуП d4x = fiikRikd*x. (11.7) Он в самом деле гораздо сложнее, так как величины Rik зависят от вторых производных тензора gik. Можно ожидать, что гамильтоновы производные достигнут четвертого порядка. Фактически же очень легко провести варьирование, а гамильтоновы производные будут иметь только второй порядок. Сначала мы получим bT=f(86ikRik + 9ikSRik) d4x. Теперь вспомним уравнение Палатини (6.19) bRik = -(dr«ik);a + (8r«ia);k. Если подставить это выражение и провести интегрирование по частям относительно инвариантной производной, то члены с SRik не дадут никакого вклада, потому что 6*к<а = 0. Поэтому у нас ос: тается выражение bI = fRikdbikd*x. (11.8) Поскольку мы можем, конечно, рассматривать iik как независимые переменные (в той же мере, что и gik или gik)> уравнения Эйлера имеют вид Rik =0. Это как раз предложенные нами уравнения поля. А как насчет четырех тождеств? Они выполняются для гамильтоновых производных по gik wmgik. Мы должны поэтому выразить через них вариацию 5/. Это легко проделать: Ь *ik = 6j^ gik =уГТ 6gik +gtk6>/4, 5 \fZg=-7 V^FY^ft* = ~—\/~Tgik5gik, 2 2 « «'* = vT bgik - -Iv* v^J gllv8g»». 109
Следовательно, = 1\Г^ UikSgik -, jRgik&gik)d4x = = fy/^g \Rlk - - gikRJ6gik d*x. Таким образом, ъ tk = \/^g \Rik - YgikR)• (1' *9) и упомянутые тождества имеют вид [v^F^(-^5i^] =0, / . 1 . \ (И-Ю) или (Д£- —6£Д) =0, или \Rik gikA = 0, причем все формы записи означают одно и то же. Это показывает нам, что в качестве тензора материи мы должны 1 рассматривать не Rik, a Rik — gfkR- Здесь будет, конечно, и постоянный множитель, по существу, гравитационная постоянная. Мы не будем сейчас его учитывать, за исключением того факта, что по причинам, которые я в данный момент объяснить не могу, он является отрицательным. Таким образом, для тех мест, где имеется материя, мы должны положить -[Rik-~gikR\=Tlk. (11.11) Я предпочел бы, чтобы вы рассматривали эти равенства не как уравнения поля, а как определение тензора материи Г,-*. Точно так же, как уравнение Лапласа div£ = р (или A2V= —4яр) не сообщает нам ничего, кроме того, что мы говорим, что повсюду, где дивергенция Е отлична от нуля, имеется заряд, и называем div^ плотностью заряда. Заряд не заставляет электрический вектор иметь ненулевую дивергенцию, он и есть эта ненулевая дивергенция. И таким же образом материя не заставляет отличаться от нуля геомет- 110
рическую величину, образующую левую часть вышеприведенного уравнения, - она и есть этот ненулевой тензор, она им описывается. Неинвариантная форма законов сохранения Примем водных: Примем к сведению явный вид следующих гамильтоновых производных: ef* -*«• (»■") 8R sTl j— / 1 bgm V^FUik -LgikR\ = -y/qf rik = - гik, (П.13) = Zik. (11.14) Выражение для первой из них извлечено из (11.7) и (11.8), для второй — из (11.9), с использованием обозначения, введенного в (11.11), для третьей - немедленно следует из равенства 8gik = —8g'k Плотность Zjk получена обычной "готизацией" из тензора Tik. Первая форма тождеств (11.10) может быть теперь записана в виде *Л;/ = 0. (11.15) Мы будем использовать это тождество также и в более явной форме 1 £'»'-f^ =0, (11.16) Ъх,- 2 Ьхк которая в действительности является первой из полученных нами в третьем пункте, где мы имели дело с произвольной инвариантной плотностью SX (см. уравнение на стр. 106) . Хотя приведенные выше "тождества сохранения" (11.15) и являются в высшей степени удовлетворительными с точки зрения общей инвариантности, они не обладают тем наглядным смыслом, который был разъяснен на элементарных примерах: интегралы по трехмерному объему от их левых частей не могут быть немедленно преобразованы с помощью интегрирования по частям к такой форме, для которой можно было бы интерпретировать, например, величины £}, %2у £з как поток величины, для которой %\ является плотностью и т.п. Мешает второй член в (11.16). Можно возразить — или, точнее, неохотно согласиться, сделав оговорку, — что интеграл по трехмерному объему от компоненты векторной или тензорной плотности в любом случае не имеет никакого инвариантного смысла. Тем не менее мы приветствовали бы любую наглядную интерпретацию, согласующуюся с элементарной точкой 111
зрения, хотя бы для некоторой избранной системы координат и скорее всего для не слишком широкой области. Нашей главной целью в дальнейшем будет устранение упомянутого препятствия с помощью приведения также и второго члена в (11.16) к сумме производных по координатам — к тому, что иногда называют "обычной дивергенцией". Начнем с объяснения причины, по которой гамильтоновы производные (для краткости - ГЛ.), собранные в (11.12) —(11.14), не зависят от производных фундаментального тензора, имеющих порядок выше второго, хотя из элементарного вариационного исчисления мы должны были бы ожидать, что будет достигнут четвертый порядок, т.е. в два раза более высокий, чем тот, который имеется в самом подынтегральном выражении Ry/^g . Причина в том, что последнее в определенном смысле эквивалентно другому подынтегральному выражению, которое в дальнейшем будет обозначаться через -fi, не содержащему производных от gik порядка выше первого. Эквивалентность основана на том, что разность Ry/^g + £ представляет собой "обычную дивергенцию", о которой мы только что говорили. Интеграл (четырехмерный) от полной дивергенции, поскольку он может быть превращен в интеграл по (гипер) поверхности, не претерпевает изменений при таких вариациях, которые помогли нам дать определение ГЛ., а именно — вариациях, обращающихся в нуль на границе. Поэтому ГЛ. от обычной дивергенции обращается в нуль. Применительно к нашему случаю мы видим, что любая ГЛ. от плотности Ry/^g равна соответствующей ГЛ. от fi,.взятой с отрицательным знаком. Именно это подразумевается, когда говорится, что подынтегральные выражения Ryf^g и-2 'эквивалентны. Переходим теперь к недостающим деталям. Рассмотрим явное выражение RV4= SikR,k = "* \^Г Ъхк +ГакГ »-Г*Г "/ Позвольте мне ввести сокращенные обозначения r"e*rev-r"eflre«-fi#Jk, 8ik2ik=2. (11.17) Таким образом, дха Ъхк Добавляя сюда некоторую обычную дивергенцию, вы получите 112
эквивалентное подынтегральное выражение Выразим множители Й'\а и в1*,* в виде таких линейных комбинаций из величин Г, которым они равны в силу того, что д1к ;0£ тождественно обращается в нуль. Из шести членов, полученных таким образом, два сокращаются, а оставшиеся четыре дают -2 2 : »'\«Гв,*- Й%Г<\а = -2Й . (11.18) Поэтому эквивалентное подынтегральное выражение, как и утверждалось, сводится к - £ . Величина й не является инвариантной плотностью. Ее преимущество в том, что она не содержит производных, имеющих порядок выше первого. Можно считать ее функцией OTgiki или от gfk, или от 81к, или от в (к и от их производных по координатам соответственно, т.е. от gikt /, или от glkf /, или от glkt /, или от gikt /, в зависимости от первого выбора. В каждом случае ее гамильтоновы производные могут немедленно быть выписаны с помощью метода, объясненного в разделе на стр. 103 и далее. Они представляют собой другую форму (достоинства которой сейчас станут ясными) записи гамильтоновых производных указанной выше плотности Ry/^g, которым они по отдельности равны. Мы имеем, например, tim_... §g _ Э / Эй ч Э« 8glm дха \bglnlt0l) bgim Давайте воспользуемся этим выражением во втором члене формулы (11.16): bgim Ьй bg Э / Эй \ Эй rlm,k — ~ bgim, к " dgl> lm,k zlmMm = _ **__ _*£_ = ± /Э8 X d*k Sgim Ъхк bxa\dglmfaJ = _Э_/Э2 \ Эй ЭЙ a~ la glm,k) — Г -glm,ka- ~ gin °x*\ 4lm ,a I °glm,a Oglm Э /ЭЙ \ ЭЙ = ~ It gim.k)--—. (11.19) °xa\dgimf0L J Ъхк Таким образом, "мешающий" член превращается в обычную дивергенцию. Если мы положим 1 / . ЭЙ \ 2 \ Ogimj I 8. Э. Шредингер 113
то (11.16) примет вид ( **+*'*),/ = <>* (11.21) Это демонстрирует, что элементарные идеи "плотности" и "потока", если и применимы, то не к компонентам £'*, а к X1* + t\. Однако t\ не является тензорной плотностью *). Но к этому мы еще вернемся. Выражение (11.20) не очень удобно для вычисления компонент tl K в явном виде, потому что частные производные от.плотности й, рассматриваемой как функция величинgik и £/*,/, являются не самым легким объектом для расчетов. Но мы не обязаны придерживаться именно этих переменных. Мы хотим вместо них использовать $tk и $'*,/• Учтем, что 8/.fi dAx=f- 6glmd*x Oglm и что это равно также 5fi ; л 62 Э0/ш ^8< Л"'^*7 /;тгг««'"л -s-r-ш гг— '*•"''• Srs поскольку величины выявляются функциями от gik. Отсюда следует, что Sfi Sfi 3g" bgim Hrs dglm и г lm bgim _ 5fi dgrS d*lm 6Я 3gj Продолжая дальше в точности по образцу (11.19), получаем другую форму записи для нашего псевдотензора, а именно •''■-К**8 -^ *""■*)■ (11-20а) Чтобы получить частные производные в "готических переменных с верхними индексами", образуем полный дифференциал тождества (11.18) *lk.adr*lk- Sik,kdr«ia + + r*ikd{uik,a)-r«i0ld{tik>k) = -2dZ *) tlk называют эйнштейновским псевдотензором энергии-импульса гравитационного поля. (Примеч. ред.) 114
и заменим явные производные в первых двух членах (как мы проделали это при выводе формулы (11.18)) такими линейными комбинациями величин Г, которым они равны вследствие обращения в нуль производной 8tk •/. Тогда эти два члена оказываются равными - 9,kdZtk = -rffi + fi,*d*'fc. Таким образом, -raikd( *'*,«)+ Га,в</( «'*.*)- 2ikd8ik=d2. (11.22) Это выражение дает требуемые частные производные; но поскольку они должны быть симметричными по верхним индексам, необходимо осторожно обращаться со вторым членом. Лучше всего переписать его таким образом: Следовательно, ЭЙ Э*'* £ ik (Г ак Гаф - Г а0 Га(Л) , * ik =-Га/Л+7 5%Г^ + -^-5ахГ%. (11.23) Таковы явные выражения для производных, вторая из которых потребуется для приведения к явному виду формулы (11.20а). В целях полноты изложения позвольте мне добавить замечание относительно однородности £ , сначала по отношению к gik mgikj. Относительно второй из них, взятой отдельно, 2 , согласно (11Л 7), представляет собой, очевидно, квадратичную форму, поскольку наши Г являются скобками Кристоффеля. Относительно обеих групп вместе скобки Кристоффеля являются однородными функциями степени нуль, поскольку величины gik суть функции степени -1 от gik. Согласно (11.17) то же самое выполняется для fi ik . Кроме того, величины 81к ( = y/-gg*k), очевидно, имеют порядок + 1 по gik. Следовательно, плотность является однородной функцией степени +1 от величин gik и g(kj, вместе взятых; и поэтому, поскольку она является квадратичной формой от последней, она должна быть однородной функцией степени —1 от первой из них. Все утверждения из последнего предложения остаются правильными (в силу предложения, предшествующего ему) в случае, когда gtk ngikft заменены на 6ik и в1 ,. Отсюда вытекают, 8* 115
например, соотношения Эйлера а'* = -Р а,/с =2 2 од дд ,а которые можно легко проверить прямым вычислением, исходя из формулы (11.23) (при этом необходимо воспользоваться равенством в|Л;/ = 0). Обсудим теперь вкратце псевдотензор tlk и закон сохранения (11.21). Уже указывалось,что первый из нихне является тензором. Он имеет также тот недостаток, что набор компонент, полученных из него опусканием верхнего индекса с помощью фундаментального тензора, не является симметричным (так же как и набор, который получают, подняв нижний индекс). И все-таки уравнение (11.21) выполняется в любой системе координат, при условии, что псевдотензор определен в этой системе именно тем способом, каким мы его определили. На первый взгляд, удивительно, что мы нашли соотношение, справедливое в любой системе координат, несмотря на то, что в нем присутствуют не только тензоры. Но, во-первых, мы не должны забывать, что наше уравнение (11.15), в конце концов, является тензорным, мы только придали ему другую форму; во-вторых, оно имеет два "не совсем ковариант- ных" свойства, а именно, в дополнение к якобы-тензору, оно содержит якобы-дивергенцию, т.е. элементарную дивергенцию вместо инвариантной. Эти два свойства, очевидно, компенсируют друг друга. О компонентах псевдотензора иногда говорят как о гравитационных энергии—импульсе—натяжении. В некотором смысле они заменяют классическое понятие гравитационной потенциальной энергии, не имеющее другого двойника в теории Эйнштейна. Однако, они не являются совершенно подходящим двойником. Выдвигалось, к примеру, возражение, что в поле изолированной материальной точки с помощью надлежащего выбора системы координат можно заставить их всюду обращаться в нуль *). Но, конечно, для одной изолированной частицы понятие потенциальной энергии не возникает и в классической теории. Наиболее важным аспектом неинвариантности формы законов сохранения (11.21) является, вероятно, следующее: эта неинвариантность особенно хорошо убеждает нас в том, что в данной теории мы не должны ожидать, что законы сохранения в элементарном смысле будут целиком выполняться для % \ в любой системе *) Bauer H. Uber die Energiekomponenten des Gravitation-feldes. - Phys. Zs., 1918, B. 19, Z. 163. Schrodinger E. Die Energiekomponenten des Gravitation-feldes. - Phys. Zs., 1918, B. 19, Z. 4. (Литература добавлена при переводе.) 116
координат. Изменение количества "импульса" 7*4, заключенного внутри замкнутой трехмерной поверхности (т.е. интеграла от X к4, вычисленного по объему, находящемуся внутри поверхности), не описывается потоком %к\, %кг^ £*з через ее границу. Для этого случая существует знаменитый и особенно поразительный пример: полное количество 744(т.е. энергии или массы), заключенное в замкнутой расширяющейся Вселенной, уменьшается. В простых моделях можно вычислить потерю энергии, и она оказывается равной количеству работы, которую должно было произвести давление, чтобы увеличить объем, если бы при этом необходимо было выталкивать поршень, как в случае адиабатически расширяющегося объема газа. Тем не менее в данном примере нет ничего подобного ни поршню, ни вообще границе, через которую могла бы вытекать энергия. С дорелятивистской точки зрения (которая могла бы вполне одобрить идею замкнутой расширяющейся Вселенной, не предполагая никакой связи между £/* и гравитационным полем) энергия не теряется, а запасается в виде потенциальной энергии тяготеющих масс, удаляющихся друг от друга. Другой пример заключается в том, что энергия — и угловой момент —"уносится" из системы через пустое пространство ( %1к - = 0) с помощью гравитационных волн, излучаемых системой, когда она имеет внутреннее движение, приводящее к изменению со временем ее моментов инерции, скажем, к осцилляциям. Излученная энергия не обязана где бы то ни было проявляться в качестве Т\\ но это может произойти и произойдет, когда эти волны натолкнутся на другую систему, способную частично поглотить их. Весь процесс имеет большое сходство с тем, что хорошо известно нам из классической теории испускания и поглощения электромагнитного излучения, за исключением того, что истинный тензор энергии Т\ равен нулю внутри волн на всем протяжении их пути сквозь пустое пространство. В таких случаях точные законы сохранения для %\ + t \ могут служить для вычисления потерь энергии — или ее притока, но для определенности мы будем говорить об испускании. Поток t4i, t42, t43 через замкнутую поверхность, которая окружает систему, но сама находится в пустом пространстве, даст вам потерю величины Т\ +1\ внутри поверхности. Если движение внутри системы приблизительно периодично, если система координат выбрана надлежащим образом, если можно качественно предсказать тип векового изменения, обусловленного излучением, - как, например, в случае вращающегося жесткого стержня, который, очевидно, может изменять только свою угловую скорость, — тогда степень затухания может быть количественно выведена из упомянутого интеграла от потока "вектора" t4 k. 117
Г ЛАВ А 12 ОБОБЩЕНИЯ ТЕОРИИ ЭЙНШТЕЙНА Другой вывод эйнштейновых полевых уравнений Динамическое взаимодействие материальных тел не ограничивается одним только гравитационным притяжением. Электрические и магнитные силы между ними были известны с очень давних пор и были сведены Фарадеем и Максвеллом к понятию электромагнитного поля. В обычных условиях электромагнитные силы во всех случаях, когда они вообще наблюдаются, значительно превосходят силы гравитационного притяжения, которое чрезвычайно слабо, если по меньшей мере один из взаимодействующих материальных объектов не является очень большим, имеющим размеры небесного тела. В последнее время мы вынуждены признать также, что между элементарными частицами (нуклонами), из которых построены ядра атомов, имеются силы (называемые ядерными силами), ощутимые только на очень малых расстояниях, но перевешивающие там даже сильное электрическое отталкивание между некоторыми из этих частиц. Поле таких сил называют обычно мезонным полем, по причинам, в которые мы сейчас не будем вдаваться. С тех пор как Эйнштейн открыл в 1915 г. свою теорию гравитационного поля, имели место непрекращающиеся попытки обобщить ее так, чтобы тем же самым естественным путем объяснить также и электромагнитное поле. Поскольку последнее в пустом пространстве описывается антисимметричным тензором второго ранга, сразу же возникает идея, что необходимо взять тензор gik в несимметричной форме в надежде, что его антисимметричная часть Viigib - gici) будет иметь какое-то отношение к электромагнетизму. Но этот план сталкивается с определенной трудностью. Мы получили полевые уравнения Эйнштейна в два этапа. Сначала'мы выделили аффинную связность, заданную скобками Кристоффеля (9.9) и (9.7), как ту, которая "естественно принадлежит" метрике gik. Это было сделано фактически постулированием важного тождества (9.4) и принятием решения ограничиться симметричной аффинной связностью. Только после этого стало возможным образовать для данной аффинной связности тензор Эйнштейна R^ и принять вариационный принцип 5/ »ikRikd4x = 0, (12.1) что и было вторым шагом, сразу приведшим к полевому уравнению Эйнштейна для вакуума, R^ = 0, как объяснено на стр. 108, к которой мы и отсылаем читателя. 118
Исследование, проведенное в первом пункте главы 10, показало, что даже для случая метрики в собственном смысле слова, т.е. для симметричного фундаментального тензора gik, скобки Кристоффе- ля совершенно, очевидным образом не являются одной-единствен- ной аффинной связностью, естественным образом принадлежащей ей. Однако этот выбор может быть по крайней мере сформулирован в виде двух упомянутых выше постулатов, или словами: симметричная аффинная связность, обеспечивающая параллельный перенос фундаментального тензора в себя. Нет никаких очевидных указаний на то, чем нужно заменить тождество (9.4), если тензор gik несимметричен. В этом состоит вышеупомянутая трудность, независимо от вопроса, следует ли сохранить в этом случае постулат симметрии для Гили опустить его. Может показаться очень естественным планом принять соотношение (9.4) также и для несимметричного тензора g(k в том виде, как оно есть. Такая попытка была предпринята, но провалилась. Вряд ли стоит приводить ее здесь полностью. Провал этой попытки станет понятным после того, как совершенно естественное обобщение соотношения (9.4), как мы увидим, возникнет автоматически. Выход из этой дилеммы указывается весьма важным усовершенствованием вывода полевых уравнений Эйнштейна. Оно принадлежит Палатини и минует "первый шаг": вам не нужно заранее принимать решение относительно аффинной связности, вы получите ее вместе с полевыми уравнениями сразу из вариационного принципа. Необходимо действовать таким образом. Пусть плотность 8lk в уравнении (12.1) имеет тот же смысл, что и раньше, но тензор Rik пусть будет тензором Эйнштейна для некоторой не указанной явно симметричной аффинной связности Г'к1. Примем, что метрика gik и связность Ylkl являются независимыми функциями, которые необходимо варьировать произвольным образом, сохраняя при варьировании лишь их свойства симметрии. В любом случае вы получите J («*'**/*+ 8ikbRik)dAx=0. (12.2) Но теперь два вклада в этот интеграл должны обращаться в нуль по отдельности: f&8lkRtkd4x = 0, (12.3) f8ikdRikd*x = 0. (12.4) Во второй строчке воспользуемся формулой (6.19), а именно 6Rik = - (Sraik).a + (5 raia).k. (12.5) Интегрируя (12.4) по частям относительно инвариантной производной (что разрешено, поскольку аффинная связность, определяю- 119
щая инвариантную производную,по предположению,симметрична), вы получите /( ert;e«re№- й'к..к6Г*1а)<Рх = 0 (12.6) ИЛИ /( *'*;*-*"а *%)«Гв№</4*=0. (12.7) Часть выражения в скобках, симметричная по /, к, должна обращаться в нуль. Отсюда, как легко видеть, следует, что 0|7с;а = О. (12.8) Это, конечно, эквивалентно равенству (9.4) и влечет за собой (9.9), т.е. наша связность Г должна даваться скобками Кристоффеля. Соответствующий им тензор Эйнштейна симметричен, и поэтому (12.3) требует, чтобы выполнялось уравнение Д/*=0, (12.9) которое, поскольку Г совпадает со скобками, является уравнением Эйнштейна для вакуума. Теория Эйнштейна—Штрауса Особым достоинством вывода Палатини является то, что его сразу можно однозначным образом распространить и на несимметричный тензор gik • Единственное решение, которое нужно принять заранее, заключается в том, придерживаться ли нам требования симметрии для аффинной связности или опустить его. Если вы попытаетесь придерживаться его, то потерпите фиаско. Вы не получите ничего нового, только абсурдно произвольное и бесполезное дополнение к уравнениям для чистой гравитации. И снова мы не будем утруждать читателя, излагая все это здесь, а перейдем к случаю, когда требование симметрии не применяется ни к #,-*, ник Г1к1. За исключением этого пункта, мы следуем в точности по образцу предыдущего пункта, начиная с уравнения (12.2) и до конца. Имеется даже некоторое упрощение ввиду того, что независимые вариации не ограничены больше требованием симметрии, а являются совершенно свободными; поэтому мы можем теперь, к примеру, немедленно вывести из (12.3) уравнение (12.9), не обращая внимания на то, будет ли тензор Rik всегда симметричным или нет (конечно, не будет). С другой стороны, имеются две чисто технические сложности, требующие осторожности. Во-первых, для несимметричной аффинной связности, имеется, как указано в (6.19), еще одна добавка к формуле (12.5). Во-вторых, простая 120
формула "интегрирования по частям относительно точки с запятой", с помощью которого уравнение (12.6) было получено из (12.4) и (12.5), также ограничена случаем симметричных аффинных связностей, для которых она была доказана в главе 4; в несимметричном случае имеется дополнительный член, в котором нужно разобраться. Чтобы сходство с симметричным случаем не затемнялось несущественными деталями, а относящиеся к делу результаты не занимали слишком много места, мы пару раз приведем здесь только результаты преобразований, вынося технически сложные выкладки в приложение (стр. 128), где читатель может найти их, если ему покажется, что он в них нуждается. Что касается обозначений, мы будем придерживаться известных соотношений между четырьмя формами фундаментального тензора, например, где g — снова детерминант величин gik (но не их симметричной части). Но, конечно, в соотношении, определяющем g,k из gik, a именно в gMgkm=glkgmh=blm, (12.10) порядок индексов теперь существен, и мы примем тот порядок, который указан здесь. Теперь мы не принимаем никакой общей схемы подъема и опускания индексов. Она не нужна и способна привести к путанице. Мы введем весьма удобные обозначения Эйнштейна и Штрауса, а именно будем указывать симметричную или антисимметричную составляющую чего бы то ни было, подчеркивая обсуждаемую пару индексов или помещая под ними галочку соответственно. Например, 1 Sik " ~(gik + gki) > Г'*/ =-(Г^-Г'/Л). (12.11) ^ 2 Обратимся теперь к нашим вариационным уравнениям (12.3) и (12.4). Мы уже указывали, что первое из них сразу дает уравнение (12.9), которые мы в этой связи зарегистрируем в качестве первой системы наших полевых уравнений. Из (12.4), с помощью стандартного подхода *), вы вместо (12.8) получите совершенно неожиданный результат. Простейшая его формулировка может быть дана в терминах другой аффинной связности, которую мы снабдим *) См. приложение. 121
звездочкой. Она выражается через исходную следующим образом: •r'^r'^ + jS'itr,, (12.12) 2 Для аффинной связности "со звездочкой" имеем *Г\а = Т\к> (12.13) что может быть немедленно проверено. Тогда результат имеет вид • *'.« + да1*Гко*+ дкО*Г1«о-1-дк1СГОо« + *Г°ао) = 0. (12.14) Нашими обобщенными полевыми уравнениями теперь являются (12.9) и (12.14) с (12.12). Наиболее эффектно уравнение (12.14). Как и следовало ожидать, оно переходит в уравнение (12.8) в симметричном случае, когда аффинная связность * Г совпадает с исходной. Но по двум причинам оно вовсе не является таким обобщением уравнения (12.8), которое кем угодно могло быть предсказано заранее. Во-первых, и это самое важное, левая часть уравнения (12.14) не является инвариантной производной от Й^'по отношению к аффинной связности * Г, ибо, как вы видите, в третьем члене индексы идут в обратном порядке. Это, конечно, тензорная плотность, и вы можете назвать ее инвариантной производной определенного, но не обычного, типа (см. наш комментарий к уравнению (3.7а) в гл. 3). Только благодаря этому обратному порядку индексов уравнения (12.14) однозначно, как и в симметричном случае, определяют по крайней мере связность * Г *). В противном случае это было бы не так, и в этом главная причина провала наивного обобщения уравнения (12.8). Вторым неожиданным свойством является, конечно, то, что аффинная связность * Г вообще оказалась здесь замешанной. Она берет на себя роль аффинной связности в этой теории, и было бы уместно убрать звездочку, если бы это не приводило к путанице. Вектор Г/ остается произвольным, он не определяется из вариационного принципа; но число независимых компонент аффинной связности * Г предписанием (12.13) уменьшается с 64 до 60. Свертывая уравнение (12.14) сначала по паре (/, а), затем по паре (к, а) и вычитая друг из друга полученные уравнения, *) См. приложение. 122
получаем з-% + ^*-°(*га«°-*г%а) = 0- (12Л5) Следовательно, с учетом (12.13) имеем д^.а=0. (12.16) И наоборот,уравнение (12.13) следует из (12.14) и (12.16), кроме сингулярных случаев. Предписание (12.13) лучше, вероятно, заменить условием (12.16), которое интересно само по себе, поскольку имеет общую форму системы уравнений Максвелла. Почти таким же способом, как и в симметричном случае, уравнения (12.14) можно привести к эквивалентной, но более простой форме *) ^/.а-^/*Г°Ла-^а*Гаа/ = 0. (12.17) И снова в последнем множителе имеет место специфический порядок индексов. Окончательно, подставив аффинную связность *Г в уравнение (12.9), вы легко получите *) ***/ +у(Г/.*-Г*./) = 0, (12.18) где первый член имеет смысл тензора Эйнштейна для аффинной связности * Г. Уравнения (12.16) — (12.18) могут рассматриваться как полевые уравнения этой теории, их число равно числу неизвестных функций, а именно 64 + 4 + 16 = 84. Отметим следующее. Приведенные выше 64 уравнения (12.17) являются линейными (недифференциальными) уравнениями для 64 компонент аффинной связности * Г. Они имеют однозначное решение, соответствующее скобкам Кристоффеля для симметричного случая. Если бы это решение можно было выписать явно и подставить в (12.18), то это означало бы огромное уменьшение в числе полевых уравнений. Однако попытка следовать по этому пути возбуждает подозрение, что явное решение слишком сложно, чтобы можно было достигнуть таким способом обозримых результатов. Теперь второе, менее важное замечание. Уравнения (12.18) могут быть разбиты на их симметричную и антисимметричную части */?*,= О, (12.18а) *Rkl + —(r/ifc-rM) = 0. (12.186) *) См. приложение. 123
Второе из этих уравнений дает соотношение •Ям./+ **«.* +**,*./ = О (12.19) N^ >~* >W и может быть заменено им, поскольку согласно (12.19) наш антисимметричный тензор должен быть ротором некоторого ковариант- ного вектора, а связность Г/ больше нигде не появляется в наших полевых уравнениях. Однако это выглядит как шаг назад. Ибо всегда, когда вы сталкиваетесь с уравнением вида (12.19), вы немедленно заключаете, что данный тензор является ротором, и выписываете нечто вроде уравнения (12.186), которое проще. Эта процедура хорошо известна для одной из пар уравнений Максвелла, которая относится в точности к такому же типу. Третье замечание относится к интересному следствию из одной только системы уравнений (12.17). Если умножить ее на gk\ то первый член, согласно (12.10), является логарифмической производной от g. Весь результат может быть тогда записан в виде Э \tw/-g * „ — -Т^. (12.20) дха — Это соотношение хорошо известно из симметричного случая. Мы заключаем, что Э*0 Эх, а Если принять во внимание уравнение (12.13) или его эквивалент (12.16), то можно обойтись без подчеркивания нижних индексов. Стоит отметить, что уравнение (12.21), вследствие (12.17), выполняется в любой системе координат, хотя четыре величины *Гааа не образуют вектора. Дальнейшее обсуждение лучше отложить до тех пор, пока в следующем пункте не будет изложен чисто аффинный вариант теории. Чисто аффинная теория Не можем ли мы, следуя Палатини, избежать введения двух основных связностей в пространственно-временном многообразии: квазиметрической — с помощью g^ — и аффинной связности Гг kl ? Нельзя ли продвинуться на шаг дальше Палатини и основывать теорию на одной только аффинной связности, являющейся, в конце концов, первой и единственно необходимой для закладки основ математического анализа (см. главу 3) ? 124
Но как мы получим подынтегральное выражение для нашего вариационного принципа? Мы можем, конечно, образовать из нашей аффинной связности тензор Эйнштейна. Но мы не можем свернуть его по паре его ковариантных индексов, чтобы получть скалярную плотность; у нас нет и никаких средств для поднятия одного из них. Еще в 1921 году АХ.Эддингтон указал, что простейший инвариантной плотностью, которую можно построить из одного только тензора Эйнштейна, является квадратный корень из детерминанта его компонент (см. наше общее замечание в главе 2, стр. 27). В последующие годы и он сам, и Эйнштейн пытались построить на этой основе чисто аффинную теорию, но безуспешно, по той причине, как мне кажется, что аффинная связность с самого начала считалась симметричной (см. книгу Эддингтона "Теория относительности"*), в последних изданиях которой дается исчерпывающий обзор также и работ Эйнштейна). Опуская требование симметрии, мы получаем теорию, очень похожую, как мы сейчас увидим, на ту, набросок которой был дан в предыдущем пункте. Таким образом, возьмем в качестве нашей функции Лагранжа**) £=|>/(-Det/?,*) (12.22) и потребуем, чтобы б f$d4x = /— 6Rikd4x = 0. (12.23) dRik Из общего исследования — или непосредственно из тех фактов, что последний интеграл является инвариантом и что вариация dR,k является произвольным тензорным полем, - следует, что набор частных производных образует контравариантную плотность второго ранга. Очень удобно по крайней мере обозначить эту тензорную плотность через -^ = glk (12.24) dRik и определить, вдобавок, "латинские" контра- и ковариантные^-тензоры точно тем же способом, что и ранее. Ибо уравнение (12.23) *) Эддингтон А.С. Теория относительности. Пер. с англ. / Под ред. Д.Д.Иваненко. - Л.-М.: ГТТИ, 1934. (Примеч. ред.) **) Константа \ и знак минус взяты для удобства и не влияют на конечный результат. 125
совпадает тогда по форме с (12.4), а все следствия, выведенные в предыдущем пункте из этой "второй половины" вариационного принципа, остаются прежними, и нам не нужно выводить их заново. "Первая половина" и ее следствие (12.9) теперь отсутствуют. Вместо этого система уравнений постулирует связь между аффинной связностью и "метрикой" в дополнение к связи, накладываемой уравнением (12.14) или эквивалентным ему уравнением (12.17). Формально полная система полевых урдвнений нынешней теории может быть выписана сразу и двумя способами: мы можем или подставить, согласно (12.24), частные производные для 8ik в уравнения (12.14) и (12.16), удаляя тем самым все g поставляя компоненты аффинной связности в качестве единственных неизвестных функций; или мы можем подставить в уравнение (12.24) аффинную связность *Г, полученную из уравнений (12.17) и дополненную соотношениями (12.12), с тем чтобы "убрать звездочку"; в этом случае следует присоединить уравнение (12.16) в том виде, как оно есть, и мы останемся С "метрикой", т.е. с компонентами g в качестве единственных неизвестных функций (в действительности число их равно 16). Однако второй план практически исключается упомянутой выше сложностью решения уравнения (12.17). Заметим, что в этих рассуждениях мы пока нигде не воспользовались конкретной формой, предложенной для плотности ф в уравнениях (12.22). Они были бы справедливы для любой функции Лагранжа, зависящей только от Я,^. Если это не так, то рассуждения видоизменяются. Можно было бы, например, допустить, что ф зависит также от второй свертки тензора В, упомянутой в главе 6 на стр. 60 и обозначенной там Sjk. В этом случае мы имели бы дф Эф = /— bRikdAx - f 8SikdAx. dRjjc dSik Эти два интеграла не обязаны были бы обращаться в нуль порознь, поскольку второй интеграл зависит, в конечном итоге, от той же самой вариации 5Г'А:/ , что и первый. Это, как я сказал, привело бы к видоизменению и, на самом деле, к сильному усложнению полевых уравнений, независимо даже от того факта, что у нас больше нет никаких очевидных указаний насчет того, что именно взять в качестве ф. Будем придерживаться выбора, сделанного в самом начале. Я утверждаю, что соотношение (12.24) эквивалентно уравнению Rik = А*/*. (12.25) 126
В самом деле, тогда £= 2\yf=J (12.26) Эф 1 Эф **'* ,к = 7Т- = ~"F= = • (12-27) Так что даже уравнение (12.9) подвергается небольшому видоизменению, оно заменяется системой уравнений (12.25). Это очень известная система; в симметричном случае она переходит в то, что называется "уравнением Эйнштейна с космологической постоянной". Мы не упоминали о нем ранее в этих лекциях. На любом "человеческом" масштабе параметр X должен быть очень малой постоянной, и добавочный "космологический член" практически несуществен во всех случаях, кроме исследований структуры Вселенной. Чисто аффинная теория является единственной, в которой этот член возникает естественным, непреднамеренным образом. Она определенно требует, чтобы X Ф 0. Мы можем теперь, если захотим, выполнить наш план полного устранения величин g. Взяв для£/& выражение из (12.25) и подставив его в (12.27), мы получим следующую замкнутую систему полевых уравнений этой теории: *«.в-Лв,*Г%в-Л*вТвв| = 0- (12.28) Если рассматривать компоненты "со звездочкой" как сокращения, объясненные в (12.12), то наша система содержит только исходные полевые переменные Г* к1 и больше ничего. Она, как и можно было ожидать, второго порядка, и "несущественная" постоянная X исчезла, как и требовалось. Тем не менее в симметричном случае она содержит уравнения Эйнштейна с космологическим членом! Могло бы показаться в данный момент, что мы забыли включить в нашу систему уравнения (12.16). Но они - с величинами 6 , замененными на их выражения в терминах Я,-* , — являются следствиями уравнений (12.28), если наши *Г представляют собой просто сокращенное обозначение для комбинаций (12.12). Несколько иная точка зрения состоит в том, чтобы рассматривать величины *Г, подчиняющиеся условию (12.13), и вектор Г/ как неизвестные функции. Тензор Rki при этом необходимо рассматривать (ср. с переходом от (12.5) к (12.18)) как сокращенное обозначение для комбинации Rkl = *Rkl +-1(Г/,* - Г*.,). (12.29) 127
Снова и в том же самом смысле, что и ранее, уравнение (12.16) является следствием. Его включение не является необходимым, кроме случаев, когда по той или иной причине имеется желание не накладывать условие (12.13) как априорное условие на все *Г. Система уравнений (12.28) не имеет аналогов в теории Эйнштейна—Штрауса. Обсуждение теорий, изложенных до сих пор Для обеих теорий — или версий — "тождества сохранения" (и несколько других, тесно связанных с ними) могут быть выведены во многом тем же самым методом, который использовался в главе 9 для теории Эйнштейна. Я не буду здесь этим заниматься, а отсылаю читателя к моей статье в Ргос. R. Irish Acad. 1948, v.52, A,p.l. Насколько мне известно, пока не получено ни одного конкретного решения, которое могло бы быть применено к чему-либо, что могло бы нас заинтересовать, исключая, конечно, хорошо известные решения для симметричного случая. Известно, что и число последних весьма ограничено. Не очень удивительно поэтому,-что гораздо более сложный несимметричный случай должен оставаться в высшей степени дискуссионным. Таким образом, все еще не решено, какая интерпретация различных тензоров и плотностей скорее всего позволит теории объяснить наблюдаемые факты. Это относится не только к антисимметричным тензорам, подобным, ik например, Й ^ и т.п., которые, как надеются, имеют какое-то отношение к электромагнитному полю, а возможно, и к ядерному по- лю. Мы даже не знаем, какая из величин g^ или g— (или, что менее вероятно, tik или д1к) играет в несимметричном случае роль соответствующих тензорных объектов, описывающих гравитационное поле в теории Эйнштейна. Приведенные четыре возможности четко различаются между собой, но совпадают, конечно, в пределе, когда все эти тензоры симметричны. Нужно быть готовыми, как мне кажется, даже к тому, что в общем случае не существует резкого разграничения между различными полями; что они частично сливаются друг с другом неким способом, который трудно предвидеть. Я не думаю, что трудности с нахождением точных решений должны удерживать нас от дальнейших размышлений касательно этих теорий. По моему мнению, они являются единственными естественными обобщениями своей исключительно успешной предшественницы. Предположим, например, что нам повезло и мы действительно нашли восхитительное точное решение с цилиндриче- 128
ской симметрией, соответствующее, для некоторой допустимой интерпретации, локализованному электрическому заряду, окруженному также дипольным магнитным полем. Что могли бы мы с ним сделать? Могли бы рассматривать его как модель вращающегося электрона или протона? Не могли бы. Ибо мы знаем, что классическое взаимодействие таких изысканных игрушечек в целом не может описывать действительное электромагнитное взаимодействие окончательных составных частей материи, и в еще меньшей степени их взаимодействие в ядре. Прогресс в описании более сложных свойств этого взаимодействия (излучение и поглощение, рождение и уничтожение частиц), в той мере, в какой он вообще достигнут, основывается не на очень сложных классических решениях только что упомянутого выше типа, а на гораздо более простых, а именно плоских синусоидальных волнах, которые достаточно просты для того, чтобы их можно было подвергнуть некоторому квантово-ме- ханическому рассмотрению. Я допускаю, что никто не сочтет такой подход идеальным, но он укажет нам, как мы надеемся, путь к лучшим подходам. Этот путь, вероятнее всего, не проходит через очень сложные "частицеподобные" решения. Мы можем, следовательно, даже утешать себя тем, что такие решения, по-видимому, практически недосягаемы в нашем случае. Математическое приложение к главе 12 Стр. 121. Начнем с распространения на случай несимметричной аффинной связности правила для "интегрирования по частям относительно точки с запятой", вью еденного в главе 4 для симметричной связности. Из общего выражения для инвариантной производной контравариантной векторной плотности, а именно из зд* . = ад* . + Г* .ЗГ-Г* .91* ;/ , / oi at мы получаем, свертывая по паре индексов, (сокращенное обозначение Гк объяснено во втором из соотношений (12.12)). Это и есть требуемое обобщение уравнения (4.3) в главе 4. Если в следующих за (4.3) рассуждениях учесть дополнительный член, можно получить общую формулу интегрирования по частям, а именно f(A"\„)(B~\„);ad4x = = f[~(A '...).,« + 2ГаА~...]В~\..с14х, в которой мы, однако, не выписали вклад границы, поскольку в 9. Э. Шредингер 129
нашем случае, как и в большинстве приложений, он обращается в нуль. После этих предварительных действий мы переходим к формуле (12.4), в которую мы подставим из (6.19) выражение С помощью стандартной процедуры интегрирования по частям, используя только что выведенное правило, мы избавляемся в вариациях от точек с запятой. Выкладки довольно просты, но некоторое размышление потребуется, чтобы записать результат в простейшей форме. Вам не составит никакого труда убедиться в том, что / в'* 8Rikdr = /(в'\ - 8ка<8'%)Га,кс14х. где * ®k'^8k\a-2gk,ra + ^'at^r0 + 2^r'w. (Подобная форма записи подсказывается уравнением (12.7), к которому все должно сводиться, и сводится, в симметричном случае.) Теперь нужно только представить инвариантную производную в явном виде, чтобы понять, что обращение последнего выражения в нуль в точности соответствует уравнениям (12.14) с учетом (12.12) и (12.13). Стр. 122. Лучше всего обратиться к уравнению (12.17) и разбить его на два в соответствии со свойствами симметрии: Skl,a~Sal Г кос ~ Ska Г oil ~Sol Г кос ~ Ska Г ocl = °> ^— — — ^^ —— — >^ >^ Ski,a "Sal Г кос -Ska Г а/~^а/ Г кос ~ Ska Г а/= °- Мы должны предположить, что детерминант компонент тензораgki не обращается в нуль, и воспользоваться им для перемещения индексов. Возьмем сначала симметричный случай gkl = gkl a = 0. Из >^ «^^* второго уравнения следует, что *Г1ка = *Гк1а и *П^ = 0. Тогда >«•• >«• * 5 ( S } первое уравнение дает Г к1 = } в результате процедуры, ука- — [klf занной на стр. 75. В общем (несимметричном) случае та же самая процедура, примененная к первому уравнению, дает *Г5к1 в виде линейной функции от *Г5к1 , а если применить ее ко второму уравнению, то получится выражение для *Tski в виде линейной функ- ции от Г к1. Подставляя по очереди одно из этих выражений 130
в другое, получим для *rskl — ] | и *Г5Л/ два разложения — (kl} — в ряд по нарастающим степеням тензора gkl и его производных; >^ для не слишком больших значений этих величин данные разложения обязаны сходиться. Поскольку они представляют собой рациональные функции, только в исключительных случаях может не оказаться решения. Стр. 122. Соотношения (12.14) и (12.17) эквивалентны безотносительно к каким бы то ни было предположениям, подобным (12.13), об аффинной связности. Мы должны вывести теперь вторую систему уравнений из первой. Как и в известном симметричном случае, из формулы (12.10) (выражающей условие, что компоненты glk являются нормированными минорами детерминанта g компонент gik) следует, что Э* kl bgkl bgkl Г"~ = gg л— = -***'!—• ОХ а ОЛ"а OJCa Таким образом, Э1пу^"_ _ dg^_ а также Л/ в", а = Л/ \—£Г^ gk' + ^ZZk', a) = Э\Л^ — ainv^J — ainV^F = 4—— -2>f=g— =2чЛ^— . оха оха одса После этих предварительных действий мы переходим к соотношению (12.14) и сначала умножаем его на gkl. Предыдущее уравнение дает нам в точности первый член, и мы легко получаем, что Э In уУ — я 2 —-— (*Га +*ГС ) = 0 ^ - V * аа 1 а а > yj- ОХа Затем мы возвращаемся к соотношению (12.14) и умножаем его на gksgr i. Сначала мы получаем, используя все время (12.10), что 9* 131
Первый член этого уравнения - согласно предыдущему - сводится к Ъ\-8 к1 = 1 г а +*га ч oks°rl qx & 2&rs\ ж аа ж асг / и, таким образом, сокращает последнюю пару членов. Для второго члена имеем SksgriyT-Sg*1,* = ~y/-ggrSfoc- Итак, мы остаемся, на самом деле, с уравнением (12.17), которое и собирались получить. Стр. 126. Нам нужно доказать соотношение между тензорами Эйнштейна для двух аффинных связностей со звездочкой и без — связанных друг с другом формулой (12.12). Вряд ли необходимо приводить здесь это доказательство. Следует взять выражение (6.17) для тензора Эйнштейна и подставить вытекающее из (12.12) выражение для связности Г без звездочки через связность со звездочкой. Оказывается, что квадратичные части тензоров Эйнштейна одинаковы для обеих аффинных связностей, поскольку все дополнительные члены сокращаются. Результатом будет (12.29). Стр. 121. (Примечание при корректуре.) На этой странице мы упомянули, что вектор Г, остается произвольным, не определяемым вариационным принципом. Это справедливо как по отношению к теории Эйнштейна—Штрауса, так и по отношению к чисто аффинной теории. Сообщения в газетах за декабрь 1949 года, по-видимому, указывают на то, что профессор Эйнштейн в последнее время *) придает большое значение условию Г, = 0. Согласно (12.12) это означало бы, в нашей терминологии, что аффинные связности со звездочкой и без нее совпадают. Нам следовало бы, вероятно, упомянуть, что Эйнштейн и Штраус считают все антисимметричные тензоры, такие как g ik ,Tlkl и т.д., чисто мнимыми, так что матрицы gik и т.п. становятся эрмитово- симметричными. Если бы мы с самого начала приняли эту точку зрения, это заметно усложнило бы наши исследования, но не изменило бы конечные результаты. * ) Einstein A. The Bianchi Identities in the Generalyzed Theory of Gravitation. - Canad. J. Math., 1950, v. 2, pp. 120 - 128. (Перевод: Эйнштейн А, Тождества Бьянки в обобщенной теории гравитации. Собрание научных трудов. - М.: Наука, 1966, т. II, с. 732 - 743.)
Э.ШРЕДИНГЕР РАСПШРЯЮПЩЕСЯ ВСЕЛЕННЫЕ
ПРЕДИСЛОВИЕ Этот краткий курс лекций, прочитанный в летнем семестре 1954 г. (на семинаре повышенного уровня), не исчерпывает и не может исчерпать всего предмета. Общее исследование тензора материи, обеспечивающего ту или иную форму расширяющейся вселенной, полностью оставлено в стороне; считается, что интервал задан, и главной целью рассмотрения являются поведение пробных частиц и световых сигналов, а также результаты, полученные при наблюдении за ними, и вытекающие отсюда заключения. Наиболее подробно рассматривается вселенная де Ситтера. Благодаря тому, что ее тензор материи обращается в нуль, эта вселенная допускает несколько в равной мере простых представлений, которые настолько различны, что можно только удивляться, что они представляют один и тот же геометрический объект. Рассматривая в качестве основной формы этого объекта хорошо известный однополостный гипер-гиперболоид, я попытался сделать наглядной связь между сжимающейся и расширяющейся (гипер) сферическими системами отсчета, статической системой отсчета и расширяющейся плоской системой отсчета. Каждая из них характеризуется пучком (гипер) поверхностей, сечения которых гипер-гипербо- лоидом дают семейство "одновременных" пространств, т.е. пространств при постоянном времени. Особенно интересен тот факт, что вторая и третья системы отсчета не используют весь основной объект, т.е. весь гипер-гиперболоид, для описания всего мира; в статической системе отсчета мир сводится к сравнительно малой части основного объекта, а в плоской системе отсчета — к его половине. Это влечет за собой возможность, уже отмеченную А.С.Эддингтоном, что "внемировые" пробные частицы и световые сигналы могут попасть в поле зрения наблюдателя, находящегося внутри соответствующих частей, и привести к трудностям интеллектуального порядка, если он попытается интерпретировать их в одной из этих двух систем отсчета. В статической системе отсчета он должен осознать даже такую возможность, что он сам может быть "катапультирован" в области, находящиеся вне его мира. И это не будет предотвращено даже принятием так называемой 134
эллиптической интерпретации основного объекта (т.е. отождествлением его точек — антиподов); некоторое внимание этой возможности уделено в первой главе. Во второй главе я рассматриваю поведение пробных частиц и световых сигналов в более общих расширяющихся вселенных, в предположении, что они описываются времениподобными и нулевыми геодезическими соответственно; главной чертой является постепенная потеря импульса (или кинетической энергии) пробными частицами и аналогичное покраснение световых сигналов. Указывается на связь этих явлений с "работой, производимой над воображаемым удаляющимся поршнем", и подчеркивается важное замечание Р.С.Толмена, а именно — что независимое доказательство того факта, что наша реальная Вселенная определенно не является статической, дается изменениями в массе покоя, не только наблюденными лабораторно, но, как хорошо установлено, постоянно происходящими в больших масштабах внутри звезд. В главах III и IV я постараюсь показать, что предположение о том, что траектории являются геодезическими, хорошо подкрепляется волновыми теориями света и материи. Волновая теория света дает также доказательство того, что для (почти) однородного светового пакета полная энергия, содержащаяся в нем, уменьшается пропорционально частоте, тогда как его линейные размеры, если пренебречь расплыванием, обусловленным дифракцией, увеличиваются вместе с радиусом вселенной и пропорционально ему, так же как и длина волны. В принципе те же самые утверждения справедливы и для волн материи, — хотя приложения этого не столь непосредственны; более того, они становятся несколько менее определенными за счет продольного расплывания, вызванного дисперсией. Хочу тепло поблагодарить Альфреда Шульхофа за ту скрупулезность, которую он проявил при построении точных параллельных перспективных видов упрощенного основного объекта, представляющего вселенную де Ситтера, и за то, что он вычертил семейства плоских сечений, характерных для различных способов (или систем отсчета), с помощью которых можно наглядно представить себе это интересное решение космологических полевых уравнений. Я надеюсь, что его аккуратные рисунки облегчат понимание взаимосвязи этих систем. Дублин, 1955 Э. Шредингер
ГЛАВА I ВСЕЛЕННАЯ ДЕ СИТТЕРА § 1. Синтетическое построение Простейший способ получить модель вселенной де Ситтера состоит в том, чтобы построить ее синтетически следующим образом. Пусть х, ur vf у, z.— декартовы координаты в евклидовом пространстве R5. Рассмотрим гиперсферу х2 + и2 +у2+/ + z2=/?2. (1) Все ее точки равноправны (эквивалентны), а в каждой точке эквивалентны все направления. Следовательно, ее внутренний метрический тензор gik, в сущности, один и тот же повсюду, и в любой точке он обладает полной сферической симметрией. То же самое справедливо для его свернутого тензора кривизны Rik. Поэтому эти два тензора должны быть пропорциональны: *,* = Agtk , (2) где Л - константа, зависящая только от радиуса R. (В действительности Л = —3/R2.) Группа линейных преобразований координат, которые не изменяют (1), представляет собой десятипараметриче- скую группу вращений (включая отражения) вокруг начала координат в R5. Если вместо (1) мы рассмотрим однополостной гипергиперболоид x2+w2 + u2+j>2-z2=/?2, (3) то на нем равенство (2) снова будет справедливо при условии, что мы теперь понимаем под gik на нем внутреннюю метрику, порожденную той псевдоевклидовой геометрей в Rs, которая определяет квадрат "расстояния" между двумя любыми точками (хь щ и т.д. и х2, и2 и т.д.) как (*i -x2)2 +(hi -u2)2 +(«! -v2)2+(yi -y2)2-(zi -z2)2, (4) и имеем в виду, конечно, что Rik формируются из этих gik. (Это 136
ясно из чисто алгебраических соображений, поскольку настоящий случай следует формально из предыдущего заменой z на /z.) Однако для согласования с традиционными обозначениями мы предпочитаем изменить знак в определении (4) (но мы ничего не изменяем в (3) !). Это изменяет знак десяти членов gik в (2), но не меняет знака Rihi которые являются однородными функциями от gik степени нуль. Следовательно, единственное, что изменяется, это соотношение между Л и Л2. (Теперь Л = +3/Л2.) Линейными автоморфизмами для (3) являются автоморфизмы, индуцированные псевдовращениями (включая отражения) нашего R5 вокруг начала координат; они содержат как расширенную, так и более узкую "группу Лоренца в пяти измерениях". Мы главным образом будем использовать более узкую группу, т.е. ту, в которой dz/dz ' положительно. Как и в предыдущем случае, она, разумеется, десяти параметрическая. На нашей четырехмерной гиперповерхности (3), которая является нашей моделью вселенной де Ситтера, она играет ту же роль, которую в пространстве Минковского играет (обычно так называемая) шестипараметрическая группа Лоренца, дополненная четырехпараметрической группой трансляций. Действительно, наша нынешняя десятипараметрическая группа позволяет перевести любую точку на (3) в любую другую, указывая на то, что они все эквивалентны, подобно точкам на (1). Пространство-время де Ситтера совершенно однородно. (Упомянутое перемещение никоим образом не обязано сохранять знак z, даже если мы потребуем, чтобы dz/dzf > 0; причина состоит в том, что все точки на (3) расположены в пространственноподобном направлении по отношению к началу координат в Rs.) Остается еще один вопрос: будет ли метрика, индуцированная на (3), иметь требуемую сигнатуру? В Rs сигнатура состоит из четырех отрицательных и одного положительного знака. Является ли она сигнатурой пространства Минковского (три минуса, один плюс) в пространстве R4, представленном с помощью (3)? Это не есть что-то само собой разумеющееся. Но согласно (3) для dx, dv и т.д. - элементов линии на (3) — мы имеем соотношение + х dx + и du + v dv +y dy - z dz - 0. Таким образом, все эти элементы линии ортогональны радиусу- вектору, который пространственноподобен. Поэтому можно в любой точке (3) выбрать локальную пятимерную ортогональную систему координат, одна из осей которой будет лежать в направлении радиуса-вектора. На нее придется один из отрицательных знаков, и он выпадает из выражений для интервалов в R4. Остающиеся четыре соответствуют метрике Минковского. 137
Давайте все же убедимся — это будет полезно для нас позднее, — что тесная связь между (1) и (3) позволяет легко определить геодезические на поверхности (3). Они должны соответствовать геодезическим на (1), т.е. большим окружностям на гиперсфере. Последние вырезаются любыми плоскостями, проходящими через начало координат в евклидовом пространстве Rs. Им соответствуют, — поскольку алгебраическая замена z -► iz линейна и однородна, — плоскости, проходящие через начало координат в псевдоевклидовом пространстве Rs. Поэтому все геодезические на (3) — геодезические на этой поверхности, а не в Rs, — вырезаются плоскостями, проходящими через начало координат в Rs, и наоборот. Они являются, таким образом, плоскими кривыми, а именно коническими сечениями. Пространственноподобные являются эллипсами, а времениподобные - ветвями гиперболы. Все это станет яснее в рамках упрощенной модели. § 2. Упрощенная модель. Геодезические Чтобы получить наглядную модель, мы отбросим теперь координаты и и v, или лучше сосредоточим наше внимание на сечении и - 0, v = 0 (5) полной модели. Объемлющее пространство R5 превращается, таким образом, в пространство R3 с метрикой Минковского ds2 = -dx2 -dy2 + dz2, которое можно обычным путем наглядно представить себе в воспринимаемом нами пространстве. Вселенная (3) сводится к обычному однополостному равноосному гиперболоиду х2 +у2 -z2 = R2, (Н) в котором для пространства остается лишь одно измерение. К сожалению, это не позволит нам прямо ответить на некоторые вопросы, например, какова общая пространственная форма геодезической орбиты. (В одномерном пространстве мы можем найти только прямые линии — они, конечно, геодезические, но, вероятно, не самого общего типа.) Но для многих других вопросов упрощенная — и вследствие этого наглядная - модель полезна. Давайте, кстати, убедимся, что редукция на два измерения, — т.е. Rs ->/?з для объемлющего многообразия и R3 -+RX для пространства, - в некоторых отношениях является менее вводящей в заблуждение, чем одношаговая редукция (которая, к тому же, не обеспечила бы наглядности). Первая сохраняет четность. 138
Рис. 1. Основной геометрический объект, представляющий вселенную де Сит- гера, упрощенную от пяти измерений к трем. Показаны направления осей v, у. и z, прочерченные от начала координат О объемлющего евклидова (или скорее псевдо евклидов a) Rs. Три эллипса являются примерами "одновременных пространств", если z взять в качестве времени. Маленький эллипс называется "бутылочным горлышком", а два больших приняты в качестве искусственных границ, с тем чтобы представить на нашем рисунке бесконечный в действительности гиперболоид с помощью лишь его средней части. Гипербола, соответствующая профилю фигуры, почти совпадает с меридиональной гиперболой. Сечение гиперболоида любой плоскостью, проходящей через О, является геодезической, времениподобной, когда оно - ветвь гиперболы, пространственноподобной, когда оно - эллипс, нулевой геодезической в вырожденном предельном случае, когда оно состоит из прямых линий В Яз так же, как и в R5, любое преобразование Лоренца с необходимостью имеет инвариантные оси, а в R4 не имеет. Более того, распространение волн в одномерном пространстве относится к тому же общему типу, что ив /?3- В пространствах с четным числом измерений это не так (IVachhalll) *). Позвольте мне подчеркнуть еще раз, что метрика на (4) в точности та же, которая получится, если принять метрику Минковского в объемлющем пространстве /?3 с z, играющем роль "времени": ds2 = -dx2 -dy2 +dz2, (6) и что лоренцевские вращения относительно начала координате R3 переводят (Н) в себя и оставляют нетронутой вышеупомянутую метрику на (Н) . (В (6) мы могли бы исключить один из 3-х диф- *) Nachhall (нем.) - отзвук, т.е. имеется последействие. {Примеч.ред.) 139
ференциалов и соответствующую координату, используя уравнение (Н), однако сейчас нет смысла проделывать это.) Мы будем теперь интерпретировать z как мировое время. Это, конечно, необязательно, позже мы рассмотрим и другие возможности. Не нужно забывать, кстати, что с точки зрения общей теории относительности приемлемым является любое изменение координат на (Н), а не только вышеупомянутые автоморфизмы (Н). Но они действительно образуют весьма выделенное множество. При z, взятом в качестве времени, параллельные окружности на (Н) представляют собой пространство в различные моменты времени. Таким образом, окружность пространства (измеренная согласно (6), с dz - 0) будет сжиматься до определенной эпохи z = 0, а затем будет расширяться. Эта эпоха и события на "бутылочном горлышке" *) окажутся выделенными. Но этого не может быть, поскольку мы знаем, что все точки на (Н) эквивалентны. Являются ли тогда эквивалентными и все параллели? Ни в коем случае. Мы только что установили, что они имеют различные инвариантные длины окружности **). Более того, параллель горловины является (пространственной) геодезической, а другие — нет. (Действительно, первая вырезается плоскостью, проходящей через начало координат в нашей упрощенной модели, а значит, и плоскостью, проходящей через начало координат и в полной модели, поскольку уравнения (5) линейны и однородны.) Но лоренц- преобразование пространства /?3, затрагивающее также и координату z, переводит параллель горловины в эллипс, вырезаемый на (Н) некоторой плоскостью, проходящей через начало координат и составляющей с плоскостью (х,у) угол, меньший 45°. Следовательно, все эти эллипсы эквивалентны. В своей совокупности они представляют собой совокупность всех пространственных геодезических, возникающих в нашей упрощенной модели. Любая из них является горловиной в некоторой конкретной системе отсчета. И любую точку из (Н) можно перенести на горловину с помощью подходящего преобразования Лоренца в R3. Вскоре мы уделим особое внимание антиподальным парам точек на (Н). Антиподом точки P(x,yrz) мы называем точку Р( -х, —у, —л ). Отметим очевидный факт, что если преобразование Лоренца переводит Р в Q, оно же переводит Р в Q. Соотношение антиподности лоренц-инвариантно. *) В отечественной литературе более употребителен термин "горловина", который и используется в дальнейшем. (Примеч. ред.) **) Иногда говорят "собственные дпиньГ. (Примеч. ред.) 140
Рассмотрим одну из вышеупомянутых плоскостей, проходящих через начало координат и составляющих угол, меньший 45°, с плоскостью (х, у). Она даст в сечении пространственноподобную геодезическую — эллипс. Эллипс становится все более вытянутым по мере того как угол приближается к 45°. Когда угол достигает 45°, эллипс вырождается в пару параллельных образующих, каждая из которых представляет собой местонахождение антиподов точек, лежащих на другой. Одна из них принадлежит к одному семейству образующих, другая - к другому. Обозначим эти две образующие g\ и g2. Отметим, что g2 является единственной образующей второго семейства, которая не имеет конечной точки пересечения с g\\ отметим также, что две образующие из одного и того же семейства никогда не пересекаются. Из нашего построения мы знаем, что образующие являются геодезическими. Поскольку они составляют угол 45° с плоскостью (х, у), они являются, как следует из (6), нулевыми геодезическими (световыми лучами). Путем дальнейшего увеличения наклона плоскости от 45 до 90° мы получаем времениподобные геодезические (гиперболы), но сейчас они не интересуют нас. Совокупность образующих обоих семейств составляет множество нулевых геодезических в нашей упрощенной модели. Является ли это свойство нулевых геодезических, а именно то, что они — прямые линии, следствием нашего упрощения модели? Нет. Оно справедливо также и в полной модели. Ибо нулевой интервал на гиперповерхности (3) должен, конечно, быть таковым и в Rs. Значит, он составляет угол 45° с осью z. Поэтому нулевая геодезическая на (3) должна составлять постоянный угол 45° с осью z на всем ее протяжении. Мы видим, что все геодезические являются плоскими кривыми, следовательно, в том числе и нулевая геодезическая. Но плоская кривая, составляющая постоянный угол с заданным направлением, с необходимостью является прямой. Итак, мы видим, что это свойство внутренне присуще нулевым геодезическим, а не вызвано упрощением модели. Однако возвратимся теперь к упрощенной модели. Через любую данную точку на (Н) проходит одна образующая из каждого семейства, и вместе они образуют "световой конус" в этой точке. Эти образующие очевидно (т.е. в евклидовом смысле) ортогональны, если точка лежит на горловине. Для точек на больших параллелях (по обе стороны) внутренний угол раствора их "светового конуса", очевидно, уменьшается, стремясь к нулю на бесконечности. Световой конус в любой точке Р, согласно тому, что мы разъяснили прежде, может быть получен как сечение (Н) парой 45°-плоскостей, проходящих через Р и начало координат Оу причем полное сечение состоит, очевидно, из двух световых конусов: 141
одного в Р и другого в его антиподе Р. "Световой конус" в Р сам по себе может также быть получен сечением (Н) касательной плоскостью в Р, или, по-другому, сечением (Н) таким (двумерным) световым конусом в объемлющем пространстве R3y который имеет Р своей вершиной. (В дальнейшем термин "световой конус" будет относиться к паре нулевых геодезических (световых лучей) на (Н), если противоположное не будет специально оговорено.) Отметим, в частности, следующее. Внутренние области световых конусов антиподов Р и Р не имеют общей конечной точки, поскольку ни один из двух лучей, проходящих через Ру не пересекает ни одного из двух, проходящих через Р, либо вследствие их параллельности, либо из-за принадлежности к одному и тому же семейству. В случае неантиподов осуществляется хотя бы одно, а обычно два пересечения световых конусов; ибо антипод Р кР однозначно определен тем, что его световой конус параллелен световому конусу точки Р. Следовательно, для неантиподов всегда имеются части внутренних областей их световых конусов, являющиеся общими для обоих. § 3. Эллиптическая интерпретация Мы хотим обсудить в нашей упрощенной модели так называемую "эллиптическую" интерпретацию псевдосферы (Н): является ли она возможной, чем она подсказывается и каковы ее следствия. Она состоит в том, что антиподы считаются представляющими одну и ту же мировую точку или событие. В данном обсуждении мы будем о нашей упрощенной модели говорить так, как если бы она была полной моделью, оставляя для отдельного рассмотрения вопрос о том, будут ли выводы, сделанные относительно первой, применимы к последней. Более того, вначале мы совсем не будем вводить эллиптическую интерпретацию. Ибо это значило бы напрашиваться на вопросы, и во всяком случае, это могло бы внести путаницу. Мы будем сначала использовать наивную интерпретацию и докажем теоремы, которые имеют место и в более сложной. Если Р имеет большое положительное значение z, то Р имеет большое отрицательное z. Это вызывает опасение, что если Р п Р подразумевают одно и то же событие, то в отдаленном будущем наблюдатель сможет снова стать свидетелем того же самого события, свидетелем которого он уже был в далеком прошлом. Это опасение, однако, является необоснованным, поскольку мы видели, что точки-антиподы соединены пространственно подобными геодезическими, поэтому наблюдатель, вероятно, не сможет перебраться от одной точки к другой. Но было бы в равной степени затруднительно (с точки зрения предполагаемого отождествленияР иР)у 142
если бы наблюдатель мог в какую-то эпоху его жизни получить с помощью сигнала информацию о Р9 а в какую-то более позднюю эпоху повстречать сигнал из Р. Если бы это произошло, он, конечно, должен был бы считать, что события Р и Р различны. Но и это также не может произойти. Ибо с целью получить сигнал из Р он с необходимостью должен войти в после-конус (конус будущего точки Р) *). Но, попав туда, он никогда не сможет снова выйти из него. (Потому что невозможно пересечь после-конус изнутри наружу, не превысив скорости света, — после-конус является самой эффективной тюрьмой в мире.) Мы видели, что световые конусы событий Р и Р не имеют ни одной общей точки. Следовательно, наш наблюдатель никогда не сможет снова попасть ни в после-конус, ни в пред-конус (конус прошлого) точки Р. Это двойное утверждение полезно. Действительно, вторая из возможностей могла бы позволить нашему наблюдателю, после получения сообщения из Р, послать сообщение в Р, что было бы еще более катастрофично для предполагаемого отождествления. Но когда я просто сказал, что двойное утверждение полезно, я имел в виду также и следующее: если позже мы действительно примем это отождествление, мы, возможно, должны будем для точки Р поменять местами понятия пред-конуса и после-конуса. Сейчас мы пока не принимаем его и продолжаем считать после-конусом ту половину, которая раскрыта в сторону положительных z. Вероятно, будет полезно ознакомиться с возможным возражением. Могут подумать, что теоремы предыдущего параграфа можно было бы перехитрить с помощью сменной работы двух или более наблюдателей, передающих послания друг другу. Удалось бы им объединить в памяти одного из них послания из Р и Р1 Нет. Ибо смена наблюдателей представляет собой не что иное, как усложненный сигнал. Никакая подобная договоренность никогда не поможет протащить контрабандой послание, взятое из Р, в область вне после-конуса точки Р\ то же самое справедливо в случае точки Р. Эти две области исключают друг друга, поэтому два таких послания не могут встретиться. И по той же причине никакая договоренность подобного рода не поможет протащить контрабандой послание изР в пред-конус точки Р. Это устраняет prima facie**) возражения против предполагаемого отождествления антиподов. Но здесь есть обстоятельство, кото- *)В русской (и английской) научной литературе обычно используются термины "конус будущего" (cone of the future) и "конус прошлого" (cone of the past). Однако в оригинале автор намеренно использует более краткие термины "after-cone" и "fore-cone", являющиеся аналогами немецких терминов "Nachkegel" и "Vorkegel" (см. также стр. 89). {Примеч. пер.) **) Prima facie (лат.) - с первого взгляда. {Примеч. пер.) 143
рое, на мой взгляд, определенно подсказывает этот шаг. Оно состоит вот в чем. Возможный опыт наблюдателя, движущегося по произвольной времениподобной мировой линии из бесконечного прошлого (z ->—оо) в бесконечное будущее (z ->°°), включает только половину поверхности (Н). Какую именно половину, зависит от того, по какой мировой линии он следует. Но в соответствии с тем, что мы уже знаем, она, конечно, не может содержать в себе более одной из каждой пары точек-антиподов. Другими словами, если наше утверждение правильно, недоступная половина состоит из антиподов доступной половины. Сначала я покажу, что это утверждение правильно. Рассмотрим времениподобную мировую линию наблюдателя на (Н), перемещающегося из бесконечного прошлого в бесконечное будущее. Мы хотим знать диапазон его возможного опыта, под которым мы подразумеваем все те точечные события,' которые могут когда-либо попасть в его поле зрения, иными словами, все те события, которые он своим движением вводит в свой пред- конус. ("Событие", конечно, является фиксированной точкой на (Н) и не движется.) Если конкретное событие Р попадет в пред-конус, то наблюдатель никогда не сможет удалить его оттуда своими будущими передвижениями. (Это то же самое, что и наше предыдущее утверждение, что он никогда не сможет убежать из после-конуса точки Р, стоит ему только войти туда; пред-конус наблюдателя все время только приобретает точки, а после-конус только теряет точки.) Следовательно, весь возможный опыт наблюдателя есть не что иное, как предел его пред-конуса в бесконечном будущем. Мы видели, что на удаленных окраинах нашей модели (евклидов) раствор светового конуса в любой точке все больше сокращается, в пределе стремясь к нулю. Все времениподобные мировые линии, а следовательно, также и линия нашего наблюдателя, какой бы она ни была в предшествующих частях, приближаются асимптотически к высшей (меридиональной) гиперболе, а скорость наблюдателя — к скорости света, что кажется странным, но соответствует возрастающему расширению "пространства" в нашей системе отсчета. Во всяком случае, касательная плоскость (чьим пересечением с (Н) и является световой конус!) приближается к определенной плоскости, проходящей под углом 45° через начало координат О в R3, например, в частном случае, к плоскости z =у. Любая такая плоскость делит (Н) на две равные половины; пред-конус нашего наблюдателя приближается асимптотически к одной из них, представляющей, таким образом, весь его возможный опыт. (В нашем примере это была бы половина, где у > z.) В дальнейшем мы увидим, что она включает в себя почти полное знание о пространстве в отдаленном прошлом, но все меньшее и 144
меньшее о более поздних пространствах; только одна половина параллели, соответствующей горловине, становится известной в этом пределе, и только незначительные части позднейших параллелей ("пространств")- Это не удивительно. Благодаря возрастанию скорости расширения, которая асимптотически приближается к скорости света, та область пространства, из которой световые сигналы вообще могут достичь наблюдателя, сжимается по направлению к нему. Это, казалось бы, находится в противоречии с известной эквивалентностью всех точек на (Н), а следовательно, также и всех моментов на мировой линии наблюдателя. Но мы должны помнить, как было отмечено ранее, что параллельные окружности, z = const, которые играют роль пространства, или пространственных сечений, в нашей системе отсчета ни в коем случае не эквивалентны друг другу*). Позвольте мне заметить, *) Можно выдвинуть такое возражение: поскольку все точки на (Н) эквивалентны, кажется странным, что пред-конус нашего наблюдателя в далеком будущем должен включать "почти точно половину" поверхности (Н), в то время как, к примеру, в далеком прошлом он включает намного меньше - так и хочется сказать - только "незначительную долю". Странно, что пред-конус вообще должен "расти", поскольку каждая точка с помощью преобразования Лоренца может быть переведена в каждую другую, и, таким образом, конечно, ее пред-конус - в пред-конус другой точки! Ответ состоит вот в чем. Несмотря на то, что первые два выражения в кавычках может быть опасно и спорно применять к бесконечному множеству, все-таки, без сомнения, верно, что пред-конус наблюдателя растет, в том смысле, что в любой более поздний момент он содержит области, которые он не содержал в некоторый более ранний момент, так же, как и все то, что он содержал тогда ("раньше" и "позже" могут относиться к собственному времени наблюдателя). Это утверждение инвариантно и не находится в конфликте с эквивалентностью. Сравните его с простым случаем материальной точки, движущейся равномерно по прямой линии: нельзя указать ни одной геометрической точки впереди нее, которая не будет пройдена и оставлена позади движущейся точкой, в момент времени, который может быть указан, даже несмотря на то, что любые две ситуации в процессе ее движения являются эквивалентными. В аккуратной, хотя и несколько условной формулировке, теорема, приведенная в тексте, гласит: если задана мировая линия наблюдателя, то любой паре событий-антиподов /\ Р (за исключением одномерного множества,, которое будет указано ниже) можно сопоставитьконечный момент времени z такой, что для любого z > z либо Р, либо Р будут находиться внутри пред-конуса наблюдателя. К исключительному множеству относятся антиподы, расположенные на определенных парах параллельных образующих gx, #2, зависящих от мировой линии наблюдателя. Соответствие между zp и Р, Р не обладает свойством равномерной сходимости, т.е. zp не имеет точной верхней грани. Во всех этих утверждениях можно, если это кажется более предпочтительным, заменить время z собственным временем наблюдателя (но, конечно, значение sp не будет совпадать с zp) . 10. Э. Шредингер 145
кстати, что наш нынешний всеобщий результат касательно любого возможного опыта наблюдателя представляет независимое доказательство недоступности посланий от антиподов одному и тому же наблюдателю, которую выше мы доказали непосредственно. Несмотря на то, что любой отдельный наблюдатель может исследовать только половину "мира", ограниченную, как описано выше, некоторой плоскостью, проходящей под углом 45° через начало координат, ему все еще остается возможность выбрать любую из двух половин. Даже если он начинает с какой-то данной области в отдаленном прошлом — при условии, что вы позволите ему двигаться с околосветовой скоростью — он все еще может, по своему усмотрению, достичь отдаленного будущего почти по любому азимуту (имеется в виду угол вокруг оси z) в пределах почти 360°. В этом можно легко убедиться, обратив аргументацию, которая только что доказала нам, что наблюдатель в отдаленном будущем может получить послания почти из любого азимута в далеком прошлом, исключая только малую окрестность азимута, антипо- дального его собственному. В самом деле, он и сам является посланием и, поскольку ему разрешено передвигаться с любой скоростью вплоть до скорости света, он и сам мог бы начать движение почти из любого азимута в далеком прошлом. И, наоборот, если он начинает с данного азимута а в далеком прошлом, он может направиться почти к любому азимуту в далеком будущем, исключая только малую окрестность угла а = ±180°. Это и было нашим утверждением. Дело, следовательно, не в том, чтобы отделить какую-то конкретную половину гиперболоида (Н) в качестве нашей модели мира, отбросив другую половину, - нет и нет, нам определенно нужен весь гиперболоид, чтобы модель охватывала возможный опыт любого и каждого наблюдателя. Отбрасывая любую часть, мы должны были бы воздвигнуть необъяснимые барьеры для тех времениподобных мировых линий (и нулевых линий), которые собирались проникнуть в эту часть; действительно, нам было бы трудно объяснить, что случится с объектами — частицами, световыми сигналами или наблюдателями, — чьими мировыми линиями ойи являются. С другой стороны, кажется странным, что двое или более наблюдателей, даже "сидевшие вместе на школьной скамье" в далеком прошлом, должны будут в будущем, когда они "проследуют Позвольте мне добавить одно предостережение, которым часто пренебрегают. Свобода использования любой системы отсчета не предполагает свободы использования более чем одной системы одновременно, оставляя свободу изучения последовательности событий в некоторой непрерывно меняющейся системе отсчета. 146
разными жизненными путями", познать на опыте различные миры, так что в конечном итоге определенные части мира, познанного одним из них, должны будут остаться в принципе недоступными для другого и наоборот. Правда, они могут никогда и не узнать, что это так, разве что путем теоретических рассуждений, таких, какие мы именно сейчас и проводим, но, конечно, не с помощью сравнения путевых заметок. Ибо когда бы они ни встретились с этой целью, они будут иметь один и тот же пред-конус, и, таким образом, в этот момент они достигнут состояния с одним и тем же возможным опытом. Однако мы - или, по крайней мере, некоторые из нас - привыкли считать "окружающий нас реальный мир" мысленной конструкцией, основанной как раз на общности опыта всех нормальных, психически здоровых людей. С этой точки зрения может показаться совершенно неприемлемым согласиться с моделью мира, согласно которой для двух расставшихся наблюдателей возможное совместное обладание их опытом, вероятно, прекратится по отношению к некоторым его частям, интересным для каждого из них и касающимся каждого из них в отдельности. В самом деле, это раньше или позже случится, если только они не достигают отдаленного будущего точно по одному и тому же азимуту. Один из способов избежать этого заключается в том, чтобы принять эллиптическую интерпретацию модели мира (Н), т.е. провозгласить, что антиподы представляют собой одно и то же событие. Ибо тогда любая половина (Н), не содержащая пар-антиподов, равносильна всему миру. Тогда весь возможный опыт любого наблюдателя является полным и охватывает, следовательно, одни и те же события для любых двух наблюдателей, какими бы ни были их мировые линии. Но какую цену мы должны заплатить за это? Я нахожу удобным, хотя другие, может быть, обходятся без этого, думать теперь, что событие представляется не просто парой антиподов, а тонким прямым жестким стержнем, соединяющим их. Все эти "стержни" пересекаются в начале координат О. Рассмотрим последовательность событий, соответствующих материальной точке, или, возможно, даже световому сигналу. "Мировая линия" такого объекта может быть представлена поверхностью, образованной стержнями, соединяющими пару мировых линий — антиподов (времениподобных или нулевых линий; в последнем случае поверхность представляет собой плоскость). Мы чувствуем искушение наделить эти две мировые линии направлениями, указывая временную последовательность с помощью стрелок. Если так, то стрелки должны быть направлены в противоположные стороны: одна — в сторону возрастания z, другая - в сторону уменьшения г. 10* 147
Но мы не должны делать этого. Ибо здесь проблема неоднозначности выбора направления неразрешима. Так же, как мы не могли решиться на то, чтобы оставить только одну "половину" поверхности (Н), отбрасывая другую, точно так же мы не можем решиться на то, чтобы позволить стрелкам указывать "вверх" в одной половине и "вниз" в половине — антиподе. Ибо каким бы путем мы ни произвели такое разделение, возникла бы полнейшая путаница для мировых линий, пересекающих данную. Таким образом, различие между прошлым и будущим утрачено; утрачено также, конечно, и различие между пред-конусом и после-конусом. В частности, мы не должны отдавать никакого предпочтения "однонаправленным" световым сигналам одного рода; мы должны уравнять в правах опережающие потенциалы с запаздывающими потенциалами. Это приводит в замешательство, но, может быть, не является абсолютно роковым для эллиптической модели. Она оказалась столь же полностью обратимой, как и все наши фундаментальные теории. В ней найдется место и для частиц, описываемых обратимыми механическими законами, и для обратимых электромагнитных полей (включая световые сигналы), описываемых обратимой электродинамикой. В модели, которая включает время в качестве координаты, мировая линия частицы не возникает постепенно, она и есть частица. Нет необходимости указывать ее направление, если законы обратимы, так как оба варианта имеют смысл. Нет необходимости знать, происходит ли движение из А в В или из В в А; аналогично и для электромагнитных полей, включая световые сигналы. Трудности возникают, когда движущийся объект является термодинамической системой, скажем, изолированной системой. В этом случае мы привыкли решать, исходя из значений энтропии в А и в В, какое из событий является более ранним. И, конечно, та же самая трудность — и по тем же самым причинам (если не по другим) —возникает в случае наблюдателя,который является (если не чем-то большим), во всяком случае, термодинамической системой, несущей врожденное направление времени. Тем не менее это может и не быть роковым для эллиптической интерпретации. Ибо хорошо известно, что необратимые законы термодинамики могут основываться на статистике микроскопически обратимых систем только при условии, что статистическая теория имеет самостоятельность в определении направления времени. Если же какие-то другие законы природы определяют это направление, статистическая теория терпит крах*). С этой точки зрения обратимая модель мира является очень желательной. Боюсь, что сейчас я должен оставить ее и обратиться к другим аспектам мира де Ситтера. *) См. Schrodinger Е. - Proc. R. Irish Acad., 1950, v. 53, p. 189. 148
§ 4. Статическая система отсчета Системы отсчета, которые мы использовали до сих пор, имеют то большое преимущество, что автоморфизмы модели принимают знакомую форму лоренцевых преобразований объемлющего многообразия. За эту простоту мы платим использованием лишней координаты, а именно трех — в упрощенной модели, пяти — в полной модели. Другое неудобство, с которым мы столкнулись, — неэквивалентность "пространств" z = const. Эта неэквивалентность существенна, поскольку одно из них (z = 0) является геодезической линией, а другие нет. Простейший, но не очень дальновидный способ отбрасывания лишней координаты заключается во введении пары полярных координат для х и у, или точнее, поскольку пространственный радиус-вектор не постоянен, — псевдосферических координат длях, у, z. Если мы положим jc = R cos х ch t, у = R sin x ch r, z = R sh г, (7) то это удовлетворяет уравнению (Н) и дает для интервала (6) ds2 = -R2ch2t dX2 +Я2 dt2. (8) Это тот же самый "сжимающийся и расширяющийся" мир, что и прежде. Незначительное изменение заключается в том, что мы ввели новое время г, которое изменяется менее быстро, чем z. Рис. 2. То же, что и на рис. 1, но показаны несколько пространственно подобных геодезических (эллипсов), вырезанных связкой плоскостей, проходящих через ось х. Две точки М и М на этой оси представляют так называемый горизонт масс статической системы отсчета, причем эллипсы являются одновременными пространствами в этой системе отсчета 149
Заметим, что вся поверхность (Н) перекрывается, если х задано в интервале длиной 2я, а г принимает все вещественные значения. Преобразование (7) нигде не является сингулярным. Автоморфизмами являются переходы (псевдовращения) от одной псевдополярной системы координат (х, t) к другой. На случай полной модели соотношения (7) легко видоизменить с помощью введения двух дополнительных полярных углов 0, кр. Нам нет необходимости на этом подробно останавливаться. В (8) вместо простого dx2 появится выражение dx2 +sin2x(d02 +sin20 d*2). (9) Интервалом на (трехмерной) сфере - вот чем заменяется интервал упрощенной модели. В дальнейшем мы ограничимся упрощенной моделью. Чтобы получить систему отсчета, в которой все пространства постоянного времени эквивалентны, мы должны следовать другим путем. Мы помним, что все эллипсы, вырезаемые плоскостями, проходящими через начало координат под углом, меньшим 45°, являются эквивалентными пространственно подобными геодезическими, поскольку каждый из них переводится подходящим автоморфизмом в "горловину", которая сама является одним из них. Отберем из них все те эллипсы, которые проходят через одну и ту же "горизонтальную" прямую линию, скажем, ось х. Мы предлагаем сделать их пространствами постоянного времени. Новое время должно тогда быть функцией отношения z/v, или, если вам больше нравится, функцией параметра такого преобразования Лоренца в плоскости (z,y), которое переводит какой-то конкретный эллипс в "горловину". По-видимому, подходящим будет выбор thr=z/v. (10) (Это в точности "скорость" вышеназванного преобразования Лоренца.) Возникает подозрение, что х или какая-то ее функция является подходящей пространственной координатой, так как она не затрагивается этим преобразованием Лоренца. Давайте выберем х, определяемое соотношением smx = xlR. (11) Мы удовлетворим (10) и уравнению поверхности (Н), если дополним (11) следующим образом: x = Rsinx, >> = ficosxclu, r=/?cosxsh/. (12) Мы получили другой набор псевдополярных углов на (Н), сильно отличающийся от (7). Выражение для интервала следует из (6) 150
и (12) ds2 = -R2 dX2 + R2cos2Xdt2. (13) (Для полной модели та же самая модификация, указанная в (9) для (8), будет иметь место в (13); но мы, для простоты и наглядности, ограничимся упрощенной моделью.) Это - известная статическая форма метрики де Ситтера, даже еще более известная в координатах (х, t'): x = Rsinx, t' = Rt, что дает ds2 =-(1 -x2IR2y\dx2 +(1 -x2IR2)dt'2. (14) Но мы будем придерживаться выражения (13). Статическая форма получена очень высокой ценой. Определение (12) отличается от (7) двумя резко выраженными особенностями. Во-первых, в нем не удалось избежать сингулярности, столь хорошо известной в обычных полярных координатах и там неизбежной. При x = ±R, z = 0 (точки М и М на рис. 2), все одновременные пространства пересе- Рис. 3. То же, что и на рис. 1 и 2, но показана "седловидная*' область, к которой сводится весь мир в статической системе отсчета. Она представляет собой ту часть поверхности гиперболоида, которая лежит справа от двух заштрихованных плоских полосок. Ее границами на этой поверхности являются четыре (половинки) нулевых геодезических, исходящих из двух точек М, М (горизонт масс). Эти нулевые геодезические вырезаются плоскостями х = ± R. Отдавайте себе, пожалуйста, отчет в том, что существует много времени- подобных и нулевых геодезических (ни одна из них не показана на рисунке» с тем чтобы не возникло путаницы), которые входят в этот мир и покидают его, проводя не более чем конечный интервал собственного времени внутри него 151
каются, и время t становится совершенно неопределенным, что можно увидеть также из (12) для х = ±90°. Это и есть печально знаменитый горизонт масс, который здесь (а также и в полной модели, где он представляет собой двумерную сферическую поверхность) отделяет области 1x1 > 90° и 1x1 < 90° настолько эффективно, что кажется, будто они не имеют ничего общего между собой. Во-вторых у даже для наиболее полной потенциально пригодной области изменения переменных (т.е. для х рт —180 до +180° и для t — все вещественные числа) выражение (12) описывает не всю поверхность (Н), а только ту ее часть, в которой \у\ > \z\, что можно увидеть из (10). Границами являются два "световых конуса" (четыре нулевых линии), проходящие через точки х = ±R, z =0. Эти два обстоятельства, вместе взятые, — наличие сингулярности и ограничений, - оба искусственно созданные выбором системы отсчета, имеют странные следствия. Давайте рассмотрим на гиперболоиде (Н) участок седловидной формы, которым представление (12) в действительности ограничено, заданный условиями |л:| <Л, у > 0 или 1x1^ 90°, t — вещественные числа. (Не было бы никакой разницы, если бы мы включили в рассмотрение антиподную седловину 1x1 ^90°, но достаточно говорить об одной из них.) Вспомним, что времениподобные геодезические, которые описывают свободные пробные частицы, прочерчены на (Н) плоскостями, проходящими через начало координат под углом более крутым, чем 45°, и сами имеют, конечно, крутизну, большую 45°. Понятно, что большинство из них имеет только ограниченный участок внутри области нашего "седла". Примечательным исключением является ветвь гиперболы х=0у которая в статической системе описывает частицу, постоянно покоящуюся в пространственном начале координат (х = 0) этой системы отсчета. Эта траектория примечательна также и потому, что она представляет собой "Гринвич" статической системы отсчета; ее собственное время согласно (13) равно R t и, таким образом, определяет мировое время t. Никакая другая траектория свободной частицы не проходит своим курсом целиком внутри нашей области, хотя есть, тем не менее, две группы, асимптотически стремящиеся к той или иной ветви гринвичской гиперболы, которые или находились внутри области, начиная с момента t = —°°, позже покинув ее, или попали в нее и остались внутри навсегда. В последней группе представлены частицы, которые движутся к началу координат статической системы отсчета и приходят там асимптотически в состояние покоя, а в первой представлено в точности обратное движение. Даже в этих исключительных случаях вход или выход соответственно происходят в конечные моменты собственного времени 152
обсуждаемой частицы. В общем случае, когда только ограниченная доля траектории лежит внутри нашей области, частица находится внутри только в течение ограниченного отрезка собственного времени. Все это является очевидным в системе отсчета, используемой на гиперболоиде (Н), а собственное время является инвариантом. Мы можем добавить, что световые сигналы (образующие) также входят и покидают седловидную область и имеют снаружи продолжение в обоих направлениях. Как же эти события выглядят в статической системе отсчета** Обычно дается следующее описание*). Может быть обнаружено, что частица или световой сигнал приближается к началу координат, и это приближение может продолжаться в течение некоторого времени. Но в конечном итоге (не считая весьма исключительный случай, упомянутый выше) она повернет от начала координат, чтобы никогда не вернуться. С этого момента она в дальнейшем продолжает приближаться к "горизонту масс", но достигает его только асимптотически при t ->°°. Наиболее озадачивающее свойство этих утверждений, если направить их против (Н)-модели, состоит в следующем. Горизонт масс состоит из двух координатных сингулярностей в точках Л/, М (x=±R, z = 0). Они соединены пространственноподобной геодезической с каждой точкой внутри нашей седловидной области. Как может что-либо когда-нибудь хотя бы приблизиться к одной из них? Кроме того, мы знаем и видам с помощью непосредственной проверки, что большинство времениподобных (и нулевых) геодезических входят в нашу область и покидают ее в самых различных точках без того, чтобы наш старый знакомый, горизонт масс препятствовал или мешал им пересекать границу. Решение этого парадокса состоит в том, что граница нашей области образована отрезками нулевых линий, проходящих через одну из двух сингулярностей в М,М. Приближаясь к такой нулевой линии, вы обнаружите, что ваше инвариантное расстояние от этой сингулярной точки стремится к нулю, хотя и остается при этом чисто пространственным. Забавной чертой релятивистской метрики является то, что на чрезвычайно удлиненных эллипсах, которых вы достигаете, длинные, почти прямолинейные части дуги, будучи почти нулевыми линиями, вносят очень малый вклад в полную длину периметра, которая набирается главным образом на коротких кусочках в точках поворота вблизи вершин главной оси. Упомянутая неспособность движущегося объекта, как материальной точки, так и светового сигнала, в статической системе *) См., например, Tolman R.C. Relativity, Thermodynamics and Cosmology. - Oxford University Press, 1934, p. 349 (перевод: Толмен Р. Относительность, термодинамика и космология. - М.: Наука, 1974). 153
отсчета достичь границы, не говоря уже о том, чтобы ее пересечь, является просто вопросом определения "гринвичского" времени. Она имеет такой же статус, что и утверждение о неспособности Ахиллеса обогнать черепаху в парадоксе Зенона. Время t определено так, что оно становится равным °° или —°° на границах, следовательно, их невозможно пересечь ни при каком конечном времени. Некоторые авторы считают справедливой или, по меньшей мере, поддерживают ту точку зрения, что статическая система отсчета — это система отсчета "наблюдателя", постоянно покоящегося в пространственном начале координат (ветвь гиперболы х = О или х = О, >>>0). Очевидно, они опираются на то, что это - единственная времениподобная геодезическая непрерывно, "от зари до зари" остающаяся внутри этой картины мира, и на то, что кажется неприятным обнаружить себя самого выпавшим из собственной мировой системы отсчета. Но нет ни малейшей причины заставлять кого бы то ни было менять систему отсчета, которую он использует в своих вычислениях, всякий раз, как он выйдет прогуляться*). Даже в гораздо более простом случае обычного гражданского времени мы не переводим часы все время, когда мы путешествуем по Британским островам или Франции. Но даже если наш "наблюдатель" на самом деле остается в пространственном начале координат, он обязан обнаружить теоретически — при условии, что он правильно установил свою статическую мировую модель и правильно ею пользуется, — что частицы, световые сигналы, а также другие наблюдатели обычно перемещаются из одной части горизонта масс в другую за ограниченный отрезок их собственного времени и пересекают его без какого- либо усилия с их стороны, отдаваясь просто инерциальному движению. Он обнаружит это в случае объектов, чьи траектории он наблюдал некоторое время в свои телескопы с точностью, достаточной для вычисления, по известным законам инерциального движения, их полных курсов, а также и конечных периодов собственного времени, которые такой объект провел в его мире и проведет до того, как снова достигнет горизонта масс. Но ему остается только удивляться, откуда взялся этот объект и куда он направляется. *) Позвольте мне в этой связи разоблачить недоразумение, выползшее из популярных статеек и состоящее в том, что каждая конкретная система отсчета, например, в специальной теории относительности, связывается с поведением (движением) того, кто ею пользуется. Местопребывание физика является его личным делом. Самой сутью относительности является то, что кто угодно может пользоваться какой угодно системой отсчета. В самом деле, мы изучаем, к примеру, столкновения частиц двумя разными способами — в лабораторной системе отсчета и в системе центра масс, - не находясь в последнем случае на борту сверхзвукового лайнера. 154
И даже более того. Он может запустить ракету и вычислить, исходя из начальной скорости, которую он ей сообщил, тот конечный момент собственного времени ракеты, в который она достигнет горизонта масс. Он поместил в ракету термодинамическую систему в неравновесном состоянии и некоторое количество урана. Возврат к равновесному состоянию первой и распад последнего определяется собственным временем. Поэтому возврат — возможно, а распад определенно — не завершатся, когда будет достигнут горизонт. Но это произойдет при мировом времени t -*°°. Таким образом, в статической системе отсчета, поскольку за мировое время принято собственное время центральной геодезической, эти физические процессы кажутся неограниченно замедленными. (Общепринятая трактовка заключается в том, что они неограниченно замедляются*) по мере того, как системы приближаются к горизонту.) Обратный случай — ракета, достигающая центрального наблюдателя, - представляет меньший интерес, или, во всяком случае, не содержит ничего нового. Но вот случай световых сигналов заслуживает исследования, поскольку они могут быть испущены событием, которое находится вне седловидной области на гиперболоиде (Н), и могли бы в таком случае доставить центральному наблюдателю информацию о событии, которому он не должен приписывать никакого вещественного значения t. Острый интеллект. Эддингтона**) давно заметил это: "Он может даже видеть, как они [т.е. такие события] происходят, через сильный телескоп". Само по себе это правильно. Но действительно ли это вызовет путаницу для нашего наблюдателя с его точки зрения - это нужно проверить. К сожалению, наша упрощенная модель является недостаточной для этой цели. Начнем с того, что некоторое отдельно взятое событие направляет только один световой луч к некоторому отдельно взятому наблюдателю — независимо от того, имеет ли пространство одно или три измерения. Но по одному этому лучу наблюдатель не сможет определить местонахождение источника; последний может находиться в любом месте вдоль луча. Требуются по крайней мере два наблюдателя, находящихся на некотором расстоянии друг от друга, чтобы определить параллакс. Но, очевидно, в одномерном пространстве и это бесполезно. *)С точки зрения (по часам) центрального наблюдателя. {Примеч. ред.) **)The Mathematical Theory of Relativity (2nd ed., Cambridge University l'ress, 1930), § 70, p. 166. (Перевод: Эддингтон А.С. Теория относительности. - Л.-М.: ГТТИ, 1934.) Эддингтон называет статическую систему отсчета "импровизированной контравариантностью", которая "ведет к признанию, что лежащие вне нашего времени события влияют даже на наш собственный опыт". 155
В нем нет никакого параллакса, сигнал может поступить только по двум направлениям — или справа, или слева, т.е. в направлении от Мили от М. Мы должны поэтому теперь вернуться назад к нашей модели (3), вложенной в пространство Минковского Rs с метрикой ds2 = -dx2 ~du2 -dv2 -dy2 +dz2, (15) и к соответствующей статической модели. § 5. Определение параллаксов Позвольте мне резюмировать: мы видели, что когда мы преобразуем нашу упрощенную модель из х, у, z-системы отсчета в статическую систему отсчета, последняя охватывает область, являющуюся лигшь частью всего гиперболоида, ограниченную двумя точками Af, M и четырьмя нулевыми линиями, выходящими из них. Она ограничивается этой областью потому, что отсчет времени введен так, что t становится равным -н» или —°° на этих нулевых линиях и неопределенным в точках М, М горизонта масс. Это приводит, как мы видели, к странным явлениям, так как объекты и световые лучи входя! в эту область и покидают ее, и большинство объектов проводят внутри нее лишь ограниченный период их собственного времени. Мы убедились, что любой объект (или световой сигнал), входя в область или покидая ее, проецируется на горизонт масс в этой системе отсчета. Но в упрощенной системе отсчета, где пространство одномерно, нет параллаксов, и следовательно, наблюдатель не будет в состоянии указать местонахождение источника такого внешнего светового сигнала. Мы должны поэтому вернуться назад к полностью оснащенной модели с х, и, v для пространства, вместо одного только х. Легко видеть — и я покажу это впоследствии в несколько строчек, — что л:, и, v могут использоваться как пространственные координаты в статической системе отсчета. Но вначале, с тем чтобы не перепутать системы отсчета, мы установим в пятимерной х, и, и, уу z-системе отсчета, в какие точки на их горизонте масс "статические наблюдатели", находящиеся вблизи статического начала координат, будут проецировать световые сигналы, приходящие к ним от одного и того же внешнего события. (Впоследствии мы поразмыслим и о том, как они будут интерпретировать их.) Для пространственного начала координат (или мировой линии центрального наблюдателя) в статической модели мы выберем х = ы=и = 0, у>0, (16) в действительности это то же самое, что и в модели, упрощенной с помощью (5). Горизонт масс, соответствующий этому выбо- 156
ру, вычерчивается на гиперболоиде (3) х2 +и2 +и2 +/ -z2=R2 (3) условием 7 = 0, z=0, (17) которое в упрощенной модели определяло редуцированный горизонт масс, М, М (х = ±R, z = 0); полный горизонт, определенный формулами (3) и (17), может быть наглядно представлен как двумерная сфера х2 +и2 +v2=R2 (18) в подпространстве R3t охватываемом координатами х, и, v. To, что в упрощенной модели мы называли седловидной областью, которая была миром статической модели, теперь оказывается четырехмерной областью х2 +и2 +и2<Л, у>0 (19) на гиперповерхности (3). Граница, сквозь которую надо проникнуть, чтобы попасть внутрь этой области, снаружи не является, конечно, просто горизонтом масс (17) — четырехмерной области нужна трехмерная граница, — и эта граница представляет собой упомянутое npocTpaHcf- во Л3, прочерченное на (3) с помощью (18). Комбинируя эти два уравнения, вы видите, что на этой границе | у | = | z |. Граница состоит из некоторых иулевый линий, выходящих из точек на горизонте масс. В самом деле, если координаты точки, находящейся на последнем, обозначить с помощью нижнего индекса Л/, то уравнение для ее светового конуса *), записанное в бегущих координатах со штрихом, согласно (7) гласит: -(*' - хм)2 - ("' - им? - (v - vMf -у'2 +г'2 = 0. (20) Далее мы увидим, что пара образующих этого светового конуса у' = ±z, х = хм, и = им, v = vM (21) лежит на гиперповерхности (3) и на границе,а никакая другая точка нёлежит> поскольку сокращение членов су' и z' в (20) С необхе димостью требует выполнения последних трех уравнений в (21). Мы особенно отметим тот факт, что каждая точка на границе связана нулевой геодезической с одной и только одной точкой на горизонте масс, а именно с точкой, которая имеет те же самые коор- лнаты х, и, и, но, как следует из (17), равные нулю координаты у, z. *) Полного конуса в пяти измерениях! 157
Теперь мы хотим выбрать событие Е(хЕг уЕ и т.д.), лежащее вне этой области (19) и такое, что световой луч из Е достигает ветви гиперболы (16). Мы примем, что в точке Е первое неравенство (19) (но не второе) нарушено, и возьмем zE < 0. Для простоты мы выбираем Е на пред-конусе с вершиной (16). Эта вершина описывается уравнением х = и = v = z = 0, у =Л. (22) Ее пред-конус*), записанный в бегущих координатахх " и т.д., есть -jr"2-ii"a-u"2-(y"-/?)2+z,f2=0f z"<0. (23) Поскольку х" и т.д. должны удовлетворять уравнению (3), это сводится к y"=R, z"<0, (24) в то время какхп,и",v " принимают все значения, совместимые с x"2+u"2+v"2=z"2. (25) Мы выбираем наше событие Е следующим образом: 4+*4+4=4> yE=R, *2г<-Л, (26) причем последнее условие выбрано с целью нарушить первое из неравенств (19). Уравнения для светового луча, идущего из Е к вершине (22), очевидно, имеют вид х" = Ахе, и" = \иЕ, v" = \vE, у" = R, z" = XzEi (27) где X есть некоторый параметр, изменяющийся от X = 1 (в точке Е) до X = 0 (в вершине). Этот световой луч проникает сквозь границу в точке, где | z" \ = | у " |, скажем, в точке z" = 'KzE = -R, \ = -R/zE = \0, (28) где Х0 - некоторое положительное число, заключенное между 1 и 0 в силу неравенства (26). Эта точка проникновения, как мы видели, соединена нулевой геодезической с одной и только с одной точкой на горизонте масс, а именно с точкой хм = ^о^£-, "м = ^о"£-, vM = \0vE, Ум=2М = 0. (29) И это есть, в статической системе отсчета центрального наблюдателя, точка, в которую он проецирует событие Е, или где он "видит" его. Теперь рассмотрим результат измерения параллакса этим наблюдателем и его соседом. *) Полный конус в пяти измерениях! 158
Мы выбираем вблизи предыдущей точки проникновения точку на границе с координатами х = Х0хЕ + Ах, и = XoUe + Аи, (30) v = X0vE + Ди> У = ~z = R + Д.У, что, конечно, возможно, хотя первые три приращения и подчиняются соотношению (18). Это гарантирует также, что новая точка проникновения (30) удовлетворяет (3). Приращение Ду надо выбрать так, чтобы прямая линия, соединяющая Е с (30), являлась световым лучом, возможность чего легко может быть доказана. (Мы могли бы начать с рассмотрения близкого по направлению светового луча из Е и определить (30) как точку, где он проникает сквозь границу.) Координаты этого светового луча, скажем, х'" и т.д., имеют следующее параметрическое представление, поскольку луч связывает точки (26) и (30) : *"' = **+м[(Хо-1)*я+Ах], и'" = иЕ + /i[(X0 - l)Wf + Аи], и"' = "я+М(Хо-1)1^+Д"], [ (31) у'"=Я+цАу, z'" = zE+n (-R - zE - Ay). В самом деле, при \х = 0 они совпадают с координатами Е, а при М = 1 — с (30). Для следующего значения ц H=\/(l-\0) = zE!(zE+R) (см. (28)), которое превышает 1 (см. неравенство (26)), координаты равны хш = Д*/(1 - Хо), и" = Дм/(1 - Хо), v'" = Av/(\ - Х0), (32) У"=Л+Ду/0-Хо), г"' = -Д>7(1-Хо). Эта точка близка к вершине (22). Мы предположим, что вспомогательный наблюдатель находится в точке (32) и расположился там в целях измерения параллакса. В соответствии с вышесказанным он "проецирует" луч в ту точку горизонта масс, которая имеет те же самые х, ut v, что и точка проникновения (30). Заметим, что это тот же самый горизонт масс! Ибо два наблюдателя обязательно должны использовать одну и ту же статическую систему, чтобы сравнение их записей имело смысл. Согласно (30) вспомогательный наблюдатель обнаружит, что его точка проекции на горизонт смещена на Ах, Аи, Av по отношению к тому, что об- 159
наружено главным наблюдателем, хотя он знает, что его собственная обсерватория (согласно (32)) смещена относительно обсерватории главного наблюдателя в том же самом пространственном направлении на величины, пропорциональные указанным, но большие на множитель 1/(1 — Х0). Поскольку эти два пространственных перемещения параллельны, второе перемещение в статической системе отсчета ортогонально к лучу зрения, что облегчает вычисление параллакса. Поскольку перемещение на горизонте происходит в том же самом (не противоположном) направлении и является меньшим на множитель 1 — Х0,два наблюдателя,сравнив записи, обнаружат, что событие Е находится за горизонтом на расстоянии (от горизонта), равном, как легко вычислить (1 — \0)R/\0. Поскольку в соответствии» со способом отсчета их времени горизонт не может быть достигнут, а тем более перейден за конечное мировое время, они найдут, что невозможно приписать какое- либо значение времени событию Е, как это указывалось Эддинг- тоном. Предшествующие рассуждения являются безупречными в той мере, в какой они касаются вычисления смещений Ах и т.д., и Ах/(\ - Х0) и т.д.; но при обсуждении параллакса, якобы следующего из этих вычислений, и следствия, якобы выведенного из них наблюдателями, я допустил небрежность. Во-первых, я воспользовался тем фактом (который выведен в книге Р. Толмена, цитированной выше), что световые лучи являются прямыми в статической системе отсчета, именно — в координатах х, и, и. Это довольно странно, потому что статическое пространство не является плоским. Мы должны поэтому разобраться в данном вопросе. Полное преобразование, соответствующее упрощенному случаю, приведенному в (12), имеет вид х = R sin в cos (/? sin х, и = R sin в sin </? sin х, (12а) v = R cos в sin х, У = R cos x ch t, z = R cos x sh t. Это удовлетворяет уравнению (3) - определению гипер-гипербо- лоида. Интервал приобретает вид (ср. (13)) ds2 = -R2 [dx2 +sin2x(d02 + sin20dy2)]+R2 cos2 \ dt2. (13a) Пространство, очевидно, является гиперсферическим, с радиусом R. Но можно также использовать х, и, v в качестве пространственных координат, полагая r = R sin x>x = rsinO cos^p и т.д., г2 =х2 +и2 + и2. Тогда (13а) приобретает вид с/52 =-(1 -r2/R2)'1 dr2 -r2 (d62 + sin20<fy2) + + (1 -r2/R2)R2dt2. (14a) 160
Таким образом, х, и> v и г, 0, у являются обычными декартовыми и полярными координатами соответственно с известными соотношениями между ними, но геометрия пространства - римановА и радиальные расстояния "длиннее", чем в плоском пространстЭе, к примеру, инвариантное расстояние до горизонта (г = R) равно не R, а R dr */i R cosydx тг / * J — =T*- о cosx о cosx 2 Какова же теперь форма нулевой геодезической? Во-первЫ*, на (3) bRs они вычерчены определенными плоскостями, проходящими через начало координат О в Rs. Значит, они являются плоскими кривыми. Более того, они должны иметь постоянный наклон к оси z. Поэтому они должны быть прямыми линиями в Rs. Это означает, что имеется четыре независимых линейных уравнения дДя пяти переменных х, ut v, yy z (между прочим, не все четыре является однородными, поскольку линии не проходят через пятимерное начало координат О, находящееся вне гипер-гиперболоида). Исключая у и z, мы получаем два линейных уравнения для х, и, v. ОтсюДа следует тот результат, что световые лучи являются прямыми линиями в х, и, v-пространстве. Мы знаем, что это пространство имеет гиперсферическую метрику. Нетрудно показать, что эти лучи не являются пространственными геодезическими данной метрики - потому что течение времени неравномерно*). Они являются окружностями, но не большими окружностями. Так что мы спроецировали правильно. Наши наблюдения измерят положительной параллакс. И это мы должны рассматривать как факт (в такого ро- да мире). Но есть и второй вопрос: заставили ли мы наших наблюдателей интерпретировать их параллакс разумно? Зная, что свет следует £Ю прямым линиям (в х, и, и), не было бы противоестественным заподозрить, что то же самое справедливо за горизонтом, и именно это я молчаливо предполагал выше,"локализуя" за них событие£\Но э#о приводит к тупику. Вдоль луча, направленного вовне из простра н- ственного начала координат, величины х, и, v иг растут пропо р- ционально. На горизонте г =/?. Если вы продолжите луч за горизонт, то г2 = х2 + и2 + v2 > R2. Таких точек не найдется, если в*ь! *) Другими словами, потому что скорость света меняется от места к м^с" ту, и выполняется принцип кратчайшего времени Ферма (а не кратчайше го пути). Заметьте, пожалуйста, что нет никакого противоречия между двуг**1* утверждениями, а именно, что световые лучи являются прямыми линияМ*и в координатах х, и, и, но окружностями, если это пространство рассматрРи" вается как гиперболоид (или его половина). 11. Э. Шредингер 1.61
хотите продолжить пространство гиперсферически также и за полусферой, находящейся внутри горизонта. И это является наиболее естественным предположением, но находящимся в очевидном противоречии с первым естественным предположением. Я не вижу, как можно разумно решить проблему определения местонахождения. Но мы отметим тот результат, что наблюдатели получили вполне приемлемый положительный параллакс, этот результат позже нам понадобится: действительная направленность их телескопов не может зависеть от системы отсчета, используемой нами или ими. § 6. Система отсчета Леметра—Робертсона Эта система отсчета интересна тем, что она представляет пространство как бесконечное и, qua *) пространство, плоское, демонстрируя, что на весьма часто задаваемый вопрос, является ли пространство действительно искривленным и конечным, нельзя ответить, потому что ответ на него зависит от системы отсчета. Мы вернемся сначала к нашей упрощенной модели. Ключевым моментом является то, что в качестве "одновременных пространств" мы предлагаем рассматривать множество парабол, получающихся при сечении **+>,2 _Z2=/?2 (Н) множеством параллельных плоскостей, проходящих под углом 45°, а также то, что мы выбираем их параллельными оси дс, а именно — семейство у + z = const. (33) Это значит, что мы ввели временную переменную вида r=/0 + z). (34) Сначала кажется, что это несколько опрометчиво; но на самом деле все параболы являются пространственноподобными (имея везде наклон менее 45°), за одним исключением, а именно, когда константа в (33) равна нулю, что дает пару параллельных образующих (нулевых линий), а именно х = ±R. Этот предельный случай будет устранен позже с помощью подходящего выбора функции/. Как и в предыдущей модели, нам остался один только х для обозначения точек в любом из этих пространств, одномерных в нашей упрощенной модели. (В полной модели будут использованы х, и, v.) Конечно, мы хотим, чтобы интервал был диагональным, т.е., если мы берем пространственную координату в форме r = g(x.y,z)9 (35) *) Qua (лат.) - как. (Примеч. пер.) 162
Рис. 4. То же, что и на рис. 1-3, но показано семейство парабол, вырезаемых связкой 45° -плоскостей, параллельных 45°-плоскости, проходящей через ось х Последняя рассекает гиперболоид двумя нулевыми геодезическими на две равные половины, и верхняя половина представляет весь мир в системе отсчета Леметра-Робертсона, в которой параболы являются одновременными пространствами. Ортогональные им траектории (не изображены) являются линиями времени. Они вырезаются связкой плоскостей, которые проходят через асимптоту, имеющую наклон слева сверху направо вниз (уравнение х = 0, у + z = 0) мы желаем, чтобы линии t = const и 7 = const были ортогональными (в смысле метрики Минковского). Естественно, это не оставляет существенного произвола для выбора 7, потому что может быть только один набор траекторий, ортогональных к нашим параболам. Давайте найдем их. Направления t = const на (Н) заданы с помощью соотношений dy+dz = 0, xdx+ydy -zdz = 0. (36) Таким образом, dx : dy :: dz = - (у + z): x : (- jc). (37) Любое направление bxt by, bz, ортогональное ему в смысле метрики Минковского, должно удовлетворять соотношениям 5 О + z) Ьх _ у +z х - (у + z)bx + х by + x bz = 0, xl(y + z) = a( = const). (40) П* 163 (39) (38)
Таким образом, мы должны взять *) НтЫ- (41) Плоскости (40), которые прочерчивают координатные линии г = = const на гиперболоиде (Н), проходят через пространственное начало координат О, Они образуют пучок плоскостей, проходящих через асимптоту х = 0, у + z =0. Поскольку плоскости проходят через О, координатные линии — геодезические и, конечно, времени- подобные, что можно усмотреть прямо из (40), ибо косинус угла между осью z и нормалью к этой плоскости есть |a|/V(l+2a2)<l/VT (42) дня любых небесконечных а. То, что эти координатные линии являются геодезическими, — привлекательное свойство. Оно означает, что в этой системе отсчета свободная частица может оставаться "в покое" (г = const) (чего она не могла делать в статической системе отсчета, кроме как находясь в пространственном начале координат). Примем простейшую конкретизацию (41) и (34) г = Rxl(y + z), Г= 1п(0 + z)IR). (43) Выбор логарифма удаляет жуткую вырожденную параболу (у + z = 0) на отрицательную бесконечность по времени. Этого вряд ли можно избежать, но за это пришлось заплатить потерей половины гиперболоида (Н), а именно той, где у + z < 0. Позже мы еще вернемся к этой потере. Отметим, что величина г (не взирая на выбранную букву) может иметь любой знак, а именно знак координаты х\ область ее изменения включает все вещественные числа. По мере того, как мы приближаемся к 7 = -°°, только "малая" окрестность пространственной вершины параболы имеет конечные значения г, а повсюду вне ее г становится очень большим. При у + z = 0 система отсчета является сингулярной, и преобразования (43) теряют смысл. Обращая (43), получим сначала >' + z =Re*, y-z=Re~1 -rV/Л, (44) л- = re*. *) С помощью несколько более сложной процедуры можно непосредственно определить £. Оказывается, что g является произвольной функцией двух аргументов х/(у + z) и х2 + у2 - z2. Но второй аргумент постоянен на (Н). 164
Второе равенство получено из (Н), которое с помощью первого и последнего из равенств (44) дает y-z = (R2 -jc2)/0 + z). (45) Из (44) имеем для интервала ds2 = -dx2 -dy2 + dz2 =-e21 dr2 + R2 dt2. (46) "Пространство" расширяется ввиду того, что для свободных пробных частиц с постоянными значениями 7 (что, как мы видели, допустимо) расстояния между ними экспоненциально увеличиваются с течением времени. В любой фиксированный момент времени пространство является бесконечным и плоским, хотя тот факт, что оно плоское, не очень существен в упрощенной модели. (Но оно также плоское и в полной модели*).) Величина параметра 7 является однородной мерой времени, одинаковой всюду и всегда. Но, конечно, скорость света dr - — =Re-< (47) dt быстро уменьшается с течением времени, наводя, возможно, на мысль о том, что она "на самом деле" постоянна, а свет только замедляется расширением пространства. Мы видели, что пробная частица может позволить себе, чтобы расширение увлекло ее за собой. Может ли она также и сопротивляться ему? Нет, не слишком долго. В этом состоит удивительное свойство этой системы отсчета. Его можно вьюести непосредственно из выражения для 7 в (43), по крайней мере в нашей упрощенной модели, для которой, как мы видели немного ранее, любая времениподобная геодезическая в конечном итоге асимптотически приближается к ветви меридиональной гиперболы, более того, к ее асимптоте (хотя эта асимптота находится вне (Н)). Интуитивно ясно, что тогда отношения x:y:z стремятся к постоянным и так же должен вести себя 7, который зависит только от этих отношений. Логарифмическая шкала времени заставляет это стремление проявиться очень быстро, а именно экспоненциально. Следовательно, частица, обладающая пекулярным**) (собственным) движением (изменением 7), очень скоро совсем останавливается, и расширение пространства увлекает ее за собой. Не является исключением и световой сигнал, поскольку приведенные *) Заметим, что никакое пространственное начало координат не выделено; вы можете сдвинуть 7 на константу. Но вряд ли это преобразование, здесь очень простое, соответствует какому-либо простому автоморфизму (Н). **) Т.е. происходящим относительно рассматриваемой (движущейся) системы отсчета. {Примеч. ред.) 165
выше рассуждения справедливы и для него. Можно указать то значение координаты г, которое свет никогда не превзойдет, и только будет асимптотически приближаться к нему таким же образом, как и любая материальная частица. Это не удивительно, если принять во внимание (47). Детальные аналитические выкладки мы приведем для полной модели, к которой мы теперь должны обратиться, по следующим двум причинам. Во-первых, совершенно неясно, имеет ли место эта остановка также и для тангенциального движения, или, быть может, только для радиального. Во-вторых, нам желательно знать форму траекторий свободных пробных частиц. Как окажется, они прямолинейны и, в самом деле, обрываются. Для полной модели преобразование Леметра, соответствующее (43), имеет вид Rx Ru Rv _ y + z x = , и = , v = , t = In . (48) у + z у + z у + z R Мы будем теперь использовать Т для пространственного радиуса- вектора, и таким образом, г2 = х2 + и2 + v2, Т>0. (49) Обратные уравнения имеют вид y + z=Re*, - г2 - y-z=Re-f e\ R х = хет, и = йе*, v^ve*. Во втором уравнении мы использовали (3) Д2 _x2 _w2 _у2 Легко вычислить интервал ds2 =-dx2 -du2 -dv2 -dy2 + dz2 = = -e2l(dx2+d~u2 +dv2) + R2dF2, (52) подтверждающий, что одновременные пространства ( х, й, и) являются плоскими и, конечно, бесконечными. Полная евклидова шестипараметрическая группа движений по этим трем переменным оставляет (52) без изменения; ни одна пространственная точка и ни одно направление не выделены. Любая геодезическая находится как сечение гипер-гиперболоида (3) плоскостью, проходящей через начало координат О пятимерного объемлющего пространства (х, и, v, у, z), т.е. в основу кладутся три независимых однородных 166 (50) (51)
линейных уравнения, связьшающие эти пять переменных. Из них мы выражаем х, ut v через у + z и у - z, затем умножаем на R/(y + z) и получаем из первых трех уравнений в (48) у - z х = А+В- (53) y+z и два аналогичных уравнения для й, у, скажем, с константами А\ В* и А", В". Используя первые два уравнения из (50), находим г2 х = А+В1е-" -— ) (54) *P-f) и два аналогичных выражения. Исключая время, мы получим в любом случае по меньшей мере два линейных уравнения. В общем случае х - А и - A' v - А" в = в' = в" ' (55) Одно или оба из этих двух уравнений могут оказаться несостоятельными, потому что одно или, соответственно, два из значений В могут быть нулями. Но в этих случаях одно или два из уравнений (54), соответственно, уже не зависят от времени. И все три уравнения не зависят от времени, если все три значения В — нули; в последнем случае орбита вырождается в точку, обозначая частицу "в покое", т.е. без пекулярного (собственного) движения. (То, что орбита никогда не является пространственноподобной геодезической, очевидно из (52), потому что в этом случае ds2 = R2 dt2 >0.) Тот результат, что геодезическая есть прямая в х, м, и, справедлив для всех из них, но для нас главным образом интересны траектории частиц и световых сигналов. Мы хотим доказать, что на непространственноподобной геодезической величина dt нигде не может обращаться в нуль (и поэтому Г изменяется от — °° до +°°). В самом деле, если бы dt где- нибудь обратилось в нуль на пути продвижения вдоль непространственноподобной геодезической, то, согласно (52), dx, du~, dv также должны были бы обратиться в нуль, чтобы интервал ds2 не был отрицательным (пространственноподобным). Это, согласно (48), повлекло бы за собой d (у + z) = 0, dx = du=dv = 0. Учитывая этот факт и дифференцируя (3), находим O + z)tf0>-z) = 0. 167
Если мы исключим область^ + z = 0, которая сингулярна в системе отсчета Леметра, то это влечет за собой dy=dz = 0. Но когда все пять дифференциалов обращаются в нуль, мы вообще не движемся вперед вдоль нашей геодезической. Следовательно, величина г, поскольку ее дифференциал не может обращаться в нуль, должна изменяться от — °° до +°° на непространственнопо- добной геодезической, т.е. на любой траектории. (В упрощенной модели это интуитивно очевидно.) Теперь из (54) и двух аналогичных уравнений видно, что в пределе t -* °° пекулярное движение быстро прекращается во всех трех направлениях, а предельные значения 5с, н, v являются одним из двух наборов корней уравнения х=А -J3F2/R2 (56) и двух аналогичных уравнений. Вообще говоря, это — квадратные уравнения, но мы видели, что они заключают в себе два линейных уравнения (см. (55) и следующие за ним замечания). Хотя пространственные геодезические представляют меньший интерес, хорошо бы обратить внимание на то, что это доказательство не имеет силы (и факт остановки не имеет места) для пространственной геодезической. Это происходит по той простой причине, что на ней 7 не стремится к + °°, а имеет максимальное значение. Мы усмотрели это интуитивно в упрощенной модели. Чтобы доказать это для полной модели, мы заметим, что (евклидов) косинус угла между осью z и радиусом-вектором, проведенным из О в любую точку х, и, у, у, z, есть 1 -z _ z >/r2+i/2+y2+z2 v'tf2 +2z2 ' С ростом z он приближается к \\\Jl снизу, поэтому указанный угол приближается к 45° сверху, и следовательно, z должно иметь верхнюю границу, если точка лежит на плоскости, имеющей с осью z угол, больший 45° (как та, что пересекает (3) по пространствен- ноподобной геодезической). С другой стороны, из (3) имеем y< + y/(R2 +z2). Следовательно, у также имеет верхнюю границу, поэтому и у + z имеет ее, а также и t (из последнего уравнения в (48)). Что и требовалось доказать. Прекращение (замирание) всякого пекулярного движения, включая таковое для световых сигналов, не является характерной 168
чертой именно системы отсчета Леметра. Мы исследуем это явление позднее для плоской и сферической вселенных, расширяющихся или сжимающихся по произвольному временному закону. Замирание приводит, inter alia *\ к тому эффекту, что конкретный наблюдатель недостижим для сигналов какого бы то ни было рода, исходящих из больших областей мира, картину которого он составил, так как они замирают, не достигнув его. С другой стороны (точно так же, как в статической системе отсчета), его достигнут сигналы, возникшие вне его мира (из событий, где у + z <0). Приведут ли они его в замешательство? Давайте говорить о световых сигналах, поскольку для них мы можем использовать наши предыдущие вычисления параллаксов. Но вначале я хочу устранить маленький парадокс. Согласно (48) наши теперешние пространственные координаты х, w, v находятся в очень простой связи с переменными х, w, и, которые использовались в качестве пространственных координат в статической системе отсчета. В последней орбиты световых лучей были прямолинейными, а орбиты частиц - нет. Как случилось, что орбиты как световых лучей, так и частиц являются прямолинейными в jc, м, Ъ, но последние не являются прямолинейными в статической системе отсчета? Или, наоборот, по-другому, почему прямолинейность световых лучей сохраняется в статической системе, в то время как прямолинейность орбит частиц не сохраняется **) ? Первое довольно *) Inter alia (лат.) - среди прочего. (Примеч. пер.) **)Это рассуждение можно пояснить аналитически. Будем исходить из системы Леметра. В ней из (55) имеем для геодезических: dx _ du _ dv В В' В" ' Если геодезические световые, то ds2 = 0, и из (52) получим <&2 = »г tf о»* е-21 dl* ,... в2 + в2 + в 2 Извлекая квадратный корень, для определенности со знаком плюс, имеем dx _ BR^ -!.<&_ Bjl -7 dl ~ D ' dl " D € ' ' ^ = £^e-7, D^B2+B'2+B"2. dt D Интегрируя, получаем (С, С - константы интегрирования) BR _7 „ Переходим в статическую систему с помощью (50) BR „ у B'R „, 7 D D 169
удивительно, потому что знаменатель у + z никоим образом не является постоянной, и линейные уравнения между Зс, й, \>не являются однородными. Что такое орбита? Это непрерывная последовательность точек в одновременном пространстве, несущих те же самые пространственные метки, которые несли точки, поойденные движущимся объектом. Такая орбита является прямолинейной для световых сигналов в переменных Зс, w, v. Но пока проходилась орбита, время шло вперед. Соотношение между переменными "с черточкой" и "без" зависит от времени. Почему орбита должна быть прямолинейной также и в переменных д:, и, и? Пространство (х,м, и) расширяется равномерно (по отношению к системе отсчета "с черточкой") с той же самой скоростью, с которой уменьшается скорость света в системе отсчета "без черточки". Или лучше сказать, х -система отсчета сжимается по отношению к х-системе. Поэтому движущийся объект, который проследовал бы с постоянной "7-ско- ростью" по прямой линии в х-системе отсчета, дал бы правильное движение в х-системе, и наоборот. Итак, Г-скорость объекта в х-системе отсчета не является постоянной, а мы не исследовали его t-скорость, да и не хотим этого делать, — она к делу не относится. Ибо если х-система отсчета является статической, темп отсчета времени никак не сказывается на орбите в ней. Понятно, что "сохранение прямолинейности" ограничено случаем световых лучей и не справедливо для орбит частиц в статической системе отсчета. Возвратимся теперь к вопросу о том, как световые сигналы, происходящие извне области, на которую распространяется эта система отсчета, т.е. из у + z < 0, будут восприниматься в этой системе отсчета и не приведут ли они к путанице в этой системе отсчета. И теперь это рассмотрение включает область событий Е, для которой мы исследовали тот же самый вопрос в статической системе отсчета; центральный наблюдатель тоже может быть тот же самый в обоих случаях. Поэтому мы снова помещаем двух наблюдателей на небольшом расстоянии друг от друга для наблюдения параллаксов. Если мы поставим их в те же самые условия, Отсюда BR В'R В" R с с ' с" т.е, орбиты световых лучей в 5с, и,~v-системе являются прямыми линиями. Шримеч; ред.) 170
/?__——^ Наблюдатель ——"-Ц——■ ""1 Горизонт ' ■—*^Jf 8/лорой масс наблюдатель Рис. 5. Схематически показан параллакс, который найдут для в не миро во го события два наблюдателя, оба покоящиеся вблизи центра статической модели. Если расстояние между наблюдателями принято равным единице, то проекция наблюдаемого ими смещения на горизонт масс равна 1 - \0. Она положительна, но меньше чем 1, поскольку то же самое справедливо для \0. Параллакс (для единичного смещения между наблюдателями) равен \0/R. На рисунке подразумевается, что они поместят событие в Ь\ и таким образом, на расстоянии (1 - \0)R/\ 0 за горизонтом масс (путем прямолинейного продолжения их световых лучей за горизонт, о которых им известно, что до горизонта они прямолинейные). Возражения против этой процедуры обсуждаются в тексте что и прежде, действительное направление их телескопов должно быть то же самое, потому что оно не может зависеть от системы отсчета, которую они используют для интерпретации своих наблюдений. Мы нашли, что они измерили положительный параллакс (сходящиеся лучи зрения), причем такой, который соответствовал для смещения наблюдателей на 1 смещению 1 - Х0 на коор- динантном расстоянии R; при этом смещения относились к (дс, и, v ) -пространству, а X 0 было числом, заключенным между нулем и единицей, являясь нулем для события Е, находящегося очень далеко вне их мира, и единицей для события Е на их горизонте. (Вспомните путаницу, к которой наблюдатели пришли даже при определении пространственного местонахождения события; они не смогли сохранить за пределами горизонта ни закон прямолинейного распространения, известный в (х, и, и)-пространстве внутри горизонта, ни сферический характер пространства, известный им из их полусферы.) Теперь здесь, на первый взгляд, кажется, нет никаких трудностей. Мы должны принять, что они знают из эксперимента: а) что в координатах (х, Ъ, Ъ) свет распространяется по прямым линиям, б) что это пространство плоское и, следовательно, бесконечное, в то время как мы знаем в), что Rx * = —— и т.д., y+z (57) и следовательно, что они должны ceteris paribus *) найти параллакс, вычисленный ранее и указанный выше. Кажется, что у них не будет *) Ceteris paribus - (лат.) при прочих равных условиях. (Примеч. пер.) 171
никаких трудностей с определением местонахождения точки Еу и после этого, с вычислением для нее действительного значения 7. Единственное, что может поразить нас, это то, что они, если их рассуждения будут правильными, никогда _не_поместят событие на расстоянии, большем R (в координатах х, Ъу v),3a исключением тех событий, которые произошли за пределами их мира. Но они будут неправы. Ибо легко усмотреть, что они могут получать световые сигналы с любого расстояния (в пространстве х, м, и), при условии, что сигналы испущены достаточно рано. Так что здесь должна быть какая-то помеха. В чем же она состоит? По двум причинам мы должны предположить, что эти две обсерватории находятся на постоянном инвариантном расстоянии друг от друга: прежде всего, для удобства наблюдателей, поскольку их обсерватории построены в одной и той же стране на твердой почве, которая не расползается; они, конечно же, не построены на плавающих островах; но, главным образом, потому, что для использования нашего предыдущего результата относительно параллакса мы должны поместить их точно в те же условия, что и двух наблюдателей в статическом пространстве, которые находились, конечно, на фиксированных местах в (х, и, и)-пространстве. Применяя (52) к конечному, но малому расстоянию между ними, скажем, Д х, Дм, Д и» мы видим, что эти смещения должны меняться пропорционально е Или, записав (57) в виде х=хе~ * и т.д., мы имеем, что для постоянного х, ... dx = 0 = efdx + хе* dt,...; следовательно, если главный наблюдатель покоится в точке х = й = = S" = 0, вспомогательный наблюдатель движется (в пространстве (х, ufW)) со скоростью dx Ax _=--_,..., (58) Rdt R что означает — в направлении к главному наблюдателю. Зная, что в пространстве (х, й, у"), в котором он находится в движении, имеет место прямолинейное распространение света, он учтет астрономическую аберрацию, обусловленную его движением. Направление движения таково, что симулируется положительный параллакс. Если в момент наблюдения расстояние между двумя наблюдателями, перпендикулярное направлению телескопа, равно ДГ, а время равно 7, то, поскольку из (52) скорость света равна ехр(—7), должным образом выведенный параллакс, симулируемый движе- 172
нием наблюдателя, равен Аг ехр(7)/Д. Измеренный параллакс может быть получен из рис. 5, который относится к (х, и, и)-пространству; следовательно, маленькие поперечные отрезки (названные там для простоты 1 и 1 - Х0) надо умножить на Аг = Дг~ехр(7). Таким образом, измеренный параллакс равен Х0Ar/R = Х0 А7 ехр (T)/R. (59) Вычитая симулируемый параллакс, возникновение которого вовремя заподозрил наш наблюдатель, мы получим -(1 - Х0) Аг ехр (t)/R < 0. (60) Тот же самый результат получился бы, если дать возможность второму наблюдателю в статической системе отсчета отодвигаться от главного наблюдателя таким образом, чтобы его (5с,w, и")-координаты оставались постоянными. Тогда он нашел бы отрицательный параллакс (60), но спокойно исправил бы его с учетом своей аберрации на параллакс (59). Для событий, находящихся далеко вне мира, Х0 приближается к нулю, а отрицательный параллакс имеет свое наибольшее абсолютное значение. Он становится равным нулю для Х0 -* 1, т.е. когда Е находится как раз на границе мира. Никакая разумная интерпретация здесь невозможна. Мы должны принять, что световые Наблюдатель наблюдатель Рис. 6. Иллюстрируется, как наблюдатели, использующие систему отсчета Леметра-Робертсона, рассчитывают, исходя из отрицательного параллакса (сходящиеся световые лучи), расстояние я, на котором лучи должны встретиться позади спин наблюдателей. Однако наблюдатели могут быть удовлетворены тем, что лучи никогда не достигнут той точки, где лучи пересеклись бы лучи действительно сходятся в (х, и, гГ)-системе отсчета. Это приводит в недоумение, потому что они не могли бы на самом деле встретиться снова! Но наблюдатели могут рассчитать из (60) расстояние а за своими спинами, где лучи встречаются: Дг/я = (1-Хо)Дг ехр(7)//?, a=R ехр(-7)1(1 -Х0). 173
Но попадут ли они туда? И насколько далеко они могут попасть? Имеем / e~rRdt =Re-f <a, t причем знак равенства справедлив только в пределе Х0 -► 0, т.е. когда лучи приходят от события Е, находящегося очень далеко вне этой системы отсчета. ГЛАВА II ТЕОРИЯ ГЕОДЕЗИЧЕСКИХ §7.0 нулевых геодезических Геодезическую можно определить тем, что она должна давать стационарное значение контурному интегралу в фиксированных пределах интервала bfds = 0yds2 = gikdxidxk. (1) Легко показать, что это определение ведет к уравнениям Эйлера d2xk ( к\ dxt dxm ds2 I Im J ds ds если после выполнения вариации по произвольному параметру т отождествить этот параметр с s. (Для других параметров уравнение (2), вообще говоря, видоизменяется, см. ниже.) Уравнения (2) имеют первый интеграл dxf dxk gik — = const. (3) as ds Из второго уравнения в (1) следует, что const = 1. (То, обстоятельство, что константа не определяется из уравнения (2), связано с тем фактом, что уравнение (2) одинаково выглядит при любом параметре, отливающемся от s постоянным множителем.) Следовательно, левая часть уравнения (3), а поэтому и правая часть второго уравнения в (1), нигде на нашей кривой не могут обращаться в нуль. Согласно общей теории решения уравнения (2) существуют при любых начальных значениях величин xkidxk/ds, a (3) всегда является первым интегралом. Это выполняется независимо от того, какой смысл имеет параметр s. Таким образом, если начальные 174
значения выбраны так, чтобы заставить левую часть (3) обратиться в нуль, она будет обращаться в нуль на всем протяжении кривой для любого допустимого выбора параметра, скажем, т. Тогда из (1) получаем (5)'- на всем протяжении кривой, откуда следует, что s в этом случае не является допустимым параметром, и, что еще хуже, вариационный принцип (1) в этом случае не имеет смысла при любом параметре. Запишем его в развернутом виде /( dXi dxk\ Таким образом, все производные величины \/х бесконечны при х = 0, и она не может быть получена в этой точке разложением по малому приращению подкоренного выражения*). Следовательно, повсюду, где квадратный корень обращается в нуль, вариация (4) не может быть выполнена. Более того, для некоторых малых приращений подынтегральное выражение будет вещественным, для других - мнимым, что недопустимо в вариационном исчислении. Поэтому, чтобы определить геодезические, мы вообще изменим вариационный принцип. Мы примем, что dxt dxk Hga J1-T dr = 0. (5) dr dr С первого взгляда можно подумать, что экстремали выражения (5) в несингулярном случае отличаются от экстремалей уравнения (1). Но это не так. Не вычисляя их, мы заключаем, исходя из полной аналогии с аналитической механикой, что они допускают первый интеграл, скажем, вида dxt dxk gik -—г"= const s E- <6) dr dr Эта константа, обозначенная нами Ef может быть равной нулю, а может и не быть. Если она не равна нулю, вы видите, что dr с точностью до постоянного множителя совпадает с ds. Замечательным фактом является то, что наш вариационный принцип (5), постулированный вначале в терминах произвольного параметра, тем *) Конечно, это не означает, что она меняется на бесконечную величину, а означает изменение только на величину, которая нелинейна по приращению, но обратно пропорциональна квадратному корню из него. 175
не менее, определяет этот параметр с точностью до линейного преобразования с постоянными коэффициентами. На данном этапе это доказано при константе в (6), отличной от нуля. Теперь уже не удивительно, что при Е Ф О уравнение (5) имеет те же самые экстремали, что и (1). В самом деле, в этом случае вы можете записать (5) в виде = 2sfW8 Sy/(gik ^L^jdr. Это не демонстрирует эквивалентности при Е = 0. Но в этом случае эквивалентности и нет; ибо (5) сохраняет смысл, в то время как (1) — нет. Следуя Леви-Чивите *), мы распространим определение геодезических на нулевые геодезические с помощью (5). Очень легко показать, что дифференциальные уравнения экстремалей уравнения (5) в любом случае имеют вид d2xk (k) dxi dxm —Л + _L _SL =o. (7) dr2 \lm) dr dr Это уравнение, совместно с (6) для Е = 0, дает определение нулевых геодезических. Конечно, в этом случае dr теперь есть не ds (которое равно нулю). На первый взгляд, можно было бы подумать, что г теперь остается неопределенным**). Но это не так. Ибо, если вы введете в (7) параметризацию X = Х(т), вы найдете, что d2xk + | к | dxi_ dx^ = ^ Л^ </х* d\2 \lm\ d\ d\ X'2 d\' Следовательно, более простая форма (7) может иметь место только для конкретного параметра г, выделенного с точностью до линейного преобразования с постоянными коэффициентами. Для ненулевых геодезических он, по существу, представляет собой 5, длину дуги. Это соответствие нельзя распространить на нулевые геодезические. Но можно распространить другое, а именно то, что dxk/dT является согласно (7) касательным вектором, параллельно переносимым вдоль кривой, В несингулярном случае вам не нужно переносить его на самом деле; его легко узнать, потому что в любой точке он является вектором, имеющим ту же самую инвари- *) The Absolute Differential Calculus (Blackie and Son, 1929), p. 332. **) Даже хорошие учебники не устояли перед этой ошибкой. 176
антную длину, что и в любом другом месте. В сингулярном случае эта проверка терпит фиаско, потому что все касательные векторы имеют нулевую длину. Это неудобно. Однако вы можете свободно использовать (7) - и вам не нужно обращаться к (7а) - как для нахождения нулевой геодезической из подходящим образом выбранных начальных условий, так и для нахождения геодезической между двумя данными точками, когда есть риск, что она окажется нулевой геодезической. Ибо вы знаете, что параметр т, при котором уравнения получают эту простую форму, существует в любом случае. а) Нахождение параметра для нулевых геодезических в частных случаях. В некоторых случаях легко найти подходящий дифференциал dr, а именно когда по крайней мере одна из четырех координат является "циклической", под этим мы подразумеваем, что g(k не зависят от нее *). Уравнения Эйлера для циклической переменной могут быть немедленно проинтегрированы и определяют dr. Наиболее важным является случай статического гравитационного поля: все gik не зависят от хЛ и gk4 = 0 (к = 1, 2, 3). (Даже без последнего предположения хА является циклической координатой. Но этот случай стационарного поля менее прост и не столь важен в приложениях.) Обозначим через Q подынтегральное выражение в (5), так что (5) примет вид bfQdr = Q. (8) В рассматриваемом нами сейчас случае * dxf dxk dx4 dx4 Q " 2 gik — — +£44 — — . l dr dr dr dr Уравнение Эйлера, полученное варьированием по х4 > гласит d I dx4 \ dx4 — 1*44 —НО, *44— = 1, (9) dr \ dr ) dr в действительности: = const. Но эта константа не может обратиться в нуль, поскольку ни один из сомножителей в левой части не может обратиться в нуль, и поэтому с помощью несущественного изменения dr мы можем сделать константу равной 1. Следовательно, dr=g44dx4 (10) *) Название "циклическая" было дано в аналитической механике переменной, для которой энергия зависит только от ее производной по времени, но не от ее непродифференцированного значения. 12. Э. Шредингер 177
является подходящим выбором параметра. Другими словами, касательный вектор 1 dxx 1 dx2 1 dx3 1 - , , - , (И) g44 dx4 g44 dx4 g44 dx4 g44 параллельно переносится вдоль нулевой геодезической в статическом гравитационном поле. (Это вектор для всех существенных преобразований, оставляющих поле статическим, а именно — преобразований первых трех координат.) Позвольте мне короткое отступление (о принципе Ферма и его аналоге в механике). Если вычислить вариацию (5) для нулевой геодезической в статическом поле, но позволяя х4 меняться в конечных точках, она не будет, в общем случае, равна нулю, и мы получим вклад от пределов (обозначим их "1" и "2") : dx4 |2 8 fQdr=g44 —~8х4 \ dr 11 Если, однако, применить это только к таким "варьируемым путям", на которых Q также равно нулю, т.е. которые состоят из нулевых элементов, не являясь при этом нулевыми геодезическими, тогда вариация равна нулю, и мы получим, используя (9), dxA 2 • ,2 } О =£44 8х4 \ =8х4 \ =8 J dx4. dT ! Это и есть принцип Ферма кратчайшего (или стационарного) времени перехода. Он выполняется в точности при тех условиях варьирования, которые мы приняли, а именно, что сравниваемые кривые соединяют одни и те же две точки в пространстве, и по ним необходимо проследовать "с локальной скоростью света", т.е. Q = 0. Очевидным образом его можно привести к трехмерной форме 5 / Ял1/2 (-2 gik dxt dxk)l/2 = 0. i i Пространственные концы "1" и "2" зафиксированы. Используемый параметр получен без какой-либо предвзятой установки на его счет. Связь между четырехмерным геодезическим принципом и принципом Ферма аналогична связи между принципами Лагранжа и Мопертюи в общей механике. Согласно первому U 81=8 f (Т- V)dt = 0 для фиксированных пределов, т.е. он дает уравнения движения. Если система консервативна, Т + V= E есть первый интеграл. Если 178
варьировать также и t, время перехода, то tx ,. t2 . Ы = -Ebt\ (это, возможно, не (Т - V) bt \ ) (Отложим доказательство на некоторое время.) Теперь пусть М= J 2Tdt = f (T-V)dt+ f (T+V)dt. tx tx tx Если мы теперь осуществим вариацию, при которой Е удерживается постоянным, и позволим пределам варьировать, тогда ЬМ=Ь / 2Tdt = -E8t\'2 +£5r|'2 =0. Это - принцип Мопертюи. Этот интеграл можно привести к виду, в котором он не будет больше содержать t: 2T=2(E- V),nTмы запишем как 2 ds так что dt = , у/2Т 7(5)"- и таким образом, 5 fds\/{2(E- V)) = 0. в Заметим, что вовсе не время перехода здесь является минимальным! Для того чтобы непосредственно доказать справедливость выражения, используемого для 5/, введем параметр X, который не варьируется на концах, и примем, что / — функция от X; производные по X указываются точкой: 1 / ds\2 1 , , dt = td\9 Г=- — =-*2Г2, 2\dt I 2 5/=5 fl-s2r2-Vjtd\= fl-Lpr2 6t- Vbtjd\ поскольку существенны только вклады, обусловленные варьированием t (X), ведь остальные обращаются в нуль согласно принципу Лагранжа. Следовательно, 5/= / - (-s2i~2 + v\td\-\( - s2i'2 + VJbtl =-Ebt[2xi гак как подынтегральное выражение обращается в нуль. (Этот 12* 179
результат не ограничивается консервативными системами, но в общем случае его не так просто доказать.) После этого отступления мы возвращаемся к нашей главной теме. В нестатическом случае представляет интерес интервал де Сит- тера в системе отсчета Леметра: «-'[(гигшумг?)'- <■» Здесь все три пространственные координаты — циклические. По крайней мере одна из них должна изменяться вдоль луча. Ее уравнение Эйлера может быть проинтегрировано и дает е2Г — = 1, <1т = е2Т dx. dT Касательным вектором, переносимым параллельно, является в данном случае dx dx dx Но поскольку это не вектор относительно отрогональных преобразований трех пространственных координат (а только они единственно являются существенными из преобразований, оставляющих (12) неизменным), лучше взять dr = e2T do (do2 =dx2 + du2 +c/i72) и получить параллельно переносимый касательный вектор -2l d* -21 dU -21 dU -1 do do do (потому что R dtjdU = ехр(г) на нулевой линии). Подходящий параметр не является инвариантной пространственной длиной вдоль луча, т.е. do jxp(t), а совпадает с R dt. Поэтому можно также взять г = ехр(/ ). б) Сдвиг частоты. Знание подходящего параметра на нулевых линиях, когда оно может быть обеспечено, является полезным при определении сдвига частоты света, испущенного на одной времениподобной мировой линии и поглощенного на другой. Вообще говоря, нет никакого смысла сравнивать две частоты, измеренные в мировом времени, потому что они зависят от системы отсчета. Кроме того, в существенных случаях мы можем наблюдать только одну из них, поскольку источник недостижим (на Солнце, или на звезде, или в туманности). Что мы действительно сравниваем — 180
Рис. 7. Иллюстрируется вывод общей формулы (16) для частотного сдвига из того факта, что интеграл Лагранжа равен нулю для любого светового луча и поэтому должен быть одинаковым для двух последовательных световых биений, движущихся от источника к наблюдателю, даже хотя оба предела этого интеграла изменяются в соответствии с движениями источника и наблюдателя, которые могут быть совершенно произвольными это частоту света, пришедшего от внешнего источника, измеренную в нашем собственном времени, и измеренную в том же самом масштабе частоту света этого же самого производителя света (например, атома натрия) в нашей лаборатории. Предположение состоит в том, что последняя частота является инвариантом, и, таким образом, той же самой, что и на удаленном источнике, будучи измеренной в собственном времени источника. Поэтому, чтобы предсказать наблюдаемый сдвиг из теории, мы должны найти отношение двух упомянутых промежутков собственного времени: 6s 1 - на источнике между испусканиями двух последовательных биений света (гребней волны, к примеру) и 5s2 - на приемнике между поступлениями этих биений. Отношение 8s2/8Sl (13) определяет сдвиг: период, который мы наблюдаем в свете, приходящем от удаленного источника, деленный на период, который был бы наблюден наблюдателем на источнике, а он, по предположению, тот же самый, какой мы измеряем для такого же производителя света в лаборатории. Таким образом, вышеуказанное отношение, когда оно больше чем 1, указывает на красное смещение, а когда меньше - на фиолетовое смещение. Это явление называется эффектом Доплера и/или гравитационным эффектом. Но в то время как полный сдвиг сам по себе является инвариантным, два вида сдвига не могут быть различены инвариантным образом. Чтобы определить отношение (13), мы вычислим вариацию интеграла (5), причем путь интегрирования до варьирования является нулевой линией (световым лучом) из одной точки на мировой линии источника хь li к точке хк\2 на мировой линии наблюдателя, в то время как варьируемый путь должен быть нулевой лини- 181
ей из (х* + Ьхк) d в (хк + 6х*) |2. Мы должны принять во внимание вариации на пределах интегрирования. Полная вариация, конечно, равна нулю, потому что интеграл обращается в нуль на обоих путях. Таким образом, мы имеем 2 dxi dxk 0 = 6 /ft*—-' —</т = i dr dr с U ■ dxt d8Xk .. dx* dXk * \^ = /(2ft* — — + ft*,/ — —- bxAdr i \ dr dr dr dr / dxt |2 2 г d ( dxt \ = 2ft* —i 8xk\ - / 2 — ft* —i - ar |i i L ar \ dr J dxt dxm 1 -ftw.it-г- -— \bxkdr. (14) ar dr J Интеграл обращается в нуль, согласно (7), для подходящего параметра т. Следовательно, для него dxt 12 ft*-7^5** ^0. (15) dr |i Поэтому Г dx( Ьхк ] г* «г], 5s2 65! г dXj Ьх г Л, 5х* 1 (16) Выражения в квадратных скобках являются скалярными произведениями касательных векторов мировой линии движения (5) и светового луча (d) на источнике (7) и приемнике (2) соответственно. Эти произведения не могут обращаться в нуль, потому что времениподобныи вектор не может быть ортогональным нулевому вектору, не равному тождественно нулю*). Ясно, что нужно знать *) Достаточно проверить это, преобразовав £/* к метрическому тензору специальной теории относительности (-1, -1, -1,1). Пусть р* есть некоторый нуль-вектор, тогда ркр = 0. Пусть ы* ортогонально р*, так что рки - 0. С учетом этих двух соотношений норма м* при любых \ совпадает с нормой для м* + \рк. Норма последней in extenso [in extenso (лат.) - (здесь) в подробной записи. (Примеч. пер.) ] имеет вид -(и, +\р,)2 -(и2 +\рг)2 -(н3 +*Рз)2 +("4 +*Р4)2- Взяв конкретное значение \ = -и4/р4, видим, что эта норма не может быть 182
gik в обоих местах, а также и все четыре направления, причем все это в явной форме, если требуется дать определенный ответ на вопрос о сдвиге частоты. Единственное, чегб не достает для вычисления правой части в (16), — это отношения величин йт в точках (1) и (2), или, другими словами, значения параметра г, при котором подынтегральное выражение в (14) обращается в нуль. Из этого dXj I dx( I обращения в нуль следует, что — представляет собой , dr \2 dr |i параллельно перенесенное вдоль луча. Это необходимо выяснять в каждом конкретном случае, разве только он не окажется упомянутого ранее простого типа, для которого это известно в общем случае. Альтернативой переносу светового вектора dXj/dr (^/-частные) является перенос из точки (7) в точку (2) 8Xf/ds-вектора, касательного к времениподобной мировой линии (5-частные). Ибо числитель отношения (16) остается неизменным, когда переносятся все три его сомножителя; после переноса первые два становятся равными двум первым сомножителям знаменателя, и мы можем сказать, что сдвиг частоты определяется частным от деления косинусов двух углов, образованных световым лучом с вектором направления движения источника (перенесенным к приемнику) и вектором направления движения приемника соответственно. Давайте проверим (16) на простейшем примере статического поля, причем и источник, и принимающий наблюдатель покоятся. На обоих пределах в этом случае остаются только вклады 8x4/8s Ф 0, равные g^^2. Как в числителе, так и в знаменателе выживает только член с / = к = 4. Подходящим dr, согласно (10), является #44^*4, тогда dx4/dr = l/g44- Поэтому мы получаем fa2 _ I 4 g44 Jj_ = \fg44 12 5Sl L JL -1/2 1 У/IZ \ #44 £44 1 I #44 J 2 Данный результат согласуется с хорошо известным "гравитационным красным смещением". Оно может быть также получено с помощью простого соображения, что наблюдаемые длины волн должны быть прямо пропорциональны скоростям света (измеренным в единицах мирового времени!), т.е. V#44» поскольку все испущенные биения достигают приемника и затрачивают одно и положительной и обращается в нуль, только когда ик пропорционально рк. Другими словами, все векторы, ортогональные нуль-вектору, за исключением пропорциональных ему самому, являются пространственноподобными. 183
2J m_ =e z ет Л"1 =е — (посколькуds = 0). то же мировое время на то, чтобы достигнуть его. Из этого факта никоим образом не следует дейать вывод, что частота является неизменной: ибо частота, измеренная в единицах миррвого времени, не имеет смысла наблюдаемой величины. Давайте теперь рассмотрим систему отсчета Леметра—Робертсона ds2=-e21 (dx2 + du2 +dv2)+R2 d72y для которой мы также запишем ds2=-e21 do2 +R2d72. Нам желательно определить сдвиг частоты, когда и источник, и наблюдатель покоятся с точки зрения координат х, йу v. Наблюдателя можно поместить в пространственное начало координат. Мы нашли, что подходящим dr будет do exp(27~). И что же мы получим из (16) ? На обоих концах лишь 5х4 _ 57 _ 1 55 55 R отлично от нуля. Поэтому для светового луча нам нужно только dx4 di o7 т i т ! —- = — =e~2t e* /Г1 =е~< — dr e2T do R Следовательно, из (16) 552 R2e-T* R2 - - — = = =e'*-ri >i, bsx R2e-'*R-2 что означает красное смещение. (Ибо вспомните, это есть отношение периодов или длин волн.) Пусть У = (5с2 + и2 + v2) ll2 будет расстоянием в координатах (х, й, и"), которое, по предположению, не изменяется. Тогда из интервала (для df = 0) инвариантное расстояние, которое ведь меняется, очевидно равно Г ехр(7"). Поэтому Х2 _ инвариантное расстояние в момент приема (2) _ г2 \i инвариантное расстояние в момент испускания (1) гг На первый взгляд, это, мягко говоря, удивляет. Согласно наивной точке зрения; наблюдатель покоится, а источник движется-вовне со скоростью, равной exp(fi) в момент испускания; разве не одним этим должен определяться сдвиг частоты? Эта наивная идея не далека от истины, но в этой форме она является только приблизительной. Запишем Х2 _ \х ■'+ ДХ _ АХ _ г2 \i \i Xi rx 184
следовательно, ДХ г2 - гг Далее, г2 — гх представляет собой расстояние, пройденное источником между ti и 12, а г х — расстояние, пройденное светом за то же время. Таким образом, если вы пренебрежете ускорением источника, то это отношение почти совпадает, с наивной точки зрения, с отношением их скоростей (что представляет собой обычное приближение для значения ДХ/Х). Но относительно нашего результата подразумевается, что он является точным. Поэтому давайте проверим его более прямым способом. Давайте снова рассмотрим два последовательных световых биения, путешествующих от мировой линии источника (7) к мировой линии наблюдателя (2). А теперь давайте измерим расстояние Т от Ах до А 2 вдоль прямолинейного светового луча. Из выражения для интервала и свойства светоподобности имеем dr=Re-Td7t 7=R(e-T> -е'7*). По предположению, это расстояние не изменяется и должно быть таким же, как от Вх до В2. Следовательно, -е-^5?! + е~**Ь!2 =0, ill -7-7 _i!£i 67 i dsi поскольку оба покоятся в (Зс, й> и")-системе отсчета. Это тот же результат, что и ранее. Но мы можем теперь привести его к другой Рис. 8. Иллюстрируется способ, которым вычисляется отношение 8s2/dsl (и тем самым красное смещение в системе отсчета Леметра—Робертсона), с покоящимися в этой системе отсчета источником и наблюдателем, исходя непосредственно из того факта, что координатное расстояние между ними не меняется со временем 185
форме, используя вышеприведенный результат для г ; из него *>1 R :\ -etx-U =1 _ bs2 или, в очевидных обозначениях, Av = г exp(tt) R Данный результат в точности согласуется с наивной точкой зрения, поскольку правая часть является как раз отношением того, что с упомянутой точки зрения является скоростью источника в момент испускания и скорости света. (Но это утверждение не было бы справедливо для других законов расширения.) § 8. Свободные частицы и световые лучи в расширяющихся пространствах общего типа, плоских или гиперсферических а) Плоские пространства. Мы обобщим интервал Леметра (52) (глава I, стр. 165) следующим образом: ds2=-e2g<7)(dx2 + du2 + dv2)+R2dT2, (17) где g(T) является произвольной функцией F, в то время как R является некоторой постоянной длиной, которую мы сохранили с целью сравнения с § 6, хотя она и не имеет теперь очевидного смысла. Конечно, выражение (17) больше не является решением полевых уравнений в пустом мире, оно должно быть подкреплено наличием (пространственно однородной) плотности, а может быть, и давлением. Мы не предлагаем заниматься здесь их исследованием; эта общая проблема очень подробно изложена в книге Тол- мена*) . Мы принимаем (17) как данное и хотим изучить его геодезические, а более конкретно — времениподобные и нулевые геодезические. Мы воспользуемся вариационным принципом (5) из § 7, который применим ко всем случаям ■<$)' </т = 0. (18) *) R. Tolman. Relativity, Thermodynamics and Cosmology, p. 361. (Перевод: P. Толмен. Относительность, термодинамика и космология). 186
Мы знаем первый интеграл (6) (см. § 7, стр. 174) Iwt / \dr ) \ dr) J \dT/ (19) где Е — какая-то константа, равная нулю для нулевых геодезических и положительная для времениподобных. Простое рассуждение показывает, что варьируя пространственные параметры х, й, й~, мы получим три очень простых уравнения Эйлера, например, dr \ dr ) (20) которые формально являются теми же самыми, что и уравнения в задаче о геодезических для трехмерного статического плоского пространства, с которыми наша система (20) совпадает, если использовать параметр </т' = е-2*<'~></т. (21) Итак, мы заключаем: 1) что все орбиты являются прямыми линиями в координатах (Зс,!7, й"), но могут вырождаться в точку (потому что ни dr, ни dr'не являются пространственными линейными элементами); 2) что мы имеем также первый интеграл трехмерной задачи (что легко подтверждается из трех уравнений типа (20)) т.е. левая часть равна неотрицательной константе (для /=0 мы получаем точку, упомянутую в п. 1). Подставляя (22) в (19), мы находим смысл параметра г: dT= Rdl Отсюда, с помощью (22), находим скорость "с черточкой" i/2 Rfe-W ) "1Ш#И£-)Т <£+/8е-2*<г»1/2 (24) Мы замечаем, что, как и в случае метрики Леметра—де Ситтера, все частицы, включая световые сигналы (Е = 0), асимптотически останавливаются, если расширение длится неограниченно, т.е. при g(t ) -*°°. Это утверждение выполняется в (хуй~у ИГ)-системе отсчета и означает, что частицы в конечном итоге просто участвуют в общем расширении. V есть скорость того, что астроном 187
мог бы назвать "пекулярным" движением*), в котором движение, связанное с расширением, не принимается во внимание. Но, помимо этого у V выражено не слишком осмысленным способом, потому что заданному темпу изменения во времени, скажем, координаты х в различные эпохи соответствуют различные темпы изменения во времени того, что мы склонны называть "истинной" х-координатой, изменение которой в ехр(£(7~)) раз быстрее. Переопределяя соответствующим образом пекулярную скорость, мы должны также опустить множитель R в правой части (24). Согласно (17) это означает, что для наших нынешних целей лучше вместо / считать временем R t. Тогда мы получим V = R-lVe^')= fe 8 ' _ . (25) {Е+/2е-2*Ю}Ч2 Мы замечаем, что для Е Ф 0 переопределенная пекулярная скорость все еще уменьшается, хотя и менее быстро. Для света, однако, она становится равной 1 (/ = 0 должно быть исключено при Е = О, потому что, согласно (23), это сделало бы наш параметр т бессмысленным). Каков смысл величины Е для случаев, когда она не обращается в нуль? Вычислим величину I г= у/Т откуда следует, что Vs/E~ sfT^T'< = /е-*<'>. (27) Из уравнения (19) значение Е фиксируется с точностью до постоянного множителя, поскольку известно, что то же самое имеет место для г. Но предпочтительнее выбрать инвариант, который превратит (1т в инвариантный дифференциал. Уравнение (27) подсказывает взять для Е квадрат массы покоя; тогда (27) является импульсом пекулярного движения. Квадратный корень в знаменателе (26) будет тогда энергией пекулярного движения, а параметр т согласно (23) будет, в сущности, интегралом по времени от величины, обратной этой энергии. Мы отметим, что импульс (27) изменяется обратно пропорционально фактору расширения, или "линейным размерам" модели. Мы имеем основания усомниться в том, имеет ли какой-нибудь разумный физический смысл говорить об импульсе и энергии пе- *) Пекулярным в астрономии называется движение отдельной звезды относительно местной системы звезд. (Примеч. ред.) 188
кулярного движения и игнорировать при этом общее движение, связанное с расширением. Но это определенно является простейшим способом отразить действительное положение дел. Я осмелюсь сказать, что плоские модели, отличные от модели Леметра, вряд ли имеют какое-то значение для физики. Все становится гораздо более простым для сферического пространства. б) Сферические пространства. Мы рассмотрим выражение для интервала = _e2iT(Ofl2^x2 + sin2x(c/02 +sin20^2)] + R* dt2 , (28) которое является обобщением очень простой формы представления пространства-времени де Ситтера, данной в (8), стр. 176, для упрощенной модели, но не исследованной в дальнейшем. И снова (28) необходимо, вообще говоря, подкрепить каким-то тензором материи, но здесь мы не будем этим заниматься. Как и в (18), мы воспользуемся "квадратичным" вариационным принципом, который, для краткости, запишем в виде /ds\2 6f[—) dT = 0> (29) или, в несколько более детальной записи, 4<2'<"*'(1г)'-'Ш1-°. Величина со не является переменной, но ее производная по t является "угловой скоростью". Как и ранее, мы имеем первый интеграл 2 = Е. (31) № Вариации по х> 0, у будут здесь несколько более сложными, но нет необходимости их выполнять, так как мы видим, что, используя снова параметр г', как ив (21), мы встретимся с проблемой минимизации для трехмерной статической гиперсферы. Поэтому мы заключаем: 1) что все орбиты являются большими кругами на единичной гиперсфере, описываемой с помощью углов х, #> V (которая играет здесь в точности ту же роль, что и пространство "с черточкой" в плоской задаче), или, возможно, точкой на ней, а именно в том случае, когда х> #> ^ являются постоянными: эти углы часто называют сопутствующими координатами; 2) что мы имеем другой первый интеграл, соответствующий (22) ^(г)(тг)2=/2- (32) 189
Из двух последних уравнений (33) \ пт / и следовательно, ^dT~{E+R2f2e-2*W}1!2 (34) Используя это в (32), мы получаем скорость g(0 d" = fR2e~g(t) V = Re dt = {£+/^^-2^)}1/2 • (35) Я опустил прилагательное "пекулярную". Оно не было бы здесь совершено неверным, если бы не подразумевало, что имеется еще какая-то другая скорость, которой в действительности здесь нет. Верно, два тела, оба имеющие V = О, увеличивают расстояние между собой за счет расширения; существует взаимное красное смещение и т.д.; но эта "скорость" не относится целиком ни к тому, ни к другому телу; и не относится половина к одному, а половина к другому, потому что такая точка зрения привела бы к громадной путанице в ситуации, когда имеются третье и четвертое тела (с V = Q). Согласно (35) материальное тело (Е > 0) асимптотически замирает на большом круге, по которому, как мы видели, оно движется. Но для светового сигнала (Е = 0) скорость V =R (постоянна!) . (Сейчас, может быть, было бы более подобающим опустить в последнем члене выражения для интервала (28) множитель R2, который мы удержали для ссылки на наше предшествующее исследование; это означало бы замену нашего R t на t и дало бы для света V = 1.) Несмотря на постоянство V для света, может случиться так, что световой сигнал, испущенный с покоящегося тела {V = 0) по направлению к другому покоящемуся телу, не будет, приближаться к последнему и, возможно, никогда не достигнет его. Ибо если со есть угловое расстояние между ними, то длина дуги большого круга, находящейся между ними, а именно Ле*<г)со, (36) может увеличиваться со скоростью, большей скорости сигнала, идущего вдоль дуги. В самом деле, может оказаться, что RegWg\t)oodt>Rdt. Например, в случае метрики де Ситтера (выражение для интервала в (8) на стр. 176), где вместо нашей экспоненты стоит ch(f), это неравенство выполняется, и продолжает выполняться при coshf > 1. 190
Этот пример показывает, что покоящееся тело может быть вынесено из поля зрения другого покоящегося тела стремительным расширением вселенной. Вернемся к (35) и образуем, аналогично (27), комбинацию =/Ле-'*>. (37) л/1 -V2/R2 Если мы возьмем Е равным квадрату массы покоя*), что возможно, то это выражение будет импульсом. Он уменьшается обратно пропорционально радиусу пространства. В расширяющемся пространстве все импульсы уменьшаются таким же образом для тел, на которые не действуют никакие другие силы, кроме гравитации (которая обусловлена, конечно, материей, требуемой для существования нашего интервала в форме (28)). Этот простой закон имеет еще более простую интерпретацию в волновой механике: все длины волн, будучи обратно пропорциональными импульсу, попросту расширяются вместе с пространством. Это утверждение можно подкрепить прямым анализом в рамках волновой механики, который показывает также, что даже пространственно ограниченное волновое явление ( к примеру, "волновой пакет") "участвует в расширении пространства", но объяснение точного смысла этого выражения следует отложить, потому что оно не совсем так просто, как кажется. Амплитуды уменьшаются таким образом, что полная энергия (почти) монохроматического волнового пакета уменьшается пропорционально его частоте. (Это удовлетворит квантового физика.) Все это справедливо и для света, который в нашем нынешнем анализе нужно подвергнуть не вполне удовлетворительному переходу к пределу Е->0, V -+R. Мне следовало бы добавить, что упомянутые теоремы волновой механики не являются совершенно точными, но представляют собой очень хорошие приближения в той мере, в какой расширение не является чрезвычайно быстрым, т.е. в той мере, в какой/?"1 (dR/dt) является малым по сравнению с частотами рассматриваемых волн. Для энергии нашего тела мы получаем из (35) и (37) выражение — V = r-g(t)(Ff2g(t) + /2g2)l/2 = >J\-V2IR2 = (E+f2R2e-2s^)1*2 (38) *) Возможно, нам следовало бы сказать: "Положим Е равным квадрату массы покоя, умноженному на R2'\ поскольку скорость света равна R (постоянной!). Читатель простит нам эту не имеющую отношения к делу непоследовательность. 191
— хорошо известное соотношение, поскольку (37) является импульсом, а Е — квадратом энергии покоя. Энергия, конечно, уменьшается,и скорость ее уменьшения управляется другим интересным соотношением. Чтобы облегчить восприятие, сначала дадим нерелятивистское приближение. Согласно формуле кинетической теории для давления идеального газа — m0v2n в обычных обозначениях) отдельная частица, заключенная в полном объеме 12 пространства, дает вклад в давление m0v2 м--55- ■ <*» Умножим это выражение на приращение d£l объема 12 за периоде mQv2d£l . , [p]da = -г" = m0v2g\t)dt9 (40) поскольку 12 увеличивается как третья степень радиуса. Кинетическую энергию частицы вычислим по ее импульсу (37) 1 f2R2 — m0v2= - е'2*«К (41) 2 Ъп0 Она уменьшится за период dt на (1 \ f2R2 —т0 и2) = - e~2*Wg\t)dt = 2 I m0 = m0v2g'(t)dt, (42) что совпадает с (40). Потеря энергии такова, как если бы она была затрачена на работу над удаляющимся поршнем, хотя никакого поршня нет. Чтобы превратить (39) в точную релятивистскую формулу, мы должны заменить m0v2 произведением импульса и скорости. Согласно (37) и (35) это дает _ J_ {VIRfyfF _ f2R2 e~2gM [Р]~ 312 \\-{VIR)2)112 " 3n{E+f2R2e-2sW)112 ' (39') f2R2e-2*Wg\t)dt [Р]Ш= (E,f2R2e-2^l2 ' <40> Это на самом деле в точности равно уменьшению энергии (38) за период времени dt. Поскольку все эти соотношения универсально справедливы для любого вида материи и, как я упоминал выше без доказательства, также и для светового или теплового излуче- 192
ний, они должны быть справедливы также и для всей той материи, которая обеспечивает существование интервала в форме (28). Не проводя расчетов, мы можем утверждать, что и вся вселенная теряет энергию, как если бы ее содержимое своим давлением работало на увеличение ее объема. Что же является этим таинственным "поршнем" и куда девается энергия? В ньютоновой механике мы сказали бы, что она затрачивается на преодоление взаимного гравитационного притяжения и хранится в виде гравитационной потенциальной энергии. Из теории Эйнштейна понятия гравитационной силы тяги и потенциальной энергии исчезли, хотя они изредка используются в целях краткости речи. Но разве в основе этой теории не лежат очень важные законы сохранения, включая сохранение энергии? Разве они не нарушаются, если об энергии говорят, что она уменьшается и при этом нет никакого ее потока вовне (его здесь не можзт быть потому, что в данном случае нет никакой границы и ничего лежащего вне) ? Нет и нет! Закон сохранения не дает возможности утверждать, что объем энергии, заключенный в любой данной пространственной области, постоянен, при условии, что нет никакого движения энергии через ее границу; и по той простой причине, что плотность энергии есть компонента тензора (а не инвариант) и ее интеграл по инвариантно зафиксированной области пространства вообще не имеет никакого инвариантного или ковариантного смысла, даже смысла компоненты тензора (или вектора). Верно, что имея дело с таким особым объектом, как расширяющееся сферическое пространство, необходимо сильно снизить наши требования касательно инвариантности, потому что мы привязаны к весьма специальной системе отсчета; в общей же системе отсчета объект утратит свои простые свойства и совсем отобьется от рук. Неинвариантные понятия, приспособленные к этой системе отсчета, могут быть очень полезными в таких случаях. Этот факт, между прочим, не всегда получает достаточное признание. А в любой конкретной системе отсчета законам сохранения можно придать форму, которая будет допускать как интегрирование по трехмерным областям, так и утверждение о "постоянстве содержимого" типа того, что приведено выше. Хорошо известным трюком является приведение законов сохранения к обычной дивергенции без дополнительных членов, порожденных кривизной. Однако это достигается за счет введения необщековариантного (псевдо-) тензора энергии—импульса—натяжений, что заставляет рассматривать его вместе с тензором материи. Только для суммы этих двух тензоров справедливы интегральные законы сохранения. Величиной, не зависящей от времени, в нашем случае является интеграл по всему пространству от суммы плотности энергии материи и плотности гравитационной 1 3. Э. Шредингер 193
псевдоэнергии. И, конечно, последняя вносит тот вклад, который в ньютоновой механике был бы назван гравитационной потенциальной энергией. Таково решение кажущегося парадокса, нравится оно нам или нет. Из предыдущего анализа не следует делать поспешное заключение, что масса покоя вселенной является постоянной, потому что она инвариантна. Напротив, она может меняться; однако это не связано непосредственно с изменением объема, с расширением. Мы знаем, что масса покоя изменяется во многих процессах, происходящих в лаборатории, при рождении пар и их так называемом уничтожении и во всех ядерных превращениях. В этих процессах, которые определенно постоянно происходят в больших масштабах внутри звезд, энергия локально сохраняется, но энергия покоя может значительно изменяться. В этих переходах всегда, когда энергия покоя уменьшается, возрастает кинетическая энергия, и поэтому вклад этого конкретного количества энергии в давление возрастает, достигая своего максимального значения при переходе в электромагнитное излучение с нулевой энергией покоя. Р. Толмен весьма уместно заметил, что если бы эти изменения давления произошли в изначальной статической вселенной, то они сами по себе оказались бы достаточными для того, чтобы разрушить гравитационное равновесие и дать начало расширению (или сжатию). Поскольку мы знаем, что такие процессы постоянно идут, это является очень сильным аргументом (в дополнение к наблюдаемому красному смещению и независимо от него), заставляющим верить, что наша Вселенная не является статической. Ибо согласно общепринятой теории изменение полной энергии покоя должно сопровождаться изменением объема. Между этими двумя изменениями нет однозначной связи, но при постоянном объеме энергия покоя также была бы постоянной. в) Красное смещение для сферических пространств. Займемся теперь непосредственно исследованием сдвига частоты света, используя тот же метод, что и прежде, т.е. уравнение (16) Г dXj 8xk 1 б s2 L l dr 5 s J i 7^ = —r -, * , ' <16> [Ш7ГТГ\2 где индекс 1 относится к источнику, 2 — к наблюдателю, б-отношения—к соответствующим им мировым линиям, а d-отношения-к мировым линиям световых лучей. Мы примем, что ни источник, ни наблюдатель не имеют пекулярного движения. Мы нуждаемся 194
в подходящем dr\ его дают наши первые интегралы или просто (33) с£-=0: dT = e*Mdt (параметр / можно опустить, он может быть равным нулю). Выживает только член с / =/г = 4; компонента gA 4 = Я2 является константой и может быть опущена. 5-отношения также являются константами. Таким образом, получаем Этот результат известен нам из предыдущего случая (плоская расширяющаяся вселенная Леметра—де Ситтера). Длины волн теперь находятся в точности в том же отношении, что и радиусы пространства в моменты поглощения и испускания соответственно. Более того, имеется полное согласие с уменьшением импульса частицы, если этот импульс интерпретировать "для фотона" согласно волновой механике как hj\. Красное смещение является чем-то происходящим с фотоном во время его путешествия вместе с расширением пространства, а вовсе не эффектом Доплера. Но вы можете вспомнить, что в случае системы отсчета Леметра мы могли, наоборот, интерпретировать его как эффект Доплера при испускании. Это, очевидно, невозможно в общем случае (только, быть может, когда g(t) линейная функция; но, в такой интерпретации трудности имеются в любом случае, ибо линейная скорость света является постоянной, а скорость удаления источника в момент испускания (t\), если вы примете, что наблюдатель постоянно покоится, не совпадает со скоростью удаления наблюдателя в момент (t2), если вы примете, что постоянно покоится источник). В любом случае для функции £ (г) общего вида нет никакой общей связи между отношением двух значений R в эти два момента и их производными по времени в один или другой, или в оба эти момента времени. Даже в случае сжимающегося и расширяющегося сферического мира де Ситтера, для которого R (r) ^ ch г, не кажется, что есть какая-то простая связь со "скоростями" источника и наблюдателя. Интересно заметить, что зависимость изменения длины волны от изменения объема пространства в точности та же, что и в случае, хорошо знакомом из классического вывода закона смещения Вина. Когда вы имеете световое излучение любого типа, заключенное внутри идеально отражающей полости, и очень медленно ("адиабатически") меняете ее объем, например, медленно выводя (или вводя) идеально отражающий поршень, длина волны изменяется пропорционально кубическому корню из объема. Для этого 13* 195