Text
                    Е. И. Бутиков
Оптика
Учебное пособие для студентов
физических специальностей вузов
Издание 2-е, переработанное
и дополненное
НЕВСКИЙ
ДИАЛВСГ
Санкт- Петербург
2003


УДК 353 ББК 22.34 Б 93 Рецензенты: кафедра общей физики Московского физико-технического института (зав. кафедрой — проф. С. П. Капица); проф. В. А. Фабрикант Бутиков Е. И. Б 93 Оптика: Учебное пособие для студентов физических специальностей вузов. — 2-е изд., перераб. и доп. — СПб.: Невский Диалект; БХВ-Петербург, 2003. — 480 с: ил. Данная книга представляет собой переработанный вариант учебного пособия «Оптика», впервые выпущенного издательством «Высшая школа» в 1986 г. и допущенного Министерством высшего и сред- среднего специального образования СССР для обучения студентов физических специальностей вузов. Изложение учебного материала проводится на основе электромагнитной теории света с соблюдени- соблюдением требования единства теории и эксперимента. Наряду с традиционными вопросами оптики значительно строже и подробнее, чем обычно, рассматриваются статистические и когерентные свойства оптическо- оптического излучения, спектральное разложение, электронная теория дисперсии, оптические резонаторы, разре- разрешающая сила оптических и спектральных приборов, фотоэлектрические измерения, свойства лазерного излучения, основы нелинейной оптики. Пособие отражает связанные с появлением лазеров изменения во взглядах на преподавание оптики. Лазеры не только привели к возникновению новых современных на- научных направлений, таких как нелинейная оптика и голография, но и оказали большое влияние на многие классические разделы оптики. К каждому параграфу даны контрольные вопросы и задачи, составляющие органичную часть учеб- учебного пособия. Формулы, имеющие различный вид в системах единиц СГС и СИ, приведены в обеих системах. I8ВN 5-7940-0041-4 («Невский Диалект») © «Невский Диалект», 2003 I8ВN 5-94157-380-4 («БХВ-Петербург»)
Оглавление Предисловие 5 Введение 6 1. Электромагнитные волны в вакууме. Испускание волн. Квазимонохроматический свет 11 1.1. Плоские монохроматические электромагнитные волны в вакууме 12 1.2. Поляризация плоских монохроматических волн 19 1.3. Стоячие электромагнитные волны 25 1.4. Энергия электромагнитных волн 30 1.5. Испускание электромагнитных волн. Сферические волны 36 1.6. Спектральное разложение излучения 45 1.7. Квазимонохроматический свет 50 1.8. Спектральные линии. Поляризация квазимонохроматического света 54 1.9. Эффект Зеемана 61 1.10. Основы фотометрии 65 2. Распространение света в изотропных средах 71 2.1. Уравнения Максвелла для волн в веществе 72 2.2. Материальные уравнения. Плоские монохроматические волны в изотропной среде 75 2.3. Классическая электронная теория дисперсии 81 2.4. Дисперсия вдали от линии поглощения 85 2.5. Аномальная дисперсия 88 2.6. Дисперсия в металлах и плазме. Показатель преломления рентгеновских лучей 92 2.7. Дисперсия в ионных кристаллах. Ориентационная дисперсия 96 2.8. Поворот направления линейной поляризации в магнитном поле (эффект Фарадея) 99 2.9. Естественное вращение направления поляризации 105 2.10. Рассеяние света 112 2.11. Скорость света. Фазовая и групповая скорости 122 2.12. Излучение Вавилова—Черенкова 131 3. Отражение и преломление света на границе 134 3.1. Законы отражения и преломления света 135 3.2. Формулы Френеля 137 3.3. Полное отражение 146 3.4. Отражение света от поверхности металлов 153 3.5. Световое давление. Импульс электромагнитной волны 158 4. Распространение света в анизотропной среде 165 4.1. Двойное лучепреломление 166 4.2. Плоские монохроматические волны в анизотропной среде. Одноосные кристаллы 170 4.3. Преломление на границе анизотропной среды. Построение Гюйгенса 177 4.4. Поляризационные призмы и поляроиды 181 4.5. Искусственная анизотропия. Эффект Керра 184
Оглавление 5. Интерференция света 189 5.1. Интерференция монохроматического света 190 5.2. Интерференционные опыты по методу деления волнового фронта 194 5.3. Деление амплитуды. Локализация интерференционных полос 198 5.4. Интерференция квазимонохроматического света. Временная когерентность 205 5.5. Роль конечных размеров источника света. Пространственная когерентность 222 5.6. Двухлучевые интерферометры 234 5.7. Многолучевая интерференция 241 6. Дифракция света 252 6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 253 6.2. Дифракция Френеля на прямолинейном крае экрана 263 6.3. Дифракция Фраунгофера 270 6.4. Гауссовы пучки. Оптические резонаторы 283 6.5. Дифракционные решетки 290 6.6. Спектральные приборы 299 7. Геометрическая оптика и роль дифракции в оптических приборах 311 7.1. Основные положения геометрической оптики 312 7.2. Центрированные оптические системы 319 7.3. Ограничение световых пучков в оптических системах 329 7.4. Аберрации оптических систем 333 7.5. Яркость и освещенность оптических изображений 341 7.6. Разрешающая способность оптических инструментов 344 7.7. Физические принципы голографии 357 8. Оптика движущихся тел 368 8.1. Безуспешные поиски «светоносной среды» 369 8.2. Основные положения частной теории относительности 376 8.3. Теория относительности и оптика движущихся тел 380 8.4. Эффект Саньяка. Лазерный гироскоп 387 9. Термодинамика излучения. Световые кванты 391 9.1. Тепловое излучение в замкнутой полости. Черное тело 392 9.2. Спектральная плотность равновесного излучения. Формула Планка 399 9.3. Световые кванты. Спонтанное и вынужденное излучения 407 9.4. Лазеры 416 9.5. Фотоэлектрический эффект 427 9.6. Энергия и импульс фотона. Дуализм света 436 10. Основы нелинейной оптики 447 10.1. Некогерентные нелинейные эффекты 448 10.2. Материальные уравнения для нелинейных сред 450 10.3. Генерация второй гармоники 456 10.4. Параметрическое преобразование частоты 461 10.5. Вынужденное рассеяние Мандельштама—Бриллюэна 465 10.6. Вынужденное комбинационное рассеяние 470 Заключение 473 Алфавитный указатель 474
Предисловие В течение последних десятилетий одна из важнейших физических дисциплин — оптика — ра- радикально изменила свой облик. Эти изменения обусловлены созданием принципиально новых источников света (лазеров). Исключительные свойства лазерного излучения, коренным обра- образом отличающие его от некогерентного излучения традиционных источников света, привели к бурному развитию лазерной техники и широкому практическому применению лазеров. Бла- Благодаря когерентности излучения лазеров оказывается возможной исключительно высокая кон- концентрация световой энергии во времени (сверхкороткие световые импульсы), в пространстве (фокусировка излучения в малой области размером порядка длины световой волны), по на- направлению распространения (пучки с предельно малой угловой расходимостью), в спектре (узкие, почти монохроматические спектральные линии). Применение лазерного излучения стремительно расширяется и охватывает практически всю экспериментальную физику, как и многие области техники и технологии. Лазеры не только привели к возникновению новых научных направлений, таких как нелинейная опти- оптика и голография, но и оказали большое влияние на классические разделы оптики. В частности, произошло широкое внедрение в оптику общеволновых представлений, первоначально разра- разработанных в радиофизике. Изучение основ оптики представляет собой важную часть образова- образовательной программы для будущих физиков и инженеров независимо от их узкой специализации. Особенность данного учебного пособия заключается в том, что оно в значительной мере отражает изменения во взглядах на преподавание оптики, связанные с появлением и широким распространением лазеров. В то же время пособие закрепляет и развивает традиции препода- преподавания оптики как важного раздела курса общей физики, заложенные на физическом факультете Санкт-Петербургского университета несколькими поколениями замечательных ученых и педа- педагогов (Д. С. Рождественский, С.Э. Фриш, Л.Н. Курбатов, Н.И. Калитеевский). Содержание учебного пособия соответствует программе курса общей физики для физиче- физических специальностей вузов. От существующих пособий оно отличается тем, что в нем в срав- сравнительно небольшом объеме наряду с традиционными вопросами оптики значительно стро- строже и подробнее, чем это обычно принято, рассматриваются статистические и когерентные свойства оптического излучения, спектральное разложение, электронная теория дисперсии, оптические резонаторы, разрешающая сила оптических и спектральных приборов, фотоэлек- фотоэлектрические измерения, основы нелинейной оптики. Большое внимание уделяется свойствам лазерного излучения и применению лазеров в оптическом эксперименте. Изложение учебного материала проводится на основе электромагнитной теории света, с соблюдением требования единства теории и эксперимента, обязательного при изучении курса общей физики. Каждый параграф пособия снабжен контрольными вопросами, которые помогут студенту обратить внимание на главные положения изучаемой темы. Органическую часть учебного пособия составляют задачи, к ним даны решения, подробные указания или ответы. В настоящее время сложилась ситуация, когда в технической литературе используется в основном Международная система единиц (СИ), а в научной литературе предпочтение отда- отдается, как правило, гауссовой системе единиц (т. е. симметричной системе СГС). Поэтому для успешной работы с литературой специалисту и студенту необходимо владеть каждой из этих систем единиц. Чтобы облегчить использование данной книги читателю, привыкшему к опре- определенной системе единиц, формулы, имеющие различный вид в СИ и в СГС, приведены здесь параллельно в двух системах единиц. Эта особенность книги упростит также ее использование в справочных целях.
Введение Оптикой называют учение о физических явлениях, связанных с испусканием, рас- распространением и взаимодействием с веществом коротких электромагнитных волн, длина которых лежит в интервале 10~4— 10~9м. Большое значение этой области спектра электромагнитных волн для практической деятельности человека обуслов- обусловлено прежде всего тем, что внутри нее в узком интервале длин волн от 0,4 до 0,7 мкм лежит участок видимого света, непосредственно воспринимаемого человеческим гла- глазом. С точки зрения физики происходящих процессов выделение столь узкой спек- спектральной области не имеет особого смысла, поэтому в понятие оптического диапа- диапазона включают еще инфракрасное и ультрафиолетовое излучения. Но и для них при- принятые границы спектра в значительной степени условны. По существу они определя- определяются используемыми способами получения и регистрации электромагнитных волн. Электромагнитная теория света возникла в итоге длительного развития взглядов на природу света. Ей предшествовала волновая теория, в которой свет рассматривал- рассматривался как упругое возмущение, распространяющееся в гипотетической среде — эфире. В трудах Френеля и других выдающихся физиков XIX столетия эта теория была доведена до высокой степени совершенства, но в то же время в ней выявились труд- трудности принципиального характера. Неудовлетворительность старой волновой теории для объяснения наблюдаемых оптических явлений проявлялась в необходимости на- наделять эфир экзотическими и противоречивыми свойствами, не совместимыми с за- законами механики. В середине XIX столетия на основе экспериментальных открытий в области элек- электрических и магнитных явлений (связанных главным образом с исследованиями Фа- радея) Максвелл сформулировал систему уравнений электродинамики, подытожив все имеющиеся в этой области знания. Наиболее важным следствием уравнений Максвелла оказалась возможность существования электромагнитных волн, распро- распространяющихся в вакууме со скоростью, величина которой равна входящей в эти уравнения электродинамической постоянной с. Ее значение впервые было получено Кольраушем и Вебером в 1856 году на основе чисто электрических лабораторных измерений. Найденная таким образом скорость электромагнитных волн совпала со скоростью света в вакууме, измеренной к тому времени достаточно точно. Это совпа- совпадение и навело Максвелла на мысль, что свет представляет собой электромагнитные волны. Решение центральной для оптики проблемы природы света пришло в оптику в какой-то мере со стороны, как это часто бывает в истории науки. Электрические и магнитные явления изучались параллельно и независимо от оптических. Наиболее важные этапы развития физики — это периоды великих обобщений, когда неожидан- неожиданно выясняется, что казавшиеся не связанными явления имеют общую физическую основу и представляют собой всего лишь разные аспекты одного и того же физиче- физического явления. Таким образом, несмотря на очевидные различия в способах возбуждения и ре- регистрации электромагнитных волн разных диапазонов, все эти волны имеют единую природу и законы их распространения описываются одними и теми же дифференци- дифференциальными уравнениями — уравнениями Максвелла.
Введение 7 Дадим краткую качественную характеристику электромагнитных волн разных частотных диапазонов и способов их возбуждения и регистрации. Согласно классической электродинамике, электромагнитное излучение возникает при ускоренном движении электрических зарядов. Электромагнитные волны (за ис- исключением света) не наблюдались до 1887 года, когда Герцу удалось генерировать волны длиной от 10 до 100 м с помощью искрового разряда между заряженным и за- заземленным металлическими шарами. Основной недостаток такого излучателя — за- затухание колебаний и большая ширина спектра частот излучаемых волн. Современные методы, основанные на применении вакуумных электронных ламп и транзисторов, дают возможность генерировать монохроматические электромагнитные волны с час- частотами до 1013Гц. Эта область частот простирается от радиоволн до микроволн. Диапазон радиоволн используют для радиовещания (длинные, средние и короткие волны), телевидения, телекоммуникаций и космической связи (ультракороткие вол- волны), а микроволновый диапазон — для радиолокации и радиорелейных линий. Для возбуждения излучения с частотами выше границы микроволнового диапазона тра- традиционные электронные методы непригодны. В лабораторном эксперименте методы получения излучения оптического диапазона основаны на следующих физических явлениях: 1. Свечение раскаленных твердых или жидких тел (тепловое излучение), обеспе- обеспечивающее испускание сплошного спектра. Источники теплового излучения осо- особенно эффективны в ближней инфракрасной области. Электрическая дуга между угольными электродами и электрический разряд в лампах высокого давления дают сплошной спектр в видимой и ближней ультрафиолетовой областях. 2. Свечение возбужденных разреженных газов, вызванное квантовыми переходами внешних электронов в атомах и молекулах с высоких энергетических уровней на низкие. Это излучение имеет дискретный спектр, т.е. состоит из сравнительно узких спектральных линий. Ртутная дуга низкого давления — пример источни- источника линейчатого спектра, отдельные линии которого можно выделить с помощью фильтров. Широкое распространение в лабораторной практике получили безэлек- безэлектродные лампы, возбуждаемые СВЧ-разрядом. 3. Свечение различных тел под действием излучения (фотолюминесценция) или бом- бомбардировки электронным пучком (катодолюминесценция). Все перечисленные источники оптического излучения принципиально отличаются от источников радио- и СВЧ-диапазонов. Излучение волн радиодиапазона происходит при ускоренном движении электронов в антенне радиопередатчика. Все электроны в антенне движутся согласованно: они совершают вынужденные колебания в одина- одинаковой фазе. Так как эти колебания могут поддерживаться очень долго и с высоким постоянством частоты, то излучаемые при этом волны с большой степенью точ- точности можно считать монохроматическими (когерентными). В отличие от антенны, любой из упомянутых источников света — это скопление множества возбужденных или все время возбуждаемых атомов, излучающих волновые цуги конечной про- протяженности. Даже когда эти цуги можно характеризовать одной и той же длиной волны, соотношения фаз между цугами волн имеют совершенно случайный характер и непрерывно изменяются из-за независимого характера актов спонтанного испус- испускания света отдельными атомами. Излучение обычных источников света, таких как
8 Введение раскаленные тела, возбуждаемые электрическим разрядом газы и т. п., представляет собой наложение огромного числа не согласованных между собой цугов волн, т.е. фактически «световой шум» — беспорядочные, некогерентные колебания электро- электромагнитного поля. Чрезвычайно большие возможности открывает применение в оптических экспери- экспериментах принципиально новых источников света — лазеров (оптических квантовых генераторов). Благодаря использованию вынужденного излучения в таком источнике все возбужденные атомы испускают электромагнитные волны согласованно, подоб- подобно тому, как это происходит в антенне радиопередатчика. В результате образуется световая волна, близкая по своим свойствам к монохроматической, — когерентная электромагнитная волна. Особые свойства лазеров, заключающиеся в способности концентрировать энергию в спектре, во времени, в пространстве, по направлениям распространения, связаны с высокой когерентностью их излучения. Сам факт их су- существования заставляет по-иному подходить к изучению многих оптических явлений. Наиболее важные способы регистрации электромагнитных волн оптического диа- диапазона основаны на измерении переносимого волной потока энергии. Для этой цели используются фотоэлектрические явления (фотоэлементы, фотоумножители, электронно-оптические преобразователи, фоторезисторы и фотодиоды), фотохимиче- фотохимические явления (фотоэмульсии), фотолюминесценция (различные люминесцирующие экраны), термоэлектрические явления (термостолбики, болометры). Визуальный метод регистрации излучения основан на чувствительности человече- человеческого глаза к свету с длинами волн от 0,4 до 0,7 мкм. В пределах этого интервала чув- чувствительность глаза неодинакова. Закон ее изменения иллюстрирует так называемая кривая видности, приведенная на обложке (по оси ординат отложена относитель- относительная чувствительность глаза, т. е. величина, обратная мощности монохроматического излучения, вызывающей одинаковое зрительное ощущение). Чувствительность нор- нормального глаза достигает максимального значения в зеленой области спектра при Я « 555 нм. На видимую область спектра приходится значительная доля энергии излучения Солнца. В этом нет ничего удивительного, ибо особенности зрения обусловлены длительным приспособлением органов чувств к условиям, сложившимся на нашей планете, где самым важным источником света всегда было Солнце. Отметим, что вопрос о восприятии света глазом относится, строго говоря, к фи- физиологической оптике, которая не рассматривается в этой книге, содержащей изложе- изложение физической оптики. Впрочем, с восприятием света связано множество явлений, в которых тесно переплетаются и физические, и физиологические процессы. Напри- Например, в формировании изображений предметов, воспринимаемых глазом, важную роль играют физические процессы преломления света в хрусталике и стекловидном теле. А особенности восприятия цветов (например, исчезновение окраски предметов при слабом освещении, связанное с наличием двух сортов рецепторов в сетчатке гла- глаза, и различие спектральной чувствительности при ярком и сумеречном освещении) и движущихся объектов обусловлены характером переработки информации на пути к зрительным центрам головного мозга и относятся к области физиологии. Всем приемникам света присуща инерционность, характеризуемая некоторым вре- временем разрешения г. При визуальном наблюдении г « 0,1с. Колебания интенсив- интенсивности, происходящие за меньшие времена, глазом различить нельзя, и зрительное
Введение 9 ощущение определяется средней за время г интенсивностью. Поэтому мы не заме- замечаем быстрых (по сравнению с г) мельканий света от люминесцентных ламп (период мельканий Т = 0,01 с), от экрана телевизора или киноэкрана (Г = 0,02 с). В прием- приемниках света, использующих ячейки Керра в качестве затворов, время регистрации может быть доведено до 10~9 с. Наименее инерционные фотоэлектрические прием- приемники характеризуются временем разрешения порядка 10~10с. За пределами примыкающей к видимому свету со стороны высоких частот уль- ультрафиолетовой области начинается рентгеновское излучение, обладающее большой проникающей способностью. Различают непрерывный и линейчатый спектры рентге- рентгеновского излучения. Непрерывный спектр связан с излучением быстрого электрона при его торможении в теле антикатода. При увеличении ускоряющего напряжения V и, следовательно, кинетической энергии электронов {ту2/2 = е\]) коротковолновая граница тормозного излучения смещается (максимальная энергия излучаемых рент- рентгеновских квантов Нсо равна кинетической энергии еИ бомбардирующих электронов) и, кроме того, появляются узкие максимумы (характеристическое излучение). Длины волн этих дискретных линий зависят от того, какой химический элемент использован в качестве материала антикатода. Верхний предел частот электромагнитных волн, испускаемых атомными система- системами, — около 1020 Гц. Излучение более высоких частот (гамма-излучение) испуска- испускается возбужденными атомными ядрами и при превращениях элементарных частиц. Электромагнитные волны различных диапазонов получили разные названия и об- обнаруживают себя в совершенно несхожих физических явлениях. Однако все виды излучения имеют единую природу и отличаются друг от друга только своими часто- частотами и характерными длинами волн. Распространение всех видов излучения в ваку- вакууме подчиняется одним и тем же закономерностям. Распространение электромагнитных волн в веществе в тех случаях, когда длина волны велика по сравнению с межатомными расстояниями, можно рассматривать феноменологически без учета атомистического строения среды. Для этого уравне- уравнения Максвелла дополняются материальными уравнениями, в которых свойства среды учитываются введением соответствующих констант. Указанное условие выполняется для радиоволн и волн оптического диапазона. Поэтому электромагнитная теория све- света, основанная на макроскопической электродинамике Максвелла, объясняет в общих чертах все явления, связанные с распространением света. Однако она не способна описать процессы испускания и поглощения света, которые определяются более тон- тонкими особенностями взаимодействия вещества с электромагнитным полем. Вопрос об излучении и поглощении света атомами относится не к одной только оптике, так как в него входит и механика самого атома. Наблюдаемые при этом спектральные закономерности раскрывают как природу света, так и структуру атома. Естественное углубление феноменологической электромагнитной теории дает классическая электронная теория, рассматривающая движение дискретных электри- электрических зарядов в веществе и их взаимодействие с электромагнитным полем. Элек- Электронная теория вскрывает физическую сущность процессов, описываемых феноме- феноменологической теорией. Классическая электронная теория достигла больших успехов благодаря работам X. Лоренца и других ученых. Она не утратила своего значения и в настоящее время, так как дает правильное качественное объяснение обширно- обширному кругу электромагнитных и оптических явлений с помощью простых и наглядных
10 Введение моделей. Ограниченность классической электронной теории обусловлена лежащим в ее основе предположением, что поведение электронов в атомах описывается клас- классической механикой. Трудности этой теории привели к созданию квантовой теории, отражающей современные представления о строении вещества. Квантовая теория оказала сильное влияние и на представления о природе света. В этой теории свободное электромагнитное поле рассматривается как совокупность частиц, называемых фотонами или световыми квантами. Каждый фотон характери- характеризуется энергией с = На) и импульсом р = Нк. Такое описание поля заменяет класси- классическое описание с помощью напряженности электрического поля и индукции маг- магнитного поля. Классическая волновая картина получается как предельный случай квантовой, соответствующей большому числу фотонов в одном состоянии. На основе возникших в квантовой теории корпускулярных представлений удалось объяснить ряд явлений, связанных с превращением энергии света в энергию час- частиц и необъяснимых с помощью классической волновой теории. Это прежде всего фотоэффект и фотохимические процессы. Волновые и корпускулярные свойства света не могут быть одновременно логи- логически непротиворечиво объяснены классической физикой, ибо в ней понятия волны и частицы являются взаимоисключающими. Современная квантовая теория, постро- построенная с учетом возможной зависимости результатов измерений от условий и средств наблюдения физического явления, преодолевает логические трудности, связанные с корпускулярно-волновым дуализмом. Свет обладает потенциальной возможностью проявлять и волновые, и корпускулярные свойства, но в чистом виде они проявля- проявляются лишь в разных опытах при взаимоисключающих условиях. Эти свойства допол- дополняют друг друга, ибо только их совокупность дает полное представление о свете. Данная книга содержит описание как волновых, так и корпускулярных свойств света. Однако основное внимание уделено волновым свойствам. Обусловлено это тем, что большинство физических явлений, связанных с взаимодействием излуче- излучения и вещества, адекватно описывается так называемой полуклассической теорией. В этой теории поле оптического излучения рассматривается как классическое элек- электромагнитное поле, подчиняющееся уравнениям Максвелла, тогда как поведение ато- атомов вещества описывается квантовой механикой. Полуклассическая теория приводит к успеху при решении большинства задач оптики. Лишь в некоторых задачах, где необходим учет шумов (например, флуктуации лазерного излучения), нужно прини- принимать во внимание не только дискретность процессов поглощения и испускания света атомными системами, но и сам факт квантования поля излучения (т. е. нужно исполь- использовать квантовую электродинамику). Интересно отметить, что даже фотоэффект, при объяснении которого в физику впервые было введено понятие фотона, может быть полностью описан в рамках полуклассической теории.
Электромагнитные волны. Испускание волн. Квазимонохроматический свет Основные свойства электромагнитных волн (в частности, свето- световых волн), распространяющихся в пустом пространстве, можно изучить исходя из фундаментальных законов электромагнитного поля, выражаемых уравнениями Максвелла. Наибольшей простотой отличаются плоские монохроматиче- монохроматические волны. Более сложные волны (в частности, сферические и гауссовы) в малых областях пространства в значительной ме- мере неотличимы от плоских. Эти свойства заключаются в первую очередь в поперечности, поляризации и определенном соотно- соотношении между напряженностями электрического и магнитного полей. Иными соотношениями полей характеризуются стоячие вол- волны, образующиеся при наложении распространяющихся на- навстречу двух бегущих волн одинаковой частоты, амплитуды и поляризации. Испускание электромагнитных волн, согласно классической электродинамике, происходит при ускоренном движении элек- электрических зарядов. Представление о характере поля излучения реальных источников света можно получить, рассматривая сна- сначала простейшую модель источника света — осциллирующий электрический диполь. Свободные колебания заряженного ос- осциллятора затухают из-за излучения. Поэтому испускаемый им свет имеет вид цуга волн убывающей амплитуды и характери- характеризуется не одной частотой, а спектральным контуром конечной ширины. Дальнейшее развитие модели реального источника света, ког- когда он рассматривается как совокупность независимо излучаю- излучающих осцилляторов, позволяет рассмотреть статистические свой- свойства его излучения и получить представление о ширине и форме спектральных линий.
12 1. Электромагнитные волны в вакууме 1.1. Плоские монохроматические электромагнитные волны в вакууме Изучение свойств световых волн в вакууме целесообразно начать с простейшего в математическом отношении случая плоских монохроматических волн. Несмотря на ограниченную применимость такой идеализированной модели для описания реаль- реальных световых волн, она во многих случаях оказывается полезной. Для теоретическо- теоретического исследования свойств этих волн будем рассматривать их как одно из возможных решений уравнений Максвелла. Напомним кратко уравнения Максвелла и их физическое содержание. Электромагнитное поле в вакууме в каждой пространственной точке г в любой момент времени I определяется заданием двух векторов: напряженности электрического поля Е(г, с) и индукции магнитного поля В(г, г). Через векторы Е и В выражается сила Г, действующая в электромагнитном поле на пробный заряд ^, движущийся со скоростью V: СГС: Г = ^Е + ^- хВ; СИ: Г = ?Е + <?у х В. A.1) с Напряженность электрического поля Е(г, I) в принципе может быть найдена измерением силы Г, действующей на неподвижный пробный заряд. С магнитным полем В (г, г) связана та часть силы Г, которая появляется только при движении заряда (сила Лоренца). Источниками электромагнитного поля являются заряды и токи, для характеристики кото- которых служат объемная плотность заряда р и вектор плотности тока \. Связь электричес- электрического и магнитного полей с их источниками выражается следующими уравнениями: СГС: <ИуЕ = 4л/0, СИ: сИуЕ = ^-, A.2) 1 ЭЕ 4л. Здесь с « 3 • 108 м/с — электродинамическая постоянная, связанная с электрической и маг- магнитной постоянными соотношением с = 1/у/ёоЩ- Чтобы увидеть, какие экспериментальные законы электромагнетизма выражаются эти- этими уравнениями, перепишем их в интегральной форме. Проинтегрируем обе части уравне- уравнения A.2) по объему V, ограниченному замкнутой поверхностью 5, и преобразуем объем- объемный интеграл в левой части в поверхностный с помощью математической теоремы Остроградского—Гаусса. В результате получим СГС: фЕ№ = 4л I рйУ; СИ: (ЬЕ<\8= — [ рдУ A.4) 5 V ЗУ — поток напряженности электрического поля сквозь замкнутую поверхность 5 определяется полным зарядом, находящимся в ограниченном этой поверхностью объеме. Это закон Гаусса, эквивалентный в случае статического (т.е. создаваемого неподвижными зарядами) электри- электрического поля эмпирическому закону Кулона, описывающему взаимодействие неподвижных точечных зарядов. Для получения интегральной формы уравнения A.3) выберем замкнутый контур / и вы- вычислим поток левой и правой частей A.3) через произвольную (незамкнутую) поверхность 5, опирающуюся на контур /. Поток ротора В преобразуем с помощью математической теоремы
1.1. Плоские монохроматические волны 13 Стокса в циркуляцию вектора В по контуру /: у Ла§; СИ: с2 /вей = |- /ес!8 + ^- Лё8. 5 / 5 ° 5 СГС: /ва1=^~ /Её8+у Ла§; СИ: с2 /вей = |- /ес!8 + ^- Лё8. A.5) / 5 5 / 5 ° 5 Второе слагаемое в правой части A.5) выражает справедливую в случае постоянных полей теорему о «магнитном напряжении», согласно которой циркуляция вектора В по любому замкнутому контуру определяется полным током / через поверхность, опирающуюся на этот контур. Эту теорему можно рассматривать как следствие закона Био—Савара—Лапласа, опре- определяющего магнитное поле, которое создается элементом постоянного тока. Установленный Максвеллом первый член в правой части уравнения A.5) говорит о том, что изменяющееся электрическое поле ЗЕ/Зг (ток смещения), так же как и ток проводимо- проводимости }9 создает вихревое магнитное поле. Необходимость добавления члена с током смещения в случае переменных во времени полей видна из того, что только тогда уравнения A.2) и A.3) будут удовлетворять закону сохранения заряда. Чтобы показать это, возьмем дивергенцию от левой и правой частей уравнения A.3). Учитывая, что дивергенция ротора любого векторного поля тождественно равна нулю, и изменяя во втором члене порядок дифференцирования по времени и по координатам, получаем СГС: -1- сИу Е = 4л <Иу к СИ: -1- (Иу Е = — <Иу 1. A.6) Подставляя сюда сИуЕ из A.2), приходим к уравнению, связывающему изменение плотности заряда с плотностью тока и выражающему закон сохранения заряда: ^ 0. A.7) В интегральной форме это уравнение (уравнение непрерывности) V 5 говорит о том, что изменение полного заряда в некотором объеме V может быть обусловлено только переносом заряда (потоком вектора плотности тока) через замкнутую поверхность 5, ограничивающую этот объем. Вторая пара уравнений Максвелла СГС: сИуВ = 0, СИ: <ИуВ = 0, A.9) ±^ ^ A.10) ^=0; го*Е+^=0 о( 01 не содержит источников электромагнитного поля р и | Так же как и первая пара A.2) и A.3), это линейные дифференциальные уравнения первого порядка, но в отличие от неоднородных уравнений A.2) и A.3) эти уравнения однородны. Интегральная форма уравнения A.9) О A.11) 5 говорит о том, что поток индукции магнитного поля через любую замкнутую поверхность 5 равен нулю, т.е. линии индукции магнитного поля представляют собой замкнутые кривые. В интегральной форме уравнения A.10) : /ес!1 = -^ /вё8; СИ: /ес!1 =-^ / СГС: ф Е41 = -- х- / Вё8; СИ: ф Е6\ = ~ / Вс18 A.12)
14 1. Электромагнитные волны в вакууме можно узнать закон электромагнитной индукции, экспериментально открытый Фарадеем: ЭДС в замкнутом контуре / определяется скоростью изменения потока магнитной индукции через поверхность 5, ограниченную контуром /. Покажем, что из уравнений Максвелла A.2)—A.3), A.9)—A.10) следует возмож- возможность существования изменяющихся во времени и в пространстве и связанных между собой вихревых электрического и магнитного полей даже при отсутствии источни- источников, т. е. при /9 = 0 и ] = 0. Такие поля и представляют собой электромагнитные волны в вакууме. Запишем уравнения Максвелла, используя векторный дифференциальный опера- оператор «набла»: Дивергенция любого вектора а с помощью оператора V записывается как скалярное произведение У а, а ротор а — как векторное произведение Уха. Полагая в урав- уравнениях A.2) и A.3) р = 0 и } = 0, вместе с уравнениями A.9) и A.10) получаем следующую систему: СГС: УЕ = 0, СИ: У • Е = 0, A.14) УВ = 0, УВ = 0, A.16) Чтобы увидеть, что эта система уравнений имеет решения в виде волн, получим из уравнений A.15) и A.17), включающих в себя как напряженность электрического поля, так и индукцию магнитного поля, новые уравнения, содержащие только одно из этих полей (например, Е). Для этого составим векторное произведение оператора У на обе части уравнения A.17): 1 гЖ У х (У х Е) = — У х —. A.18) Преобразуем левую часть A.18), раскрывая двойное векторное произведение по формуле *) А х (В х С) = В(А • С) - (А • В)С. В получившемся выражении У х (У х Е) = У (У • Е) — У2Е первый член равен нулю, так как напряженность электрического поля Е удовлетворяет уравнению A.14). В результате уравне- уравнение A.18) принимает вид СГС: У2Е=-Ух^; СИ: У2Е = У х ?5 A.19) С д( 01 *] При применении этой формулы к выражениям, содержащим операторный множитель V, нужно заботиться, чтобы он оставался впереди тех множителей, на которые он действует в исходном выражении.
1.1. Плоские монохроматические волны 15 Чтобы выразить V х ЭВ/Э* через напряженность электрического поля Е с помо- помощью A.15), продифференцируем обе части A.15) по времени и изменим в левой части порядок дифференцирования по координатам и времени: „ ЭВ 1 Э2Е Подставляя отсюда V х ЗВ/Зг в правую часть уравнения A.19), получаем, что на- напряженность электрического поля Е удовлетворяет волновому уравнению: Аналогично можно показать, что точно такому же уравнению удовлетворяет и ин- индукция В магнитного поля: 1 у2в-^2 Уравнение A.20) имеет решения в виде бегущих волн, распространяющихся со ско- скоростью с. Например, если все компоненты векторов Е и В зависят только от одной пространственной координаты г (плоская волна), то решением уравнения Э2Е 1 32Е дг2 с2 Ы2 ~ будет любая функция единственного аргумента 1±г/с9 т.е. Е(г,0 = Е(г ±г/с). В этом легко убедиться непосредственной подстановкой. Знак «—» в 1±г/с соответствует волне, распространяющейся в положительном направлении оси г, знак «-Ь» — в отрицательном. Отметим, что любое решение системы уравнений Максвелла A.14)—A.17) обязательно удовлетворяет волновым уравнениям A.20), A.21), но обратное утверждение неверно: не вся- всякое решение этих волновых уравнений дает электромагнитное поле, которое может сущест- существовать на самом деле, т.е. удовлетворяет уравнениям Максвелла. Поясним это на простом примере. Волновое уравнение всегда имеет тривиальное нулевое решение. Поэтому совокуп- совокупность волновых уравнений A.20), A.21) для напряженности электрического поля Е и индук- индукции магнитного поля В допускает, например, решение в виде бегущей волны электрического поля при полном отсутствии магнитного поля. Уравнения Максвелла такого решения не до- допускают. Исследуем на основе уравнений Максвелла свойства бегущих плоских монохро- монохроматических электромагнитных волн. В таких волнах зависимость всех компонент векторов Е и В от координат и времени имеет один и тот же вид и выражается гармонической функцией Е(г, г) = Е0со$(кг-(О( + <р). A.22) Под Е(г,г) здесь можно понимать любую из проекций векторов Е и В. Амплиту- Амплитуда Е$ и начальная фаза д> плоской монохроматической волны не зависят от г и г, т. е.
16 1. Электромагнитные волны в вакууме одинаковы во всем пространстве во все моменты времени («однородная волна»).*) Никакие реальные волны этим свойством не обладают, поэтому плоская монохрома- монохроматическая волна представляет собой идеализацию, применимость которой к описанию реального волнового процесса зависит не столько от рассматриваемого процесса, сколько от характера решаемой задачи. Условия применимости этой идеализации в каждом конкретном случае требуют специального рассмотрения. Сейчас же необ- необходимо заметить, что изучение свойств плоской монохроматической волны важно еще и потому, что любая электромагнитная волна может быть представлена в ви- виде суперпозиции таких простых волн (благодаря линейности уравнений Максвелла сумма любых решений также является решением). Аргумент косинуса в A.22) называется фазой волны. Уравнение поверхности по- постоянной фазы (или волновой поверхности) кг — ш = СОП81 определяет в пространстве плоскость, перпендикулярную вектору к (называемому волновым вектором). Эта плоскость перемещается в пространстве вдоль направле- направления волнового вектора к со скоростью V = р A.23) где к — модуль волнового вектора, называемый волновым числом. Скорость пере- перемещения поверхности постоянной фазы в пространстве называется фазовой скорос- скоростью волны. Период изменения напряженности поля в пространстве — это длина волны Я: Л==2я 2я=1;Г, A24) к со т. е. длина волны представляет собой то расстояние, на которое перемещается плос- плоскость постоянной фазы за время, равное одному периоду колебаний Т = 2л/со. В дальнейшем для зависимости напряженности поля в волне от координат и вре- времени вместо A.22) удобно использовать комплексную запись Е(г, 0 = Ке [Ео ехр(/<р) ехр /(кг - ш)]. Амплитуду Ео вместе с комплексным множителем ехр(/<р) будем в дальнейшем рас- рассматривать как одно комплексное число Ео = |Ео|ехр(/<р). Его модуль равен ампли- амплитуде, а аргумент — начальной фазе колебаний в точке г = 0. Знак «Ке» при записи будем опускать, не забывая, однако, о том, что физический смысл имеет лишь веще- вещественная часть используемых комплексных выражений: г~^). A.25) ф) Плоскую монохроматическую волну A.22) можно рассматривать как частный случай гармонических волн общего вида где Ео(г) и #(г) зависят от положения г рассматриваемой точки. Поверхности постоянной фазы такой волны, вообще говоря, не совпадают с поверхностями постоянной амплитуды. В таком случае говорят, что волна неоднородна.
1.1. Плоские монохроматические волны 17 Комплексная запись особенно удобна потому, что при ее использовании диффе- дифференцирование напряженности поля по времени Э/Эг сводится, как видно из A.25), просто к умножению на —1со. Стоящее в показателе экспоненты в A.25) скаляр- скалярное произведение кг можно записать в виде кхх + куу + кг1, поэтому дифферен- дифференцирование Е(г, /) по координате х сводится к умножению Е(г, I) на гкх. Так как оператор V означает дифференцирование по координатам, то его применение к на- напряженности поля сводится к умножению ее на вектор /к. Поэтому для плоской монохроматической волны, у которой напряженность Е(г, I) электрического поля и индукция В(г, I) магнитного поля записаны в комплексной форме A.25), уравне- уравнения Максвелла A.14)—A.17) принимают следующий вид: СГС: кЕ = 0, СИ: к-Е = 0, A.26) к х В = -- Е, ЛхВ = -соЕ, A.27) к-В = 0, к-В = 0, A.28) к х Е = - В; к х Е = соВ. A.29) с Из этих формул сразу следует свойство поперечности однородных плоских элек- электромагнитных волн: из уравнений A.26) и A.28) видно, что векторы Е и В перпенди- перпендикулярны направлению волны (вектору к), а из уравнений A.27) и A.29) — что век- векторы Е и В ортогональны друг другу и образуют вместе с вектором к правую тройку векторов (рис. 1.1). Уравнения A.26) и A.28) — скалярные, а A.27) и A.29) — векторные, т.е. каждое из них эквивалентно 1 В трем скалярным. Но в случае монохроматических полей (когда все величины зависят от времени как ехр(—Шг)) из этих восьми уравнений Максвелла (два векторных и два скалярных) независимы только шесть: уравне- уравнение A.26) является следствием A.27), а A.28) — след- следствием A.29). В самом деле, подставляя Е из A.27) Рис.1.1.Взаишюерасположе- ,л ~г\ ¦ /1 «\ л т, ние векторов Е, В и к в бегу- в A.26), получаем тождество к • (к х В) = 0. Точно так щей эле1С^Омашитной волне же при подстановке В из A.29) в A.28) приходим к тож- тождеству к • (к х Е) = 0. Для определения фазовой скорости монохроматических волн V = со/к (см. фор- формулу A.23)) нужно найти связь между частотой со и модулем волнового вектора к (волновым числом). Подставим В из уравнения A.29) в уравнение A.27): с\ х (к х Е) = -со2Е. Раскрывая двойное векторное произведение в левой части и учитывая, что, соглас- согласно A.26), к • Е = 0, получаем условие *2 = ^-, A.30) при выполнении которого уравнения A.26)—A.29) имеют нетривиальное (нену- (ненулевое) решение. Это значит, что фазовая скорость г; = со/к для однородных
18 1. Электромагнитные волны в вакууме монохроматических волн в вакууме равна входящей в уравнения Максвелла элек- электродинамической постоянной с. Современное значение с = 2,99792458 • 108 м/с. В п. 2.11 рассмотрены оптические методы определения этой важнейшей константы. Подчеркнем, что скорость электромагнитных волн в вакууме не зависит от их частоты. Из уравнений Максвелла следует, что в электромагнитной волне модули векто- векторов Е и В связаны между собой. Подставляя к из A.30) в уравнение A.27) или в A.29), находим соотношение между Е и В: СГС: Е=В; СИ: Е = сВ. A.31) Отметим, что это соотношение, как и показанная на рис. 1.1 связь между направ- направлениями Е и В, выполняется в любой точке в каждый момент времени. Проведенное выше рассмотрение свойств бегущих плоских монохроматических волн относилось к определенной инерциальной системе отсчета. Если ту же самую электромагнитную волну в вакууме рассматривать в другой инерциальной системе отсчета, то значения векторов Е и В в одной и той же мировой точке (г, с1) будут иными. При переходе к другой системе отсчета изменятся также частота волны со (эффект Доплера) и направление волнового вектора к (аберрация света). Но все от- отмеченные выше свойства волны остаются справедливыми и в новой системе отсчета. В самом деле, фазовая скорость волны V = со /к в соответствии с A.30) равна универ- универсальной постоянной с. Это значит, что скорость электромагнитной волны в вакууме остается неизменной при переходе к другой системе отсчета. Свойство перпендику- перпендикулярности векторов Е и В в бегущей плоской волне сохраняется при переходе в дру- другую систему отсчета, так как скалярное произведение Е • В является инвариантом преобразований Лоренца. В равной мере и соотношение A.31) между величинами Е и В остается в силе, поскольку величина Е2—В2 (СГС) или Е2—с2В2 (СИ) также представляет собой инвариант преобразований Лоренца. Здесь мы рассмотрели простейшее решение уравнений Максвелла в пустоте — бегущую плоскую монохроматическую волну. В дальнейшем будут рассмотрены и другие решения. Сферические монохроматические волны, у которых поверхнос- поверхности постоянной фазы представляют собой концентрические сферы, изучаются в п. 1.5. В отличие от плоской волны, амплитуда которой всюду одинакова, амплитуда сфе- сферической волны обратно пропорциональна расстоянию до центра волны. Другой важный частный случай — гауссовы волны (или гауссовы пучки, см. п. 6.4), в которых распределение амплитуды по волновой поверхности описы- описывается функцией Гаусса и имеет конечную ширину. Гауссовы волны могут служить математической моделью излучения газовых лазеров. Небольшой участок сферической волны вдали от ее центра можно приближен- приближенно рассматривать как плоскую волну (размеры этого участка должны быть малы по сравнению с расстоянием до центра). Поэтому рассмотренные здесь свойства плоских волн (фазовая скорость, поперечность, соотношение между Е и В) локаль- локально (т.е. в каждой точке) справедливы и для сферических волн. То же относится и к небольшим (по сравнению с шириной поперечного распределения амплитуды) участкам гауссовых волн. Подчеркнем, что упомянутые свойства характерны только для бегущих волн. Стоячие волны (см. п. 1.3) обладают существенно иными свой- свойствами.
1.2. Поляризация плоских волн 19 Контрольные вопросы • Какие экспериментальные законы электромагнетизма содержатся в каждом из уравнений Максвелла? • Какой физический смысл имеет член с дЕ/д( в уравнении Максвелла A.3)? • Эквивалентны ли волновые уравнения A.20) и A.21) системе уравнений Максвел- Максвелла A.14) — A.17), из которой они выведены? • Что такое однородная плоская волна? • В чем заключается свойство поперечности однородных плоских волн? • Как из уравнений Максвелла найти фазовую скорость монохроматических электромагнит- электромагнитных волн в вакууме? Задачи 1. Покажите, исходя из уравнений Максвелла A.14)—A.17), что индукция В магнитного поля удовлетворяет волновому уравнению A.21). 2. Покажите, что выражение A.22) описывает монохроматическую волну, поверхности посто- постоянной фазы которой представляют собой плоскости, перпендикулярные вектору к и пере- перемещающиеся вдоль к со скоростью V — ы/к. 1.2. Поляризация плоских монохроматических волн Выше на основе уравнений Максвелла было показано, что в бегущей плоской элек- электромагнитной волне векторы Е и В в каждой точке и в каждый момент времени образуют с волновым вектором к правую тройку векторов (см. рис. 1.1). В этом заключается свойство поперечности электромагнитных волн. Выберем ось г системы координат вдоль волнового вектора к. Тогда у векторов Е и В могут быть отличны от нуля только проекции на оси х и у. Уравнения Максвелла допускают, в частности, такое решение, когда у вектора Е во всех точках и во все моменты времени отлична от нуля только одна проекция, например Ех(г, (). Вслед- Вследствие упомянутого выше свойства поперечности у вектора В отлична от нуля только проекция на ось у9 т.е. Ву(г,г). Эти проекции связаны между собой соотношени- соотношением A.31). Мгновенный «снимок» такой волны, показывающий векторы Е и В в раз- разных точках оси г в один момент времени, приведен на рис. 1.2, а. Вдоль любой дру- другой прямой, параллельной оси г, картина векторов Е и В имеет точно такой же вид. В этом случае в каждый момент времени во всех точках любой плоскости г — сопз*, перпендикулярной направлению распространения волны, вектор Е (как и вектор В) имеет одно и то же значение. Поэтому говорят, что такая волна имеет плоскую (или линейную) поляризацию. Плоскость, в которой лежат вектор напряженности элек- электрического поля волны и волновой вектор к, называют плоскостью поляризации или плоскостью колебаний*^ Чтобы представить себе изменение электрического "^ Такая терминология не вполне общепринята. В некоторых книгах (особенно старых) плоскостью поляризации называют плоскость, содержащую магнитный вектор В.
20 1. Электромагнитные волны в вакууме и магнитного полей с течением времени, можно считать, что вся система векторов на рис. 1.2, а движется как целое вдоль оси г со скоростью с. На рис. 1.2,6 электри- электрическое поле такой линейно поляризованной плоской волны для некоторого момента времени изображено с помощью силовых линий. Напомним, что на таких изобра- изображениях стрелки характеризуют направление вектора Е, а густота силовых линий — величину напряженности электрического поля. б) 2 Рис. 1.2. Векторы Е и В в монохроматической плоской волне в разных точках оси 2 в один момент времени (а) и соответствующая картина силовых линий электрического поля (б). Густота линий пропорциональна напряженности поля Линейную поляризацию электромагнитных волн легко продемонстрировать простыми опы- опытами в микроволновом диапазоне. Источник (клистронный генератор) через волновод пря- прямоугольного сечения с присоединенным к нему пирамидальным рупором (рис. 1.3) излучает элек- электромагнитную волну линейной поляризации. При- Приемник состоит из такого же рупора и волновода, внутри которого перпендикулярно продольной оси помещен линейный вибратор с кристаллическим детектором. Снимаемый с детектора сигнал усили- усиливается и регистрируется осциллографом. При оди- одинаковой ориентации рупоров излучателя и прием- приемника регистрируемый сигнал максимален. При по- повороте приемника (или излучателя) на некоторый угол вокруг продольной оси сигнал уменьшается и исчезает совсем, когда этот угол достигает 90°. Детектор воспринимает только такие колебания, при которых вектор Е имеет составляющую вдоль оси вибратора. Поэтому исчезновение сигнала при повороте приемника свидетельствует о ли- линейной поляризации регистрируемой волны. Излучение обычных источников света не поляризовано. Это так называемый есте- естественный свет, в котором вектор Е, будучи ортогональным направлению рас- распространения (свойство поперечности), не сохраняет определенного направления в плоскости, перпендикулярной направлению распространения. В естественном свете Рис. 1.3. Демонстрация поляризации электромагнитных волн в СВЧ-диапазоне
1.2. Поляризация плоских волн 21 а) в равной мере представлены все направления колебаний вектора Е в этой плос- плоскости. Физические процессы в источниках, приводящие к испусканию естествен- естественного света, рассмотрены в п. 1.8. В лабораторных условиях линейно поляризован- поляризованный свет получают, пропуская естественный через оптические поляризаторы. Су- Существует много типов таких устройств. Их дей- действие основано на различных физических прин- принципах. Некоторые типы поляризаторов описаны ниже (см. пп. 3.2, 4.4). С их помощью можно не только получить линейно поляризованный свет, но и выяснить, имеет ли исследуемое излуче- излучение линейную поляризацию. Выполняющее та- такую роль поляризационное устройство называ- называют анализатором. Интенсивность пропускаемо- пропускаемого через анализатор линейно поляризованного света при повороте анализатора изменяется от максимального значения, когда направление по- поляризации совпадает с направлением пропуска- пропускания анализатора, до нуля, когда эти направления перпендикулярны. Схема таких опытов показа- показана на рис. 1.4. Если свет не обладает линейной поляризацией, то при пропускании через анали- анализатор А его интенсивность не обращается в нуль ни при какой ориентации анализатора. В отличие от обычных источников света из- излучение газового лазера, окна разрядной трубки которого наклонены на определенный угол к ее оптической оси (угол Брюстера, см. п. 3.2), обладает линейной поляризацией. Это можно продемонстрировать, про- пропуская излучение лазера через анализатор. При соответствующей ориентации анали- анализатора наблюдается полное гашение проходящего излучения. В рассмотренном примере линейно поляризованной волны предполагалось, что вектор Е во всех точках направлен параллельно или антипараллельно оси х (см. рис. 1.2). Однако в пустом пространстве все направления в плоскости ху, пер- перпендикулярной направлению распространения волны, эквивалентны. Поэтому век- вектор Е может иметь любое направление в этой плоскости. Пусть наряду с волной, поляризованной вдоль оси х9 в том же направлении распространяется другая волна той же частоты со, но поляризованная вдоль оси у. Вследствие линейности уравне- уравнений Максвелла такое наложение (или суперпозиция) волн также является решением. В зависимости от разности фаз складываемых линейно поляризованных волн резуль- результирующая волна может иметь различную поляризацию. Рассмотрим электрическое поле Е(г,0 волны, возникающей при сложении двух волн одинаковой частоты с ортогональными направлениями линейной поляризации: Рис. 1.4. Схема опыта для наблюдения поляризации света Ех(г9 г) = ЕОх е<( Еу(г9 0 = ЕОу е1' A.32)
22 1. Электромагнитные волны в вакууме При одинаковых (или отличающихся на ля, где п — целое число) фазах ф1 и ср2 комплексных амплитуд Е$х и Е$у в каждой точке происходит сложение синфазных взаимно перпендикулярных колебаний, что дает колебание в некотором новом на- направлении в плоскости ху. Результирующая волна будет линейно поляризованной. Направление ее поляризации зависит от отношения амплитуд а и Ь. Различные слу- случаи сложения ортогональных синфазных колебаний представлены на рис. 1.5. У ъ -ъ а- X =0 У ъ  7: . а х Ь=2а,д>1=<р2 У ь / Ь=а, А. а х У -а а х У \ Ь=2а,ц Ь а \| х Рис. 1.5. Сложение двух поляризованных волн с ортогональными направлениями поляризации. При синфазных и противофазных складываемых колебаниях результирующая волна имеет линейную поляризацию Пусть теперь волна, поляризованная вдоль оси у, отстает по фазе на я/2 от волны, поляризованной вдоль оси х, т.е. срх — ср2 = я/2. Если амплитуды этих волн одинако- одинаковы (а = Ь)9 то вектор Е в любой точке 1 будет равномерно вращаться в плоскости ху против часовой стрелки с угловой скоростью со, оставаясь неизменным по модулю. Например, в точке г = 0 Ех(/) = а со$(оI + (/>!), Еу (г) = а со$(сог + срх - я/2) = а $т(со1 + срх). A.33) Такую волну называют поляризованной по кругу или циркулирую поляризованной. Когда при наблюдении навстречу волне вращение вектора Е в фиксированной плос- плоскости происходит, как в рассмотренном примере A.33), против часовой стрелки, го- говорят о волне левой круговой поляризации.*) Попытаемся представить себе электрическое поле такой волны в разных точках оси ч в один и тот же момент времени. В точке г > 0 в некоторый момент г вектор Е такой же, каким он был в точке г =0в более ранний момент г — г/с. Поэтому кон- концы векторов Е для разных значений г лежат на винтовой линии (рис. 1.6, а), причем для левой круговой поляризации эта линия соответствует винту с «левой» нарезкой. Чтобы с помощью рис. 1.6, а получить представление об изменении напряженности поля с течением времени, можно считать, что весь этот «винт», оставаясь на месте, вращается как целое вокруг оси г с угловой скоростью со либо что он перемещается поступательно (без вращения) вдоль оси г со скоростью с. Эти представления экви- эквивалентны и для фиксированной точки оси г дают равномерное вращение вектора Е против часовой стрелки. Все сказанное о поведении вектора Е в волне круговой поляризации можно от- отнести и к вектору В. В самом деле, в бегущей электромагнитной волне векторы Е и В лежат в плоскости, перпендикулярной направлению распространения; в любой *) В некоторых книгах встречаются противоположные определения, поэтому следует относиться с осто- осторожностью к терминам «левая» и «правая» поляризация.
1.2. Поляризация плоских волн 23 момент и в любой точке они перпендикулярны друг другу, а их модули связаны соотношением A.31). Правая круговая поляризация соответствует вращению вектора в фиксированной плоскости г = сопз* в направлении по часовой стрелке: Еу{г) = а со§(&>/ + <Р1 + я/2) = —а $т(со1 + щ), A.34) т.е. Еу{г) опережает по фазе волну Ех(г) на л/2. «Мгновенный снимок» для такой волны (рис. 1.6,6) отличается от изображенного на рис. 1.6, а тем, что концы векто- векторов Е лежат на винтовой линии с «правой» нарезкой. а) б) Рис. 1.6. Вектор Е в разных точках оси г для волны с левой (а) и правой {б) круговой поляризацией На практике для превращения линейно поляризованного света в свет круговой поляризации используют анизотропные кристаллические пластинки, в которых две волны с ортогональными направлениями линейной поляризации имеют различные фазовые скорости. Подбором толщины пластинки можно получить на выходе за- заданную разность фаз этих волн и тем самым требуемое состояние поляризации. Подробнее такие устройства рассмотрены в п. 4.1. Для получения света круговой по- поляризации можно использовать также явление полного отражения света на границе прозрачных сред (см. п. 3.3), при котором возникает разность фаз отраженных волн с ортогональными направлениями линейной поляризации. Подведем некоторые итоги. При использовании комплексной записи A.32) для скла- складываемых волн с ортогональными направлениями линейной поляризации результиру- результирующая волна имеет линейную поляризацию, если отношение комплексных амплитуд
24 1. Электромагнитные волны в вакууме у выражается вещественным числом. Направление поляризации составляет с осью х угол х — такой, что Щх — Еоу/Е$х (см- Рис- 1-5). Результирующая волна имеет круговую поляризацию, если отношение ком- комплексных амплитуд Е()у/Еох дается мнимым числом, по модулю равным единице. При Ецу/Е^х = ехр(—/я/2) = —/ будет волна правой круговой поляризации, при Еоу/Еох = / — левой. В общем случае при произвольном значении комплексных амплитуд Е$х и Е$у в A.32) в каждой точке пространства вектор напряженности электрического поля монохроматической волны вращается в плоскости г = соп§1, перпендикулярной на- направлению распространения волны, одновременно изменяясь периодически по мо- модулю, так что конец его описывает эллипс в плоскости г = сопз*. Ориентация осей и эксцентриситет этого эллипса определяются отношением амплитуд а/Ъ и разно- разностью фаз 8 = ц>2 — Ц>\ складываемых волн (см. задачу 2). В таком случае говорят, что волна имеет эллиптическую поляризацию. Это наиболее общий вид поляриза- поляризации монохроматической волны, переходящий в частных случаях в линейную и круго- круговую поляризации. Картины поляризации при одинаковых амплитудах и разных фазах складываемых взаимно перпендикулярных колебаний показаны на рис. 1.7. 5=0 0<5<я/2 8=п12 Ъ<8<п12 Я=я ж<8<Ъж12 8=Ъя12 Ъж12<8<2ж 8=2л Рис. 1.7. Сложение взаимно перпендикулярных колебаний одинаковой амплитуды при разных фазах Волну с произвольной (в общем случае эллиптической) поляризацией всегда мож- можно разложить либо на сумму двух линейно поляризованных волн с ортогональными направлениями поляризации, либо на сумму двух поляризованных по кругу волн с правой и левой поляризациями. В зависимости от характера решаемой задачи мо- может оказаться предпочтительным или первое, или второе представление. В дальней- дальнейшем мы встретимся с примерами использования каждого из этих базисов. Так, при изучении распространения света в анизотропных средах (кристаллах) удобно разло- разложить падающую волну на сумму двух линейно поляризованных волн, а при изучении естественного (см. п. 2.9) и магнитного (см. п. 2.8) вращений плоскости поляризации в веществе удобно использовать разложение на две волны с круговой поляризацией. Контрольные вопросы • В каком случае говорят, что волна имеет линейную поляризацию? • Как на опыте можно определить, имеет ли исследуемый свет линейную поляризацию? • Что такое правая круговая поляризация? • Как зависит мгновенное значение вектора напряженности электрического поля Е(г,0 от координаты г в волне с правой круговой поляризацией? Ответьте на тот же вопрос для вектора магнитного поля В (г, ().
1.3. Стоячие электромагнитные волны 25 Каким условиям должны удовлетворять две линейно поляризованные волны, распростра- распространяющиеся в одном направлении, чтобы при их сложении получалась волна левой круговой поляризации? Задачи 1. Покажите, что линейно поляризованную волну с произвольным направлением поляризации можно представить как суперпозицию двух распространяющихся в том же направлении волн правой и левой круговой поляризации. Как связаны амплитуды этих волн с амплитудой исходной волны? 2. При сложении двух линейно поляризованных волн A.32) в общем случае возникает волна эллиптической поляризации. Для результирующей волны выразите большую и малую полу- полуоси ах и а 2 эллипса поляризации и угол 0, определяющий его ориентацию (рис. 1.8), через амплитуды а, Ь и разность фаз 8 = ф2 — Ф\ складываемых волн. Ответ. Полуоси ах иа2 эллипса колебаний связаны с ам- амплитудами а и Ь соотношением а\ + а\ = а2 +Ъ2. Форма эллипса колебаний характеризуется вспомогательным уг- углом \р, тангенс которого дает отношение полуосей эллипса: щ-ф = а^ау Для нахождения гр имеем соотношение 8111 2ф = (8Ш 2а) 8Ш 5, Рис. 1.8. Эллипс, описываемый где Ща = Ь/а. Угол 0, характеризующий ориентацию эл- концом вектора Е эллипти- липса колебаний, находится из соотношения чески поляризованной волны 12 20 = (Х%2а)со$8. в фиксированной точке оси г 3. Дайте характеристику эллипса колебаний магнитного вектора В для волны с эллиптической поляризацией. Сравните с эллипсом колебаний вектора Е. 1.3. Стоячие электромагнитные волны В изученных выше бегущих электромагнитных волнах электрическое и магнитное поля направлены перпендикулярно друг другу и в каждой пространственной точке из- изменяются с течением времени совершенно одинаково (например, в монохроматиче- монохроматической волне они совершают гармоническое колебание в одинаковой фазе). Однако это свойство электромагнитных волн не универсально. Существенно иными свойствами обладают стоячие волны. Они образуются, в частности, в резонаторах оптических квантовых генераторов (лазеров). Для таких волн характерны пространственное раз- разнесение и сдвиг во времени колебаний электрического и магнитного полей. Стоячие волны возникают при наложении двух распространяющихся навстречу бегущих монохроматических волн одинаковой частоты, амплитуды и поляризации.*) Такая картина получается, в частности, при полном отражении волны от границы раздела двух сред. Условия, при которых отражение будет действительно полным, т. е. *) Это частный случай интерференции, другие многообразные проявления которой подробно рассмат- рассматриваются в гл. 5.
26 1. Электромагнитные волны в вакууме отраженная волна будет иметь такую же амплитуду, как и падающая, обсуждаются в пп. 3.3 и 5.7. Рассмотрим структуру электромагнитного поля стоячей волны, созданной нало- наложением встречных линейно поляризованных плоских волн. Выберем ось г в направ- направлении распространения одной из волн, а ось х — в направлении поляризации. Нача- Начало отсчета расстояний вдоль оси г выберем в точке, где колебания напряженности электрического поля обеих волн происходят в одинаковой фазе, а начало отсчета времени — в тот момент, когда эти напряженности в начале координат достигают максимума. При этом формулы для Е\(г9 г) и В\(г9 *) принимают особенно простой вид: A.35) Эта волна распространяется в положительном направлении оси г. Для волны, рас- распространяющейся навстречу, проекция вектора к на ось г имеет противоположный знак: A.36) Здесь учтено также, что векторы Е, В и к в каждой из волн в соответствии с рис. 1.1 должны образовывать правую тройку векторов (рис. 1.9). Теперь из A.35) и A.36) легко найти результирующее электромагнитное поле Е = Е] + Е2, В = В] + В2: Е = BЕ0е~ш соькг, О, 0), В = @, 21В0е~ш ьткг, 0), или, в вещественном виде, Е = BЕ0 соз ш соз кг, 0, 0), A.37) В = @, 2Е0 81П6Я 8111 *г, 0). Из этих формул видно, что вектор напряженности электрического поля результи- результирующей волны в каждой точке совершает гармоническое колебание в направлении оси х с частотой со, причем амплитуда этих коле- колебаний изменяется вдоль оси г от максимального значения 2Е$ в плоскостях г = (л/к) п = (Х/2)п (п = О, ±1, ±2,...), называемых пучностями О)—у!1 *- электрического поля, до нуля в плоскостях г = (л/к)(п + 1/2) = (Л/2)(л + 1/2) (п = 0, ±1, ±2,...), называемых узлами. Фаза колебаний Е Рис. 1.9. Взаимная ориентация векто- во всех точках между соседними узлами одинако- ров Е, В и к в распространяющихся _ у ^ навстречу электромагнитных волнах ва> а колебания по разные стороны узла происхо- линейной поляризации Дят в противофазе. • Е, о?
1.3. Стоячие электромагнитные волны 27 Я/2 Рис. 1.10. Стоячая волна в натянутом шнуре Здесь уместно вспомнить картину смещений в стоячей волне, возбуждаемой в закрепленном на концах натянутом шнуре (рис. 1.10). Такую стоячую волну можно рассматривать как некоторую моду колебаний (т.е. одно из так называемых нор- нормальных колебаний) распределенной механической системы с бесконечным числом степеней свободы. Напомним, что при нормальном колебании в системе все ее элементы совершают чисто гармоническое движение с одной и той же характерной для данной моды частотой соп и с определенным соотношением амплитуд. Частбты нормальных мод закрепленного на концах шнура (или струны) образуют дискретный спектр и могут быть найдены из условия, что на длине шнура / укладывается целое число п полуволн: / = пА/2, откуда лу V . л (оп=п—, у„=и—. A.38) В этих выражениях V — скорость распространения волн в шнуре. Аналогично, стоячую электромагнитную волну между двумя параллельными идеально от- отражающими плоскостями, находящимися на расстоянии / друг от друга, можно рассматривать как нормальное колебание электромагнитного поля в таком плоском резонаторе. Частбты нормальных мод плоского резонатора образуют эквидистантный спектр и выражаются той же формулой A.38), если скорость V в ней заменить на скорость света с. Колебания магнитного поля (см. A.37)) происходят в направлении, перпендику- перпендикулярном напряженности электрического поля, и также представляют собой стоячую волну. Однако пучности и узлы стоячей волны магнитного поля сдвинуты вдоль оси г на четверть длины волны по отношению к пучностям и узлам электрическо- электрического поля. Колебания магнитного поля отстают во времени на четверть периода от колебаний электрического поля. Так, например, в момент времени I — 0 индукция магнитного поля (см. A.37)) всюду равна нулю, а напряженность электрического поля максимальна и распределена в пространстве по закону 2Е§ъоък1 (рис. 1.11,а). а) /=0 х Рис. 1.11. Электрическое и магнитное поля стоячей линейно поляризованной волны в разных точках оси 2 для нескольких моментов времени Спустя промежуток времени Г/8 (Г = 2л/со — период колебаний) напряженность электрического поля уменьшается до у/2Е()СО$кг, а индукция магнитного поля, воз- возрастая, достигает значения \/2Во$ткг (рис. 1.11,6). К моменту времени Г/4 на- напряженность электрического поля всюду обращается в нуль, а индукция магнитного достигает максимального значения 2/?о $тк% (рис. 1.11, в).
28 1. Электромагнитные волны в вакууме а) б) С/гоячая электромагнитная волна, как и бегущая, может иметь и иные, отличные от линейной, состояния поляризации. Например, стоячая волна круговой поляризации получается при наложении распространяющихся навстречу волн круговой поляриза- поляризации, имеющих одинаковые амплитуды и одинаковые направления вращения векторов поля (см. задачу 1). Это значит, что одна из складываемых волн имеет правую, а другая — левую круговую поляризацию. Такая картина возни- возникает при отражении циркулярно по- поляризованной волны от идеального плоского зеркала. Вектор напряженности электри- электрического поля вращается в ту же сто- сторону, что и в каждой из склады- складыУ ваемых волн, однако во всех точ- точках он направлен в каждый мо- Рис. 1.12. Пространственное распределение электри- мент вдоль одной и той же прямой ческого и магнитного полей в стоячей циркулярно (рИС. 1.12, а). Модуль его изменяет- поляризованной волне ся вдодь оси г по Косинусоидально- му закону от максимального значе- значения 2Ео в пучностях, т.е. в тех точках, где вращение векторов Е в складываемых волнах происходит в одинаковой фазе, до нуля в узлах, где векторы Е в складыва- складываемых волнах в каждый момент времени направлены в противоположные стороны. Вектор индукции магнитного поля результирующей стоячей волны вращается в каж- каждой точке так же, как и вектор напряженности электрического поля. В отличие от бегущей волны векторы Е и В в каждый момент времени лежат в одной плоскости. Пространственное распределение магнитного поля отличается сдвигом вдоль оси г на четверть длины волны, т.е. пучности магнитного поля совпадают с узлами элек- электрического поля и наоборот (рис. 1.12,6). Первые опыты по наблюдению стоячих световых волн были выполнены Винером A890). В опытах Винера стоячая волна возникала при отражении почти монохро- монохроматического света от плоского металлического зеркала. Условия отражения от хо- хорошего (идеального) проводника таковы, что при падении по нормали первый узел электрического поля стоячей волны должен располагаться на поверхности зеркала. Для регистрации положения узлов и пучностей стоячей световой волны использо- использовалось действие света на фотографическую эмульсию, в составе которой имеют- имеются светочувствительные кристаллические зерна бромистого серебра. Под действием света начинается разложение бромистого серебра, что приводит к почернению (пос- (после процесса химического проявления) тех участков фотоэмульсии, которые были подвергнуты освещению. В соответствии со слоистым распределением амплитуд ко- колебаний электрического и магнитного полей в стоячей световой волне почернение фотоэмульсии должно происходить слоями. Из-за малого расстояния между пуч- пучностями и узлами (Я/4) такие слои располагаются очень близко друг к другу (на расстоянии Я/2). Трудность наблюдения столь близких слоев Винер преодолел, расположив очень тонкий светочувствительный слой на поверхности стеклянной пластинки под очень
1.3. Стоячие электромагнитные волны 29 малым углом д> (около 1') к поверхности зеркала (рис. 1.13). Этот слой пересекает- пересекается с плоскостями пучностей по параллельным прямым, расстояние между которыми, как видно из рис. 1.13, равно А/B8пкр). При А = 0,5мкм и ср « 1' расстояние между полосами почернения на пластинке составляет около 1 мм. В таких условиях нетруд- нетрудно увидеть, что первая полоса почернения фотоэмульсии не совпадает с зеркалом, а отстоит от него на расстояние А/4 (по нормали). Как раз здесь располагается пучность электри- электрического поля стоячей световой волны. Этот результат одно- однозначно показывает, что фотохимическое действие света обу- обусловлено электрическим полем световой волны. Впоследствии Друде и Нернст в аналогичных опытах A892) показали, что флуоресценция вещества под действием стоячей световой волны также максимальна в пучностях электрическо- электрического поля. Затем Айве A933) обнаружил, что фотоэффект тоже вызывается электрическим полем световой волны. Результаты всех этих опытов легко понять на основе пред- представлений электронной теории. Если в процессе распростране- распространения световой волны ее электрическое и магнитное поля высту- выступают как равноправные, то при взаимодействии с веществом основную роль играет электрическое поле. Любой физический процесс взаимодействия света с веществом сводится в пер- первую очередь к действию поля световой волны на электроны, входящие в состав вещества. Действующая на электрон си- ^ „ „^ ^ ± « /1 1 \ г- Рис. 1.13. Схема опытов ла, выражаемая формулой A.1), определяется главным обра- Винера по наблюдению зом электрическим полем световой волны. В самом деле, ха- стоячих световых волн рактеристики электрического и магнитного полей в световой волне связаны соотношением A.31), поэтому обусловленная магнитным полем со- составляющая силы в A.1) отличается множителем у/с от силы еЕ, действующей на электрон со стороны электрического поля. Обычно у <^ с, поэтому вынужденное светом движение зарядов в веществе определяется электрическим полем световой волны. Пространственное разнесение электрического и магнитного полей в стоячей волне дает возможность получить прямое экспериментальное подтверждение этих выводов. Контрольные вопросы • Каким условиям должны удовлетворять частбты, амплитуды, фазы и состояния поляри- поляризации волн, распространяющихся навстречу, для того чтобы при их сложении возникла стоячая волна? • Что такое узлы и пучности стоячей волны? Опишите картину пространственного распре- распределения и изменения во времени электрического и магнитного полей в линейно поляризо- поляризованной стоячей волне. • На каком расстоянии друг от друга находятся соседние узлы стоячей волны? • Какой частотный спектр имеют нормальные колебания электромагнитного поля в резо- резонаторе, образованном плоскими параллельными идеальными зеркалами, находящимися на расстоянии / друг от друга?
30 1. Электромагнитные волны в вакууме • Каким образом опыт Винера доказывает, что фотохимическое действие света обусловлено электрическим полем световой волны? • Почему во взаимодействии света с веществом основную роль играет электрическое поле световой волны? Как это объясняется электронной теорией? Задачи 1. Найдите зависимость векторов электрического и магнитного полей от координат и времени в стоячей волне круговой поляризации, возникающей при наложении распространяющихся навстречу циркулярно поляризованных волн с одинаковым направлением вращения векто- векторов электрического поля. Решение. Пусть волна, распространяющаяся в положительном направлении оси г, имеет правую круговую поляризацию: Е,(г,0 = {Е0ё{к1~ш\ -/Еое'^-^О), A.39) В, (г, 0 = (/*о с({кг~ш\ Во е'(*г-*">, 0). Чтобы вращение вектора Е2 встречной волны происходило в том же направлении, она должна иметь левую поляризацию: Е2(г, 0 = (Е0е-1{кг+а>'\ -1Е0^к^ш\ 0), A.40) Для результирующей волны из A.39) и A.40) получаем Е(г, 0 = BЕ0 е~1ш соз*г, -2Е0 и"ш со8Л:г, 0), или, в вещественной форме, Е(г,/) = BЕосо$к1 созшг, — 2Еосо$кг зтсм, 0), A.41) В(г, () = (—2Во$ткг созсм, 2Во$ткг $тсо(у 0). Описываемое формулами A.41) поведение векторов Е и В в результирующей стоячей волне круговой поляризации иллюстрируется рис. 1.12. 1.4. Энергия электромагнитных волн Злектромагнитное поле обладает энергией. При распространении электромагнит- электромагнитных волн происходит перенос энергии поля в пространстве. Вопрос о переносимой световой волной энергии можно рассмотреть количественно на основе уравнений Максвелла A.14)—A.17), описывающих электромагнитное поле в вакууме. Напомним известные из курса электричества и магнетизма выражения для объем- объемной плотности энергии электрического поля СГС: Щ = ^; СИ: юэ = ^- A.42)
1.4. Энергия электромагнитных волн 31 и плотности энергии магнитного поля СГС и,„ = ^; СИ: ».. |-. Л^_. (..43) Отсюда для скорости изменения плотности полной энергии электромагнитного по- поля ю = юэ + юм в данной точке можем получить (путем дифференцирования A.42) и A.43) по времени) следующее выражение: 4ЯЧ ^ "^ A.44) СИ: ¦?¦ (ш, + и;м) = < Правую часть A.44) можно с помощью уравнений Максвелла преобразовать сле- следующим образом. Обе части уравнения A.15), содержащего ЗЕ/3/, умножим скаляр- но на Е, а обе части уравнения A.17), содержащего ЭВ/Э/, умножим скалярно на В: СГС: Е.(УхВ) = -Е^, СИ: Ес2(УхВ) = Е^, A.45) с о/ а/ В-(УхЕ) = ~В^; Вс-2(УхЕ) = -с2В^. A.46) С ш о1 Теперь вычтем почленно уравнение A.46) из A.45). Тогда в правой части мы полу- получим интересующее нас выражение A.44) для скорости изменения плотности энергии электромагнитного поля: СГС: ^-[Е-(УхВ)-В.(УхЕ)] = ~(шэ + шм); A.47) СИ: е0с2 [Е • (V х В) - В • (V х Е)] = - (шэ + шм). Легко показать, что выражение в квадратных скобках в левой части A.47) представ- представляет собой дивергенцию векторного произведения В х Е. В самом деле, применим к В х Е дифференциальный оператор V. Чтобы воспользоваться правилом диф- дифференцирования произведения, можно в смешанном скалярно-векторном произве- произведении V • (В х Е) выполнить циклические перестановки сомножителей так, чтобы оператор V действовал только на один из сомножителей. Это дает Е • (V х В) и -В • (V х Е) (во втором случае пришлось в векторном произведении переставить сомножители, чтобы оператор V стоял перед Е, и одновременно изменить знак). Таким образом, V • (В х Е) = Е • (V х В) - В • (V х Е). A.48) С помощью этого тождества выражению A.47) можно придать виц, уравнения непре- непрерывности для плотности энергии электромагнитного поля ю = юэ Н- юм (подобно
32 1. Электромагнитные волны в вакууме уравнению непрерывности A.7) для плотности заряда, выражающему закон сохране- сохранения заряда): ^ = -<&*. A.49) где вектор 8 имеет смысл плотности потока энергии электромагнитного поля и на- называется вектором Пойнтинга. СГС: 8 = — Е х В; СИ: 8 = е0с2 Е х В. A.50) Уравнение A.49), полученное как следствие уравнений Максвелла, выражает за- закон сохранения энергии для электромагнитного поля. Чтобы увидеть это, проин- проинтегрируем обе части A.49) по некоторому объему V, ограниченному замкнутой по- поверхностью а. Интеграл по объему от сиу 8 в правой части преобразуем с помощью математической теоремы Остроградского-Гаусса в интеграл по поверхности <т, огра- ограничивающей этот объем: ^ [юйУ = - 1&йа. A.51) V с Уравнение A.51), представляющее собой интегральную форму уравнения непрерыв- непрерывности A.49), говорит о том, что скорость изменения энергии электромагнитного поля в некотором объеме V, не содержащем зарядов и токов (при выводе уравнения предполагалось, что р = 0 и ] = 0), равна потоку энергии, входящему в этот объем через охватывающую его замкнутую поверхность а. В бегущей электромагнитной волне происходит направленный перенос энергии электромагнитного поля в пространстве. Направление и интенсивность переноса энергии характеризуются вектором Пойнтинга A.50). Для рассмотренных в п. 1.1 плоских волн в вакууме векторы Е и В в любой точке и в любой момент времени ортогональны друг другу и образуют вместе с вектором к правую тройку векторов (см. рис. 1.1). Поэтому направление вектора Пойнтинга 8 в таких волнах совпадает с направлением волнового вектора к: энергия переносится в направлении, перпен- перпендикулярном поверхностям постоянной фазы. Учитывая ортогональность векторов Е и В, а также соотношение A.31) между их модулями, для модуля плотности потока энергии из A.50) получаем следующее выражение: СГС: 5 = 4~ Е2 = 4- Я2; СИ: 5 = сс0Е2 = ссос2В2. A.52) Ал Ал ю ю Из соотношения A.31) следует также, что объемная плотность энергии электри- электрического поля юэ A.42) в бегущей электромагнитной волне в каждой точке и в лю- любой момент времени равна плотности энергии магнитного поля юм A.43). Поэтому выражаемую формулой A.52) плотность потока энергии можно записать как произ- произведение полной плотности энергии ю = юэ + юм электромагнитного поля бегущей волны на скорость волны с: 5 — с(юэ -1- тм) = сю. A.53) В монохроматической волне зависимость напряженности электрического поля от координат и времени выражается формулой A.22). Подставляя Е{г,г) из A.22)
1.4. Энергия электромагнитных волн 33 в A.52) и используя тождество соз2а = A 4- соз2а)/2, для 5(г, /) получаем СГС: 5(г,/) = ^[1+сс СМ, СИ: 5(г,/) = Щ^ [1 +с ] При характерных для оптического диапазона электромагнитных волн высоких ча- частотах со ~ 1015 с колебания потока энергии волны в каждой точке, происходящие в соответствии с A.54) на частоте 2со, ненаблюдаемы и физический интерес пред- представляет лишь среднее по времени значение 5, называемое обычно интенсивно- интенсивностью света. Производя в A.54) усреднение по времени, находим, что в монохрома- монохроматической волне средняя плотность потока энергии E) во всех точках одинакова: СГС: E) = ^; СИ: E) = ^й A55) (угловые скобки обозначают здесь усреднение по времени). Аналогично поведению мгновенного значения плотности потока энергии 5(г, /) в монохроматической волне в каждой точке осциллируют на частоте 2со плотность энергии юэ электрического поля (см. A.42)), пропорциональная Е2(г, /), и равная ей плотность энергии магнит- магнитного поля юм (см. A.43)). Их средние по времени значения во всех точках одинаковы и пропорциональны квадрату амплитуды: СГС: К) = <шм) = ^, СИ: <шэ) = (шм) = %&-, Поэтому в формуле A.55) правую часть можно выразить с помощью A.56) через среднюю плотность энергии поля волны: E)=ф). A.57) Это соотношение можно получить и непосредственно из A.53), усредняя его за про- промежуток времени, равный периоду осцилляции 5 и ю. Таким образом, в световой волне энергия, переносимая в 1 с через площадку 1 м2, перпендикулярную направ- направлению распространения волны, равна произведению скорости света с на объемную плотность ю энергии электромагнитного поля волны. В стоячей электромагнитной волне никакого направленного переноса энергии в среднем не происходит. Рассмотрим, например, стоячую волну линейной поляри- поляризации, электрическое и магнитное поля которой даются выражениями A.37). У со- соответствующего такой волне вектора Пойнтинга 8 A.50) отлична от нуля только г-проекция: СГС: 5г = ^- (ЕХВУ - ЕУВХ) = ^- Е$ $т2ш 81П 2кг; A.58) СИ: 5г = еос (ЕХВУ -ЕуВх) = сос Е$ зт2ш зт2кг. При усреднении выражения A.58) по времени получаем Eг) = 0. 2 Зак 4498
34 1. Электромагнитные волны в вакууме Оделаем замечание о пространственной локализации потока энергии, поверх- поверхностная плотность которого выражается формулой A.50). Поток вектора Пойнтин- га 8 через замкнутую поверхность, как видно из A.51), дает энергию электро- электромагнитного поля, выходящую за 1 с из объема, ограниченного этой поверхностью. Можно ли утверждать, что и в случае незамкнутой поверхности поток векто- вектора Пойнтинга дает энергию, проходящую через поверхность за 1 с? Такая лока- локализация потока энергии в пространстве отнюдь не вытекает из полученного для замкнутой поверхности соотношения A.51). Поэтому применение вектора Пойн- Пойнтинга к вычислению потока энергии через незамкнутую поверхность иногда при- приводит к парадоксам. Известный пример такого парадокса — непараллельные ста- статические электрическое и магнитное поля, для которых Е х В ф 0 и, следователь- следовательно, 8^0, хотя поток вектора 8 через замкнутую поверхность, конечно же, равен нулю. В отличие от статических полей в оптике иногда имеет смысл говорить о по- потоке энергии (т.е. потоке вектора 8) через незамкнутую поверхность. Подробный анализ показывает, что такая локализация потока энергии допустима, если размеры площадки велики по сравнению с длиной волны. С помощью непрозрачного экрана с большим (по сравнению с длиной волны) отверстием можно выделить и измерить энергию, переносимую излучением через отверстие. Можно утверждать, что в пада- падающей волне и при отсутствии непрозрачного экрана через площадку, совпадающую с отверстием, будет проходить та же энергия. Опособы регистрации электромагнитных волн оптического диапазона основаны на измерении потока энергии, которую переносит волна. Всем существующим при- приемникам света присуща большая или меньшая инерционность, характеризуемая некоторой постоянной времени г. Колебания интенсивности регистрируемого из- излучения, происходящие за времена, меньшие г, приемник разрешить не в сос- состоянии. Чтобы измерить мгновенное значение напряженности электрического поля в све- световой волне, приемник должен был бы иметь время разрешения, которое мало по сравнению с периодом световых колебаний. Для видимого света этот период состав- составляет примерно 10~15с. Наименее инерционные приемники оптического излучения основаны на фотоэлектрическом эффекте (см. п. 9.5). Они могут иметь время разре- разрешения до 10~10с. Это время много больше периода оптических колебаний. Поэто- Поэтому все существующие приемники излучения оптического диапазона могут измерять только величины, квадратичные по напряженности поля и усредненные за време- времена, не меньшие времени разрешения приемника. Чтобы подчеркнуть это, их иногда называют квадратичными детекторами. Раздел оптики, связанный с измерением световых потоков, называется фотомет- фотометрией (см. п. 1.10). Для измерения интенсивности излучения с любой длиной волны можно использо- использовать тепловое действие излучения. Поглощаемую чувствительным элементом такого приемника мощность падающего на него излучения можно измерить по превыше- превышению температуры чувствительного элемента над температурой окружающей среды (которая может быть довольно низкой, если в качестве среды взять, например, жид- жидкий гелий). Стационарное состояние с определенной разностью температур уста-
1.4. Энергия электромагнитных волн 35 навливается, когда в каждый отрезок времени за счет излучения чувствительный элемент получает столько же энергии, сколько теряет из-за теплопроводности и дру- других причин. Описываемый детектор должен иметь устройство для калибровки. Перекрывая доступ излучению, по вмонтированному в чувствительный элемент резистору К про- пропускают ток. Силу тока / подбирают такой, чтобы установилась та же разность тем- температур чувствительного элемента и окружающей среды, что и при поглощении из- измеряемого излучения. В этих условиях мощность тока /2Я, рассеиваемая резистором, равна мощности излучения. Детекторы подобного типа имеют много разновидностей. Их отклик определяет- определяется только падающим на чувствительный элемент потоком энергии и не зависит от спектрального состава излучения. Наибольшее распространение среди таких несе- неселективных приемников получили термоэлементы, в которых для измерения раз- разности температур поглощающего излучение чувствительного элемента и окружаю- окружающей среды использована термопара. При небольших размерах термопар инерцион- инерционность этих приемников может быть доведена до 10~2— 10~3с. Несколько термоэле- термоэлементов, соединенных последовательно для увеличения чувствительности, образуют термостолбик. Другой пример неселективного приемника — термометр сопро- сопротивлений (болометр). Его действие основано на изменении сопротивления тонко- тонкого слоя металла или полупроводника при нагревании энергией поглощаемого излу- излучения. К другому классу детекторов излучения относятся фотоэлектрические прием- приемники. Это приемники, основанные на явлении внешнего фотоэффекта — фотоэле- фотоэлементы и фотоумножители (см. п. 9.5) и внутреннего фотоэффекта — фотосо- фотосопротивления и фотодиоды. В отличие от приемников, основанных на тепловом действии, где поглощаемая мощность излучения распределяется между всеми час- частицами чувствительного элемента, здесь она отдается лишь малой доле всех частиц тела, а именно только некоторым входящим в его состав электронам. Поток высвобо- высвобождаемых при фотоэффекте электронов (фототок) пропорционален потоку падающего излучения. Фотоэлектрическим приемникам свойственны высокая чувствительность и хорошие временные характеристики. Все эти приемники обладают селективно- селективностью', их чувствительность в значительной степени зависит от длины волны пада- падающего излучения. Это нужно учитывать при измерениях потока энергии в разных участках спектра. Для абсолютных измерений интенсивности такие приемники тре- требуют специальной калибровки. Контрольные вопросы • Как объемная плотность энергии электрического поля выражается через напряженность электрического поля? • Как следует понимать утверждение, что закон сохранения энергии электромагнитного поля выражается уравнением непрерывности A.49)? Где при его выводе использованы уравнения Максвелла? • Какие энергетические превращения описывает выражение A.58)? • В каких случаях с помощью вектора Пойнтинга можно вычислять поток энергии через незамкнутую поверхность?
36 1. Электромагнитные волны в вакууме Задачи 1. Докажите тождество A.48), используя проекции векторов на оси декартовой системы ко- координат. 2. Найдите плотность потока энергии 5- (г, /) в стоячей волне круговой поляризации. Чему равно среднее значение 5г? 3. Средняя плотность потока солнечной радиации на поверхности Земли (солнечная посто- постоянная) составляет 1,4кВт/м2 (при условии, что поглощения в атмосфере не происходит). Оцените амплитуду напряженности электрического поля световой волны, приходящей на Землю от Солнца. Ответ. Ео « 1 кВ/м. 4. Две волны одинаковой частоты распространяются в одном направлении. Покажите, что плотность потока энергии результирующей волны равна сумме плотностей потоков 5\ + §2 каждой из волн, если волны линейно поляризованы во взаимно перпендикулярных направ- направлениях. 1.5. Испускание электромагнитных волн. Сферические волны До сих пор мы изучали свойства электромагнитных волн в пустом пространстве, основываясь на уравнениях Максвелла A.2) и A.3) с равными нулю источниками р и }, входящими в правые части этих уравнений. Такие уравнения без источников описывают распространение волн в пустоте, но не позволяют понять, как возникают электромагнитные волны. Согласно классической электродинамике испускание электромагнитных волн про- происходит при ускоренном движении электрических зарядов.*) Простейшая модель источника света получается, если рассмотреть диполь, электрический момент кото- которого р{г) гармонически изменяется со временем. Такой диполь можно представить себе как объединение синусоидально движущегося заряда ц с находящимся вблизи него покоящимся зарядом — ц. Точное решение на основе уравнений Максвелла задачи об излучении электромаг- электромагнитных волн такой системой приводится в курсах электродинамики. Однако понять природу механизма испускания волн осциллирующим диполем и получить необходи- необходимые формулы можно с помощью предложенной Дж. Томсоном следующей простой модели этого явления. Рассмотрим точечный заряд д, который до момента времени г — О покоился в на- начале координат. Его электрическое поле изображалось радиальными силовыми лини- линиями, выходящими из начала координат. Пусть в момент времени г — О заряд под дей- действием какой-то внешней силы начинает двигаться с постоянным ускорением а в на- направлении оси г. По истечении короткого промежутка времени г действие этой силы прекращается, так что дальше заряд движется равномерно с той скоростью V = ат9 * * Это утверждение относится к движению заряда в вакууме. В веществе излучение возможно и при равномерном движении заряда, если скорость заряда больше фазовой скорости света в данной среде (эффект Вавилова—Черенкова, см. п. 2.12).
1.5. Испускание электромагнитных волн 37 которую он приобрел к концу периода ускорения. Будем считать, что ускорение а и время г таковы, что у«с. Представим себе картину силовых линий электрического поля, создаваемого со- совершающим такое движение зарядом, спустя промежуток времени / после начала движения, большой по сравнению с длительностью периода ускорения т, т.е. при I ^> т. Так как предельная скорость распространения любых взаимодействий в пусто- пустоте равна с, в точках, лежащих за пределами сферы радиусом с1 (с центром в начале координат), в момент времени I еще не известно о том, что в момент г = 0 заряд начал движение. За пределами этой сферы электрическое поле такое же, каким оно было при неподвижном заряде (рис. 1.14). Напряженность этого поля равна СГС: СИ: A.59) О Внутри сферы радиусом сA — т) электрическое поле в момент времени г такое же, как и поле равномерно движущегося заряда, так как начиная с момента г заряд уже движется с постоянной скоростью V. При V <^ с это поле в момент време- времени г совпадает с полем неподвижного точечного заряда д, находящегося в той точке, через которую в момент I проходит движущийся заряд. При г > т можно считать, что движущийся заряд в момент времени г находится на расстоянии ы от начала координат (это отличается от истинного значения расстояния всего на г; г/2). Таким образом, все изменения электрического поля, связанные с ускоренным движением заря- заряда в течение времени т, в момент времени / за- заключены внутри тонкого шарового слоя толщи- толщиной ст9 наружный радиус которого с19 а внутрен- внутренний с{1 -т). Картину электрического поля в этой Рис- 1-14. Изломы силовых линий области внутри шарового слоя можно найти, осно- электрического поля заряда д, вызван- „ ные кратковременным ускоренным вываясь на свойстве непрерывности силовых ли- даижением Заряда вблизи точки О ний. Для этого достаточно соединить соответству- соответствующие радиальные силовые линии (см. рис. 1.14). Вызванный ускоренным движением заряда излом силовых линий «убегает» от заряда со скоростью с. Изломы на силовых линиях между сферами г = сг и г = с (г - г) — это и есть искомое поле излучения заряда, т. е. испускаемая зарядом волна, распро- распространяющаяся со скоростью с от источника. Рассмотрим одну из силовых линий, составляющую некоторый угол в с направле- направлением движения заряда (рис. 1.15). Вектор напряженности электрического поля в из- изломе разложим на две составляющие: радиальную Ей и поперечную Е^. Радиальная составляющая Ец — это статическое поле, создаваемое неподвижным зарядом д9 на- находящимся в начале координат. Напряженность поля на расстоянии г = сг задается выражением A.59). Поперечная составляющая Е^ — это напряженность электричес- электрического поля в волне, испущенной зарядом во время его движения с ускорением. Так как волна распространяется в радиальном направлении, то вектор Е^ перпендикулярен
38 1. Электромагнитные волны в вакууме направлению волны. Из рис. 1.15 видно, что Подставляя сюда Ец из A.59) и учитывая, что г = с7, находим СГС: Е± = 4^- 8Ш0; СИ: Е± = —!— -^- зтб. A.60) с3гг 4яг0 с3гг Отношение у/т представляет собой ускорение а, с которым двигался заряд в тече- течение промежутка времени от 0 до г. Входящее в A.60) время г можно выразить через расстояние г от заряда до точки наблюдения: ( = г /с. Поэтому соотношение A.60) можно переписать в виде СГС: Е± = ^-&пв; СИ: Е± = -г^— Ц-ьтв. A.61) с2г 4яе0 с2г Приведенный здесь вывод этой формулы был основан на предположении, что лю- любое электромагнитное возмущение распространяется в пустоте со скоростью с. Прежде всего обратим внимание на то, что напряженность Е± электрического поля волны убывает обратно пропорционально первой степени расстояния г от цен- центра в отличие от напряженности Ец электростатического Е\\/ поля точечного заряда, которая убывает как 1/г2. Далее отметим, что напряженность Е± поля волны в момент времени / в точке наблюдения, находящейся на расстоянии г от источника, зависит от ускорения заря- да а в более ранний момент времени г — 0: волна, из- излученная в момент / = 0, достигает точки наблюдения спустя время, равное г 1с. Предположим теперь, что заряд с\ все время движется вдоль оси г с некоторым переменным ускорением а (г), Рис. 1.15. Радиальная и попе- оставаясь при этом вблизи начала координат (напри- речная составляющие векто- совершает гармонические колебания). Тогда он бу- бура Е в области излома силовой г г г / ; линии дет излУчать электромагнитные волны непрерывно. На- Напряженность электрического поля в точке наблюдения, находящейся на расстоянии г от начала координат, по- прежнему определяется формулой A.61), причем поле Е± в момент времени г зави- зависит от ускорения а заряда в более ранний момент времени г1 = I - г /с: СГС: Е±(г9 0 = ^^ 8Ш0; СИ: Е±(г, /) = -г^— ^р- 8Ш0. A.62) Для справедливости этой формулы существенно предположение о том, что совер- совершающий ускоренное движение заряд все время остается вблизи начала координат, так как «время запаздывания» г/с в A.62) принято неизменным и равным времени прохождения волны от начала координат в точку наблюдения.
1.5. Испускание электромагнитных волн 39 Применим полученный результат к излучению заряда д, совершающего гармониче- гармоническое колебание с частотой со: г (/) = г0со$ш, а (г) = г@ = -оJг0со$ш. A.63) При таком движении по гармоническому закону заряд излучает монохроматическую волну. В этой волне поверхности постоянной фазы о>(/ - г/с) -Ш - кг = сом* A-64) (к = со /с) представляют собой сферы с центрами в начале координат, расширяю- расширяющиеся со скоростью с = о)/к. Расстояние, на которое перемещается поверхность постоянной фазы за время, равное периоду колебаний Т = 2л/со, — это длина вол- волны Х = сТ = 2л/к. Формула A.62) применима для поля излучения осциллирующего заряда, если ам- амплитуда г о его осцилляции в A.63) мала по сравнению с длиной волны: г0 < Я. Только тогда время запаздывания можно считать неизменным и полагать равным г/с. Это же условие можно сформулировать как требование, чтобы скорость заряда была много меньше скорости света: у « с. В этом случае его называют электрическим диполъным осциллятором, а испускаемые им волны — дипольным излучением. Можно представить себе, что наряду с осциллирующим зарядом д в начале ко- координат находится покоящийся заряд —д9 образующий вместе с зарядом д ней- нейтральную систему — электрический диполь с осциллирующим дипольным момен- моментом р{г) = дг(О- Добавление неподвижного заряда -д приведет к изменению ради- радиального поля Ец (оно будет убывать с расстоянием быстрее, чем в рассмотренной выше картине поля, создаваемого одним зарядом д). На больших расстояниях от источника, где сравнительно медленно (как \/г) убывающее поперечное поле из- излучения Е± значительно превосходит радиальное поле Еп (в волновой зоне, т.е. при г > А), формула A.62) в равной мере применима и к полю излучения диполя с дипольным моментом СГС: Е±(г91) = ^р- 81П0; СИ: Е±(г, /) = -^— Щ1 8Ш0. A.65) с1г 4ят сАг При этом безразлично, чем обусловлены осцилляции дипольного момента: измене- изменением расстояния между зарядами G и — д по закону г@ = г^соъш при неизменной их величине или изменением зарядов по закону д(г) = до со&ш при неизменном рас- расстоянии г о между ними. Последний случай соответствует простым антеннам, приме- применяемым в радиотехнике. Поле излучения в волновой зоне можно находить, заменяя антенну эквивалентным дипольным осциллятором. Первый случай — колебания расстояния между зарядами — важен как класси- классическая модель электромагнитного излучателя света в оптике. Например, в модели атома Томсона оптический электрон связан с атомом квазиупругой силой и может совершать гармонические колебания. Состоящий из таких атомов источник света можно заменить совокупностью элементарных дипольных осцилляторов. Оказыва- Оказывается, что электрический дипольный осциллятор как модель излучающей атомной системы в ряде случаев приводит к правильным результатам, подтверждающимся на опыте.
40 1. Электромагнитные волны в вакууме На больших расстояниях от источника, т.е. в волновой зоне, где г ^> Л, можно отдельные небольшие участки сферической волновой поверхности A.64) рассматри- рассматривать как плоскости. Если размеры этих участков велики по сравнению с длиной волны, то к ним применимы результаты, полученные выше при изучении плоских электромагнитных волн. В частности, мы сра- сразу можем сказать, каким будет магнитное поле В. Если для каждой точки ввести волновой вектор к, направлен- направленный радиально из начала координат, то векторы Е, В и к в этой точке образуют правую тройку векторов в со- соответствии с уравнением A.29). Их взаимное располо- расположение показано на рис. 1.16. Индукция В (г, г) магнитно- магнитного поля сферической электромагнитной волны в каждой точке связана с напряженностью Е(г, г) электрического поля A.65) в этой же точке тем же соотношением A.31), что и для плоской волны. Как видно из рис. 1.16, вектор Е направлен по каса- касательной к меридиану, а вектор В — по касательной к па- параллели. Поэтому в сферической системе, орты которой направлены в сторону возрастания соответствующих координат (г, 0, <р), векторы Е и В имеют следующие проекции: Рис. 1.16. Векторы Е, В и к в волновой зоне поля излуче- излучения осциллирующего заряда СГС: Ег = О, В г = 0, СИ: Ег = О, В г = 0, Ее = с2г 81П0, = 0, 4ле0 с2г Вв = 0, A.66) Еф = 0, п -Ев Эти формулы можно записать в векторном виде. Если ввести вектор дипольно- го момента р(г), единичный радиальный вектор г1 = г/г, то, как видно из рис. 1.16 и выражений A.66), СГС: В=-^ Е = Вх СИ: В = 1 1 * р(,')хг 3г 1 A.67) = сВ х тг. Отметим, что поле излучения дипольного осциллятора, хотя и представляет со- собой сферическую волну, сферической симметрией не обладает. В волновой зоне по- поверхности постоянной фазы действительно сферические, но модули векторов Е и В в разных точках такой сферы различны, ибо они, как видно из A.67), зависят от полярного угла в. Поле поперечной сферической волны не может быть сферически симметричным.
1.5. Испускание электромагнитных волн 41 Поток энергии в волновой зоне осциллятора имеет в каждой точке радиальное направление. В самом деле, из рис. 1.16 ясно, что направление вектора Пойн- тинга 8 A.50) в каждой точке волновой зоны совпадает с направлением радиуса- вектора г. Найдем значение плотности потока энергии в точке с координатами г, 0, для диполя с гармонически изменяющимся дипольным моментом рA) = р0со&ш: СГС: 5(г, 0, 0 = ;?" ^2(>*> М = т" <^гт яп2 всо82(<у' - кг); 4л* 4я с^г1 4 2 СИ: 5(г, в, г) = е0сЕ2(г, в, г) = 1л ч, ^& йп2 0со82(<и* - */¦)• Усредняя выражение A.68) по времени, получаем интенсивность излучения диполя на расстоянии г. СГС. E(г,0))- — —-Т- (!-69) Зависимость интенсивности от направления выражается в A.69) множителем 8Ш20. Максимальная интенсивность наблюдается при в = я/2, т.е. в экваториальной плос- плоскости: максимум интенсивности соответствует направлению, перпендикулярному оси диполя. Вдоль оси диполя (в = 0) энергия не излучает- излучается. Угловое распределение излучаемой осцилли- осциллирующим диполем энергии показано на рис. 1.17 с помощью «диаграммы направленности». Дли- Длина отрезка, проведенного из начала координат до пересечения с линией г = $т2 в, пропорциональ- Рис* ^^* Угловое распределение на интенсивности распространяющейся в данном эаеРпш. излучаемой осциллирующим -г* диполем (диаграмма направленности) направлении волны. Распределение интенсивно- интенсивности по направлениям в пространстве характери- характеризуется поверхностью, которая получается вращением кривой на рис. 1.17 вокруг оси I. Полную энергию, излучаемую диполем за 1 с по всем направлениям (поток из- излучения), можно найти, вычисляя поток E) через поверхность сферы радиусом К с центром в осцилляторе. Разобьем сферу на кольца координатными поверхностя- поверхностями в = сопз! и в + дв = соп81. Площадь такого кольца равна 2лЯ2 &тв(Ю, а значе- значение E) во всех его точках одинаково. Поэтому полная излучаемая мощность СГС: Р = О A.70) СИ:
42 1. Электромагнитные волны в вакууме Полученный результат заслуживает подробного обсуждения. Излучаемая осцил- осциллятором мощность пропорциональна квадрату амплитуды его дипольного момента и четвертой степени частоты, т. е. обратно пропорциональна четвертой степени дли- длины волны. Этот закон играет большую роль в теории рассеяния света. Столь сильной зависимостью интенсивности излучения от длины волны объясняются, например, го- голубой цвет неба (короткие волны рассеиваются сильнее, чем длинные) и красный цвет Солнца на закате, когда при прохождении через большую толщу атмосферы голубые лучи рассеиваются из прямого пучка гораздо сильнее, чем красные. Выражаемый формулой A.70) поток излучения осциллятора через поверхность сферы не зависит от ее радиуса К — через любую охватывающую осциллятор замк- замкнутую поверхность протекает за 1 с одинаковая энергия. В окружающем осциллятор пространстве нет ни проводников, ни электрических зарядов, ввиду чего излучаемая им электромагнитная энергия не может переходить в другие формы энергии и долж- должна без потерь переноситься с волной в отдаленные области пространства, нигде не накапливаясь и не исчезая. Это объясняет характер зависимости напряженности Е(г) электрического поля в формуле A.65) от расстояния до источника. Чтобы общее из- излучение через сферическую поверхность не зависело от ее радиуса, плотность по- потока 8{г) должна убывать обратно пропорционально г2, так как поверхность сферы пропорциональна г2. С другой стороны, плотность потока 5 пропорциональна Е2. Следовательно, напряженность Е(г) должна убывать обратно пропорционально рас- расстоянию г. Осциллятор совершает незатухающие колебания лишь в том случае, когда эти ко- колебания поддерживаются каким-либо внешним источником. Без такого источника колебания будут затухать даже при движении в абсолютно пустом пространстве, так как осциллятор теряет энергию на излучение (радиационное затухание). Хотя ни- никаких сил сопротивления, никакой «вязкости» в обычном смысле этого слова здесь нет, затухание колебаний можно описать, вводя в уравнение движения излучающего заряда эффективную силу трения таким образом, чтобы потеря энергии на излучение могла быть представлена как средняя работа этой силы. Используя полученное выше выражение A.70) для излучаемой осциллятором мощности, легко сделать оценку времени жизни атома в возбужденном состоянии. Воспользуемся простой классической моделью атома, согласно которой оптиче- оптический электрон — частица с зарядом с\ = —е и массой т — связан в атоме квазиуп- квазиупругой силой, так что при возбуждении атома он совершает собственные колебания с определенной частотой со, и его координата г изменяется со временем по закону I (г) = 1цсо$ш. Незначительным изменением частоты колебаний вследствие затуха- затухания здесь можно пренебречь. Энергия такого осциллятора состоит из кинетической энергии \УК = ^тг2(() и потенциальной 1УП = \таJ12A), средние значения которых равны между собой. Полная энергия осциллятора IV = 1УК + 1УП = 1,ий>2г2 A.71) пропорциональна квадрату амплитуды колебаний. Излучаемая осциллятором мощ- мощность Ртл, представляющая собой скорость уменьшения его энергии —(ДО7&, в со- соответствии с A.70) также пропорциональна квадрату амплитуды. Выражая г о через
1.5. Испускание электромагнитных волн 43 энергию \У из A.71) и подставляя в правую часть A.70), получаем, что скорость уменьшения энергии осциллятора пропорциональна его энергии: A.72) где СГС: у = СИ: у = Ътсг' A.73) Из уравнения A.72) следует, что энергия возбуждения осциллятора уменьшается вследствие потерь на излучение по экспоненциальному закону: у/(г) = №@)е~2у1 = №@)е-//Тэ. Здесь тэ — \/Bу) — время радиационного затухания, в течение которого энергия осциллятора уменьшается в е « 2, 72 раза. Амплитуда го колебаний осциллятора также убывает экспоненциально (рис. 1.18): Длительность этого процесса характеризуется временем затухания амплиту- амплитуды г = 1/у (временем жизни колебаний), которое в два раза превышает время за- затухания энергии: г = 2гэ. Время г определяет продолжительность цуга волн, ис- испускаемых возбужденным осциллятором. Используя A.73), находим число полных колебаний, совершаемых осциллятором за время г: СГС: 1 = -^- Т 2лу 3 шс\ 2л е2а>* /ПС 3 A.75) Принимая для со = 2пс/Х значение, соответствующее А = 0,5 мкм (видимый свет), из A.75) находим, что за время затухания осциллятор совершает около 10 миллионов колебаний. Период этих колебаний составляет примерно 10"5 с, поэтому время жиз- жизни возбужденного состояния атома, обусловленное ^о^?@ радиационным распадом, по порядку величины рав- но 10~"8с. Хотя эта оценка получена для простой классической модели излучающего атома, результат 2 /е по порядку величины согласуется с наблюдаемыми на опыте значениями. Таким образом, излучаемая отдельным атомом волна не является строго монохроматической. Она представляет собой постепенно затухающий цуг, в котором содержится около 107 волн. Простран- Рис- 1-18- Радиационное затухание ственная протяженность такого цуга составляет колебаний излучающего электрона несколько метров. Разумеется, приведенные оцен- оценки справедливы для невзаимодействующих атомов в пустом пространстве (сильно разреженный газ), так как среднее время жизни атома в возбужденном состоянии может определяться и другими причинами, например столкновениями атомов друг с другом или со стенками сосуда (разрядной трубки).
44 1. Электромагнитные волны в вакууме Непосредственное экспериментальное определение времени радиационного зату- затухания было впервые осуществлено Вином для атомов водорода с помощью канало- вых лучей. Через узкие отверстия (каналы) в катоде разрядной трубки возбужденные атомы водорода вылетают в закатодное пространство, где поддерживается очень вы- высокий вакуум. Высвечивающиеся атомы в пучке движутся практически без соударе- соударений. По убыванию интенсивности вдоль светящегося пучка при известной скорости *) атомов можно было определить время затухания гэ, которое по порядку величины совпало с приведенной выше оценкой A0~8 с). В современной экспериментальной физике используют другие, более совершен- совершенные методы измерения времени радиационного затухания. Некоторые из них рас- рассмотрены ниже (см. п. 5.4). Контрольные вопросы • В выводе выражения для электрического поля ускоренно движущегося заряда были неявно использованы уравнения Максвелла и некоторые следствия из них. Еще раз внимательно проследите за всеми этапами вывода и укажите, какие уравнения и в каких местах были использованы. • Какую поляризацию имеют волны, излучаемые осциллирующим диполем? • Что называют волновой зоной поля излучения осциллирующего диполя? Почему получен- полученные в тексте выражения для поля излучения справедливы только в волновой зоне? • Объясните зависимость напряженности поля излучения в сферической волне от расстояния на основе закона сохранения энергии. • Как, используя классическую модель атома, оценить время его жизни в возбужденном состоянии? • По какому закону изменяется со временем энергия возбужденного атома в результате излучения? По какому закону изменяется амплитуда колебаний оптического электрона? Задачи 1. Точечный заряд с/ движется по окружности радиусом а с угловой скоростью со, при- причем соа <С с. Найти пространственное распределение излучаемой таким «ротатором» энер- энергии. Какой характер имеет поляризация излучаемых волн? Решение. Движение заряда с\ можно разложить на два гармонических колебания одина- одинаковой частоты со и амплитуды а, происходящих во взаимно перпендикулярных направле- направлениях со сдвигом по фазе на л/ 2. Поэтому поле излучения ротатора представляет собой суперпозицию полей двух осциллирующих диполей. Начало координат выберем в центре ротатора, ось г направим перпендикулярно его плоскости. Ось г является осью симметрии рассматриваемой системы. Направление оси х можно выбрать так, чтобы точка наблюдения, направление на которую образует угол в с осью г, лежала в плоскости хт. (рис. 1.19). Пусть заряд ц движется против часовой стрелки. Тогда *) Скорость атомов в пучке определялась по доплеровскому смещению спектральных линий при на- наблюдении вдоль направления каналовых лучей.
1.6. Спектральное разложение излучения 45 Направления колебаний векторов напряженности Е] и Е2 электрического поля в волновой зоне для волн, испускаемых каждым диполем, взаимно перпендикулярны (см. рис. 1.19), а по фазе колебания сдвинуты на л/ 2. Амплитуда Ег в волне, излучаемой осциллирующим вдоль оси у диполем, не зависит от угла в, а амплитуда Е] во второй волне в соответствии с A.66) пропорциональна со$0. Поэтому в произвольной точке «север- «северного полушария» на рис. 1.19 результирующая волна имеет ле- левую эллиптическую поляризацию. Оси эллипса колебаний в каждой точке ориентированы вдоль «меридиана» и «параллели». Эллиптическая поляризация для «северного полюса», т. е. для положительного направления оси г, превращается в круговую, ибо в этом направлении обе волны имеют одинаковые амплитуды. Для точек наблюдения в «южном полушарии» поляризация будет правой. В экваториальной плоскости (в направлении оси х) амплиту- *ис* *#*^# ^ Расчету поля да одной из волн обращается в нуль, поэтому излучение имеет излУчения заряда, движу- - ' ' ' щегося по окружности линейную поляризацию; при наблюдении вдоль оси х движение гу заряда по окружности неотличимо от осцилляции вдоль оси у. Рассмотренный пример показывает, что понятие «поляризация» относится к поведению волны в данной точке, т. е. состояние поляризации, вообще говоря, различно в разных точ- точках поля. Волна может иметь линейную поляризацию в одних точках и круговую или эл- эллиптическую — в других. Только в некоторых случаях, например для однородной плоской волны, состояние поляризации всюду одинаково. Поток энергии результирующей волны аддитивно складывается из потоков энергии каж- каждой из волн, так как эти волны для любого направления распространения имеют ортого- ортогональные направления поляризации (см. задачу 4 к п. 1.4). Поэтому интенсивность излуче- излучения ротатора в направлении, составляющем угол 0 с осью г, пропорциональна 1 4- соа20: E@)) ~ 1+соз20. 1.6. Спектральное разложение излучения Рассмотренные выше монохроматические электромагнитные волны представляют собой идеализацию. Свет от реального физического источника никогда не бывает строго монохроматическим. Любой реальный физический процесс ограничен во вре- времени в отличие от гармонического колебания, продолжающегося бесконечно долго. Таким образом, ограниченность во времени и монохроматичность исключают друг друга. Реальную электромагнитную волну можно представить в виде наложения моно- монохроматических волн с различными частотами. Такая возможность обусловлена прин- принципом суперпозиции: при наличии нескольких волн поля этих волн просто накла- накладываются друг на друга; общая напряженность поля двух источников равна сумме напряженностей полей, создаваемых каждым источником в отдельности. Этот извест- известный из опыта факт находит свое математическое выражение в том, что описывающие электромагнитное поле уравнения Максвелла линейны. Линейные уравнения облада- обладают тем свойством, что любая суперпозиция решений (сумма, линейная комбинация) также является решением. Таким образом, принцип суперпозиции дает возможность исследовать слож- сложную электромагнитную волну, заменяя ее суммой (в общем случае бесконечной)
46 1. Электромагнитные волны в вакууме монохроматических составляющих с разными частотами. С математической точки зрения такая замена означает разложение функции в ряд или интеграл Фурье. Целесообразность разложения сложной волны на сумму именно монохроматиче- монохроматических составляющих обусловлена не только тем, что монохроматические волны — это наиболее простые волны и их свойства хорошо известны. Сложную функцию можно представить как сумму других функций самыми разнообразными способами. Возможно разложение не только по синусам и косинусам, но и по другим функ- функциям. С математической точки зрения все такие разложения одинаково допустимы. Целесообразность разложения именно на монохроматические составляющие связа- связана с физикой, с возможностью выделения в эксперименте отдельных монохромати- монохроматических составляющих. В экспериментальной оптике спектральный прибор, напри- например спектрограф с призмой или дифракционной решеткой, производит фактическое разложение сложного излучения на монохроматические составляющие и позволяет вести экспериментальный контроль монохроматичности, ибо синусоидальная волна дает в таком приборе резкую отдельную линию. Поэтому синусоидальные функции оказываются для таких устройств физически выделенными по сравнению с различ- различными полными системами других функций. Рассмотрим сначала самый простой в математическом отношении пример немоно- немонохроматической волны, получающейся при сложении двух монохроматических волн одинаковой линейной поляризации и одинаковой амплитуды Е^, распространяющих- распространяющихся в одном направлении. Пусть эти волны имеют различные частоты со\ и оJ. Напря- Напряженность результирующего поля этих волн в некоторой точке представляет собой сумму гармонических колебаний с частотами со{ и со2. С помощью тригонометриче- тригонометрического тождества ее можно преобразовать к следующему виду: Е{г) =Я0со5йу+ Е0со5й>2' = 2Еосо$(-^——-Асо$(-^——-Л. A.76) Будем предполагать, что разность частот Асо = со2 — со^ мала по сравнению со сред- средней частотой со = (со2 + со{)/2, т.е. Асо <^С со. Тогда правую часть в A.76) можно рассматривать как «быстрые» колебания со средней частотой со, амплитуда Е\(г) которых «медленно» изменяется со временем: ЕA)=ЕхA)со*ш9 ЕХ($) = 2Е0со8(^г). A.77) График Е(г) показан на рис. 1.20, а. В течение нескольких периодов «быстрых» ко- колебаний созйЯ амплитуда Е\{г) изменяется незначительно. В таких случаях говорят, что ЕA) представляет собой «почти гармоническое» колебание с медленно изменя- изменяющейся амплитудой — амплитудно-модулированное колебание. Интенсивность монохроматической волны пропорциональна квадрату амплитуды напряженности. Если применить это понятие к «почти монохроматической» модули- модулированной волне A.77), то мы получим, что ее интенсивность периодически изменя- изменяется с частотой Асо: Е}{1) =2Е^A + соя Доя). A.78) Малоинерционный приемник излучения, реагирующий на интенсивность («квадра- («квадратичный детектор»), должен зарегистрировать эти периодические (с периодом 2л/Асо,
1.6. Спектральное разложение излучения 47 рис. 1.20) изменения интенсивности. Но инерционный приемник с постоянной време- времени, большой по сравнению с периодом модуляции, зарегистрирует среднее значение интенсивности, которое, как видно из A.78), равно сумме интенсивностей отдельных монохроматических составляющих. *) а) Е@ б) а>1 (о2 со Рис. 1.20. Зависимость от времени напряженности поля и интенсивности при сложении двух монохроматических волн с близкими частотами и одинаковыми амплитудами Иногда ставят вопрос о «реальности» разложения колебания на синусоидальные составляющие. Что реально в соотношении A.76): левая часть, т.е. совокупность чисто гармонических колебаний, или правая часть, т. е. «почти гармоническое» коле- колебание с медленно меняющейся амплитудой? В такой форме вопрос лишен смысла, так как A.76) — математическое тождество, т.е. слева и справа стоит одно и то же. Никаким способом нельзя установить, создается поле Е(г) двумя различными моно- монохроматическими источниками с частотами о)х и со2 или одним источником, испускаю- испускающим волну с частотой со, амплитуда которой периодически изменяется (рис. 1.20, а). Вопрос приобретает смысл, когда его ставят в связи с приемником, восприни- воспринимающим колебания. Для малоинерционного приемника целесообразно использовать представление Е(г) в виде колебания одной частоты со = (со^ + @2)/2 с медленно меняющейся амплитудой. Для спектрального аппарата или резонатора, настроенного на определенную частоту, целесообразно представление Е{1) в виде совокупности монохроматических колебаний с частотами со^ и со2. й качестве другого примера рассмотрим волну, порождаемую колебанием Е2A)со&ш9 амплитуда которого промодулирована по синусоидальному закону Е2(() — Е${\ +тсо$п1) с «глубиной» т (т < 1) и частотой О <^о). Легко видеть, что такая волна может быть представлена как совокупность трех строго монохрома- монохроматических волн с частотами со, со + п и со — п\ = ЕоA -Ь - A.79) *' Заметим, что при точном равенстве частот со] = со2 интенсивность результирующей волны не равна сумме интенсивностей составляющих. Эта интенсивность не изменяется со временем и в зависимости от соотношения начальных фаз может иметь любое значение от нуля до учетверенной интенсивности отдельной волны.
48 1. Электромагнитные волны в вакууме О совокупности монохроматических составляющих говорят как о спектре немо- немонохроматической волны. Интенсивность модулированной волны, усредненная за про- промежуток времени, равный периоду модуляции, пропорциональна Е^(\ + т2/2) и рав- равна сумме интенсивностей монохроматических составляющих с частотами со, со + п и со — п. Этот пример ясно показывает, что изменение амплитуды со временем приводит к нарушению монохроматичности волны и появлению новых частот в ее спектре. В случае иного, более сложного, чем в разобранных примерах, закона измене- изменения амплитуды напряженности во времени физическая сущность разложения волны в спектр, т.е. на монохроматические составляющие, остается прежней, хотя зада- задача отыскания этих составляющих становится более сложной и требует применения теоремы Фурье. Простейший случай соответствует периодическому изменению напряженности по- поля с некоторым периодом Т. При этом возможно разложение в обычный ряд Фурье. Разложение периодической функции содержит дискретные частоты, являющиеся це- целыми кратными основной частоты со = 2л/Т: ЕA)= ^2 Е„с-1(ОпГ. A.80) п—~ оо Комплексные коэффициенты Фурье Еп этого разложения определяются по известно- известному виду самой функции Е{1) интегралами Т/2 Еп = ^ I Е{1)епш&. A.81) -Г/2 Ввиду вещественности Е{г) очевидно, что Е-п — Е*. При возведении суммы A.80) в квадрат и усреднении по времени квадраты всех слагаемых и произведения всех слагаемых с различными частотами обращаются в нуль из-за наличия в них осциллирующих синусоидальных множителей, за исключением произведений ви- вида ЕПЕ-П = \ЕП\2. Отсюда следует, что средняя интенсивность волны равна сумме интенсивностей монохроматических компонент: \ЕП\2. A.82) /?=—оо п=\ При переходе к суммированию только по положительным п мы учли, что для све- света Е{г) не имеет постоянной составляющей и поэтому в A.80) Еп = 0 при п = 0. Для непериодических полей разложение в спектр дает непрерывный набор различ- различных частот. Здесь нужно использовать представление в виде интеграла Фурье: A.83) Чтобы такое разложение было возможно, функция Е{1) должна удовлетворять определенным требованиям, которые в физических задачах обычно выполняются.
1.6. Спектральное разложение излучения 49 Входящая в подынтегральное выражение непрерывная функция частоты Еа> опреде- определяется по известной функции Е(г) соотношением оо Еш= [ ЕA)еш<Ъ. A.84) — ОО При этом Е-со = Е^, так как функция Е{г) вещественна. Поэтому фактически доста- достаточно знать комплексную функцию Ею только при положительных значениях со. Как видно из A.83), Еп)йо)/Bя) определяет вклад в Е{г) монохроматических составляю- составляющих из интервала частот со, со + йсо. Чтобы выразить полную энергию волны через интенсивность ее компонент Фурье, вычислим интеграл от Е2A) по времени: Здесь мы воспользовались формулой A.83). Изменяя теперь порядок интегрирования по со и X и используя формулу A.84), получаем оо оо оо _ [рр й(О - [ \р \2й(О _9 [\р \2&» Таким образом, полная энергия немонохроматической волны выражается через ин- интеграл по положительным частотам от ее спектральной плотности, характеризую- характеризующей распределение энергии волны по спектру частот. Отметим, что термином «спектр» в физике пользуются несколько вольно, вкла- вкладывая в него порой разный смысл. Иногда его относят просто к набору частот (дис- (дискретному или непрерывному), входящих в состав немонохроматического излучения, иногда — к распределению энергии (интенсивности) излучения по этим частотам, характеризуемому спектральной плотностью 2|Е^|2, а иногда — к фурье-образу Е& математической функции Е{г), описывающей немонохроматическое излучение. В то время как Е& в соответствии с формулой A.83) полностью определяет функцию Е(г), знание спектральной плотности энергии 2|/^|2 еще не позволяет восстановить функ- функцию Е({). Дело в том, что в энергетическом спектре 2|/^|2 уже не содержится ин- информация о фазах монохроматических составляющих. Поэтому данное поле Е(г) характеризуется вполне определенным спектром, но одному и тому же спектру мо- могут соответствовать разные функции ЕA). В заключение заметим еще раз, что математическому разложению немонохро- немонохроматической волны в ряд или интеграл Фурье для нахождения спектральной плотно- плотности ее энергии можно сопоставить реальный физический процесс — эксперимен- экспериментальное измерение спектра такой волны с помощью соответствующего анализатора (спектрального прибора). Принцип действия некоторых спектральных приборов рас- рассматривается в п. 6.6.
50 1. Электромагнитные волны в вакууме Контрольные вопросы • В чем заключается физическое содержание принципа суперпозиции? Какое свойство урав- уравнений Максвелла обеспечивает выполнение принципа суперпозиции? • В чем преимущество разложения произвольной электромагнитной волны на синусоидаль- синусоидальные волны по сравнению с разложениями по полным системам других функций? • В каких случаях выражения A.76) или A.79) удобно рассматривать как почти гармони- гармоническое колебание с медленно изменяющейся амплитудой («модулированное» колебание) и в каких — как сумму нескольких монохроматических колебаний? • Каким спектром (коэффициентами Еп при разложении в ряд Фурье A.80)) характеризуется колебание вида Е(() = Е0со$(о1? Е(г) = Ео&тш! Е(г) = Еосо$(со( + срI • Каким спектром характеризуются биения вида Е(() = А со5{2г созая? • Какой спектр имеет амплитудно-модулированное колебание с гармонически изменяющейся амплитудой, т.е. колебание вида ЕA) = /?оA + тсо&п1) со$ш, при со ^> № • Можно ли по измеренному идеальным прибором энергетическому спектру \Ео)\2 восстано- восстановить зависимость от времени напряженности Е(() электрического поля волны, воздейство- воздействовавшей на спектральный прибор? 1.7. Квазимонохроматический свет Исследуем спектральный состав немонохроматической электромагнитной волны, представляющей собой отрезок синусоиды: {Е0со$со1 (-т/2 < I < т/2), О (И > т/2). A.86) Описываемое этой формулой колебание длится не бесконечно долго, а конечное время т (рис. 1.21, а). Поэтому его спектр образован не единственной частотой со0, а) б) -2ж/т 0 2л7г Асо-со-(о0 Рис. 1.21. Синусоидальный цуг волн конечной длительности г (а) и соответствующее распределение энергии по частотам (б)
1.7. Квазимонохроматический свет 51 а непрерывным набором частот. Мы увидим, что при большой длительности коле- колебаний (по сравнению с отдельным «периодом» Т = 2л/щ), т.е. при г > Г, спектр в основном сосредоточен в небольшом интервале частот Асо вблизи значения &>0, причем монохроматическая составляющая с частотой &>0 имеет наибольшую ампли- амплитуду. Пространственная картина волны, порождаемой колебанием A.86), представля- представляет собой цуг синусоидальных волн длины Х — сТ, имеющий конечную протяжен- протяженность I = ст. Для нахождения спектра подставим Е{г) из A.86) в формулу A.84). Вычисле- Вычисление интеграла удобно произвести, выразив со5<у0г через показательные функции по формуле Эйлера: г/2 1 2 -т/2 мп[(<а - <ао)т/2] мп[(й) + йH)т/2] (<»-а>0)т/2 + (й) + йH)т/2 A.87) 81ШС На рис. 1.22 показан график функции (&тх)/х. Ее главный максимум рас- расположен при х = 0, где она имеет значение, равное 1. Функция обращается в нуль при х = ±я, ±2я,... В промежутках между этими точками она имеет второстепенные максимумы и миниму- минимумы: значение [(8т;с)/;с]2 на интерва- интервале (я, 2л) не превосходит 0,05; на ин- 1 тервале Bя, Зя) не превосходит 0,02 и т.д. Сопоставляя график (&тх)/х с формулой A.87), можно заключить, что конечный отрезок синусоиды име- имеет фурье-компоненты, в основном со- сосредоточенные вблизи значений @$ и -щ в частотных интервалах поряд- порядка ширины главного максимума 2я/т. Для характеристики спектрально- спектрального распределения энергии (или интен- интенсивности), как это видно из форму- формулы A.85), достаточно рассмотреть ход функции [Еоу]2 при положительных ча- частотах со > 0. Пусть рассматриваемый цуг содержит много «периодов», т.е. т ^> Т = 2л/щ. Это значит, что главные макси- максимумы функции Есо A87) отстоят по частоте от начала координат на расстояние со$, которое велико по сравнению со спектральной шириной этих максимумов 2л/т. Поэтому в области положительных частот со > 0 функция Е& A.87) практически определяется только своим первым слагаемым. Таким образом, длинный цуг синусо- синусоидальных волн характеризуется следующим распределением энергии по спектру: Рис. 1.22. График функции 81ШС A.88)
52 1. Электромагнитные волны в вакууме График этой функции приведен на рис. 1.21,6. Он дает представление о контуре спектральной линии рассматриваемого излучения. Максимум спектральной плот- плотности соответствует значению со = со0. Большая часть энергии цуга приходится на монохроматические составляющие, лежащие в пределах этого главного максимума, т.е. между частотами, отстоящими от со0 на 2л/т. Ширину спектральной линии мож- можно определить как интервал частот Асо между значениями, при которых спектральная плотность равна половине максимальной плотности («ширина на половине высоты»). Так как [(8шд:)/х]2 = 0,5 при х = =Ы,39, то приближенно можно положить Асот « 2я, или Дуг « 1, A.89) где у = со/Bл). Чем больше длительность цуга синусоидальных волн г, тем уже соответствующий ему спектральный интервал Асо (или Ду). Ширина спектральной линии Ду приблизительно равна обратной длительности колебаний 1/г. Это важ- важное соотношение между шириной спектра и длительностью колебаний имеет общий характер: мы увидим, что оно сохраняется и в том случае, когда огибающая цу- цуга имеет более сложную форму. Его можно записать также в виде соотношения между протяженностью волнового цуга в пространстве / = ст и интервалом вол- волновых чисел Ак = Асо/с монохроматических компонент, входящих в состав цуга: Ак1 « 2л. Когда ширина спектра Асо мала по сравнению со средней частотой щ (Асо <^ щ)9 излучение называют квазимонохроматическим. Излучение в виде достаточно длин- длинного цуга синусоидальных волн или в виде хаотической последовательности таких цугов дает пример квазимонохроматического излучения. Отдельные спектральные линии в излучении разреженных газов представляют собой квазимонохроматический свет. Такой свет можно также выделить из излучения источников, дающих непрерыв- непрерывный спектр (Солнце, раскаленные тела), с помощью монохроматоров — приборов, осуществляющих спектральное разложение. Наибольшей степенью монохроматично- монохроматичности (характеризуемой отношением щ/Асо или Я0/ДЯ) обладает излучение стабили- стабилизированных по частоте газовых лазеров. Классическая модель оптического излучения возбужденного атома (см. п. 1.5) так- также дает пример квазимонохроматического света. Напряженность поля в волне, ис- испускаемой затухающим осциллятором, изменяется по закону где постоянная затухания у определяется соотношением A.73). Для нахождения спектра излучения подставим Е(г) в A.84). При вычислении интеграла удоб- удобно со$&Hг выразить через показательные функции: оо = -Яо{ /> о
1.7. Квазимонохроматический свет 53 Рассматривая вещественную часть этой функции, замечаем, что она имеет два мак- максимума в точках со — со0 и со = — со0. При у < со0 максимумы очень острые и только в окрестности этих пиков функция Е(о заметно отлична от нуля. Это относится как к вещественной, так и к мнимой части Е^. Поэтому при у <С со0 в интересующей нас области положительных частот вкладом второго слагаемого из A.91) в функцию Е& можно пренебречь. В результате для спектральной плотности энергии излучения за- затухающего осциллятора из A.91) в случае слабого затухания находим Описываемая выражением A.92) форма спектральной линии излучения называет- называется лоренцевским контуром (рис. 1.23). Кривая имеет резкий максимум при со = со0, т.е. на частоте собственных колебаний в отсутствие затухания. Уширение спек- спектра излучаемых частот обусловлено радиационным затуханием свободных коле- колебаний осциллятора. Интенсивность излучения уменьшается вдвое для частот, от- отличающихся от со0 на у = 1/г. Отсюда для ширины линии на половине высо- высоты находим Асо = 2у = 2/г. Это зна- значит, что в случае затухающего ос- № циллятора ширина полосы излучае- излучаемых частот АV связана с характерной длительностью цуга г тем же соот- соотношением A.89) Дут ~ 1: чем мень- меньше длительность процесса испускания, тем шире спектр частот. Так как Асо = 2у <С со0, то излучаемый свет является квазимонохроматическим. На рис. 1.23 масштаб не выдержан — ширина лоренцевского контура сильно преувеличена. Рассмотренный пример позволяет оценить обусловленную радиацион- радиационным затуханием естественную шири- ширину спектральных линий излучения сво- свободных атомов. Так как время жизни возбужденного состояния г составляет около 10~8с (см. п. 1.5), то для естествен- естественной ширины получаем Ау ~ 108 Гц. В шкале длин волн оценка естественной ширины спектральной линии дает АХ ~ 10~5 нм. Приведенные выше примеры соответствовали квазимонохроматическому свету, получаемому из монохроматического при медленном изменении (модуляции) его амплитуды: Е(() = ЕоA)со$(ш + <р), где #о(О — медленно (по сравнению с созш) изменяющаяся функция времени. Но немонохроматичность может быть вызвана так- также изменением (модуляцией) фазы: ср = <р(/). Поэтому для более общего случая квазимонохроматического света колебание напряженности электрического поля мо- может быть записано в виде Рис. 1.23. Лоренцевский контур спектральной линии = Ео(() соз[ где #о(/) и ^@ — медленно изменяющиеся функции времени.
54 1. Электромагнитные волны в вакууме Контрольные вопросы • Постройте графики функций Еш и |Е<у|2 для отрезка синусоидального колебания Е(г) A.86). • При каких условиях для характеристики спектрального распределения энергии вторым слагаемым в формуле A.87) можно пренебречь? • В каком приближении формула A.92) дает спектральную плотность энергии излучения затухающего осциллятора? • Рассмотрите связь лоренцевского контура A.92) с резонансной кривой, характеризующей установившиеся колебания затухающего осциллятора под действием синусоидальной внеш- внешней силы. Задачи 1. Найдите спектральную плотность энергии для квазимонохроматического цуга синусоидаль- синусоидальных волн, амплитуда напряженности которых медленно изменяется по колоколообразному (гауссову) закону: 2,2 Е(г) = Еое ' со5О>0/. Здесь время т ^> То = 2л/щ характеризует длительность волнового цуга. Показать, что и в этом примере длительность цуга и ширина спектрального интервала Ау связаны соот- соотношением Ау • г ~ 1. Ответ. 2|Е<у|2 = ^ Еояг2ехр{ — \ т2(со — со0J}. Форма спектральной линии гауссова, с шириной на половине высоты Ау = у/2\п2/(лт). 1.8. Спектральные линии. Поляризация квазимонохроматического света д ,о сих пор мы рассматривали спектральный состав излучения, представляющего со- собой одиночный волновой цуг конечной длительности. При регистрации такого цуга идеальным спектральным прибором (прибором бесконечно большой разрешающей силы) должен получиться либо спектральный контур A.88) в случае отрезка синусо- синусоиды вида A.86), либо лоренцевский контур A.92) в случае одиночного затухающего цуга вида A.90). Рассмотрим теперь спектральный состав излучения реального источника света, состоящего из большого числа атомов — элементарных излучателей. Точнее, бу- будем рассматривать упрощенную модель такого излучения. В точке наблюдения (на- (например, там, где находится приемник) происходит сложение колебаний электромаг- электромагнитного излучения, приходящего в эту точку от разных элементарных излучателей макроскопического источника. Несмотря на то что вопрос о спектральном составе результирующего излучения очень сложен, ответ на него оказывается достаточно простым. Поэтому сначала сформулируем результат и лишь затем приведем его обо- обоснование. В основе математической модели излучения обычного (нелазерного) источника света лежит статистическая гипотеза о том, что в случае спонтанного излуче- излучения различные атомы источника испускают отдельные цуги волн независимо друг
1.8. Спектральные линии. Поляризация 55 от друга в случайные моменты времени. Фазы колебаний электромагнитного поля и направления поляризации в излучении различных атомов не скоррелированы друг с другом. Поэтому оказывается, что регистрируемое спектральное распределение ин- интенсивности излучения всех атомов источника в такой некогерентной суперпозиции определяется суммированием распределений интенсивности для индивидуальных атомов. В частности, если цуги волн, испускаемые различными элементарными излу- излучателями в случайные моменты времени, одинаковы (или отличаются амплитудами), то спектр излучения источника как целого будет таким же, как и распределение интенсивности для изолированного излучателя (атома). Перейдем к обоснованию сформулированного выше результата. Предположим, что через точку наблюдения в течение интервала времени Г, необходимого для наблюде- наблюдения, проходит большое число волновых цугов конечной длины. Допустим, что все эти волновые цуги, испущенные как одним и тем же атомом в разные моменты времени, так и разными атомами, идентичны по форме, т.е. колебания напряженности элек- электрического поля, вызываемые этими цугами в точке наблюдения, описываются одной и той же функцией Е(г - (к). В одних условиях это может быть функция вида A.90), в других — A.86). Физические условия, приводящие к той или иной модели, обсу- обсуждаются ниже. Отдельные цуги различаются только моментами прохождения через точку наблюдения ^.*) Пусть пока и направление линейной поляризации излучения во всех цугах одинаково (при отказе от этого предположения результирующее излу- излучение источника представляет собой неполяризованный, т.е. «естественный», свет). Предположим, что за интервал времени (-Т/2, Т/2) через точку наблюдения проходит п цугов. Тогда по принципу суперпозиции полное поле Р(?) в точке наблю- наблюдения в момент времени г можно записать в виде суммы п слагаемых: ^1к). A.93) Слагаемые, соответствующие отдельным цугам, разложим в интеграл Фурье и учтем, что фурье-образ Е(О во всех слагаемых одинаков: оо п п*)= /^Ёе"/Ае"/а;/?- о-94) -оо *=1 Если рассматривать эту формулу как разложение полной напряженности поля в ин- интеграл Фурье сю ^ей"^' О-95) то, как видно из сравнения A.94) и A.95), п '"*. A.96) —оо + )В частном случае A.90) момент гк соответствует прохождению начала цуга, в случае A.86) прохождению середины цуга.
56 1. Электромагнитные волны в вакууме Интересующая нас средняя интенсивность полного поля излучения A.93) за время наблюдения Т Т/2 оо /~± I ^2@*«уг I ^(ОЛ. A.97) -Т/2 -оо Пределы интегрирования здесь распространены до бесконечности, так как при большом (по сравнению с длительностью отдельных цугов) интервале времени наблюдения Т можно пренебречь частичным срезанием некоторых цугов краями интервала Далее можно воспользоваться формулой A.85), чтобы выразить полную интенсивность через интеграл по всем частотам от ее спектральной плоскости: оо оо -оо О Таким образом, для распределения энергии результирующего излучения A.93) по спектру из A.96) находим 2 ^ п 2_ Т -<а)\ |2 A.99) Двойную сумму по /, к в A.99) можно преобразовать следующим образом, выделив в ней слагаемые с / = к: г( -гк). A.100) Вспомним теперь, что моменты прохождения отдельных цугов %к распределены со- согласно статистической гипотезе случайным образом, поэтому одинакова вероятность появления равных по модулю положительных и отрицательных значений косинуса у разных слагаемых в A.100). Это значит, что вторая сумма в A.100) при большом числе слагаемых в среднем равна нулю и вся двойная сумма в A.99) сводится к и, т.е. к числу цугов, проходящих через точку наблюдения за интервал {—Т/2, Т/2). Так как 2|ЕЛ>|2 характеризует спектральный состав излучения отдельного цуга, то из A.99) с учетом сказанного следует, что спектральная плотность интенсивности излучения всего источника, усредненная за время наблюдения Г, равна спектраль- спектральной плотности энергии излучения отдельного цуга, умноженной на среднее число цугов п/Т9 проходящих за единицу времени. При этом безразлично, налагаются ли отдельные цуги друг на друга или они следуют настолько редко, что между ними есть свободные промежутки. Важно лишь, чтобы за все время наблюдения Т проходило большое число цугов: п ^> 1. Рассмотренную выше математическую модель источника света можно усложнить, отказавшись от предположения об идентичности волновых цугов, испущенных раз- различными атомами. Оказывается, что и в этом случае спектральное распределение интенсивности излучения всех атомов источника находится суммированием распре- распределений интенсивности излучения отдельных атомов. Опектр излучения источника как целого будет таким же, как и распределение интен- интенсивности A.92) для изолированного атома, если обеспечить, во-первых, отсутствие
1.8. Спектральные линии. Поляризация 57 соударений атомов и, во-вторых, их движение с одинаковой скоростью в направлении наблюдения. Эти условия выполняются для свечения пучка атомов в вакууме, возбу- возбуждаемого скрещенным с ним электронным пучком, при наблюдении в направлении, перпендикулярном движению атомов. Таким образом удается получить излучение, ширина спектра которого определяется радиационным временем жизни возбуждае- возбуждаемого атома (естественная ширина). В других условиях наблюдаемая на опыте ширина спектральных линий обусловле- обусловлена, как правило, вторичными явлениями. Прежде всего укажем на уширение линий, вызванное столкновениями излучающих атомов с окружающими их атомами и мо- молекулами. При определенной плотности газовой среды эффективное время жизни туд излучающего атома в возбужденном состоянии может оказаться меньше радиацион- радиационного времени гизл (~ 10~8с). По классическим представлениям, столкновения нарушают процесс колебаний возбужденных осцилляторов, поэтому протяженность излучаемого волнового цуга, как и длительность колебаний, уменьшается. Если характерное время между столк- столкновениями много меньше времени радиационного затухания, то изменением ампли- амплитуды на протяжении отдельного цуга (т. е. от одного столкновения до другого) можно пренебречь. Тогда спектр излучаемого некоторым атомом «оборванного» в результа- результате столкновения волнового цуга можно аппроксимировать выражением A.88). Если считать, что промежутки времени между соударениями распределены экспоненци- экспоненциально (пуассоновский процесс), то результирующая спектральная линия имеет такую же лоренцевскую форму A.92), как при радиационном уширении, но с характерным средним временем туд между соударениями (см. задачу 1): 1(со) ~ —__. (П01) 1 + (сощJт1 В типичном газоразрядном источнике света туд порядка 10~~9с, поэтому шири- ширина линии A.101) Ау ~ 109Гц. Если время туд одного порядка с временем радиа- радиационного затухания 1/у, то можно показать, что и в этом случае спектр характе- характеризуется лоренцевским контуром с максимумом при о) = со0 и шириной 2(у + п^), где п1 = 1/туд — среднее число соударений в единицу времени. Другая причина уширения спектральных линий — эффект Доплера. Спектр излу- излучения, испущенного движущимся атомом, в лабораторной системе отсчета сдвинут по частоте. Излучающие атомы в источнике совершают хаотическое тепловое дви- движение, и полный спектр излучения источника определяется наложением сдвинутых друг относительно друга одинаковых спектральных распределений отдельных атомов. В случае свечения газоразрядной плазмы низкого давления столкновения излучаю- излучающих атомов происходят редко, и эти спектральные распределения обусловлены ради- радиационным затуханием, т.е. даются сдвинутыми лоренцевскими контурами A.92). На- Наложение этих контуров дает спектральную линию излучения источника с шириной, зависящей от температуры. Эта доплеровская ширина для водорода при комнатной температуре почти в 500 раз больше естественной. Прежде чем исследовать форму спектральной линии, обусловленную эффектом Доплера, отметим принципиальное отличие между доплеровским уширением и рас- рассмотренными выше радиационным и столкновительным уширениями. Это различие
58 1. Электромагнитные волны в вакууме 1(со) заключается в следующем. Радиационное и столкновительное уширение обусловлены тем, что каждый атом излучает цуг волн ограниченной длительности, характеризуе- характеризуемый определенным спектром частот. Поэтому излучению отдельного атома соответ- соответствует весь профиль спектральной линии, так что невозможно приписать определен- определенную частотную компоненту внутри излучаемой линии какому-либо отдельному атому источника (или группе атомов). Такой тип уширения обычно называют однородным. В случае доплеровского уширения излуче- излучению разных атомов соответствуют различ- различные части профиля спектральной линии источника, т.е. возможна идентификация определенной группы атомов по интерва- интервалу излучаемых частот в пределах контура линии. Этот тип уширения называют неод- неоднородным. Выражение для формы спектральной линии, обусловленной эффектом Доплера, получим в приближении, когда однород- однородная (например, естественная) ширина мно- много меньше доплеровской. Другими слова- словами, будем считать, что неподвижные ато- Рис 1.24. Гауссов контур спектральной линии мы излучают практически на одной часто- (неоднородное доплеровское уширение) V, г _ те со0. Для движущихся атомов наблюда- наблюдаемые частоты сдвинуты. При этом имеет значение лишь проекция скорости атома на направление наблюдения. Если эта про- проекция равна V, то наблюдаемая частота излучения (при V <^с) определяется выра- выражением A.102) Вероятность того, что в состоянии теплового равновесия при температуре Т атом массой т имеет проекцию скорости в интервале между V и V + йь9 определяется максвелловской функцией распределения: *,-Г===1 1/2 \2лкТ) ехр - ту'- 2кТ (IV. A.103) Строго говоря, распределение Максвелла A.103) справедливо только при тепловом равновесии. Тем не менее отклонение от него для излучающих атомов в газовом разряде обычно незначительно. Подставляя в A.103) V из A.102), получаем вероятность того, что наблюдаемая частота лежит в интервале от со до со + йсо: г / ш \ 1/2 Г гпг^ /со — со*\ 21 \(\СО. со0\2лкТ 2кТ Это есть та доля полного числа возбужденных атомов источника, которая излучает в направлении наблюдения на частоте от со до со + дсо. Акты спонтанного испускания различных атомов происходят независимо, т. е. их излучение некогерентно. Поэтому
1.8. Спектральные линии. Поляризация 59 полная интенсивность излучения источника 1(со) йсо в интервале от со до со 4- йсо пропорциональна числу атомов, излучающих в этом интервале. Таким образом, доп- леровское уширение приводит к распределению энергии в спектре, выражаемому следующей формулой: где /о — спектральная плотность интенсивности излучения в центре линии на часто- частоте со0. Описываемый выражением A.104) контур спектральной линии имеет колоко- лообразную форму с быстро (экспоненциально) спадающими крыльями (рис. 1.24). Он называется гауссовым, так как совпадает с кривой нормального закона распреде- распределения Гаусса. Ширину доплеровской линии Дй>доп определим из A.104) как разность частот, при которых интенсивность равна половине ее максимального значения. По- Полагая 1{со) = /о/2, находим Поп 0 (^) ^о>0 = 1,67 — со,, A.105) м \тс1' с с где Ут = у/2кТ/т — наивероятнейшая скорость атома при температуре Т источника. Подставляя в A.105) числовые значения констант, получаем для оценки доплеров- доплеровской ширины спектральной линии следующую простую формулу: = 7;2 • 1<Г7Ч/Г7М. A.106) СО0 V0 Я0 Здесь М — атомная масса. Например, для линии неона при Ао = 632,8 нм, М = 20, Т = 300 К из A.106) находим ДАд0П = 1,6- 10~3нм. В таких условиях доплеров- ская ширина на два порядка превосходит естественную ширину спектральной линии (ДАИЗЛ= 1,17-КГ5 нм). Эффект Доплера дает основной вклад в уширение спектральных линий в разре- разреженных газах. Этот эффект важен также для понимания процессов в газовых лазерах: при низких давлениях рабочего газа в разрядной трубке эффектом Доплера опреде- определяется спектральный контур линии усиления. й рассмотренной модели источника, содержащего большое число спонтанно излу- излучающих атомов, предполагалось, что в точку наблюдения испущенные отдельными атомами волновые цуги приходят в состоянии линейной поляризации с одним и тем же направлением колебаний. Такое условие выполняется, если излучение на пути от источника проходит через поляризатор, пропускающий волны с определенным направлением колебаний. Результирующее излучение, возникающее при наложении многих цугов, будет немонохроматическим (имеющим спектр конечной ширины), но по-прежнему обладает линейной поляризацией с тем же направлением колебаний. Если отказаться от предположения о том, что излучение пропускается через поляри- поляризатор, то мы получим модель неполяризованного, или естественного, излучения. По классической электронной теории, оптический электрон в атоме связан ква- квазиупругой силой, пропорциональной его смещению из положения равновесия, так что при возбуждении он совершает колебания с определенной частотой со0. Такая
60 1. Электромагнитные волны в вакууме система обладает сферической симметрией, т.е. колебания электрона в зависимо- зависимости от начальных условий могут происходить в любом направлении. Поэтому ясно, что поляризация излучения в отдельных волновых цугах, испущенных различными атомами, зависит в точке наблюдения от соотношения амплитуд и фаз колебаний излучающего электрона по двум взаимно перпендикулярным направлениям. В об- общем случае поляризация излучения в отдельных цугах будет эллиптической с произ- произвольными ориентацией и эксцентриситетом эллипса колебаний. Эти характеристики эллипса колебаний сохраняются на протяжении одного цуга, но случайным образом изменяются от одного цуга к другому. Результирующее электромагнитное поле в точке наблюдения, возникающее в ре- результате наложения волновых цугов, испущенных различными атомами, будет об- обладать определенным состоянием поляризации (т.е. определенным эллипсом коле- колебаний) лишь на протяжении промежутка времени, малого по сравнению с длитель- длительностью отдельного цуга. В силу случайного характера поляризации спонтанного из- излучения разных атомов состояние поляризации результирующего излучения спустя промежуток времени порядка длительности одного цуга уже никак не связано с со- состоянием поляризации в начале этого промежутка. Такое излучение и называют неполяризованным. Важно отметить, что отсутствие поляризации не является его «внутренним» свойством, а проявляется лишь как ре- результат инерционности любой существующей аппаратуры для измерения состояния поляризации. Можно считать, что в неполяризованном излучении все направления колебаний в плоскости, перпендикулярной направлению распространения, представ- представлены с одинаковой вероятностью, т.е. для такого излучения имеется осевая сим- симметрия. Иначе можно сказать так: при разложении колебаний в неполяризованном излучении на два любых взаимно перпендикулярных направления амплитуды этих квазимонохроматических колебаний одинаковы, а их фазы не скоррелированы. Рассмотренными здесь примерами линейно поляризованного и естественного ква- квазимонохроматического света не исчерпываются все возможные случаи. Линейно по- поляризованный квазимонохроматический свет, как и монохроматический, можно с по- помощью определенных устройств превратить в эллиптически поляризованный (в част- частном случае в циркулярно поляризованный). Кроме того, существует частично по- поляризованный свет, который можно рассматривать как смесь естественного света с поляризованным. Контрольные вопросы • Как связана форма спектральной линии макроскопического источника, содержащего боль- большое число независимо излучающих атомов, со спектральными контурами излучения, соот- соответствующими отдельным цугам? • Какая статистическая гипотеза лежит в основе рассмотренной математической модели из- излучения макроскопического источника? • Какие условия должны быть выполнены, чтобы можно было наблюдать излучение со спек- спектральным контуром, определяемым радиационным затуханием? • Какой порядок величины имеет естественная ширина спектральных линий? • В чем отличие однородного и неоднородного уширения спектральных линий? • Объясните механизм возникновения доплеровского уширения спектральных линий.
1.9. Эффект Зеемана 61 • Какой порядок величины имеет доплеровская ширина спектральных линий? Как она зависит от температуры источника? • Объясните, почему излучение источника, содержащего большое число атомов, может быть неполяризованным, несмотря на то что волновые цуги, испускаемые отдельными атомами, характеризуются определенным состоянием поляризации. Задачи 1. Рассмотрим математическую модель уширения спектральной линии, обусловленного столк- столкновениями излучающих атомов. Будем считать, что излучаемые отдельными атомами вол- волновые цуги характеризуются одной и той же средней частотой щ, но вследствие испыты- испытываемых атомами столкновений Имеют различную длительность. Можно считать, что дли- длительности отдельных цугов распределены по экспоненциальному закону: вероятность того, что некоторый цуг имеет длительность, заключенную в промежутке от / до / + ё/, равна рA) 61 = - е~'/г 61. Здесь г — средняя длительность цуга (/) (среднее время между соударениями): оо оо = ПрAN( = - / <*> о о Найдите форму спектральной линии излучения, представляющего собой хаотическую по- последовательность таких цугов. Решение. Будем считать, что среднее время между соударениями много меньше радиаци- радиационного времени жизни. Тогда затуханием колебаний на протяжении отдельного цуга можно пренебречь и принять для него форму отрезка синусоиды A.86). Распределение энергии по спектру для такого цуга характеризуется выражением A.88). Спектральную линию все- всего источника получим как наложение спектров отдельных цугов с учетом распределения цугов по длительности: 8т2[(а)-аH),/21 1 [(а>-а>0)//2]2 1 + (<о-<о0Jг2- о Спектр описывается лоренцевским контуром с шириной на половине высоты, определяемой средним временем между соударениями. 1.9. Эффект Зеемана В 1896 г. голландский физик Зееман открыл явление расщепления спектральных линий под действием внешнего магнитного поля, приложенного к источнику света. Это открытие установило несомненную связь между испусканием света и движением электрических зарядов в атоме. Объяснение наблюдаемых явлений было дано Лорен- Лоренцем и сыграло важную роль в обосновании и развитии электронной теории. Эффект Зеемана позволил определить знак и значение удельного заряда частиц, ответствен- ответственных за излучение света. Таким образом впервые было получено доказательство того, что эти частицы — электроны.
62 1. Электромагнитные волны в вакууме Схема экспериментальной установки для наблюдения эффекта Зеемана пока- показана на рис. 1.25. Источник света с линейчатым спектром (газоразрядная труб- трубка) находится в однородном магнитном по- поле между полюсами мощного электромаг- электромагнита. По оси сердечника просверлен канал для того, чтобы иметь возможность вести наблюдение не только поперек магнитно- магнитного поля, но и вдоль него. Излучение про- проходит через анализаторы Р\ и Р^ (николи) и кристаллическую пластинку А/4 для ис- исследования поляризации и затем направля- направляется в спектрограф большой разрешающей силы. Исходная одиночная спектральная ли- линия при наблюдении поперек поля рас- со0-п со0 Рис. 1.25. Расщепление спектральной линии в эффекте Зеемана оH-п со0 оH+п щепляется на три линейно поляризованные компоненты. Центральная линия соответ- соответствует той же частоте соц, что и при отсут- отсутствии магнитного поля, а направление по- поляризации параллельно магнитному полю (я-компонента). Боковые линии вдвое меньшей интенсивности смещены по шка- шкале частот в противоположные стороны на одинаковые расстояния и поляризова- поляризованы ортогонально центральной линии, т.е. перпендикулярно индукции магнитного поля (<т-компоненты). Фотография спектральной линии неона А = 613,3нм, рас- расщепленной магнитным полем 3,3 Тл на три ком- компоненты, приведена на рис. 1.26. При наблюде- наблюдении вдоль магнитного поля боковые компоненты <• - имеют такое же смещение, а их интенсивность д;^ л::/>ч вдвое меньше интенсивности исходной линии. ^ ^ Центральная несмещенная компонента вообще отсутствует. Смещенные компоненты имеют кру- . говую поляризацию. Если свет распространяется ¦?¦'.'.. - •¦:.,"< в направлении индукции магнитного поля, то бо- -.V-;::: ковая компонента с меньшей частотой имеет пра- правую, а с большей - левую поляризацию. При Рис 126 расщеГ1ление спектральной изменении направления индукции на противопо- линии неона Я = 613,3 нм в магнитном ложное круговая поляризация смещенных компо- поле 3,3 Тл при наблюдении поперек нент также меняется на противоположную. поля (фотографический негатив) Характер расщепления одиночной спектральной линии в магнитном поле и состоя- состояние поляризации отдельных компонент можно объяснить на основе рассмотренной в п. 1.8 модели источника света как совокупности одинаковых классических изо- изотропных осцилляторов. В отсутствие магнитного поля излучение такой системы не поляризовано и имеет одну и ту же частоту щ при наблюдении в любом направ- направлении (точнее, характеризуется одинаковым спектральным контуром с центром на частоте щ). Влияние внешнего постоянного магнитного поля В на движение из- излучающего электрона можно рассмотреть, пренебрегая затуханием его колебаний. В уравнение свободных колебаний электрона при наличии магнитного поля наряду
1.9. Эффект Зеемана 63 с квазиупругой силой нужно включить силу Лоренца: СГС: г + йH2г = ~гхВ; СИ: г + бH2г = --гхВ. A.107) "тс у т Введем, по определению, вектор угловой скорости €1 (ларморовскую частоту): СГС: Й = --^-В; СИ: Й = -^-В. A.108) 2тс 2т Теперь A.107) можно записать в виде г-2гхЙ + ^г = 0. A.109) Классическая теория эффекта Зеемана сводится к нахождению решений этого урав- уравнения. Если записать его в проекциях на оси декартовой системы координат (ось 1 удобно направить вдоль индукции В магнитного поля, тогда п1 = —Я), то получится система однородных дифференциальных уравнений: х + 2Пу+<о1х = 0, у-2Ш+а)$у =0, г+со^=0. A.110) Из последнего уравнения видно, что одно из возможных решений этой систе- системы — гармоническое колебание электрона вдоль оси г. Такое колебание происходит с той же частотой &>0, что и при отсутствии магнитного поля. Это и понятно, так как при движении вдоль магнитного поля сила Лоренца равна нулю. Существова- Существование такого решения объясняет несмещенную я-компоненту в эффекте Зеемана. При наблюдении поперек поля я-компонента имеет наибольшую интенсивность (равную половине интенсивности исходной линии) и линейно поляризована вдоль оси г, т.е. вдоль магнитного поля. При наблюдении вдоль поля ее интенсивность обращается в нуль — осциллирующий заряд в этом направлении не излучает. Первые два уравнения в A.110) «зацепляются» между собой. Но если вме- вместо искомых функций х(г) и у (I) ввести две другие функции 4± =х±1у, то для них из A.110) получаются несвязанные уравнения: умножая второе уравнение на / и складывая с первым, получаем 4+-2Ш4++й>о4+ =0. A.111) Будем искать вещественные функции х(г) и у (г). Тогда х = Ке4+, У = 1т4+. Подста- Подставим в A.111) 4+ в виДе 4+@ = 4ое~/й>'« Тогда для со получается следующее харак- характеристическое уравнение: о?- Его корни а)} 2 = &^ у^О "*"^2- Ларморовская частота п, определяемая форму- формулой A.108), много меньше собственной частоты электрона щ даже в очень сильных магнитных полях. Например, при В = ЮТл A.108) дает п « 1012 с", а частота для видимого света (А = 500нм) &>0 « 4 • Ю^с. Поэтому (Х2/о>0J « 10~7 и вторым членом в подкоренном выражении можно пренебречь, т.е. сох 2 ~ ^^о "~ ^* Первому корню со^ = со^— п соответствует решение 4+(') = 4о е""^'', т.е. х{1) = 4о СО8(й>0 - Я) *, уA) = -4о 5
64 1. Электромагнитные волны в вакууме Это решение описывает движение электрона по окружности в плоскости ху в на- направлении по часовой стрелке с угловой скоростью о>0 — п. Такую же частоту имеет излучаемая им волна. В результате возникает компонента, смещенная в сторону низких частот на п — [е/Bт)]В. При наблюдении поперек поля (в плоскости ху) она имеет линейную поляризацию (см. задачу 1 к п. 1.5). Направление поляризации лежит в плоскости ху, т.е. перпендикулярно индукции магнитного поля. Свет с час- частотой щ — О, распространяющийся вдоль магнитного поля, имеет правую круговую поляризацию. Второму корню характеристического уравнения щ = —Щ ~ & соответствует ре- решение |+(г) =4о^щ+пI9 т.е. Здесь электрон движется в плоскости ху по окружности против часовой стрелки. Поэтому компонента, смещенная в сторону высоких частот, при распространении вдоль магнитного поля имеет левую круговую поляризацию. Исследуя характер круговой поляризации смещенных компонент при наблюдении вдоль магнитного поля, можно установить знак заряда излучающей частицы: вол- волна левой круговой поляризации должна смещаться в сторону высоких частот для отрицательной частицы и в сторону низких — для положительной. Соответствие с опытом получается, если считать, что заряд излучающей частицы отрицателен. По величине расщепления можно установить удельный заряд е/т. Опыт дает такое же значение, как и измерения е/т по отклонению электронных пучков в электриче- электрическом и магнитном полях. Это совпадение можно рассматривать как доказательство того, что оптическое излучение атомов обусловлено движением электронов. Дальнейшие исследования показали, что описанный выше тип расщепления в маг- магнитном поле, называемый нормальным эффектом Зеемана, характерен только для одиночных (синглетных) спектральных линий. Большинство наблюдаемых спек- спектральных линий представляют собой мультиплеты, состоящие из двух или несколь- нескольких тесно расположенных компонент. Примером может служить желтая линия на- натрия, состоящая из двух линий й\ и/>2 {Хх = 589,6 нм, А2 = 589,0 нм), причем ин- интенсивность #2~линии вдвое больше. В магнитном поле й\ -линия расщепляется на четыре компоненты, 1>2'линия — на шесть компонент. Интенсивности отдельных я- и а -компонент таковы, что смесь всех линий при наблюдении в любом направлении дает неполяризованный свет. Расщепление мультиплетов может быть и более сложным. Для объяснения слож- сложного эффекта Зеемана необходима квантовая теория. Причина сложного характера расщепления обусловлена тем, что электрон помимо заряда и связанного с его ор- орбитальным движением магнитного момента обладает еще и собственным моментом импульса (спином) и связанным с ним магнитным моментом. Спиновый момент элек- электрона и его проявления в оптических спектрах не имеют адекватной классической интерпретации. Квантовая теория атома дает исчерпывающее объяснение сложного (или аномального) эффекта Зеемана, как и сложной структуры спектральных линий при отсутствии внешнего магнитного поля. Для простого (нормального) эффекта Зе- Зеемана в случае синглетных спектральных линий квантовая теория приводит к тем же результатам, что и классическая.
1.10. Основы фотометрии 65 Если учитывать причины, вызывающие уширение линий, то каждая компонента, как и вся спектральная линия при отсутствии магнитного поля, характеризуется некоторой конечной шириной. Частбты щ, щ±п соответствуют положению цен- центров этих уширенных компонент. Влияние приложенного к источнику постоянного электрического поля на спектр испускаемого света было обнаружено Штарком в 1913 г. В случае водорода про- происходит расщепление спектральных линий на несколько компонент, пропорциональ- пропорциональное напряженности электрического поля (линейный эффект Штарка). Расщепление спектральных линий атомов, содержащих более одного электрона, пропорционально квадрату электрического поля (квадратичный эффект Штарка). В рамках классической модели источника как совокупности заряженных осцилля- осцилляторов объяснить эффект Штарка невозможно, так как электрическое поле не влияет на собственную частоту гармонического осциллятора. Как и в случае аномального эффекта Зеемана, для объяснения эффекта Штарка требуется привлечение квантовых законов, определяющих строение атома. Эффект Штарка дает вклад в неоднородное уширение спектральных линий газо- газоразрядных источников, так как электрические поля ионов, образующихся в разряде, влияют на частоту света, испускаемого атомами, оказавшимися в этих случайных локальных полях. Контрольные вопросы • Покажите, что постоянное магнитное поле с индукцией В оказывает на излучающий элек- электрон такое же влияние, как и равномерное вращение источника света с угловой скоростью п = -[е/Bт)]В (СИ) или Й = ~[е/Bтс)]В (СГС). • Почему несмещенная компонента отсутствует при наблюдении вдоль поля? • Как электронная теория объясняет поляризацию и относительную интенсивность компо- компонент при наблюдении поперек поля? • Покажите, что сложение всех зеемановских компонент дает неполяризованный свет при наблюдении в любом направлении. Воспользуйтесь тем, что при отсутствии поля все на- направления колебаний электрона равновероятны. • Каким образом эффект Зеемана позволяет определить знак заряда частицы, ответственной за испускание света атомами? 1.10. Основы фотометрии Способы измерения энергетических величин, характеризующих оптическое излу- излучение, были рассмотрены в конце п. 1.4. Здесь мы кратко сформулируем основные понятия фотометрии, приведем соотношения между фотометрическими величинами и их единицы. Поток излучения Фа — это мощность излучения, переносимого электромагнит- электромагнитными волнами через некоторую поверхность а, усредненная за промежуток вре- времени, значительно превышающий период колебаний. Единица потока излучения — ватт (Вт). Поток излучения через поверхность а связан с интенсивностью (8) 3 Зак. 4498
66 1. Электромагнитные волны в вакууме (средней по времени поверхностной плотностью потока энергии) соотношением (здесь 8 — вектор Пойнтинга, см. п. 1.4). Наряду с величинами Фа и (8), характе- характеризующими излучение, вводят еще ряд энергетических величин для характеристики освещаемой поверхности и самого источника излучения. Энергетической освещенностью (облученностью) Е некоторой поверхности на- называют отношение потока излучения, приходящегося на элементарный участок по- поверхности, к площади этого участка: Е = дФ/да. Когда излучение падает перпенди- перпендикулярно поверхности, ее освещенность равна интенсивности (8). При наклонном па- падении (под углом 0) освещенность уменьшается: Е = (8) соз 0. Энергетическая осве- освещенность выражается в тех же единицах, что и интенсивность (Вт/м2). Полная энергия излучения, падающая на 1 м2 поверхности за некоторое время г, называется энергетической экспозицией Н. Этой величиной определяется почерне- почернение фотоэмульсии при фотографической регистрации излучения, широко использу- используемой во многих оптических и спектральных приборах. При неизменной освещенно- освещенности Н — Ег. Экспозиция выражается в джоулях на квадратный метр (Дж/м2). В тех случаях, когда излучение распространяется в виде сферической волны от точечного источника*^, для характеристики пространственно-угловой плотности потока излучения вводят энергетическую силу света, или силу излучения. Силой излучения 7@, ф) в некотором направлении, задаваемом углами 0 и (р сферической системы координат, называется отношение потока излучения дФ в элементарный те- телесный угол (Ш, содержащий данное направление, к этому углу: 7@, ср) = ёФ/(Ш. Размерность силы излучения совпадает с размерностью потока, но в наименовании ее единицы (Вт/ср) указывается единица телесного угла — стерадиан. Полный поток излучения (т.е. поток через замкнутую поверхность, окружающую источник) полу- получается интегрированием энергетической силы света по всем направлениям: 2л л . ,5ш0ё0. О О Ф= //(Ш= [дер [7@, Если источник излучает равномерно по всем направлениям, то сила света 7 не зави- зависит от 0 и (р. Тогда Ф = 4я7. Полный поток излучения характеризует данный источ- источник; этот поток нельзя увеличить никакими оптическими системами. Действие таких систем сводится лишь к перераспределению потока в пространстве, к большей кон- концентрации его по некоторым направлениям (прожектор). При этом сила света 7@, ф) возрастает по одним направлениям и уменьшается по другим. Создаваемая излучением точечного источника освещенность поверхности обратно пропорциональна квадрату расстояния г от источника до поверхности. В самом де- деле, Е = ёФ/ёо", ёФ =7<Ш, а телесный угол сЮ, под которым видна площадка (кг из *) Точечным называют источник, размеры которого малы по сравнению с расстоянием от него до точки наблюдения.
1.10. Основы фотометрии 67 источника, равен дп = да соз а/г2. Здесь а — угол, образованный нормалью к пло- площадке с направлением на источник (рис. 1.27). Таким образом, _ (Ш _ Усоза Е = У — — х . да г2 Для характеристики протяженного источника вводят еще две энергетические величины: яркость и светимость. Пусть AФ — поток излучения, исходящего от пло- площадки да источника в телесный угол дп по направлению, образующему угол в с нор- нормалью к поверхности (рис. 1.28). Отноше- Отношение этого потока к телесному углу и к ви- видимой по данному направлению площади выделенного участка источника да соз в называется энергетической яркостью ис- источника: В (в) = дФI (да соз 0 дп). Едини- Единица энергетической яркости — Вт/(м2 • ср). Из всех фотометрических характери- 1.27. К вычислению освещенности по- поверхности, создаваемой точечным источником (Ш/ стик источника света яркость наиболее непосредственно связана со зрительными ощущениями, так как освещенность изоб- изображения источника света на сетчатке глаза пропорциональна яркости излучающей поверхности по направлению наблюдения. В случае если сила излучения 7@) = дФ/дп, характеризующая элемент да поверхности протяженного источника, пропорциональна видимой по данному на- направлению площади этого элемента да соз 0, то говорят, что источник удовлетво- удовлетворяет закону Ламберта. Яркость ламбертова источни- источника В (в) = У@)/(скгсо5 0) не зависит от 0, т.е. одинако- одинакова по всем направлениям. Примером такого идеального «косинусного» излучателя может служить черное тело (см. п. 9.1). В случае несамосветящихся поверхностей ламбертовым источником с хорошей точностью можно считать мутную среду или матовую поверхность, каж- каждый участок которой рассеивает падающий на нее свет равномерно во все стороны, например освещенный из- изнутри колпак светильника из молочного стекла: его по- поверхность выглядит одинаково яркой при наблюдении под любым углом. Солнце практически не отличается от ламбертова источника; яркость его поверхности почти не зависит от направления. Поэтому Солнце выглядит как плоский диск почти равномерной яркости. Энергетической светимостью К называется отно- отношение потока излучения, исходящего от элемента по- поверхности источника по всем направлениям, к площади этого элемента. Выражение для К через яркость излучающей поверхности можно получить, интегрируя поток энергии по всем направлениям в пределах телесного угла 2я: ' 2л л/2 Рис. 1.28. К определению ярко- яркости излучающей поверхности д== В(в)со$вдП= дер I В(в)со$6$\пвдв.
68 1. Электромагнитные волны в вакууме Для источника, удовлетворяющего закону Ламберта, В = сопз*, и связь между свети- светимостью и яркостью становится особенно простой: К = лВ. Единица энергетической светимости — Вт/м2. Наиболее старый метод измерения энергии излучения в видимой области спек- спектра — визуальный. Здесь приемником излучения служит глаз, а основным способом количественных измерений — визуальное уравнивание яркости двух фотометриче- фотометрических полей: стандартного и измеряемого. При таких измерениях играет роль только та часть энергии излучения, которая непосредственно вызывает световое ощущение. Чувствительность «среднего» глаза к монохроматическому излучению разных длин волн характеризуется спектральной световой эффективностью, или видностыо (см. график на обложке). Очевидно, что при измерениях энергии светового излуче- излучения, основанных на зрительных ощущениях, обычные энергетические характеристики излучения оказываются недостаточными. В таких случаях применяют специальные световые величины, базирующиеся на использовании установленного международ- международным соглашением стандартного источника {светового эталона) с определенным распределением энергии по спектру. В качестве эталонного выбрано излучение аб- абсолютно черного тела (см. п. 9.1) при температуре затвердевания чистой платины B042 К). Основной светотехнической единицей (входящей в число основных еди- единиц СИ) установлена единица силы света У, называемая канделой (от лат. сап<1е1а — свеча). Кандела (кд) — это сила света, испускаемого с 1/60 см2 поверхности эталон- эталонного источника в направлении нормали. За единицу светового потока принимается люмен (лм) — световой поток от точечного источника силой света 1 кд, распространяющийся в пределах телесного угла 1 ср. Единица освещенности люкс (лк) — освещенность поверхности, на 1 м2 которой падает световой поток 1 лм. Точечный источник силой света 1 кд создает освещенность 1лк на поверхности, расположенной в 1м от него перпендикуляр- перпендикулярно лучам. Яркость В (в) = У/(ситсо5 0) выражается в канделах на квадратный метр (кд/м2), светимость К = дФ/да — в люменах на квадратный метр (лм/м2). Вследствие различной чувствительности глаза к излучению разных длин волн све- световому потоку 1 лм соответствует разная мощность в зависимости от спектрального состава излучения. Для монохроматического излучения с длиной волны Я = 555 нм, соответствующей максимальной чувствительности глаза, так называемый механиче- механический эквивалент света составляет 0,0016 Вт/лм. Это минимальная мощность излу- излучения в ваттах, способная создать световой поток 1 лм в наиболее воспринимаемой глазом спектральной области. Во всех фотометрах, предназначенных для визуального сравнения различных ис- источников, роль глаза сводится к установлению равенства освещенностей двух грани- граничащих друг с другом полей. Для достижения этого равенства используют разнооб- разнообразные приемы ослабления освещенности, создаваемой более сильным источником (изменение расстояния, нейтральные фильтры переменной толщины, системы поля- поляризационных призм). При равенстве освещенностей граница между полями исчезает и они сливаются в одно поле. Когда оба поля имеют одинаковый цвет, глаз фиксирует равенство их освещенностей с высокой точностью. Для сравнения источников с разным спектральным составом излучения (гетеро- (гетерохромная фотометрия) равенство освещенностей фотометрических полей, имеющих разный цвет, устанавливают на основе некоторых психофизиологических особенно-
1.10. Основы фотометрии 69 стей зрения (например, совпадение предельной частоты исчезновения мельканий при освещении прерывистым светом рассматривается как признак равенства освещенно- стей полей разного цвета). Контрольные вопросы • Сформулируйте определения основных энергетических характеристик излучения: потока энергии излучения, энергетической освещенности, силы света, яркости, светимости. В ка- каких единицах их выражают? • Что такое точечный источник? Как зависит от расстояния создаваемая им освещенность? • При каком условии протяженный источник называется ламбертовым? Приведите примеры ламбертовых источников. • Почему наряду с энергетическими характеристиками излучения необходимо вводить све- светотехнические? Как определяется основная светотехническая единица — кандела?
Распространение света в изотропных средах При изучении распространения электромагнитных волн (в част- частности, световых волн) в материальной среде нужно учитывать, что любое вещество содержит электроны и ядра, входящие в состав атомов и молекул. Под действием электрического по- поля падающей волны заряженные частицы начинают совершать колебательное движение и сами становятся источниками элек- электромагнитных волн. Эти вторичные волны от всех элементов объема вещества налагаются друг на друга и вместе с падаю- падающей волной образуют в итоге полное электромагнитное поле в веществе, которое и вызывает вынужденное движение входя- входящих в состав вещества зарядов. Последовательная реализация этого подхода приводит к ин- интегральным уравнениям. Опираясь на них, можно показать, как внешнее электромагнитное поле, распространяющееся в пустом пространстве между зарядами среды со скоростью света в вакуу- вакууме, точно компенсируется и заменяется в веществе результиру- результирующим вторичным возмущением, распространяющимся с мень- меньшей скоростью. Эффект сложения падающей волны со вторич- вторичными волнами эквивалентен изменению фазовой скорости света в веществе. Значительно более простым оказывается решение этой зада- задачи не на основе имеющих весьма прозрачное физическое со- содержание интегральных уравнений, а с помощью дифференци- дифференциальных уравнений для средних полей в веществе. Именно та- такой подход и используется в данной главе. Но все же отметим, что достигаемые при использовании дифференциальных урав- уравнений математические упрощения несколько затеняют физиче- физическую картину возникновения преломленной волны как результа- результата наложения первоначальной волны и вновь излученных в ве- веществе волн.
2.1. Уравнения Максвелла в веществе 71 2.1. Уравнения Максвелла для волн в веществе Основные представления о распространении света в веществе могут быть система- систематизированы в рамках классической электронной теории, получившей наибольшее развитие к началу XX века в трудах X. Лоренца. В этой теории электрические свойства вещества объясняются на основе простейшей модели атома, предложен- предложенной Дж. Томсоном, в которой электроны удерживаются в положении равновесия квазиупругой силой. Хотя дальнейшее изучение строения атома привело к отказу от этой модели, связанные с ней представления о макроскопических электромагнитных свойствах вещества дошли до нашего времени без особых изменений. Это означа- означает, что основные результаты электронной теории, относящиеся к распространению света в веществе, не связаны непосредственно с ее примитивными модельными пред- представлениями. Философский аспект подобной ситуации заключается в том, что успешное объяс- объяснение наблюдаемых явлений с помощью некоторой модели еще не может служить решающим ее подтверждением. В то же время полученные на основе определенной модели результаты могут иметь общее значение, выходящее за ее рамки. История физики знает немало таких примеров. Согласно представлениям классической электронной теории, вещество рассматри- рассматривается как совокупность заряженных частиц, размещенных в вакууме на расстояниях, больших по сравнению с размерами самих частиц. Электромагнитное поле сильно меняется на расстоянии между входящими в состав вещества заряженными части- частицами. Однако эти быстрые изменения поля в пространстве в обычных условиях на опыте не наблюдаются. В самом деле, опыт показывает, что свет распространяется в воздухе, стекле и многих других веществах в значительной мере так же, как и в вакууме, т. е. макро- макроскопически эти вещества представляются непрерывными и однородными. Непрерыв- Непрерывными представляются и поля распространяющихся в них электромагнитных волн. Поэтому интерес представляют средние значения характеризующих вещество физи- физических величин, таких как плотность заряда или плотность тока, и средние значения напряженностей электромагнитных полей. Усреднение должно производиться по эле- элементам объема, содержащим макроскопически большое число атомов или молекул, т.е. большим по сравнению со средним расстоянием между частицами. В то же время линейный размер этих элементов объема должен быть много меньше характерного размера макроскопических неоднородностей, мерой которых может служить длина электромагнитной волны. Удовлетворяющие таким условиям элементы объема при- принято называть физически бесконечно малыми. Электрическое и магнитное поля волны остаются почти постоянными на рассто- расстояниях порядка Я/2я, что для видимого света составляет примерно 10~~7м. В объ- объеме A0~~'Kм3 содержится около 108 атомов конденсированного вещества и около 3 • 104 молекул любого газа при нормальных условиях. Поэтому во всем оптическом диапазоне, включая и короткие ультрафиолетовые волны, вещество обычно прояв- проявляет себя как сплошная однородная среда. Лишь в особых условиях, например при распространении света в верхней атмосфере, плотность которой очень мала, или в веществе, находящемся в состоянии, близком к критическому, среда не может рассматриваться как вполне однородная: флуктуации плотности в объемах поряд- порядка (А/2ЯK становятся существенными, что приводит к рассеянию преимущественно
72 2. Распространение света в изотропных средах коротковолнового излучения. В диапазоне рентгеновских лучей, когда длина вол- волны становится сравнимой с межатомными расстояниями, макроскопический подход к веществу как к сплошной среде становится, вообще говоря, неприменимым. Изучение распространения света в веществе облегчается следующими обстоя- обстоятельствами. Электроны в атомах находятся в движении, но их скорость V обычно много меньше скорости света с. Поэтому пропорциональная у/с сила Лоренца A.1), действующая на электрон со стороны магнитного поля световой волны, оказывается пренебрежимо малой по сравнению с силой, действующей со стороны электричес- электрического поля. Сила Лоренца существенна лишь при объяснении давления излучения (см. п. 3.5). Наконец, внутренние электрические поля в атомах, создаваемые зарядами ядер и электронов, обычно значительно превосходят напряженность поля излучения. Ис- Исключение в этом отношении составляет лишь сфокусированное лазерное излучение высокой интенсивности, о распространении которого речь пойдет в гл. 10. Поэтому в обычных условиях излучение лишь незначительно возмущает состояние электро- электронов в веществе. Такие возмущения можно рассмотреть в линейном приближении. Линейность отклика вещества на действие электрического поля волны позволяет воспользоваться методом фурье-анализа. Это значит, что достаточно рассмотреть от- отклик вещества на плоские монохроматические волны различных частот. /Действие электрического поля электромагнитной волны на электрон в атоме вызы- вызывает его смещение из положения равновесия. Относительное смещение отрицатель- отрицательного и положительного зарядов проявляется в том, что атом приобретает дипольный момент. Вещество оказывается поляризованным. *) Макроскопической характери- характеристикой поляризованности вещества служит вектор Р, который равен отношению векторной суммы дипольных моментов всех атомов и молекул в физически беско- бесконечно малом элементе среды к объему этого элемента. Наличие поляризованности вещества означает возникновение в нем поляризаци- поляризационных зарядов и токов, обусловленных связанными в атомах электронами. Эти заря- заряды и токи необходимо учитывать в полных уравнениях Максвелла при нахождении электромагнитного поля. Поэтому для описания электромагнитных волн в веществе нужно искать решение уравнений Максвелла A.2)—A.3), когда заряды и токи р и } не равны нулю, а выражаются через поляризованность Р. Когда вещество поляризовано неоднородно, т. е. вектор Р меняется от точки к точ- точке, то физически бесконечно малый элемент объема приобретает не только диполь- дипольный момент, но и отличный от нуля полный заряд. Макроскопически этот поляриза- поляризационный заряд характеризуется объемной плотностью р, которая выражается через быстроту изменения вектора Р в пространстве (через его производные по координа- координатам) следующим соотношением: р = -У-Р. B.1) Изменение поляризованности с течением времени означает, что создающие ее за- заряды вещества движутся, т. е. возникает поляризационный ток. Он характеризуется вектором плотности тока }, который равен скорости изменения вектора Р: *) Понятие поляризации вещества в электрическом поле не имеет ничего общего с поляризацией элек- электромагнитных волн.
2.1. Уравнения Максвелла в веществе 73 Соотношение B.2) можно пояснить следующим образом. Каждый движущийся элементарный заряд вещества ц вносит в ток свой вклад, равный произведению заря- заряда на его скорость V. Если в единице объема содержится N таких зарядов (движущих- (движущихся с одинаковой скоростью), то они создают плотность тока ] = Мц\. Но V = дг/д/, поэтому ^ = д(Мзт)/с1/ = д?/<\г. Входящие в правые части неоднородных уравнений Максвелла A.2) и A.3) плот- плотность заряда р и плотность тока ^ содержат вклад как внешних источников, созда- создающих интересующее нас поле излучения, так и рассмотренный выше вклад поляри- зованности вещества, выражаемый соотношениями B.1) и B.2). Если, как и в п. 1.1, интересоваться распространяющимися от внешнего источника волнами в тех ме- местах, где внешних источников уже нет, то в правые части уравнений Максвелла A.2) и A.3) войдут только обусловленные поляризованностью плотность заряда р из B.1) и плотность тока ] из B.2): СГС: УЕ=-4яУР, СИ: У-Е=-—У-Р, B.3) Этим уравнениям можно формально придать такой же вид, как и уравнениям Максвелла для вакуума, если ввести вместо напряженности электрического поля Е вектор электрической индукции Б по следующему определению: СГС: Б = Е + 4яР; СИ: Б = г:0Е + Р. B.5) При использовании вектора Б уравнения B.3) и B.4) записываются в виде СГС: УБ = 0, СИ: УБ = 0, B.6) УхВ-~^=0; еос2 V хВ~^=0. B.7) Вторая пара уравнений Максвелла A.9) и A.10) не содержит источников р и ^ и поэтому для полей в веществе имеет тот же вид, что и для полей в вакууме: СГС: УВ = 0, СИ: V • В = 0, B.8) УхЕ+-~ = 0; УхЕ+~=0. B.9) С 61 61 х ассматривая распространение электромагнитных волн в среде, мы говорили о вли- влиянии на вещество только электрического поля волны. Если атомы или молекулы среды обладают магнитными моментами, ориентирующее действие магнитного поля приводит к появлению отличного от нуля суммарного магнитного момента у физиче- физически бесконечно малых элементов объема. Макроскопически такая намагниченность вещества характеризуется вектором М — средней объемной плотностью суммар- суммарного магнитного момента. Процессы ориентации магнитных моментов атомов или молекул происходят медленно по сравнению с периодом колебаний магнитного по- поля в электромагнитной волне оптического диапазона (см. п. 2.7). Поэтому в оптике
74 2. Распространение света в изотропных средах всегда можно считать М = 0. Для описания магнитного поля световой волны в ве- веществе, как и в вакууме, достаточно одного лишь вектора В. *) В дальнейшем мы будем рассматривать решения уравнений Максвелла B.6)—B.9), описывающие плоские монохроматические волны в веществе. Контрольные вопросы • Что такое физически бесконечно малые элементы объема? • Какие условия должны выполняться для того, чтобы можно было использовать это поня- понятие? 2.2. Материальные уравнения. Плоские монохроматические волны в изотропной среде Фундаментальные уравнения Максвелла B.6)—B.9) для электромагнитного поля в веществе еще не составляют полной системы уравнений. Их необходимо дополнить соотношениями, характеризующими свойства рассматриваемой среды. Такие соотно- соотношения устанавливают связь между векторами ЕиБ (или между Е и Р) и называются материальными уравнениями. В быстропеременных электромагнитных полях, заметно изменяющихся за време- времена, сравнимые с временем установления (релаксации) электрической поляризован- ности вещества, связь между Е и Р становится, вообще говоря, довольно сложной. В отличие от медленно меняющихся полей значение поляризованности Р в некото- некоторый момент времени отнюдь не определяется значением напряженности Е в тот же момент, а зависит от значений функции Е(/) во все предыдущие моменты време- времени. Только в монохроматических полях связь между Е и Р оказывается сравнитель- сравнительно простой. Поэтому целесообразно сначала рассмотреть распространение в среде монохроматических волн определенной частоты со. Чтобы для таких волн можно было использовать макроскопическое описание поля, длина волны Я, имеющая по- порядок с/со, должна быть много больше среднего расстояния между атомами или молекулами среды. Зависимость напряженности электрического поля плоской монохроматической волны от координат и времени может быть записана в виде Е(гл)=Еое/(кг-^). B.10) Волновой вектор к перпендикулярен поверхностям постоянной фазы и характери- характеризует направление волны, а его модуль к (волновое число) обратно пропорционален длине волны: Я = 2л/к. В пределах элемента объема, малого по сравнению с длиной волны, электрическое поле волны B.10) можно считать однородным**) и изменяю- изменяющимся со временем по гармоническому закону: Еое-/а". B.11) *) Влияние магнитного поля волны на поляризованность среды в области оптических частот неотличи- неотличимо от эффектов пространственной дисперсии (см. п. 2.9). **) Влияние неоднородности электрического поля монохроматической волны обсуждается в п. 2.9.
2.2. Материальные уравнения. Плоские волны в среде 75 Если амплитуда Ео напряженности поля световой волны много меньше напряжен- напряженности внутриатомных электрических полей, отклик вещества на поле волны можно считать линейным. Это значит, что поляризованность среды в пределах рассматри- рассматриваемого элемента объема однородна и совершает вынужденные колебания под дей- действием поля Е(/) по гармоническому закону с частотой внешнего воздействия со и амплитудой Ро, пропорциональной Ео: СГС: Р@ = Ро е-*" = *(*>) Ео е"'"'; СИ: Р(/) = Р0 е-|й" = еоХ(<о) Ео е"'"'. Направление вектора Р в изотропной среде, где нет физически выделенных на- направлений, совпадает с направлением вектора Е. Поэтому коэффициент пропорци- пропорциональности х(&) между Р и Е, называемый диэлектрической восприимчивостью, в изотропной среде является скаляром. *) В однородной среде, свойства которой всю- всюду одинаковы, восприимчивость %{(о) не зависит от пространственных переменных. При вынужденных колебаниях электронов вещества под действием электричес- электрического поля волны их движение, создающее поляризованность, вообще говоря, про- происходит с отставанием по фазе от колебаний напряженности электрического поля. Это запаздывание по фазе в формуле B.12) проявляется в том, что восприимчи- восприимчивость х{й>) — комплексная величина. В тех случаях, когда можно пренебречь затуханием элементарных осцилляторов, отставания по фазе не будет и восприимчивость выражается вещественной вели- величиной. Так будет для частот, далеких от собственной частоты осцилляторов, т.е. в спектральной области прозрачности среды. Характеризующая распространение монохроматической волны восприимчи- восприимчивость х(о>) зависит от частоты волны со. Об этой зависимости говорят как о законе дисперсии восприимчивости. Вид функции х((о) определяется структурой вещества. Ее можно рассчитать в рам- рамках той или иной идеализированной модели. Сравнительно простой оказывается мо- модель для вещества с малой плотностью (газы, плазма), рассматриваемая в классичес- классической электронной теории дисперсии (см. п. 2.3). В плотном материале (конденсиро- (конденсированные среды) атомы расположены тесно и сильно взаимодействуют друг с другом. Собственные частоты со0 и коэффициенты затухания у атомных электронов в плот- плотном веществе из-за этих взаимодействий будут иными, чем у свободных атомов. Кроме того, локальное поле, действующее на отдельный атом в плотном веществе, отличается от среднего макроскопического поля Е. Все это приводит к тому, что точное вычисление функции %(&>) (теория дисперсии) для плотного вещества пред- представляет собой трудную задачу, которая решена только для некоторых особенно простых веществ. Однако составить ясное физическое представление о многих явлениях, связанных с распространением света в веществе, можно и не решая задачи вычисления функ- функции восприимчивости %(&)). Для этого можно воспользоваться уравнениями Макс- Максвелла и феноменологической теорией, в которой материальное уравнение B.12), * > В анизотропных средах (кристаллах) направление поляризованности Р в общем случае не совпада- совпадает с направлением напряженности электрического поля Е, т.е. диэлектрическая восприимчивость х(ы) является тензором (см. п. 4.2).
76 2. Распространение света в изотропных средах связывающее поляризованность Р с напряженностью Е поля монохроматической вол- волны, считается заданным (например, полученным путем экспериментальных измере- измерений на разных частотах со). В рамках такой феноменологической теории удобно перейти от уравнений Макс- Максвелла B.3)-B.4), содержащих поляризованность Р, к иной их форме B.6) —B.7), аналогичной соответствующим уравнениям для вакуума. При этом вместо Е и Р в них фигурирует единственный вектор Б, определяемый соотношением B.5). По- Поскольку вектор Р такой заменой из дальнейшего рассмотрения исключается, це- целесообразно вместо функции восприимчивости %(&)), связывающей Р и Е, ввести диэлектрическую проницаемость е(со), связывающую векторы Б и Е в монохрома- монохроматической волне частоты со: СГС: В@ = Бо е~1ш = е{со) Ео е~(ш = е{со) () B.13) СИ: Б@ = Во е~ш = е0е(со) Е0 е""' = е0е(со) Е(/). В излагаемой теории соотношение B.13) играет роль материального уравнения. Что- Чтобы выразить функцию е(со) через %(&>), подставим в B.5) Е из B.11), Р из B.12) и Б из B.13). В результате получим СГС: е(со) = 1 + 4лх((о); СИ: е(со) = 1 + х((о). B.14) В изотропной однородной среде е((о), как и #(<и), является скаляром и не зави- зависит от пространственных координат. В случае комплексной восприимчивости %(со) диэлектрическая проницаемость также будет комплексной: е(со) = е'(со) + 1е"(со). B.15) Ее вещественная часть е'(со) определяет ту составляющую индукции Б, которая из- изменяется в фазе с напряженностью Е электрического поля, а мнимая часть €п(со) — составляющую Б, которая отстает от Е на я/ 2. Ниже мы увидим, что веществен- вещественная часть е ответственна за преломление света на границе среды, а мнимая — за поглощение света в веществе. Отметим, что между вещественной и мнимой частями е(со) существуют интегральные со- соотношения (формулы Крамерса—Кронига), которые являются прямым следствием чрезвычай- чрезвычайно общего физического принципа причинности. Они позволяют вычислить, например, функ- функцию е!(со), если известна для данного вещества функция еп(и>) во всем диапазоне частот со. Поэтому для полной характеристики оптических свойств среды в феноменологической теории достаточно знать (например, из эксперимента) только одну из этих функций, скажем с"(со). Выразим в уравнениях Максвелла B.6)-B.7) индукцию Б через напряженность Е поля с помощью материального соотношения B.13), согласно которому в монохро- монохроматической волне В = е(со)Е (СГС), Б = еое(со)Е (СИ): СГС: УЕ = 0, СИ: V • Е = 0, B.16) у*В«М ЛхВ,ф,)|. A17) Нас интересует решение этих уравнений в виде плоской монохроматической волны, в которой зависимость характеристик электрического и магнитного полей от коорди-
2.2. Материальные уравнения. Плоские волны в среде 77 нат и времени выражается формулой B.10). Для таких функций дифференцирование по времени сводится к умножению на — г со, а применение оператора дифференциро- дифференцирования по координатам V — к умножению на /к. Поэтому уравнения B.16)—B.17), а также вторая пара уравнений Максвелла B.8)—B.9) превращаются из дифферен- дифференциальных уравнений в алгебраические: СГС: к-Е = 0, СИ: кЕ = 0, B.18) к х В = ~е(со) - Е, ЛхВ = -е(со)со Е, B.19) с к • В = 0, к • В = 0, B.20) кхЕ=~В; кхЕ = соВ. B.21) с Эти уравнения*) однородны, и из условия существования их ненулевого решения можно получить допустимые при данной частоте со значения волнового числа к, определяющего фазовую скорость волны. Подставив В из B.21) в B.19), найдем 2 к х (к х Е) = -е{со)%Е. B.22) с1 Раскрывая двойное векторное произведение в левой части и учитывая, что, соглас- согласно B.18), к • Е = 0, находим условие к2 = ф>)^-, B.23) при выполнении которого уравнения B.18)—B.21) имеют ненулевое решение. В общем случае, когда е(со) — комплексная величина, к2 тоже становится ком- комплексным. Здесь могут представиться разные случаи. Запишем вектор к в виде к = к' + /к", где к' и к!' — вещественные векторы. Подставляя в B.23) к2 = к'2 — к + Ик!к!', находим, что вектор к может быть вещественным только тогда, когда величина е(со) вещественна и положительна. Но даже и в этом случае к все же может быть ком- комплексным, если только к'к" = 0 (например, при полном отражении, см. п. 3.3). В случае комплексного вектора к волна B.10), вообще говоря, не будет плоской в обычном смысле этого слова. В самом деле, записав B.10) в виде Е(г, I) = Ео е е ^ ', B.24) убеждаемся, что плоскости постоянной фазы перпендикулярны вектору к', в то вре- время как поверхности постоянной амплитуды представляют собой плоскости, перпен- перпендикулярные вектору к", в направлении которого происходит затухание волны. Если векторы к' и к!' имеют различные направления, то волну B.24) называют неодно- неоднородной плоской волной. Рассмотрим наиболее важные частные случаи. *} Для монохроматических полей уравнения B.18) и B.20) следуют из уравнений B.19) и B.21) соот- соответственно: при подстановке Е из B.19) в B.18), как и при подстановке В из B.21) в B.20), получаем тождества. Поэтому из восьми уравнений (двух скалярных и двух векторных) здесь независимы только шесть.
78 2. Распространение света в изотропных средах Во многих веществах электромагнитные волны в широком диапазоне частот рас- распространяются практически без ослабления. Примером может служить прохождение видимого света сквозь стекло, воздух, воду и другие прозрачные газы и жидкости. В случае таких непоглощающих сред диэлектрическая проницаемость е(со) для рас- рассматриваемых частот вещественна и положительна. Волновой вектор при этом также веществен и, как следует из B.23), по модулю равен к = -у/ёЩ=-п(а>), B.25) с с где п = у/ё — показатель преломления среды. Это очень важная характеристика оп- оптических свойств вещества. Через показатель преломления выражается, в частности, фазовая скорость монохроматической волны. Действительно, как видно из B.10), « = Т = -Т-у Зависимость фазовой скорости (или показателя преломления) от частоты (или от длины волны) называется дисперсией.*^ Наличие дисперсии позволяет в экспе- эксперименте «рассортировать» монохроматические компоненты сложной волны, так как при наклонном падении на границу вещества эти компоненты в преломленном из- излучении распространяются в различных направлениях. На этом принципе действуют призменные спектрографы и монохроматоры. Дисперсия проявляется не только в эффекте преломления на границе вещест- вещества. Она сильно влияет и на прямолинейное распространение немонохроматического излучения в объеме вещества, так как различные монохроматические компоненты имеют отличающиеся скорости, т.е. как бы «идут не в ногу». При этом огибающая модулированной волны перемещается с так называемой групповой скоростью, не сов- совпадающей с фазовой скоростью. Подробно эти эффекты рассматриваются в п. 2.11. В случае вещественного волнового вектора к из уравнений B.18) и B.20) следу- следует, что векторы электрического и магнитного полей лежат в плоскости, перпенди- перпендикулярной вектору к, т.е. световая волна поперечна. Из B.19) или B.21) видно, что векторы Е и В перпендикулярны друг другу и вместе с вектором к образуют правую тройку векторов (как орты \,}, к правой системы координат). Величины векторов Е и В в каждой точке и в любой момент времени связаны соотношением СГС: у/ф))Е = В; СИ: у/Ф>) Е = сВ. B.27) Для каждого конденсированного вещества имеются полосы частот, в которых оно поглощает излучение. В поглощающей среде волновой вектор становится комплекс- комплексным, но может при этом иметь определенное направление, т.е. векторы к' и к" параллельны друг другу. Такая волна будет плоской в буквальном смысле, так как для нее поверхности постоянных значений напряженности поля представляют со- собой плоскости, перпендикулярные направлению распространения. Чтобы подчерк- * * Слово «дисперсия» означает разброс, отклонение, рассеяние. Это слово используется для обозна- обозначения различных понятий. Например, в статистике дисперсией называют среднюю квадратичную ошиб- ошибку или меру разброса значений случайной величины от среднего. В оптике под дисперсией понимают круг явлений, берущий начало в известных опытах Ньютона по различному преломлению цветных лучей в призме. Под дисперсией в узком смысле этого слова понимают зависимость показателя преломления от частоты п{(о) (или от длины волны А).
2.2. Материальные уравнения. Плоские волны в среде 79 нуть это, ее называют однородной плоской волной. Иначе говоря, в такой волне плоскости постоянной фазы и плоскости постоянной амплитуды параллельны друг другу. При параллельных к' и к" можно ввести комплексную «длину» волнового век- вектора, записав к в виде /геь где е# — единичный вектор в направлении к. Тогда из B.23) имеем к = \/е(со) со/с. Комплексную величину \/е(со) обычно пишут в ви- виде п + IX с вещественными п и х и называют комплексным показателем преломле- преломления. Поэтому к = (п + 1х)а)/с. Выбирая ось г в направлении вектора к и подставляя комплексную величину к в B.10), получаем для этого случая зависимость напряжен- напряженности электрического поля волны от координат и времени: Е(г,г) =Еое-^/се-^-пг/с). B.28) Вещественная часть показателя преломления п, как и в случае прозрачной среды, определяет фазовую скорость волны V = с/п. Мнимая часть х называется показате- показателем затухания. Она характеризует ослабление волны по мере ее распространения: как видно из B.28), на расстоянии Дг = с/со = Яо/Bя), где Ао — длина волны дан- данной частоты со в вакууме, амплитуда приобретает множитель е~"*. Заметим, что затухание волны не обязательно связано с истинным поглощением электромагнитной энергии: диссипация энергии происходит лишь тогда, когда мни- мнимая часть е((о) отлична от нуля, а коэффициент х может быть отличен от нуля и при вещественном (отрицательном) е(со). Именно так дело обстоит для плазмы при со < (Ор, где о)р — плазменная частота (см. п. 2.3). Фактически это означает, что излучение при е(со) < 0 не может проникнуть в вещество и происходит полное отражение волны на границе. Векторы электрического и магнитного полей в затухающей плоской волне перпен- перпендикулярны друг другу и направлению распространения, а их величины по-прежнему связаны соотношением B.27), но только с комплексным значением е(со). Если запи- записать у/г в виде у/с = у/п2 + х2 ехр [/ агс*§(лг/и)], то становится ясно, что колебания магнитного поля отстают по фазе от колебаний электрического поля на угол агс1§(лг/и) в отличие от волн в вакууме или прозрачной среде, где колебания полей в каждой точке происходят синфазно. Основываясь на уравнениях Максвелла B.6)—B.9) для средних полей в веществе, можно показать, что плотность потока энергии и в этом случае характеризуется век- вектором Пойнтинга A.50), хотя выражение для закона сохранения энергии электромаг- электромагнитного поля в среде имеет иной вид, чем выражение A.49) или A.51) для вакуума. Для волны с определенным направлением вектора к (т.е. при параллельных к' и к") вектор Пойнтинга направлен вдоль к. Интенсивность (среднее по времени значение плотности потока энергии) пропорциональна квадрату амплитуды напряженности поля и в поглощающей среде, характеризуемой комплексным показателем прелом- преломления п 4- IX, убывает вдоль направления волны по закону 50с~а1. B.29) Экспоненциальное уменьшение интенсивности по мере проникновения излуче- излучения в среду, выражаемое соотношением B.29), называют законом Бугера. Величина
80 2. Распространение света в изотропных средах а = 2хсо/с, называемая коэффициентом поглощения, характеризует быстроту это- этого уменьшения: на расстоянии I = \/а интенсивность уменьшается ве« 2,72 раза. В материалах, которые мы считаем прозрачными, расстояние / («глубина проникно- проникновения») обычно много больше толщины материала. Если мнимая часть с (со) отлична от нуля, затухание интенсивности излучения обусловлено поглощением энергии и определяется работой, совершаемой электриче- электрическим полем волны Е над поляризационными токами в веществе, плотность з которых равна ёР/д/. Эта работа в единице объема в единицу времени равна Е ^, и ее среднее значение отлично от нуля, если у ] = с!Р/с1/ есть составляющая, изменяющаяся в фа- фазе с Е(г). Такая составляющая существует, когда мнимая часть восприимчивости % (и следовательно, мнимая часть е) отлична от нуля. Усиливающим (активным) средам соответствуют отрицательные значения показа- показателя затухания к и коэффициента поглощения а (см. п. 2.5). Контрольные вопросы • Что такое диэлектрическая восприимчивость %(&>)? • Почему материальное уравнение Р(/) = #Е(/), связывающее поляризованность Р(/) с вызы- вызывающим ее электрическим полем Е(г), справедливо только для монохроматических полей? • Какой физический смысл имеет вещественная часть диэлектрической восприимчиво- восприимчивости %\о)I мнимая часть х"{о)I • При каком условии волновой вектор к плоской волны в среде будет вещественным? Может ли вектор к быть комплексным при вещественном е(соI • Как расположены плоскости постоянной фазы и плоскости постоянной амплитуды в волне, характеризуемой комплексным волновым вектором к = к' + /к"? • Как связаны между собой векторы электрического и магнитного полей монохроматической волны в веществе? • Какой физический смысл имеют вещественная и мнимая части комплексного показателя преломления? • По какому закону изменяется интенсивность излучения по мере его распространения в среде? • Что такое коэффициент поглощения и как он связан с показателем затухания? • При каком условии затухание волны обусловлено поглощением энергии? 2.3. Классическая электронная теория дисперсии й п. 2.2 были введены материальные уравнения, связывающие поляризованность среды Р (или электрическую индукцию В) с напряженностью Е электрического по- поля монохроматической волны, что позволило рассмотреть свойства монохроматиче- монохроматических плоских волн в веществе. Для обоснования феноменологических материальных уравнений и нахождения явного вида входящей в них диэлектрической восприимчи- восприимчивости х(<у) (или диэлектрической проницаемости е(со)) в той или иной среде, т.е. для «объяснения» дисперсии, необходима микроскопическая теория взаимодействия электромагнитного поля волны с веществом.
2.3. Классическая электронная теория дисперсии 81 Микроскопическая теория исходит из некоторой идеализированной модели стро- строения вещества. Наибольшей простотой отличается модель газообразной среды, так как для нее в первом приближении можно не учитывать взаимодействие атомов или молекул и, кроме того, считать, что действующее на отдельный атом поле совпа- совпадает со средним полем электромагнитной волны. В таких условиях для получения макроскопического материального уравнения достаточно рассмотреть действие поля световой волны на изолированный атом. Входящие в состав атома электроны можно разделить на внешние, или оптиче- оптические, и электроны внутренних оболочек. Принятая терминология обусловлена тем, что с излучением оптического диапазона взаимодействуют по сути дела только внеш- внешние электроны. Собственные частоты электронов внутренних оболочек столь велики, что поле световой волны на них почти не влияет и лишь для рентгеновского излуче- излучения внутренние электроны становятся существенными. В классической теории дисперсии оптический электрон в атоме рассматривается как затухающий дипольный осциллятор, характеризуемый определенной собственной частотой со0 и постоянной затухания у, так что уравнение его движения в поле Е(/) световой волны имеет вид г + 2уг + со1г = — Е(/), B.30) т где г — смещение электрона из положения равновесия. Силу Лоренца, действующую на электрон со стороны магнитного поля световой волны, в это уравнение не вклю- включают, так как ее величина отличается множителем у/с от силы — еЕ(/), а скорость V оптического электрона в атоме много меньше скорости света с. Сила Лоренца суще- существенна лишь для объяснения давления света. Уравнение B.30) основано на предположении о том, что к движению электрона в атоме применимы законы классической механики. С позиций современной физи- физики это предположение совершенно неоправданно. В атомных масштабах движение электрона подчиняется законам квантовой, а не классической механики. Поэтому может сложиться впечатление, что классическая теория дисперсии лишена физиче- физического содержания и представляет лишь исторический интерес. Однако это не так. Дело в том, что для описанной выше модели гармонического осциллятора кванто- квантовая теория дисперсии приводит к таким же результатам, что и классическая. Для такой модели различие в принципах (классическая или квантовая теория) примени- применительно к вопросам дисперсии оказывается несущественным, хотя в других вопросах (например, в вопросе о средней энергии гармонического осциллятора в состоянии теплового равновесия, см. п. 9.2) есть различие. Другое дело, что сама модель дипольного осциллятора (восходящая к предло- предложенной Томсоном простейшей модели атома), используемая в классической теории дисперсии, выглядит чрезмерно упрощенной в свете современных представлений о строении атома. Например, для атома водорода правильные, согласующиеся с опы- опытом результаты получаются, когда мы считаем, что на электрон действует куло- новская сила, обратно пропорциональная квадрату расстояния до центра (~ 1/г2), а не квазиупругая, пропорциональная расстоянию (~ г). Никаких квазиупругих сил и сил трения, пропорциональных скорости, в атомах нет. Строение атомов и моле- молекул определяется кулоновскими силами взаимодействия электронов и ядер. Однако
82 2. Распространение света в изотропных средах классическая физика оказалась не в состоянии объяснить на основе этих сил струк- структуру и даже само существование атомов и молекул как устойчивых образований. Это и не удивительно, так как уравнения классической физики получены на осно- основе макроскопического опыта и в масштабах атома оказываются за пределами своей применимости. Правильную теорию атома дает квантовая механика. Поэтому и последователь- последовательная теория дисперсии, использующая реалистическую модель среды, должна быть квантовой. Однако ее изложение выходит за рамки данной книги. Мы вынуждены здесь ограничиться упрощенной моделью атома как гармонического осциллятора, для которой квантовая теория, как уже говорилось, приводит к тем же результатам, что и классическая. Такой подход оправдывается тем, что последовательная кванто- квантовая теория дисперсии, учитывающая реальную структуру атома, дает аналогичный результат, хотя и с некоторыми особенностями, о которых сказано ниже. Входящая в уравнение B.30) собственная частота со0 атомного электрона может быть рассчитана только на основе квантовой теории атома. В рамках классичес- классической теории дисперсии ее следует рассматривать как феноменологически введенную постоянную. В эксперименте значение со0 определяет частоту линии поглощения в спектре исследуемого вещества (см. ниже). Постоянная затухания у, характеризующая в B.30) силу «сопротивления», про- пропорциональную скорости электрона, содержит вклад, обусловленный радиационным затуханием: в классической теории осциллирующий электрон обязательно излучает. Другие причины затухания (например, взаимодействие с другими атомами и соуда- соударения) связаны с диссипацией энергии электромагнитного поля, т. е. с ее превраще- превращением в другие формы (в теплоту). Такое диссипативное затухание можно считать истинным поглощением и включить его вклад в константу у. Относительная роль разных членов в уравнении B.30) зависит от рассматриваемой области частот. На- Например, при частотах со, далеких от собственной частоты со0 осциллятора, затухани- затуханием, как правило, можно пренебречь. Заметим, что в уравнении B.30) осциллятор предполагается изотропным, т. е. ква- квазиупругая сила —тсоцГ одинакова при смещении электрона в любом направлении. В монохроматической волне действующее на осциллятор поле Е(/) в правой ча- части B.30) изменяется со временем синусоидально: Е(О = Еое-^. B.31) Нас интересует частное решение уравнения B.30), описывающее установившиеся вынужденные колебания осциллятора. Эти колебания под действием синусоидальной внешней силы также будут синусоидальными, и их частота совпадает с частотой вы- вынуждающей силы. Поэтому решение уравнения B.30) для смещения электрона г{г) можно искать в виде Амплитуду г0 найдем, подставляя г(/) и его производные в левую часть B.30) и дей- действующее поле Е(/) из B.31) в правую часть. В результате получим г(,) = — — 1 Е(г). т соц — со2 — Псоу
2.3. Классическая электронная теория дисперсии 83 Индуцированный действующим полем Е(/) дипольный момент атома р(/) ра- равен —етA) и, следовательно, пропорционален напряженности: р@ 4 -—]- т о>0 — со* — Зависящий от со коэффициент пропорциональности между р и Е в B.32) называется атомной поляризуемостью а(со): СГС: р = а(й>)Е; СИ: р = е0а(со)Е. B.33) Если N — концентрация атомов вещества, то поляризованность Р равна Мр. Огра- Ограничимся пока случаем достаточно разреженной среды (газы или пары), чтобы дей- действующее на осциллятор поле Е(/) в B.32) и B.33) можно было считать совпада- совпадающим со средним макроскопическим полем, которое входит в уравнения Максвел- Максвелла и в соотношение B.12), определяющее диэлектрическую восприимчивость %(&>). Подставляя в B.12) Р = #р с р из B.33) и отождествляя Е из B.33) с Еое~/й>/ в B.12), находим восприимчивость: СГС: х{а>) т оJ - со2- 2шу B.34) СИ: хк0*) = Маш) = ~ г . те0 (о*-со2- 2шу Диэлектрическая проницаемость е(со) связана с х(<*>) соотношением B.14). Под- Подставляя в него х(<*>) из B.34), получаем х(ы) Для рассматриваемой модели разре- разреженной среды, содержащей N осцилляторов в 1 м3, СГС: е(со) = 1 + т со2 — со2 — 2шу' СИ: е(со) = 1 + 111- -^ т • те0 со$-со2 - 2шу Для упрощения записи дальнейших формул удобно ввести характеризующую модель среды константу сор согласно следующему определению: СГС: с^ = -^~; СИ: < = —. B.36) р т р те0 Она имеет размерность частоты. Теперь е(со) из B.35) можно записать в виде е(со) = I + Шр . . B.37) 0)^ + СО * — 21(х)у Вследствие затухания атомных осцилляторов диэлектрическая проницаемость оказывается комплексной. Выделяя в B.37) вещественную и мнимую части е! + /г:7', можно получить выражения для зависящих от частоты показателя преломления п(со) и показателя затухания х(^)« Эти выражения весьма громоздки, поэтому анализ фи- физических результатов электронной теории дисперсии проведен ниже для сравнитель- сравнительно простых частных случаев.
84 2. Распространение света в изотропных средах Контрольные вопросы • Какая модель среды рассматривается в классической теории дисперсии? • Поясните физический смысл отдельных членов в уравнении B.30). 2.4. Дисперсия вдали от линии поглощения При частотах, далеких от собственной частоты со0 атомных осцилляторов, где вы- выполняется условие 2соу <С \со% — со2\, мнимой частью в B.37) можно пренебречь. Тогда для зависимости показателя преломления от частоты получаем следующую приближенную формулу: п2(со) = е(со) = 1 + $ — со2 B.38) При достаточно малой концентрации N (газы или пары) вдали от собственной час- частоты со0 (когда со2 <С \со$ — со2\) показатель преломления п близок к единице, т.е. второй член в B.38) мал по сравнению с первым. Применяя приближенную форму- формулу \/\ + х « 1 + х/2 (при х «: 1), из B.38) получаем СГС: п(со) » 1 + 1 т 1 — СО* СИ: п(со) « 1 + Ые2 1 2те B.39) 0 (хJ Описываемая этой формулой зависимость показателя преломления от частоты показана на рис. 2.1. При тех значениях частоты, где формула B.39) применима, показатель преломления, как видно из рис. 2.1, возрастает с увеличением частоты. Такой характер зависимости п(о>) называют нормальной дисперсией. Для низких частот (со < со0) показатель преломления (см. B.39)) больше единицы, т. е. фазовая скорость с/п волны в среде меньше скорости света в пустоте. Это значит, что измененная средой волна отстает по фазе от падающей. Если же час- частота света больше собственной частоты осцилляторов (со > со0), то п < 1 и фазо- фазовая скорость волны в среде V = с/п ока- оказывается больше скорости света в ваку- вакууме, т.е. измененная волна по фазе опе- опережает падающую. Никакого противоре- противоречия с теорией относительности здесь нет. со Теория относительности утверждает, что скорость материальных тел и скорость сигнала не могут превышать с. Поня- Понятие показателя преломления применимо к монохроматической волне, имеющей бесконечную протяженность в простран- пространстве и во времени, т. е. к установившим- Рис. 2.1. Зависимость показателя преломления ВЫнл/жпенным когтебяниям оспиттттято- сильно разреженной среды от частоты (диспер- ся вынужденным колебаниям осциллято- сионная кривая) вдали от собственной частоты ров среды. Монохроматическая волна не атомных осцилляторов со0 может служить для передачи сигнала. ||
2.4. Дисперсия вдали от линии поглощения 85 Сигнал равносилен неустановившемуся процессу, и из одного факта п < 1 ниче- ничего нельзя заключить о скорости сигнала (см. п. 2.11). Тот факт, что при со > со0 установившаяся волна в среде по фазе опережает падающую волну, удивителен не более, чем то, что маятник при установившихся вынужденных колебаниях движет- движется противоположно действующей на него силе, если частота этой силы больше его собственной. Многие вещества имеют собственные частоты а)§ (и связанные с ними полосы по- поглощения) в далекой ультрафиолетовой части спектра. Поэтому для частот со во всей видимой области справедливо неравенство со <С а)$ (начальный участок левой ветви кривой на рис. 2.1). Рассматривая (о)/со0J как малый параметр, преобразуем правую часть B.38) следующим образом: > Переходя в B.40) от частоты со к длине волны (в вакууме) А = 2л с /со, получаем простую формулу для п2(А), удобную для сравнения с опытными данными: B.41) где А = % B.42)  В = Щ-. B.43) Щ Выражаемая формулой B.41) зависимость показателя преломления от длины вол- волны (с некоторыми эмпирическими константами А и В) была предсказана Френелем и Коши задолго до появления электронной теории дисперсии. Во многих случаях она дает удовлетворительное описание экспериментальных данных. Сравнение теорети- теоретической зависимости B.41) с экспериментально наблюдаемой позволяет определить значения констант А и В для конкретной среды. При этом появляется возможность проверки электронной теории дисперсии, так как константы А и В можно оценить по B.42) и B.43). Для такой оценки нужно знать концентрацию N атомов и собствен- собственную частоту оH. В тех случаях, когда сведения о частоте оH отсутствуют, можно оценить отношение В /Л, которое (см. B.42), B.43)) не зависит от со0, и получен- полученную оценку сравнить с опытными данными. Подобные оценки во многих случаях дают удовлетворительное совпадение (в пределах 10—20%) с экспериментальными значениями. Формула B.38), как уже отмечалось, справедлива для разреженной среды, так как при ее выводе предполагалось, что действующее на отдельный атом поле совпадает со средним макроскопическим полем Е. В плотном веществе (жидкости, твердые тела) это-предположение несправедливо, так как напряженности полей, создавае- создаваемых дипольными моментами соседних атомов, индуцированными внешним полем, могут быть одного порядка с Е. Напряженность этого дополнительного поля можно
86 2. Распространение света в изотропных средах приближенно найти, представив себе, что рассматриваемый атом находится в цен- центре сферической полости, вырезанной в окружающем его диэлектрике. Аналогичная задача встречается в электростатике диэлектриков. Можно показать, что локальное поле Елок в сферической полости, вырезанной в поляризованном диэлектрике, связа- связано со средним полем Е и поляризованностью Р соотношением СГС: Елок = Е + —Р; СИ: ЕЛОк = Е + —. B.44) Строго говоря, напряженность поля, действующего на атом, совпадает с напряженно- напряженностью поля в полости B.44) только в случае изотропного материала или кубического кристалла. Хотя соотношение B.44) получено в электростатике, его можно исполь- использовать и для электрического поля электромагнитной волны, пока длина ее много больше размеров полости, т. е. среднего расстояния между соседними атомами. Счи- Считая, что входящее в B.33) поле, действующее на рассматриваемый атом, совпадает с локальным полем B.44), для зависимости показателя преломления от частоты мы придем вместо B.38) к формуле, полученной X.Лоренцем и Л.Лоренцем: п2 - 1 со2 Для разреженной среды, показатель преломления которой близок к единице, в знаменателе левой части можно положить п2 4- 2 « 3 и B.45) сводится к выра- выражению B.38). В конденсированной среде помимо учтенного в B.45) отличия дей- действующего на отдельный атом поля от среднего существенны и другие усложнения, обусловленные тесным расположением атомов. Из-за взаимодействия соседних ато- атомов собственные частоты со0 атомных осцилляции оказываются сильно сдвинутыми и «размазанными», а постоянная затухания у увеличенной, т.е. значения а>0 и у оказываются иными, чем у свободных атомов. Правая часть формулы B.45) пропорциональна концентрации N атомов, а следо- следовательно, и плотности вещества р. Поэтому величина ±•44- р п2 + 2 называемая удельной рефракцией, для данного вещества не должна изменяться при изменении плотности. Во многих случаях это условие хорошо выполняется. На- Например, для воздуха при увеличении его давления от нормального атмосферного в 200 раз удельная рефракция (на фиксированной частоте) остается постоянной с точностью около 10~3. Иногда удельная рефракция почти не изменяется даже при переходе вещества из газообразного состояния в жидкое. Так, при ожижении кисло- кислорода удельная рефракция изменяется менее чем на 1 %; при конденсации водяного пара — всего на 3 %, хотя плотность р изменяется при этом на три порядка. Имеется, однако, немало случаев, когда постоянство удельной рефракции не соблюдается. Контрольные вопросы • Фазовая скорость электромагнитных волн в веществе при п < 1 превышает скорость света в вакууме. Почему это заключение не противоречит теории относительности? • Как изменяется показатель преломления данного вещества при изменении его плотности?
2.5. Аномальная дисперсия 87 2.5. Аномальная дисперсия Вернемся к выражению B.37) для диэлектрической проницаемости с((о), справед- справедливому для достаточно разреженной среды, и исследуем теперь на его основе дис- дисперсию вблизи собственной частоты со0 атомного осциллятора. В этом случае (при со « со0) пренебрегать членом с постоянной затухания у в B.37) нельзя и е((о) оказывается комплексной. Показатель преломления \/е{(о) — п-\-1х также будет комплексным. Для нахо- нахождения его вещественной (п) и мнимой (л:) частей приравняем п2—х2 вещественной части е(со) из B.37), а 2пх — мнимой части е(со): (со$ - со2J + 4со2у2 (со$ - со2J + 4со2у2 При частотах со, близких к собственной частоте со0, в формулах B.47) возмож- возможны упрощения: при со «со0 всюду, кроме ((о% — со2), можно заменить со на со0, а (о)ц — (о2) преобразуется следующим образом: (Оц — со2 = (соц + со)(со0 — со) « 2со0А(о, B.48) где Асо = (Оц — со. В результате формулы B.47) принимают вид ^ Л^ пх=^У__ B.49) 2со0 (АсоJ + у2 4^0 (АсоJ + у2 V у Сделаем, наконец, еще одно упрощающее предположение, которое позволит по- получить сравнительно простые выражения для п(со) и х(со), а именно: будем считать среду настолько разреженной, что максимальное значение пх в B.49), которое дости- достигается при Асо = 0, мало по сравнению с единицей: со2/Dсо0у) <С 1. Тогда и макси- максимальное значение второго слагаемого в выражении для г^—х2 много меньше едини- единицы. Пренебрегая членами, квадратичными по малому параметру (Ор/D(о0у), из B.49) находим »1 %> 2 У B.50) 4 } 4со0 (АсоJ + у2 к } 4со0 (АсоJ + у2 Благодаря простому виду этих формул мы легко можем до конца проанализи- проанализировать их физическое содержание. И хотя они имеют ограниченную применимость из-за сделанных при их выводе предположений, такой анализ позволит и для общего случая составить качественное представление о характере зависимости показателей преломления и затухания от частоты вблизи линии поглощения. Графики функций п(со) ¦*? 1 и х(со) приведены на рис. 2.2. Зависимость показате- показателя затухания от частоты характеризует спектральный контур линии поглощения. В рассматриваемой модели среды, состоящей из неподвижных затухающих атомных осцилляторов, этот контур (как и спектральный контур линии излучения, см. п. 1.8)
88 2. Распространение света в изотропных средах имеет лоренцевскую форму с максимумом при Асо = 0, т.е. при со — со0. Ширина максимума на половине высоты равна 2у, она растет с увеличением постоянной затухания. График зависимости показателя преломления от частоты называют дисперсион- дисперсионной кривой. Показатель преломления сначала растет с увеличением частоты, до- достигая максимального значения при Асо = — у, т.е. при со — со^ — у. Затем п(со) убывает при возрастании частоты и после перехода через центр линии по- поглощения становится меньше единицы. Минимум п(со) расположен при Асо = у (т.е. при со = со0 + у). При дальнейшем увеличении частоты показатель прелом- преломления возрастает, асимптотически при- приближаясь к 1. Дисперсионную кривую на рис. 2.2 можно сравнить с графиком зависимо- зависимости п(со) (см. рис. 2.1) для частот, дале- Асо ких от собственной частоты со0. Мы ви- видим, что полученная при у = 0 кривая с разрывом в точке со = со0 трансформи- трансформировалась при учете поглощения в непре- непрерывную кривую с падающим участком Рис. 2.2. Дисперсионная кривая и лоренцевский вблизи со0. спектральный контур линии поглощения. Вире- к ЧЯРТОТЯ гпетя ппибтшжяетгя делах ширины контура 2у показатель преломле- Когда частота света приближается ния п(со)-1 уменьшается с увеличением частоты к со0, основной эффект обусловлен мни- (аномальная дисперсия) мой частью показателя преломления х(со), что связано с поглощением света (абсорбцией). Такое избирательное поглощение приводит, например, к появлению темных линий в спектре солнечного излучения. Свет, излучаемый поверхностью Солнца, имеет сплошной (непрерывный) спектр. При прохождении сквозь солнеч- солнечную атмосферу излучение сильно поглощается на частотах, равных собственным частотам входящих в состав атмосферы атомов. Измеряя эти частоты, можно опре- определить химический состав солнечной атмосферы. Такими методами установлено, что химические элементы на Солнце и звездах не отличаются от земных. Уменьшение показателя преломления с частотой, которое происходит в пределах ширины спектрального контура линии поглощения, называют аномальной диспер- дисперсией. Экспериментально она была открыта Леру в 1860 г. в опытах по преломлению белого света призмой, наполненной парами йода. Оказалось, что синие лучи прелом- преломляются меньше красных, т. е. показатель преломления убывает с частотой. Систематические экспериментальные исследования аномальной дисперсии были выполнены Кундтом, установившим, в частности, что аномальный ход дисперсии всегда сопровождается поглощением. Происхождение названия «аномальная дисперсия» связано с тем, что у всех про- прозрачных веществ, которые были к тому времени изучены, показатель преломления возрастает с частотой, т. е. дисперсия «нормальная», получившая теоретическое объ- объяснение в работах Френеля и Коши. После создания электронной теории дисперсии стало ясно, что аномальная дисперсия должна наблюдаться у всех веществ в тех областях спектра, где имеется сильное поглощение.
2.5. Аномальная дисперсия 89 Для изучения аномальной дисперсии Кундт использовал метод скрещенных призм, впервые примененный еще Ньютоном. Одна из призм (с вертикальным ребром) стек- стеклянная и обладает нормальной дисперсией. Она разлагает проходящий через нее узкий пучок белого света в цветную горизонтальную полоску («спектр»). Вторая призма (с горизонтальным ребром) изготовлена из исследуемого вещест- а) . б) ва. Она смещает каждую точку цвет- ццЦ!' И ной полоски по вертикали. Показа- ннннпии'111"" нннпннШ111" тель преломления и, следовательно, Краен. Фиол. краен. /'" Фиол. смещение по вертикали зависят от длины волны. Поэтому цветная полос- Рис« 2«3. Картина на экране, наблюдаемая в методе кя гтяновитея някггонной и ипошипя скрещенных призм. В случае нормальной дисперсии ка становится наклонной и искривля- вещества призмы с горизонтальным ребром (стек- ется, воспроизводя характер зависи- Ло) показатель преломления растет с частотой и по- мости показателя преломления вто- лоска монотонно поднимается от красного конца рой призмы от длины волны. Если спектра к фиолетовому^). Если вещество призмы н^п "к' ™ ^ *•> "«™ «глипоь ^^1п 05ладает линией поглощения, полоска разрывает- дисперсия материала второй призмы Ся, а ее края изгибаются (б) в соответствии с ходом нормальная, то полоска монотонно дисперсионной кривой на рис. 2.2 поднимается от красного конца спек- спектра к фиолетовому (рис. 2.3, а). В случае аномальной дисперсии цветная полос- полоска в области поглощения разрывается, а ее края искривляются в противополож- противоположные стороны (рис. 2.3, б) в соответствии с характером дисперсионной кривой п((о) на рис. 2.2. Падающий участок дисперсионной кривой наблюдать трудно из-за силь- сильного поглощения. В эффектном демонстрационном опыте Кундта, иллюстрирующем зависимость показателя преломления от частоты в парах натрия вблизи линии поглощения, роль второй призмы игра- играло конусообразное пламя газовой горелки, в которое вводился натрий. В результате создаваемый первой (стеклянной) приз- призмой спектр разрывался в месте расположения желтой /)-линии поглощения паров натрия и изгибался, как на рис. 2.3, б. Этот опыт был усовершенствован Вудом, использовавшим в качестве второй призмы горизонтальную кювету с парами натрия, плотность которых уменьшается по высоте. Для созда- создания неравномерной по высоте плотности паров верхняя часть кюветы охлаждается, а нижняя, где лежит кусочек металличе- металлического натрия, подогревается горелкой или электрической спи- спиралью. Такой столб паров натрия действует на проходящий пу- пучок света как призма с горизонтальным ребром, вызывая от- отклонение по вертикали, а стеклянная призма с вертикальным ребром разлагает пучок в горизонтальный спектр. Наблюдае- Наблюдаемая на экране зависимость показателя преломления от частоты Рис. 2.4. Дисперсия вблизи вблизи О-линии поглощения натрия терпит разрыв (рис. 2.4). желтой линии поглощения Количественные измерения дисперсии для проверки теории натрия, на людаемая в опыте ЛуЧше производить на разреженных газах и парах металлов, таюсак тогда имеется возможность работать как можно бли- ближе к центру линии поглощения. При малой плотности паров изменения показателя преломления малы, и для их измерения наилучшим является интерфе- интерференционный метод «крюков», предложенный Д. С. Рождественским (см. п. 5.6).
90 2. Распространение света в изотропных средах 1\лассическая дисперсионная формула B.35) и ее предельный случай B.50) для раз- разреженных газов с большой точностью описывают наблюдаемую на опыте зависи- зависимость показателя преломления п(со) и показателя затухания х(со) от частоты вблизи отдельных линий поглощения. Опыт показывает, что даже для одноатомных газов, атомы которых имеют только один оптический электрон, существует несколько ли- линий поглощения. Формулу B.35) можно обобщить так, чтобы она описывала ход показателя преломления в широкой области спектра, содержащей несколько спек- спектральных линий на частотах со0к: СГС: „2И = 1 + —Е-2—К—' 2 B.51) СИ: п2(со) = ^ГГк т€о к ^Ок -ь>2 Величины /к, называемые силами осцилляторов, удовлетворяют правилу сумм ^2к{к = 1- К такой же дисперсионной формуле приводит и квантовая теория. Однако в кван- квантовой теории собственные частоты со0к уже не рассматриваются как эмпирические постоянные, определяемые из самой кривой дисперсии (т. е. из фактического положе- положения спектральных линий), а приобретают вполне определенный физический смысл. При отсутствии внешних полей атом имеет некоторый набор стационарных состо- состояний, в которых его энергия принимает дискретные значения Ео, Е^ Е2,..., Ек,... Эти уровни энергии могут быть рассчитаны методами квантовой механики. При пе- переходе атома из одного состояния в другое происходит испускание (или поглощение) света с частотой, определяемой правилами Бора: Если все атомы среды находятся в основном состоянии, которому соответствует наинизшая энергия Ео, то в дисперсионную формулу входят только слагаемые с час- частотами со0к, соответствующими переходам атома из основного состояния в возбуж- возбужденные. Вклад каждого возбужденного состояния в атомную поляризуемость опреде- определяется силой осциллятора /к. Сила осциллятора /к пропорциональна вероятности спонтанного перехода из соответствующего возбужденного состояния в основное. При определенных условиях (например, при электрическом разряде в газе) часть атомов среды находится в возбужденных состояниях. Дисперсионная формула тогда содержит резонансные члены с частотами со1к = (Ек — СГС: B-52) СИ: п2(со) = 1 + ^ где /-к — —/1к — сила осциллятора для перехода между уровнями энергии Е-х и Ек; N1 — концентрация атомов, находящихся в состоянии с энергией Е-г\ 23/ ^/ = ^» где N — полная концентрация атомов.
2.6. Дисперсия в металлах и плазме 91 Особый интерес представляет неравновесный случай, когда для какой-либо пары уровней с энергиями Ег и Ек (Е1 > Ек) выполняется условие Л^- > Ык. Такая ин- инверсная населенность создается с помощью специальных средств в активной среде оптических квантовых усилителей и генераторов — лазеров (см. п. 9.4). Сила ос- осциллятора /1к положительна при / < к и отрицательна при / > к. Поэтому в случае инверсной населенности (Л^- > Л^) дисперсия в окрестности частоты со « со1к (соот- (соответствующей переходу между этой парой уровней), определяемая двумя слагаемыми с Л^- и Л^, отрицательная. Отрицательным будет и показатель затухания х(со), что соответствует усилению волн с частотами со «со1к вследствие преобладания выну- вынужденного испускания над поглощением. Отрицательные дисперсия и поглощение не находят объяснения в рамках классической теории дисперсии. Контрольные вопросы • В каких случаях дисперсию называют нормальной и в каких — аномальной? • Спектральный контур линии поглощения х(со) в формуле B.51) имеет лоренцевскую фор- форму. С какими свойствами принятой при ее выводе модели среды это связано? • Каким будет контур линии поглощения х(со)9 если допустить, что атомы рассматриваемой разреженной среды совершают хаотическое тепловое движение? 2.6. Дисперсия в металлах и плазме. Показатель преломления рентгеновских лучей В металлах некоторые из электронов не связаны с каким-либо определенным ато- атомом; это «свободные» электроны, ответственные за электрическую проводимость металла. В отличие от рассмотренных выше оптических электронов в атомах диэлек- диэлектрика, на свободные электроны не действует «квазиупругая»сила, привязывающая их к какому-то отдельному атому, но сила «трения», характеризующая сопротивление движению электрона, остается. Поэтому уравнение B.30) классической теории дис- дисперсии и все следствия из него можно применить к свободным электронам, положив обусловленную квазиупругой силой собственную частоту со0 равной нулю. Электроны проводимости участвуют в тепловом движении и все время изменяют свое положение. В результате оказывается, что действующее на них электрическое поле в среднем как раз равно макроскопическому полю Е. Следовательно, мы должны взять формулу B.37), полученную для разреженной среды (без поправки на отличие локального поля от среднего), и положить в ней со0 = 0: Ф>) = я2=1- , ** • B-53) Константа &>р B.36) зависит от концентрации N свободных электронов и назы- называется в данном случае плазменной частотой.*) Постоянную затухания у в B.53) можно оценить, выразив ее через удельную проводимость металла для постоянного тока (см. задачу 1). *> Название связано с тем, что сор определяет частоту собственных коллективных колебаний в плазме, концентрация электронов в которой N.
92 2. Распространение света в изотропных средах Формула B.53) для показателя преломления в металлах предсказывает совершен- совершенно разный характер распространения волн в областях низких и высоких частот. При низких частотах, когда со <$: у (для меди это соответствует электромагнитным вол- волнам длиной порядка 1 мм и более), формула B.53) приводит к комплексному по- показателю преломления с одинаковыми вещественной и мнимой частями п = х ^> 1. Такие волны проникают в глубь металла на расстояние, которое много меньше дли- длины волны в вакууме (скин-эффект). Коэффициент отражения К (см. п. 3.4) для них близок к единице, т. е. они практически полностью отражаются от поверхности. В противоположном случае высоких частот, когда со ^> у, в формуле B.53) мож- можно пренебречь мнимым слагаемым Ну по сравнению с со и для диэлектрической проницаемости получается вещественное выражение е(со)=п2((о) = 1-^. B.54) СО^ Такой же результат получается и непосредственно из уравнения B.30) при о>0 = 0, если в нем пренебречь диссипативным членом 2уг по сравнению с инерционным г. При высоких частотах характер дисперсионных явлений в металлах обусловлен инерцией свободных электронов: за промежуток времени между двумя актами рас- рассеяния, который в среднем равен г = 1/Bу), электрон успевает совершить много вынужденных колебаний, так как при со ^> у их период Т <^т. Из формулы B.54) видно, что плазменная частота сор имеет смысл своего рода критической частоты. При со < со^ диэлектрическая проницаемость отрицательна, а показатель преломления чисто мнимый. Это значит, что волны с со < сор (но со > у) не могут распространяться в металле из-за сильного затухания, причем это затуха- затухание не связано с поглощением (т.е. диссипацией) энергии. В самом деле, диэлек- диэлектрическая проницаемость вещественна (а истинное поглощение происходит только при 1т е ^ 0), да и выражение B.54) для е(со) получается при пренебрежении дисси- диссипативным членом в уравнении движения электрона. Фактически при со < сор проис- происходит полное отражение падающей волны от среды. При чисто мнимом показателе преломления коэффициент отражения равен единице (см. п. 3.4). При со > сор показатель преломления становится вещественным, а металл — про- прозрачным для излучения. Обычно плазменная частота у металлов попадает в область рентгеновских лучей, но для некоторых металлов область прозрачности начинает- начинается с ультрафиолетовых лучей. Например, у натрия длина волны, соответствующая граничной частоте о>р, составляет 210 нм, что хорошо согласуется с теоретической оценкой сор по формуле B.36) на основе известной концентрации N свободных элек- электронов. Прозрачность щелочных металлов в ультрафиолетовой области спектра была обнаружена на опыте Вудом в 1933 г. Для промежуточных частот (со «у) нужно пользоваться полным выражени- выражением B.53), а не его предельными формами. В этом случае у показателя преломле- преломления отличны от нуля зависящие от частоты вещественная и мнимая части. Это зна- значит, что волны разных частот при распространении в металле по-разному затухают. Очень тонкие слои металла прозрачны даже для видимого света. Например, тонкий слой золота, полученный напылением в вакууме на стеклянную подложку, пропуска- пропускает видимый свет, но сильно поглощает инфракрасное излучение. Экспериментальные методы определения оптических констант металлов основаны на исследовании поля- поляризации отраженного света (см. п. 3.4).
2.6. Дисперсия в металлах и плазме 93 Уравнения B.53) или B.54), которые описывают дисперсию электромагнитных волн в среде со свободными электронами, в равной мере применимы к электронам прово- проводимости в металлах и к свободным электронам в плазме, например в ионосферной плазме. Полученные выше выражения (при надлежащих значениях N. и у) можно ис- использовать для объяснения характера распространения радиоволн в ионосфере Зем- Земли. Граничная частота здесь попадает в радиодиапазон, поэтому волны длиной поряд- порядка Юм и более отражаются ионосферой, что широко используется для радиосвязи, тогда как ультракороткие (УКВ) свободно проходят сквозь нее. Это обстоятельство открывает возможность радиолокации Луны и планет и жизненно важно для радио- радиоастрономии, использующей технику ультракоротких волн. Исследование частотной зависимости отражения радиоволн дает хороший метод изучения ионосферы, в част- частности определения N по критической частоте. В случае очень высоких частот (со —> оо) диэлектрическая проницаемость е((о) любого вещества стремится к единице: при очень быстрых изменениях напряжен- напряженности поля процессы поляризации не успевают происходить. Предельный вид функ- функции е((о) при больших частотах, справедливый для любых тел (безразлично — металлов или диэлектриков), можно установить, рассматривая электроны вещест- вещества как свободные, пренебрегая их взаимодействием друг с другом и с ядрами ато- атомов. Для этого частота со поля должна быть велика по сравнению с собственны- собственными частотами о>0 электронов в атомах данного вещества. Пренебрегая &>0 по срав- сравнению с &>, для е{о)) получаем из B.38) такое же выражение B.54), как и в ме- металлах: е(й>)=п2(а>) = 1-% B.55) с той разницей, что в со2 = 4яЛ/ге2/т (СГС) или со2 — Nе2/(те^) (СИ) под N нужно понимать не концентрацию электронов проводимости, а полное число электронов в единице объема вещества. Область применимости этой формулы начинается от далекого ультрафиолета у самых легких элементов и от рентгеновских частот у более тяжелых элементов. При частотах, соответствующих рентгеновскому излучению, перестает выполняться усло- условие Я ^> а (а — среднее расстояние между атомами среды). Поэтому, строго говоря, мак- макроскопическое описание поля здесь неприменимо и среду нельзя рассматривать как непре- непрерывную. Нужно исходить из рассеяния рентгеновского излучения на отдельных электронах, распределенных в пространстве с некоторой плотностью Ы(х9у,г). В кристаллах эта функ- функция координат будет трехмерно периодической, отражая упорядоченное расположение атомов в узлах кристаллической решетки. Когда длина волны меньше пространственного периода решетки, при определенных условиях возможно появление волн, распространяющихся в на- направлениях, сильно отличающихся от направления падающей волны. Это явление подобно образованию дифракционных максимумов при падении света на оптическую дифракционную решетку (см. п. 6.5). Однако если интересоваться распространением рентгеновского излучения в веществе в направлении, близком к направлению падающей волны, то зависимость плотно- плотности числа электронов М(х, у, г) от координат становится несущественной и вместо нее мож- можно рассматривать усредненную по объему величину N — полную концентрацию электронов. Поэтому для преломления на малые углы, несмотря на нарушение условия Я > а, диэлектри- диэлектрическая проницаемость е(со) и показатель преломления п(со) сохраняют свой обычный смысл и для рентгеновского излучения.
94 2. Распространение света в изотропных средах Из приведенной формулы видно, что показатель преломления рентгеновских лу- лучей меньше единицы, хотя и очень мало отличается от нее. Его можно измерить, наблюдая предельный угол полного отражения рентгеновских лучей при переходе из воздуха в среду. Для Я « 0,1 нм в стекле п = 1 - 5 • 10~6. Широкое применение рентгеновских лучей в медицине и в технике основано имен- именно на том, что для них показатель преломления в любом веществе практически не отличается от единицы. Глубина проникновения рентгеновских лучей в металлах больше, чем для видимого света, но во многих других веществах она даже отда- отдаленно не приближается к тем громадным глубинам проникновения, которых можно достичь в видимой или инфракрасной области. Прозрачная для видимого света атмо- атмосфера Земли полностью поглощает приходящее из космоса рентгеновское излучение (рентгеновская астрономия стала возможной только при выведении телескопов на спутниках за пределы атмосферы). Аналогично обстоит дело и в таких средах, как вода и стекло. Но видимый свет, для которого показатели преломления этих сред имеют значения около 1,5, чрезвычайно чувствителен к внутренним граничным по- поверхностям. В таких неоднородных средах, как, например, мышцы и другие ткани организма, происходит диффузное отражение света на многочисленных граничных поверхностях, разделяющих отдельные области, что делает эти среды непрозрачны- непрозрачными для видимого света. Рентгеновские лучи, для которых во всех средах п « 1, как бы не замечают этих граничных поверхностей. Поэтому шапка пены на кружке пива совершенно непрозрачна для видимого света (дает на экране черную тень) и полно- полностью прозрачна для рентгеновских лучей. Контрольные вопросы • При каких частотах электромагнитные волны могут распространяться в металлах? • Какой предельный вид имеет функция е(а>) при высоких частотах? • Каким свойством рентгеновских лучей обусловлено их широкое применение в медицине? Задачи 1. Выразите постоянную затухания у в уравнении B.30) через удельную проводимость а. Решение. Основной механизм, который дает вклад в испытываемое электроном проводи- проводимости сопротивление движению, — это рассеяние на отклонениях действующего на него поля в металле от идеальной пространственной периодичности. Эти отклонения обусловле- обусловлены дефектами кристаллической структуры (примеси, вакансии, дислокации, границы зерен) и тепловыми колебаниями ионов. Все эти факторы существенны не только при осцилли- осциллирующем движении электрона в поле световой волны, но и при движении в постоянном электрическом поле, где они обеспечивают постоянную скорость упорядоченного движе- движения (дрейфа) электронов в направлении поля, накладывающегося на хаотическое тепловое движение. Скорость дрейфа V = г можно найти из уравнения B.30), считая в нем а>0 = 0 и напря- напряженность поля Е в правой части постоянной. При установившемся движении в постоянном поле V = г = 0, поэтому
2.7. Дисперсия в ионных кристаллах. Ориентационная дисперсия 95 Каждый электрон проводимости дает в ток вклад — е\. Полная плотность тока ^ = —Ме\. Учитывая B.56), получаем В B.57) легко узнать дифференциальную форму закона Ома: ^ = аЕ. Сравнивая эти два выражения, получаем Поэтому постоянная затухания у может быть выражена через удельную проводимость а, значение которой для каждого металла дают измерения на постоянном токе. 2.7. Дисперсия в ионных кристаллах. Ориентационная дисперсия Рассмотрим вклад ионов в дисперсию диэлектрической проницаемости (или показа- показателя преломления) на примере типичного ионного кристалла — каменной соли ЫаС1. Этот кристалл имеет кубическую решетку, образуемую однозарядными положитель- положительными ионами натрия и отрицательными ионами хлора. Под действием внешнего электрического поля ионы Иа" и С1~ смещаются из своих равновесных положений в узлах кристаллической решетки в противоположные стороны. В результате каждый элемент объема среды приобретает дипольный момент. Поэтому в ионных кристал- кристаллах (а также любом веществе, содержащем молекулы с ионной связью) вклад в по- ляризованность Р дают не только оптические электроны, но и сами ионы, смещаясь как целое из своих равновесных положений. Длина волны излучения оптического диапазо- на (Я « 10~5см) много больше постоянной ре- шетки (а « 10~8см), поэтому в пределах эле- мента объема, содержащего макроскопически большое число ионов, поле волны можно счи- тать однородным. Тогда смещения г+ всех по- ложительных ионов из своих равновесных поло- жений одинаковы (рис. 2.5). То же самое можно сказать и о смещениях отрицательных ионов г_. Действующая на каждый ион возвращающая си- ла пропорциональна относительному смещению положительной и отрицательной подрешеток: Г+ = -/?(г+ - г_), Г_ = — Г+- Урав- Уравнения движения ионов (без учета затухания) можно записать в виде е / ©. ® @ ® @ © /у /~у Уу >^у г" ® \У ® © ® @ © рис. 2.5. Смещение положительных и отрицательных ионов кристалла в электрическом поле световой волны +г+ = -0(г+ - г_) + еЕ, B.59) М_г_ = уЗ(г+ - г_) - еЕ. B.60) Здесь М+ и М_ — массы положительного и отрицательного ионов.
96 2. Распространение света в изотропных средах Сложив почленно эти уравнения, получим М+г+ + М_г_ = О — центр масс сис- системы остается на месте. Для относительного смещения положительных и отрицатель- отрицательных ионов г = г+ — г__ из уравнений B.59) и B.60) находим (нужно первое уравне- уравнение разделить на М+, второе — на М_ и произвести почленное вычитание): Г + л>?г = —, B.61) где \//и = \/М+ + 1/М_; /л — приведенная масса двух ионов противоположного знака; а>1 = Ц5//л) ^2 — частота собственных колебаний, возникающих при относи- относительном смещении положительной и отрицательной подрешеток (длинноволновых оптических колебаний). Индуцированный дипольный момент р пары соседних ионов противоположного знака равен ег. Решая уравнение B.61) для монохроматического поля частоты со, получим, что г и, следовательно, момент р = ег пропорциональ- пропорциональны Е. Коэффициент пропорциональности а^со) — ионная поляризуемость (в расчете на пару ионов) — имеет такой же вид, как и для оптических электронов, только вместо массы электрона в а^со) входит приведенная масса \х двух ионов и вме- вместо собственной частоты со^ электрона (приходящейся обычно на ультрафиолетовую часть спектра) входит а>1 — частота оптических колебаний ионов: е2 1 е2 1 СГС: аДй>) = ~ 7; СИ: а^со) = 1 + , г. B.62) 1 Ц(о}со2 1 1ле(о}(о2 Вследствие большой массы ионов по сравнению с массой электрона {[л > т) их собственная частота (о1 много меньше &>0 и обычно соответствует инфракрасной области спектра (порядка 1013 Гц). Как видно из B.62), инфракрасное излучение с частотами со, близкими к аI9 вызывает особенно сильную ионную поляризацию, т. е. сильно взаимодействует с оптическими колебаниями кристаллической решетки. Конечно, непосредственно вблизи а>1 выражение B.62) неприменимо: для правиль- правильного описания резонанса в уравнение B.61) нужно включить член, учитывающий затухание в движении ионов. Действующее на ионы электрическое поле в B.61) в кубическом кристалле можно отождествить с локальным полем Елок, связанным со средним макроскопическим по- полем соотношением B.44). Учитывая вклады электронов и ионов в поляризованность среды, теперь вместо B.45) получим следующее выражение: п2 - 1 _ 4я^ е2 1 4яЛГ; е2 1 т 3{(О2-(О2) И Ъ{(о}-0J)' (Формула в СИ получается заменой 4я —> 1/е0.) Этому выражению (после некото- некоторых преобразований) можно придать вид обычной дисперсионной формулы: п2 - 1 = ^~2 + ^Г1 1 { 2 Г* - ОI О){ - (О2 Ионные кристаллы, как правило, прозрачны в видимой области спектра, так как полюсы резонансных членов в правой части B.63), обусловленных электрона- электронами и ионами, и связанные с ними полосы поглощения находятся соответственно
2.7. Дисперсия в ионных кристаллах. Ориентационная дисперсия 97 в ультрафиолетовой и инфракрасной областях спектра. Но зависимость показателя преломления от частоты в видимой области существенно определяется этими члена- членами, хотя сами резонансные частоты й0 и со- находятся за ее пределами. Эти частбты, а также постоянные Со и С, в B.63) могут быть найдены по измерениям показателя преломления в видимой области (при нескольких значениях частоты со). Полагая затем в B.63) со = О, можно получить статическое значение диэлектрической прони- проницаемости: е@) = л2@) = 1 -+- Со/2H + С,-/5?. Так как со1 <С 50, основную роль здесь играет член с 5/9 т.е. главный вклад в е@) обусловлен ионной поляризуемостью. Замечательно, что найденное таким образом из оптических измерений в видимой об- области статическое значение е вполне удовлетворительно согласуется с измерениями диэлектрической проницаемости ионных кристаллов электрическими методами. Некоторые ионные кристаллы, в целом прозрачные в видимой области, имеют характерную окраску. Такая окраска говорит о наличии сравнительно узких полос поглощения в видимой области. Эти полосы обусловлены наличием примесных ионов и других точечных дефектов. Например, окрашенный в розовый цвет рубин представляет собой кристалл корунда А^Оз, в котором некоторые ионы алюминия А13+ замещены ионами хрома Сг3+. Окраска рубина свя- связана с полосами поглощения примесного иона (чистый корунд бесцветен). Ионные кристаллы с подходящими примесями используются как материал для активной среды твердотельных лазеров. В щелочно-галоидных кристаллах типа ЫаС1 полосы поглощения возникают при наличии вакансий. Нагревание кристалла №С1 в атмосфере паров натрия приводит к некоторому из- избытку ионов натрия и обусловливает образование вакантных узлов в подрешетке хлора. При быстром охлаждении кристалла («закаливании») вакансии оказываются «замороженными». На место отсутствующего отрицательного иона хлора для компенсации заряда может быть захвачен электрон. Образуется ^-центр. Собственная частота электрона в ^-центре прихо- приходится на видимую область спектра. В результате кристалл №С1 окрашивается в желтовато- коричневый, а КС1 — в голубой цвет. Центры окраски в щелочно-галоидных кристаллах могут быть созданы также облучением образца рентгеновскими или гамма-лучами. Релаксационная (ориентационная) дисперсия проявляется в средах с полярными молекулами — в жидкостях и растворах. Полярные молекулы обладают собственным постоянным дипольным моментом, обусловленным несимметричным распределени- распределением электрических зарядов внутри молекулы. При отсутствии внешнего поля поляри- зованность Р среды равна нулю, так как дипольные моменты молекул ориентируются хаотически. При наложении электрического поля на каждую молекулу действует пара сил, поворачивая дипольный момент молекулы вдоль по полю. Тепловое движение пре- препятствует этой ориентации. В среднем получается преимущественное направление моментов по полю, и поляризованность будет отлична от нуля, а при слабых по- полях — пропорциональна напряженности поля. Ясно, что рассматриваемый механизм поляризации дает сильную зависимость диэлектрической восприимчивости (и про- проницаемости) от температуры, выражающуюся в уменьшении % и е с ростом темпе- температуры. В переменном электрическом поле с частотой со ориентационная поляризован- поляризованность будет изменяться с той же частотой. Пока период изменения напряженности поля Т = 2л/со много больше времени релаксации т (т. е. времени установления равновесия), значение е((о) такое же, как и в постоянном поле. Но при увеличении 4 Зак 4498
98 2. Распространение света в изотропных средах частоты, когда Т приближается к т, полное установление среднего дипольного мо- момента не успевает произойти. Тогда е((о) будет меньше своего статического значения. Поэтому в области частот со ~ 1/т возникает зависимость диэлектрической прони- проницаемости от частоты, т. е. дисперсия. При этом обязательно будет и абсорбция, так как такие процессы необратимы: поворот дипольных моментов молекул происходит с трением и сопровождается диссипацией энергии поля, т. е. выделением теплоты. Времена релаксации для процессов ориентации диполей изменяются в широких пределах и сильно зависят от температуры. Например, для воды при комнатной тем- температуре т ~ 101 с, для льда при — 20 °С т ~ 10~3 с. Если дипольные моменты мо- молекул велики, то и значения е при низких частотах со «С 1/т оказываются большими. Так, у воды при комнатной температуре е = 81, п = у/ё = 9. При частотах со ^> 1/т ориентационный механизм практически не дает вклада в восприимчивость, т. е. моле- молекулы ведут себя так, как если бы они не были полярными. Для воды при оптических частотах диэлектрическая проницаемость составляет всего лишь 1,77 (показатель преломления п = у/е = 1,33). Переход от статических значений е к значениям, со- соответствующим оптическим частотам, происходит в области частот со ~ 1/т. Для воды это примерно 1010Гц, что соответствует диапазону сантиметровых радиоволн (микроволны). На оптических частотах рассматриваемый механизм поляризации ни- никакой роли не играет. Здесь уместно объяснить, почему в оптике магнитную проницаемость можно считать рав- равной единице для всех веществ. Механизм намагничивания парамагнетиков состоит в ори- ориентации магнитных моментов атомов и молекул во внешнем магнитном поле. Характерное время установления равновесной намагниченности того же порядка, что и время установле- установления ориентационной поляризованности в электрическом поле. Эти времена заведомо велики по сравнению с оптическими периодами. Тем более это относится к временам релаксации ферромагнитных процессов. Поэтому нужно полагать /и = 1 уже при частотах гораздо более низких, чем оптические. Контрольные вопросы • В чем заключается физическая причина поглощения инфракрасного излучения в ионных кристаллах? • Почему значения диэлектрической проницаемости воды для радиоволн и для видимого света столь сильно различаются? • Чем объясняется, что постоянный дипольный момент молекул и связанная с ним ориента- ционная дисперсия не играют никакой роли в оптике? 2.8. Поворот направления линейной поляризации в магнитном поле (эффект Фарадей) Влияние внешнего постоянного магнитного поля на излучение дипольного осцилля- осциллятора (эффект Зеемана) было рассмотрено в п. 1.9. Классическая электронная теория приводит к выводу, что свет, излучаемый состоящим из таких изотропных осцил- осцилляторов источником, при наблюдении вдоль магнитного поля вместо одной узкой
2.8. Эффект Фарадея 99 спектральной линии на частоте со0 образует две компоненты на частотах &>0 ± Л, где ларморовская частота п = [е/Bтс)В] (СГС) или п = [е/Bт)]В (СИ). Смещен- Смещенные компоненты имеют левую и правую циркулярные поляризации в отличие от естественного света исходной спектральной линии. Для одиночных спектральных линий (синглетов) эксперимент полностью подтверждает предсказания классической теории. Расщепление собственной частоты осциллятора в магнитном поле должно прояв- проявляться не только в испускании, но и в поглощении света: максимумы поглощения света левой и правой круговых поляризаций при распространении вдоль магнитного поля приходятся на частоты со^ ± п. Линейно поляризованный и естественный свет можно разложить на сумму двух циркулярно поляризованных волн, поэтому в погло- поглощении должны наблюдаться сразу две линии на частотах со0 ± п (обратный эффект Зеемана). Поглощение и дисперсия связаны друг с другом. Поэтому следует ожидать, что при распространении вдоль магнитного поля в среде, содержащей дипольные ос- осцилляторы, волны левой и правой круговых поляризаций будут характеризоваться разными значениями показателя преломления, т.е. будут иметь неодинаковые фазо- фазовые скорости. Когда эти волны представляют собой составляющие одной линейно поляризованной волны, различие их скоростей проявляется в изменении (повороте) направления ее поляризации по мере распространения в среде вдоль линий магнит- магнитного поля. Поворот плоскости поляризации при прохождении света через вещество, находя- находящееся в магнитном поле, впервые наблюдал Фарадей в 1846 г. Это был первый эксперимент, продемонстрировавший связь оптических и магнитных явлений. Для наблюдения эффекта Фарадея исследуемое вещество помещается между полюсами электромагнита (рис. 2.6). Линейно поля- поляризованный свет пропускается вдоль маг- магнитного поля через канал, просверленный в сердечнике. Анализатор Р*, устанавлива- - ^ Рис. 2.6. Схема наблюдения эффекта Фарадея ется так, чтобы при отсутствии магнитного поля свет не проходил (скрещенные поля- поляризаторы />1 иР2). При включении электромагнита свет проходит через анализатор. Поворотом анализатора его можно погасить. Это значит, что свет остается линейно поляризованным и здесь наблюдается именно поворот направления линейной поля- поляризации. Количественные исследования показали, что угол поворота ср пропорционален длине пути / света в веществе и индукции В внешнего магнитного поля: B.64) Коэффициент пропорциональности р, характеризующий исследуемое вещество, зависит от частоты света. Он называется постоянной Верде. Поворот условно счи- считают положительным, если для наблюдателя, смотрящего вдоль магнитного поля, он происходит вправо (по часовой стрелке). Большинство веществ характеризуются положительным вращением.
100 2. Распространение света в изотропных средах Направление поворота плоскости поляризации для каждого тела не зависит от на- направления распространения света, а связано только с направлением магнитного поля. Это свойство позволяет увеличить суммарный угол по- поворота удлинением пути света в образце за счет мно- многократных отражений на посеребренных поверхностях образца (рис. 2.7). В последние годы эффект Фарадея широко приме- применяется в научных исследованиях. В кольцевых лазерах с его помощью можно добиться того, что бегущим на- навстречу волнам будут соответствовать отличающиеся частоты генерации (см. п. 8.4). Малая инерционность екта эффекта (время установления меньше 10~9с) позволя- Рис. 2.7. Усиление эй поворота плоскости поляриза- поляризации за счет удлинения пути ет использовать его для модуляции света, для создания при многократных отражениях оптического затвора и т. п. х ассмотрим теоретическое истолкование эффекта Фарадея на основе классической электронной теории. Как уже отмечалось, физическая причина поворота направле- направления поляризации состоит в различии фазовых скоростей волн левой и правой круго- круговых поляризаций при их распространении вдоль магнитного поля в веществе. Пусть в падающей на образец линейно поляризованной волне колебания вектора Е про- происходят вдоль направления АА (рис. 2.8). Тогда в точке г = 0, где распространяю- распространяющаяся вдоль оси г волна входит в обра- образец, векторы Е+ и Е_ циркулярно поля- поляризованных волн, на которые можно раз- разложить падающую волну, вращаются с уг- угловой скоростью со в противоположных направлениях, сохраняя в каждый момент симметричное расположение относитель- относительно направления АА (см. рис. 2.8,а), т.е. углы <р+ и ср_ при т. = 0 равны друг другу: ( ) = ф_@, 1)=Ш + СОП81. а) В + Обозначим фазовую скорость волны ле- Рис- 2-8- Направление поляризации света: „ „ а — в точке 2=0 (АА): б — в точке г=1(ВВ) вой круговой поляризации, в которой вра- вращение вектора Е+ происходит против ча- часовой стрелки, через у+. В точке г направление вектора Е+ в момент времени /, характеризуемое углом <р+(г, *)> будет таким же, как и в точке т. = 0 в более ранний момент времени I — = <р+@, г ) = сои ) +соп$1. Совершенно аналогично для волны правой круговой поляризации, распространя- распространяющейся со скоростью у_, имеем Ф_ (г, /) = ф_ /о, г —— ] = со и — + соп81.
2.8. Эффект Фарадея 101 Векторы Е+ и Е_ в точке г вращаются с угловой скоростью со в противо- противоположных направлениях и в сумме дают колебание вдоль направления В В (см. рис. 2.8, б), относительно которого они в каждый момент расположены симметрич- симметрично. Так как <р+(г, *) ф(р_{г, 0> то направление В В поляризации в точке т. повернуто относительно исходного направления АА на угол <р = (<р+ — <р_)/ 2: где л+ — показатель преломления для циркулярно поляризованной волны, в которой вращение вектора Е происходит в том же направлении, в каком идет ток в обмотке создающего поле электромагнита, и п_ — для волны с противоположным направле- направлением вращения. В модели вещества, которую использует классическая электронная теория диспер- дисперсии, оптические электроны в атомах рассматриваются как изотропные осциллято- осцилляторы, характеризуемые единственной собственной частотой со0. При этом показатель преломления среды п((о) не зависит от характера поляризации света. Все формулы для е((о) и п(со), полученные в пп. 2.3—2.5, одинаково применимы для света любой поляризации. Но при помещении среды во внешнее магнитное поле В происходит расщепление собственных частот осциллятора. Нормальными модами осциллятора в магнитном поле являются колебания вдоль направления поля с прежней часто- частотой аH и круговые движения в плоскости, перпендикулярной индукции магнитного поля, с частотами со± = усоц + О2 ± О « со0 ± О (см. п. 1.9), причем большая час- частота (о+ = аH + п соответствует вращению электрона в том же направлении, в ко- котором идет ток, создающий магнитное поле. Круговые движения электронов в атомных осцилляторах возбуждаются при рас- распространении в среде циркулярно поляризованной волны. Поэтому в выражениях, определяющих показатель преломления для распростра- распространяющихся вдоль магнитного поля циркулярно поляризованных волн, резонансные члены будут максимальны при совпадении частоты со с собственными частотами круговых движений со±. Найдем показатель преломления вдали от этих частот, где затуханием осциллято- осцилляторов можно пренебречь. Уравнение вынужденного движения электрона в поле свето- световой волны Е(/) при наличии постоянного внешнего поля В имеет вид СТО. г + Ц?г = —[*Е@ + -*хв1; СИ: г + ^г=--1"е@+гхв]. Дальше действуем так же, как и в п. 1.9. Вводим ларморовскую угловую ско- скорость а согласно A.108) и соответствующий член, содержащий г, переносим в ле- левую часть уравнения: г - 2г х п + (о^г = -- Е(*). B.66) 171 Направим ось г вдоль магнитного поля В. Тогда вектор О, будет иметь проекции @,0,—]?). Вектор напряженности Е(/) электрического поля для
102 2. Распространение света в изотропных средах распространяющейся параллельно В циркулярно поляризованной монохроматиче- монохроматической волны с частотой со имеет проекции Ех = Е0со$аI, Еу = ±Е0&т(о1, Ег = 0, где верхний знак в Еу соответствует волне с вектором Е+, вращающимся против часовой стрелки, нижний — волне с вектором Е_. Заметим, что направление рас- распространения волны (вдоль В или навстречу) при этом никакой роли не играет. Записывая B.66) в проекциях на оси х иу, получаем систему уравнений: X + Юу + (ОцХ = Ео СО8ОЯ, B.67) У + 2пх + (Оцу = ± Ео 81П Ш. Дальше удобно вместо вещественных функций х(г) и у (г) ввести вспомогательную комплексную функцию 4@ = х + 1у, так что х = Яе|, у = 1т|. Умножая второе уравнение B.67) на / и складывая с первым, получаем | - ЪО\ + с%4 = ^ Яо е±Ш- B-68) Установившееся движение электрона описывается частным решением этого урав- уравнения, имеющим вид |(/) =|оехр(±/й#). Для амплитуды 4о из B.68) нахо- находим 4о = (~~еIт)Ео/{°>о ~ ы1 ^ 2а)п). Отделяя вещественную и мнимую части в !(/), получаем 1*М± МОBб9) т о)%-оJ±2па) *У) т а* - со2 ± Отсюда находим индуцированный дипольный момент р = — ег(г) и атомную поляри- поляризуемость а±(со) в поле циркулярно поляризованных волн: е2 1 е2 1 СГС: а± = — —~ ^ ; СИ: а± = = ^ . B.70) т о)$ - со2 ± 2п(о те0 о)$ - со2 ± 2псо Учитывая то, что ларморовская частота О даже в очень сильных магнит- магнитных полях много меньше частоты со для оптического диапазона (п/со ~ 2 • 10~4 при В = 10 Тл и у — 500 нм), знаменатель в B.70) можно приближенно записать в виде о)ц — (со =р пJ. Отсюда следует, что атомная поляризуемость а± в поле цир- циркулярно поляризованных волн B.70) может быть получена из выражения для атом- атомной поляризуемости а(со) при отсутствии магнитного поля (т.е. при {2 = 0) е2 1 е2 1 СГС: а(п>) = ^—т; СИ: а{а>) = * =• т (х)*~(хI те0 щ — (о1 простой заменой со на со =рп, т.е. а± = а(со =рО). То же самое справедливо и для восприимчивости х±у диэлектрической проницаемости е±, показателя преломле- преломления п±. Таким образом, П±((х)) — п((О =Р О) « п@)) =Р , 6@
2.8. Эффект Фарадея 103 Подставляя п_ — л+ в B.65), получаем выражение для угла поворота направления поляризации: 2с ^' с да) ч ' В области нормальной дисперсии показатель преломления возрастает с частотой, т. е. дп/дсо > 0, и поворот направления поляризации происходит в ту сторону, в ко- которую идет ток в обмотке электромагнита, создающего поле. Это справедливо для света, распространяющегося как вдоль магнитного поля, так и навстречу. Угол <р, как видно из B.71), пропорционален индукции В магнитного поля и пройденному расстоянию г = /. Таким образом, электронная теория дисперсии объясняет эмпири- эмпирический закон B.64) и позволяет по известной зависимости п((о) вычислить постоян- постоянную Верде р: п — е /л — е 2 @ 10\ 2тс по) 2тс аЛ Для закона дисперсии л(А), описываемого формулой Коши B.41), зависимость посто- постоянной Верде от длины волны согласно B.72) имеет вид р{Х) ~ 1/Я2, что находится в полном соответствии с экспериментальными данными. В непосредственной близости к собственной частоте осцилляторов со0 эффект Фа- Фарадея описывается более сложными закономерностями. В уравнении движения ос- осциллирующего электрона B.66) необходимо учитывать затухание. Можно показать (см. задачу 1), что для циркулярно поляризованных волн, распространяющихся вдоль магнитного поля, дисперсионная кривая и спектральный контур линии поглоще- / '* *' ' ния имеют для данной среды тот же '' вид, что и при отсутствии магнитно- магнитного поля, отличаясь только сдвигом по шкале частот на О вправо для волны с положительным направлением враще- вращения вектора Е и на п влево — для волны с противоположным направлени- направлением вращения Е. На рис. 2.9 штриховы- штриховыми линиями показаны графики функций п+((О) — 1 и п_((О) — 1, а их разность ми поляризациями при распространении вдоль п_ — п+ — сплошной линией. Видно, магнитного поля что в окрестности со^ дважды изменяет- изменяется знак эффекта Фарадея: в интервале частот ~ 2О вблизи со0 поворот направления поляризации происходит в отрицательную сторону, а вне этого интервала — в поло- положительную. Однако следует иметь в виду, что в данном случае эффект не сводится только к повороту направления поляризации падающей волны. В окрестности &>0 существенно поглощение света, причем при данном значении коэффициенты затуха- затухания х±(со) для циркулярно поляризованных составляющих падающей волны имеют разные значения (круговой дихроизм). Поэтому после прохождения через образец амплитуды этих составляющих не равны и при их сложении получается эллиптиче- эллиптически поляризованный свет.
104 2. Распространение света в изотропных средах Важно сознавать, что в эффекте Фарадея магнитное поле влияет на состояние по- поляризации света лишь косвенно, изменяя характеристики среды, в которой распро- распространяется свет. В вакууме магнитное поле никакого влияния на свет не оказывает. Обычно угол поворота направления поляризации очень мал, но благодаря высо- высокой чувствительности экспериментальных методов измерения состояния поляриза- поляризации эффект Фарадея лежит в основе совершенных оптических методов определения атомных констант. Контрольные вопросы • В чем заключается физическая причина поворота плоскости поляризации при распростра- распространении света вдоль магнитного поля в веществе? Почему этого не происходит в вакууме? • Как угол поворота направления поляризации выражается через показатели преломления для циркулярно поляризованных волн? • Что представляют собой нормальные моды изотропного осциллятора в магнитном поле? • При отражении волна с правой круговой поляризацией превращается в волну с левой по- поляризацией и наоборот. Почему же при отражении линейно поляризованной волны, состо- состоящей из двух циркулярно поляризованных, направление поворота плоскости поляризации остается прежним? • Как, зная показатель преломления среды п(а)) при отсутствии магнитного поля, найти показатели преломления для циркулярно поляризованных волн, распространяющихся вдоль магнитного поля? • В каком направлении происходит поворот плоскости поляризации в области нормальной дисперсии? • Почему распространяющийся вдоль магнитного поля линейно поляризованный свет стано- становится эллиптически поляризованным, если его частота близка к линии поглощения? Задачи 1. Найдите показатели преломления для монохроматических циркулярно поляризованных волн, распространяющихся вдоль магнитного поля в разреженной среде, содержащей N атомных осцилляторов в единице объема. Каждый осциллятор характеризуется заря- зарядом е, массой т, собственной частотой а>0 и постоянной затухания у. Рассмотрите область частот вблизи собственной частоты осцилляторов а> « а>0. Ответ. Выражения для показателя преломления и показателя затухания циркулярно поля- поляризованных монохроматических волн получаются из соответствующих выражений B.49), справедливых в отсутствие магнитного поля, заменой Аа> —> Аа> ± О. Другими словами, дисперсионная кривая и спектральный контур линии поглощения в магнитном поле для волны с положительным направлением вращения сдвинуты на п по шкале частот вправо, а с отрицательным — на п влево: п±(со) = п(а> ^ О), х±(со) = х(а> 2.9. Естественное вращение направления поляризации В некоторых случаях распространение линейно поляризованного света в веществе сопровождается поворотом направления поляризации вокруг оси пучка даже при от- отсутствии внешнего магнитного поля. Это явление в отличие от магнитного вращения
2.9. Естественное вращение направления поляризации 105 направления поляризации называют естественным вращением или естественной оп- оптической активностью (гиротропией). Естественная активность была открыта Араго в 1811 г. для кристаллов кварца. Позднее Био обнаружил поворот направления поляризации света в растворах сахара. Теперь известно много естественно-активных веществ, хотя у большинства из них это явление выражено очень слабо. Для наблюдения оптической активности слой исследуемого вещества помещают между установленными на темноту (скрещенными) поляризаторами. Проходящий при этом свет можно снова погасить поворотом одного из поляризаторов. Это зна- значит, что после прохождения через слой активного вещества свет остается линейно поляризованным, но направление его поляризации повернуто на некоторый угол от- относительно первоначального. Угол поворота направления поляризации зависит от длины волны света, а для данной длины волны пропорционален толщине / слоя активного вещества: ср = а(соI. Например, в кварце при распространении вдоль оп- оптической оси желтый свет натрия (Я = 589,3 нм) испытывает поворот направления поляризации 21,73 угл. град, на миллиметр. Опыт показывает, что при изменении направления распространения света на про- противоположное поворот плоскости поляризации происходит в обратную сторону. По- Поэтому при прохождении сквозь активную среду, отражении от зеркала и вторичном прохождении через ту же среду назад направление линейной поляризации восста- восстанавливается. Этим естественное вращение отличается от магнитного, где имело зна- значение направление вектора индукции внешнего магнитного поля, а не направление распространения света. Для естественного вращения направление (знак) поворота связывают с направлением света: активную среду называют правовращающей, ес- если для наблюдателя, смотрящего навстречу световому пучку, поворот происходит по часовой стрелке, и левовращающей — в противоположном случае. Определен- Определенный таким образом знак вращения не меняется при изменении направления света, т.е. свой- свойство среды быть право- или левовращающей не зависит от направления луча, подобно тому как свойство винтовой линии быть правой или левой не зависит от того, с какой стороны на нее смотреть. Кристаллический кварц встречается в двух Рис 2Ж Втишяя форМа монокристал- модификациях: для одной поворот направле- лов право-и левовращающего кварца. Вто- ния поляризации при распространении вдоль рая модификация является зеркальным оптической оси *) происходит вправо, для дру- изображением первой гой — влево (на такой же угол). Для кристал- кристаллической решетки кварца характерно отсутствие центра и плоскостей симметрии. Две модификации по своей симметрии и внешней форме кристаллов (рис. 2.10) от- отличаются друг от друга, как правая рука отличается от левой или как винт с правой нарезкой от такого же винта с левой нарезкой. Никаким перемещением их нельзя совместить друг с другом. Одна модификация является зеркальным изображением +) Кварц представляет собой одноосный кристалл (см. п. 4.2). Распространение света в нем вдоль оп- оптической оси происходит так же, как в изотропной среде (т.е. возможна любая ориентация плоскости поляризации).
106 2. Распространение света в изотропных средах второй. Вращательная способность кварца связана с его кристаллической структу- структурой, так как плавленый кварц не обладает оптической активностью. оптически активных жидкостей и аморфных тел эффект вращения обусловлен асимметричным строением молекул. Согласно представлениям стереохимии, асим- асимметрия органических молекул связана со свойством атома углерода образовывать направленные валентные связи с другими атомами или атомными группами (ради- (радикалами). В простейшем случае (например, в молекуле метана СН4) атом углерода находится в центре правильного тетраэдра, образованного четырьмя атомами водо- водорода. Но если все четыре вершины тетраэдра, окружающего атом углерода, заняты разными радикалами, то возможны две изомерные модификации молекулы, каждая из которых представляет собой зеркальное изображение другой. Оптическая активность возникает тогда, когда в веществе преобладают молекулы только одной модификации. Поворот направления линейной поляризации можно объяснить, предположив, что в оптически активной среде монохроматические волны правой и левой круговой поляризаций имеют различные фазовые скорости уп и ул, т.е. различные показатели преломления пп и пл. Для угла д> поворота плоскости поляризации можно получить (точно так же, как в п. 2.8) следующее выражение: Знак ср в B.73) определен в соответствии со сформулированным выше правилом (д> > 0 в случае правого вращения). Возможность существования в активной среде циркулярно поляризованных волн, распространяющихся с различными скоростями, была непосредственно показана экс- экспериментально Френелем с помощью специально изготовленной сложной призмы (рис. 2.11), состоящей из трех призм: двух тор- торцовых из правовращающего кварца (П) и сред- средней с тупым преломляющим углом — из лево- вращающего кварца (Л). Оптические оси всех призм параллельны основанию. Падающий на Рис. 2.11. Расщепление в призме Френеля торцовую грань линейно поляризованный пу- пучка линейно поляризованного света чок света расщепляется на два пучка — с пра- на два пучка с правой и левой круговыми вой и левой круговыми поляризациями. В пра- поляризациями вовращающем кварце пп < ил, в левовращаю- щем, наоборот, пп > пл. Поэтому луч правой круговой поляризации при преломлении на внутренних гранях отклоняется в сторо- сторону основания средней призмы, а левой поляризации — в сторону вершины. Состоя- Состояние круговой поляризации выходящих из призмы Френеля пучков непосредственно проверяется с помощью пластинки Я/4 и анализатора. 1 еоретическое объяснение различия фазовых скоростей волн правой и левой кру- круговых поляризаций в оптически активной среде может быть дано только при учете структуры и конечного размера ее молекул. При этом существенно, что действую- действующее на входящие в состав молекул среды электроны электрическое поле волны Е(г, г)
2.9. Естественное вращение направления поляризации 107 в данный момент времени I в разных точках протяженной молекулы различно. Ин- Индуцированный неоднородным полем волны дипольный момент молекулы зависит от значений Е(г) на всем протяжении молекулы (а не в одной точке, как это предполага- предполагалось в теории дисперсии, где действующее на электрон поле считалось однородным и вместо Ео ехр/(кг — ш) мы писали Ео ехр(—шг)). Характерный масштаб неоднородности поля — это длина волны Я. Отношение характерного размера молекул а к длине световой волны Я имеет порядок 10~3. Для многих оптических проблем пренебрежение величинами, содержащими это ма- малое отношение а /Я, вполне допустимо, так как учет таких величин привел бы лишь к малым поправкам, не внося ничего радикально нового. Но существуют эффекты, которые целиком определяются этими малыми величинами порядка а /Я. С этой точ- точки зрения проблема естественного вращения плоскости поляризации представляет принципиальный интерес, требуя выхода за рамки нулевого приближения по малому параметру а /Я. Влияние неоднородности поля волны на индуцированный дипольный момент мо- молекулы с макроскопической точки зрения означает, что поляризованность среды Р(г) в каждой точке зависит от значения напряженности Е(г) не только в той же точке г, но и в соседних точках области порядка молекулярных размеров. Другими словами, связь между Р и Е имеет нелокальный характер. То же самое относится, очевидно, и к связи между вектором индукции Т> и напряженностью Е поля. Для учета этой нелокальности достаточно представить Е в виде разложения в ряд Тэйлора по малым смещениям Аг = (Ах, Ау, Аг) из рассматриваемой точки г и ограничиться первыми членами разложения: Производная ЬЕ1/дхк имеет порядок Я/Я, а Ахк порядка размеров молекулы а, так что член Ах^дЕ^дх^ ~ {а/Х)Е и его отношение к первому члену разложения порядка а /Я. Аналогично, следующий член разложения будет иметь порядок (а/ХJЕ и т.д. Разложению Е по степеням а /Я в рамках феноменологической теории соответ- соответствует материальное уравнение, в котором вектор индукции Т) зависит не только от вектора Е, но и от его пространственных производных: = е(со)Е( + 5>ш(") ^Г "Ь Е °Ш«И ^Г + * * * A74) 0х0х Таким образом, оптические свойства изотропной среды характеризуются скаляр- скалярной диэлектрической проницаемостью е(со) и тензорами третьего и четвертого ран- рангов Ущ(<о) и (Х1к1т(со). В однородной среде они не зависят от пространственных координат, а об их зависимости от частоты монохроматического поля говорят как о частотной (или временной) дисперсии. В монохроматической плоской волне зависимость ^ и Е от координат и времени имеет вид ехр/(кг - ш). При этом дифференцирование Е по координате х1 сводится
108 2. Распространение света в изотропных средах к умножению Е на 1к1 и B.74) приводится к виду СГС: Я, = ;>>,(*), ВД; СИ: О, = ео^1с(^ ВД, B.75) к к где е1к(й>, к) = е(со)81к + « $^УшИ*/ ~ ^Цчыт^к^. B.76) Здесь 81к — символ Кронекера (81к = 1 при / = к, 81к = 0, если / фк). Выражае- Выражаемая соотношением B.75) связь векторов Б и Е в случае монохроматической волны формально принимает локальный характер. Нелокальность этой связи проявляется в том, что диэлектрическая проницаемость е^(&>,к) зависит не только от часто- частоты со света, но и от волнового вектора к (т.е. от длины волны А = 2л/к). Об этой зависимости говорят как о пространственной дисперсии в отличие от временной дисперсии, отражающей нелокальность связи между I) и Е во времени. Вследствие малости параметра а/Х эффекты пространственной дисперсии в опти- оптике малы. Они становятся существенными лишь тогда, когда приводят к качественно новым явлениям. В средах, не обладающих центром симметрии, второй член в B.76), имеющий порядок а/Х, приводит, как показано ниже, к небольшому различию фазо- фазовых скоростей волн правой и левой круговых поляризаций, т. е. к естественной оп- оптической активности. При наличии центра симметрии этот член обращается в нуль и эффекты пространственной дисперсии могут быть обусловлены лишь третьим чле- членом в B.76), имеющим порядок (я/АJ. Пример такого эффекта — слабая оптическая анизотропия кубических кристаллов, на возможность существования которой Лоренц обратил внимание еще в 1878 г. Из-за малости эффекта ((я/АJ ~ 10~6) наблю- наблюдать его трудно. Экспериментально он был обнаружен лишь в 1960 г. Е.Ф. Гроссом и А. А. Каплянским по зависимости поглощения света от поляризации в кубическом кристалле закиси меди С112О. Естественная оптическая активность может наблюдаться лишь в средах без центра инверсии, для которых тензор У^о)) отличен от нуля. В изотропной среде (жидкость или раствор) асимметричные молекулы расположены хаотически и выбор направле- направления осей л:, у и г совершенно произволен. Основываясь на эквивалентности направ- направлений осей л:, у и I в соотношении B.74), связывающем макроскопические величи- величины Е и Б, можно показать (см. задачу 2), что в изотропной среде тензор у^со) имеет вид у(со)е1к1, где у (со) — скаляр, а е[к1 — полностью антисимметричный тензор тре- третьего ранга (е1к1 — 0, если среди индексов /, к, I имеются одинаковые, и е1к1 = ±1 в зависимости от того, получены индексы г Д, / из х, у, г четным или нечетным чис- числом перестановок). В таком случае материальное уравнение B.75) можно записать в виде СГС: Б = е(со) Е - 1у (со) к х Е; B.77) СИ: Б = ео[е(й>)Е- 1у(со)кх Е]. Если молекулы жидкости обладают центром инверсии (т. е. не имеют стереоизо- меров), то макроскопически жидкость симметрична не только по отношению к лю- любому повороту, но и по отношению к отражению (инверсии) в любой точке, и для
2.9. Естественное вращение направления поляризации 109 нее у (со) = 0. Только тогда, когда жидкость содержит молекулы двух модификаций (представляющих зеркальные изображения друг друга) в разных количествах, она не обладает центром симметрии и у (со) ф 0. В такой гиротропной среде у вектора Б, как видно из B.77), есть небольшая составляющая, перпендикулярная Е и направ- направлению волнового вектора к. По модулю она отличается от составляющей вдоль Е множителем порядка а/Л. При вещественных е(со) и у(со) (прозрачная среда) эта составляющая сдвинута по фазе на четверть периода. Покажем, что в среде, удовлетворяющей материальному уравнению B.77), волны правой и левой круговых поляризаций характеризуются различными показателя- показателями преломления пп Ф пл. Обратимся к уравнениям Максвелла B.7) и B.9). В слу- случае плоской монохроматической волны, когда зависимость Е и I) от г и г имеет вид ехр /(кг - ш), они из дифференциальных превращаются в алгебраические: СГС: к х В = - - В, СИ: е0с2к х В = -со Б, B.78) к х Е = - В; кхЕ = со В. B.79) с Исключим из этих уравнений индукцию магнитного поля, подставляя В из B.79) в B.78): СГС: к х (к х Е) = - % Б; СИ: еос2к х (к х Е) = -со2 Б. Преобразуем двойное векторное произведение, учитывая, что к • Е = 0, и выразим в правой части В через Е с помощью материального уравнения B.77). В результате получим однородное уравнение для электрического поля Е: (с2к2 - есо2) Е + 1усо2к х Е = 0. B.80) Выберем ось г вдоль направления распространения волны, т. е. вдоль вектора к. В проекциях на оси х иу уравнение B.80) принимает вид (с2к2 - есо2) Ех - 1усо2кЕу = 0, B.81) 1усхJкЕх + (с2к2 - есо2) Еу = 0. Ненулевое решение этой однородной системы уравнений для Ех и Еу существует, когда ее определитель равен нулю. Из условия существования ненулевого решения получаем уравнение для нахождения к: с2к2 - е(со) со2 = ±усо2к. B.82) В нулевом приближении малую правую часть в B.82) можно положить равной нулю, что дает к0 = у/ёсо/с, п0 = у/е — прежний результат, соответствующий пренебреже- пренебрежению эффектами пространственной дисперсии. В следующем приближении по малому параметру Я/'а к± = к0±1-у^, п± = п0±1-У^. B.83)
110 2. Распространение света в изотропных средах Знаку «4-» в B.83) соответствует решение системы B.81), у которого Еу/Ех = —/, т.е. волна правой круговой поляризации, знаку «—» — левой. Поэтому пя — пп = = п_ — п+ = —усо/с. У двух изомерных модификаций вещества знак материальной постоянной у противоположен. При у > 0 будет пл — пп < 0 и среда в соответствии с B.73) характеризуется левым вращением, при у < 0 — правым. Таким образом, феноменологическая теория на основе материального уравне- уравнения B.77) дает объяснение естественному вращению направления поляризации световой волны. Задача микроскопической теории оптической активности состоит в расчете константы у (со), определяющей угол поворота, и нахождении ее частотной зависимости (дисперсии) для той или иной модели гиротропной среды. Естественное вращение плоскости поляризации можно проиллюстрировать нагляд- наглядным демонстрационным опытом в СВЧ-диапазоне. Модель активной среды устроена следующим образом: одинаковые пружинки диаметром 6—7 мм и длиной около 10 мм из медной изолированной проволоки (активные «молекулы»), хаотически ориенти- ориентированные, заполняют небольшую картонную коробку. Рупор излучателя, питаемо- питаемого клистронным генератором, создает линейно поляризованную монохроматическую волну (Я = 3 см). Такой же рупор приемника повернут вокруг продольной оси на угол л/2 относительно излучателя («скрещен» с излучателем). Поэтому приемник никакого сигнала не регистрирует. Введение коробки с пружинками на пути вол- волны между излучателем и приемником приводит к появлению сигнала. Поворотом рупора приемника на некоторый угол вокруг продольной оси можно этот сигнал погасить. Это доказывает, что поляризация волны после прохождения через модель среды остается линейной, но с другим направлением поляризации. Если взять короб- коробку, заполненную хаотически ориентированными пружинками таких же размеров, но навитыми в противоположную сторону, то и направление поляризации поворачива- поворачивается на такой же угол в противоположную сторону. Этот опыт моделирует правое и левое вращения направления поляризации двумя модификациями молекул (стерео- изомерами) одного и того же макроскопически изотропного вещества. Контрольные вопросы • В чем отличие естественной оптической активности от магнитного вращения плоскости поляризации? • В каком случае активная среда называется правовращающей? • При каком условии макроскопически изотропная среда не имеет центра симметрии? • Почему в призме Френеля пучок линейно поляризованного света расщепляется на два циркулярно поляризованных? • Почему в неоднородном внешнем поле связь между Р и Е имеет нелокальный характер? • Что такое пространственная дисперсия? • Рассмотрите с помощью уравнений Максвелла и материального уравнения B.77) взаимное расположение векторов Е, В, О и к плоской волны, распространяющейся в гиротропной среде.
2.10. Рассеяние света 111 Задачи 1. Чему равна разность показателей преломления правой и левой круговых поляризаций в кварце для желтого света натрия (Я = 589,3 нм), если при распространении вдоль оп- оптической оси такой свет испытывает поворот направления поляризации 21,73 угл. град, на миллиметр? 2. Покажите, что в изотропной среде связь векторов ЕиБс точностью до величин поряд- порядка (а/ЯJ выражается соотношением причем у тензора у1к1 все компоненты, имеющие два одинаковых индекса, обращаются в нуль (при любом значении третьего индекса), например ухху = 0, уххх = 0. Покажите, 4X0 Ух у г = —Уухг — Уугх и т-Д-> т-е- что ПРИ перестановке любой пары индексов компонен- компонента уш, у которой все индексы различны, меняет знак. Покажите, что при наличии центра симметрии все компоненты тензора у1к1 равны нулю. Указание. Рассмотрите поворот системы координат вокруг одной из осей, например оси х, на угол 90°. При этом у —> г, Еу —> Ег, г —> —у, Ег —> — Еу. Отсюда ухху = уххг, Уххг = —Ухху* т-е- Ухху = Уххг = 0 и т.д. Для среды с центром симметрии рассмотрите пре- преобразование инверсии. 3. Используя приведенные в тексте данные, найдите угол, на который разведены поляризо- поляризованные по правому и левому кругу лучи, выходящие из призмы Френеля (см. рис. 2.11). Угол р — 152°, показатель преломления в кварце при распространении вдоль оптической оси п = 1,54. Ответ. ^4'. 2.10. Рассеяние света Злектрическое поле распространяющейся в веществе световой волны раскачива- раскачивает входящие в состав атомов и молекул электроны, и они становятся центрами вторичных сферических волн, излучаемых во все стороны. Поэтому распростра- распространение света в веществе должно, казалось бы, сопровождаться рассеянием. Од- Однако в п. 2.2 было показано, что в прозрачной однородной среде плоская волна распространяется только в прямом направлении, не испытывая рассеяния в сто- стороны.*) Такой результат сложения всех вторичных волн обусловлен их коге- когерентностью. Это можно пояснить следующим образом. Разделим мысленно всю среду на одина- одинаковые элементы объема, содержащие достаточно много молекул, чтобы среду в них можно было рассматривать как сплошную. В то же время размеры этих элемен- элементов должны быть малы по сравнению с длиной волны. Монохроматическая световая волна индуцирует у этих элементарных объемов дипольные моменты, изменение ко- которых во времени приводит к излучению когерентных вторичных волн одинаковой +) Предполагается, что поверхности постоянной фазы рассматриваемой волны представляют собой бес- бесконечные плоскости. При ограничении их размеров возникают явления дифракции (см. п. 6.3). Дифракци- Дифракционная расходимость волны мала при достаточно больших размерах волновых поверхностей.
112 2. Распространение света в изотропных средах амплитуды. Рассмотрим один такой элемент объема Ух (рис. 2.12). В некотором направлении, составляющем угол в с направлением исходной волны, он излучает вторичную волну определенной амплитуды и фазы. }А На плоскости АВ, перпендикулярной направлению вол- волны, всегда можно выделить другой элемент объема У2, который в том же направлении в излучает вторичную волну той же амплитуды, но сдвинутую по фазе на л. Эти волны при сложении полностью погасят друг друга. Из рис. 2.12 видно, что для этого расстояние / между Ух и У2 должно быть равно Х/B$тв). Так как все элемен- элементы объема на плоскости АВ можно разделить на такие пары, то ясно, что рассеянных волн в направлении в не будет. Рис. 2.12. К объяснению от- Приведенное рассуждение справедливо для любых сутствия рассеянного света « Л л Л Л тт/г * в идеально однородной среде значении 0, кроме в = 0 и в = л. Чтобы убедиться в от- отсутствии волны, рассеянной назад (в — л), можно рас- рассмотреть два элемента объема У^ и^, отстоящих друг от друга на Я/4 вдоль направления волны (см. рис. 2.12). Колебания вторичного ис- источника Уз отстают по фазе от Ух на четверть периода, поэтому вторичные волны, распространяющиеся назад, сдвинуты на Я/2 и при сложении гасят друг друга. Толь- Только для в = О все вторичные волны складываются синфазно и образуют проходящую волну. Соложение вторичных волн дает одну только прямую волну лишь при условии, что все вторичные источники — элементарные объемы — строго одинаковы. Они должны содержать одинаковое число атомов-излучателей вторичных волн. Это усло- условие выполняется для идеально однородных сред, и в них рассеяние света вооб- вообще не происходило бы. С макроскопической точки зрения рассеяние света может быть обусловлено только неоднородностями среды. При слабых нарушениях од- однородности рассеянный в стороны свет составляет лишь малую долю первичного пучка. Параллельный пучок света в высококачественном стекле или в тщательно очищенной воде почти не виден при наблюдении сбоку, т.е. свет почти не рас- рассеивается в стороны. В то же время пучок света отчетливо виден со всех сто- сторон, если в воде содержатся мельчайшие пузырьки воздуха или капельки другой нерастворимой жидкости (например, жира), находящиеся во взвешенном состоя- состоянии. Рассеяние света происходит и тогда, когда сами взвешенные частицы имеют размеры, меньшие длины волны видимого света, и потому недоступны прямому наблюдению. Такие среды называют мутными. Основные закономерности рассея- рассеяния света в мутных средах были впервые экспериментально исследованы Тинда- лем в 1869 г. Следующий простой опыт дает представление об этих закономер- закономерностях. Интенсивный пучок белого света проходит сквозь стеклянную кювету, запол- заполненную водой, в которую добавлено несколько капель молока. При наблюде- наблюдении сбоку рассеянный свет имеет более голубой оттенок, чем свет источника; свет, прошедший сквозь кювету, имеет при достаточной ее толщине красноватый оттенок.
2.10. Рассеяние света 113 Рассеянный под прямым углом к первичному пучку свет имеет линейную поляри- поляризацию даже тогда, когда падающий свет не поляризован. Вектор Е в рассеянном свете перпендикулярен направлению первичного пуч- пучка. Зависимость интенсивности рассеянного све- света 1F) от направления наблюдения в графически изображается индикатрисой рассеяния 1{в) ~ 1 + соз2 в Первичный /@)~1+со820 (рис. 2.13). Для естественного падающего света индикатриса рассеяния симметрична относитель- относительно оси первичного пучка и относительно перпен- « 2 п Инттшгятпигя пяггРят1Я НРПО_ дикулярной ей плоскости. ляризованного света в мутной среде Хеория эффекта Тиндаля была дана Рэлеем в 1899 г. Предположим, что оптичес- оптическая неоднородность создается одинаковыми сферическими частицами, беспорядочно распределенными в однородной прозрачной среде с диэлектрической проницаемо- проницаемостью с « 1. Если размеры частицы малы по сравнению с длиной волны, то действую- действующее на частицу электрическое поле Е(г) световой волны можно считать однородным. Индуцируемый внешним полем дипольный момент р(г) частицы пропорционален напряженности поля: р(г) = ахЩг) (СГС) или р(г) = е^а^Щг) (СИ), где поляризуе- поляризуемость а1(со) частицы зависит от диэлектрической проницаемости е^(а)) материала частицы и пропорциональна ее объему: - 1 СГС: ах = 3, ег+2 СИ: ах = -8—- 1 ех+2 B.84) Напряженность Е' электрического поля вторичной волны, излучаемой осцилли- осциллирующим дипольным моментом частицы, на большом по сравнению с ее размерами расстоянии г ^> а определяется формулами A.66). Направление Е' связано с направ- направлением р так, как показано на рис. 1.17. Если падающий свет линейно поляризован, то колебания вектора р происходят в той же плоскости. При наблюдении перпен- перпендикулярно первичному пучку в этой плоскости рассеянного излучения не будет, так как диполь вдоль своей оси не излучает. Поместив на пути первичного пуч- пучка поляризатор и поворачивая его вокруг оси пучка, при наблюдении перпендикуляр- перпендикулярно пучку увидим изменение интенсивности рассеянного света вплоть до полного его исчезновения. Это происходит при совпа- совпадении направления колебаний в первичном пучке с направлением наблюдения. Естественный падающий свет можно Рис. 2.14. К зависимости поляризации и интен- представить как некогерентную смесь двух сивности рассеянного света от угла рассеяния ВОлн одинаковой интенсивности, линейно поляризованных во взаимно перпендику- перпендикулярных направлениях, например вдоль осей х и у на рис. 2.14. Поэтому и дипольный момент р рассеивающей частицы будет совершать колебания вдоль осей х и у. При наблюдении перпендикулярно первичному пучку, т.е. вдоль оси у (в = я/2), рас- рассеянный свет будет полностью поляризован, так как распространяющееся в этом
114 2. Распространение света в изотропных средах направлении излучение обусловлено только колебаниями р вдоль оси х. По мере изменения угла в от значения л/2 (в обе стороны) к поляризованному вдоль оси х рассеянному свету неизменной интенсивности примешивается не когерентный с ним свет, поляризованный в плоскости у г (см. рис. 2.14), интенсивность которого изме- изменяется как соз2 в. В результате степень поляризации рассеянного света постепенно уменьшается, обращаясь в нуль для 0 = 0 и 0 = я, а его интенсивность изменяется как 1 + соз2 в. Этим объясняется форма индикатрисы рассеяния естественного света, приведенной на рис. 2.13. Для нахождения интенсивности рассеянного одной частицей света /(г, в) подста- подставим в A.66) р = а^со2Е (СГС) или р = е0а1(^2Е (СИ). Кроме того, в случае неполя- ризованного первичного пучка в выражении для интенсивности рассеянного света, как только что было выяснено, нужно заменить зш2 в на A + соз2 в)/2. В результате получим СГС: 1(г, в) = Ш "^ 1A+ сое2 в) /0; л -> , B-85) СИ- Кг в)- 1 "'И 1+С08вг си. Пг,в)-{4яJ с4г2 2 /0, где /0 — интенсивность первичного пучка. В том случае, когда рассеивающие сфе- сферические частицы находятся на расстояниях, больших по сравнению с длиной волны, и распределены по объему беспорядочно, относительные фазы рассеянных ими волн в точке наблюдения имеют случайные значения. Поэтому полная интенсивность рас- рассеянного света равна сумме интенсивностей световых волн, рассеянных отдельными частицами. Когда расстояние до точки наблюдения велико по сравнению с разме- размерами рассеивающего объема, расстояние г в B.85) для всех частиц можно считать одинаковым. Поэтому полная интенсивность рассеянного света получается из B.85) умножением /(г, в) на число частиц N в объеме V. Основная зависимость интенсивности рассеянного света от частоты определяет- определяется множителем со4 в B.85). В самом деле, если материал взвешенных сферических частиц прозрачен в видимой области, зависимость поляризуемости а^ (со) от часто- частоты, обусловленную дисперсией ех (со) в B.84), можно не принимать во внимание по сравнению с сильной зависимостью ~ со4. Интенсивность рассеянного мутной средой света оказывается обратно пропорциональной четвертой степени длины волны. Этот результат известен как закон Рэлея. Коротковолновое излучение рассеивается силь- сильнее, поэтому при рассеянии белого света получается голубой оттенок, а прошедший свет, обедненный голубыми лучами, имеет красноватый оттенок. Рассмотренные закономерности рассеяния света не выполняются, если размеры рассеива- рассеивающих частиц сравнимы с длиной волны. Зависимость интенсивности от длины волны стано- становится менее заметной. Рассеянный в поперечном направлении свет будет поляризован лишь частично, причем степень его поляризации зависит от размеров и формы частиц. Рассеяние вперед становится преобладающим, и индикатриса сохраняет симметрию лишь относительно направления первичного пучка. Теория рассеяния света на сферических частицах, размеры которых могут быть поряд- порядка или больше длины волны, была впервые разработана Ми в 1908 г. Рассеяние Ми можно рассматривать как дифракцию (см. п. 6.3) плоской волны на одинаковых однородных сферах, хаотически распределенных в однородной среде и находящихся друг от друга на расстояниях, больших по сравнению с длиной волны.
2.10. Рассеяние света 115 Рассеяние Ми имеет много практических приложений: изучение атмосферной пыли и аэро- аэрозолей, влияние облаков и тумана на распространение света, теория радуги. Измерение характе- характеристик рассеянного света лежит также в основе оптических методов исследования коллоидных суспензий (нефелометрия). Опыт показывает, что рассеяние света происходит не только в мутных средах, но и в тщательно очищенных от посторонних примесей или включений жидкостях и га- газах. Рассеяние в чистом веществе, как правило, слабое. Но тем не менее оно пред- представляется принципиально важным явлением. Физическая причина оптической неод- неоднородности в идеально чистых средах была указана М. Смолуховским в 1908 г. Из-за хаотического характера теплового движения молекул в среде возникают флуктуации плотности и, следовательно, флуктуации показателя преломления. Такой тип рассе- рассеяния света называют молекулярным. Флуктуации плотности особенно велики вблизи критического состояния, где сжимаемость среды становится очень большой. Поэтому в критической точке наблюдается интенсивное рассеяние света (критическая опалес- ценция). Стеклянная ампула с эфиром при достижении критического состояния дает на экране совершенно черную тень. Количественная теория молекулярного рассеяния света была построена Эйнштей- Эйнштейном в 1910 г. Здесь мы ограничимся простейшим случаем слабого рассеяния в иде- идеальных газах. Наиболее известный пример — молекулярное рассеяние солнечного света в земной атмосфере, которым объясняется голубой цвет и поляризация свече- свечения неба. Эти эффекты легко наблюдаемы благодаря большой толщине слоя рассеи- рассеивающего газа. Полное гашение вторичных волн, распространяющихся во всех направлениях, кроме направления падающей волны, происходит лишь тогда, когда равны ампли- амплитуды вторичных волн от одинаковых элементов объема Д V среды. Из-за флуктуации числа молекул газа в таких элементах объема точного равенства амплитуд вторич- вторичных волн не будет. Электрическое поле вторичной волны от /-го элемента объема в точке наблюдения можно представить в виде суммы Е,- + #Е/5 где Е, — напряжен- напряженность поля вторичной волны при условии, что число молекул в этом элементе равно своему среднему значению (одинаковому для всех элементов), а 8Е1 — изменение напряженности, вызванное флуктуацией числа молекул (дополнительным дипольным моментом /-го элемента). Сумма напряженностей Е^ полей когерентных волн от всех элементов объема равна нулю для любого направления (кроме в = 0), поэтому для нахождения результирующего поля нужно сложить только 8ЕГ Интенсивность рас- рассеянной волны Из-за независимого характера флуктуации числа молекул идеального газа в раз- разных элементах объема двойная сумма с / ф у обращается в нуль. Поэтому ин- интенсивность рассеянного света равна сумме интенсивностей вторичных волн, обу- обусловленных дипольными моментами, возникшими за счет флуктуации числа моле- молекул в каждом элементе объема. Дополнительный дипольный момент /-го элемента объема равен аЕ8И[ (СГС) или е0аЕ8М1 (СИ), где а — поляризуемость молеку- молекулы, а <5Л^- — отклонение числа молекул в этом элементе от среднего значения. Интенсивность /Дг, в) рассеянного им света можно найти, повторяя рассуждения,
116 2. Распространение света в изотропных средах которые привели к формуле B.85). В результате получим выражение, отличающе- отличающееся от B.85) заменой поляризуемости а1((о) взвешенной частицы на аЙУ,-. Поэто- Поэтому /. (г, 0) ~ (&У,.J. Интенсивность света, рассеянного всеми элементами объема, можно получить, заменив (#Л^.J его средним значением ((ЯЛ^-J) и умножив на число # таких элемен- элементов во всем рассеивающем объеме V, т. е. на # = V/ ДV. Для идеального газа средний квадрат флуктуации числа частиц в выделенном малом элементе объема ДУ равен, как известно, среднему числу частиц в этом элементе: (E^J) = Л^ДУ, где N — концентрация молекул. Таким образом, (EЛ^/J)^ = ЫУ и для полной интенсивности рассеянного идеальным газом света получаем /ТУ1. 1(~ /Э\ V / \^\ С 1{К, V) = д—х B.86) ) 1+СО820 Этот результат заслуживает обсуждения. Оказывается, идеальный газ рассеивает свет так, что интенсивности вторичных волн, испускаемых отдельными молекула- молекулами, просто складываются, несмотря на когерентность этих вторичных волн. Простой результат B.86) получается только для идеального газа, когда средний квадрат флук- флуктуации числа молекул в некотором объеме равен среднему числу молекул в этом объеме. Поэтому измерение интенсивности рассеянного газом света позволяет «со- «сосчитать» рассеивающие молекулы и тем самым определить постоянную Авогадро Л^. Совпадение ЫА со значениями, полученными другими методами, может служить до- доказательством молекулярного характера рассеяния света. Лишь в предельном случае сильно разреженного газа, в условиях, когда среднее расстояние между молекулами не мало по сравнению с длиной волны света, среду в пределах малых элементов объема уже нельзя рассматривать как сплошную. Тогда рассеяние действительно происходит независимо на каждой молекуле, подобно тому, как на взвешенных по- посторонних частицах в мутной среде. Удобной характеристикой отдельных рассеивающих центров служит эффективное сечение рассеяния а, определяемое как отношение потока энергии, рассеиваемой по всем направлениям, к интенсивности падающего излучения. Эта величина имеет раз- размерность площади. Если в падающем излучении мысленно выделить поток, приходя- приходящийся на «мишень» такой площади а, то как раз столько энергии и рассеивает центр по всем направлениям. Для нахождения этой энергии нужно интенсивность /(г, 0) излучения, рассеиваемого одной частицей, проинтегрировать по поверхности сферы радиуса г. Учитывая, что 2л л ДA+соз20)(Ш = ^ [йср /A+со820)зш0с10 = у, О О из B.85) находим СГС: <7 = ^^га2И; СИ: а = ~(^а2{а>). B.87) 3 с4 Ьл с4
2.10. Рассеяние света 117 Рассмотрим рассеяние света заряженным осциллятором, который моделирует по- поведение оптического электрона атома (или молекулы) в классической теории дис- дисперсии. Его поляризуемость а(со) была найдена в п. 2.3 (см. B.32)). Вдали от соб- собственной частоты со0 затуханием можно пренебречь, положив у = 0. Подставляя а в B.87), получаем где СГС: го = -Ц; СИ: г0 = -I- -Ц. B.89) тс2 4яг тс^ В случае рассеяния света свободным электроном в формуле B.88) следует по- положить со0 = 0. При этом частота со выпадает, т. е. сечение рассеяния а становится константой: а — (8л/3)гц. Оно пропорционально площади круга радиуса г0. По этой причине г0 = 2,8 • 10~13 см называют классическим радиусом электрона. При рассеянии света в воздухе собственные частбты осцилляторов значительно больше частоты видимого света. Поэтому со2 в знаменателе B.88) можно пренебречь по сравнению с соц, и сечение рассеяния оказывается пропорциональным четвертой степени частоты. Синий свет, частота которого примерно вдвое больше красного, рассеивается в шестнадцать раз интенсивнее. Этим, например, объясняется голубой цвет неба. При приближении частоты со света к собственной частоте со^ осциллятора сече- сечение рассеяния, как видно из B.88), резонансно возрастает. При со «со0 пренебре- пренебрегать затуханием уже нельзя. Можно показать (см. задачу 1), что при со = со0 се- сечение а = ^лгцсо2/у2. Если константа у обусловлена радиационным затуханием осциллятора (сильно разреженный газ), то сечение рассеяния приближается к Я2: в условиях резонанса эффективный размер «мишени», которую представляет атом для падающего излучения, в масштабах самого атома (« 10~8 см) становится огром- огромным (« 10~5 см). Этот пример показывает, что локализация потока энергии световой волны для незамкнутой поверхности, размеры которой меньше длины волны, не име- имеет смысла (см. замечание в п. 1.4, с. 34). Описываемое явление называется резонансной флуоресценцией. В стеклянный сосуд, откачанный до высокого вакуума и заполненный парами металла (например, натрия) с очень малой плотностью, направляют пучок света от газоразрядной лампы с парами того же металла. Сосуд начинает излучать по всем направлениям яркий свет той же частоты, что и у возбуждающей лампы (желтый в случае натрия). Энер- Энергия падающего пучка почти целиком может перейти в энергию рассеянного излуче- излучения. Как впервые показал Вуд, для этого необходима лишь достаточно низкая плот- плотность паров металла, чтобы константа у определялась радиационным затуханием, а не столкновениями, при которых часть приобретаемой атомом световой энергии безызлучательно превращается в энергию хаотического теплового движения атомов. По той же причине в сосуде должно быть возможно меньше инородных молекул. В противном случае резонансная флуоресценция может ослабиться или даже совсем исчезнуть.
118 2. Распространение света в изотропных средах Выше было показано, что благодаря поперечности световой волны при наблюдении под прямым углом к направлению первичного пучка естественного света (в — л/2 на рис. 2.14) рассеянный свет должен быть полностью линейно поляризован в перпендикулярной первично- первичному пучку плоскости. Однако при рассеянии в газе или жидкости с анизотропными молекулами поляризация рассеянного света обычно не бывает полной. Объясняется это тем, что направле- направление вектора индуцированного падающей волной дипольного момента анизотропной молекулы не совпадает, вообще говоря, с направлением электрического поля волны. Деполяризация рассеянного света будет выражена тем сильнее, чем больше анизотропия поляризуемости мо- молекул среды. Изменение спектрального состава излучения при рассеянии обусловлено зависи- зависимостью эффективного сечения от частоты. Быстрое возрастание а = <у4 в соответ- соответствии с формулой B.87) (это относится и к рассеянию в мутных средах, и к мо- молекулярному рассеянию, когда поляризуемость а(со) почти не зависит от частоты; исключение составляет только резонансная флуоресценция) приводит к тому, что распределение энергии в рассеянном свете отличается от первичного относитель- относительно большей величиной энергии в высокочастотной части спектра. Для монохро- монохроматического падающего излучения во всех рассмотренных выше случаях рассеян- рассеянный свет характеризуется той же частотой. Такой тип рассеяния называют рэлеев- ским. Однако при молекулярном рассеянии света в среде, содержащей многоатомные молекулы, в спектре рассеянного излучения наблюдаются добавочные линии (са- (сателлиты), сопровождающие каждую из спектральных линий первичного света. Это явление было открыто в 1928г. Л.И. Мандельштамом и ГС. Ландсбергом в Москве и Раманом в Индии. Оно называется комбинационным рассеянием света. Про- Происхождение сателлитов связано с модуляцией рассеянного света низкочастотными колебаниями атомов, образующих молекулу рассеивающей среды. Поляризуемость молекулы зависит, вообще говоря, от расположения составляю- составляющих ее атомов. При колебаниях атомов поляризуемость изменяется около среднего значения а0 в такт с этими колебаниями: Частоты этих колебаний соответствуют инфракрасной области спектра A012-1013 Гц), т.е. изменения а{1) происходят медленно по сравнению с колеба- колебаниями электрического поля в падающем свете (« 1015 Гц). Поэтому можно считать, что в монохроматическом поле падающей волны изменение дипольного момента мо- молекулы происходит по закону СГС: р{г) = а{г) Е{г) = (а0 + Р(()) Ео созш; СИ: т. е. представляет собой амплитудно-модулированное колебание. Такими же модули- модулированными будут и колебания напряженности поля в рассеянном свете. Несущая частота этих колебаний равна частоте падающего света со, а модуляция происхо- происходит на частотах п1 колебаний атомов в рассеивающей свет молекуле. Спектр такого амплитудно-модулированного колебания состоит из колебаний несущей частоты со
2.10. Рассеяние света 119 и колебаний с комбинационными частотами со ± п1 (см. A.79)). По образному вы- выражению Л. И. Мандельштама, «спектр рассеянного света несет то, что молекула говорит о себе. Изучая его, вы изучаете ее строение». На опыте интенсивности са- сателлитов одной и той же линии, смещенных в красную сторону спектра, оказывают- оказываются больше, чем у соответствующих сателлитов, смещенных в фиолетовую сторону, хотя по классической теории они должны быть одинаковы. Наблюдаемая асиммет- асимметрия интенсивностей получает естественное объяснение в квантовой теории, когда учитывается различие населенностей дискретных колебательных уровней энергии молекулы. Исследование спектров комбинационного рассеяния представляет собой мощный метод изучения структуры молекул и характера внутримолекулярных колебаний. Спектры комбинационного рассеяния каждого химического соединения настолько специфичны, что позволяют его идентифицировать и обнаруживать в смесях. При рассеянии на флуктуациях плотности в твердых телах и жидкостях также про- происходит модуляция рассеянного света. Флуктуации плотности можно рассматривать как суперпозицию стоячих акустических (упругих) волн, представляющих собой сво- своего рода фазовые дифракционные решетки (см. п. 6.5). Рассеянный свет появляется в результате дифракции на этих пульсирующих решетках (они периодически исче- исчезают в те моменты, когда деформация обращается в нуль) и поэтому оказывается модулированным. Эта модуляция также проявляется в виде сателлитов, расположен- расположенных по обе стороны от частоты монохроматического падающего света. Теория пока- показывает, что в этом случае частота модуляции п зависит от направления рассеянной волны: О _ V . в — = 2п- ЗШ-, со с 2 где V — скорость звука в рассеивающей среде. Так как у/с ~ 10", то эти сателлиты расположены очень близко к часто- частоте падающего света и проявляются в виде тонкой структуры линии рэлеев- ского рассеяния. Они могут быть зарегистрированы лишь с помощью спектраль- спектральных приборов высокой разрешающей силы. Описываемое явление было пред- предсказано Л. И. Мандельштамом и Л. Бриллюэном и экспериментально обнаружено Г. С. Ландсбергом и Л. И. Мандельштамом в монокристалле кварца и Е. Ф. Гроссом в жидкостях. Контрольные вопросы • Почему в идеально однородной среде не происходит рассеяние света? Опишите основные закономерности рассеяния света в мутной среде. • Как зависят интенсивность и поляризация рассеянного света от направления, если падаю- падающий свет: а) линейно поляризованный; б) естественный? • Какова физическая причина рассеяния света в идеально чистом веществе? • Почему для идеального газа рассеяние на флуктуациях плотности происходит так, как будто каждая молекула рассеивает свет независимо от других?
120 2. Распространение света в изотропных средах • Как объясняется голубой цвет неба? Почему применение желтого светофильтра при фото- фотографировании ландшафтов и при аэрофотосъемке увеличивает четкость изображений уда- удаленных предметов? • Какие условия необходимы для наблюдения резонансной флуоресценции? • В чем заключается комбинационное рассеяние света? Какие физические причины вызывают это явление? Задачи 1. Рассчитайте эффективное сечение а рассеяния монохроматического света заряженным ос- осциллятором, если частота со света близка к собственной частоте со0 осциллятора. Решение. При со « со0 необходимо учитывать затухание осциллятора. Тогда _ 8я 2 ^ 3 (оJ — со2) + 4у2со2' или, заменив (о$ — со2 на 2со0Асо, получаем а==ТГ°(А^J+у2' Зависимость сечения от частоты изображается лоренцевским контуром с шириной на поло- половине высоты 2у. При точном совпадении со с со0 получаем \лг\оу^1у2. Подставляя сюда г0 из B.89) и у из A.73), находим эффективное сечение резонансного рассеяния света осцил- осциллятором, затухание которого обусловлено только излучением: а = [3/Bл)]Лц. 2. Найдите закон изменения интенсивности проходящего через рассеивающую среду парал- параллельного пучка падающего монохроматического излучения. Решение. Выберем ось г вдоль направления пучка. Рассмотрим слой среды между плос- плоскостями г иг + дг. Элемент объема такого слоя, имеющий единичную площадь поперечно- поперечного сечения, содержит N дг рассеивающих центров, если N — их концентрация. В условиях, когда эти центры расположены хаотически, поток рассеиваемой выделенным элементом объема энергии равен 1аNдг, где а — сечение рассеяния для одного центра, а 1(г) — интенсивность падающего пучка. Такое же выражение справедливо и в случае молекуляр- молекулярного рассеяния на флуктуациях плотности в идеальном газе, если под а понимать сечение рассеяния для одной молекулы. Таким образом, 61 = — 1аЫ6г9 откуда Интенсивность пучка экспоненциально убывает по мере его распространения. Сравним это выражение с законом Бугера B.29). Если истинное поглощение (т.е. диссипация энер- энергии света) отсутствует и ослабление пучка обусловлено только рассеянием, коэффициент ослабления (экстинкции) а = 2ха)/с в B.29) должен совпадать с г\. Проверим это для резо- резонансной флуоресценции, когда со « со0. Показатель затухания х выражается в этом случае формулой B.49). Подставим в нее значение у из A.73), справедливое для чисто радиаци- радиационного затухания осциллятора: 2л Сравнивая это выражение с выражением для эффективного сечения а, найденным в зада- задаче 1, убеждаемся, что а = Мт = г]. Это значит, что мнимая часть показателя преломления к в B.50) учитывает в этом случае эффект рассеяния.
2.11. Скорость света. Фазовая и групповая скорости 121 3. Найдите закон ослабления интенсивности параллельного пучка монохроматического света за счет молекулярного рассеяния в идеальном газе, показатель преломления п которого мало отличается от единицы. Решение. При рассеянии на флуктуациях плотности в идеальном газе интенсивность рас- рассеянного света, в соответствии с B.86), равна сумме интенсивностей вторичных волн, рас- рассеянных отдельными молекулами. Поэтому, как и в предыдущей задаче, /(г) = /о ехр(—^г), где ц = NG, а для сечения а можно воспользоваться формулой B.87), выразив в ней поля- поляризуемость молекулы а через показатель преломления: откуда а = 2(п — 1)/М Подставляя а в B.87), находим _ 2со4 (я-1J Ц" Зле4 N ' Эта формула была получена Рэлеем в 1881 году. 4. Почему мы отчетливо видим облака (или туман), в то время как водяной пар, из которого они образовались при понижении температуры, совершенно не был виден, хотя, безуслов- безусловно, этот пар содержался в воздухе до образования облаков (или тумана)? Решение. Рассмотрим N молекул водяного пара. Пока они находятся в газообразной фазе, суммарное сечение рассеяния света этими молекулами пропорционально N. Пред- Предположим, что они сконденсировались в одну капельку тумана (размером много меньше длины волны света). Соответствующее сечение рассеяния определяется квадратом ее по- поляризуемости (см. B.87)) и, следовательно, пропорционально Ы2. Те же молекулы после конденсации рассеивают свет приблизительно в N раз сильнее. 2.11. Скорость света. Фазовая и групповая скорости Скорость света с в вакууме — одна из важнейших мировых констант. Согласно со- современным представлениям, выдающееся значение этой универсальной постоянной обусловлено тем, что она определяет предельную скорость распространения любых взаимодействий и сигналов, любых силовых полей независимо от их физической при- природы. Эта скорость одинакова во всех системах отсчета и обусловлена структурой пространства и времени, а не конкретным видом носителя сигнала — электромаг- электромагнитными волнами. В частности, она определяет и скорость гравитационных волн в вакууме. Универсальный характер скорости света в вакууме находится в глубоком про- противоречии с классическими представлениями о пространстве и времени, согласно которым при переходе от одной системы отсчета к другой скорость любого движе- движения изменяется на величину относительной скорости этих систем. Введение в физи- физику представления о существовании абсолютной (не зависящей от системы отсчета) скорости потребовало формирования новых — релятивистских — представлений о пространстве и времени, составляющих суть теории относительности. Эти пред- представления утверждают относительный (т. е. зависящий от системы отсчета) характер одновременности событий, промежутков времени и пространственных расстояний. Ограничившись здесь этими общими замечаниями о роли скорости света в физиче- физической теории, перейдем к обсуждению экспериментальных методов ее определения.
122 2. Распространение света в изотропных средах Скорость света впервые была измерена в 1676 г. датским астрономом Ремером, ко- который связал наблюдаемые нерегулярности затмений спутников Юпитера с време- временем прохождения света по диаметру орбиты Земли и получил таким образом пра- правильное по порядку величины значение скорости света. Ныне наиболее кратко суть этого метода определения скорости света можно уяснить путем сравнения с эф- эффектом Доплера: наблюдаемый период обращения спутника становится больше, ког- когда Земля при своем движении по орбите удаляется от Юпитера, и меньше, когда приближается. Для относительного изменения периода можно использовать элемен- элементарное выражение АТ/Т = ±у/с9 справедливое, когда относительная скорость ис- источника и наблюдателя у много меньше скорости света. Знак «+» соответствует увеличению расстояния, «-» — уменьшению. Другой астрономический метод определения скорости света основан на явлении аберрации света (см. п. 8.2), которое было открыто английским астрономом Брэдли в 1725-1728 гг. Это явление заключается в кажущемся смещении положений звезд, вызываемом движением Земли по орбите. Звезды, расположенные в направлении нормали к плоскости орбиты Земли, описывают в течение года на небесной сфере окружности с угловым диаметром около 41". В соответствии с теорией, этот угло- угловой диаметр равен 2у/с9 что позволяет определить с. Наиболее точные измерения аберрации дают с — 2,999 • 108 м/с. Измерение скорости света от земного источника в лабораторных условиях впер- впервые было выполнено Физо в 1849 г. Пучок света прерывался зубчатым колесом, вращавшимся перед источником света, и отражался от зеркала, находившегося на расстоянии около 9 км. Если за время движения светового импульса до зеркала и обратно колесо повернется на такой угол, что на месте прорезей окажутся зу- зубья, вернувшийся свет не попадет в окуляр и поле зрения окажется темным. При вдвое большей угловой скорости вернувшийся световой импульс проходит через сле- следующую прорезь и наблюдатель видит источник. Очевидно, что в этом случае для определения скорости света нужно разделить путь от колеса до зеркала и обратно на время поворота колеса на один зубец. Современная модификация метода Физо основана на прерывании света с помощью практически безынерционного оптичес- оптического затвора (конденсатора Керра, см. п. 4.5). Это позволяет значительно повысить точность, несмотря на сокращение длины базиса до нескольких метров. Другой лабораторный метод измерения скорости света, основанный на исполь- использовании отражения света от вращающегося зеркала, был впервые осуществлен Фу- Фуко в 1862 г. и значительно усовершенствован Майкельсоном в 1926 г. В установке Майкельсона за время прохождения отраженным световым импульсом расстояния до неподвижного зеркала и обратно восьмигранное зеркало успевало повернуться на 1/8 оборота так, чтобы отражающая поверхность заменялась соседней. Измерения скорости производились не только для видимого света, но и в дру- других диапазонах электромагнитных волн. В частности, для радиосигналов измерения времени прохождения известного расстояния дали значение скорости, совпадающее в пределах ошибок измерения со скоростью видимого света, что вновь подтверждает справедливость электромагнитной теории света. Осе упомянутые выше способы измерения скорости света основаны на прерывании света, т.е. на использовании сигналов, передаваемых с помощью модулированных
2.11. Скорость света. Фазовая и групповая скорости 123 световых волн. Поэтому фактически здесь измеряется не фазовая скорость электро- электромагнитных волн, а скорость светового импульса. В вакууме эти скорости одинако- одинаковы, но в среде, обладающей дисперсией, монохроматические составляющие разных частот, входящие в состав модулированной волны, распространяются с разными ско- скоростями, что приводит к совершенно особому характеру распространения импульса. В простейшем случае слабой дисперсии импульс распространяется без искажений с так называемой групповой скоростью (см. ниже). Для непосредственного измерения фазовой скорости электромагнитных волн тре- требуются принципиально иные методы. В области радиочастот можно использовать стоячие волны в объемном резонаторе. Теория позволяет связать размеры резонато- резонатора и его резонансную частоту с фазовой скоростью электромагнитных волн. В случае плоского резонатора длиной / эта связь имеет вид Vк = кс/B1), где к — целое чис- число (см. п. 1.3). Измеряя в вакууме частоту резонанса непосредственным сравнением с эталоном частоты, а длину резонатора — сравнением с эталоном длины интер- интерференционными методами, Эссен в 1950 г. получил для скорости электромагнитных волн длиной около 10 см значение с = B99792,5 ± 1) км/с. В 1972 г., когда были разработаны прецизионные методы измерения частоты в оп- оптическом диапазоне, значение скорости света было определено в Национальном бю- бюро стандартов США Ивенсоном с сотрудниками на основе независимых измерений длины волны и частоты света. В качестве источника использовался стабилизиро- стабилизированный гелий-неоновый лазер, генерирующий близкое к монохроматическому ин- инфракрасное излучение (Я = 3,39 мкм). Частота V этого излучения измерялась срав- сравнением с цезиевым эталоном частоты (времени) с использованием методов нели- нелинейной оптики. Длина волны Я этого же излучения измерялась с большой точно- точностью интерферометрическим сравнением с принятым в те годы эталоном длины, т. е. с длиной волны оранжевой линии криптона-86. Для этого пришлось использовать ряд вспомогательных монохроматических источников с промежуточными значения- значениями частоты и длины волны. Несмотря на длинную цепочку измерений, таким мето- методом удалось получить значение скорости света в вакууме с громадной точностью: с =Яу = B99 792 456,2 ± 1)м/с. Фактически этот метод можно рассматривать как сравнение частоты излучения оранжевой линии криптона, длина волны которого ис- использовалась в недалеком прошлом в эталоне длины (при определении единицы длины — метра), с частотой эталона времени на основе цезия-133. Опыт показы- показывает, что точность такого сравнения лимитируется точностью первичного эталона длины. В связи с этим в конце 1980-х годов в метрологии перешли от независимо выбранных эталонов длины и времени к единому эталону. Длина волны излучения эталонного источника лежит в основе единицы длины, а частота (период) — в осно- основе определения единицы времени. При этом числовое значение с получено не как результат измерений (неизбежно содержащий некоторую погрешность), а введено по определению (т.е. точно) на основе международного соглашения. Разумеется, это значение выбрано так, чтобы обеспечивалась преемственность с прежними эта- эталонами длины и времени. Обратимся теперь к вопросу о скорости света в веществе. Лабораторные ме- методы с использованием короткого базиса позволяют определять скорость света в различных средах. Так, для воды Майкельсон нашел с/у = 1,33, что находится
124 2. Распространение света в изотропных средах в хорошем соответствии со значением показателя преломления воды, получен- полученным из измерений на основе преломления света при пересечении поверхности. Во многих случаях значение п, полученное как отношение синусов угла паде- падения и угла преломления, хорошо согласуется со значением, найденным из изме- измерения скорости света. Однако в некоторых случаях возникают серьезные расхожде- расхождения. Например, для сероуглерода Майкельсон нашел с/ь = 1,76, тогда как обыч- обычное определение показателя преломления дает п = 1,64. Объяснение расхождений было дано Рэлеем, выяснившим сложный характер самого понятия скорости вол- волнового движения. С этим понятием связан широкий круг проблем, касающихся кинематики волнового движения и поэтому общих для волн разной физической природы. Понятие скорости возникло в механике для описания движения частицы (матери- (материальной точки). В волновом движении происходит перенос состояния (т.е. значений поля) из одного места в другое. В общем случае понятие скорости здесь неоднознач- неоднозначно. Остановимся на этом вопросе подробнее. В среде без дисперсии (для электромагнитных волн, строго говоря, только вакуум дает пример такой «среды», хотя вода, воздух и многие газы характеризуются очень слабой дисперсией в видимой области) всякое возмущение распространяется без из- изменения своей формы, и введение скорости волнового движения не вызывает затруд- затруднений. Но в среде с дисперсией возмущение по мере распространения деформиру- деформируется, и понятие скорости становится неопределенным. В таком случае требуется сна- сначала сказать, чтб именно мы будем по определению называть скоростью распростра- распространения. Например, для дви- \ \ -д ~ А^ \ - 7Г" жения изменяющего свою \Лч\ ЛУу1/У\ /\ ЛХ '=0 форму облака не °Ущест' чЬ/ \ 9 I / I / у*\ I \ I \ I \ /> вует однозначного понятия скорости: можно говорить и о скорости его передне- го края («фронта»), и о ско- скорости его «центра тяжести» и т.д. Аналогично обстоит дело со скоростью волно- волнового движения в дисперги- ы 2Т руЮщей среде. Здесь прихо- приходится вводить ряд понятий: скорость группы, скорость энергии, скорость фронта, > = ЪТ скорость сигнала и т. д. Понятие фазовой скоро- скорости, использовавшееся во всем предыдущем изложе- Рис. 2.15. Группы волн, возникающие при сложении двух волн нии, при наличии диспер- с длинами Аи А+ДА сии применимо только к монохроматической волне, бесконечно протяженной в пространстве и во времени. Но такая волна непригод- непригодна для передачи сигнала, и сама постановка подобных вопросов требует отказа от
2.11. Скорость света. Фазовая и групповая скорости 125 монохроматической идеализации. В любом опыте (в том числе и в описанных выше опытах по измерению скорости света в веществе) мы всегда имеем более или менее сложный импульс или, как говорят, «волновой пакет», ограниченный в пространстве и во времени. При определенных условиях деформация («расплывание») волново- волнового пакета происходит медленно и можно говорить о его скорости как о скорости какой-либо точки пакета, например точки максимальной амплитуды. Стоке впервые обратил внимание на то, что в среде с дисперсией скорость пакета будет отличаться от фазовой скорости любой из составляющих его монохроматических волн. Для уяснения сущности этого вопроса рассмотрим модулированную волну, возника- возникающую в результате наложения двух монохроматических волн одинаковой амплитуды с близкими значениями длины волны Я и Я + АЯ. В результирующей волне макси- максимумы амплитуды будут в тех местах, где «горб» одной волны совпадает с горбом другой. Там, где горб одной волны совпадает с «впадиной» другой, результирующая волна имеет нулевую амплитуду. Все вместе это выглядит как последовательность отдельных волновых групп (рис. 2.15). При АЯ <С Я каждая группа содержит большое число периодов. Если скорости складываемых волн одинаковы, то результирующая модулирован- модулированная волна распространяется с той же скоростью, не изменяя своей формы. При на- наличии дисперсии монохрома- монохроматические составляющие имеют у , Я несколько различающиеся ско- рости V и у -+- Ау. Поэтому вза- взаимное расположение их горбов и впадин меняется с течением времени (рис. 2.16). И хотя об- общий вид результирующей вол- волны остается прежним, центры (и границы) волновых групп с течением времени смещают- смещаются относительно положения от- отдельных горбов и впадин, т.е. движутся с иной скоростью, нежели складываемые моно- монохроматические волны. Чтобы убедиться в этом, достаточно сравнить наклон прямых на рис. 2.15, проведенных через границы волновых групп, с на- наклоном прямой, проведенной через склоны отдельных горбов. Скорость движения центров (или границ) этих групп называют групповой скоростью. Найдем ее. Будем для определенности считать, что скорость монохроматических волн рас- растет с увеличением длины волны (нормальная дисперсия). Тогда нижняя волна на рис. 2.16, имеющая длину Л + &&, постепенно обгоняет верхнюю волну с дли- длиной Я. Пусть в какой-то момент времени совпадают горбы Р и Р|, т.е. центр группы волн приходится на точку Р. Через некоторое время г горб Р1 обгонит Р, но зато .16. К выводу формулы для групповой скорости волн
126 2. Распространение света в изотропных средах совпадут горбы () и ()\. Это значит, что центр группы волн за это время сместился назад на одну длину волны Я и совпадает с точкой (?. Поэтому скорость и центра группы меньше фазовой скорости верхней волны на Х/т, т.е. и = у — Х/т. Время т, в течение которого горб ()\ догоняет <2> как легко видеть из рис. 2.16, равно АХ/Ау. Поэтому выражение для групповой скорости (формула Рэлея) в пределе АХ —» О принимает вид и = у-Л(^-. B.90) Когда фазовая скорость монохроматических волн у не зависит от длины волны (т.е. отсутствует дисперсия), ду/дХ = 0 и групповая скорость совпадает с фазовой. При нормальной дисперсии ду/йХ > 0 и групповая скорость меньше фазовой: и < у. В области аномальной дисперсии ду/дХ < 0 и формула B.90) дает и > у. Например, в случае гравитационных (т.е. обусловленных силой тяжести) волн на поверхности воды в глубоком водоеме фазовая скорость пропорциональна л/Х: у(Х) = С^у/Х. Применяя формулу Рэлея, получаем и = у/2 — центр группы таких волн движется вдвое медленнее, чем отдельные горбы и впадины. В случае коротких (Я < 1,7 см) капиллярных волн, обусловленных силами поверхностного натяжения, у(Х) = С2/у/Х и и = \у — центр группы бежит в полтора раза быстрее отдельных горбов и впадин. Во всех опытах по измерению скорости света, основанных на прерывании (моду- (модуляции) света, измеряется именно групповая скорость. Это относится и к астроно- астрономическим методам Ремера и Брэдли, хотя здесь свет распространяется в вакууме, где нет дисперсии и групповая скорость совпадает с фазовой. В опытах Майкельсона с водой и сероуглеродом измерялась групповая ско- скорость, но для воды в видимой области значение йу/йХ настолько мало, что практически и = у, поэтому и получается с/и « с/у = и. В сероуглероде Хду/йХ дает заметный вклад и и < у = с/п, что и обнару- обнаружил Майкельсон. Тщательное измерение зависимо- зависимости л (Я) для сероуглерода показывает, что найденная Майкельсоном величина действительно соответству- соответствует групповой скорости, выражаемой формулой Рэлея. Рис. 2.17. Графическое определе- Существует простой графический способ нахожде- нахождение групповой скорости из закона ния групповой скорости по кривой у(Х), предложен- дисперсии ный Эренфестом. Как ясно из рис. 2.17, отрезок, от- отсекаемый на оси ординат касательной к кривой 1>(Я), проведенной в какой-либо точке А этой кривой, равен как раз у — Хйу/йХ, т.е. груп- групповой скорости при данной длине волны Я. Формула Рэлея B.90) справедлива не только для скорости перемещения огибаю- огибающей бесконечной череды волновых групп, которая получается при сложении двух монохроматических волн. При определенных условиях она характеризует также ско- скорость движения центра одиночного волнового пакета, образованного непрерывным набором монохроматических составляющих. Эти условия касаются как самого вол- волнового возмущения, так и свойств среды, в которой оно распространяется: для тех
2.11. Скорость света. Фазовая и групповая скорости 127 длин волн из интервала ДА, которые входят в состав рассматриваемого возмущения, фазовая скорость 1>(А) монохроматических волн в среде должна с хорошим прибли- приближением представлять линейную функцию длины волны. Другими словами, групповая скорость B.90) в пределах интервала длин волн ДА должна быть постоянной. Смысл этого условия легко понять из рис. 2.17: если огибающая суммы двух любых мо- монохроматических составляющих из интервала ДА перемещается с одной и той же скоростью щ то и весь импульс будет перемещаться с этой скоростью, не изменяя своей формы. В таких условиях групповая скорость B.90) может служить адекватной характеристикой скорости волнового процесса. Рассмотрим вопрос о скорости распространения энергии, переносимой электро- электромагнитной волной. Пусть в среде имеется монохроматическая волна. Энергия про- пропорциональна квадрату напряженности поля, а так как одинаковые значения напря- напряженности (например, максимумы) перемещаются с фазовой скоростью, то, казалось бы, с этой же скоростью будет распространяться и энергия. Однако в действитель- действительности такое утверждение бессодержательно, так как оно не может быть проверено экспериментально. При распространении неограниченной в пространстве монохро- монохроматической волны средняя за период энергия произвольного элемента объема будет оставаться постоянной и ни о каком наблюдаемом потоке энергии сквозь какую-либо поверхность говорить не приходится. Изменение энергии в каком-то объеме среды можно констатировать лишь тогда, когда мы имеем ограниченный волновой цуг или группу волн. Поэтому движение энергии следует отождествлять с перемещением изменений амплитуды, и в тех случаях, когда групповая скорость имеет смысл (т.е. волновой цуг или импульс распространяется не расплываясь), она совпадает со скоростью переноса энергии: E) = (ю)и. Формула Рэлея B.90) удобна для вычисления групповой скорости в тех случаях, когда фазовая скорость задана как функция длины волны: V = 1>(А). Однако часто бывает удобно вместо А использовать волновое число (модуль волнового вектора) к = 2я/А и рассматривать V = у(к). Тогда вместо B.90) можно написать и = у+к^-, B.91) Если выразить здесь фазовую скорость через частоту V = со/к и рассматривать ча- частоту как функцию волнового числа со = о)(к)9 то от B.91) придем к другой (эквива- (эквивалентной) формуле для групповой скорости: Еще одна эквивалентная форма соотношения B.90) полезна тогда, когда свойства среды характеризуются показателем преломления, заданным как функция частоты п = п{со):
128 2. Распространение света в изотропных средах Пусть, например, модулированная волна или отдельный волновой импульс (с до- достаточно узким спектром) распространяется в прозрачной разреженной среде, по- показатель преломления которой мало отличается от единицы. Вдали от собственной частоты со0 атомных осцилляторов их затуханием можно пренебречь, и зависимость показателя преломления от частоты выражается формулой B.39): 2 п(й>) « 1 +^ 2FJ-0J)' При со > со0 фазовая скорость V = с/п оказывается больше скорости света в ваку- вакууме, что, как уже отмечалось, не противоречит теории относительности, так как фазовая скорость характеризует бесконечно протяженную монохроматическую вол- волну, которая не может служить для передачи сигнала. Если волну с частотой со > &>0 промодулировать, то распространение модуляции (т. е. изменений амплитуды, кото- которые можно рассматривать как сигналы) будет происходить с групповой скоростью. Вычисление и по формуле B.93) дает Эта величина меньше скорости света в вакууме как при со < &>0, так и при со > &>0, где фазовая скорость больше с. Другой пример — распространение волн в среде со свободными электронами (плазма, металлы). Здесь в соответствии с B.53) п(со) = л/1 — со^/со2. Поэтому в об- области прозрачности, т. е. при со > &>р, фазовая скорость всегда больше с, а для груп- групповой скорости в результате вычисления по формуле B.93) получаем причем иь = с2. И здесь распространение изменений амплитуды происходит со ско- скоростью, меньшей с. Однако в некоторых случаях и групповая скорость, вычисляемая по формуле Рэлея B.90) или любой из эквивалентных ей формул B.91)—B.93), оказывается больше с. Так будет, например, в области аномальной дисперсии, в чем можно убе- убедиться, воспользовавшись формулой B.51) для п(со) вблизи собственной частоты атомных осцилляторов. Здесь тоже нет противоречия с теорией относительности, ибо групповая скорость отнюдь не во всех случаях выражает скорость сигнала. Как уже отмечалось, волновой импульс в процессе распространения не изменяет своей формы и перемещается с групповой скоростью, если фазовые скорости его моно- монохроматических составляющих зависят от частоты по линейному закону, т.е. груп- групповая скорость постоянна в пределах занимаемой импульсом полосы частот. Когда изменение показателя преломления на этом интервале частот происходит нелинейно, импульс по мере распространения неизбежно деформируется. Кроме таких фазовых искажений, связанных с непостоянством групповой скорости в пределах занимаемой импульсом полосы частот, причиной деформации импульса может быть зависящее от частоты поглощение, особенно существенное в области аномальной дисперсии
2.11. Скорость света. Фазовая и групповая скорости 129 (или усиление в случае активной среды). При этом по мере распространения им- импульса происходит искажение его энергетического спектра; изменяется и частота, соответствующая максимуму спектра (несущая частота), так что на больших рас- расстояниях импульс может стать совершенно непохожим на то, что было послано. В поглощающей среде в определенных условиях потери «выедают» преимуществен- преимущественно заднюю часть импульса, что увеличивает скорость перемещения его максимума. В усиливающей среде передняя часть импульса проходит при наибольшей инверсии населенностей (см. п. 9.3) и усиливается в большей мере, чем задняя, проходящая по «обедненной» среде. В таких условиях на конечном интервале расстояний максимум огибающей может перемещаться со скоростью, превосходящей скорость света в ва- вакууме, или даже с отрицательной скоростью, но это не противоречит ни релятивист- релятивистской причинности, ни здравому смыслу, так как эта скорость связана с «внутренней» перестройкой импульса и не может быть использована для передачи сигнала. Что ка- касается групповой скорости, определяемой формулой Рэлея, то она в таких условиях утрачивает определенное физическое содержание. В случае импульса с резко ограниченным передним краем, впереди которого ни- никакого возмущения нет, можно говорить о скорости распространения его фронта (т.е. переднего края). Оказывается, что скорость такого фронта в любой среде совпа- совпадает со скоростью света в вакууме. В этом легко убедиться на основе электронной теории. К моменту прихода фронта электрон атомного осциллятора находится в по- покое и благодаря своей инерции не сразу начнет излучать вторичные волны (из-за которых изменяются структура и скорость результирующей волны). Поэтому фронт любого сигнала проходит через среду со скоростью с, как через пустое пространство, и действие среды сказывается лишь позади фронта. Отсюда понятно, что скорость сигнала, как бы она ни была определена, всегда меньше или равна скорости света в вакууме в согласии с требованием теории относительности. Скорость сигнала (или сигнальная скорость) в случае среды с дисперсией требу- требует специального определения, на что впервые было указано Зоммерфельдом. Физиче- Физически содержательное определение сигнальной скорости должно учитывать не только свойства среды, но и чувствительность приемников излучения в рассматриваемой области спектра. Дело в том, что в процессе распространения импульс может стать очень пологим, так что его переднему краю будет соответствовать слишком малая энергия, а все приемники излучения имеют конечную чувствительность. Поэтому понятие скорости фронта соответствует идеализированному случаю предельно чув- чувствительного регистрирующего прибора. Контрольные вопросы • Опишите основные астрономические и лабораторные методы измерения скорости света. • Какие методы дают значение фазовой, а какие — групповой скорости? • С каким свойством скорости света связана возможность введения единого эталона длины и времени? • Какой физический смысл имеет групповая скорость? • Как групповая скорость выражается через фазовую скорость монохроматических волн? • С какой скоростью происходит перенос энергии в электромагнитной волне? 5 Зак 4498
130 2. Распространение света в изотропных средах • В каких случаях групповая скорость волн утрачивает физический смысл? • С какой скоростью распространяется передний фронт светового возмущения в среде? • Докажите эквивалентность формул B.90)-B.93). • Покажите, что групповая скорость может быть вычислена по формуле А А <1л\ - — . п йХ/ 2.12. Излучение Вавилова-Черенкова Электрическое поле падающей волны вызывает вынужденные колебания электро- электронов, входящих в состав атомов и молекул среды, и они становятся источниками вторичных волн. В однородной среде эти вторичные волны когерентны, и в ре- результате их сложения между собой и с падающей волной образуется преломленная волна. Вынужденное движение электронов среды может быть вызвано не только пада- падающей волной, но и иными способами, например электрическим полем движущейся в среде заряженной частицы (электрона, протона и т.п.). При этом отдельные эле- элементы объема среды вдоль траектории заряда также становятся когерентными источ- источниками электромагнитных волн. Если заряд движется равномерно со скоростью V, меньшей фазовой скорости света в среде V (V < у)9 то волны, исходящие от разных частей траектории заряда, при сложении полностью гасят друг друга. Так будет для волн, распространяющихся в любом направлении. Условие полного погашения волн перестает вы- выполняться тогда, когда скорость заряда превосхо- бит фазовую скорость света в среде. При п > 1 скорость света V = с/п < с и движение заряда со скоростью V в интервале V < V < с не противоре- противоречит теории относительности. Движущийся с такой скоростью заряд встречает лежащие на его пути электроны среды раньше, чем к ним может прий- прийти излучение, испущенное возбужденными перед Рис.2.18.Фронтударнойакустической этим электронами. Здесь мы вправе ожидать явле- волны в среде при движении снаряда ний, подобных тем, что хорошо известны в акусти- со сверхзвуковой скоростью ке: снаряд, движущийся со скоростью, превышаю- превышающей скорость звука в среде, обгоняет созданную им волну давления и оставляет за собой скачок давления в виде «конуса Маха» (рис. 2.18). Нормаль к фронту акустической волны составляет угол в с направле- направлением движения снаряда, определяемый отношением скорости звука V к скорости снаряда V: со5 0 = ^. B.94) Аналогичное оптическое явление — излучение света при равномерном движе- движении заряда в среде со скоростью V, превышающей скорость света в этой среде V
2.12. Излучение Вавилова-Черенкова 131 (у = с/п), — было открыто в 1934г. СИ. Вавиловым и П.А. Черенковым и теоре- теоретически объяснено в 1937 г. И.Е. Таммом и И.М. Франком. За его открытие и объ- объяснение Черенкову, Тамму и Франку была присуждена Нобелевская премия 1958 г. по физике. Для определения направления волны излучения Вавилова—Черенкова рассмотрим два любых одинаковых элемента объема Л и В на траектории заряда (рис. 2.19). Элемент В испускает точно такую же волну, что и элемент А, но с запаздыванием на время /, в течение которого заряд проходит рас- расстояние АВ. Эти волны придут в удаленную точку наблюдения одновременно, если направление на нее определяется таким углом 0, что со$0 = 2;/У, ибо волне из А потребуется как раз на / больше време- л V п ни для прихода в точку наблюдения. Все когерент- когерентные волны от разных элементов объема среды на Рис. 2.19. К определению направле- траектории заряда, распространяющиеся в этом на- ния распространения излучения , Вавилова-Черенкова правлении, имеют одинаковую фазу и при сложении (интерференции) усиливают друг друга. Для любого другого направления всегда можно разделить все элементы объема вдоль траекто- траектории на такие пары, чтобы испускаемые ими волны были в противофазе и гасили друг друга. Условие, определяющее направление излучения Вавилова-Черенкова, совпадает с условием B.94) для направления акустической волны. Это и не удивительно, так как оно имеет чисто кинематический характер и поэтому справедливо для волн лю- любой природы. Отметим еще раз, что оно выполняется только при У > V — скорость источника должна быть больше скорости волн в среде. Фронт излучаемой волны представляет собой конус, вершина которого перемещается вместе с зарядом со ско- скоростью У (см. рис. 2.18). Приемник излучения, находящийся в какой-либо точке А, зафиксирует отдельную вспышку света в тот момент, когда фронт пройдет через эту точку. Отметим, что для возникновения излучения существенна нестационарность воз- возмущения среды полем пролетающей частицы. Если бы вместо одной частицы текла непрерывная заряженная жидкость, то и при скорости V > с/п излучение Вавилова—Черенкова не возникло бы. В случае пучка частиц статистические нерегу- нерегулярности приводят к взаимной некогерентности излучений, создаваемых отдельными частицами, так что их интенсивности просто складываются. Выше молчаливо предполагалось, что в среде отсутствует дисперсия. Существу- Существующая в реальных средах зависимость показателя преломления и, следовательно, фа- фазовой скорости света от частоты V = с/п((о) приводит к тому, что при заданной скорости У заряда черенковское излучение возможно только на частотах со, для ко- которых п(со) > с/У. Поэтому спектр излучения Вавилова-Черенкова лежит преиму- преимущественно в видимой области, обрываясь на высоких частотах, когда из-за приближе- приближения показателя преломления к единице условие п{(о) > с/У перестает выполняться. В частности, ни при какой скорости заряда в спектре черенковского излучения не может быть рентгеновских лучей, так как для них п < 1. Излучаемый свет поляри- поляризован так, что напряженность электрического поля лежит в плоскости, образуемой лучом и направлением движения заряда.
132 2. Распространение света в изотропных средах Знергия излучаемого света черпается из кинетической энергии движущегося заря- заряда, скорость которого должна при этом уменьшаться. Но само по себе черенковское излучение отнюдь не связано с торможением электрона, ибо оно должно иметь мес- место и при равномерном движении заряда со скоростью V > V = с/п. Конечно, такое равномерное движение вследствие потерь энергии на излучение не может быть дви- движением по инерции, но в принципе эти потери всегда можно компенсировать с помо- помощью постоянной внешней силы. Если энергия частицы велика по сравнению с поте- потерями на излучение, то роль этих потерь становится совершенно несущественной. *) Поэтому приближение, при котором движение частицы, несмотря на излучение, счи- считается равномерным, имеет широкую область применимости. Излучение будет происходить и тогда, когда заряд движется не в самом веществе, а вдоль оси проделанного в нем канала, параллельно краям узкой щели или про- просто параллельно границе. Для возникновения волн в среде в таких условиях кроме прежнего условия V > V требуется еще, чтобы диаметр канала или расстояние от траектории заряда до границы были меньше длины волны излучения. Практическое применение излучение Вавилова-Черенкова получило в физике высоких энергий для регистрации быстрых заряженных частиц. На нем основано действие так называемых черенковских счетчиков, с помощью которых можно разде- разделить релятивистские частицы, обладающие одинаковым импульсом, но разной массой и, следовательно, разной скоростью. .Может ли возникать излучение при равномерном движении заряженной частицы со скоростью, меньшей скорости света в среде? Из предыдущего рассмотрения напрашивается отрицательный вывод: при V < с/п вторичные волны от разных элементов объема вдоль траектории гасят друг друга для любого направления наблюдения и только движение заряда с ускорением может привести к излучению. **) Однако в среде для возникновения излучения важно не из- изменение самой скорости V заряда, а изменение отношения этой скорости к фазовой скорости света У/у. Отсюда ясно, что излучение возникает и при постоянной скорос- скорости V заряда, если вдоль его траектории изменяется показатель преломления. Полного гашения когерентных волн от элементов объема в подобных условиях не происходит. Именно такая ситуация складывается, например, при пересечении равномерно движущейся заряженной частицей границы вакуума со средой или границы раз- раздела двух сред. На возникающее при этом переходное излучение было указано В.Л.Гинзбургом и И.М.Франком в 1944г., а первые экспериментальные резуль- результаты (с использованием протонов с энергией от 1 до 5МэВ) были опубликованы только в 1959 г., хотя, как теперь ясно, такое свечение уже давно наблюдалось на анодах рентгеновских трубок. В случае пересечения зарядом границы металла проис- происхождение переходного излучения становится особенно наглядным. Когда заряженная частица находится вблизи плоской поверхности металла, напряженность электри- электрического поля вне металла совпадает с напряженностью поля диполя, образованного зарядом и его «электрическим изображением». В момент пересечения поверхности *) Потери энергии вследствие излучения обычно гораздо меньше так называемых ионизационных по- потерь, связанных с возбуждением и ионизацией атомов вещества пролетающей частицей. **} Излучение, возникающее при столкновении заряженных частиц, называют тормозным, а при уско- ускорении под действием магнитного поля — магнитотормозным или (для релятивистских частиц) синхро- синхротронIЫМ.
2.12. Излучение Вавилова—Черенкова 133 металла заряд и его изображение одновременно исчезают (поле заряда, находящегося в металле, практически полностью экранируется электронами проводимости). Воз- Возникающее при этом переходное излучение будет (вне металла) точно таким же, как при мгновенной остановке в одной точке двух движущихся навстречу зарядов про- противоположного знака, т. е. эквивалентно соответствующему тормозному излучению. Аналогичное явление можно наблюдать и при равномерном движении заряда (с досветовой скоростью) параллельно границе. Излучение возникает, если гра- граница обладает некоторым рельефом, т.е. не представляет собой идеальную плос- _ ^^. кость. В опытах Смита и Парселла A953) электроны с энергией е{У = 300кэВ дви- двигались в вакууме над поверхностью ме- металлической дифракционной решетки с пе- периодом (I — 1,67 мкм перпендикулярно ее +е штрихам (рис. 2.20). Отрицательный заряд рис. 2.20. Излучение, возникающее при дви- электрона вместе с индуцированным поло- жении заряда вдоль рельефной поверхности жительным зарядом на поверхности метал- проводящей среды ла (который можно заменить «изображе- «изображением» электрона) образуют диполь. Расстояние между обоими зарядами и, следова- следовательно, дипольный момент при равномерном движении электрона со скоростью V изменяются периодически с периодом Т = с1/У, где А — расстояние между штри- штрихами решетки. В результате возникает дипольное излучение. Так как излучающий диполь движется со скоростью V, в лабораторной системе отсчета частота о/ и дли- длина волны X' излучаемого им света зависят (вследствие эффекта Доплера, см. п. 8.3) от направления наблюдения: 1 -Усо80/с' Для в « 15° расчет по этой формуле дает X' = 0,5 мкм, что соответствует види- видимой области. Траектория электронов имеет вид светящейся полосы, цвет которой изменяется в зависимости от угла наблюдения в. Контрольные вопросы • При каких условиях равномерное движение заряда сопровождается излучением? • Какое влияние оказывает дисперсия среды на черенковское излучение? Почему в его спек- спектре не может быть рентгеновских лучей? • Может ли возникать излучение при равномерном движении заряда в среде со скоростью, меньшей скорости света?
Отражение и преломление света на границе Когда свет достигает границы раздела двух сред с разными оп- оптическими свойствами (или границы среды с вакуумом), он ча- частично проходит во вторую среду, изменяя направление в слу- случае наклонного падения, и частично возвращается в первую среду. Направление отраженного и преломленного света опи- описывается хорошо известными законами геометрической оптики. Однако эти законы ничего не говорят о поляризации и интен- интенсивности отраженного и преломленного света. В данной главе ответ на эти вопросы (как и вывод известных законов отраже- отражения и преломления) дается на основе электромагнитной теории света. Появление преломленной и отраженной световых волн на границе раздела сред обусловлено теми же физическими при- причинами, что и изменение фазовой скорости волны при ее рас- распространении в неограниченной среде по сравнению со ско- скоростью света в вакууме: электрическое поле падающей волны раскачивает входящие в состав вещества среды заряженные час- частицы, которые становятся источниками вторичных волн. Зада- Задача нахождения отраженной и преломленной волн, возникающих в результате сложения этих когерентных вторичных волн, мо- может быть решена в рамках макроскопической электродинамики, т.е. с помощью уравнений Максвелла и феноменологических материальных уравнений, в которых среды рассматриваются как сплошные, а их оптические свойства задаются показателя- показателями преломления. При этом законы отражения и преломления, а также выражаемые формулами Френеля соотношения между амплитудами и фазами падающей, отраженной и преломленной волн получаются как следствие граничных условий для электро- электромагнитного поля, вытекающих из уравнений Максвелла.
3.1. Законы отражения и преломления света 135 3.1. Законы отражения и преломления света Закономерности отражения и преломления света относятся к наиболее ранним экс- экспериментальным открытиям в оптике. Закон отражения был известен еще Архимеду; открытие закона преломления связывают с именами Снеллиуса и Декарта. Для получения этих законов на основе электромагнитной теории рассмотрим иде- идеализированный случай бесконечной плоской границы раздела двух неподвижных од- однородных изотропных сред, каждая из которых занимает целое полупространство. Пусть в одной из этих сред задана приходящая из бесконечности плоская монохро- монохроматическая волна. Эта падающая на границу волна, поверхности постоянной фазы которой представляют собой неограниченные плоскости, порождает волновой про- процесс в обеих средах, который мы собираемся исследовать. Практически достаточно, чтобы перечисленные условия выполнялись хотя бы при- приближенно. Например, падающая волна может быть сферической (от источника, на- находящегося достаточно далеко от границы), тогда ее небольшие участки приближен- приближенно рассматриваются как плоские и к ним применимы результаты, полученные для неограниченных плоских волн. Аналогично обстоит дело в случае неплоской грани- границы раздела, отдельные участки которой можно приближенно рассматривать как плос- плоские. Для этого размеры таких участков должны быть велики по сравнению с длиной волны. Монохроматичность падающей волны предполагает установившийся характер всех процессов. Полное электромагнитное поле, включающее падающую, отражен- отраженную и преломленную волны, должно удовлетворять определенным граничным усло- условиям, которые могут быть получены предельным переходом из уравнений Макс- Максвелла. Эти условия заключаются в непрерывности тангенциальных составляющих векторов Е и В на границе. Для получения граничных условий можно взять контур в виде небольшой прямоугольной петли АВСО (рис. 3.1), стороны АВ и ОС которой параллельны границе раздела сред и про- проходят по разные стороны от нее. Применим к контуру уравнение Максвелла A.12) (или B.9)) в интегральной форме и устремим длины сторон АО и ВС к нулю, чтобы в пределе стороны АВ и ОС совпали на границе. Тогда циркуляция вектора Е в левой части A.12) сводится в преде- пределе к ЕХтА/ — Е2тЫ, где ЕХт и Е2т — проекции векторов Е! и Е2 в первой и второй средах на направление вектора т, 2 О т С параллельного границе (и стороне АВ), а поток вектора В 1 * | в правой части обращается в нуль, так как площадь охва- 1 А А1 В тываемой контуром поверхности стремится к нулю. Отсюда и следует, что ЕХт = Е2т. Аналогично на основе интеграль- Рис*31# КонтУР интегрирования , 1Т г\ ,^ „ч для вывода граничных условии ной формы уравнения Максвелла B.7) можно показать, что В1т = В2т (при отсутствии поверхностных токов на грани- границе). Так как вектор г может иметь любое направление в плоскости границы (т.е. две неза- независимые компоненты), то здесь мы имеем четыре независимых граничных условия, которые справедливы для любых непрерывных сред. Еще два граничных условия можно получить из уравнений Максвелла B.6) и B.8). Эти условия выражают непрерывность нормальных составляющих векторов В и В на границе: ВХп = #2и» &\п — Е>2п- Н° для монохроматических полей уравнения B.6) и B.8) являются следствием уравнений B.7) и B.9). Поэтому граничные условия для нормальных составляю- составляющих не дают ничего нового: они выполняются автоматически при соблюдении условий для тангенциальных составляющих.
136 3. Отражение и преломление света Отметим, что наличие во второй среде только одной (преломленной) волны, ухо- уходящей от границы раздела, не следует непосредственно из уравнений Максвелла, а основано на дополнительном предположении, известном как условие излучения. Можно обеспечить выполнение граничных условий, предполагая во второй среде на- наличие двух волн, одна из которых распространяется от границы, другая — к границе. Так пришлось бы поступать при исследовании волнового процесса не в полубеско- полубесконечной среде, а в слое, ограниченном с двух сторон (в плоскопараллельной пла- пластинке). Разные предположения приводят к разным результатам. Условие излучения, связанное с принципом причинности, дает критерий отбора имеющих физический смысл решений: возбуждаемое тело может порождать лишь уходящие от него вол- волны (отраженные, рассеянные и т.п.). В задаче о преломлении на границе полубес- полубесконечной среды физический смысл имеет решение, основанное на предположении о наличии только трех волн: падающей, отраженной и преломленной. На рис. 3.2 показаны направления рассматриваемых волн. Все величины, относящи- относящиеся к падающей и отраженной волнам, распространяющимся в первой среде с по- показателем преломления п^ = у/€^9 будем отмечать соответственно индексами 0 и 1, а величины, относящиеся к преломленной волне во второй среде с показателем пре- преломления п2 = у/ё^9 — индексом 2. Первую среду считаем прозрачной, для второй среды такого предположения пока делать не будем. Для каждой из трех плоских волн используем комплексную запись. Таким образом, в каждой точке границы в любой момент времени Е е/(ког-ау) + Е е/(к,г-оу) =Е е/(к2г-ау) ^ C.1) ВОт е/(ког-"о') + я1т е^!1-^') = В2т е^-ау). Чтобы граничные условия выполнялись в любой момент времени, коэффициенты при г в показателях экспонент для всех трех волн должны быть одинаковы. Поэто- Поэтому частоты отраженной и преломленной волн равны частоте падающей волны, что, впрочем, очевидно, если эти волны рассматривать как результат сложения вторичных волн, излучае- излучаемых зарядами вещества при их вынужденном дви- движении. *) Направим ось г перпендикулярно границе разде- раздела. Углы ф, срх и ср2, образуемые волнами с осью г, называют соответственно углами падения, отраже- отражения и преломления. Граничные условия должны вы- выполняться сразу во всех точках границы раздела. Это возможно лишь тогда, когда зависимость Ет - - тт „ и В т от координат точки в плоскости ху у всех трех Рис. 3.2. Направления падающей, от- т г ^ ^ г раженной и преломленной волн на волн одинакова, т.е. равны тангенциальные компо- плоской границе раздела двух сред ненты кХ9 ку их волновых векторов. Отсюда следует *) При больших амплитудах напряженности поля падающей волны, сравнимых с внутриатомными по- полями, вынужденные колебания атомных осцилляторов могут происходить не только на частоте падающей волны, но и на кратных частотах, что приводит к появлению гармоник в преломленном и отраженном излучении (см. гл. 10).
3.2. Формулы Френеля 137 прежде всего, что направления распространения всех трех волн лежат в одной плоскости, проходящей через ось г {плоскость падения). Выберем в качестве нее плоскость хг (см. рис. 3.2). Таким образом, к\х=к1х =к0х = -Л181Пф. C.2) с с Остается найти нормальные к границе раздела компоненты волновых векторов от- отраженной и преломленной волн. Для этого воспользуемся соотношением B.23), со- согласно которому 1^2 _ ^2 I ^2 _ ^ ^2 __ ^2 | ^2 __ ^ /о 2) Отсюда, учитывая C.2), находим г -компоненты отраженной и преломленной волн: К| = —#0 = И]СО5</), к2 = ~ Л/ Су — Сл 51П ф. C.4) С С V Величина к2^ в поглощающей среде (при комплексном значении е2) комплексна. Она будет комплексной (чисто мнимой) и в прозрачной среде, если выполнено условие 51П2</) > с2/ех (условие полного отражения). Эти случаи будут рассмотрены ниже. Если вторая среда прозрачна и втер < у/е^/е^ = п2/п{, то из C.2) следу- следуют известные законы отражения и преломления света, определяющие направ- направления отраженной и преломленной волн. Учитывая, что кОх = (со/с)п] кХх = {(о/с)пх зикрр к1х = (а)/с)п2$т(р2, находим Законы отражения и преломления, выражаемые формулами C.5), получены без каких бы то ни было предположений относительно комплексных амплитуд в C.1) и поэтому справедливы при любом состоянии поляризации падающей волны. Контрольные вопросы • Каким условиям должны удовлетворять векторы электрического и магнитного полей на границе раздела двух сред? • К какому условию для векторов Е и В на границе приводит каждое из уравнений Максвел- Максвелла B.6)-B.9)? • Сколько независимых условий для векторов электромагнитного поля должно выполняться на границе двух сред? • Поясните, каким образом из граничных условий C.1) можно получить геометрические за- законы отражения и преломления света. 3.2. Формулы Френеля При выводе законов отражения и преломления информация, содержащаяся в гра- граничных условиях C.1), не была использована полностью: для соблюдения C.1) ком- комплексные амплитуды отраженной и преломленной волн должны иметь вполне опре- определенные значения при заданной амплитуде падающей волны. Поэтому граничные
138 3. Отражение и преломление света условия C.1) позволяют определить не только направления отраженной и прелом- преломленной волн, но и их амплитуды и состояния поляризации. Ограничимся пока случаем прозрачных сред и, кроме того, будем считать, что выполняется условие $тд> < п2/пх, при котором во второй среде существует пре- преломленная волна (т.е. значение к2г в C.4) ве- вещественно). Противоположный случай полно- полного отражения рассмотрен в п. 3.3. Разложим каждую из трех волн в C.1) на две составляющие: поляризованную в плоскос- __ ти падения (снабдив ее индексом ||) и поля- ^х ризованную в направлении, перпендикулярном к плоскости падения (индекс _1_). Для векторов Е ^^ и В, лежащих в плоскости падения, условимся Рис. 3.3. Условный выбор положительных выбирать положительные направления в каж- направленийвекгоровЕиВдпяпадающей, й из вшш как ПОКазано на рис. 3.3: еп, е, отраженной и преломленной волн ' г О' 1 и е2 — единичные векторы этих положитель- положительных направлений. В перпендикулярной плос- плоскости положительное направление для всех трех волн задается единичным векто- вектором ,), направленным вдоль оси у. Таким образом, Е^ = Е^, еЦ = Е^е0 и т.д. Вектор В в каждой из трех волн выражается через соответствующий вектор Е с помощью соотношения B.21), что дает следующую связь между амплитуда- амплитудами ЕП, Е-1 и ВИ, В-1: <Р C.6) ВЦ м о - ~п Используя соотношения C.6), четыре граничных условия C.1) можно переписать так, чтобы в них входили амплитуды напряженностей только электрических полей каждой из волн. Учитывая, что еОх = - со$</), е1д. = со$</>, е^ = — С05</>2, получаем — Е\| ) = C.7) » - Е\) = Заметим, что эти уравнения распадаются на две группы, одна из которых содержит только компоненты ЕИ, другая — компоненты Е-1, т.е. Е^ и Е^ выражаются только через Ео~ и не зависят от еЦ, и наоборот. Это значит, что волны указанных двух типов можно рассматривать независимо друг от друга. Уравнения C.7) можно разрешить относительно компонент отраженной и прелом- преломленной волн, выразив их через компоненты падающей волны: СО8</) П<> СО5<» «! СО5</J , || р\\ _ 2л! СО5</> СО5</) , СО5</) Л2 СО8 </) 4" А1! СО5 </>2 C.8) C.9)
3.2. Формулы Френеля 139 Эти соотношения, называемые формулами Френеля, полностью определяют ха- характеристики отраженной и преломленной волн. Их обычно пишут в несколько иной форме, которую можно получить из C.8) и C.9), исключив п^/п2 с помощью закона преломления C.4): , зт(» - д>2) ¦ ¦ _2со5<у>5т<у>2 ¦ Ь\ = :— г Ьс\ , Ьъ = —— г- Ьг\ , C.10) 1 ( ) ° 1 ( ) ° Е\ ~~ ±~/~ . ~ \ ^0» ^2 ~ ~1~(~ . _ \ (~ ~ \ ^0* К^-^Ч В случае нормального падения <р = 0 и, следовательно, </>2 = 0. Тогда соотноше- соотношения C.8) принимают вид Е = !!1^!2 Е Е = ^1_ Е CЛ2) При этом различие между параллельной и перпендикулярной компонентами исче- исчезает, так как теряет смысл понятие плоскости падения. Заметим, что при переходе к случаю нормального падения в формулах C.9) для Е^ получается выражение, от- отличающееся знаком от C.12). Это отличие чисто формальное и возникает из-за того, что в соответствии с принятым выше определением положительное направление для Е| (см. рис. 3.3) при нормальном падении совпадает с отрицательным направле- направлением ЕЦ, тогда как положительные направления Е^ и Е^ всегда одинаковы. При п2 > #1 знак амплитуды Е1 в C.12) противоположен знаку Ео. Это значит, что векторы напряженностей электрического поля падающей и отраженной волн на границе раздела совершают колебания в противофазе. Об этом обычно говорят как о потере полуволны при отражении от оптически более плотной среды (отметим, что векторы индукции магнитного поля падающей и отраженной волн при этом ко- колеблются синфазно). Амплитуда Е2 преломленной волны в C.12) всегда (при любом соотношении между пх и п2) совпадает по знаку с Ео, т.е. во второй среде коле- колебания напряженности электрического поля на границе происходят синфазно с па- падающей волной. Очевидно, что при нормальном падении линейно поляризованного света преломленная и отраженная волны также будут поляризованы линейно в той же плоскости, что и падающая волна. При нормальном падении циркулярно поля- поляризованного света волна во второй среде будет иметь такую же круговую поляри- поляризацию, а отраженная волна — круговую поляризацию противоположного знака, что обусловлено изменением направления ее распространения на противоположное при прежнем направлении вращения вектора Е в пространстве. 13 общем случае наклонного падения света на границу прозрачной среды коэффи- коэффициенты пропорциональности между амплитудами преломленной и отраженной волн и амплитудой падающей волны в формулах C.8)—C.11) вещественны. Отсюда сле- следует, что отражение и преломление не сопровождаются изменением фаз, за исключе- исключением, быть может, изменения фазы отраженной волны на л (если соответствующий коэффициент отрицателен). Поэтому в случае линейной поляризации падающего све- света отраженная и преломленная волны будут тоже поляризованы линейно. С помощью формул Френеля C.10)-C.11) можно показать, что в отраженной волне направление
140 3. Отражение и преломление света град поляризации отклоняется от плоскости падения на больший угол, а в преломлен- преломленной — на меньший угол, чем в падающей волне (см. задачу 1). Рассчитанные по формулам Френеля зависимости отношения амплитуд напряженности электрическо- электрического поля отраженного и падающего света от угла падения для границы воздух—стекло приведены на рис. 3.4. В случае линейной поляризации в направ- направлении, перпендикулярном плоскости падения, знак отношения Е^/Ец- всегда отрицателен, т.е. при лю- любых углах падения колебания напряженностей элек- электрического поля в отраженной и падающей волнах на границе раздела происходят в противофазе. Для поляризации в плоскости падения на рис. 3.4 приве- приведен график отношения Е^/Ец, взятого для большей наглядности с противоположным знаком. Перемена знака сделана для того, чтобы при переходе к пре- предельному случаю нормального падения выбор поло- Рис. 3.4. Отношение амплитуд жительных направлений амплитуд отраженной и па- отраженной и падающей волн на дающей волн стал одинаковым (ср. с рис. 3.3). границе воздух-стекло (и = 1,5) т этош ррафика видно? что колебания напряжен- напряженностей электрического поля отраженной и падающей волн происходят в противофазе, как и в случае Е^/Е^, пока угол падения меньше некоторого значения </>Б , называемого углом Брюстера. При переходе через это значение фаза отраженной волны, поляризованной в плоскости падения, скачком из- изменяется на я. Угол Брюстера определяется из условия <рБ + Ф2 — яг/2: при падении света под таким углом направления отраженной и преломленной волн взаимно пер- перпендикулярны (рис. 3.5). Из формулы C.11), со- содержащей в знаменателе Щ{ф + </>2)> видно, что при ф = фБ получается Е^ = 0: отраженной вол- волны не будет, если падающий под углом </>Б свет поляризован в плоскости падения. Отсюда следует, что отражение естественного света, который мож- можно представить как некогерентную смесь двух ли- линейно поляризованных волн с ортогональными на- направлениями поляризации, обладает замечатель- замечательным свойством: при падении естественного света под углом ф = фБр отразится только составляю- Рис. 3.5. К определению угла полной щая, поляризованная перпендикулярно плоскости поляризации (угла Брюстера) падения, и отраженный свет будет полностью ли- линейно поляризованным. В этом состоит закон Брюстера, открытый эксперименталь- экспериментально в 1815 г. Угол <рБ называется еще углом полной поляризации. Так как в этом случае $тф2 = соз^ (см. рис. 3.5), то из закона преломления получаем ^ C-13)
3.2. Формулы Френеля 141 При отражении видимого света на границе воздух—стекло п2/п1 = 1,5, что соответ- соответствует углу Брюстера д>Б « 56°. Использование отражения естественного света под углом Брюстера дает один из простейших способов получения поляризованного света. Его недостатком является малая интенсивность отраженного света. Описанные выше закономерности отражения света под углом Брюстера можно про- продемонстрировать простым опытом, схема которого представлена на рис. 3.6. Отраже- Отражение света происходит от черного стекла, в котором преломленная волна полностью поглощается. Это необходимо для того, чтобы не было мешающего света, отражен- отраженного второй поверхностью стекла. Конечно, применение черного стекла не вполне соответствует отражению света от прозрачной среды. Но поглощение света в чер- черном стекле в действительности слабое (оно происходит на расстояниях, больших по сравнению с длиной волны, т. е. мнимая часть показателя преломления много меньше вещественной), и связанные с поглощением искажения не скажутся на результатах опыта с отраженным светом. Падающий на первое зеркало под углом Брюстера естественный свет после отра- отражения оказывается полностью поляризованным. Если второе зеркало расположено параллельно первому (см. рис. 3.6, #), то падающий на второе зеркало поляризован- поляризованный свет отразится от его поверхности, так как направление поляризации перпенди- перпендикулярно плоскости падения (плоскости чертежа). Будем а\ поворачивать второе зерка- зеркало вокруг оси пучка по- поляризованного света, полу- полученного при отражении от первого зеркала. При этом угол падения остается неиз- неизменным и равным углу Брю- Рис' 3'6' Схема опьгга' Демонстрирующего поляризацию света, у 1 1 г отраженного под углом Брюстера стера. Интенсивность отра- отраженного вторым зеркалом света начнет постепенно убывать вплоть до полного исчезновения, когда плоскость падения совпадет с плоскостью поляризации (см. рис. 3.6,5). При таком расположе- расположении второе зеркало не может отражать свет той поляризации, которая возникает при отражении от первого зеркала. В газовых лазерах торцовые окна разрядной трубки представляют собой плос- плоскопараллельные стеклянные пластинки, расположенные под углом Брюстера к оси трубки (см. рис. 9.8). Благодаря этому излучение, распространяющееся вдоль оси трубки в образованном зеркалами открытом резонаторе и поляризованное в плос- плоскости падения на пластинки, проходит сквозь них беспрепятственно, не испыты- испытывая отражения. В результате лазер генерирует свет, поляризованный в этой плос- плоскости. Введем, по определению, коэффициент отражения К границы (по другой терми- терминологии, отражательную способность) как отношение среднего по времени отражен- отраженного от поверхности потока энергии к падающему потоку. Для нормального паде- падения коэффициент отражения не зависит от состояния поляризации и, как видно из
142 3. Отражение и преломление света формулы C.12), следующим образом выражается через показатели преломления п^ и п2 граничащих сред: * = 4 = !^€- C-14) 4 (»+»J Значение /? не изменится, если п^ и п2 поменять местами. Поэтому коэффициент отражения на границе прозрачных сред не зависит от того, в каком направлении падает свет: из первой среды во вторую или наоборот. Для границы воды (п = 1,33) и воздуха Я = 2%, стекла (п = 1,5) и воздуха К = 4%, т.е. ни вода, ни стекло при нормальном падении не могут служить хорошим зеркалом. В обычных зеркалах ис- используется отражение от металлической поверхности, стекло же служит только для ее защиты. Слабое отражение от передней поверхности делает такие зеркала непри- непригодными для оптических целей. В оптических приборах используют зеркала, у ко- которых отражающий металлический слой нанесен на переднюю поверхность, стекло здесь служит лишь удобным материалом для подложки. В сложных оптических системах, содержащих большое число преломляющих по- поверхностей (до нескольких десятков, например в многолинзовых объективах), да- даже незначительные («4%) потери энергии на отражение при каждом прохождении границы стекло-воздух существенно ослабляют полезный световой поток. Для их уменьшения используют специальные покрытия, наносимые на поверхности линз (см. п. 5.7). Коэффициент отражения тем меньше, чем меньше различаются показатели прелом- преломления граничащих сред. При п^ — п2 отражение вообще отсутствует. Можно, напри- например, так подобрать смесь бензола с сероуглеродом, чтобы ее показатель преломле- преломления был таким же, как у стекла. Тогда отражение исчезает и граница между стеклом и жидкостью становится незаметной: жидкость с погруженными в нее кусочками стекла становится оптически однородной. Это явление используют в минералогии для измерения показателя преломления прозрачных образцов неправильной формы. В таких измерениях свет должен быть по возможности монохроматическим, так как жидкость и погруженное в нее тело обычно обладают различной дисперсией: если их показатели преломления для какой-то длины волны совпадают, то для других длин волн совпадения уже не будет. Коэффициент отражения при наклонном падении зависит от состояния поляриза- поляризации падающего света. Для света, поляризованного в плоскости падения и перпенди- перпендикулярно ей, формулы C.10) дают Л ^5т2(<у>-<у>2) к =1ё2(д>-д>2) 1 2( + У 1! Ч2{(Р + Я>)' Если плоскость поляризации падающего света составляет с плоскостью падения угол у, то Е^ = Е0$ту, Ец = Е^со^у и коэффициент отражения Ку можно выра- выразить через /?_!_ и /?,, из C.15):
3.2. Формулы Френеля 143 Коэффициент отражения для неполяризованного света можно получить усредне- усреднением этого выражения по направлениям поляризации у: 0,2 То, что коэффициент отражения неполяризованного света равен полусумме К± и /?.,, можно также объяснить тем, что естественный падающий свет допустимо рассмат- рассматривать как сумму двух некогерентных между собой волн одинаковой интенсивности, поляризованных в плоскости падения и в перпендикулярном ей направлении. Отметим, что выражения C.15) не изменяются при взаимной замене ф и ф2. Это значит, что коэффициент отражения для волны, падающей из первой среды под уг- углом <р, равен коэффициенту отражения для волны, падающей из второй среды под углом ф2. Зависимости К . и /?,. от угла падения име- ю -1- II ' ют существенно различный характер. На рис. 3.7 приведены графики зависимости К± и /?,, от ф о,8 для видимого света на границе воздуха со стек- стеклом (#1 = 1, «2 = 1,52), построенные по фор- 06 мулам C.15). Полезно сравнить их с графика- II II II ми Е^/Ец и Е*1/Ец на рис. 3.4. При малых углах 04 падения (ф < 10°) изменения коэффициентов от- отражения незначительны, К± и /?.. имеют практи- практически такое же значение C.14), что и при нор- нормальном падении. Затем К± монотонно возрас- возрастает по мере увеличения <р, в то время как /?., сначала убывает, обращается в нуль при ф = <рБ и лишь затем начинает монотонно возрастать. Рис. 3.7. Зависимость коэффициентов Если отражение происходит от оптически бо- *1 и к± от Угла падения на границе „ воздух-стекло лее плотной среды, т.е. п2 > п19 то возрастание * К^ и /?ц продолжается вплоть до ф = л/2 (сколь- (скользящее падение), когда они оба достигают единицы. При скользящем падении от- отражение будет практически полным. Благодаря этому можно наблюдать красивые изображения берегов, отражающихся в спокойной поверхности воды горных озер. При отражении от оптически менее плотной среды (п2 < пх) оба коэффициента обращаются в единицу уже при угле падения ф — <рт, где зт<рт = п2/пх. Угол фт называется предельным углом полного отражения. При ф — Фт угол преломления ф2 = я/2, т. е. преломленная волна распространяется параллельно границе разде- раздела. Отражение под углами ф > фт требует особого рассмотрения (см. п. 3.3), так как к2г в C.4) становится чисто мнимым, т.е. поле во второй среде затухает. За- Затухание волны при отсутствии поглощения (диссипации энергии) означает, что на границе происходит полное отражение падающей волны. Различие зависимостей К^ и /?.. от угла падения приводит к тому, что при наклон- наклонном падении естественного света отраженный от поверхности свет в общем слу- случае оказывается частично поляризованным. Впервые это было экспериментально 0 80 <р, град
144 3. Отражение и преломление света обнаружено в 1808 г. Малю. Так как /?,, < К± (за исключением нормального падения Ф = 0 и скользящего ср = я/2), то в отраженном свете преимущественное направле- направление электрического поля перпендикулярно плоскости падения. Преломленный свет будет частично поляризован с преимущественным направлением Е в плоскости паде- падения. Частично поляризованный свет можно рассматривать как смесь естественного с линейно поляризованным. Для его характеристики вводят степень поляризации А: • 100%. Для естественного света /^ = /„ и А = 0. Свет, отраженный под углом Брюстера, имеет /м = 0, и для него А= 100%, т.е. он полностью поляризован перпендику- перпендикулярно плоскости падения. При принятом определении отрицательные значения А соответствуют преимущественной поляризации в плоскости падения. Для прелом- преломленного света из формул Френеля C.10) и C.11) в случае естественного падающего света находим т. е. А < 0. При падении естественного света из воздуха на стекло под углом Брю- стера преломленная волна имеет А = —8% (см. задачу 3). При прохождении света через плоскопараллельную пластинку на второй поверхности опять происходит пре- преломление под углом Брюстера и степень поляризации увеличивается еще на 8%. Если последовательно расположить несколько пластинок (стопа Столетова), то на выходе можно получить высокую степень поляризации света. В настоящее время этот способ почти не применяется, так как существуют бо- более удобные и совершенные способы получения поляризованного света с помощью кристаллических поляризационных призм и поляроидов (см. п. 4.4). При выводе формул Френеля граница раздела между двумя различными средами рассмат- рассматривалась как математическая плоскость. В действительности граница раздела представляет собой не геометрическую поверхность, а тонкий переходный слой, на протяжении которого показатель преломления изменяется от п{ до п2. Для справедливости формул Френеля необ- необходимо, чтобы толщина слоя была мала по сравнению с длиной волны. Для этого граничная поверхность должна быть свободна от посторонних примесей и хорошо отполирована. Если же показатель преломления постепенно изменяется на протяжении нескольких длин волн, преломление имеет совсем другой характер. Когда длина волны мала по сравнению с раз- размерами неоднородностей среды, выполняются условия применимости геометрической оптики (см. п. 7.1). Преломление волны можно при этом рассматривать как распространение лучей, испытывающих в неоднородном переходном слое рефракцию (постепенное отклонение) без всякого отражения. Измерения коэффициентов отражения для чистых поверхностей при различных углах падения и различных поляризациях падающего света дают значения, которые находятся в хорошем согласии с формулами Френеля. Исключение составляет лишь случай отражения света под углом Брюстера, при котором наблюдаются небольшие
3.2. Формулы Френеля 145 отступления от формул Френеля. Тщательные опыты показали, что закон Брюсте- ра соблюдается не строго: коэффициент отражения /?,, ни для какого угла падения в нуль не обращается, а достигается только минимум при ср = <рБ , хотя в миниму- минимуме Ям очень мал. Кроме того, свет, линейно поляризованный под некоторым углом к плоскости падения, при отражении под углом Брюстера (и в малой его окрест- окрестности) становится поляризованным эллиптически, хотя по формулам Френеля он должен оставаться линейно поляризованным. Происхождение этих аномалий, согласно Друде, можно объяснить наличием на поверхности отражающей среды тонкого переходного слоя. Теория показывает, что толщина переходного слоя порядка нескольких межатомных расстояний уже доста- достаточна для того, чтобы вызвать наблюдаемые отклонения от формул Френеля. Физи- Физические причины возникновения переходных слоев на поверхностях еще окончательно не выяснены, но несомненно, что для чистых веществ они обусловлены молекуляр- молекулярной структурой самой отражающей среды вблизи ее поверхности. Контрольные вопросы • Как связаны (в точках границы) фазы отраженной и преломленной волн с фазой падающей волны в случае нормального падения? • Что такое угол Брюстера? Чем он замечателен? • Как можно измерить показатель преломления прозрачного образца неправильной формы? • Почему при наклонном падении естественного света (<р Ф <рБр) отраженный свет частично поляризован? • Какие отступления от формул Френеля наблюдаются на опыте? Задачи 1. У падающего на границу прозрачных сред света направление поляризации составляет угол у с плоскостью падения. Какие углы ух и у2 составляет направление поляризации с плоскостью падения у отраженного и преломленного света? Ответ. СО$(ф — Ф-)) 18У Учитывая, что 0 < ср < л/2, 0 < ср2 < л/2, и полагая 0 < у < л/2, получаем неравенства ух > у и у2 < у, т. е. плоскость поляризации при отражении поворачивается от плоскости падения, а при преломлении — в сторону плоскости падения. 2. Каким должен быть преломляющий угол а призмы из стекла с показателем преломления п = 1,5, чтобы свет линейной поляризации мог пройти сквозь нее без потерь на отражение? Ответ, а = л - 2<рБр = 67°22'. 3. Найдите степень поляризации преломленного света, если естественный свет падает из воз- воздуха на поверхность стекла (и = 1,5) под углом Брюстера. Ответ. _ 4я2-(п2 + 1J _ (и2 + 1J = ,0/ 4„2 + („2 + !J фг24>2 + 1J
146 3. Отражение и преломление света 3.3. Полное отражение Проведенное в п. 3.2 исследование коэффициентов отражения К± и /?,. показало, что для падения света из оптически более плотной среды 1 на границу менее плот- плотной среды 2 (п^ > п2) оба коэффициента обра- обращаются в единицу, когда угол падения ср до- достигает значения <рт, определяемого условием 8т<рт = п2/п\ и называемого предельным углом полного отражения. На границе стекло—воздух (п, = 1,5;п2 = 1)<рт=41°. Графики зависимости г , = Е^/Е^ и г„ = е\/Е^ 0,2 от угла падения для пх > п2, построенные по формулам Френеля C.10)-C.11), приведены на рис. 3.8. Отличие от аналогичных графиков для пх < п2 (см. рис. 3.4) состоит не только в том, что г± и |г,.| достигают теперь единицы уже при угле падения ср = срт < л/2 (а не при скользящем 40 <р,град падении, как для п} < п2), но и в самом характе- „ „ о ~ ре их приближения к единице. С помощью фор- Рис. 3.8. Отношение амплитуд отра- » - / ,/ г женной и падающей волн (в зависи- МУЛ Френеля легко убедиться (см. задачу 1), что мости от угла падения) на границе в точке Ф = Фт кривые имеют вертикальную каса- стекло-воздух тельную. Это обстоятельство играет большую роль в экспериментальных методах определения по- показателей преломления жидкостей. На рис. 3.9 приведена схема рефрактометра Аббе, дей- действие которого основано на явлении полного от- отражения. Между двумя призмами РР, изготов- изготовленными из стекла с высоким показателем пре- преломления, помещают каплю исследуемой жид- жидкости. Пучок света от источника 5 проходит через светофильтр Р и испытывает полное от- отражение при переходе из первой призмы в жид- жидкость. Призму вместе с рычагом К можно по- поворачивать относительно зрительной трубы Т. Благодаря отмеченному обстоятельству граница полного отражения наблюдается с исключитель- исключительной резкостью: нарастание интенсивности пре- преломленного света кажется скачкообразным. По углу наклона зрительной трубы по отношению к призме при визировании границы полного от- отражения определяют показатель преломления жидкости. Рефрактометр Аббе обеспечивает измерение показателя преломления жидкости с точностью до 0,1 %. Когда угол падения превышает предельное значение <рт, не существует веществен- вещественного угла преломления <р2> так как закон преломления C.5) дает для шкр2 значе- значение, превосходящее единицу, а для со$<р2 — чисто мнимое значение. Но формулы Рис. 3.9. Схема рефрактометра Аббе
3.3. Полное отражение 147 Френеля C.8)—C.11) останутся справедливыми и в этом случае, если закон прелом- преломления C.5) рассматривать просто как определение входящих в них величин $т<р2 и со$<р2- Справедливость понимаемых таким образом формул Френеля следует из того, что они обеспечивают выполнение граничных условий C.1) ив случае полного отражения. При ср > фт волновой вектор к2 волны во второй среде имеет вещественную про- проекцию ^ на направление границы и мнимую проекцию к1г на направление нормали к границе: формулы C.2) и C.4) для этого случая дают к ± /^ 12 ^ 5И12 ф — П^. C.16) Это значит, что электромагнитное поле во второй (оптически менее плотной) среде представляет собой неоднородную волну, у которой поверхности постоянной фазы — это плоскости х = сопз!, перпендикулярные границе, а поверхности постоянной ам- амплитуды — плоскости I = сопз!, параллельные границе раздела. *) Знак перед корнем в C.16) определяется из требования, чтобы при удалении от границы раздела ампли- амплитуда этой неоднородной волны уменьшалась. Только такое решение имеет физиче- физический смысл. Подставляя к^ и к2г из C.16) в выражение Е2 ехр /(к2г — ш)9 получаем Еи-^'1"****-*») / с C.17) Убыванию амплитуды в направлении оси г соответствует знак «+» в C.16). Вели- Величина / характеризует глубину проникновения волны во вторую среду: на этом рас- расстоянии от границы амплитуда волны убывает ве« 2,72 раз. По существу волну во второй среде можно считать поверхностной: ее амплитуда заметна только на рас- расстоянии нескольких длин волн от граничной поверхности. Амплитуда Е2 волны на границе (при г = 0) может быть найдена по формулам Френеля. Поверхности постоянной фазы этой неоднородной волны перемещаются вдоль границы раздела со скоростью г; = со/к^ = с/(/г1 §т<р). В рассматриваемом случае вторая среда прозрачна, т.е. поглощение света в ней не происходит. Поэтому за- затухание амплитуды волны в глубь второй среды означает, что энергия падающего света целиком возвращается в первую среду. В этом можно убедиться и непосред- непосредственным вычислением среднего потока энергии: вектор (8) во второй среде имеет только параллельную границе составляющую, которая убывает ве« 2,72 раза на расстоянии 1/2 от границы (см. задачу 4). Экспериментальная проверка проникновения света во вторую среду при полном отражении, т.е. доказательство существования неоднородной волны, представляет собой довольно трудную задачу из-за малой глубины проникновения. Простой и ин- интересный метод был предложен Мандельштамом и Зелени. Призма полного отраже- отражения своей отражающей гранью погружается в раствор флуоресцирующего вещества. +) Волновой вектор к2 преломленной волны можно записать в виде к2 = Ц + /к2, где вещественные векторы к'2 и к2' имеют следующие проекции: к2 = (п1(б>/сMШф, 0, 0), к2 = @, 0, (п>/с)у/п$&т2<р - *%). Векторы к2 и к2' ортогональны. Это соответствует (см. п. 2.2) случаю, когда в прозрачной среде (с веще- вещественной диэлектрической проницаемостью) вектор к может быть комплексным, если к' • к;/ = 0.
148 3. Отражение и преломление света Пучок света падает на эту грань под углом, большим предельного. В тонком слое раствора, прилегающем к призме, виден зеленоватый свет флуоресценции. Другой метод обнаружения возмущения в менее плотной среде основан на поме- помещении второй преломляющей среды на близком расстоянии от границы, где происхо- происходит полное отражение. Сделав прослойку менее плотной среды (например, воздуха между стеклами) тоньше, чем длина волны, можно получить во второй среде обыч- обычную однородную световую волну, так как неоднородная волна в прослойке достигает второй границы еще не слишком ослабленной. Меняя толщину прослойки, можно варьировать интенсивность проходящего света. На таком принципе работает один из модуляторов света. Прохождение света через зазор между средами при падении под углом, большим предельного, называют нарушенным полным отражением. В такой ситуации необходимо учитывать граничные условия и на второй близкой поверхнос- поверхности. Вносимое второй границей возмущение изменяет поведение волны на первой границе, нарушая полное отражение. *) Описанные опыты легко выполнить с электромагнитными волнами сантиметро- сантиметрового диапазона. Две парафиновые призмы Р1 и Р2 полного отражения (для па- парафина п = 1,5 при Я «Зсм) располагаются рядом с небольшим зазором между диагональными гранями (рис. 3.10). Ру- Рупор антенны А клистронного передатчика направляется на боковую грань одной из призм. Антенны приемников воспринима- воспринимают волны, распространяющиеся в направ- направлениях I и 2. Если зазор между призмами Р1 больше длины волны, то в призме Р| про- Р^ Л2 исходит полное отражение и только при- 2 1^ емник /7] регистрирует сигнал. По мере сближения призм можно наблюдать пере- Рис. ЗЛО. Схема опыта, демонстрирующего на- распределение энергии между приемника- рушенное полное отражение в микроволновом ми Когда призмы прижаты друг к другу, диапазоне Л реагирует только приемник П2. При исследовании отраженной электромагнитной волны будем исходить из формул Френеля C.8)—C.9), подставив в них со$<р2 = ^у(п\ ыпф/п2J — 1 из закона пре- преломления C.4): Рг П^ СО$ф — 1уП2 51П2 ф — #2 #2 С08<Р ~ 1П\ Уп\ 8ш2 Ф ~ п2 г± у , Гц = у ==. C.18) П\ СО5 ф + I уП^ 51П2 ф — п\ П^ СО5 ф + Ш^ \1п\ 51П2 ф — П^ Отсюда следует, что \г±\ = |г,.| = 1 при Ф > Фт: какова бы ни была поляриза- поляризация падающего света, интенсивность отраженного света равна интенсивности па- падающего, т.е. отражение действительно полное. Это соответствует заключению, сделанному выше на основе закона сохранения энергии. Эффект полного отраже- *} Аналогичное явление — проникновение частицы через потенциальный барьер — имеет место в кван- квантовой механике и называется туннельным эффектом.
3.3. Полное отражение 149 ния легко наблюдается на опыте и находит многочисленные практические при- применения. На рис. 3.11 показаны стеклянные призмы полного отражения. На гра- границе стекло—воздух <рт « 42°, поэтому при падении света на грань призмы под углом 45° отражение полное. Призма на рис. 3.11, а поворачивает лучи под прямым углом, оборотная призма на рис. 3.11,6 переворачивает изображе- изображение. Призмы полного отражения ши- широко используются во многих оптиче- оптических приборах, в частности в зритель- зрительных трубах и полевых биноклях для получения прямого изображения. а) -—- ¦/. * | б) Рис. 3.11. Стеклянные призмы полного отражения В последние годы для передачи информации с помощью генерируемого лазерами когерент- когерентного оптического излучения все большее распространение получают тонкопленочные и во- волоконные диэлектрические световоды. Их действие также основано на явлении полного отражения. Световой поток, испытывая многократные отражения на границе материала све- световода и оболочки из оптически менее плотного материала, распространяется вдоль волокна, несмотря на его изгибы. Во многих отношениях оптическое волокно аналогично полым волноводам с внутренни- внутренними поверхностями из хорошо проводящего металла, широко применяемым в технике СВЧ. Электромагнитные поля в этих системах имеют подобную структуру. Распространение све- света в цилиндрическом прозрачном волокне или прямоугольной диэлектрической пленке носит волноводный характер. Физические принципы действия оптических волноводов и других тон- тонкопленочных структур составляют теоретическую базу новой бурно развивающейся области прикладной физики, получившей название интегральной оптики. Интерес к оптическим спо- способам передачи и обработки информации быстро растет, что обусловлено преимуществами оптической связи в таких системах, где требуется высокая надежность, помехозащищенность, большая скорость передачи информации при малых габаритах и массе. Основные трудности реализации таких систем связаны с потерями световой энергии в диэлектрическом световоде, вызванными поглощением или рассеянием света в волокне, а также нерегулярностями границы раздела между сердцевиной и оболочкой. Эти потери предъявляют очень жесткие требования к технологии изготовления световодов. В результате интенсивной исследовательской работы в 1970-х годах была разработана технология получения оптических волокон и световодных ка- кабелей с малыми потерями из кварца и специальных стекол, что открыло путь к практической реализации оптических систем дальней связи. Ослабление световой волны вызывается также радиационными потерями на изгибах свето- световода, что ставит предел минимальным размерам схем с использованием оптических волокон. Обращение модулей коэффициентов отражения г_|_ и г.. C.17) в единицу при ср > срт находится в полном соответствии со сделанным выше выводом о равен- равенстве нулю среднего потока энергии во второй среде в направлении, перпендикуляр- перпендикулярном границе. На вопрос о том, как проникла световая энергия (которой обладает неоднородная волна) во вторую среду, проведенный выше анализ ответить не мо- может, так как он относился к стационарному состоянию и, кроме того, был основан на предположении, что граничная поверхность и волновая поверхность падающей волны бесконечны. В реальном эксперименте падающая волна ограничена и в про- пространстве, и во времени. В начале процесса, пока происходит установление коле- колебаний, небольшая энергия проникает во вторую среду и создает там неоднородную
150 3. Отражение и преломление света волну. Когда падающий пучок света имеет поперечное сечение конечной ширины, вблизи его границ (точки А и В на рис. 3.12) полученные выше формулы непримени- неприменимы: здесь энергия падающей волны вполне может проходить из более плотной среды в менее плотную или обратно. Это и есть та энергия, которая вдали от краев пуч- пучка переносится неоднородной волной во второй среде в направлении, параллельном границе раздела. Электромагнитное поле в первой среде в том месте, где происходит наложе- наложение падающей и отраженной волн (область внутри треугольника на рис. 3.12), то- тоже образует неоднородную пло- скую волну, распространяющу- распространяющуюся параллельно границе раз- раздела. Поверхности постоянной фазы этой волны, как и неодно- неоднородной волны во второй среде, представляют собой плоскости, перпендикулярные границе раз- раздела. Они перемещаются вдоль границы с такой же скоростью у = с/(п1 8т<р). Амплитуда этой ^ волны зависит от г, изменяясь Рис. 3.12. Полное отражение пучка света с ограниченным периодически с пространствен- поперечным сечением ным периодом Я1/со8ф (Я1 _ длина падающей волны в пер- первой среде), в отличие от экспоненциального затухания вдоль г амплитуды неодно- неоднородной волны во второй среде. Средний поток энергии здесь тоже направлен вдоль границы и периодически зависит от координаты г (см. задачу 4), т.е. имеет слоистую структуру (см. рис. 3.12). х ассмотрим изменение поляризации света при полном отражении. Как видно из фор- формул C.18), г_|_ и г.. при полном отражении становятся комплексными. Это значит, что на границе фаза отраженной волны отличается от фазы падающей волны. Что- Чтобы найти изменение фазы при отражении, представим комплексное число, стоящее в числителе выражения г_|_ в C.18), в показательной форме: где тангенс аргумента равен отношению мнимой и вещественной частей: . C.19) ~ 2 п{со$<р ч у Знаменатель в выражении C.18) для г_|_ — это число, комплексно сопряженное числителю, т.е. яехр(;#х/2). Поэтому г± = е^- и 8± в C.19) представляет со- собой скачок фазы при отражении волны, поляризованной перпендикулярно плоскости падения.
3.3. Полное отражение 151 Аналогично найдем скачок фазы 5,, для волны, поляризованной в плоскости паде- падения, воспользовавшись выражением для г., в C.38): щ^ = ^1_ 1. C.20) 2 «2 С08 Ф Скачки фаз 8± и 8,, для волн двух поляризаций различны. Если падающая волна поляризована линейно, то в отраженной волне возникает некоторая разность фаз 8 = 8± — 8н между компонентами поля, перпендикулярной и параллельной плоскос- плоскости падения. Поэтому отраженная волна будет, вообще говоря, эллиптически поля- поляризована. Для относительной разности фаз 8 из C.19) и C.20) находим X СОЗ ф л /И? 51П2 ф - И? *е| = ^-г -• C-21) Разность фаз 8 обращается в нуль при скользящем падении (ф = я/2) и при паде- падении под критическим углом (ф = фт). Между этими значениями лежит угол, соот- соответствующий максимуму относительной разности фаз. Максимум C.21) достигается при со82<р = (и2 — п^)/{п\ + п^). Подставляя это значение в C.21), получаем для максимального значения разности фаз 8т выражение Чем больше различие в показателях преломления двух сред, тем большую раз- разность фаз между параллельной и перпендикулярной компонентами волны можно получить при полном отражении. Для получения круговой поляризации отраженно- отраженного света амплитуды этих компонент должны быть равны между собой, а разность фаз должна быть я/2. Первое условие выполняется, если падающая волна линей- линейно поляризована в направлении, составляющем угол 45° с нормалью к плоскос- плоскости падения. Удовлетворить второму условию, т.е. получить 8 = я/2, можно толь- только при п\ - и2 ^ 2п{п2. Если «! « 1 (воздух), то показатель преломления п2 опти- оптически более плотной среды должен превосходить значение у/2 4- 1 =2,41. В видимой области спек- спектра столь большой показатель преломления имеет лишь алмаз. Для стекла (п^ = 1,5) максимальная разность фаз двух ортогональных поляризаций при пол- ном отражении достигается при ф = 51°20' и сое- Л Л ^ „ ^ Л со- ,# т-г Рис. 3.13. Параллелепипед Френеля тавляет 45 56 . При двух значениях угла паде- г ния ф = 48°37/ и ф = 54°377 разность фаз рав- равна я/4. Двукратное отражение под одним из этих углов дает разность фаз я/2. Этим свойством воспользовался Френель для преобразования линейной поляриза- поляризации света в круговую с помощью стеклянного параллелепипеда с углом 54° 37' (рис. 3.13). Линейно поляризованный свет падает по нормали на грань АВ и после
152 3. Отражение и преломление света двукратного полного отражения на гранях АО и ВС выходит в прежнем направ- направлении через грань СВ. Если плоскость поляризации падающего света составляет угол 45° с плоскостью падения, то выходящий свет имеет круговую поляризацию. Это устройство можно использовать и для превращения циркулярной поляризации света в линейную. Контрольные вопросы • При каких условиях отражение на границе прозрачных сред будет полным? • Какими будут поверхности постоянной фазы и поверхности постоянной амплитуды волны в оптически менее плотной среде при полном отражении? • Как согласовать с законом сохранения энергии полное отражение падающей волны и нали- наличие потока энергии, переносимого поверхностной волной во второй среде? • Как изменяется состояние поляризации света при полном отражении? Задачи 1. С помощью формул Френеля покажите, что при отражении от оптически менее плотной среды (п2 < П\) крутизна кривых г±(ф) и Гм(ф) при приближении <р к предельному углу полного отражения <рт стремится к бесконечности. 2. При каком значении показателя преломления параллелепипед Френеля имеет угол 45°? Ответ, п = 1,55. 3. Падающий на параллелепипед Френеля свет имеет круговую поляризацию. Каким будет направление линейной поляризации выходящего света? 4. Плоская волна падает из среды с показателем преломления п^ на границу оптически ме- менее плотной среды (п2 < п\) под углом ф, превышающим предельный угол <рт. Волна поляризована перпендикулярно плоскости падения. Найдите среднюю плотность потока энергии (8) в каждой среде. Решение. В первой среде в области наложения падающей и отраженной волн вектор (8) направлен вдоль границы и периодически зависит от координаты г с периодом Л\/Bсо$ф): = 2/п, 8т<рсо82(^1р^ + *±), D1}> = D])) = 0. Во второй среде вектор (8) также направлен вдоль границы, а его модуль экспоненциально убывает с увеличением г, т. е. фактически весь поток энергии сосредоточен в прилегающем к границе слое толщиной 1/2 : D2)> = Ш2пх мпфехр(-2г//), D2)> = D2)> = 0. Здесь / — интенсивность падающей волны. г 8± = 2 Л, С08ф ' / 2 • 2 2 1 '•»- /и^ 51П E0 — ^2 При I = 0 (т.е. на границе) ($*) = ($*) — плотность потока энергии в каждой из сред имеет одно и то же значение вблизи границы.
3.4. Отражение света от поверхности металлов 153 3.4. Отражение света от поверхности металлов Особенности отражения света от металлической поверхности связаны с наличием в металле свободных электронов, ответственных за его электропроводность. Выну- Вынужденные колебания свободных электронов под действием поля падающей на грани- границу металла электромагнитной волны, происходящие в примыкающем к этой границе тонком слое, создают сильную отраженную волну. Ее интенсивность может прибли- приближаться к интенсивности падающей волны. Вследствие большой плотности свободных электронов (около 1022см~3) даже сравнительно тонкие слои металла отражают большую часть падающего на них света и поэтому практически непрозрачны в опти- оптическом диапазоне. Благодаря высокой отражательной способности металлы играют важную роль в инструментальной оптике: поверхности некоторых металлов служат прекрасными зеркалами. Частичное проникновение света в металл создает токи проводимости. С ними связано выделение джоулевой теплоты, т. е. поглощение света — необратимое пре- превращение электромагнитной энергии в энергию хаотического теплового движения. Чем выше проводимость металла, тем меньшая доля падающего света проникает в металл и поглощается там. В идеальном проводнике, которому формально соот- соответствует бесконечно большая проводимость, потери на джоулеву теплоту вообще отсутствуют, так что падающий свет полностью отражается. Отражение монохроматического света от поверхности металла, как и его распро- распространение в поглощающей среде, можно рассмотреть на основе макроскопических уравнений Максвелла и материальных уравнений, в которых диэлектрическая про- проницаемость с (со) комплексна. Ее мнимая часть ответственна за поглощение света, т.е. описывает джоулевы потери. При использо- использовании комплексной диэлектрической проницаемо- проницаемости уравнения Максвелла и вытекающие из них граничные условия для векторов электромагнитно- электромагнитного поля формально принимают такой же вид, как и в прозрачной среде. Поэтому полученные выше законы отражения и преломления остаются в силе и для поглощающих сред, включая металлы, если входящий в них показатель преломления п считать комплексным: у/г = п + гх (см. п. 2.2). В сильно поглощающих средах и металлах мнимая часть преобладает. В макроскопической теории величи- Рис. 3.14. Отражение и преломление ны п(со) и х(а>) полностью характеризуют оптиче- света на поверхности металла ские свойства поглощающей среды. Эксперимен- Экспериментальные методы их определения основаны на изучении отраженного света. Измере- Измерение характеристик отраженного света позволяет как бы «заглянуть» внутрь металла и получить сведения о значениях п и х для массивного образца, несмотря на малую глубину проникновения зондирующего света. Рассмотрим падающую (из вакуума или воздуха) на поверхность металла плоскую монохроматическую волну, волновой вектор которой Ц) образует с нормалью угол ср (рис. 3.14). В результате в первой среде возникают отраженная волна с волновым п+т
154 3. Отражение и преломление света вектором Ц и неоднородная волна, прошедшая в металл. Ее волновой вектор ком- комплексный: к2 = Ц + /Ц'. Обращаясь к формулам C.2), находим к\х = к2х = к0х = ~ 81п(Р- C«23) Отсюда прежде всего следует, что геометрический закон отражения от металлов такой же, как и для границы прозрачных сред. Для волны в металле из C.23) по- получаем, что составляющая вектора к2, направленная вдоль границы, вещественна: к2х = (^/С)8*П(Р- Поэтому вектор Щ (мнимая часть) перпендикулярен поверхности металла. Это значит, что плоскости равных амплитуд прошедшей волны параллель- параллельны границе. Вектор Ц перпендикулярен плоскостям постоянных фаз и характеризует направление прошедшей волны. Угол гр, который он образует с нормалью к грани- границе, называется вещественным углом преломления. Отношение синусов угла падения и вещественного угла преломления зт ср/ зт гр зависит от угла падения в отличие от преломления на границе прозрачной среды, где $тф/ зикр2 = сопз(. Оормулы Френеля C.8)—C.9) остаются в силе и для волн, отраженных от поверх- поверхности металла, если в них рассматривать со8ф2 как комплексную величину, опреде- определяемую законом преломления C.4): 81П2 ф V ф 1 - -^-, (п + IXJ причем нужно взять то значение квадратного корня, которое имеет положительную мнимую часть. Тогда неоднородная волна будет затухать в глубь металла. Явные выражения для амплитуд отраженных от поверхности металла волн в общем случае получаются чрезвычайно громоздкими, и мы их здесь не приводим. В случае комплексного показателя преломления отношения амплитуд отраженных волн к амплитудам падающих Е^/Е^ и Е^/Е^, вычисляемые по формулам Френеля для каждой из двух поляризаций, также комплексные: В общем случае А^ ф А... Поэтому при линейной поляризации падающего света между двумя компонентами отраженной волны появляется сдвиг фаз, приводящий к эллиптической поляризации отраженного света. Отраженный свет остается ли- линейно поляризованным, если падающий поляризован в плоскости падения или в пер- перпендикулярном направлении. При произвольном направлении линейной поляризации падающего света отраженный остается линейно поляризованным при нормальном (<р = 0) и при скользящем (ф = я/2) падении. В этих случаях направление поляри- поляризации в пространстве остается неизменным. Измерение эллиптической поляризации света, отраженного от поверхности ме- металла при наклонном падении линейно поляризованного света, лежит в основе пред- предложенного Друде экспериментального метода определения оптических характери- характеристик п и х металла. Теория связывает п и х с эксцентриситетом и положением осей
3.4. Отражение света от поверхности металлов 155 эллипса хколебаний. По данным измерений этих величин можно рассчитать п и х. Наибольшая чувствительность метода (и одновременное упрощение расчетных фор- формул) достигается при определенном угле падения [главном угле падения, играющем при отражении от поглощающих сред ту же роль, что и угол Брюстера при отраже- отражении от прозрачных сред). В большинстве случаев он лежит вблизи 70°. Для этого угла отраженный свет имеет круговую поляризацию, если соответствующим образом подобрать направление поляризации падающего света. Информацию об оптических характеристиках металла можно получить не только из измерений состояния поляризации отраженного света, но и из сравнения интен- сивностей отраженного и падающего света. Рассмотрим нормальное падение света на поверхность металла. В этом случае для амплитуды отраженной волны можно воспользоваться формулой C.12), подставив в нее п1 = 1, п2 = п 4- 1х\ §1=.Ь^ = Ие<*. C.24) Ь 1 + п 4 IX Отсюда, умножая C.24) на комплексно-сопряженную величину \г\ е~'5, находим ко- коэффициент отражения при нормальном падении: У металлов слагаемое х2 в числителе и знаменателе этой формулы часто значи- значительно больше другого слагаемого. Тогда значение /? близко к единице, т.е. почти вся энергия падающего света отражается. В видимой области натрий отражает свы- свыше 97 %, серебро — 95 % света, падающего на чистую поверхность. Волновой вектор прошедшей в металл волны при нормальном падении, как видно из C.2), имеет только г-составляющую, которая находится из C.4): 1с2г = (со/с)у/е = (со/с){п 4- гх). В этом случае поверхности равных фаз и равных амплитуд параллельны границе. Амплитуда волны на границе находится из C.12): Е2 = 2Е0/(\ 4- п 4- 1х). Таким образом, для напряженности электрического поля вол- волны в металле получаем Е2^>') = 2Ео {11п)г+хг *~*"*/ее-1ш{'-гп1с). C.26) Амплитуда волны уменьшается в глубину металла по закону ехр(—г/1), где / = с/{х(о) = &0/Bлх) характеризует глубину проникновения (толщину скин-слоя); Яо = 2пс/со — длина волны падающего излучения в вакууме. При х = 1 в слое толщиной в одну длину волны амплитуда уменьшается в е2^ раз, а интенсивность уменьшается в е4я « 3 • 105 раз. Для большинства металлов при измерениях в ви- видимой области значение х лежит между 2 и 5. В инфракрасной области значение х еще больше: у серебра х « 40 при А = 6 мкм. Эти цифры дают представление о том, насколько мала глубина проникновения света в металл. Определяемые экспериментально значения оптических характеристик металлов не отличаются высокой точностью. Воспроизводимость измеряемых значений п и х
156 3. Отражение и преломление света в пределах нескольких процентов считается удовлетворительной. Причина этого свя- связана с тем, что в случае сильно поглощающих сред, таких как металлы, все процессы происходят в тонких слоях (~ 10~4 мм) вблизи поверхности. Поверхностные слои не защищены от внешних воздействий, их свойства изменяются со временем и зависят от способа обработки поверхности. Образование переходных слоев на поверхности при ее обработке может внести заметные искажения в результаты измерений, когда толщина их сравнима с глубиной проникновения. Последовательный теоретический расчет оптических характеристик металлов п(со) и х((о) возможен только в рамках квантовой теории дисперсии. Основанная на упро- упрощенных модельных представлениях классическая теория дисперсии в металлах рас- рассматривалась в п. 2.6. При достаточно высоких частотах (со ^> у) роль силы «трения» в уравнении дви- движения свободного электрона становится несущественной, и для е(а)) теория дис- дисперсии дает выражение B.54), получающееся из полной формулы B.53) при у = 0. Случай у = 0 формально соответствует «идеальному» металлу, обладающему бес- бесконечно большой проводимостью: а —> оо. При со < а)р диэлектрическая проницае- проницаемость идеального проводника отрицательна, поэтому п = 0, а В этом случае C.25) дает К = 1, т.е. при нормальном падении света на поверх- поверхность идеального проводника происходит полное отражение. Наложение отраженной волны на падающую приводит к образованию стоячей волны, в то время как в метал- металле напряженность поля убывает вей 2,72 раза на расстоянии / = Л0/Bлх) вглубь от поверхности (см. задачу 1). Основанное на макроскопической электродинамике описание оптических свойств металлов построено в предположении, что действующее на отдельный свободный электрон поле волны можно считать однородным. Характерный пространственный масштаб изменения напряжен- напряженности поля в металле дает глубина проникновения (или толщина скин-слоя) /. Если средняя длина свободного пробега электрона мала по сравнению с толщиной скин-слоя, упомяну- упомянутое выше предположение выполняется. Но с понижением температуры проводимость металла растет и, следовательно, уменьшается глубина проникновения. Одновременно средняя длина свободного пробега электрона возрастает, так что она может стать больше глубины скин-слоя. В таких условиях скин-эффект называется аномальным. За время одного свободного пробега электрон будет двигаться через области с разной напряженностью поля. Поэтому при расчете вклада свободного электрона в поляризованность металла действующее на него электричес- электрическое поле нельзя считать однородным. В результате оказывается, что при низких температу- температурах макроскопическая теория применима в области достаточно низких частот, когда глубина скин-слоя значительно больше длины свободного пробега, и в области высоких частот, когда столкновения электронов становятся несущественными и глубина скин-слоя должна превос- превосходить не длину свободного пробега, а среднее расстояние, проходимое электроном в течение одного периода колебаний поля. При промежуточных частотах ни одно из этих условий не вы- выполняется и нужно учитывать пространственную зависимость напряженности электрического поля, действующего на свободные электроны. Задача теоретического описания оптических свойств металла в таких условиях становится чрезвычайно сложной. Она может быть решена методами физической кинетики.
3.4. Отражение света от поверхности металлов 157 Терминология, используемая в случае поглощающих сред, нередко приводит к недо- недоразумениям. Поглощение называют слабым, если глубина проникновения много больше длины волны — амплитуда постепенно уменьшается на протяжении мно- многих длин волн. Но «слабо» поглощающие вещества, такие как растворы красителей (разбавленные чернила), могут при достаточной толщине слоя поглотить практиче- практически всю энергию падающего на них излучения. Поглощение называют сильным, если глубина проникновения меньше длины волны. Но «сильно» поглощающие вещества, например металлы, способны поглотить лишь малую долю энергии падающего света: подавляющая часть энергии отражается. Это общее правило: если материал обладает сильным поглощением на какой-то частоте, то отражение света данной частоты на его границе очень велико и лишь малая доля энергии попадает внутрь и поглощается. Следующий простой опыт может служить иллюстрацией этого эффекта. На по- поверхность стеклянной пластинки наносится слой фиолетовых чернил. Пластинка имеет одинаковую фиолетовую окраску как в проходящем, так и в отраженном све- свете, ибо окраска слабопоглощающей среды (раствора красителя) обусловлена избира- избирательным поглощением света в толще слоя. Когда чернила засохнут, они превратятся в среду с сильным поглощением. В проходящем свете пластинка по-прежнему имеет фиолетовую окраску, но в отраженном свете засохшие чернила приобретают золо- золотистый металлический блеск. Он обусловлен избирательным отражением света от поверхности для тех длин волн, которые испытывают сильное поглощение в слое красителя. Поверхностная окраска некоторых металлов обусловлена зависимостью их опти- оптических характеристик от длины волны. Так как металл представляет собой среду с сильным поглощением, тонкие пленки металла при наблюдении на просвет будут иметь дополнительную окраску. Например, очень тонкие пленки золота, имеющего желтый цвет, в проходящем свете кажутся зелеными. Контрольные вопросы • В чем заключаются основные особенности отражения света от металлов (по сравнению с отражением от прозрачных сред)? • В каких случаях отраженный металлическим зеркалом свет сохранит линейную поляриза- поляризацию? • Почему результаты измерений оптических характеристик металлов по поляризации отра- отраженного света имеют плохую воспроизводимость? • Почему металлы сильно поглощают свет, а обладающие высокой проводимостью электро- электролиты прозрачны? • В чем заключаются различия поверхностной окраски сред, обладающих сильным и слабым поглощением? Задачи 1. Световая волна частотой со падает по нормали из вакуума на плоскую поверхность иде- идеального металла. Найдите напряженности электрического поля в металле и в вакууме ДЛЯ СО < СОр.
158 3. Отражение и преломление света Решение. При со < сор диэлектрическая проницаемость идеального проводника отрица- отрицательна (г: = 1 — о)р/со < 0), поэтому п = 0, а х = (сор/со — 1) ' . Для отношения ампли- амплитуд отраженной и падающей волн из C.24) находим 1х = _2/д где C.27) Отражение от поверхности идеального проводника будет полным даже при нормальном падении. Напряженность электрического поля в вакууме находится сложением напряжен- ностей полей падающей и отраженной волн: = 2Ео А) Для нахождения амплитуды напряженности электрического поля в металле воспользу- воспользуемся второй из формул C.12): Зависимость напряженности электрического поля в металле от координат и времени по- получим, подставляя амплитуду Е2 в выражение Е2(г, /) = #2ехР'(^2гг ~~ ^0 с ^2» = шх/с из C.4): C.28) Напряженности поля в вакууме и в металле имеют одинаковую зависимость от вре- времени. Значения их на границе (т.е. при г = 0) совпадают, так как созА = 1/\Л + Щ2 А = = \/уХ+х2 =со/сор. Этого и следовало ожидать из граничных условий. Зависи- Зависимость напряженности электрического по- поля от г показана на рис. 3.15. Напряжен- Напряженность поля в металле затухает экспонен- экспоненциально, убывая в е « 2,72 раза на глу- глубине / = с/(сох) = Л0/Bлх), где Яо — дли- длина волны в вакууме. В вакууме (при г < 0) образуется стоячая волна, первый узел на- напряженности электрического поля которой та 11Г „ расположен от поверхности металла на Рис. 3.15. Напряженность электрического поля г г световой волны при нормальном падении света расстоянии, несколько меньшем половины на границу идеального металла длины волны. 3,5, Световое давление. Импульс электромагнитной волны Поглощение света в веществе, а также отражение и преломление на границе со- сопровождаются появлением механических сил, действующих на вещество. Эти силы принято называть световым давлением. Идея о световом давлении была высказана еще Кеплером для объяснения фор- формы кометных хвостов. В рамках корпускулярных представлений о природе света
3.5. Световое давление 159 такая гипотеза была естественной, так как световые частицы должны были бы пе- передавать свой импульс поглощающим и отражающим телам, т. е. производить давле- давление. Неудачи ранних попыток обнаружить световое давление на опыте приводились Франклином и Юнгом как один из аргументов против корпускулярной теории. Вол- Волновая теория, рассматривавшая свет как поперечные упругие волны, отрицала све- световое давление. Однако пришедшая ей на смену электромагнитная волновая теория света дает объяснение возникновению светового давления и позволяет его рассчи- рассчитать. Экспериментально световое давление было впервые обнаружено и измерено П. Н. Лебедевым в 1900 г. в исключительно тонких опытах. Измерения Лебедева, подтвердившие рассчитанное Максвеллом световое давление, сыграли большую роль в становлении электромагнитной теории света. Рассмотрим сначала простейший случай нормального падения света на поверхность поглощающей среды. Покажем, что среда при этом испытывает давление в направ- направлении падающей волны. Падающая волна взаимодействует с электрическими заря- зарядами среды. Электрическое и магнитное поля волны действуют на заряд д с силой Г = #Е 4- ц(у/с) х В, где V — скорость движения заряда. В бегущей электромагнит- электромагнитной волне, согласно A.31), в каждой точке в любой момент времени В = Е, поэтому при у<с второе слагаемое в Г — обусловленная магнитным полем волны сила Лоренца — все- всегда много меньше первого слагаемого дЕ. Это позволяет считать, что вынужденное движение заряда обусловлено электрическим полем вол- волны, и не учитывать силу Лоренца в основ- основном уравнении электронной теории диспер- дисперсии B.30). Но именно с силой Лоренца связано давление, оказываемое волной на среду. '**---- Выразим в формуле для силы Лоренца <?(у/с) х В индукцию магнитного поля волны Рис. 3.16. К расчету светового давления через напряженность электрического поля. Вве- Введем для этого единичный вектор п вдоль направления распространения волны: п = к/к (рис. 3.16), тогда В = п х Е. Таким образом, выражение для силы Лорен- Лоренца принимает вид =^п-(у- Е). C.29) Здесь при преобразовании двойного векторного произведения по формуле А х (В х С) = В (А • С) — С (А • В) мы предположили, что вектор скорости V направ- направлен по одной прямой с вектором напряженности Е электрического поля световой волны, так как именно электрическое поле волны возбуждает движение зарядов в ве- веществе. Произведение силы #Е на скорость V равно мощности Р, отдаваемой заряду электромагнитной волной. Поэтому формулу C.29) можно записать в виде Гл = п^. C.30) Так как взаимодействие волны с зарядом ц приводит в среднем к передаче энергии волны заряду, то среднее за период значение мощности Р положительно. Поэтому
160 3. Отражение и преломление света направление действующей на заряд средней силы, как видно из C.30), совпадает с п, т.е. с направлением волны. Таким образом, при усреднении по времени полной силы, действующей на заряд со стороны электромагнитного поля световой волны, вклад силы #Е обращается в нуль, а сила Лоренца д(у/с) х В приводит к световому давлению. Важно отметить, что из выражения C.30) для силы, действующей на заряженную частицу, выпала основная характеристика частицы — ее заряд д. Это позволяет обоб- обобщить формулу C.30) и не связывать полученный результат с модельными представ- представлениями электронной теории, использованными при ее выводе. Пусть, например, вся энергия падающего света поглощается преградой. Тогда поглощаемая мощность Р может быть выражена через вектор Пойнтинга 8 = пюс падающей волны (и; — объемная плотность излучения). Мощность йР, поглощаемая элементарной площад- площадкой йа, равна 8йа, а действующая на нее сила в соответствии с C.30) составляет п(8дG)/с. Сила светового давления на всю поверхность а поглощающей преграды определяется полным потоком излучения сквозь эту поверхность: -•и (8йа). C.31) На плоскую площадку, характеризуемую вектором а, действует сила светового давления Г = п(8а)/с = юп(по), где (па) — площадь перпендикулярной направле- направлению волны проекции площадки (рис. 3.17). Существование светового давления приводит к заключению о том, что электро- электромагнитное поле обладает импульсом. Понятие импульса, как и понятие энергии, по мере развития науки значительно изменялось. Вначале эти понятия применялись только к механическим движениям. В дальнейшем они были обобщены так, что ста- стали охватывать и другие формы движения материи. Это позволило сформулировать универсальные законы сохранения энергии и импульса, учитывающие возможность их превращения из одной формы в другую. В частности, давление света на материальные тела заставляет приписать ему опре- определенный импульс. Сила светового давления, как и любая другая механическая сила, изменяет импульс тела, на которое она действует. Исходя из универсальной применимости закона сохранения им- импульса нужно считать, что тело приобретает механиче- механический импульс за счет соответствующего изменения им- импульса другой формы движения. Так как единственный процесс, сопровождающий в данных условиях изменение импульса тела, — это поглощение света, то и носителем другой формы импульса может быть только свет. За 1 с импульс тела получает приращение, численно равное дей- Рис. 3.17. Световое давление СТВуЮщей силе. При нормальном падении сила давления на наклонную площадку у г г света на единичную площадку поверхности поглощающе- поглощающего тела равна 8/с = 1Ш. Как раз таким импульсом должен обладать поглощенный за 1 с свет. Его энергия 8 — юс была распределена с плот- плотностью ю в опирающемся на единичную площадку объеме, вытянутом вдоль волны на расстояние с (см. рис. 3.17). Естественно считать, что и переданный площадке
3.5. Световое давление 161 импульс был распределен в том же объеме. Так как этот объем равен с, то для им- импульса, приходящегося на единицу объема, т. е. для объемной плотности импульса электромагнитного поля р, получаем р=4 = п~. C.32) сА с Таким образом, импульс световой волны равен ее энергии, деленной на скорость света, и направлен в сторону распространения света. Используя представление об импульсе электромагнитного поля, легко найти силу светового давления и в тех случаях, когда падающий свет не обязательно полностью поглощается телом, а может также частично или полностью отражаться или рассе- рассеиваться. Сила давления света всегда равна передаваемому телу за 1 с импульсу све- света, т. е. векторной разности импульсов падающего и отраженного (или рассеянного) за 1 с света. Например, при нормальном падении на поверхность идеального зерка- зеркала отраженный свет обладает противоположно направленным импульсом. Поэтому передаваемый зеркалу импульс вдвое больше, чем в случае полного поглощения. При нормальном падении на зеркало с коэффициентом отражения /? давление равно шA + К). При наклонном падении сила светового давления имеет как нормальную, так и тангенциальную (при К ф 1) составляющие (см. задачу 1). Для тела, рассеива- рассеивающего падающий свет равномерно по всем направлениям, как, например, зеркальный шар, сила светового давления будет такой же, как и при полном поглощении, так как суммарный импульс изотропно рассеянного света равен нулю (см. задачу 2). Когда свет падает со всех направлений на внутреннюю зеркальную стенку полости, равно- равномерно заполненной изотропным излучением с объемной плотностью ю, его давление равно ю/Ъ (см. задачу 3). Итак, давление света на поверхность тела обусловлено передачей телу опреде- определенного импульса отражающимся светом, подобно тому как давление газа на стенки сосуда объясняется тем, что молекулы газа передают этим стенкам некоторый им- импульс при соударениях с ними. В лабораторных условиях импульс света и световое давление обычно настолько малы, что их непосредственное измерение затруднительно. Например, достигающий Земли солнечный свет действует на расположенное перпендикулярно его лучам зер- зеркало с силой 10~5 Н на 1 м2 поверхности. В опытах П. Н. Лебедева использовался легкий подвес на тончайшей упругой нити, по одну сторону которого были при- прикреплены тонкие и легкие зеркальные металлические крылышки, а по другую — зачерненные (рис. 3.18). Подвес находился в откачанном сосуде, образуя чувстви- чувствительные крутильные весы. Давление света на зеркальное крылышко приблизитель- приблизительно вдвое больше, чем на зачерненное, что должно приводить к соответствующему закручиванию подвеса при освещении. Основные трудности таких опытов связаны с тем, что при недостаточно высоком вакууме вторичные явления могут полно- полностью замаскировать искомый эффект светового давления. Главные из них — это конвекционные потоки остаточного газа и радиометрический эффект, возникающий в разреженном газе вследствие разности температур освещенной и неосвещенной сторон крылышка. Радиометрический эффект вызывает закручивание подвеса в на- направлении, противоположном действию светового давления. Лебедеву удалось почти 6 Зак 4498
162 3. Отражение и преломление света полностью исключить радиометрическое действие благодаря тщательно продуман- продуманной методике и технике эксперимента. Его измерения дали величину, согласующу- согласующуюся с теорией с точностью до 20%. Опыты Лебедева были повторены Герлахом в 1923 г., использовавшим более совершенные методы получения высокого вакуума. Полученные Герлахом результаты согласуются с теорией в пределах погрешности опыта (до 2%). После создания лазеров световое давление снова привлекло внимание исследова- исследователей. Высокие временная и пространственная когерентности лазерного излучения позволяют сфокусировать его в области с размерами по- порядка длины световой волны. При этом достигаются очень большие значения плотности энергии и импульса свето- световой волны. Простые оценки показывают, что сила давле- давления лазерного излучения мощностью 1 Вт (такую мощ- мощность легко получить для зеленого света аргонового ла- лазера), сфокусированного на частицу с размерами порядка длины световой волны, должна сообщить частице уско- ускорение, примерно в миллион раз превышающее ускоре- ускорение свободного падения. При попытках эксперименталь- экспериментального осуществления этой идеи возникает ряд трудностей. Так, например, нельзя использовать металлические час- частицы, так как даже при коэффициенте отражения 98% оставшихся двух процентов падающей мощности, погло- поглощаемых частицей, достаточно для ее плавления и испаре- испарения. Движение под действием давления сфокусированного лазерного излучения можно наблюдать, используя малые „ л <п л прозрачные сферические частицы (например, шарики по- Рис. 3.18. Один из подвесов, * * * *\ ^ V р к» к использованных П. Н. Лебеде- лиметилакрилата), взвешенные в дистиллированной воде, вым в опытах по измерению Несмотря на малый коэффициент отражения (как видно светового давления из формулы C.14), он пропорционален квадрату разности показателей преломления материала частицы и окружаю- окружающей среды), силы светового давления оказываются достаточными для их обнаруже- обнаружения в наблюдаемом движении частицы на фоне вторичных процессов (конвекцион- (конвекционных потоков жидкости, реактивных сил, возникающих, подобно радиометрическим силам в газе, при неравномерном нагреве частицы падающим излучением и т.п.). Д ,авление и импульс излучения проявляются в двух противоположных по масшта- масштабам областях: астрономической и субатомной. Например, притяжение верхних слоев звезд к их центру в значительной степени уравновешивается давлением излучения, идущего от центра звезды наружу. Световое давление приводит к некоторому пре- предельному значению массы, при котором звезда еще остается устойчивой. Этот вывод согласуется с астрономическими данными, согласно которым звезды с массой, пре- превосходящей некоторый известный предел, не наблюдаются. Из явлений микромира отметим эффект Комптона (см. п. 9.6), при котором рент- рентгеновское излучение передает часть своего импульса электронам, на которых оно рассеивается, и тем самым сообщает этим «электронам отдачи» большие скорос- скорости. Импульс излучения обнаруживает себя также в «отдаче», которую испытывает
3.5. Световое давление 163 атомное ядро при испускании гамма-лучей. Это явление вполне аналогично отдаче ружья при выстреле. Эффект отдачи в принципе существует и при испускании све- света атомами, но в оптической области он приводит к ничтожному сдвигу частоты испускаемого света (значительно меньшему естественной ширины линии). В случае классической модели элементарного источника света — линейного осциллятора — эффект отдачи отсутствует ввиду симметрии непрерывно испус- испускаемой им волны. При этом суммарный импульс испускаемой волны равен ну- нулю. Наблюдаемый на опыте эффект отдачи при испускании гамма-лучей атомными ядрами свидетельствует о неклассическом дискретном характере испускания, ког- когда вылетающий в определенном направлении гамма-квант уносит конечную порцию импульса. Свет круговой поляризации наряду с энергией и импульсом обладает также мо- моментом импульса. Для его определения можно рассмотреть вынужденное движение изотропного заряженного осциллятора под действием электрического поля цирку- лярно поляризованной волны. Это движение будет происходить по окружности с уг- угловой скоростью о), равной частоте падающей волны, причем смещение заряда из положения равновесия не совпадает с направлением действующей на него силы дЕ. Поэтому на заряд действует некоторый момент сил N относительно центра, благода- благодаря которому волна передает осциллятору мощность Р — Мсо. Наличие момента сил означает, что осциллятор за 1 с приобретает механический момент импульса, числен- численно равный этому моменту сил N. Основываясь на универсальном законе сохранения момента импульса, заключаем, что за 1 с осциллятор вместе с энергией Р получил механический момент импульса N от электромагнитного поля действующей на него световой волны круговой поляризации. Таким образом, луч света левой круговой по- поляризации с энергией ю переносит момент импульса ю/со, направленный вдоль луча. Правополяризованный свет обладает противоположно направленным моментом им- импульса. В области макроскопических явлений экспериментальное измерение момента им- импульса света представляет очень трудную задачу из-за ничтожной величины связан- связанных с ним эффектов. Тем не менее в исключительно тонких экспериментах удалось обнаружить момент импульса, передаваемый светом полуволновой кристаллической пластинке, при прохождении через которую правополяризованный свет становится левополяризованным, или наоборот (см. п. 4.1). Но в области атомных явлений об- обмен моментом импульса между светом и веществом имеет существенное значение. Например, при испускании света круговой поляризации возбужденным атомом мо- момент импульса электронов в атоме изменяется на величину, сравнимую с моментом импульса всего атома. Контрольные вопросы • Какую роль играют электрическое и магнитное поля световой волны в возникновении давления света? • Как сила светового давления, действующая на совершающий вынужденное движение заряд, зависит от передаваемой заряду мощности? • Как импульс электромагнитного поля световой волны выражается через ее энергию?
164 3. Отражение и преломление света • Чему равно давление на поверхность с коэффициентом отражения /? падающей по нормали световой волны, плотность энергии в которой равна ш? • С какими трудностями сопряжено измерение светового давления в лабораторных условиях? • В каких явлениях давление и импульс излучения играют существенную роль? Задачи 1. Найдите нормальную и тангенциальную составляющие силы светового давления при паде- падении волны с объемной плотностью энергии ш под углом в на поверхность, которая: а) поглощает все падающее на нее излучение; б) полностью отражает; в) частично отражает (коэффициент отражения /?); г) рассеивает равномерно по всем направлениям (по закону Ламберта). Ответ. а) /± = м)а соз2 в, /ц = б) /± =2и)ссо$2в, /ц =0; в) /± = ю(т(\ +Я)соз20, /ц = г) /± = юсг созв(со$в + 1/2), /м = юсг зт0соз0. Здесь ю — плотность энергии падающей волны. 2. Найдите силу давления плоской световой волны на шар радиуса /?0, когда его поверхность: а) полностью поглощает падающее излучение; б) зеркально отражает {К = 1). Ответ. Сила давления в случаях а) и б) одинакова и равна и)лК$. 3. Найдите давление изотропного излучения с объемной плотностью ш на идеальное зеркало. Ответ, р — ю/3.
Распространение света в анизотропной среде Прохождение света через анизотропное вещество, оптические свойства которого в разных направлениях не одинаковы, со- сопровождается рядом своеобразных явлений, имеющих большое принципиальное и практическое значение. Особенности оптических явлений в анизотропных средах свя- связаны с тем, что индуцируемый электромагнитной волной ди- польный момент физически бесконечно малого элемента объ- объема среды, вообще говоря, не совпадает по направлению с элек- электрическим полем волны. Так происходит потому, что в анизо- анизотропном веществе под действием внешней силы элементарные заряды смещаются в одних направлениях легче, чем в других. Физическая природа анизотропии вещества связана с особен- особенностями строения его молекул или особенностями кристалли- кристаллической решетки, в узлах которой находятся атомы или ионы. В таких условиях модель изотропного осциллятора для опи- описания оптического электрона в атоме может оказаться непри- непригодной, так как возвращающая сила, действующая на электрон при смещении из положения равновесия, обусловлена не только сферически симметричным полем ионного остова, но и полем соседних атомов или ионов, которое имеет более низкую сим- симметрию. Изучение распространения света в анизотропных средах по- построено в этой главе не на учете их атомной структуры, а с помощью феноменологической электромагнитной теории. В рамках такой теории анизотропия учитывается тем, что в ма- материальном уравнении восприимчивость среды %{а)) представ- представляет собой тензор (а не скаляр, как в изотропной среде).
166 4. Свет в анизотропной среде 4.1. Двойное лучепреломление При падении световой волны на границу изотропной среды в этой среде от гра- границы распространяется одна преломленная волна, волновой вектор которой лежит в плоскости падения и составляет с нормалью к границе угол <р2, определяемый известным законом преломления: п18Шф1 =п2$1Пф2. Если среда анизотропна, то в ней в общем случае возникают две волны, распространяющиеся от границы в раз- разных направлениях и с разными скоростями. Это явление называется двойным луче- лучепреломлением. Оно было открыто Бартолином в 1670 г. в кристаллах исландского шпата и впоследствии подробно исследовано Гюйгенсом. Гюйгенс дал объяснение двойного лучепреломления на основе гипотезы о том, что падающая на границу вол- волна порождает в кристалле элементарные вторичные волны двух видов: сферические (обыкновенные) и эллипсоидальные (необыкновенные), скорость которых зависит от направления распространения. Исландский шпат представляет собой разновидность углекислого кальция СаСОз (кальцит), относящуюся к гексагональной системе. Он встречается в природе в виде довольно больших и оптически чистых кристаллов. Раскалыва- Раскалыванием по определенным плоскостям (плоскостям спайности) кри- кристаллу можно придать форму ромбоэдра — фигуры, которую легче всего представить себе как куб, несколько сжатый вдоль пространственной диагонали АВ (рис. 4.1). Грани его имеют вид ромбов с углами 78 и 102°. В двух противоположных верши- вершинах А и В сходятся стороны трех тупых углов. Для демонстрации двойного лучепреломления узкий па- параллельный пучок света направляют перпендикулярно грани естественного ромбоэдра. Из противоположной грани выхо- выходят два пучка, имеющие направления, параллельные первона- первоначальному. Один из них распространяется в том же направ- Рис. 4.1. Кристалл лении чт0 и первичный пучок, а второй смещен в сторону, исландского шпата т.е. для него угол преломления отличен от нуля, несмотря на то что угол падения равен нулю. Это обстоятельство да- дало повод назвать второй пучок необыкновенным (е), а первый, подчиняющий- подчиняющийся закону преломления, — обыкновенным (о). Если падающий пучок достаточно узок, а кристалл имеет достаточную толщину, то выходящие пучки пространственно разделены (рис. 4.2) и образуют два пятна на экране. Ког- Когда падающий свет естественный, оба пятна име- | ют одинаковую освещенность. При повороте крис- :,..;| талла вокруг направления падающего пучка одно *^\к;ш'•¦'¦":- пятно остается на месте, а второе обходит вок- вокруг него. С помощью анализатора легко убедиться, что выходящие из кристалла пучки света линей- Рис- 4-2- Двойное лучепреломление но поляризованы во взаимно перпендикулярных ^оГГо^ГГе^Ге^ направлениях. Увеличив сечение падающего пуч- грань кристалла исландского шпата ка, можно получить частичное перекрывание пятен на экране. При повороте анализатора неперекрывающиеся части пятен периодически становятся светлыми и темными: когда у одной части освещенность максимальна,
4.1. Двойное лучепреломление 167 у другой — обращается в нуль. Освещенность перекрывающейся части остается неизменной. В кристалле исландского шпата пространственная диагональ АВ ромбоэдра (см. рис. 4.1) является осью симметрии третьего порядка: при повороте на треть оборота (на 120°) вокруг этой оси кристалл совмещается сам с собой. Спилив ту- тупые углы в вершинах ромбоэдра по плоскостям, перпендикулярным оси симметрии, и отшлифовав эти плоскости, можно исследовать распространение света в направ- направлении оси (рис. 4.3). Оказывается, что в этом случае двойное лучепреломление отсутствует: падающий пу- пучок света не раздваивается и состояние его поляри- поляризации не изменяется. Обладающее таким свойством направление называется оптической осью кристал- кристалла. Отметим, что речь идет именно о направлении, а не об отдельной прямой, так как пучок не будет испытывать двойного преломления при распростране- Рис. 4.3. Распространение света нии вдоль любой прямой, параллельной этому направ- ВД°ЛЬ оптической оси кристалла исландского шпата лению. Кристаллы, имеющие лишь одно направление, вдоль которого не происходит двой- двойного лучепреломления, называют одноосными (исландский шпат, кварц и др.). Су- Существуют кристаллы, имеющие два таких направления. Они называются двуосными. В дальнейшем основное внимание будет уделено одноосным кристаллам, широко используемым в оптических экспериментах. Рассмотрим распространение света в одноосном кристалле в направлении, перпен- перпендикулярном оптической оси. Возьмем плоскопараллельную кристаллическую плас- пластинку, грани которой вырезаны вдоль оптической оси. Опыт показывает, что падаю- падающий нормально пучок света распространяется в пластинке в прежнем направлении. Однако состояние поляризации света при прохождении через пластинку изменяется: если падающий свет поляризован линейно, прошедший свет в общем случае поля- поляризован эллиптически. Изменение поляризации легко понять, если падающую волну разложить на две составляющие, в одной из которых вектор Е параллелен оптиче- оптической оси, в другой — перпендикулярен. Оказывается, что эти составляющие распро- распространяются в кристалле с разными скоростями и при прохождении через пластинку между ними возникает сдвиг по фазе. Различие скоростей волн с ортогональными направлениями поляризации в анизо- анизотропной среде можно объяснить на основе электронной теории дисперсии. Одина- Одинаковым смещениям оптического электрона атома вдоль оптической оси и в перпен- перпендикулярном направлении соответствуют разные квазиупругие возвращающие силы. Поэтому будут различаться и собственные частоты й>., и со± колебаний электрона в этих взаимно перпендикулярных направлениях. Поляризуемость атома определяет- определяется разностью квадратов частоты со света и частоты собственных колебаний электро- электрона (см. гл. 2), Следовательно, различным направлениям колебаний в световой волне определенной частоты соответствуют различные значения поляризуемости, диэлек- диэлектрической проницаемости и показателя преломления. Обозначим по показатель преломления для волны, в которой вектор Е перпенди- перпендикулярен оптической оси, пе — для волны, в которой вектор Е лежит в плоскости, содержащей оптическую ось и направление распространения волны. Этим волнам с ортогональными направлениями поляризации соответствуют различные фазовые
168 4. Свет в анизотропной среде скорости уо = с/по и уе = с/пе Пусть на пластинку падает линейно поляризован- поляризованная волна. Тогда на входе обе волны имеют одинаковую фазу. Разность их фаз 8 на выходе из пластинки зависит от ее толщины й\ 8 = -{по-пе)й. D.1) Если 8 = к я, где к = ±1, ±2,..., то выходящая волна тоже имеет линейную по- поляризацию. В остальных случаях поляризация волны эллиптическая (если только направление поляризации падающей волны не совпадает с оптической осью и не перпендикулярно оси, когда в кристалле возбуждается лишь одна из волн и выходя- выходящий свет остается линейно поляризованным). Чтобы с помощью кристаллической пластинки можно было получить свет круговой поляризации, разность фаз 8 должна быть равна Bк + \)л/2. При заданных значе- значениях по и пе этому условию можно удовлетворить подбором толщины й пластинки в D.1). В результате получается так называемая пластинка в четверть длины вол- волны (пластинка Я/4). Разумеется, необходимая разность фаз получится только для све- света определенной частоты. Это обусловлено как прямой зависимостью 8 от а) в D.1), так и дисперсией показателей преломления по и пе. Свет круговой поляризации на выходе из пластинки получается при условии, что плоскость поляризации падающей волны составляет угол ±л/4 с оптической осью пластинки (рис. 4.4), так как только в этом случае будут одинаковы амплитуды волн, между которыми пластинка Я/4 вносит сдвиг фаз л/ 2. Пластинки Я/4 изготовляют обычно из кварца или из тонких листочков слюды. Качество пластинки Я/4 можно проверить, исследуя с помощью анализатора выходя- выходящий из нее циркулярно поляризованный свет. При правильно подобранной толщине пластинки вращение анализатора вокруг оси пучка вы- выходящего света не должно приводить к изменению его интенсивности. Пластинка Я/4 может быть использована и для обратного преобразования циркулярно поляризованно- поляризованного света в линейно поляризованный. Ясно, что направ- направление поляризации выходящего света при этом состав- составляет угол ±л/4 с оптической осью пластинки. С помощью четвертьволновой пластинки можно Рис. 4.4. Получение света кру- также отличить на опыте свет круговой поляризации говой поляризации с помощью От естественного (неполяризованного) света, а свет четвертьволновой пластинки эллиптической поляризации - от частично поляри- зованного. Одного только поляризационного прибора (анализатора) недостаточно, чтобы различить эти типы поляризации. Как для поля- поляризованного по кругу, так и для естественного света интенсивность пучка после про- прохождения через анализатор одинакова при любой ориентации анализатора. Если же предварительно ввести пластинку Я/4, то поляризованный по кругу свет превратится в линейно поляризованный, который можно полностью погасить при определенной ориентации анализатора. Естественный свет можно рассматривать как наложение двух волн одинаковой интенсивности с ортогональными поляризациями, разность фаз между которыми случайным образом многократно изменяется в течение време-
4.1. Двойное лучепреломление 169 ни наблюдения. Дополнительная постоянная разность фаз, вносимая четвертьволно- четвертьволновой пластинкой, не может изменить случайного характера соотношения фаз орто- ортогональных составляющих. Поэтому прошедший через четвертьволновую пластинку свет остается неполяризованным и его интенсивность не меняется при повороте анализатора Эллиптически поляризованный свет можно представить как сумму двух волн, ли- линейно поляризованных вдоль главных осей эллипса, разность фаз между которы- которыми ±л/2. Пропуская исследуемый свет через пластинку Я/4, к этой разности можно добавить еще ±л/2 и тем самым сделать ее равной 0 или л, т.е. превратить эллипти- эллиптическую поляризацию в линейную, в чем можно в свою очередь убедиться с помощью анализатора. Для этой цели пластинка Я/4 должна быть ориентирована так, чтобы ее главные направления (т. е. направление оптической оси и перпендикулярное ей) совпадали с главными осями эллипса колебаний, определенными предварительно с помощью анализатора (напомним, что превращение света круговой поляризации в линейно поляризованный происходит при любой ориентации пластинки). Таким образом, по направлению оптической оси пластинки определяют ориентацию осей эллипса колебаний, а по положению анализатора, при котором гасится выходящий из пластинки пучок, — отношение этих осей. Описанным выше методом легко отличить эллиптически поляризованный свет от частично поляризованного, который можно рассматривать как смесь линейно по- поляризованного света с естественным. И в том и другом случае при повороте анали- анализатора наблюдается лишь изменение интенсивности света между некоторыми макси- максимальным и минимальным значениями. Если же предварительно ввести в пучок пластинку Я/4, соответственным образом ее |—] ориентировав, то эллиптически поляризованный свет превра- М тится в линейно поляризованный и может быть полностью по- погашен анализатором. В случае частично поляризованного света пластинка Я/4 при указанной ориентации (как и при любой другой) никакого влияния не оказывает, т. е. выходящий из нее свет не будет погашен анализатором ни при какой его ориен- —*" тации. ^ Для анализа поляризованного света наряду с пластинкой Я/4 используются приспособления, которые позволяют скомпенси- *" ровать до нуля (или дополнить до я) любую разность фаз л ж т „ ~ „ Рис. 4.5. Компенсатор между двумя волнами. Они называются компенсаторами. Про- из кварцевых клиньев стейший компенсатор состоит из двух слабо скошенных квар- кварцевых клиньев (рис. 4.5). Сложенные вместе, они образуют плоскопараллельную кри- кристаллическую пластинку с оптической осью, ориентированной вдоль ее граней. Один из клиньев можно перемещать относительно другого с помощью микрометрического винта, изменяя тем самым их общую толщину и, следовательно, вносимую компен- компенсатором разность фаз между двумя волнами. Контрольные вопросы • Что называется оптической осью анизотропной среды? • Какую поляризацию может иметь свет, распространяющийся вдоль оптической оси?
170 4. Свет в анизотропной среде • Циркулярно поляризованный свет при прохождении через пластинку Я/4 превращается в линейно поляризованный. Каким будет направление его поляризации? • Как с помощью пластинки Я/4 и анализатора можно отличить естественный свет от цир- циркулярно поляризованного? частично поляризованный от эллиптически поляризованного? • Как отличить свет с частичной круговой поляризацией (т.е. смесь естественного с цирку- циркулярно поляризованным) от естественного? Задачи 1. Если естественный кристалл исландского шпата положить на страницу книги и рассмат- рассматривать оказавшийся под ним текст, то все буквы кажутся раздвоившимися, причем одно изображение параллельно смещено относительно другого. Маленькие предметы (например, точки) дают два отдельных изображения. Будет ли происходить раздваивание изображения, если через такой кристалл смотреть на удаленный предмет? Ответ. Не будет. 2. Узкий пучок естественного света падает нормально на грань кристалла исландского шпата и преломляется, как показано на рис. 4.2. Что произойдет, если на пути выходящих из кристалла пучков поместить еще один точно такой же кристалл, ориентированный так же, как и первый? Что изменится, если второй кристалл повернуть на 90° вокруг оси падающего пучка? 3. Какую толщину может иметь четвертьволновая пластинка из кварца для желтого света натрия (пе = 1,553, по = 1,544)? Ответ. с1т\п = (Я/4)(/76, — по) = 16мкм. 4.2. Плоские монохроматические волны в анизотропной среде. Одноосные кристаллы х ассмотрим распространение света в прозрачной анизотропной среде на осно- основе электромагнитной теории. Фундаментальные уравнения Максвелла B.6)—B.9) для электромагнитного поля в веществе имеют универсальный характер и в пол- полной мере применимы к анизотропным средам. Будем искать их решение в ви- виде плоских монохроматических волн, где Е, В, В зависят от координат и време- времени по закону ехр/(кг — ш). Введем единичный вектор волновой нормали М, на- направленный вдоль волнового вектора к (т.е. перпендикулярно плоскостям равных фаз): N=- = -1*. D.2) к со Тогда из уравнений Максвелла B.7) и B.9) получим СГС: ^Е=-В, ^В=--О; D.3) СИ: N х Е = уВ, еос2П х В = -иО.
4.2. Плоские волны в анизотропной среде 171 Здесь V — фазовая скорость волны, т.е. скорость, с которой поверхность равных фаз перемещается в направлении волновой нормали N. Прежде чем вводить мате- материальное уравнение, связывающее векторы Е и О в ани- анизотропной среде, рассмотрим те свойства электромагнит- электромагнитных волн, которые следуют непосредственно из уравне- уравнений D.3). Эти свойства отражают взаимное расположение векторов Б, Е, В и N. Из второй формулы D.3) видно, что вектор В перпен- дикулярен векторам В и ^ а из первой — что векторы В и N взаимно перпендикулярны. Таким образом, в бегу- бегущей волне векторы Б, В и N образуют правую тройку Рис 46 Взаимное располо- ортогональных векторов (рис. 4.6). Что касается векто- жение векторов В, В, Е, N и $ ра Е, то в анизотропной среде его направление, вообще ПРИ распространении света говоря, не совпадает с направлением В. Из первого урав- уравнения D.3) следует, что вектор Е ортогонален вектору В, т. е. лежит в плоскости, образуемой векторами В и N. Это значит, что бегущие волны в анизотропной среде поперечны в отношении векторов О и В, но в общем случае они не поперечны в отношении вектора Е (см. рис. 4.6). Направление переноса энергии в электромагнитной волне определяется вектором Пойнтинга 8 A.50). Для характеристики этого направления введем ориентированный вдоль 8 единичный вектор $: в анизотропной среде 8 ЕхВ 5 ~~ ЕВ ' D.4) Его называют лучевым вектором, так как направление переноса энергии — это и есть направление лучей. В изотропной среде лучи параллельны волновой нор- нормали. Однако в анизотропной среде в общем случае это не так. Из рис. 4.6 вид- видно, что вектор 8, ортогональный векторам Е и В, лежит в одной плоскости с Б, Е и N и составляет с вектором N такой же угол а, что и вектор Е с векто- вектором Б. Плоскость равных фаз перемещается вдоль вектора N со скоростью V. Скорость перемещения этой плоскости вдоль вектора луча 8 называется лучевой скоростью и. Когда N и 8 не совпадают, лучевая и фазовая скорости не равны и, как видно из рис. 4.6, связаны соотношением V = D.5) Особенности распространения лучей (т. е. переноса энергии) в анизотропной среде обусловлены как дисперсией волн (т.е. зависимостью фазовой скорости от частоты), так и отличием направлений волновых нормалей N и лучей 8. Дисперсия в равной мере присуща как изотропным, так и анизотропным средам. Чтобы выделить особен- особенности, специфичные только для анизотропной среды, будем в дальнейшем пренебре- пренебрегать дисперсией, т.е. полагать йь/дХ = 0. В такой недиспергирующей среде вектор лучевой скорости и = и 8 характеризует направление и скорость переноса энергии световой волны. Поэтому задача определения лучевой скорости в зависимости от на- направления луча представляет наибольший интерес и ниже основное внимание будет сосредоточено на ее решении.
172 4. Свет в анизотропной среде Преобразуем уравнения D.3) так, чтобы вместо вектора волновой нормали N в них фигурировал лучевой вектор 8, а вместо фазовой скорости у — лучевая скорость и. Для этого умножим векторно левую и правую части каждого из них на 8. Двойные векторные произведения в левых частях преобразуются следующим образом: 5x(NxЕ)=N(8¦Е)- Е(в • 14) = -- Е, 8 х A4 х В) = N(8 • В) - В(8 • 14) = -- В. Здесь мы воспользовались тем, что вектор 8 в соответствии с D.4) ортогонален век- векторам Е и В, а произведение 8 • N заменили на у/и с помощью формулы D.5). В ре- результате вместо D.3) получаем СГС: Е = --(8хВ), В=-($хВ); D.6) СИ: Е = -и($ х В), е0с2В = и(в х Э). Теперь можно исключить из этих уравнений индукцию В магнитного поля: СГС: (-) Е + 8х(8хБ) = 0; СИ: (-) е0Е + 8 х (8 х О) = 0. Раскрывая двойное векторное произведение и учитывая, что х2 = 1, получаем урав- уравнение, которому должны удовлетворять Е и Б в бегущей плоской волне: СГС: (-) Е + 8 (8 • О) - В = 0; СИ: (-) е0Е + «(в • О) - В = 0. D.7) Соотношения D.6) и D.7) получены на основе уравнений Максвелла без каких бы то ни было предположений о свойствах среды. Чтобы продвинуться дальше, необ- необходимы материальные уравнения, связывающие Ей Бв рассматриваемой среде. В анизотропной среде поляризованность Р, как уже отмечалось, в общем случае не совпадает по направлению с создающим ее электрическим, полем Е. Поэтому не сов- совпадают и направления Е и Б, т. е. в материальном уравнении, связывающем Е и Б в монохроматической волне, диэлектрическая проницаемость с (со) представляет со- собой тензор второго ранга: СГС: Я/= $^*!*(*>) ** (/,*=*, У, г); " D.8) СИ: О1 = ^2 Компоненты тензора диэлектрической проницаемости для той или иной модели среды могут быть рассчитаны на основе электронной теории дисперсии. В рамках фе- феноменологической теории (которая положена в основу дальнейшего рассмотрения) их можно считать параметрами, определяемыми на опыте.
4.2. Плоские волны в анизотропной среде 173 В различных системах координат х, у, г компоненты тензора е{к имеют разные значения. Специальным выбором системы координат соотношение D.8) можно упро- упростить, приведя тензор е!к к диагональному виду: СГС: йх=ехЕх, Оу СИ: Ох=е0ехЕх, Оу D.9) Если вектор Е направлен вдоль одной из этих осей, то вектор Б совпадает с ним по направлению. Соответствующие оси координат х9у,г называются главными ося- осями тензора, а величины ех, еу, ег — главными значениями тензора или главны- главными диэлектрическими проницаемостями. Несовпадение направлений векторов Е и В (рис. 4.7) обусловлено неравенством главных значений. Для оптически одноос- одноосной среды два главных значения диэлектрического тензора е1к совпадают (ех — еу). Оптические свойства одноосной среды полностью определяются двумя параметра- ми = ех = еу и ггн = сг, называемыми поперечной и про- продольной диэлектрическими проницаемостями. Когда вектор Е лежит в плоскости ху, т.е. перпендикулярен оси г (направ- ление которой параллельно оптической оси), вектор Б сов- совпадает с ним по направлению. Это значит, что в отношении оптических (и электрических) свойств одноосная среда обла- дает полной симметрией вращения относительно направления оптической оси, хотя в отношении других свойств (например, механических) симметрия оптически одноосной среды может быть более низкой. К оптически одноосным средам относятся все кристаллы тетрагональной, гексагональной и тригональной (ромбоэдри- ческой) систем; оптическая ось совпадает здесь с осью сим- в анизотропной среде метрии четвертого, шестого или третьего порядка соответ- соответственно. Изотропное твердое тело (например, стекло), под- подверженное однородной деформации растяжения или сжатия в одном направлении, либо жидкость из анизотропных молекул, помещенная в однородное электрическое поле, также представляет собой оптически одноосную среду. В кристаллах более низкой симметрии (триклинная, моноклинная, ромбическая системы) все три главных значения тензора е^ различны. Можно показать, что в этом случае существуют два направления (оптические оси), вдоль которых обе волны с ортогональными поляризациями распространяются с одной скоростью. В кристаллах кубической системы (таких, как каменная соль №С1, флюорит Сар2, алмаз С и т.д.) все три главных направления диэлектрического тензора физически эквивалентны, поэтому главные значения ех,еу и ег одинаковы. Это значит, что тензор е1к вырождается в скаляр (векторы Ей О всегда совпадают по направле- направлению) и кристаллы кубической системы в отношении оптических свойств ведут себя как изотропная среда. В отношении других свойств, выражаемых тензорами более высокого ранга (например, упругих), кубические кристаллы анизотропны. Оптичес- Оптическая анизотропия кубических кристаллов появляется только при учете очень сла- слабых эффектов пространственной дисперсии, описываемых тензором четвертого ранга (см. п. 2.9).
174 4. Свет в анизотропной среде в Перейдем к исследованию распространения света в оптически одноосных кристал- кристаллах. Если свет распространяется вдоль оптической оси, то при любой его поляриза- поляризации векторы Е и В лежат в плоскости ху и, как и в изотропной среде, совпадают по направлению, причем В = е^Е^ (СГС) или В = е^е^Е^ (СИ). Поэтому скорость волн, распространяющихся вдоль оптической оси, рав- равна с/у/ёГ[, а поляризация может быть любой (линей- (линейной, круговой, эллиптической). Ниже будет показано, что в любом другом направлении могут распростра- распространяться только линейно поляризованные волны с орто- ортогональными направлениями поляризации, причем ско- скорости этих двух волн различны. Из-за симметрии выбор направления осей коор- координат в плоскости ху произволен. Воспользуемся этим для упрощения уравнений. Пусть направление луча 8 (рис. 4.8) составляет некоторый угол в с оптической осью (осью г). Выберем ось у так, чтобы она лежа- т в плоскости образуемой оптической осью и лу- чом (ее называют плоскостью главного сечения). Тог- Тогда вектор 8 имеет следующие проекции: 8 = @, зт 0, Рис. 4.8. К вь1бору направления осей координат соз0). Скалярное произведение 8-0 в D.7) имеет вид (зт0)Оу + (соз0)Ог. Вы- Выпроекции В в D.7) с помощью материальных уравнений D.9), учитывая, разим что ег = су — с ,, ег = е.., и запишем D.7) в проекциях на оси координат х, у, V г =0, -) - ец зт20*1 Ег =0. D.10) Мы получили систему однородных уравнений для нахождения проекций векто- вектора Е плоской волны. Система имеет ненулевое решение только тогда, когда ее определитель равен нулю. Это условие и дает уравнение для нахождения лучевой скорости и@) при данном направлении луча. Определитель распадается на произ- произведение двух множителей, один из которых равен (с/иJ — е±. Отсюда сразу нахо- находим первый корень уравнения: и = с/у/(Г[ = с/по. Подставив его в коэффициенты системы D.10), получим, что у соответствующего этому корню решения проекции напряженности поля Еу и Ег тождественно равны нулю, а Ех может иметь любое значение. Таким образом, описываемая этим решением волна линейно поляризована вдоль оси х, т.е. перпендикулярно оптической оси (и плоскости главного сечения). Ее лучевая скорость и = с/по не зависит от угла 0, т.е. от направления распростране- распространения. Такую волну называют обыкновенной и относящиеся к ней величины снабжают индексом о. Приравнивая нулю второй множитель в определителе системы D.10), находим еще один корень: и(в) = / С D.11) €± СОЗ2 0 + С., 31П2 0
4.2. Плоские волны в анизотропной среде 175 Это значит, что вторая волна распространяется со скоростью и@), зависящей от на- направления волны (т.е. от угла в). Подставляя второй корень D.11) в коэффициенты системы уравнений D.10), получаем Ех = 0, Ег/Еу = —Щв. Таким образом, вторая волна поляризована в плоскости главного сечения, причем вектор Е перпендикуля- перпендикулярен 8 (см. рис. 4.8). Эту волну называют необыкновенной (индекс е). Наряду с глав- главными диэлектрическими проницаемостями с± и с,, для характеристики одноосных сред используют также параметры по — у/ёГ[ и пе = у/К, называемые соответствен- соответственно обыкновенным и необыкновенным показателями преломления. Других решений система D.10) не имеет, т.е. двумя найденными выше волнами с ортогональными линейными поляризациями, имеющими скорости ио = с/у/е~^ = с/по и ие(в) D.11), исчерпывается все многообразие нормальных*) волн, которые могут распространяться по заданному направлению в. Для нахождения хода лучей в одноосных кристаллах обычно выполняют гео- геометрические построения, в которых используют поверхности лучевых скоростей (лучевые, или волновые, поверхности). Для построения лучевой поверхности из произвольной точки О во всевозможных направлениях проводят лучи и откла- откладывают на них отрезки, пропорциональные соответствующим значениям лучевой скорости. Множество концов отложенных отрезков образует замкнутую поверх- поверхность, которая для обыкновенной волны, очевидно, представляет собой сферу радиу- радиусом ио = с/у/ёГ^, а для необыкновенной волны — эллипсоид вращения с полуосями с/у/ё~[ и с/у/К. Чтобы убедиться в этом, достаточно переписать соотношение D.11) в виде Так как исозв = мг, иьтв = иу, то ясно, что уравнение D.12) определяет эллип- эллипсоид вращения в пространстве скоростей, соприкасающийся со сферой для обык- обыкновенной волны в точках, соответствующих направлению оптической оси. Сечение лучевых поверхностей плос- плоскостью у г, проходящей че- через оптическую ось, показа- показано на рис. 4.9. При пе > по (кварц) вытянутый эллипсо- эллипсоид целиком лежит внутри сферы (см. рис. 4.9, а). Та- Такие кристаллы называют по- положительными. У отрица- отрицательных кристаллов пр < пп Гислянлский шттат^ и сАепа Рис. 4.9. Лучевые поверхности обыкновенной и необыкновенной (исландский шпат] и сфера волн в одноосных кристаллах лежит внутри сплющенного эллипсоида (см. рис. 4.9,6). Из этих рисунков видно, что при распространении вдоль оптической оси обе вол- волны имеют одинаковую скорость и = с/по, определяемую обыкновенным показателем * ) Напомним, что нормальными называют волны, состояние поляризации которых остается неизменным по мере распространения.
176 4. Свет в анизотропной среде преломления по. Для этого направления любая плоскость, содержащая оптическую ось, будет плоскостью главного сечения, поэтому возможны как любое направление линейной поляризации, так и в равной мере круговая или эллиптическая поляриза- поляризация. При распространении в перпендикулярном оптической оси направлении обык- обыкновенная волна имеет по-прежнему скорость ио = с/пО9 а необыкновенная, в которой вектор Е направлен вдоль оптической оси, — скорость ие = с/у/е7, = с/пе, опреде- определяемую необыкновенным показателем преломления. Для всех других направлений распространения векторы N и 8 не совпадают. В п. 4.3 лучевые поверхности будут использованы для исследования двойного лу- лучепреломления на границе оптически одноосной анизотропной среды. Контрольные вопросы • Дайте характеристику взаимного расположения векторов Е, Б, В, N и 8 для плоской волны в анизотропной среде. • Как связаны между собой лучевая и фазовая скорости? • Какому условию удовлетворяют главные диэлектрические проницаемости оптически одно- одноосного кристалла? Кристаллы каких систем (сингоний) оптически одноосны? • Как зависит от направления луча лучевая скорость обыкновенной и необыкновенной волн? Как эти волны поляризованы? • Кристаллы кубической системы оптически изотропны, т.е. скорость света в них по всем направлениям одинакова. Будет ли это утверждение справедливо и для звука, т. е. для ме- механических упругих волн? Задачи 1. Определите максимальный угол огтах между направлениями луча и волновой нормали для кристалла исландского шпата (по = 1,658, пе = 1,486). Решение. Угол а между N и 8, как видно из рис. 4.6, равен углу между Б и Е. В необык- необыкновенной волне эти векторы лежат в плоскости главного сечения. Пусть р — угол между Б и оптической осью кристалла, а у — между Е и той же осью. Спроецируем векторы ЭиЕ на направление оси и перпендикулярное ей направление и воспользуемся материальными уравнениями п± = €±Е±, О и = €»Еп: О 8111 р — е± Е 8111 у, О СО8/? = Сц Е СО8 у. Разделив почленно эти уравнения, находим \%р = (е±/еиI%у — (по/пеJ1%у. Интересую- Интересующий нас угол а — Р — у (см. рис. 4.7), поэтому \%у. Максимум а достигается при Х%у — пе/по = 0,896, т.е. при у = 41°52;, и равен
4.3. Преломление на границе анизотропной среды 177 4.3. Преломление на границе анизотропной среды. Построение Гюйгенса Полное количественное решение задачи о преломлении и отражении света на гра- границе анизотропной среды может быть получено на основе электромагнитной теории. Как и в случае границы изотропных сред, электромагнитное поле должно удовлетво- удовлетворять тем же граничным условиям: тангенциальные составляющие векторов Е и В по обе стороны границы должны совпадать в каждой ее точке в любой момент вре- времени. Метод решения задачи остается прежним: в первой среде наряду с заданной падающей монохроматической плоской волной рассматривается еще одна — отра- отраженная, а во второй среде — преломленная. Их волновые поверхности предполага- предполагаются бесконечными плоскостями (хотя на опыте, как правило, приходится иметь дело с узкоограниченными пучками). Отличие состоит в том, что для волн в анизотроп- анизотропной среде нужно учитывать зависимость фазовой скорости от направлений волновой нормали и поляризации. Эта зависимость может быть найдена с помощью уравнений Максвелла и материальных уравнений примерно так, как это было сделано в п. 4.2 для лучевой скорости в одноосных кристаллах. Электромагнитная теория позволяет найти как направления отраженной и пре- преломленных волн, так и их амплитуды. При этом не требуются никакие дополни- дополнительные допущения (как, например, принцип Гюйгенса — построение огибающей для вторичных волн). Однако в общем случае окончательные формулы оказываются чрезвычайно громоздкими. Поэтому ограничимся лишь иллюстрацией применения электромагнитной теории на наиболее простом примере. Пусть плоская волна падает из вакуума (или воздуха) на границу оптически од- одноосной анизотропной однородной среды, занимающей верхнее полупространство (рис. 4.10). Рассмотрим частный случай: оптическая ось параллельна границе ху и перпендикулярна плоскости падения хг (т.е. параллельна оси у). Падающую волну разложим на составляющие, поляризован- поляризованные в плоскости падения и в перпендику- перпендикулярном направлении. Граничные условия, как и для изотропной среды, выражаются уравнениями C.1). Чтобы эти условия вы- выполнялись сразу во всех точках границы, у всех трех экспонент зависимость от коор- координат х и у должна быть одинакова. Отсю- Отсюда, во-первых, следует, что у волновых век- векторов к 2 и к2 отраженной и преломленной волн равны нулю у -составляющие, т. е. нор- нормали к волновым поверхностям отражен- отраженной и преломленной волн лежат в плоско- плоскости падения. Во-вторых, из равенства дг-составляющих векторов к0, к1 и к2 следуют геометрические законы отражения и преломления, определяющие направления этих волн. Так как кОх = (со/с) зпкр, к^х = (со/с) $тф19 то ср^ = <р: угол отражения ср^ от анизотропной среды равен углу падения ср. Рис. 4.10. Преломление и отражение плоской волны на границе одноосной среды
178 4. Свет в анизотропной среде Что касается угла преломления ф2, то теперь он будет иметь разные значения для двух ортогональных поляризаций. В самом деле, при рассматриваемом направлении оптической оси (вдоль оси у) в волне, поляризованной в плоскости падения, век- вектор Е направлен перпендикулярно оптической оси. Скорость такой (обыкновенной) волны уо равна с/у/ё^_ = с/по, а модуль ее волнового вектора к2 = <о/уо = (а)/с)по. Из #2* =^0л:' учитывая* что ^2х =^28^П(^2 ' нах°Дим по$тф2 =31Пф. Если же волна линейно поляризована в направлении, перпендикулярном плоскости падения, то для рассматриваемого расположения вектор Е в ней направлен вдоль оптиче- оптической оси. Скорость этой (необыкновенной) волны уе равна с/у/е^ = с/пе, а модуль волнового вектора к2 = <о/ье = (а)/с)пе. Поэтому для нее угол преломления ф2 определяется из условия пе зт ф2 — зт ф. Так как здесь скорость необыкновенной волны одна и та же для любого ее направления в плоскости хг, то отношение сину- синусов угла падения и угла преломления постоянно и равно пе. Полученные выше выражения для ф2 и ф2 определяют направления волно- волновых нормалей преломленных волн. Для сравнения с опытом важно знать ход лучей, представляющих пути распространения световой энергии. Однако при выбранном расположении преломленные волны идут перпендикулярно оптической оси, когда лучи и волновые нормали совпадают. Таким образом, в этом частном случае пада- падающий из вакуума под углом ф луч создает два преломленных луча (обыкновенный и необыкновенный), углы преломления которых ф2 и ф2 (см. рис. 4.10) даются соотношениями по&тф2 = 81п<р, п€ &тф2 = $тф. D.13) 1 раничные условия позволяют найти не только направления отраженной и прелом- преломленных волн, но и их амплитуды. Действуя так же, как и в п. 3.2, в рассматриваемом случае мы придем к таким же формулам Френеля C.8)—C.11), лишь с той раз- разницей, что для поляризации, перпендикулярной плоскости падения, выражения для амплитуд отраженной и преломленной волн содержат пе в качестве показателя пре- (е) ломления второй среды и угол преломления ф2 ' из D.13) вместо ф^. Е^ __ СО8 ф - Пе СО8 ф$' _ 8П1((р - ф2 ) Е2 __ 2 СО8 ф 2 СО8 ф 8111 ф^ Е0 СО5ф + ПСО$ф2 8т(ф + ф>2 ) Е0 СО8ф + ЛСО8ф2 &т{ф + ф2 ') Составляющая падающей волны, поляризованная в плоскости падения, прелом- преломляется на иной угол Ф2\ и для нее амплитуды отраженной и преломленной волн выражаются соответствующими формулами Френеля C.9), C.11) с заменой п2 на по и ф2 на ф2\ Е\ По СО8 ф — СО8 ф2 \%{ф — ф2 ) По СО8 ф Л- СО8 ф{°] По СО8 ф + СО8 ф2 8т(ф + ф ) СО8(ф - ф')
4.3. Преломление на границе анизотропной среды 179 Мы видим, что в данном случае электромагнитная теория дает исчерпывающее описание отражения и преломления света на границе анизотропной среды. При ином расположении оптической оси относительно границы принципиальных затруднений не возникает, но вычисления оказываются громоздкими. В таких случаях возмож- возможно получить частичное решение задачи — определить направления преломленных волн в одноосном кристалле — с помощью изящного геометрического построения, впервые примененного Гюйгенсом для объяснения двойного лучепреломления в ис- исландском шпате. Напомним, как выполняется построение Гюйгенса в случае изотропной среды (рис. 4.11). Когда волновая поверхность падающей из вакуума плоской волны до- достигает точки О на границе изотропной среды, вторичные волны из всех прежних точек О', распространяющиеся со свой- свойственной им скоростью, имеют общую огибающую ОВ, которая и представляет собой поверхность равных фаз прелом- преломленной волны. Учитывая, что вторичная волна, распространяющаяся со скорое- ^^ и, . ^ ^, , тью у = с/п, проходит расстояние О1 В ^^' ^^' за то время, что падающая волна — расстояние АО, из треугольников ОО1 А и О О1 В получаем закон преломления: При обобщении построений Гюйгенса на случай анизотропной одноосной среды ^и^гХГДХГ^Го?сД для вторичных волн нужно использовать найденные в п. 4.2 поверхности лучевых скоростей. Касательная к ним плоскость дает положение фронта (т.е. поверхности равных фаз) преломленной волны, а прямая, проведенная из центра вторичной волны в точку касания, — направление преломленного луча. Так как лучевая поверхность состоит из сферы и эллипсоида, то построение Гюйгенса дает два луча: обыкно- обыкновенный, направление которого совпадает с нормалью к фронту, как и в изотропной среде, и необыкновенный, направление которого в общем случае отклоняется от нор- нормали к фронту необыкновенной волны. Для строгого обоснования построений Гюй- Гюйгенса (которое здесь не приводится) требуется показать, что распространение света от точечного источника по некоторому направлению в анизотропной среде происхо- происходит так же, как и распространение рассмотренных в п. 4.2 плоских волн, скорости которых по разным направлениям характеризуются лучевыми поверхностями. Для иллюстрации построений Гюйгенса рассмотрим несколько сравнительно простых частных случаев. А. Оптическая ось параллельна границе. Плоскость падения перпендикуляр- перпендикулярна оптической оси (рис. 4.12, а). Сечения лучевых поверхностей обыкновенной и необыкновенной волн представляют собой окружности. Поэтому направления лу- лучей и волновых нормалей совпадают как у обыкновенной, так и у необыкновенной волн. Вектор Е в обыкновенной волне ориентирован перпендикулярно оптической оси, в необыкновенной — параллельно оси. При по > пе (отрицательный кристалл)
180 4. Свет в анизотропной среде обыкновенный луч преломляется сильнее, чем необыкновенный: зш ф^ = $т ф/по, зтф^ = зтф/ле. Этот случай был рассмотрен выше на основе электромагнитной теории. Б. Оптическая ось параллельна границе. Плоскость падения проходит че- через оптическую ось (рис. 4.12,6). Сечения лучевых поверхностей плоскостью па- падения — окружность и эллипс. Направление преломленного луча задается прямой, проведенной из центра лучевой поверхности в точку ее касания с огибающей (т. е. с фронтом волны). Оба преломленных луча лежат в плоскости падения. При по > пе необыкновенный луч преломляется сильнее, чем обыкновенный, хотя направление волновой нормали для него (в данном случае не совпадающее с лучом) изменяется при преломлении меньше, чем для обыкновенного луча. Если свет падает по норма- нормали (ф = 0), то обе волны распространяются в прежнем направлении, но с разными скоростями. Таким образом, при ф = 0 случаи А и Б соответствуют рассмотренной выше кристаллической пластинке (в частности, четвертьволновой). Рис. 4.12. Построение обыкновенного и необыкновенного лучей в одноосном кристалле при разных расположениях оптической оси (точками и стрелками показаны направления колебаний вектора Е) В. Оптическая ось перпендикулярна границе (рис. 4.12, в). Оба преломленных луча лежат в плоскости падения. При п0 > пе обыкновенный луч преломляет- преломляется сильнее, чем необыкновенный. Если для обыкновенного луча зш ф/ §т ф^ = = п0 = сопз*, то для необыкновенного знкр/ зикр^ зависит от угла падения. При
4.4. Поляризационные призмы и поляроиды 181 нормальном падении обе волны распространяются в прежнем направлении (вдоль оси) с одинаковой скоростью, т. е. нет двойного лучепреломления. Состояние поля- поляризации волны в кристалле будет таким же, как у падающей волны. Г. Оптическая ось образует произвольный угол с преломляющей гранью крис- кристалла. Свет падает по нормали (рис. 4.12, г). Волновые поверхности обыкновен- обыкновенной и необыкновенной волн (т.е. касательные к сферам и эллипсоидам) представ- представляют собой плоскости, параллельные границе. Из расположения точек касания этих плоскостей с эллипсоидальными лучевыми поверхностями ясно, что необыкновен- необыкновенные лучи при нормальном падении отклоняются от первоначального направления. Этим объясняется двойное лучепреломление при нормальном падении света на есте- естественную грань кристалла. При наклонном падении света преломление становится еще сложнее. Если опти- оптическая ось не лежит в плоскости падения, то по положению точек касания огибающей плоскости с эллипсоидами вторичных волн можно установить, что необыкновенный луч при преломлении выходит из плоскости падения. Из рассмотренных примеров видно, что построение Гюйгенса дает наглядную картину двойного лучепреломления и позволяет сравнительно просто найти направ- направление отраженной, обыкновенной и необыкновенной преломленных волн. Однако такое построение оставляет открытым вопрос об их амплитудах. Контрольные вопросы • Каким условиям должны удовлетворять векторы Е и В на границе анизотропной среды? • Как электромагнитная теория объясняет появление двух преломленных волн при падении плоской волны на поверхность одноосного кристалла? • Используя построение преломленных лучей по Гюйгенсу, выясните, при какой ориентации оптической оси преломление необыкновенной волны на поверхности одноосного кристалла описывается обычным законом, т. е. зт ф/ зт ф2 = сопзЬ • При каких условиях преломленный луч остается в плоскости падения и при каких выходит из нее? 4.4. Поляризационные призмы и поляроиды Особенности преломления света на границе анизотропной среды можно использо- использовать для получения поляризованного света. Вместо отдельного кристалла для этой цели более удобными оказываются их комбинации, называемые поляризационны- поляризационными призмами. Наиболее подходящий материал для их изготовления — исландский шпат, у которого сравнительно велико различие между обыкновенным и необыкно- необыкновенным показателями преломления (по = 1,658; пе = 1,486), реже применяют кварц К = 1,544; пе = 1,553). Первая поляризационная призма была изобретена Николем в 1828 г. Она из- изготовляется из полученного раскалыванием по плоскостям спайности куска ис- исландского шпата, длина которого примерно в 3,5 раза больше толщины. Торцо- Торцовые основания АВ и СО (рис. 4.13, а) сошлифовывают под углом 68° к его длин- длинным ребрам (вместо 71° у естественного кристалла). Затем кристалл разрезается
182 4. Свет в анизотропной среде ли по плоскости, перпендикулярной торцовым поверхностям (рис. 4.13, б), и отшли- отшлифованные половинки склеиваются в прежнем положении канадским бальзамом, образующим между ними тонкий прозрачный слой с показателем преломления п = 1,549, имеющим проме- промежуточное значение между по и пе. Для обыкновенного луча канадский бальзам представ- представляет собой оптически менее плотную среду, для необык- необыкновенного — более плотную. Рис. 4.13. Ход лучей в призме Николя (а) и вид призмы Поэтому обыкновенный луч со стороны торцовой плоскости (б) может преодолеть слой баль. зама только тогда, когда его угол падения на плоскость разреза меньше предельного угла полного отражения фт (см. п. 3.3), определяемого условием зтфт = п/по = 1,549/1,658. В данном слу- случае фт « 69° и обыкновенные лучи, идущие параллельно длинным ребрам призмы (и под небольшими углами к ним), устраняются за счет полного отражения. Необык- Необыкновенный луч, поляризованный в плоскости главного сечения, частично проходит через слой канадского бальзама, так как для него полное отражение исключено. В результате выходящий из призмы Николя параллельно своему направлению входа луч оказывается полностью поляризованным. Полное отражение обыкновенного луча происходит лишь тогда, когда углы паде- падения света на входную грань призмы лежат в определенных пределах. Угол между крайними лучами падающего пучка B9°), удовлетворяющими этому условию, опре- определяет апертуру полной поляризации призмы. Существует много модификаций призмы Николя. Для работы в ультрафиолетовой области спектра канадский бальзам непригоден из-за сильного поглощения, поэтому используют призму Фуко с тонкой воздушной прослойкой. Полное отражение обык- обыкновенного луча в плоскости разреза происходит при меньших углах, и призма Фуко получается значительно короче призмы Николя, но апертура ее полной поляризации составляет всего 8°. Иногда необходимо из падающего света получать сразу два луча, поляризованных в перпендикулярных направлениях. Служащие для этой цели поляризационные приз- призмы называются двухлучевыми. Из них наибольшим совершенством отличается приз- призма Волластона (рис. 4.14). Две прямоугольные призмы склеены по гипотенузам так, что их оптические оси (по- (показанные на рисунке линиями и точками) взаимно пер- перпендикулярны. Обыкновенный и необыкновенный лучи, возникающие в первой призме при падении света по нормали к входной грани АС, идут по одному (прежне- (прежнему) направлению, но с разными скоростями: уо = с/по и уе = с/пе. Необыкновенный луч, в котором колеба- колебания вектора Е происходят в плоскости чертежа, при пе- переходе во вторую призму будет распространяться как обыкновенный, так как колебания в нем перпендикуляр- Рис 4и Ход лучеЙ в призме ны оптической оси второй призмы. Его преломление на Волластона
4.4. Поляризационные призмы и поляроиды 183 границе призм АВ происходит, как при переходе между изотропными средами с по- показателями преломления пх = пе и п2 = по. И наоборот, у обыкновенного луча пер- первой призмы после перехода его во вторую призму колебания окажутся направлен- направленными вдоль оси; преломление на границе соответствует случаю п{ = по и п2 = пе. При по > пе (исландский шпат) первый луч отклонится в сторону ребра О, второй — в противоположную сторону. Этим обеспечивается угловое разведение выходящих из призмы пучков света, линейно поляризованных во взаимно перпендикулярных направлениях (см. задачу 1). Кроме описанных выше поляризационных призм широкое распространение для получения поляризованного света нашли устройства, действие которых основано на явлении дихроизма, заключающемся в зависимости поглощения света в некоторых средах от направления колебаний. Сильным дихроизмом обладают кристаллы турма- турмалина, в которых обыкновенный луч поглощается значительно больше необыкновен- необыкновенного. При достаточной толщине пластинки турмалина (« 1 мм) выходящий из нее свет будет практически полностью поляризован. Но для некоторых участков спек- спектра необыкновенный луч тоже испытывает заметное поглощение, что ограничивает применение турмалина в качестве поляризатора. Очень удобны в обращении поляризационные устройства из синтетических дихроич- ных материалов, известные в обиходе как поляроиды. Поляроид представляет собой пленку целлулоида или другого прозрачного для видимого света материала, в ко- которую вкраплены определенным образом ориентированные микроскопические кри- кристаллики сильно дихроичного вещества, обычно герапатита или других родствен- родственных ему соединений. Таким способом получают листы большой площади, обеспечи- обеспечивающие высокую степень поляризации проходящего света при больших апертурах практически во всей видимой области спектра и имеющие сравнительно небольшую стоимость. Недостатки поляроидов связаны со спектральной селективностью погло- поглощения герапатита, из-за чего фиолетовая часть спектра оказывается поляризованной лишь частично, а пленка получается неодинаково прозрачной для лучей разного цвета Контрольные вопросы • Какое явление использовано в призме Николя для удаления одного из лучей? • Каково направление напряженности электрического поля в выходящем из призмы Николя луче (по отношению к ее ребрам)? • Почему на диагональной плоскости призмы Волластона происходит расщепление падаю- падающего луча? Задачи 1. Призма Волластона (см. рис. 4.14) из исландского шпата (по = 1,658; пе = 1,486) имеет преломляющий угол а = 15°. На какой угол 0 будут разведены выходящие из призмы лучи, поляризованные в ортогональных направлениях? Ответ, в « 2(п0 - пе) 1%а = 5°17'.
184 4. Свет в анизотропной среде 4.5. Искусственная анизотропия. Эффект Керра Многие оптически изотропные тела состоят из анизотропных молекул или дру- других структурных элементов, хаотически ориентированных в пространстве. Микроско- Микроскопическая анизотропия сглаживается лишь статистически. В результате какого-либо внешнего воздействия (механической деформации, электрического или магнитного поля), создающего физически выделенное направление в пространстве, такая среда может стать и макроскопически анизотропной. При достаточно сильном воздействии даже первоначально изотропные структурные элементы могут стать анизотропны- анизотропными; например, кубический кристалл каменной соли ЫаС1 при одностороннем сжатии становится оптически анизотропным. Двойное лучепреломление при механической деформации (фотоупругость) было открыто Брюстером в 1815 г. При одностороннем растяжении или сжатии направле- направление деформации становится выделенным и играет роль оптической оси. Для наблю- наблюдения оптической анизотропии исследуемое тело помещают между скрещенными или параллельными поляризаторами, направления пропускания которых составляют некоторый угол (лучше всего 45°) с направлением деформации. Распространяющи- Распространяющиеся перпендикулярно оптической оси обыкновенный и необыкновенный лучи при- приобретают некоторую разность фаз, и свет, прошедший через деформированное тело, становится эллиптически поляризованным. Опыт показывает, что измеряемая в таких опытах разность по — пе, которую можно рассматривать как меру возникшей анизо- анизотропии, пропорциональна механическому напряжению, приложенному к деформиру- деформируемому телу. В случае неоднородно деформированного тела таким методом можно получить картину распределения напряжений. Этим пользуются для исследования напряжений в сложных деталях и промышленных конструкциях: модель из подхо- подходящего прозрачного материала подвергают требуемой нагрузке и по наблюдаемой между скрещенными поляроидами картине с помощью числовых расчетов определя- определяют внутренние напряжения. Этот метод значительно облегчает трудоемкую работу по расчету новых конструкций. Оптический метод применяется также для исследования остаточных механиче- механических напряжений в оптическом стекле, возникающих при недостаточно медленном охлаждении после термической обработки. Разность по — пе зависит от длины волны (дисперсия искусственного двойного лучепреломления), и при наблюдении в белом свете картина неоднородно деформированного тела между скрещенными поляроида- поляроидами оказывается разноцветной. Искусственная анизотропия в жидкостях с сильно анизотропными элементами (например, в растворах полимеров) может возникнуть под влиянием даже очень слабых внешних динамических воздействий. Измерение двойного лучепреломления в ламинарном потоке между неподвижным и вращающимся коаксиальными цилин- цилиндрами, обусловленного ориентацией анизотропных молекул, используется для изуче- изучения свойств полимеров. Возникновение оптической анизотропии во внешнем электрическом поле было об- обнаружено Керром в 1875 г. Эффект Керра можно наблюдать в жидкостях и газах, где условия для теоретической интерпретации несравненно проще, чем в твердых те- телах. Благодаря этому обстоятельству теория эффекта Керра разработана значительно
4.5. Искусственная анизотропия. Эффект Керра 185 глубже, чем теория рассмотренного выше явления анизотропии при механических деформациях, трактовка которого требует исследования действия на молекулы среды межмолекулярных электрических полей, имеющих сложную структуру, в отличие от однородного внешнего поля в эффекте Керра. Большое научное значение эффекта Керра связано с тем, что он позволяет глубже проникнуть в природу анизотропии вообще и, кроме того, получить информацию о строении молекул. Вместе с тем эффект Керра имеет чрезвычайно важное прикладное значение в научных исследо- исследованиях и в технике, обусловленное его способностью протекать практически безы- безынерционно. Быстродействие керровских модуляторов света и оптических затворов может быть доведено до 10~2с. Схема наблюдения эффекта Керра приведена на рис. 4.15. Заполненный ис- исследуемым веществом конденсатор помещают между скрещенными поляризато- поляризаторами Р1 и Р2, так что при отсутствии электрического поля свет через сис- систему не проходит. При наложении электрического поля (направление Е кото- которого составляет угол 45° с направлениями пропускания поляризаторов) среда становится оптически анизо- анизотропной; выходящий из кон- конденсатора свет поляризован эллиптически и частично про- р ходит через анализатор Р2- /\ / Вводя компенсатор С, можно / \/ измерить разность фаз, воз- возникшую между обыкновен- обыкновенным и необыкновенным лу- луРис. 4.15. Двойное лучепреломление в электрическом поле чами, и тем самым найти разность показателей прелом- преломления пе — по исследуемого вещества в электрическом поле. Опыт показывает, что эта разность пропорциональна квадрату напряженности внешнего электрического поля: пе —по = КЕ2. Такой харак- характер зависимости от напряженности поля объясняется тем, что для изотропной (при отсутствии поля) среды величина пе — по не может зависеть от направления Е, по- поэтому разложение пе — по в ряд по степеням напряженности поля должно начинаться с квадратичного члена. В слабых полях, какие применяются на опыте, в разложении достаточно ограничиться только этим членом. Для разности фаз, приобретаемой лучами на пути /, можно написать ср = Bл1/Х)(пе - по) = 2лВ1Е2, где В — К/Л — постоянная Керра, характеризующая исследуемое вещество. Ее зна- значения для разных веществ изменяются в широких пределах. Большим значением В обладает нитробензол, поэтому он часто используется в технических приложени- приложениях эффекта Керра. Если, например, конденсатор имеет длину / = 5 см и расстояние между пластинами А = 1 мм, то при напряжении 1500 В разность фаз достигает зна- значения ср — л/2, т.е. ячейка Керра в таких условиях действует как пластинка в чет- четверть волны. У других жидкостей и особенно у газов постоянная Керра значительно меньше, что требует использования высоких напряжений и чувствительных методов измерения разности фаз.
186 4. Свет в анизотропной среде Для большинства веществ постоянная Керра положительна, т.е. пе > по, что со- соответствует анизотропии положительного одноосного кристалла. Реже встречаются вещества, у которых В < 0 (диэтиловый эфир, этиловый спирт). Причина оптической анизотропии вещества в электрическом поле заключается в анизотропии самих молекул. Количественная теория для газов была развита Ланже- веном в 1910 г. Поляризуемость анизотропной молекулы и, следовательно, ее вклад в показатель преломления среды зависят от ориентации молекулы относительно направления напряженности электрического поля световой волны. При отсутствии внешнего электрического поля анизотропные молекулы ориентированы хаотически, так что среда макроскопически оказывается изотропной. Во внешнем электрическом поле молекулы преимущественно ориентируются своими осями наибольшей поляри- поляризуемости вдоль поля*), и среда становится оптически анизотропной: световой волне с направлением колебаний вдоль внешнего поля (необыкновенной) соответствует большее значение показателя преломления, чем волне, поляризованной в попереч- поперечном направлении (пе > по). Величины пе и п0 можно, используя статистическую механику, выразить через главные значения поляризуемости отдельной молекулы. Теория Ланжевена всегда дает пе > по, т.о. В > 0, хотя на опыте для некоторых ве- веществ получается В < 0. Борн в 1916 г. обобщил теорию Ланжевена, распространив ее на полярные молекулы, обладающие собственным дипольным моментом, направ- направление которого может не совпадать с направлением наибольшей поляризуемости. Ес- Если эти направления взаимно перпендикулярны, то оси наибольшей поляризуемости молекул преимущественно ориентируются перпендикулярно внешнему полю и опти- оптическая анизотропия среды соответствует отрицательному кристаллу (по > пе). Двойное лучепреломление в изотропной среде может возникнуть не только в посто- постоянном внешнем электрическом поле, но и в переменном с частотами вплоть до опти- оптических. Благодаря развитию лазерной техники появилась возможность получать оп- оптическое излучение, в котором напряжен- ^ . ность электрического поля достигает очень у « I | больших значений. Схема опыта по наблю- ч^ дению эффекта Керра, вызванного электри- \ ческим полем лазерного излучения, пока- ^ 2 зана на рис. 4.16. Луч зондирующего света (Я « 500 нм) проходит через ячейку К с ис- ФЭУ следуемой жидкостью и после отражения от полупрозрачной пластинки 5 направля- Рис. 4.16. Двойное лучепреломление ется на фотоумножитель (ФЭУ). При скре- в электрическом поле лазерного излучения щенных поляризаторах Р] и ?1 свет не мо_ жет попасть в ФЭУ Когда через ячейку проходит мощный импульс инфракрасного поляризованного излучения лазера Ь, жид- жидкость становится анизотропной, зондирующий свет выходит из ячейки эллиптически поляризованным и попадает в ФЭУ. Измеряя разность фаз <р между необыкновенным *} Индуцируемый внешним полем дипольный момент анизотропной молекулы не совпадает с направ- направлением напряженности поля. Поэтому и возникает момент сил, который стремится повернуть молекулу осью вдоль поля.
4.5. Искусственная анизотропия. Эффект Керра 187 и обыкновенным лучами и зная среднеквадратичную напряженность поля лазерного излучения (Е2I/2, можно найти значение постоянной Керра в поле оптической час- частоты и сравнить его со значением в постоянном электрическом поле. В недипольных жидкостях эти значения практически совпадают. Однако в жидкостях с дипольными молекулами постоянная Керра уменьшается при переходе к оптическим частотам (у нитробензола приблизительно в 100 раз), так как дипольная молекула не успевает переориентироваться в такт с изменениями напряженности внешнего поля. В высокочастотных полях постоянные дипольные моменты молекул не играют роли в воз- возникновении анизотропии. В отличие от вектора дипольного момента, имеющего определенное направление, оба направления оси наибольшей поляризуемости молекулы эквивалентны и на- направление действующего на молекулу момента сил не меняется при переключении направ- направления внешнего поля на противоположное. Поэтому ориентация молекул в высокочастотных полях обусловлена только индуцированными дипольными моментами, как это предполагается в теории Ланжевена. Ъольшое прикладное значение эффекта Керра обусловлено его малой инерцион- инерционностью. Для измерения времени установления в эффекте Керра используют мощ- мощные и короткие (до 10~12 с) импульсы инфракрасного лазера. Схема опыта показана на рис. 4.17. Импульс инфракрасного света (А=1,06мкм) проходит через кри- кристалл дигидрофосфата калия (КОР), где из-за нелинейного эффекта удвоения час- частоты (см. п. 10.3) неболь- неболь^ КОР ^ 1,06 мкм П ^ О,53мкм 8 N. ^ фэу Рис*4Л7в Схема опыта для измеРения времени релаксации искусственной анизотропии в электрическом поле шая часть инфракрасного света превращается в зе- зеленый (Я = 0,53 мкм). Зер- Зеркало 5! пропускает ин- инфракрасный свет и отра- отражает зеленый, зеркало 52, наоборот, пропускает зе- зеленый и отражает инфра- инфракрасный. Пройдя по раз- разным путям, зеленый и ин- инфракрасный лучи затем снова соединяются и проходят через ячейку Керра, поме- помещенную между скрещенными поляризаторами Р^ и Р2. Фильтр Г задерживает ин- инфракрасный свет и пропускает в ФЭУ только зеленый. С помощью стеклянных пла- пластинок Т разной толщины можно задержать импульс зеленого света относительно инфракрасного на разные промежутки времени г. Опыт показывает, что релаксация анизотропии, созданной в жидкости инфракрасным импульсом, происходит экспо- экспоненциально по закону ехр(—г/г0) с некоторой постоянной времени г0. В сероуглеро- де г0 ~ 2 • 10~12 с, в нитробензоле г0 ~ 5 • 101 с. Ячейка Керра, т.е. кювета с жидкостью, помещенная между скрещенными поля- поляризаторами, может работать в качестве быстродействующего оптического затво- затвора, управляемого кратковременными импульсами электрического поля. Если вместо электрического импульса использовать короткий мощный лазерный импульс, то вре- время экспозиции можно довести до 10~12с. Керровский модулятор света, питаемый электрическим полем высокой частоты, позволяет осуществить до 109 прерываний в секунду. Модуляторы и затворы на эффекте Керра применяются, в частности, для
188 4. Свет в анизотропной среде управления режимом работы лазеров в целях получения сверхкоротких импульсов огромной мощности. Такие «гигантские» импульсы необходимы для исследований в бурно развивающейся нелинейной оптике. 11юли анизотропные молекулы среды обладают постоянными магнитными момен- моментами, то их преимущественная ориентация может быть создана постоянным маг- магнитным полем. Поэтому в достаточно сильных магнитных полях среда становится анизотропной и в ней может наблюдаться двойное лучепреломление. В этом состоит эффект Коттона—Мутона, открытый в 1905 г. Изменение оптических характеристик кристалла под действием внешнего элек- электрического поля называется электрооптическим эффектом Поккельса. В одно- одноосном кристалле распространение света вдоль оптической оси происходит с одной и той же фазовой скоростью ьо = с/по независимо от направления его поляриза- поляризации. Если кристалл не обладает центром симметрии, то при приложении внешне- внешнего электрического поля вдоль этой оси фазовые скорости волн с ортогональными направлениями поляризации становятся различными. В отличие от эффекта Керра, квадратичного по напряженности внешнего электрического поля, в электрооптиче- электрооптическом эффекте разность фазовых скоростей таких волн пропорциональна напряжен- напряженности поля (линейный эффект Поккельса). Безынерционность эффекта Поккельса позволяет широко использовать его для создания быстродействующих оптических затворов и высокочастотных модуляторов света. Вырезанная перпендикулярно опти- оптической оси пластинка кристалла КХ)Р (дигидрофосфата калия) помещается между скрещенными поляризаторами. Интенсивность света, пропускаемого такой ячейкой Поккельса, зависит от приложенного напряжения V по закону / ^ зт [л11 /B11^ /2)], где 1]^ ,2 — напряжение внешнего поля, при котором сдвиг фаз волн с ортогональ- ортогональными поляризациями равен л (для КХ)Р 1^/2 ~ 8 кВ). Контрольные вопросы • Какие практические применения имеет явление возникновения оптической анизотропии при механических деформациях? • Почему величина пе — по, т.е. мера анизотропии жидкости в электрическом поле, пропор- пропорциональна квадрату напряженности поля? • Какова физическая причина вызываемой внешним электрическим полем оптической анизо- анизотропии? • Почему в жидкостях с дипольными молекулами при переходе к высоким частотам внешнего электрического поля постоянная Керра уменьшается? • Какие практические применения находит эффект Керра?
Интерференция света Волновые свойства света наиболее отчетливо обнаруживают се- себя в интерференции и дифракции. Эти явления характерны для волн любой природы и сравнительно просто наблюдаются на опыте для волн на поверхности воды или для звуковых волн. На- Наблюдать же интерференцию и дифракцию световых волн можно лишь при определенных условиях. Под интерференцией света обычно понимают широкий круг явлений, в которых при наложении пучков света результирую- результирующая интенсивность не равна сумме интенсивностей отдельных пучков: в одних местах она больше, в других — меньше, т.е. возникают чередующиеся светлые и темные участки — интер- интерференционные полосы. Свет, испускаемый обычными (нелазерными) источниками, не бывает строго монохроматическим. Поэтому для наблюде- наблюдения интерференции свет от одного источника нужно разделить на два пучка и затем наложить их друг на друга. Существу- Существующие экспериментальные методы получения когерентных пуч- пучков из одного светового пучка можно разделить на два класса. В методе деления волнового фронта пучок пропускается, на- например, через два близко расположенных отверстия в непро- непрозрачном экране. Такой метод пригоден лишь при достаточно малых размерах источника. В другом методе пучок делится на одной или нескольких частично отражающих, частично пропус- пропускающих поверхностях. Этот метод деления амплитуды может применяться и при протяженных источниках. Он обеспечивает большую интенсивность и лежит в основе действия разнообраз- разнообразных интерферометров. В зависимости от числа интерферирую- интерферирующих пучков различают двухлучевые и многолучевые интерферо- интерферометры. Они имеют важные практические применения в технике, метрологии и спектроскопии.
190 5. Интерференция света 5.1. Интерференция монохроматического света Цветовые колебания в некоторой точке, через которую проходит строго монохро- монохроматическая волна, должны продолжаться бесконечно долго и иметь неизменную ча- частоту и амплитуду. Свет, излучаемый любым реальным источником, этим свойством не обладает. Тем не менее монохроматическая идеализация оказывается достаточной для решения многих задач. В частности, при изучении явлений интерференции она пригодна для определения пространственного положения максимумов и минимумов интерференционной картины. Пусть в некоторую точку приходят волны, напряженности электрического поля которых равны Е1 и Е2. По принципу суперпозиции*) напряженность результиру- результирующего поля равна их векторной сумме: Е = Е^ + Е2. В результате сложения двух гармонических колебаний одинаковой частоты получается колебание той же часто- частоты, неизменная во времени амплитуда которого зависит от соотношения фаз скла- складываемых колебаний и поэтому в разных точках наблюдения имеет, вообще говоря, разные значения. Из-за очень большой частоты оптических колебаний напряженность Е невозмож- невозможно измерить непосредственно. Все приемники излучения измеряют энергетические величины (интенсивность света или освещенность поверхности), усредненные за про- промежуток времени, очень большой по сравнению с периодом оптических колебаний. Поэтому экспериментально наблюдаемые величины пропорциональны среднему по времени значению квадрата напряженности электрического поля (Е2), причем время усреднения определяется инерционностью приемника излучения: (Е2) = <(Е, + Е2J) = (Е2) + (Е2) + 2(Е,Е2). E.1) Выражение для результирующей интенсивности помимо суммы интенсивностей каж- каждой из волн содержит еще одно слагаемое, пропорциональное 2(Е1Е2), называемое интерференционным членом. В тех случаях, когда он обращается в нуль, результи- результирующая интенсивность равна сумме интенсивностей и интерференция отсутствует. Скалярное произведение Е^ равно нулю, если складываемые волны линейно поля- поляризованы в ортогональных направлениях. Отсутствие интерференции лучей, поляри- поляризованных во взаимно перпендикулярных направлениях, было обнаружено Френелем и Араго в 1816 г. и интерпретировано в 1817 г. Юнгом как доказательство попереч- ности световых волн. Электромагнитная теория света полностью подтвердила это заключение. В дальнейшем будем считать, что оба вектора Е] и Е2 в точке наблюдения совер- совершают колебания вдоль одной прямой. Тогда можно отвлечься от векторного харак- характера этих величин и записать интерференционный член в виде 2{ЕхЕп). Рассмотрим сначала случай, когда в точке наблюдения, положение которой задается радиусом- вектором г, налагаются две плоские монохроматические волны одинаковой часто- *} При распространении в веществе очень интенсивных световых волн, напряженность поля в которых сравнима с напряженностью внутриатомных электрических полей (сфокусированное лазерное излучение), принцип суперпозиции нарушается, что приводит к разнообразным явлениям нелинейного взаимодействия волн, изучаемым нелинейной оптикой (см. гл. 10).
5.1. Интерференция монохроматического света 191 ты со, характеризуемые волновыми векторами к1 и к2: Ех = ах со${кхг - ш + 8Х) — ах со$(-ш + фх), Е2 = а2 соз(к2г — ш + 82) — а2 С08(~ E.2) Здесь введены обозначения срх = кхг + 8х и ср2 = к2г + 52. При сложении двух гармонических колебаний одинаковой частоты получается гар- гармоническое колебание той же частоты Е = а со$(—ш 4- <р). Его амплитуду а проще всего найти с помощью векторной диаграммы, изображенной на рис. 5.1: а = а\ + К = кл - 2а!а2со8(<р2 — срх) = а^ + а2 :-*1). E.3) Вводя интенсивности волн, пропорциональные квадратам их амплитуд, для интен- интенсивности результирующего колебания получаем Х12 С08(Кг - 8Х). E.4) Интенсивность зависит от положения точки наблюдения, характеризуемого радиусом-вектором г. Поверхности равных интенсивностей определяются урав- уравнением Кг = соп81 и представляют собой плоскости, перпендикулярные вектору О Рис. 5.1. Сложение гармонических коле- баний с помощью векторной диаграммы Рис. 5.2. Плоскости равных интенсивностей и освещенность экрана при интерференции плоских монохроматических волн К = к2 — кх (рис. 5.2). Интенсивность максимальна там, где косинус в E.4) прини- принимает значение -И, и минимальна при —1. Расстояние Ах между соседними плос- плоскостями максимальной (или минимальной) интенсивности определяется условием КАх = 2л. Модули волновых векторов к1 и к2 одинаковы и равны к = Ъг/А, поэтому К = 2к 8т(а/2) (см. рис. 5.2), где а — угол между кх и к2, т.е. между направлениями интерферирующих волн. Таким образом, _2я_ л Т ~ к8т(а/2) ~ 28ш(а/2) ^ а' E.5) Последнее приближенное выражение справедливо, когда волны распространяют- распространяются под малым углом друг к другу (а <С 1). Если на пути волн поместить плоский
192 5. Интерференция света экран, то плоскости равной интенсивности пересекут его по параллельным прямым, т.е. на экране будут наблюдаться чередующиеся светлые и темные интерференци- интерференционные полосы. Когда плоскость экрана перпендикулярна биссектрисе угла между направлениями волн, ширина интерференционной полосы равна величине Ах « А/а, определяемой соотношением E.5). Зависимость освещенности экрана от координаты х (см. рис. 5.2) дается выраже- выражением 1{х)=1х+12 Ах/ E.6) (начало отсчета на оси х выбрано в одном из максимумов). В частном случае интер- интерференции волн одинаковой интенсивности /| — /2 формула E.6) принимает вид = 4/1 СО8' г), Ах/ E.7) 11И111 а освещенность экрана изменяется от минимального значения, равного нулю, до максимального, равного учетверенному значению освещенности, создаваемой одной волной. График распреде- распределения интенсивности, опи- описываемого формулой E.7), приведен на рис. 5.3 вме- вместе с фотографией интер- интерференционных полос. Если экран наклонить на угол /3, то ширина полосы увели- увеличится и станет равной Дх/соз/З. Отметим, что полосы можно наблюдать при расположении экрана в любом месте, где пере- перекрываются волны. х/Ах Рис. 5.3. Интерференционные полосы и график распределения интенсивности при интерференции двух монохроматических плоских волн одинаковой интенсивности х ассмотрим теперь случай интерференции волн от двух одинаковых синфазных мо- монохроматических точечных источников ^ и52 (рис. 5.4), находящихся на расстоя- расстоянии д, друг от друга. Если расстояние / до экрана, где наблюдаются интерференци- интерференционные полосы, много больше расстояния между источниками (/ > Л), то амплитуды обеих волн в точке наблюдения практически одинаковы и для напряженности поля в точке Р можно написать кгх - ш) + Еосо8(Ат2 - ш) = 2Е0 соз\к 2 1 ] Г** 1 Е = Ео соз где гх и г2 — расстояния от источников до точки наблюдения Р (см. рис. 5.4). Вели- Величину Л = г 2 — г! называют разностью хода интерферирующих волн. Интенсивность результирующего колебания пропорциональна квадрату амплитуды, поэтому E.8) ^) =2/0A+со8*Д), где /0 — интенсивность колебаний от одного источника.
5.1. Интерференция монохроматического света 193 Освещенность экрана в минимумах равна нулю, а в максимумах — учетверенно- учетверенному значению освещенности, создаваемой одним источником. Положение максимумов определяется условием к А = ±2лт, где целое число т = 0, 1, 2,... называется по- порядком интерференции. Учитывая, что к = 2я/А, условие максимумов можно запи- записать в виде А = тХ — разность хода равна целому числу длин волн. В том случае, когда волны от ис- источников распространяются не в ва- вакууме, а в среде с показателем пре- преломления л, формула E.8) остается в силе, но в ней под А следует по- понимать не геометрическую, а опти- оптическую разность хода интерфери- интерферирующих волн: А = п(г2 — г^). Чтобы найти зависимость осве- Рис. 5.4. К расчету интерференционной картины моно- щенности экрана от координаты х хроматических во^спусгаемшсдаумя точечными (см. рис. 5.4), нужно разность хо- хода А выразить через координату х точки наблюдения Р. Для удобства введем угол 0, образуемый направлением на точ- точку Р с перпендикуляром к линии, соединяющей источники (т. е. с «оптической осью» рассматриваемой схемы). В практически важном случае малых значений в (в <С 1) для разности хода можно написать А « вЛ. Так как в « х/1, то А и хс1/1. Подстав- Подставляя А в E.8), получаем ] E.9) При х = 0 расположен максимум, соответствующий нулевой разности хода. Для него порядок интерференции т — 0. Это центр интерференционной картины. Рас- Расстояние между соседними максимумами или минимумами (пространственный пери- период интерференционной картины) Ах: определяется из условия ЫАх/1 = 2л, откуда Ах = 2л1/(Ы) = XI/Д. Если ввести угол схождения лучей а « Л//, т.е. угол, под ко- которым видны источники из точки наблюдения, то выражение для Ах можно записать следующим образом: Ах « XIа. Это совпадает с уже разобранным случаем интерфе- интерференции плоских волн, распространяющихся под углом а. В самом деле, на большом расстоянии от источников сферические волны на небольших участках приближенно можно рассматривать как плоские, угол между направлениями которых при в <С 1 приближенно равен A/1. Отметим, что среднее значение освещенности по экрану в интерференционной кар- картине, согласно формуле E.9), равно удвоенной освещенности от одного источника. Это значит, что при интерференции происходит только перераспределение энергии в пространстве, а полный поток энергии остается неизменным. В действительности это условие приближенное и выполняется тем точнее, чем больше отношение Л/Х. В противоположном случае Л < Я, т. е. когда расстояние между источниками много меньше длины волны, во всех точках пространства от обоих источников происхо- происходит сложение колебаний с практически одинаковыми фазами. Это значит, что всюду интенсивность результирующих колебаний, а вместе с тем и полный поток энергии 7 Зак 4498
194 5. Интерференция света почти в четыре раза больше, чем при одном источнике. Однако это не противоречит закону сохранения энергии, так как близко лежащие источники, взаимодействуя че- через создаваемое ими поле излучения, вместе излучают больше энергии, чем в том случае, когда они находятся далеко друг от друга. Для радиоволн, излучаемых близ- близко расположенными антеннами, увеличение полного потока энергии происходит за счет работы генератора, поддерживающего неизменные амплитуды колебаний тока в антеннах. В случае свободных колебаний в источниках увеличение излучаемой энергии приводит к более быстрому их затуханию. Уменьшение времени радиацион- радиационного затухания для близко расположенных одинаковых излучающих атомов известно и в оптике (сверхизлучение). До сих пор рассматривались только точки экрана, лежащие в плоскости чертежа на рис. 5.4. В пространстве поверхности максимальной и минимальной интенсив- интенсивности представляют собой гиперболоиды вращения с фокусами в точках 5^ и 52> так как соответствуют множеству точек, для которых разность расстояний от двух заданных точек (источников 5^ и 52) имеет одно и то же значение. Форма интерфе- интерференционных полос на экране определяется линиями пересечения этих гиперболоидов с плоскостью экрана. В небольшой центральной области экрана полосы практически можно считать равноотстоящими параллельными прямыми, ориентированными пер- перпендикулярно плоскости чертежа на рис. 5.4. Контрольные вопросы • В каком случае при наложении двух пучков света одинаковой частоты всегда, т.е. при любых фазовых соотношениях, происходит просто сложение интенсивностей? • По какому закону изменяется освещенность экрана, где наблюдается интерференция двух плоских монохроматических волн одинаковой интенсивности? разной интенсивности? • Какую форму имеют интерференционные полосы при падении на экран монохроматических волн от двух точечных когерентных источников? 5.2* Интерференционные опыты по методу деления волнового фронта Особенности наблюдения явлений интерференции света от обычных (не лазерных) источников света обусловлены тем, что испускаемый ими свет никогда не быва- бывает монохроматическим. Такой свет можно рассматривать как хаотическую последо- последовательность отдельных цугов синусоидальных волн (см. пп. 1.7, 1.8). Длительность отдельного цуга не превышает 10~8 с даже в тех случаях, когда атомы источника не взаимодействуют (газоразрядные лампы низкого давления). Любой регистрирую- регистрирующий прибор имеет значительно большее время разрешения. Поэтому при наложении пучков света от разных источников фазовые соотношения между световыми колеба- колебаниями в любой точке за время наблюдения успевают многократно измениться слу- случайным образом. В результате сложения большого числа колебаний со случайными фазами энергия результирующего колебания в любой точке будет равна сумме энер- энергий складывающихся колебаний, т.е. не происходит характерного для интерферен- интерференции перераспределения энергии в пространстве. Отсюда ясно, что для наблюдения
5.2. Интерференционные опыты 195 интерференции света необходимы специальные условия: свет от одного и того же ис- источника нужно разделить на два пучка (или несколько пучков) и затем наложить их друг на друга подходящим способом. Если разность хода этих пучков от источника до точки наблюдения не превышает длины отдельного цуга, то случайные измене- изменения амплитуды и фазы световых колебаний в двух пучках происходят согласованно, т. е. эти изменения скоррелированы. О таких пучках говорят, что они полностью или частично когерентны, в зависимости от того, будет ли эта корреляция полной или частичной. Впервые экспериментальная установка для демонстрации интерференции света бы- была осуществлена Томасом Юнгом в начале XIX в. Яркий пучок солнечных лучей освещал экран А с малым отверстием 5 (рис. 5.5). Прошедший через отверстие свет вследствие ди- А В фракции образует расходящийся пучок, который па- дает на второй экран В с двумя малыми отверсти- —*-*Д § -И ями Л*! и Л^, расположенными близко друг к другу ' '"* " на равных расстояниях от 5. Эти отверстия действу- действуют как вторичные точечные *) синфазные источни- Рис 5Л Схема опыта Юнга ки, и исходящие от них волны, перекрываясь, созда- создают интерференционную картину, наблюдаемую на удаленном экране С. Положение светлых и темных полос в ней можно находить, пользуясь монохроматической идеализацией. Расстояние Ах между соседними поло- полосами, как было показано в п. 5.1, равно Я//й. Трудности наблюдения интерференции света в таком опыте связаны с тем, что длина волны видимого света очень мала. При Я = 5 • 10~~5 см и расстоянии д, между отверстиями ^ и 52, равном всего 0,5 мм, ширина интерференционных полос сос- составляет только 1 мм при удалении экрана С на 1 м от отверстий. Измеряя ширину интерференционных полос, Юнг в 1802 г. впервые определил длины световых волн для разных цветов, хотя эти измерения и не были точными. Введение дополнительного отверстия 5 (оно необходимо для когерентного возбу- возбуждения источников 5'1 и52, см. п. 5.5) резко уменьшает световой поток, что также затрудняет осуществление этого опыта. Интенсивность наблюдаемой в опыте Юнга интерференционной картины можно заметно увеличить, если вместо точечных отвер- отверстий 51, 5^ и 52 в экранах применить узкие длинные параллельные между собой щели. Вид полос вблизи центра интерференционного поля будет при этом таким же, как и при использовании точечных отверстий. Поясним это. Если точечное отверстие 5 перемещать перпендикулярно плоскости чертежа на рис. 5.5, то интерференционные полосы на экране С, получаемые от точечных отверстий 5| и 52, будут просто сме- смещаться вдоль своих направлений, т.е. также перпендикулярно плоскости чертежа. Поэтому замена отверстия 51 длинной щелью, т.е. непрерывной цепочкой точечных некогерентных источников, не приведет к ухудшению четкости интерференционных полос по крайней мере в той области, где их кривизна незначительна. Аналогично, не ухудшит четкости и замена отверстий ^ и 52 на узкие длинные щели, перпенди- перпендикулярные плоскости чертежа на рис. 5.5. Увеличение же размера первого отверстия *) Чтобы отверстия 51 и 52 пропускали достаточно света для возможности наблюдения интерференци- интерференционных полос, они должны иметь конечные размеры. Такие источники создают направленное излучение, а не простые сферические волны (см. п. 6.3). Влияние конечных размеров отверстия 5 обсуждается в п. 5.5.
196 5. Интерференция света или ширины щели 5 в плоскости чертежа неизбежно приводит к уменьшению кон- контрастности (видности) интерференционных полос (см. п. 5.5). В современной демонстрационной модификации опыта Юнга в качестве источника света используют лазер. При этом для когерентного возбуждения вторичных источников 5| и 52 необходимость во вспомогательном отверстии 5 отпадает, так как в лазерном излучении све- световые колебания когерентны по всему поперечному сечению пучка (высокая пространствен- пространственная когерентность лазерного излучения), и щели вводят непосредственно в пучок лазерного излучения. Другой интерференционный опыт, аналогичный опыту Юнга, но в меньшей степени осложненный явлениями дифракции и более светосильный, был осуществлен Фре- Френелем в 1816 г. Две когерентные световые волны получались в результате отражения от двух зеркал, плоскости которых на- наклонены под небольшим углом 8 друг к другу (зеркала Френеля, рис. 5.6). Ис- Источником служит узкая ярко освещен- освещенная щель 5, параллельная ребру между зеркалами. Отраженные от зеркал пучки падают на экран, и в той области, где они перекрываются, возникает интерфе- Рис. 5.6. Зеркала Френеля ренционная картина. От прямого попада- попадания лучей от источника 5 экран защищен ширмой. Для расчета освещенности 1(х) экрана можно считать, что интерферирующие волны испускаются вторичными источ- источниками 51 и 52, представляющими собой мнимые изображения щели 5 в зеркалах. Поэтому 1(х) будет определяться формулой E.9), в которой расстояние / от источ- источников до экрана следует заменить на а 4- Ь, где а — расстояние от 5 до ребра зеркал, Ъ — расстояние от ребра до экрана (см. рис. 5.6). Расстояние й между источниками, как видно из рис. 5.6, равно й^2а8. Поэтому ширина интерференционной полосы на экране равна Ах и XI/й = Х(а + Ъ)/Bа8). В другом интерференционном опыте, также предложенном Френелем, для раз- разделения исходной световой волны на две используют призму с утлом при вер- вершине, близким к 180° (бипризма Френеля). Источником света служит ярко осве- освещенная узкая щель 5, параллельная преломляющему ребру бипризмы (рис. 5.7). Можно считать, что здесь обра- образуются два близко лежащих мни- мнимых изображения 5| и 52 источ- источника 5, так как каждая полови- половина бипризмы отклоняет лучи на небольшой угол (п — 1 )E. Аналогичное устройство, в ко- котором роль когерентных источ- источников играют действительные изображения ярко освещенной щели, получается, если собираю- собирающую линзу разрезать по диаметру и половинки немного раздвинуть (билинза Бийе, рис. 5.8). Прорезь закрывается непрозрачным экраном, а падающие на линзу лучи $2*-=^^ о Рис. 5.7. Бипризма Френеля
5.2. Интерференционные опыты 197 проходят через действительные изображения щели 5} и 52 и дальше перекрываются, образуя интерференционное поле. Во всех перечисленных устройствах с первичным монохроматическим источни- источником 5 (например, щелью, освещаемой ртутной лампой через светофильтр, выделяю- выделяющий одну из узких спектраль- спектральных линий) интерференцион- интерференционные полосы можно наблю- наблюдать в любом месте в облас- области перекрытия расходящихся * пучков от источников 8^ и 52 ~ - ^ - -^ - (эти области на рис. 5.6—5.8 выделены затенением). Рис. 5.8. Билинза Бийе При описании интерференционных опытов предполагалось, что колебания векто- векторов Е в обоих световых пучках происходят в точке наблюдения по одному направле- направлению. В случае ортогональной поляризации налагающихся пучков Е]Е2 = 0, интерфе- интерференционный член в E.1) равен нулю и происходит просто сложение интенсивностей, приводящее к равномерной освещенности в области перекрытия пучков. Это легко продемонстрировать, если в обычном интерференционном опыте на пути каждого из двух пучков поставить поляризаторы: полосы, отчетливо видные при совпадаю- совпадающих направлениях колебаний в обоих пучках, пропадают при повороте одного из поляризаторов на 90° (опыты Араго и Френеля). Но для наблюдения интерференции нет необходимости использовать поляризован- поляризованный свет. Неполяризованный (естественный) свет можно представить в виде супер- суперпозиции двух некогерентных волн, поляризованных во взаимно перпендикулярных направлениях. В рассмотренных выше интерференционных опытах эти волны созда- создают две независимые, но пространственно совпадающие системы полос, так как свет распространяется в изотропной среде, где фазовые скорости ортогонально поляризо- поляризованных волн одинаковы и, следовательно, для каждой точки наблюдения обе волны имеют одну и ту же разность хода интерферирующих пучков. В анизотропной среде волны с ортогональной поляризацией имеют различные фа- фазовые скорости. Если на пути одного из интерферирующих пучков естественного света поместить кристаллическую пластинку в половину длины волны,*) вносящую разность фаз между волнами с ортогональной поляризацией, то светлые полосы од- одной из независимых интерференционных картин совпадут с темными полосами дру- другой, что приведет к равномерной освещенности. Но в скрытом виде интерференци- интерференционная картина все же существует: полосы можно наблюдать, если смотреть на экран через анализатор, направление пропускания которого соответствует поляризации од- одной из волн. При повороте анализатора на 90° видна вторая картина, смещенная относительно первой на полполосы (опыт С. И. Вавилова). Иное дело, если на пути одного из пучков поместить слой оптически активного ве- вещества, при прохождении через которое происходит поворот направления колебаний. * > Если опыт выполняется с немонохроматическим светом, то в другой пучок нужно ввести стеклянную пластинку, подобранную так, чтобы оптические пути обоих пучков были примерно одинаковы. Такая ком- компенсация вносимой кристаллической пластинкой разности хода между пучками обеспечивает наблюдение полос, соответствующих низким порядкам интерференции.
198 5. Интерференция света В частности, это может быть кварцевая пластинка с гранями, перпендикулярными оптической оси. Когда толщина пластинки подобрана так, что направление колеба- колебаний изменяется на 90°, интерференционная картина полностью пропадает: теперь в двух пучках, приходящих в точку наблюдения, одинаковое направление колебаний имеют некогерентные волны, которые в исходном пучке естественного света имели ортогональные поляризации. Контрольные вопросы • Почему для наблюдения интерференции света от обычных источников интерферирующие пучки должны происходить от одного и того же источника? • Почему в центре интерференционной картины в опыте Юнга контрастность полос не ухудшается при замене точечных отверстий 5, 51 и 52 длинными узкими параллельны- параллельными щелями? • Можно ли наблюдать интерференцию неполяризованного света? Задачи 1. Найдите распределение интенсивности 1(х) на экране в установке с зеркалами Френеля (см. рис. 5.6), считая щель 5 бесконечно узкой. Сколько интерференционных полос можно наблюдать на экране? Ответ. /(д0=/0соз2[^4 "=^. 2, В опыте с бипризмой Френеля (см. рис. 5.7) светлая интерференционная полоса распола- располагается при х = 0, т. е. в плоскости симметрии установки. Где будет эта полоса, если щель 5 сместить вверх на расстояние Н1 Ответ. При х = —НЬ/а. (Указание. При наклоне призмы на небольшой угол положение мнимых изображений 5^ и 52 щели 5 в первом приближении неизменно.) 5.3. Деление амплитуды. Локализация интерференционных полос Интерференцию света по методу деления амплитуды во многих отношениях на- наблюдать проще, чем в опытах с делением волнового фронта. В опыте Поля свет от источника 5 отражается двумя поверхностями тонкой прозрачной плоскопараллель- плоскопараллельной пластинки (рис. 5.9). В любую точку Р, находящуюся с той же стороны от пла- пластинки, что и источник, приходят два луча (при малом коэффициенте отражения повторные отражения от внутренних поверхностей пластинки можно не принимать во внимание ввиду ничтожной энергии пучков, испытавших два отражения и бо- более). Эти лучи образуют интерференционную картину. Для определения вида полос можно представить себе, что лучи выходят из мнимых изображений 8{и82 источни- источника 5, создаваемых поверхностями пластинки. На удаленном экране, расположенном параллельно пластинке, интерференционные полосы имеют вид концентрических ко- колец с центрами на перпендикуляре к пластинке, проходящем через источник 5.
5.3. Локализация интерференционных полос 199 Этот опыт, как показано в п. 5.5, предъ- предъявляет менее жесткие требования к разме- размерам источника 5, чем рассмотренные вы- выше опыты. Поэтому можно в качестве 5 применить ртутную лампу без вспомога- вспомогательного экрана с малым отверстием, что обеспечивает значительный световой по- поток. С помощью листочка слюды (толщи- (толщиной 0,03—0,05 мм) можно получить яркую интерференционную картину прямо на по- потолке и стенах аудитории. Чем тоньше пластинка, тем крупнее масштаб интерфе- ренционной картины, т. е. больше расстоя- Рис. 5.9. Интерференция при отражении света ние между полосами. двумя поверхностями тонкой пластинки Особенно важен частный случай интерференции света, отраженного двумя по- поверхностями плоскопараллельной пластинки, когда точка наблюдения Р находится в бесконечности, т. е. наблюдение ведется либо глазом, аккомодированным на беско- бесконечность, либо на экране, расположенном в фокальной плоскости собирающей линзы (рис. 5.10). В этом случае оба луча, идущие от 5 к Р9 порождены одним падающим лу- лучом и после отражения от передней и зад- задней поверхностей пластинки параллельны друг другу. Оптическая разность хода меж- между ними в точке Р такая же, как на ли- линии ВС: & = п(\АВ\ + \ВС\)-\АО\. „ -*А „ , Здесь п — показатель преломления ма- Рис. 5.10. Возникновение интерференцион- п ных полос, локализованных в бесконечности теРиала пластинки. Предполагается, что над пластинкой находится воздух, т.е. по- показатель преломления п\ « 1. Поскольку \АВ\ = \ВС\ = 2/*/соз0', \Ап\ = 2к\%&ьтО (к — толщина пластинки, в и 0' — углы падения и преломления на верхней грани; $тв = п$тв'), то для разности хода по- получаем А = 2пИсо$0'. E.10) Следует также учесть, что при отражении волны от верхней поверхности пла- пластинки в соответствии с формулами Френеля (см. п. 3.2) ее фаза изменяется на л. Поэтому разность фаз 8 складываемых волн в точке Р равна 8 = 4лп^- СО8 в' ± л = Ал А л/л2 - 8т2 в ± я, E.11) где Ао — длина волны в вакууме. Разность фаз 8 определяется углом в, который од- однозначно связан с положением точки Р в фокальной плоскости линзы (см. рис. 5.10). Она не зависит от положения источника 5: если источник переместить, разность фаз
200 5. Интерференция света двух волн в точке Р останется прежней. Отсюда вытекает, что при использовании протяженного источника интерференционные полосы будут столь же отчетливы- отчетливыми, как и с точечным источником: каждый элемент протяженного источника создает в фокальной плоскости линзы свою интерференционную картину, причем положе- положение полос во всех этих картинах совершенно одинаково. Так как это справедливо для одной вполне определенной плоскости наблюдения, то про такие полосы гово- говорят, что они локализованы. В данном случае они локализованы в бесконечности (или в фокальной плоскости линзы). В соответствии с формулой E.11) светлые полосы расположены в местах, для которых 2пксо$0( ±А0/2 = тХ^ где т — целое число, называемое порядком ин- интерференции. Полоса, соответствующая данному порядку интерференции, обуслов- обусловлена светом, падающим на пластинку под вполне определенным углом в. По- Поэтому такие полосы называют интерференционными полосами равного накло- наклона. Если ось объектива расположена перпендикулярно пластинке, полосы имеют вид концентрических колец с центром в фокусе. В центре картины порядок ин- интерференции максимален. Исходя из E.11) легко показать, что угловой масштаб наблюдаемой картины пропорционален 1/л/Л (чем тоньше пластинка — тем ши- шире полосы), а радиусы последовательных светлых полос пропорциональны квад- квадратному корню из целых чисел (при условии, что в центре максимум интенсив- интенсивности). Полосы равного наклона можно получить не только в отраженном свете, но и в свете, прошедшем сквозь пластинку. В этом случае один из лучей проходит прямо, а другой — после двух отражений на внутренней стороне пластинки. Когда коэффициент отражения на поверхности пластинки мал (для стеклянной пластин- пластинки при нормальном падении примерно 0,04), интенсивности интерферирующих лу- лучей, прошедших сквозь пластинку, сильно отличаются друг от друга. В соответствии с формулой E.4) различие между максимальным и минимальным значениями интен- интенсивности оказывается малым, а видность полос — низкой. Для наблюдения полос равного наклона вместо плоскопараллельной пластинки удобно использовать интерферометр Майкельсона. Его упрощенная схема при- приведена на рис. 5.11. Свет от источника 5 падает на пластинку Р1? задняя сторона ко- которой покрыта тонким полупрозрачным слоем серебра или алюминия. Здесь пучок разделяется на два взаимно перпендикулярных пучка. Отраженный пластинкой Р1 пучок падает на зеркало М1? отражается назад, вновь попадает на пластинку Р1? где снова разделяется на две части. Одна из них идет к источнику 5 и не представляет интереса, а другая попадает в зрительную трубу, установленную на бесконечность, или на линзу Ь, в фокальной плоскости Р которой расположен экран для наблюде- наблюдения интерференции. Прошедший сквозь пластинку Р1 пучок от источника падает на зеркало М2, возвращается к Р^ и частично отражается в сторону линзы Ь. Таким образом, от одного источника 5 получаются два пучка примерно одинаковой ин- интенсивности, которые распространяются после разделения пластинкой Р^ в разных «плечах» интерферометра, затем снова встречаются и создают интерференционную картину в фокальной плоскости линзы Ь. Пластинка Р2, такая же, как иРр толь- только без отражающего покрытия, ставится на пути второго пучка для компенсации разности хода, возникающей из-за того, что первый пучок проходит через Рх три раза, а второй — только один раз. Зеркало М2 неподвижно, а зеркало М^ можно
5.3. Локализация интерференционных полос 201 передвигать микрометрическим винтом так, что его плоскость все время остается перпендикулярной зеркалу М2. Построим изображение зеркала М2, создаваемое отражающей поверхностью раз- разделительной пластинки (М'2 на рис. 5.11). Оптическая длина пути от источника до точки наблюдения для луча, отразившегося от зеркала А/2, будет такой же, как и для воображаемого луча, отразив- отразившегося от М2. Поэтому можно считать, что интерференционная картина, наблю- наблюдаемая в фокальной плоскости линзы Ь, возникает из-за воздушного слоя между отражающей поверхностью М1 и мнимой отражающей поверхностью М2. При па- параллельных поверхностях М1 и М2 по- полосы имеют вид концентрических окруж- окружностей с центром в фокусе линзы. Если после разделительной пластин- пластинки Р^ пучки имеют одинаковую интен- интенсивность, то распределение интенсивно- интенсивности в фокальной плоскости описывается формулой E.8), где разность хода А, как и в случае плоскопараллельного воздуш- Рис 5 п Схема интерферометра Майкельсона ного слоя, в соответствии с E.10) равна А = 2Н со8 0. Разность хода при заданном расстоянии к между Мх и М2, т.е. при фиксированном положении подвижного зерка- зеркала, зависит только от угла в наклона луча по отношению к оптической оси. Данному значению в соответствует кольцо радиусом РХ%9 в фокальной плоскости линзы. Поэтому положение и размер светлых и темных колец не зависят от положения источника 5, т. е. для наблюдения интерференционной картины можно использовать протяженный источник. При этом получаются интерференционные полосы, локали- локализованные в фокальной плоскости Р линзы Ь. Центру интерференционной картины (в = 0) соответствует максимальная раз- разность хода Атах = 2к, равная удвоенному расстоянию между М^ и М2. Когда М1 приближается к М2, кольца стягиваются по направлению к центру. Перемещение зеркала на расстояние АтЯ0/2 вызывает смещение картины на Ат порядков. Визуально смещение можно оценить с точностью до 1/20 порядка, но существуют методы, позволяющие обнаружить смещения до 10~3 порядка. По ме- мере приближения М{ к М2 угловой масштаб картины возрастает до тех пор, пока М1 не совпадет с М2. При этом освещенность экрана (или поля зрения при визуальном наблюдении) становится равномерной. Мы рассмотрели интерференционные опыты, в которых деление амплитуды све- световой волны от источника происходило в результате частичного отражения света на поверхностях плоскопараллельной пластинки. В случае точечного источника по- полосы можно наблюдать всюду, т.е. они не локализованы. Но на бесконечности или в фокальной плоскости собирающей линзы полосы наблюдаются и при протяженном источнике. Локализованные полосы при протяженном источнике можно получить
202 5. Интерференция света и в других условиях. Оказывается, что для достаточно тонкой пластинки или плен- пленки (поверхности которой не обязательно должны быть параллельными и вообще плоскими) можно наблюдать интерференционную картину, локализованную вбли- вблизи отражающей поверхности. В белом свете интерференционные полосы окрашены. Поэтому такое явление называют цвета тонких пленок. Его легко наблюдать на мыльных пузырях, на тонких пленках масла или бензина, плавающих на поверхнос- поверхности воды, на пленках окислов, возникающих на поверхности металлов при закале, и т.п. Локализованные вблизи поверхности пленки или тонкой пластинки интерферен- интерференционные полосы можно видеть невооруженным глазом либо с помощью лупы или сфокусированного на поверхность микроскопа. С помощью собирающей линзы ин- интерференционную картину с поверх- а) /р' б) ^ ^\ ности пленки можно отобразить на экране (рис. 5.12, а). В самом деле, лучи, выходящие из точки Р, вновь соберутся в сопряженной точке Р1 (Р1 — изображение точки Р, созда- ваемое линзой). Так как оптические длины всех лучей между сопряжен- Рис. 5.12. Наблюдение полос, локализованных ными точками одинаковы, интерфери- на поверхности тонкой пленки рующие лучи придут в точку Р' с той же разностью фаз, какой они облада- обладали в Р. Поэтому линза создает не только изображение поверхности пленки, но и сис- системы интерференционных полос, локализованных на поверхности. Чтобы понять причину возникновения этих полос, вычислим разность хода А двух лучей, приходящих в точку Р от источника 5. Из рис. 5.12,6 видно, что А = л(|А/?| + \ВР\) — \СР\. Когда пленка мало отличается от плоскопараллельной, треугольники можно считать прямоугольными и положить \АВ\ я* \ВР\ &к/со$0', \СР\ «2М%0'&\п0. Подставляя эти величины в выражение для А, получаем А « 2пксо$6'. Учитывая изменение фазы на л для луча, отраженного передней по- поверхностью пленки, находим следующее выражение*) для разности фаз 8 двух рас- рассматриваемых лучей в точке Р: 8 = 4лп-!?-со$б'±л. E.12) Разность фаз 8 зависит от толщины пленки Н и от угла в'. Для данной точки Р тол- толщина Н имеет определенное значение, и если использовать протяженный источник света, то различие величин 8 для лучей, приходящих от разных точек источника, связано с различием для них значений со8 0'. Когда интервал возможного измене- изменения со8 в' достаточно мал, то разброс значений 8 для пар лучей в точке Р от разных точек источника много меньше 2л и полосы отчетливо видны. Практически условие малости интервала изменений СО8 0' легко выполнить при наблюдении в направле- направлении, близком к нормальному. При наблюдении под углом для выполнения этого условия требуется ограничить входной зрачок объектива. Если полосы рассматрива- рассматривают невооруженным глазом, его зрачок пропускает лучи из Р в пределах небольшого *} Несмотря на внешнее сходство с формулой E.11), физическое содержание формулы E.12) совсем другое, так как она соответствует другим условиям наблюдения интерференции.
5.3. Локализация интерференционных полос 203 телесного угла, что сильно ограничивает интервал значений со§ в'. Тогда значение 8 для точки Р будет практически одинаковым у всех пар интерферирующих лучей, попадающих в глаз. Заметим, что в случае точечного источника интерференционные полосы при от- отражении от двух поверхностей пленки (не обязательно плоскопараллельной) можно наблюдать всюду, а не только на ее поверхности. Локализация полос на поверхности пленки возникает как следствие использования протяженного источника света. В точке Р (и следовательно, в Рг) будет находиться максимум интенсивности, если разность фаз E.12) кратна 2я, или, что эквивалентно, при выполнении условия 2лАсо807± ^ = тХ0 {т = 0, 1, 2,...), E.13) где черта над сов в' означает усреднение по тем точкам источника, свет от которых попадает в Р'. Отметим, что соотношение E.13) остается в силе и при неплоских поверхностях пленки при условии, что угол между ними остается малым. Поэтому интерференционные полосы соответствуют совокупности мест пленки, где ее опти- ческая толщина пк имеет одно и то же значение (при условии, конечно, что со§0' в достаточной степени одинаков для всей области наблюдения). По этой причине такие полосы называют обычно полосами равной толщины. Полосы равной толщины можно наблюдать в тонкой прослойке воздуха между поверхностями двух прозрачных пластинок. Когда направление наблюдения близко к нормальному, соб в1 ~ 1 и темные полосы проходят в местах, толщина которых удо- удовлетворяет условию к = тА/2, где т = 0, 1, 2,... Переход от одной полосы к другой соответствует изменению толщины на А/2. При постоянной толщине слоя интенсив- интенсивность одинакова по всей его поверхности. Этим пользуются для испытания качества оптических поверхностей при их шлифовке путем наблюдения прослойки между ис- исследуемой поверхностью и поверхностью эталона (контрольной пластинки). При клиновидной воздушной прослойке между плоскими поверхностями интер- интерференционные полосы будут проходить параллельно ребру клина на одинаковом расстоянии друг от друга, равном А/Bа), где а — угол между плоскостями. Та- Таким способом легко измерять углы порядка 0,1' и меньше, а также обнаруживать дефекты поверхности с точностью, недоступной другим методам @,1 А и менее). гСольцевые полосы равной толщины, наблюдаемые в воздушном зазоре между соприкасающимися выпуклой сферической поверхностью линзы малой кривизны и плоской поверхностью стекла (рис. 5.13), называют кольцами Ньютона. Их общий центр расположен в точ- точке касания. В отраженном свете центр темный, так как при толщине воздушной прослойки, много меньшей длины волны А, разность фаз интерферирующих волн обусловле- обусловлена различием в условиях отражения на двух поверхностях и близка к л. Толщина к воздушного зазора связана с рас- расстоянием г до точки касания (см. рис. 5.13): к = К- у/К2 - г2 = К (\ - у/\ - г2/К1) « ^^. Рис. 5.13. К возникновению колец Ньютона
204 5. Интерференция света Здесь использовано условие (г/КJ <С 1. При наблюдении по нормали темные поло- полосы, как уже отмечалось, соответствуют толщине к = тА/2, поэтому для радиуса гт т-го темного кольца получаем гт = у/^Ш (т = 0, 1,2,...) E.14) — радиусы темных колец пропорциональны квадратному корню из натуральных чи- чисел. Фотография колец Ньютона и график радиального распределения интенсивности приведены на рис. 5.14. Если линзу постепенно отодвигать от поверхности стекла, то интерференционные кольца бу- будут стягиваться к центру. При уве- увеличении расстояния на Я/2 карти- картина принимает прежний вид, так как место каждого кольца будет занято кольцом следующего порядка. С помощью колец Ньютона, как и в опыте Юнга, можно сравни- сравнительно простыми средствами при- приближенно определить длину волны света. Полосы равной толщины мож- можно наблюдать и с помощью ин- интерферометра Майкельсона, если одно из зеркал М1 или М2 (см. рис. 5.11) отклонить на небольшой угол. Когда М^ и М2 расположе- расположены близко и образуют клин с ма- малым углом, полосы имеют вид эк- эквидистантных прямых, параллель- параллельных ребру клина и локализованных на поверхности клина либо вбли- вблизи нее. Для их наблюдения экран следует помещать не в фокальную плоскость линзы 1,ав сопряжен- сопряженную с М^ плоскость (где линза формирует изображение плоскости зеркала М^)9 либо наблюдать в зрительную трубу, сфокусированную на поверхность зеркала М,. АЛЛЛ ГЛЛМ О Рис. 5.14. Кольца Ньютона. Внизу показан график радиального распределения интенсивности Контрольные вопросы • Почему в интерференционных опытах по методу деления амплитуды с помощью тонкой прозрачной пластинки используют обычно отраженный свет, а не прошедший? • Почему при наблюдении полос равного наклона можно использовать протяженный источ- источник света? Где локализованы полосы равного наклона? • Почему для колец Ньютона, получающихся в воздушном зазоре между соприкасающимися поверхностями линзы и стеклянной пластинки, при наблюдении в отраженном свете центр колец темный? • Какой вид имеют интерференционные полосы равной толщины в воздушном клине между плоскими поверхностями стеклянных пластинок?
5.4. Интерференция квазимонохроматического света 205 Задачи 1. Полосы равного наклона наблюдаются при отражении света длиной волны Яо от поверх- поверхностей плоскопараллельной стеклянной пластинки толщиной к (см. рис. 5.10). Найдите угловой радиус вк к-го светлого кольца, считая от от центра картины. Центр колец свет- светлый. Решение. Светлые полосы расположены в местах, для которых 2пксо$0' ±Я0/2 = тХ0. Порядок интерференции т максимален в центре картины (т. е. при в' = 0) и равен неко- некоторому целому числу т0, так как по условию центр колец светлый: 2пк ± Я0/2 = т0А0. Для к-го светлого кольца 2пксо$дк ±Я0/2 = ткХ0. Почленно вычитая эти равенства, по- получаем 2пк(\ — со8 0^) = (т0 — тк)Х0. Здесь ш0 — тк (где к = 0, 1,2,...) — номер свет- светлого кольца при отсчете от центра. При в'к <С 1, согласно закону преломления, вк = пвк и 1 - соз^ « О'к/2 « 0к/Bп2), поэтому кв^/п = кЛ0, откуда вк = у/кпЛ0/п. Радиус свет- светлого кольца пропорционален корню из его номера, а масштаб наблюдаемой картины про- пропорционален \/у/к. 5.4. Интерференция квазимонохроматического света. Временная когерентность В приведенном выше описании интерференционных опытов при их интерпретации предполагалось, что источник излучает монохроматический свет. Естественно, что результаты, полученные для монохроматической идеализации, имеют ограниченную применимость. В этом параграфе мы выясним, к каким изменениям в интерференци- интерференционных явлениях приводит учет спектрального состава реальных источников света. Начнем с простейшего случая, когда источник излучает две очень узкие, близ- близкие друг к другу спектральные линии с частотами а>^ и со2. Если бы излучение на каждой из частот представляло собой бесконечную синусоидальную волну, то результирующее излучение было бы волной средней частоты с периодически изме- изменяющейся амплитудой. Но в действительности излучение каждой из спектральных компонент представляет собой хаотическую последовательность более или менее длинных волновых цугов. Обычно за время наблюдения проходит много цугов, ко- колебания в которых никак не связаны по фазе. Поэтому можно считать, что вместо одного имеется два расположенных в одном месте источника, независимо друг от друга излучающих волны с частотами со^ и со2- При выполнении интерференцион- интерференционных опытов с таким источником каждая из волн создает свою интерференционную картину, и эти картины просто налагаются одна на другую. Если частбты со^ и со2 мало отличаются, то интерференционные полосы в каждой картине имеют почти одинаковую ширину. В тех местах, где светлые полосы одной картины налагаются на светлые полосы другой, четкость полос в суммарной картине наибольшая. Наоборот, там, где светлые полосы одной картины приходятся на тем- темные полосы другой, четкость полос уменьшается вплоть до их полного исчезновения. Исследуем этот вопрос количественно. Распределение интенсивности в двухлуче- вой интерференционной картине для отдельной спектральной линии было получено в п. 5.1. Когда обе волны имеют одинаковые амплитуды, зависимость интенсивности
206 5. Интерференция света от разности хода А двух интерферирующих волн от вторичных источников до точки наблюдения дается формулой E.8): = 2/0A+со8*Д), E.15) где к — со/с — волновое число, а /0 — равномерная интенсивность волны, которую создавал бы только один вторичный источник. Каждая спектральная линия первич- первичного источника создает свою интерференционную картину, распределение интенсив- интенсивности в которой описывается формулой E.15) с соответствующим значением волно- волнового числа &! или к2. Полная интенсивность при наложении двух интерференционных картин имеет вид /(А) = 1Х (Д) + /2(Д) = 2/10A + сое*! Д) + 2/20A + СО8*2Д). E.16) Будем считать, что обе спектральные линии имеют одинаковую интенсивность. Тогда /10 = /20 = /0 и формулу E.16) можно преобразовать: /(А) = 4/0 A + со8 -^- СО8 к А), E.17) где к = (&! + к2)/2 — среднее значение волнового числа, а 8к = к2 — к^ — раз- разность волновых чисел двух близких спектральных линий (8к<^к). На рис. 5.15 показаны интерференционные полосы (а) и соответствующий формуле E.17) гра- график зависимости интенсивности от разности хода А (б). Расстояние между сосед- соседними полосами определяется вторым (быстро осциллирующим) множителем -2тт/8к Рис. 5.15. Интерференционные полосы (а), график зависимости интенсивности от разности хода (б) и видность полос (в) двухлу- чевой интерференции в случае источника, излучающего две близ- близкие спектральные линии. Штриховая линия соответствует источ- источнику, у которого интенсивности близких спектральных линий отличаются вдвое
5.4. Интерференция квазимонохроматического света 207 и соответствует разности хода, равной одной (средней) длине волны Я = 2л/к. Пер- Первый множитель со$(8кА/2) изменяется постепенно, оставаясь практически постоян- постоянным на протяжении многих интерференционных полос, так как 8к <^к (разность частот спектральных линий много меньше средней частоты). В тех местах, где зна- значение со$(8кА/2) приближается к нулю, контрастность интерференционной картины уменьшается: разность интенсивностей в соседних максимумах и минимумах стре- стремится к нулю, полосы исчезают на фоне равномерной освещенности. Для характеристики четкости интерференционных полос Майкельсон ввел функцию видности (или просто видность) V = /тах " /т{п, E.18) 'тах + 'тт 'тах т. е. отношение разности интенсивностей в соседних максимуме и минимуме к удво- удвоенному среднему значению интенсивности. Видность имеет максимальное значе- значение, равное 1, когда интенсивность в минимумах обращается в нуль: /т.п = 0. Из формулы E.17) следует, что при заданной разности хода А ближайшему мак- максимуму соответствует соз&Д = ±1 (в зависимости от знака со$(8кА/2)) и, сле- следовательно, /тах =4/0A + |созE*Д/2)|). Аналогично, для ближайшего минимума 7тт = 4/оA - I соз(Я*Д/2)|). Подставляя /тах и /т.п в E.18), находим У(А) = \соь(8кА/2)\. E.19) Зависимость видности полос от разности хода показана на рис. 5.15, в. Видность при- принимает свое максимальное значение, равное единице, при Д = 0, т. е. вблизи полосы нулевого порядка, где освещенность в минимумах приближается к нулю. С увеличе- увеличением разности хода видность уменьшается и обращается в нуль при 8кА/2 = я/2, т.е. при А = л/8к = А2/B5А). Это соответствует случаю, когда светлые полосы ин- интерференционной картины от одной спектральной линии совмещаются с темными полосами от другой, что приводит к равномерной освещенности. При дальнейшем увеличении разности хода видность полос возрастает и при А = 2л/8к — &2/8& сно- снова равна единице. Таким образом, полный период изменения видности охватывает N = А/5А = (о/8(о интерференционных полос. Кривая видности для случая, когда спектральные компоненты имеют различную интенсивность, показана на рис. 5.15, в пунктирной линией (см. задачу 1). Отличие от случая равных интенсивностей в том, что в минимумах видность в нуль не обращает- обращается, т. е. при различной интенсивности двух близких спектральных линий полного ис- исчезновения интерференционных полос не происходит даже при А = л/8к — А2/B5А). Для наблюдения на опыте такой интерференционной картины с периодическими изменениями видности полос должна быть обеспечена возможность изменения раз- разности хода в широких пределах. Можно, например, получить полосы равного наклона в интерферометре Майкельсона (см. п. 5.3) с подвижным зеркалом Мх. Когда плечи интерферометра почти равны, т.е. расстояние между Мх и М12 мало (см. рис. 5.11), наблюдаемые полосы соответствуют разностям хода, равным небольшому числу длин волн. При этом полосы имеют наибольшую видность (см. рис. 5.15). При перемеще- перемещении зеркала М] разность хода Д возрастает, а видность интерференционных полос в соответствии с E.19) периодически изменяется.
208 5. Интерференция света Таким образом, из наблюдения за изменением видности интерференционных по- полос в зависимости от разности хода можно получить информацию о спектральном составе исследуемого света. Первые наблюдения такого рода были выполнены Физо в середине XIX в. В использованном им интерферометре наблюдались кольца Нью- Ньютона (см. п. 5.3) при освещении его желтым светом натриевой лампы. При контакте линзы с пластинкой кольца были резкими. По мере отодвигания линзы от пластинки кольца стягиваются к центру, а видность полос убывает и при прохождении пример- примерно 490-го кольца интерференционная картина пропадает. При дальнейшем увеличе- увеличении расстояния кольца появляются вновь и приобретают приблизительно первона- первоначальную видность при стягивании примерно 980-го кольца. Физо смог проследить периодическое изменение видности полос в 52 периодах из 980 колец каждый. От- Отсюда он сделал правильный вывод о том, что желтый свет натрия состоит из двух близких спектральных линий. Результаты этих опытов дают для отношения А/5А у желтого дублета натрия значение, равное 980. Средняя длина волны желтой ли- линии Я = 589,3 нм, поэтому 8Х = 0,6 нм. Позднее более тщательные систематические измерения тонкой структуры спектральных линий были выполнены Майкельсоном. Впоследствии анализ спектров с помощью двухлучевой интерференции был вытес- вытеснен методами, основанными на многолучевой интерференции (см. п. 5.8). Рассмотренный пример с источником света, излучающим две близкие по часто- частоте очень узкие спектральные линии, позволяет глубже проанализировать вопрос об ограниченности использованной ранее монохроматической идеализации и перей- перейти к изучению характера интерференционных явлений в квазимонохроматическом свете. Как известно, спектр излучения разреженных газов или паров состоит из рез- резких ярких линий, разделенных темными промежутками. Выделив свет одной из этих линий с помощью светофильтра или монохроматора, можно использовать его для наблюдения, например, полос равного наклона в интерферометре Майкельсона. Ока- Оказывается, что интерференционные полосы видны очень отчетливо, когда оптические длины путей обоих интерферирующих пучков примерно одинаковы. Если отодви- отодвигать одно из зеркал так, чтобы разность хода Д пучков постепенно увеличивалась, видность полос уменьшается (в общем случае немонотонно) и в конце концов ин- интерференционные полосы исчезают совсем. Введение разности хода между пучками эквивалентно задержке одного из них во времени, поэтому способность световых колебаний в одной точке исходного пучка к интерференции после его разделения на два пучка и последующего их соединения с некоторой разностью хода называется временндй когерентностью. Максимальная разность хода, при которой возможна интерференция, называется длиной когерент- когерентности излучения /ког, а соответствующее ей запаздывание — временем когерент- когерентности гког = /ког/с. Условие временнбй когерентности световых колебаний можно записать в виде Д < /ког = стК0Г. Уменьшение когерентности световых колебаний с увеличением временнбй задерж- задержки, т. е. уменьшение видности интерференционных полос при возрастании разности хода, связано с конечной шириной спектральной линии источника квазимонохрома- квазимонохроматического света. Как было показано в пп. 1.6—1.8, такое излучение можно рассмат- рассматривать как совокупность не скоррелированных между собой отдельных монохрома-
5.4. Интерференция квазимонохроматического света 209 тических волн, частбты которых сплошь заполняют некоторый интервал 8со, малый по сравнению со средней частотой со. Каждая монохроматическая волна из этой со- совокупности создает в интерферометре свою картину полос, и полное распределение освещенности, как и в приведенном выше примере, определяется простым наложе- наложением этих картин. При малых разностях хода интерферирующих лучей (порядка нескольких длин волн) положение полос в картинах, создаваемых отдельными монохроматическими составляющими, практически одинаково. Поэтому полосы суммарной картины от- отчетливы. По мере увеличения разности хода отдельные монохроматические картины полос смещаются одна относительно другой из-за различия в длинах волн, и в конце концов суммарная картина оказывается полностью размытой. Оценить разность хода, при которой происходит исчезновение полос, можно следу- следующим образом. Примем, что отдельные монохроматические компоненты равномер- равномерно заполняют спектральный интервал шириной 8со («прямоугольный» спектральный контур линии). Разделим мысленно этот интервал на множество пар бесконечно узких спектральных линий, отстоящих по частоте на 8со/2, т.е. на 8к/2 по шка- шкале волновых чисел (к — со/с). Распределение освещенности от каждой пары дается формулой E.17), в которой 8к (расстояние между монохроматическими компонента- компонентами) следует теперь заменить на 8к/2. Полосы в этой картине пропадают при такой разности хода Атах = /ког, когда аргумент первого косинуса в E.17) становится рав- равным л/2. Заменяя 8к на 8к/2, находим / ког~ 8к ~~ 8Х' Условие исчезновения полос для всех пар монохроматических компонент, на кото- которые был разделен спектральный интервал 8со, одинаково. Поэтому при разности хода Д = /ког из E.20) происходит размытие полос полной интерференционной картины. Формулу E.20) можно использовать для оценки длины когерентности и в случае более сложной формы контура спектральной линии квазимонохроматического света, понимая под 8к (или 8Х) полуширину контура (т.е. ширину на половине высоты). Длине когерентности соответствует максимально возможный порядок интерферен- интерференции ттах = Х/8Х = со/8со, который можно получить в квазимонохроматическом све- свете со спектральной шириной 8со (или 8Х). Для белого света (солнце, лампа накаливания, дуга с угольными электродами) и визуального наблюдения эффективный диапазон длин волн 8Х простирается при- приблизительно от 400 до 700 нм, т. е. 8Х ~ X. В этом случае ттах ~ 1 и интерференци- интерференционные полосы, казалось бы, наблюдаться не должны. Действительно, приемник излу- излучения, обладающий примерно одинаковой чувствительностью в различных участках спектра, например термоэлемент, покажет при перемещении в поле зрения поперек полос почти равномерное распределение освещенности. Но глаз представляет собой селективный приемник с сильно изменяющейся чувствительностью в зависимости от длины волны, что дает некоторым длинам волн преимущество перед другими. Визу- Визуальное наблюдение полос в белом свете облегчается и благодаря способности наше- нашего зрения различать цвет, а не только интенсивность света. Поэтому в белом свете глаз различает около десятка окрашенных интерференционных полос. При равной нулю разности хода, т.е. в тех местах, куда обе интерферирующие волны приходят
210 5. Интерференция света в одинаковых фазах, условие максимума выполняется для всех длин волн. В этом месте получается ахроматическая (т. е. неокрашенная) светлая полоса. По обе сторо- стороны от нее находятся окрашенные максимумы и минимумы, цвета которых постепенно тускнеют по мере удаления от полосы нулевого порядка, а еще дальше поле зрения кажется глазу равномерно освещенным белым светом. Таково происхождение краси- красивых интерференционных цветов в тонких пленках масла или бензина на поверхности воды. Легко оценить максимальную толщину пленки, при которой возможно визуальное наблюдение интерференции в белом свете. Принимая, что максимальный наблюдае- наблюдаемый порядок интерференции ттах «10, для максимально допустимой разности хода получаем ~ 10Я (где А « 0,5 мкм). При этом максимальная толщина пленки пример- примерно вдвое меньше: Нтах « 5А « 2 мкм. Картина интерференционных полос в белом свете иногда может оказаться по- полезной при интерферометрических измерениях, так как с ее помощью можно легко обнаружить для монохроматического света полосу нулевого порядка, соответству- соответствующую равной нулю разности хода. Для этого достаточно заменить временно моно- монохроматический источник источником белого света при неизменном расположении остальных оптических элементов. Используя излучение узких спектральных линий газоразрядных источников низ- низкого давления, можно наблюдать интерференцию при разностях хода, достигающих нескольких десятков сантиметров. Основная причина, ограничивающая в этом слу- случае длину когерентности, — это хаотическое тепловое движение излучающих ато- атомов, приводящее к доплеровскому уширению спектральных линий (см. п. 1.8). Так, например, для излучения красной линии кадмия А = 643,85 нм, впервые исследо- исследованного Майкельсоном, длина когерентности около 20 см. Для оранжевой линии А = 605,78 нм стандартной криптоновой лампы, использовавшейся в недалеком про- прошлом в эталоне длины (за 1 м принималось 1650 763,73 длины волн этой линии), длина когерентности достигает 0,8 м. Исключительно высокая монохроматичность излучения стабилизированных по частоте газовых лазеров позволяет получить интерференцию при разности хода в несколько километров. Предельная разность хода, при которой возможно наблюде- наблюдение интерференции, на практике ограничивается не длиной когерентности лазерного излучения, а трудностями создания стабильной интерференционной установки по- подобных размеров и неоднородностью земной атмосферы. При количественном исследовании значения немонохроматичности источника света в интерференционных явлениях нужно найти, как кривая видности полос связана со спектральным распределением интенсивности источника. Пусть это распределение характеризуется некоторой функцией 1^(к)9 так что /1 (к) йк — интенсивность одного из интерферирующих пучков в интервале волновых чисел (к,к + йк). Распределение интенсивности в элементарной интерференционной картине, созданной излучени- излучением из этого спектрального интервала, получается из E.15) заменой /0 на /1 (к)йк, а полная интенсивность результирующей картины находится суммированием по все- всему спектру: /(Д) =2 / 1г(к)A 4- со$кА)йк. E.21)
5.4. Интерференция квазимонохроматического света 211 Для узкой спектральной линии /1 (к) быстро убывает при удалении от некоторого среднего волнового числа /:0, соответствующего центру спектральной линии. В E.21) удобно перенести начало отсчета для к в центр линии, т. е. ввести новую переменную х = к — к$. Подставляя к = к0 + х в E.21), получаем ;(Д) -2 / /(*)[1 +«»(*„+*)Д] 4* -2 / /(*)*+ () + 2 / /(л:) со8(*Д) (к • со8#0Д - 2 / /(л:) зт(*Д) (к • зт*0Д, где функция /(х) характеризует форму спектрального контура относительно центра линии: /(х) = /^о 4-л:). Будем считать, что контур спектральной линии симмет- симметричен относительно центра, т.е. /(х) — четная функция своего аргумента х. Тогда последний интеграл в E.22) равен нулю. Предыдущий интеграл, если его рассматри- рассматривать как функцию от Д, изменяется медленно по сравнению с быстро осциллирую- осциллирующим множителем со8#0Д, так как для узкой спектральной линии функция /(х) равна нулю всюду, за исключением малой окрестности центра (т. е. вклад в интеграл дают только те значения х, для которых \х\ <С к0). Вводя обозначения /0 = //(*) с!х, С(А) = ±1/(х)со*(хАNх E.23) (/0 — полная интенсивность одного из интерферирующих пучков), для полной ин- интенсивности из E.22) получаем /(Д) = 2/0[1 + С(А) соз*0Д]. E.24) Учитывая медленность изменения С (А), можно считать, что экстремумы /(Д) — см. E.24) — будут при тех значениях Д, где со8#0Д = ±1, поэтому /ЭКстр = = 2/0[1 ±С(А)]. Следовательно, зависимость видности от разности хода Д описы- описывается выражением у = ^шах — ^«тп = (С7(АI, E.25) 1 тах ~ 1 тт В случае прямоугольного спектрального контура, т.е. равномерного распреде- распределения интенсивности в интервале 8к вблизи к0, функция /(*) = сопз( при —8к/2 < х < 8к/2 и /(х) = 0 вне этого интервала. Тогда 8к/2 йп(Л.Д/2) E26) 8к • Д/2 ' -8к/2 а видность интерференционных полос У(А), в соответствии с E.25), определяет- определяется модулем этой функции. На рис. 5.16, а показаны интерференционные полосы в случае источника с прямоугольным спектральным контуром. Ниже (рис. 5.16,6) приведен график зависимости интенсивности от разности хода /(Д). Кривая вид- ности У(Д), соответствующая равномерному распределению энергии излучения
212 5. Интерференция света в спектральном интервале шириной 8к, приведена на рис. 5.16, в. При Д = 0 вид- ность максимальна: V = 1. С увеличением разности хода видность полос убывает и при Д = 2л/8к = А2/5А обращается в нуль. Этот результат уже был получен ранее (см. E.20)). С дальнейшим увеличением Д интерференционные полосы появляются вновь, но их видность незначительна (см. рис. 5.16, в). а) б) -4тг/8к Рис. 5.16. Интерференционные полосы (а), график зависимости интенсивности от разности хода (б) и видность полос (в) двухлучевой интерференции в случае источника с прямоугольным спектральным контуром Сравнение кривых видности интерференционных полос, получаемых при различ- различных спектральных распределениях источника света, приведено на рис. 5.17, а—в. Слу- Случай а) соответствует рассмотренному выше источнику с прямоугольным спектраль- спектральным контуром. В случае отдельной спектральной линии газоразрядного источни- источника, уширенной вследствие эффекта Доплера, форма контура описывается функцией Гаусса /(х) ~ ехр(—сАг2). Для нахождения видности E.25) нужно рассчитать зна- значение С(Д), определяемое формулой E.23). Вычисляя соответствующий интеграл (см. задачу 2), получаем У(Д) = ехр{—[Д/Bа)]2}. С увеличением разности хода вид- видность полос монотонно убывает (рис. 5.17,6) и полосы практически исчезают при Д « 2л/8к9 где 8к — у/\п2/а — ширина спектрального контура на половине высо- высоты. Именно такую кривую видности впервые получил Майкельсон при исследовании красной линии кадмия. Когда спектр состоит из двух одинаковых компонент гауссовской формы с шири- шириной 8к, отделенных друг от друга интервалом в несколько 8к (рис. 5.17, в), перио- периодические изменения видности полос, обусловленные наложением интерференцион-
5.4. Интерференция квазимонохроматического света 213 ных картин от разных компонент (ср. рис. 5.15), оказываются промодулированными монотонно убывающей огибающей, обусловленной наложением картин от разных Рис. 5.17. Кривые видности, соответствующие различным спектральным распределениям интенсивности источника монохроматических составляющих каждой компоненты (ср. рис. 5.17,6). Сравнение теоретически рассчитанных кривых видности с экспериментальными позволяет уста- установить спектральное распределение интенсивности исследуемого источника света. В п. 1.8 была рассмотрена статистическая модель излучения макроскопического ис- источника света, содержащего большое число атомов — независимых элементарных излучателей. Свет такого источника представляет собой хаотическую последователь- последовательность отдельных волновых цугов конечной длительности. Когда цуги волн, испус- испускаемые разными атомами в случайные моменты времени, одинаковы, спектральное распределение интенсивности излучения будет таким же, как и у отдельного цуга (однородное уширение спектральной линии). Связь между длительностью г волно- волнового цуга и шириной 8о) соответствующего ему спектрального распределения обсу- обсуждалась в п. 1.7. Разным формам огибающей волнового цуга соответствуют и разные спектральные контуры, но соотношение между 8со и г имеет универсальный харак- характер (см. A.89)): 8со т « 2я или 8к • I & 2яг, E.27) где 8к = 8со/с — протяженность волнового цуга в пространстве. Чем больше про- пространственная протяженность / цуга, тем уже соответствующий ему спектральный интервал 8<о.
214 5. Интерференция света Исчезновение полос в интерференционных опытах при увеличении разности хода легко объяснить на основе этой модели. Каждый волновой цуг в интерференцион- интерференционном опыте делится на два цуга одинаковой протяженности, которые затем по разным путям приходят в точку наблюдения. Если оптическая разность длин этих путей пре- превышает протяженность цуга, то один из цугов минует точку наблюдения раньше, чем другой дойдет до нее. Тем самым интерференция двух цугов, образовавшихся из одного, становится невозможной. В точке наблюдения идет наложение цугов, поро- порожденных разными цугами в излучении источника. Результат будет таким же, как при наложении волновых цугов от разных источников: за время наблюдения проходит большое число цугов, фазы колебаний в которых никак не связаны друг с другом, поэтому интерференционный член в среднем обращается в нуль и происходит просто сложение интенсивностей. Отсюда вытекает, что максимальная разность хода, при которой возможна интер- интерференция, т. е. длина когерентности, — это и есть длина / волнового цуга. Выражая длину волнового цуга через ширину 8к спектрального распределения интенсивности с помощью E.27), получаем для длины когерентности /ког = 2л/8к, что совпада- совпадает с выражением E.20), полученным как результат наложения интерференционных картин, создаваемых отдельными монохроматическими компонентами в спектраль- спектральном распределении излучения источника. Конечно, рассмотренный пример, в котором все волновые цуги одинаковы, дает лишь идеализированное представление об излучении реальных источников. Тепло- Тепловое движение излучающих атомов приводит вследствие эффекта Доплера к разли- различию средних частот, сопоставляемых отдельным цугам. Во многих случаях такое неоднородное уширение определяет форму и ширину спектральных линий. Поэтому нельзя ожидать, что для излучения реальных источников квазимонохроматическо- квазимонохроматического света понятие длины когерентности можно столь просто и наглядно трактовать в буквальном смысле как протяженность волновых цугов. Однако для любого излуче- излучения, занимающего спектральный диапазон 8к, длину когерентности / = 2л/8к всегда можно принять за некоторую эффективную протяженность волновых цугов. При та- таком подходе две возможные интерпретации исчезновения интерференционных полос при больших разностях хода — в рамках представлений о хаотической последова- последовательности волновых цугов конечной протяженности или представлений о наложении интерференционных картин, создаваемых отдельными монохроматическими компо- компонентами в спектре излучения, — оказываются эквивалентными. Количественная теория когерентных свойств излучения, т.е. его способности к интерферен- интерференции, в рамках спектральных представлений была рассмотрена выше. Теория, в которой ис- используется временнбе описание излучения, базируется на математической теории случайных функций. Колебания напряженности электрического поля в световой волне, представляющей собой наложение волновых цугов, можно записать в виде Е(() = Е0(() е"'"' = а(() *-№-*№, E.28) где со — некоторая средняя частота, а Ео(() = а(г)ехр[/<р(г)] — зависящая от времени комп- комплексная амплитуда. В случае квазимонохроматического излучения, частотный спектр которого сосредоточен в узком интервале 8со вблизи средней частоты со, т. е. когда 8со <^ со, амплиту- амплитуда а (г) и фаза ф(() в E.28) представляют собой случайные функции времени. Эти функции изменяются медленно по сравнению с функцией ехр(—гш). Другими словами, можно считать,
5.4. Интерференция квазимонохроматического света 215 что E.28) описывает сравнительно медленную хаотическую модуляцию амплитуды и фазы колебания с высокой (оптической) частотой со. Следует, однако, заметить, что хотя измене- изменения а(() и ф(г) происходят медленно в масштабе периода колебаний, они происходят чрезвы- чрезвычайно быстро в масштабе времени, требуемого для наблюдения. Измеряемая на опыте интен- интенсивность пропорциональна среднему за время наблюдения значению квадрата вещественной амплитуды а (г): 2 E.29) Хаотические изменения а2(() сглаживаются при усреднении за время наблюдения. В случае стационарных оптических полей интенсивность в E.29) не зависит от времени (точнее, от по- положения интервала усреднения на шкале времени). В интерференционных экспериментах пучок квазимонохроматического света расщепляется на два, которые затем вновь встречаются в некоторой точке наблюдения Р. Будем для про- простоты считать, что интенсивности этих пучков одинаковы. Поскольку оптические пути пучков от места разделения до точки Р различаются на А, колебания в одном из них происходят с запаздыванием на время г = А/с. Поэтому результирующее колебание в Р описывается функцией - г) = [Е0A) + Е0(( - т)с1ат]с-1би. В соответствии с E.29) интенсивность этого колебания ЕA - г) е'^К(') + Е$A - г) е-'И) = ) E.30) - г)) + 2Яе [ )'] Первые два слагаемые в правой части E.30) одинаковы и пропорциональны интенсивностям /0 интерферирующих пучков. Выражение (Е0(()ЕцA — г)) называют в теории случайных функ- функций автокорреляционной функцией для комплексной амплитуды Ео((). Нормированную ав- автокорреляционную функцию называют комплексной степенью временндй когерентности колебаний и обозначают у (г): у[т)- Эта функция характеризует корреляцию световых колебаний в моменты времени, разделенные интервалом г.*) Используя определение у (г) E.31), из E.30) получаем следующее выраже- выражение для интенсивности в точке наблюдения: / = 2/0[1+Яеу(г)е-/й>г]. E.32) Если комплексную функцию у (г) представить как у(т) = \у(т)\ е~г5^т\ то формуле E.32) можно придать вид / = 2/0[1 + \у(т)\соз(сот + 8)] = 2/0[1 + |у(т)|сов(*Д+ *)]. E.33) Это выражение отличается от формулы E.8) для интенсивности при интерференции моно- монохроматических волн наличием множителя \у(т)\ в интерференционном члене и добавочным *}Так как функция у (г) характеризует в то же время корреляцию колебаний в один момент времени в двух точках, находящихся на расстоянии А = ст вдоль пучка, то временною когерентность иногда называют продольной.
216 5. Интерференция света слагаемым 8 (г) в аргументе косинуса. Зависящий от положения точки наблюдения Р множи- множитель со8(#Д 4- 8) в интерференционном члене описывает быстрые осцилляции интенсивности в пространстве при переходе от одной полосы к другой. Изменение плавной функции \у(т)\ при переходе от одной полосы к соседней незначительно, т. е. она имеет приблизительно одно и то же значение для целой области интерференционного поля, содержащей много полос. Когда \у(т)\ = 1, интерференция квазимонохроматического света с хаотически изменяю- изменяющимися амплитудой и фазой осуществляется так же, как и в случае регулярных строго моно- монохроматических волн. Поэтому при |у(г)| = 1 говорят о полной когерентности интерфериру- интерферирующих пучков. При у(т) = 0 происходит простое сложение интенсивностей пучков: / = 2/0. В этом случае интерференции нет и колебания называют некогерентными. Если О < \у(т)\ < 1, то говорят о частичной когерентности интерферирующих пучков. Можно представить себе частично когерентный свет как бы состоящим из полностью когерентной и некогерентной частей, причем доля когерентного света в этой смеси равна |у(т)|. В самом деле, формулу E.33) можно записать в виде / = 2/0|у(г)|[1 + соз(*Д + 5)] + 2/0[1 - |у(т)|]. Здесь первое слагаемое описывает интерференцию полностью когерентных волн с равными интенсивностями /0 |^(т)|, а второе — наложение некогерентных волн с интенсивностями /0A — |^(т)|). Этим объясняется, почему величина |у(г)| названа степенью когерентности. Экспериментальное определение модуля комплексной степени когерентности исследуемого излучения, т.е функции |у(т)|, может быть основано на измерении видности У(Д) интерфе- интерференционных полос в зависимости от разности хода Д = сг. Ввиду медленности изменения \у(т)\ в E.33) максимумы интенсивности соответствуют значениям со8(&Д + Я) = 1, а мини- минимумы — значениям со8(#Д -{-8) = —1. Поэтому /тах = 2/0A + |у(г)|). 1Ш = 2/„A + |У(Г)|). Таким образом, видность интерференционных полос (при равных интенсивностях интерфери- интерферирующих пучков) 1™*-1™ =\у(тI E.34) т.е. видность равна модулю комплексной степени когерентности. Кривые видности У(Д), при- примеры которых даны на рис 5.17, можно рассматривать и как графики функции \у(т)\ для соответствующих излучений, заменив Д на ст. Значительно труднее определить на опыте аргумент комплексной степени когерентно- когерентности у(т), т.е. функцию 8(т). Для этого нужно, как видно из E.33), при каждом значении разности хода Д сравнить наблюдаемое положение полос от исследуемого источника света с положением полос от монохроматического источника с частотой а), которое определяется формулой E.8). Таким способом в принципе можно экспериментально полностью определить комплексную степень временнбй когерентности, характеризующую исследуемое излучение. Привлекательная черта теории частичной когерентности состоит в том, что она опери- оперирует величинами, которые в принципе можно определить из эксперимента (корреляционные функции и интенсивности). В этом она существенно отличается от элементарной оптической волновой теории, где основную величину, т.е. напряженность Е(г) электрического поля све- световой волны, из-за большой частоты оптических колебаний невозможно измерить реальными инерционными приемниками излучения. Комплексную степень когерентности у (г) можно рассчитать, используя ту или иную ста- статистическую модель рассматриваемого излучения. Так, в простейшем примере, когда квази- квазимонохроматическое излучение представляется в виде хаотического наложения одинаковых
5.4. Интерференция квазимонохроматического света 217 волновых цугов длительностью г0, прямой расчет на основе определения у (г) E.31) дает -^0 ПРИ Г<Г0, 0 при т > т0. Степень когерентности такого излучения линейно убывает от 1 до 0 с увеличением т от О до г0. Формула E.35) отражает физически очевидный факт: колебания в моменты времени г и D- т когерентны, если промежуток времени г меньше длительности т0 отдельного цуга. Другими словами, в такой модели излучения длительность т0 цуга совпадает с временем когерентности колебаний. Найдем связь комплексной степени когерентности у (г) со спектральным распределением интенсивности излучения /(со). Для этого воспользуемся разложением квазимонохроматиче- квазимонохроматического колебания Е{г) = Е0(()е~'ш E.28) в интеграл Фурье (см. A.83) и A.84)): ^, Еа= Е(,)е™*. E.36) Выражая в определении у (г) (см. E.31)) комплексную амплитуду Ео(() через Е(() с помо- помощью E.28), приводим корреляционную функцию для амплитуд к виду со г)) = (Е(')Е*(( ~ г)) е(<иг = У Е(()Е*{1 - г) Ае'4». При усреднении по времени наблюдения, большому по сравнению с характерным временным масштабом изменения Е0@» пРеДелы интегрирования по г можно распространить до ±оо. Затем вместо Е* (г — т) подставляем его разложение в интеграл Фурье согласно E.36) и из- изменяем порядок интегрирования по г и со'\ <Е(,)Е*(,-г)>= Стоящий в скобках интеграл согласно второй из формул E.36) есть фурье-компонента Еш, функции Е{(). Поэтому г)> = 2У Е*уЕш1 е-'»'' ^ е'шг. E.37) О Знаменатель в определении у {г) E.31) получается из E.37) при т = 0. Поэтому E-38)
218 5. Интерференция света Понимая под 1(со) нормированную на единицу функцию спектрального распределения интен- интенсивности оо \Е I2 ( 7И = оо ' / 7И й(О = !> о получаем окончательное выражение для комплексной степени когерентности у(т) квазимоно- квазимонохроматического излучения через спектральное распределение его интенсивности: со у (г) = &Шт [1(со/)&~1со'т йсо'. E.39) Проиллюстрируем применение формулы E.39) на простых примерах. Пусть излучение рав- равномерно заполняет узкий спектральный интервал 8со со средней частотой со (прямоугольный спектральный контур). Тогда функция /(&/) равна постоянной величине \/8со в пределах это- этого интервала (со — 8со/2, со 4- 8со/2) и нулю — вне его. При вычислении интеграла в E.39) удобно перейти к переменной х = со1 — со: 8(о/2 [а,+х)т . Мт8со/2) у(т) Зоо у т8со/2 E.40) -8со/2 График этой функции приведен на рис. 5.18, а. Модуль у(т), равный в соответствии с E.34) видности интерференционных полос, показан штриховой линией. Сравните этот график с со- соответствующей кривой видности на рис. 5.17, а. а) \/8со.—. б) Рис. 5.18. Степень временной когерентности \у(т)\, соот- соответствующая различным спектральным распределениям интенсивности излучения
5.4. Интерференция квазимонохроматического света 219 Для излучения с гауссовым спектральным контуром (доплеровское уширение) нормиро- нормированная функция распределения интенсивности имеет вид /(&/) = ф/у/л)ехр[—/32(а)' — (оJ]. Перейдем в E.39) к переменной х = со! — со. Так как /(&/) быстро убывает при удалении от со', то пределы интегрирования по х можно распространить до ±оо: г{т) = А- сю - [ E.41) (вычисление этого интеграла см. в задаче 2). График у(т) также представляет собой гауссову кривую (рис. 5.18,6). Степень когерентности монотонно убывает с увеличением промежутка времени т. Сравните график у (г) с соответствующей кривой видности на рис. 5.17,6. В случае спектральной линии с лоренцевским контуром полушириной 8со = 2Г степень когерентности у (г) = ехр(—Г\т\) (см. задачу 3). Ее график приведен на рис. 5.18, в. Во всех случаях время когерентности тког связано с шириной спектра излучения соотношени- соотношением тког3(о « 2л. Интегральное соотношение E.39), выражающее у {г) через 1(со), можно обратить, чтобы по известной степени когерентности у(т) (например, измеренной экспериментально) рассчи- рассчитывать спектральное распределение интенсивности 1(со) исследуемого излучения. Таким образом, экспериментальное определение времени когерентности г (или длины когерентности 1 — ст) может быть основано либо на измерении видности интерференционных полос, либо на измерении спектрального интервала частот Ау ~ 1/г, занимаемого исследуемым излучением. Принципиально иной метод нахождения времени когерентности был предложен Брауном и Твиссом в 1956 г. Его упрощенная схема показана на рис. 5.19, а. Из- Излучение от исследуемого источника 5 делится полупрозрачным зеркалом на два пуч- пучка, которые после прохождения разных расстояний падают на два малоинерционных приемника (фотоумножители ФЭУ-1 и ФЭУ-2). В отличие от обычных интерференци- интерференционных опытов здесь независимо регистрируется интенсивность каждого из пучков, а) ФЭУ-2 ФЭУ-1 б) О 1 О Рис. 5.19. Схема опыта Брауна и Твисса для измерения корреляционной функции интенсивностей С(т) и график С(т) а не интенсивность результата их наложения, т. е. интерференционной картины. Для полного анализа необходимо учитывать квантовую природу фотоэффекта (статистику фотоотсчетов), но понять принцип метода можно, считая, что в идеальных услови- условиях эксперимента сила тока на выходе каждого ФЭУ пропорциональна мгновенной
220 5. Интерференция света интенсивности*) 1A) падающего света, а флуктуация этого тока пропорциональна А/(I) = 1A) - (/@). Силы фототоков 1ХA - т) и /2@ перемножаются специальной электронной схемой в корреляторе С, и произведение усредняется за большой проме- промежуток времени. Перемещением одного из приемников можно изменять временную задержку г между пучками и получить в результате измерений корреляционную функцию интенсивностей: О(т) = AХ({ - тI2({))/12 = 1 + (Мх({ -т)Ы2A))/12. (Предполагается, что оба пучка имеют одинаковые средние интенсивности: Для пучков строго постоянной интенсивности А/ х = А/2 =0 и О (г) = 1. Но для квазимонохроматического света «мгновенная» интенсивность, пропорциональ- пропорциональная квадрату медленно изменяющейся амплитуды а (г) в E.28), представляет собой случайную функцию времени. При т = 0 (детекторы на одинаковом расстоянии от разделительного зеркала) изменения интенсивности света на обоих ФЭУ происхо- происходят одинаково: 1х(г) = /2(*) = /(*). Поэтому О@) = A2(г))/12 = 1 + ((А/J)//2 > 1. С увеличением времени задержки г корреляция между изменениями интенсивностей на приемниках уменьшается и исчезает совсем, когда г превосходит время коге- когерентности, т. е. эффективную длительность волновых цугов исследуемого излучения: (А1Х(I — г)А/2@) —» 0 при г > тког и О(т) —> 1. Характерный вид зависимости О(т) показан на рис. 5.19,6. Функцию О (г) можно рассчитать, если выбрать определенную статистическую модель излучения. Можно показать, что для типичных источников квазимонохро- квазимонохроматического света, атомы которых излучают независимо друг от друга, флуктуации интенсивности ((А/JI/2 порядка самой интенсивности / и О@) « 2. Минимальное время когерентности, которое удается измерить данным способом (он называется интерферометрией интенсивностей), определяется быстродей- быстродействием элементов установки и может быть порядка 1 —10 нс. Контрольные вопросы • Как определена функция видности интерференционных полос? • Дайте качественное объяснение кривой видности в случае источника, спектр излучения которого состоит из двух близких линий (см. рис. 5.15). • Какую величину называют длиной когерентности? Чему равна длина когерентности для квазимонохроматического излучения, занимающего спектральный интервал шириной 8Х со средним значением длины волны Я? • Почему для наблюдения полос равной толщины в белом свете пленка (или пластинка) должна быть очень тонкой? • Каким образом из наблюдения полос двухлучевой интерференционной картины можно по- получить информацию о спектральном составе излучения? *) Точнее, усредненной за время, большое по сравнению с периодом оптических колебаний, но малое по сравнению с характерным временным масштабом изменения амплитуды а (/) квазимонохроматического света (см. E.28)).
5.4. Интерференция квазимонохроматического света 221 • Сопоставьте спектральный и временнбй подходы к объяснению исчезновения полос в ква- квазимонохроматическом свете при большой разности хода. • Что называется степенью временнбй когерентности колебаний? В каком случае говорят о частичной когерентности интерферирующих пучков? Как степень когерентности связана с видностью интерференционных полос? • Как найти степень когерентности, если известен спектральный состав излучения? • Как измеряется время когерентности исследуемого излучения в методе интерферометрии интенсивности? Задачи 1. Постройте кривую видности У(Д) интерференционных полос, когда спектр излучения ис- источника состоит из двух очень узких близких спектральных линий (8к <С к), интенсивность одной из которых вдвое больше интенсивности другой. Ответ. У(Д) = ^у/8со82E/:А/2) + 1. В минимумах видность принимает значение V = 1/3. Кривая У(Д) показана штриховой линией на рис. 5.15, в. 2. Рассчитайте видность У(А) интерференционных полос, наблюдаемых в случае ис- источника, контур спектральной линии излучения которого имеет гауссову форму 1^(к) = соп81 • ехр[—а2(к — к0J] (неоднородно уширенная спектральная линия). Решение. Воспользуемся формулами E.25) и E.23), где в качестве /(х) = 1\(ко+х) е~а х . Тогда со8(*Д) дх Ке у нужно взять соп8* • е~а х . Тогда оо 7 *~а2 —оо —оо Показатель экспоненты в интеграле, стоящем в числителе последнего выражения, пре- преобразуем к виду — [ах — /А/Bа)]2 — [Д/Bа)]2 и множитель е~'д^2а^ вынесем за знак интеграла. Тогда интегралы в числителе и знаменателе сокращаются. В результате получа- получаем У(Д) = е"~'д^2аI . Кривая такой зависимости видности полос У(Д) от разности хода Д приведена на рис 5.17,6. 3. Найдите степень когерентности у (г) для излучения, спектральный контур которого имеет лоренцевскую форму с полушириной 2Г: (однородно уширенная спектральная линия). Решение. Вычисление у (г) производится по формуле E.39). При интегрировании по со' удобно перейти к новой переменной х = аI — со: оо -и График степени когерентности у (г) в случае однородно уширенной спектральной линии приведен на рис. 5.18, в.
222 5. Интерференция света 5.5. Роль конечных размеров источника света. Пространственная когерентность При анализе интерференционных опытов в п. 5.4 первичный источник предпола- предполагался точечным. Однако все реальные источники света имеют конечные размеры. Увеличение размеров источника, как и расширение спектра излучаемого им света, приводит к ухудшению контрастности (уменьшению видности) интерференционных полос и даже к полному их исчезновению. Чтобы выяснить роль только первого из этих факторов, будем считать здесь излучение монохроматическим. Протяженный самосветящийся источник состоит из большого числа точечных вза- взаимно некогерентных элементов. Поэтому интенсивность в любом месте равна сумме интенсивностей в интерференционных картинах, создаваемых отдельными точечны- точечными элементами источника. В интерференционных опытах по методу деления волнового фронта (см. п. 5.2) полосы на экране перпендикулярны плоскости, в которой находятся первичный то- точечный источник 5 и вторичные источники 51 и52. Использование вместо 5 ли- линейного источника, т.е. достаточно узкой щели, вытянутой перпендикулярно этой плоскости, увеличивает интенсивность и не приводит к ухудшению четкости интер- интерференционных полос. Это уже отмечалось в п. 5.2. Однако увеличение ширины щели приводит к тому, что полосы становятся менее четкими или пропадают совсем. Если размеры источника (т.е. ширина щели 5) много меньше длины световой волны, то интерференционная картина будет резкой, так как разность хода интер- интерферирующих лучей от любой точки источника до некоторой точки наблюдения Р будет практически одна и та же. Но обычно размеры источника значительно боль- больше длины волны, поэтому одинаковые интерференционные картины от разных его элементов сдвинуты одна относительно другой. В результате наложения этих картин интерференционные полосы оказываются более или менее размытыми. Их можно наблюдать лишь при выполнении определенных условий, налагаемых на геометрию эксперимента. Эти условия подробно обсуждаются ниже. Рассмотрим сначала случай, когда источник состоит всего из двух одинаковых неко- некогерентных светящихся точек 8' и 5", находящихся на небольшом расстоянии И друг от друга (рис. 5.20). В интерференционных опытах свет от каждого источника попадает в некоторую точку наблюдения по двум различным путям. Пусть луч, идущий от 8' по одному из этих путей, обра- образует с соединяющей источники линией 8'8" угол /^ (луч I), а по другому пути — угол C2 (ЛУЧ И)- В опы- опыте Юнга, например, лучи I и II идут в направлении ^^^ отверстий 51 и52. Если расстояние ^ между источ- источниками 8' и 8" достаточно мало (много меньше рас- расстояния от них до вторичных источников 51 и 82), Рис. 5.20. К нахождению видности то можно считать, что аналогичные лучи, исходящие интерференционных полос в случае из второго источника 8", образуют с линией 5'5" протяженного источника такие же у^, р и р Оптическая разность хода лу-
5.5. Роль конечных размеров источника 223 чей 8;РA) и 8/;РA), приходящих в точку наблюдения Р от 8' и 8" по первому пути, как видно из рис. 5.20, равна |5;/РA)| — 15^AI = Осо$р1. Аналогично для лучей, приходящих в Р по второму пути, можно написать 15^A1)| — E^A1I =#со8/32. Вычтем почленно эти равенства и перегруппируем слагаемые в левой части: - \5"РA1)\] - [\5'РA)\ - |5'Р(П)|] = О(со8/*, - со8/?2). E.42) Здесь в первой скобке стоит разность хода А" лучей, приходящих в Р по двум путям от источника 8й. Ее значение определяет, будет ли в Р максимальная, минималь- минимальная или промежуточная интенсивность в интерференционной картине, создаваемой источником 8". Во второй скобке стоит разность хода А' лучей, выходящих из 8'. Разность этих величин А" - Д' = О(со$р{ - со$р2) E.43) определяет сдвиг двух интерференционных картин, создаваемых источниками 8' и 8". Если А" - А' — О (или \А" — А'\ <С Я), то максимумы одной картины совпа- совпадают с максимумами второй. При таком точном совмещении интерференционных картин видность полос максимальна (V = 1), так как интенсивность в минимумах равна нулю. С увеличением \А" — А'\ видность полос начинает уменьшаться и при \А" — А'\ = Я/2 обращается в нуль, так как светлые полосы одной картины совмеща- совмещаются с темными полосами другой. В соответствии с E.43) это происходит при ^| со8^! - со8/32| = Я/2. E.44) При дальнейшем возрастании \А" — Д'| интерференционная картина появляет- появляется вновь, причем видность полос периодически изменяется. Когда |А/7 — А7| = тХ (т = 1,2,...), видность полос V = 1. Найдем зависимость видности полос от расстояния ^ между источниками 8' и 5/;. В каждой из налагающихся интерференционных картин распределение интенсивно- интенсивности дается формулой E.8). В результате их наложения получаем / = 2/0A + со8*Д0 + 2/0A + = 4/0 1 + СО8 СО8 При перемещении точки наблюдения Р второй сомножитель в последнем выраже- выражении быстро осциллирует, описывая изменения интенсивности при переходе от одной интерференционной полосы к другой. Светлые и темные полосы расположены в тех местах, где со8[&(Д" + Д')/2] = =Ы, а интенсивность в максимумах и минимумах равна /экстр = 4/о{1 ^ I со$[к(А" — Д/)/2]|}. Отсюда для видности полос суммарной картины получаем 'тах "Г 'г СО8 к(А" - А') E.45) Пусть, например, два источника 8' и 8" освещают экран с отверстиями 51 и 82 в установке Юнга (см. рис. 5.5). Очевидно, что @2~Р\ =а — Угол» П°Д которым вид- видны отверстия ^ и 82 с места расположения источников. Так как а<1, для А" - А'
224 5. Интерференция света приближенно можно написать Д" - А' = О(со$р{ - СО8/32) « й зт/3 • (/?2 ~ Р\) = ° *{пР ' а> EЛ6) где /3 = (/31 + /32)/2. Если линия 5;5/; перпендикулярна оптической оси установки, то /3 = л/2 и А" — А' = Ва. В общем случае (при C Ф л/2) произведение й $тC = й± есть проекция отрезка \8'8"\ на перпендикулярное оптической оси направление и А" — А' = О±а. Так как а = 4/1, где / — расстояние от источников до экрана с от- отверстиями 51 и52, отстоящими на расстояние д, одно от другого, то А" — А1 = й±4/1 и из E.45) получаем V = СО8 21 СО8 XI E.47) Зависимость видности интерференционных полос от расстояния й± между источни- источниками нашла интересное применение в астрономии. У многих двойных звезд компо- компоненты находятся на столь малом угловом расстоянии в друг от друга, что при наблю- наблюдении в телескоп их уширенные дифракцией (см. п. 7.6) изображения сливаются. Для измерения угла в Физо в 1868 г. предложил следующий метод. Перед объективом те- телескопа помещается экран с двумя параллельными щелями, находящимися на рассто- расстоянии д, друг от друга, которые играют ту же роль, что и щели ^ и52в опыте Юнга. Свет каждой из компонент двойной звезды создает свою картину интерференцион- интерференционных полос в фокальной плоскости объектива телескопа. Видность суммарных полос, возникающих при наложении этих картин, определяется формулой E.47), в которой отношение й±/1 и представляет собой искомое угловое расстояние в между компо- компонентами двойной звезды. Расстояние д, между щелями можно изменять. При малом 4, пока вй/Х <С 1, полосы видны отчетливо, так как в E.47) V « 1 (при условии, что звезды имеют одинаковую яркость). Если увеличивать расстояние 4, налагающие- налагающиеся интерференционные картины будут смещаться относительно друг друга и при некотором значении д, = й?0 светлые полосы одной совпадут с темными полосами другой. Как видно из E.47), первый раз такое исчезновение интерференционных по- полос произойдет при лвй^/Х = л/2. Отсюда по измеренному значению расстояния й?0 можно определить угол в: в = Х/Bс10). В 1920 г. Майкельсон измерил по методу Фи- Физо угловое расстояние между компонентами двойной звезды Капеллы, оказавшееся равным 0,042". Этим методом можно даже проследить орбитальное движение звезд вокруг общего центра масс, так как щели на объективе должны быть ориентирова- ориентированы соответствующим образом в зависимости от расположения компонент двойной звезды. Рассмотрим теперь более общий случай протяженного источника света в виде рав- равномерно светящейся полоски (или щели) шириной Э. Можно представить себе, что такой источник состоит из элементарных взаимно некогерентно излучающих поло- полосок, расположенных перпендикулярно линии, соединяющей точки 8' и 8" на рис. 5.20. Условие, при котором происходит первое исчезновение интерференционных полос по мере увеличения ширины й щели, можно получить следующим образом. Разде- Разделим мысленно всю светящуюся полоску на множество пар одинаковых элементов так, чтобы расстояние между элементами любой пары было равно половине ширины полоски, т.е. й/2. Если положение светлых полос интерференционной картины от
5.5. Роль конечных размеров источника 225 одного элемента пары совпадает с положением темных полос картины от другого элемента этой пары, то интерференционные полосы от всего протяженного источни- источника наблюдаться не будут, так как условия совпадения одинаковы для всех пар эле- элементов. Это условие дается формулой E.44), в которой теперь расстояние О между источниками 8' и 8" нужно заменить на Л/2 — расстояние между двумя элементами одной пары протяженного источника: -со8у32| = А. E.48) Последующие исчезновения интерференционных полос произойдут, если шири- ширину источника увеличить в 2, 3,... раз. При промежуточных значениях й полосы появляются, однако видность их незначительна, так как они наблюдаются на рав- равномерном светлом фоне, со- создаваемом участком щели, на ширине которого укладывает- укладывается целое число значений Э из E.48), и лишь оставшаяся меньшая часть создает интер- интерференционные полосы. Количественное исследова- 0 я/2 л\^ ^2п Ъп~ 1-СО8&1 ние (см. задачу 1) показывает, каким образом видность ин- Рис. 5.21. Зависимость видности интерференционных полос терференционных полос зави- от ^«^ ° протяженного источника сит от ширины й протяжен- протяженного источника (рис. 5.21). При ^| соьр^ — со8/?2| = тХ (где т = 1, 2,...) видность, как уже отмечалось, обращается в нуль. Ориентировочно в качестве условия хоро- хорошего наблюдения интерференционной картины от протяженного источника можно принять неравенство -СО8/?2| E.49) При его выполнении видность полос V ^ 2/яг « 2/3. В тех случаях, когда интерферирующие лучи выходят из какой-либо точки про- протяженного источника симметрично относительно перпендикуляра к линии 8'8", проведенного из этой точки (т.е. когда протяженный источник 8'8" ориенти- ориентирован перпендикулярно оси симметрии установки, рис. 5.22), угол /?2 = я — Р^ и со8/?2 = — со8/>1. Тогда условие E.49) можно 8' записать в виде А/4, E.50) где 2(о — угол между выходящими из источника интерферирующими лучами, называемый апер- Рис. 5.22. Симметричное расположение турой интерференции. протяженного источника щ>И больших апертурах наблюдать интерфе- интерференцию можно только от источников, размеры которых меньше длины световой волны. Если со « я/2, т.е. интерферирующие лучи выходят из источника почти в противоположных направлениях, то из E.50) следует, 8 Зак. 4498
226 5. Интерференция света что его протяженность й должна быть меньше А/4. Для наблюдения интерференции с использованием источника, размеры которого много больше длины волны света, геометрия эксперимента должна быть такой, чтобы интерферирующие лучи выходи- выходили из источника под малым углом друг к другу. Когда /32~Р\ = Р> приближенно можно написать со8у31 — со8/?2 ~ зтуЗ • ф2 ~~Р\) — 2<у 8т/> и критерий E.49) при- принимает вид й8ш/? • 2а) ^ -, т.е. й^со ^ - E.51) — при малых апертурах интерференции (й)<1) играет роль протяженность ис- источника только в направлении, перпендикулярном направлению выходящих из него лучей: й± = Э $т/3. Применим критерий E.51) к рассмотренным выше интерференционным опытам. В опыте Юнга (см. рис. 5.4) 2со « с1/Ь, поэтому ширина дополнительной щели 5 и ее угловой размер в = й^/Ь должны удовлетворять условию й±^^19 в^—. E.52) При А = 5 • 10~5 см, Ь = 1 м и й = 0,5 мм из E.52) находим, что ширина щели п± должна быть меньше 0,5 мм. Рассмотрим опыт с зеркалами Френеля (см. рис. 5.5). Для точки наблюдения Р, лежащей в центре интерференционного поля, угол 2со между выходящими из ис- источника 5 интерферирующими лучами легко найти из построения, приведенного на рис. 5.23. Угол 8 (равный углу между зеркалами) является внешним для треугольни- треугольника 8ХОР и поэтому 8 — со + а/2. Для половины угла схождения лучей можно написать а/2 — а8/{а-\-Ь). Исключая из этих уравнений а/2, находим со = = 8Ь/(а + Ъ). Подставляя со в E.51), получаем следующее ограничение на ширину О± щели источника 5: О± ^ ^ Х{а + Ь)/DЬ8). Если Ь > а, то это условие принимает вид О± <сА/D5). Чтобы можно было наблюдать полосы с источником, для которого й± > Я, угол между зеркалами должен быть очень мал (8 <С 1). Можно показать, что в опыте с зеркалами Френеля апертура интерференции 2со имеет практически одно и то же значение при любом положении точки наблюдения Р на экране в области, где пере- перекрываются интерферирующие пучки (см. задачу 2). Поэтому видность полос одина- одинакова по всему интерференционному полю. В опыте с бипризмой Френеля (см. рис. 5.7 и задачу 3) апертура интерферен- интерференции также практически одинакова по всему полю и равна 2со = C(п — \)Ь/{а + Ъ) « «уЗ(л— 1) (последнее справедливо при а<^Ъ). Подставляя со в E.51), находим й± <С Я/[2/3(п — 1)]. При использовании протяженного источника, размеры которого Рис. 5.23, Апертура интерференции в опыте с зеркалами Френеля
5.5. Роль конечных размеров источника 227 велики по сравнению с длиной волны (при й± ^> Я), для выполнения критерия E.51) угол E бипризмы должен быть мал. При анализе интерференционного опыта Поля (см. рис. 5.9) для упрощения будем пренебрегать преломлением в слюде, т. е. заменим пластинку двумя отражающими параллельными плоскостями, расстояние между которыми равно толщине к пла- пластинки. Тогда расстояние между вторичными источниками 5| и 52 (мнимыми изоб- изображениями источника 5) равно 2к. Легко видеть, что угол схождения лучей в точ- точку наблюдения в этом опыте равен апертуре интерференции 2а>. Расстояние \8ХР\ равно {а 4- Ъ)/ СО8 0, поэтому 2а> = 2к^тв/\8^Р\ = к$т26/(а -Ь Ъ). Толщина к ли- листочка слюды очень мала (« 0,05 мм) по сравнению с а + Ь (« 5 м), поэтому ма- мала и апертура интерференции 2со (при любом положении точки наблюдения Р9 включая в = 45°). Следовательно, размер источника 5 может быть достаточно боль- большим: из E.51) находим О± ^ Х(а -Ь Ь)/{2к$т20). При Я = 5 • 10~5 см, к = 0,05мм, а + Ь = 5ми0 = 45° должно быть О± ^ 2,5 см. Для демонстрации опыта Поля мож- можно использовать небольшую ртутную лампу без всяких дополнительных щелей, что обеспечивает большую светосилу. С помощью листочка слюды площадью несколь- несколько квадратных сантиметров можно получить яркую интерференционную картину больших размеров, покрывающую потолок и стены аудитории. Размер источника (« 10мм) гораздо больше расстояния |5152| (~ 0,1мм), так что мнимые изображе- изображения источника почти полностью перекрываются. При наблюдении локализованных в бесконечности полос равного наклона (см. рис. 5.10) оба интерферирующих луча выходят из источника в одном направлении, т.е. апертура интерференции равна нулю. Поэтому здесь нет никаких ограничений на размер источника. Зависимость видности полос от апертуры интерференции можно наглядно проде- продемонстрировать в опыте с зеркалом Ллойда (рис. 5.24). Здесь прямой пучок света от источника 5 интерферирует с пучком, отраженным от зеркала при почти скользящем падении. В отличие от опытов Юнга или Френеля в опыте Ллойда апертура интерференции сильно зависит от положения точки наблюдения Р на экране, установленном перпендикулярно плоскости зеркала. Из рис. 5.24 видно, что 2(о « 2х/1. Аперту- Апертура тем меньше, чем ближе точ- точка Р к плоскости зеркала. При использовании протяженного ис- источника 5 видность полос замет- ' но убывает по мере удаления от точки х = 0. Критерий E.51) Рис. 5.24. Схема интерференционного опыта позволяет определить размер об- с зеРкалом Л™^* ласти, в пределах которой вид- видность полос V ^ 2/3 при заданной ширине й± щели источника 5: х ^ Х1/DО±). На вдвое большем расстоянии Я//B#±) полосы пропадут. Угол схождения лу- лучей, как видно из рис. 5.24, равен а « 2/г//. Ширина интерференционной полосы Ах &Х/а &Х1/Bк). Поэтому полное число полос на этом расстоянии составит
228 5. Интерференция света N = Н/й^. Это соотношение дает оценку наивысшего порядка интерференции в мо- монохроматическом свете от протяженного источника в опыте Ллойда. При исследовании видности полос в опытах с протяженным источником рассмат- рассматривалось наложение интерференционных картин, создаваемых отдельными его эле- элементами. Но возможна и другая постановка этого вопроса, основанная на понятии пространственной когерентности колебаний в пучке света от протяженного ис- источника. Обратимся для определенности к схеме опыта Юнга (см. рис. 5.5). Будем считать, что первый экран А с отверстием 5 отсутствует, а пучок света от монохро- монохроматического источника падает непосредственно на экран В с точечными отверсти- отверстиями $! и 52. Эти отверстия можно принять за вторичные источники, посылающие световые волны на экран С, где наблюдается интерференционная картина. Когда первичный источник точечный, световые колебания в отверстиях 51 и 52 когерентны и видность полос на экране С максимальна: V = 1. В случае протяжен- протяженного источника видность полос меньше единицы. При заданном расстоянии й между отверстиями 5| и 82 она зависит от отношения поперечного размера источника О^ к расстоянию Ь между источником и экраном В, т.е. от углового размера источника в = О^/Ь. Если в < X/Bс1), то из E.52) следует, что видность V ^ 2/3, т.е. поло- полосы видны отчетливо. С увеличением в видность уменьшается, и при в = XI й по- полосы пропадают совсем. Уменьшение видности полос можно объяснять частичной когерентностью световых колебаний в точках $! и $2, возбуждаемых протяжен- протяженным источником. Для количественной характеристики этой когерентности колебаний в разных точках поперечного сечения светового пучка вводится понятие степени пространственной когерентности у12. Она характеризует способность световых колебаний в пространственно удаленных точках $1 и 52, взятых в некотором попе- поперечном сечении пучка, к созданию стационарной интерференционной картины, если свет из точек 8^ и 82 будет каким-либо способом сведен в одну точку (в опыте Юн- Юнга это происходит в результате дифракции на отверстиях в экране В, совпадающих с точками $! и 52). В пучке света от точечного источника колебания в $1 и 52 полностью когерентны, поэтому у12 = 1 и видность полос при интерференции волн из 8^ и 52 максимальна. В пучке света от протяженного источника степень пространственной когерентно- когерентности у12 зависит от расстояния с1 между точками $! и 52 и от угловых размеров источника в — й^/Ь. При 0с1 ^ X степень когерентности обращается в нуль: колеба- колебания в 51 и 82 некогерентны и при наложении волн из 51 и 82 наблюдается просто сложение интенсивностей, т. е. интерференция отсутствует. Световое колебание в какой-либо точке, скажем 51? в пучке света от протяженного источника возникает в результате сложения колебаний в волнах, приходящих в эту точку от разных элементарных излучателей (атомов), содержащихся в источнике. Амплитуда и фаза результирующего колебания в $! представляют собой случайные функции времени: Изменения а^(г) и ф^), а следовательно, и комплексной амплитуды ЕщA) проис- происходят медленно в масштабе периода световых колебаний 2л/а), но очень быстро
5.5. Роль конечных размеров источника 229 в масштабе времени, необходимого для наблюдения. Если сместиться из точки $1 в другую (близкую) точку 52, то фазы суммируемых колебаний от отдельных ато- атомов несколько изменятся из-за того, что расстояния от них до 82 будут иными. При малом расстоянии между 51 и 52, пока длины оптических путей от отдельных эле- элементов источника до 51 и $2 отличаются на величину, малую по сравнению с длиной когерентности, случайные изменения амплитуды и фазы результирующих колебаний в^ и52 происходят согласованно. С увеличением расстояния между ^ и52 эта корреляция ослабевает и пропадает совсем, когда оптические длины до $1 и $2 Раз~ личаются больше чем на Я2/АЯ. Пусть оптические пути от 51 и 52 до точки наблюдения Р различаются на Д, т. е. колебание из 52 происходит в точке Р с запаздыванием на время т = Д/с. Тогда результирующее колебание в Р описывается функцией Ех @ + Ег(г - г) = \ЕХ0{1) + Е20(/ - г) е'"'] е"** и его интенсивность пропорциональна выражению - г)> + 2Ке (Е1О({)Е^({ - г)) е"'^. E.53) Первые два слагаемых здесь пропорциональны интенсивностям волн из 5'1 и 82. Эти интенсивности мы будем считать одинаковыми. Выражение (Е10A)Е20(г — т)) представляет собой корреляционную функцию для комплексных амплитуд ЕщA) и /?2о@- ® стационарном случае корреляционная функция зависит от т, но так же, как и средние интенсивности, не зависит от времени. Корреляционную функцию, де- деленную на интенсивность одной волны /0 ^ (Е10A)Е*0A)) = (Е20A)Е20A)), т.е. нор- нормированную корреляционную функцию )> ' ( ] называют комплексной степенью когерентности световых колебаний в точках 5^ и 82. Учитывая это определение, перепишем формулу E.53): / = 2/0[1 + Кеу12(т) е-/л*] = 2/0[1 + |у,2(т)| со8(й>г + 8п)]. E.55) В частном случае, когда точки ^ и52 совпадают, Уц{т) характеризует корреляцию между колебаниями в одной точке в разные моменты времени г и г — т и представля- представляет собой рассмотренную в п. 5.4 комплексную степень временндй когерентности E.31): Уц(т) = у{т). Для света от квазимонохроматического источника она описы- описывает зависимость видности полос от разности хода Д = ст двух интерферирующих волн, возбуждаемых колебанием в точке 5^ В случае несовпадающих точек 5'1 и 52, но при т = 0, величина )>12@) характери- характеризует корреляцию колебаний в разных пространственных точках в один момент вре- времени. Это степень пространственной когерентности световых колебаний в точ- точках $! и 82. Ее модуль в соответствии с E.55) равен видности интерференционных полос в том месте, куда колебания из 51 и 82 приходят с разностью хода Д « 0 (т.е. видность полос низкого порядка). Когда |у12@)| = 1, говорят о полной прост- пространственной когерентности, когда 0 < |у12@)| < 1 — о частичной когерентности
230 5. Интерференция света колебаний в точках 5] и 52. Свет от протяженного источника, возбуждающий ко- колебания в отверстиях ^ и 52, можно рассматривать как смесь когерентного и неко- некогерентного, причем модуль степени пространственной когерентности |У12@)|, как видно из E.55), определяет долю полностью когерентного света в этой смеси. Уменьшение степени пространственной когерентности колебаний в световом пуч- пучке обусловлено конечным угловым размером источника. Второй подход к описанию уменьшения видности полос при увеличении размеров источника, основанный на по- понятии пространственной когерентности, отличается от разобранного ранее тем, на каком этапе производится суммирование действий различных участков источника. В первом подходе это суммирование производилось на последнем этапе, т.е. в ин- интерференционной картине, во втором — на промежуточном этапе, в той плоскости, где расположены отверстия $1 и 52. В выбранном поперечном сечении пучка света от протяженного источника сте- степень пространственной когерентности у12 убывает с увеличением расстояния й меж- между точками $! и 82- В частном случае, когда источник представляет собой равномер- равномерно светящуюся полоску с угловой шириной 0, зависимость у12 от й имеет вид (см. задачу 1) я&//А) E'56) Этот результат получен при суммировании интерференционных картин, созда- создаваемых отдельными элементами протяженного источника (т.е. с использованием первого подхода). Но степень пространственной когерентности можно рассчитать и непосредственно на основе определения E.54), выбрав ту или иную статистиче- статистическую модель протяженного источника света. Знание у12 может быть использовано при определении геометрии эксперимента, обеспечивающей возможность наблюде- наблюдения интерференции (т. е. допустимых угловых размеров источника, апертуры интер- интерферирующих лучей и т.д.). Пока расстояние й между точками $! и 52 мало (й <^С А/0), степень простран- пространственной когерентности у12 « 1. При возрастании й она уменьшается и, как видно из E.56), при й — Х/в обращается в нуль. С дальнейшим ростом Л степень про- пространственной когерентности |у12| испытывает осцилляции постепенно убывающей амплитуды (см. рис. 5.21),*) но не превышает значения « 0,2. Поэтому в качестве размера области когерентности (т.е. части поперечного сечения пучка, в преде- пределах которой световые колебания в любой паре точек частично когерентны) можно принять с1К0Г « Х/в. Так как 0 = О±/Ц то размер области когерентности возрастает пропорционально расстоянию Ь от источника. Если источник имеет равномерно светящуюся поверхность в форме прямоуголь- прямоугольника, размеры области когерентности обратно пропорциональны соответствующим сторонам источника: й^ = А/015 с12 = А/02. В практически важном случае источника в форме равномерно светящегося диска с угловым диаметром 0 область когерентно- когерентности представляет собой круг диаметром й « 1,22А/0 (для точек 51 и 52, находящихся на таком расстоянии, степень когерентности у12 первый раз обращается в нуль). Сол- Солнечный диск виден с Земли под углом 0 « 30' » 10~2рад. Пренебрегая изменением *} В тех интервалах изменения с/, где уп < 0, в центре интерференционного поля расположена темная полоса.
5.5. Роль конечных размеров источника 231 яркости по его поверхности, для диаметра области когерентности при прямом сол- солнечном освещении получим й та 0,06мм (при А = 0,5 • 10~4 см). Если щели 8^ и 82 в опыте Юнга расположить на расстоянии, меньшем 0,06 мм, то интерференцию можно наблюдать при непосредственном освещении щелей ^ и 52 прямыми лучами Солнца, без вспомогательного экрана А с отверстием 5. Измеряя зависимость степени пространственной когерентности \у12\ (видности ин- интерференционных полос) от расстояния между точками 51 и 52, можно определить угловой размер протяженного источника света. Такой метод был предложен Физо и осуществлен Майкельсоном для определения угловых размеров астрономических объектов. Об измерении угловых расстояний между компонентами двойных звезд уже было сказано выше. Попытки измерить угловые диаметры одиночных звезд, помещая ^ экран с щелями перед объективом телескопа, * оказались неудачными, так как полосы остава- оставались четкими даже при наибольших расстояни- ^ - ях между $! и 52, допустимых размерами те- [- лескопов. Майкельсон преодолел эту трудность ^ ^ * с помощью звездного интерферометра^ прин- принцип действия которого понятен из рис. 5.25. Рас- положенные против щелей зеркала М1 и М2 неподвижны, а зеркала М3 и М4 можно одновре- рис ^ Схема звездного менно раздвигать. Очевидно, что видность полос интерферометра Майкельсона зависит от степени когерентности световых ко- колебаний на зеркалах М3 и М4, хотя период ин- интерференционной картины (ширина полос) определяется расстоянием между зерка- зеркалами М^ и М2. При максимальном расстоянии между внешними зеркалами ~6м наименьший поддающийся измерению угловой диаметр составляет 0,02/;. Несмотря на простоту идеи, практическое осуществление звездного интерферометра сопряже- сопряжено с преодолением многочисленных технических трудностей, связанных с жесткими требованиями к его механической конструкции. Первой звездой, у которой удалось определить диаметр, была Бетельгейзе (а Ори- Ориона), относящаяся к красным гигантам. Угловой диаметр этой звезды оказался рав- равным 0,047". Зная расстояние до Бетельгейзе, рассчитанное по параллаксу, можно найти линейный диаметр звезды. Он равен примерно 4 • 108 км, что почти в 300 раз больше диаметра Солнца и превышает диаметр земной орбиты C • 108км). Таким способом были измерены угловые диаметры нескольких звезд. Все они, подобно Бе- Бетельгейзе, гиганты, во много раз превосходящие Солнце. Подавляющее большинство звезд мало отличается по своему диаметру от Солнца. На расстоянии до ближай- ближайшей звезды солнечный диск был бы виден под углом лишь 0,007", что соответствует области когерентности размером « 20 м. Постройка интерферометра с такой базой (расстоянием между внешними зеркалами) представляет собой крайне сложную тех- техническую задачу. Кроме того, при большой базе наблюдения осложняются турбу- турбулентностью атмосферы, хотя на работе интерферометра это сказывается меньше, чем при наблюдении в телескоп. Изменения показателя преломления воздуха пе- перед зеркалами влияют на разность фаз лучей и лишь смещают интерференционную
232 5. Интерференция света картину, не сказываясь на ее видности, так что полосы остаются различимыми, если эти изменения происходят медленно. По принципу звездного интерферометра Майкельсона работают радиоинтерфе- радиоинтерферометры: сигналы с двух радиотелескопов, установленных в разных местах, подают на общий детектор. Большое угловое разрешение достигается за счет значитель- значительного увеличения расстояния между антеннами. Переход к большой длине волны (А « 10 см) радиодиапазона по сравнению с оптическим ведет к снижению разре- разрешающей способности, но это компенсируется возможностью осуществления радио- радиоинтерферометров с очень большими базами (вплоть до межконтинентальных рас- расстояний). Таким путем было достигнуто почти в сто раз большее разрешение, чем у звездного интерферометра Майкельсона. Определение размеров области когерентности и угловых размеров удаленного ис- источника возможно не только из измерений видности интерференционных полос, но и с помощью предложенного Брауном и Твиссом метода интерферометрии интен- сивностей. (В п. 5.4 было рассмотрено применение этого метода для нахождения времени когерентности.) Свет от звезды фокусируется двумя вогнутыми зеркалами на два фотоумножителя, сигналы которых после усиления перемножаются электрон- электронной схемой. Корреляция флуктуации регистрируется в зависимости от расстояния между зеркалами. С увеличением расстояния корреляция уменьшается и пропадает совсем, когда это расстояние превысит размер области когерентности. Таким об- образом, корреляционные измерения интенсивности также позволяют определить сте- степень пространственной когерентности |У12(О)| исследуемого излучения. Интерферо- Интерферометр интенсивностей имеет некоторые преимущества по сравнению со звездным ин- интерферометром Майкельсона. Здесь регистрируется непосредственно интенсивность, зависящая только от амплитуды, поэтому искажения фазы световой волны, возника- возникающие вследствие нерегулярных изменений показателя преломления атмосферы, не влияют на результаты корреляционных измерений. Этот метод значительно менее чувствителен к неточностям в перемещении зеркал, что позволяет использовать го- гораздо ббльшие базы и находить очень малые угловые размеры звезд. В частности, был создан интерферометр интенсивностей с базой до 180 м для измерения угловых диаметров звезд вплоть до 0,0005". Контрольные вопросы • Дайте качественное объяснение периодическому изменению видности полос в опыте Юнга при увеличении расстояния А между отверстиями ^ и 52, если на них падает свет от двух точечных источников, находящихся на небольшом угловом расстоянии. • Какому условию удовлетворяет ширина протяженного источника в виде полоски равномер- равномерной яркости при первом исчезновении интерференционных полос в опыте Юнга? • Какую величину называют степенью пространственной когерентности? Как она связана с видностью интерференционных полос? • Как размеры области когерентности в пучке света от протяженного источника зависят от расстояния и от размеров источника? Оцените размер области когерентности при прямом солнечном освещении. • Объясните принцип действия звездного интерферометра Майкельсона.
5.5. Роль конечных размеров источника 233 Задачи 1. Найдите зависимость видности интерференционных полос от ширины протяженного источ- источника света. Решение. Воспользуемся рис. 5.20, где под $' и 8" будем понимать крайние точки рав- равномерно светящейся полоски (или щели), вытянутой в направлении, перпендикулярном плоскости чертежа. Направим ось х вдоль $'$", выбрав начало отсчета в середине этого отрезка. Разделим мысленно весь источник на элементарные полоски шириной сЬс. Распре- Распределение интенсивности в интерференционной картине, создаваемой одним элементом <к, определяется формулой E.8), в которой /0 следует заменить на /0 дх/О. Разность хода Д(;с) от данного элемента до точки наблюдения Р для двух интерферирующих лучей может быть записана в виде Д(х) = Ао 4- - соз/?2)*, где До — разность хода для лучей, выходящих из середины источника (точки х = 0). Вы- Вывод этого выражения аналогичен выводу формулы E.42). Распределение интенсивности в интерференционной картине от всего протяженного источника находится суммировани- суммированием картин от отдельных элементов: =ТГ 0/2 0/2 -О12 где у = *(соз/?1 — со8/?2)- Выполняя интегрирование, получаем 1 = 21 Г1 + 5т(*Ао + уР/2) - зт(*Ао - уР/2) ~\ _ 0 I- у О уп/2 соз Значения Аоиу = к(созр{ — соз^2) зависят от положения точки наблюдения Р. При пере- перемещении Р сомножитель соз кА^ быстро осциллирует, описывая изменения интенсивности при переходе от одной интерференционной полосы к другой, в то время как медленно изменяющийся сомножитель $т(уО/2)/(уп/2) дает плавную огибающую этих осцилля- осцилляции. Поэтому можно считать, что экстремумы интенсивности имеются в тех точках, где соз/:До = ±1, т.е. /:До = тл (т — целое число). Таким образом, интерференционные по- полосы от протяженного источника расположены там же, где и полосы от точечного источ- источника, находящегося при х = 0 (в середине протяженного источника). Для видности полос получаем следующее выражение: V = ГО/2 — соз/?2)/А] В общем случае рх и р2 зависят от положения точки наблюдения Р9 поэтому видность по- полос может быть неодинаковой в разных местах интерференционного поля. Зависимость видности от ширины О источника показана на рис. 5.21. В опыте Юнга (см. рис. 5.5) /^(соз/?! — соз/?2) « /)±<//У[, = вй и видность полос равна V = Покажите, что в опыте с зеркалами Френеля апертура интерферирующих лучей для точки наблюдения Р, лежащей на краю интерференционного поля, равна 2со « 28Ь/(а + Ъ) « 28 (последнее при а <С Ь), т. е. практически такая же, как и для центральной области.
234 5. Интерференция света 3. Найдите апертуру интерференции для опыта с бипризмой Френеля (см. рис. 5.7). Ответ. 2а) » 2р(п - \)Ъ/(а + Ъ). 5.6. Двухлучевые интерферометры Интерферометрами называют оптические приборы, действие которых основано на явлении интерференции света. Они предназначены для точных измерений длин, уг- углов, характеристик оптических поверхностей, показателей преломления сред или их изменений, спектрального состава исследуемого излучения и т.п. Наблюдение ин- интерференционных полос при этом становится не целью исследования, а средством проведения измерений. В зависимости от характера решаемой задачи к оптической схеме интерферометра и его конструкции предъявляются различные требования. В интерферометре Рэлея, предназначенном для измерения показателей прелом- преломления газов и жидкостей, использован, как и в опыте Юнга, метод деления волно- волнового фронта. Источник в виде узкой щели 5 расположен в фокальной плоскости линзы Ьх (рис. 5.26). Выходящий из нее параллельный пучок идет через диафрагму с двумя щелями $! и 52, параллельными щели 5. Пучки света от $1 и 52 про- проходят через кюветы К1 и К2 и образуют интерференционные полосы в фокальной плоскости линзы Ь2. Введение кювет, содержащих исследуемые газы или жидкости, требует значительного расстоя- расстояния между ^ и 52, вследствие чего интерференционные поло- ^>х@^ сы располагаются тесно и для их наблюдения требуется боль- ^ шое увеличение. Для этой цели удобен цилиндрический окуляр Рис. 5.26. Схема интерферометра Рэлея (вид сверху) в ввде тонкой стекЛянной па- палочки, ось которой параллельна полосам. Кюветы занимают только верхнюю половину пространства между линза- линзами Ь^ и Ь2, а внизу свет идет вне кювет. Благодаря этому возникает вторая система интерференционных полос с таким же расстоянием между полосами, которая может служить шкалой для отсчета. Верхняя система полос сдвинута относительно нижней, так как при прохождении света через кюветы появляется добавочная разность хода д = (п2 — п^I9 где /11 и п2 — коэффициенты преломления веществ, заполняющих кюветы. По этому смещению определяют п2 — пх. В один из пучков ставится компен- компенсатор, с помощью которого можно добиваться, чтобы плавно изменялась оптическая разность хода, противоположная по знаку той, которая обусловлена прохождением света через кюветы. Совпадение двух систем полос используется для установления полной компенса- компенсации разности хода. Визуально можно установить совпадение с точностью до 1/40 по- порядка, что при / = 0,1 м, Я = 550 нм позволяет обнаружить изменение п2 — «1 око- около 10~7. Интерферометр Жамена состоит из двух одинаковых толстых пластин Р1 и Р2 (рис. 5.27), изготовленных из весьма однородного стекла (или кварца для
5.6. Двухлучевые интерферометры 235 Рис. 5.27. Схема интерферометра Жамена (вид сверху) работы в ультрафиолетовой области спектра). Задние поверхности плас- пластин посеребрены. Пучок света от протяженного источника падает под углом, близким к 45°, на одну из пластин. В результате отражения от передней и задней поверхностей пластины /I возникают два парал- параллельных пучка, разделенных тем больше, чем толще пластина. Каж- Каждый из них в свою очередь раздваи- раздваивается при отражении от двух по- поверхностей пластины Р2. Средние пучки 7 и 2 налагаются и образу- образуют интерференционную картину в фокальной плоскости зрительной трубы Т. Для разности хода между ними с помощью формулы E.10) находим А = 2пк(со$62 - СО5 01) « 2нй81п0/ • 8в\ где к — толщина пластин; п — показатель преломления их материала; в^ и в2 — углы падения на поверхности пластин Р1 и Р2; в{ и в2 — соответствующие углы преломления. Если пластины строго параллельны, то в\ = в2 и А = 0. Поле зрения будет равномерно освещенным. При юстировке одну из пластин слегка наклоня- наклоняют, поворачивая вокруг горизонтальной оси. При этом интерференционные полосы, наблюдаемые в установленную на бесконечность зрительную трубу, горизонтальны и эквидистантны. Они соответствуют низким порядкам интерференции и потому могут наблюдаться в белом свете. Значительное разведение пучков между пластина- пластинами позволяет поместить на их пути кюветы К^ и К2 с исследуемыми веществами. При этом оптическая разность хода изменится на (п2 — п^I, что вызовет смещение интерференционной картины. По такому же принципу устроен интерферометр Рождественского (рис. 5.28). Роль делителей пучков — внутренних граней пластин в интерферометре Жамена — играют здесь полуотражающие плоскопараллель- плоскопараллельные пластины Л! ий15а посеребренных наружных граней пластин — зеркала А2и В2. Это позволяет без использования толстых пластин значительно раздвинуть пучки света и ввести кюветы Кх и К2, одна из которых окружена печью (для исследова- исследования паров металлов). Пластины А^9 А2 и В^9 В2 установлены попарно на общих основаниях стро- строго параллельно. Блоки из А1э А2 и Вх, В2 мо- могут быть разнесены на значительное расстояние (« 1 м). Один из них наклоняется на небольшой угол поворотом вокруг горизонтальной оси. По- Поэтому, как и в интерферометре Жамена, наблю- наблюдаются горизонтальные полосы равного наклона, соответствующие (при отсутствии кювет) низким порядкам интерференции. Рис. 5.28. Схема интерферометра Рождественского
236 5. Интерференция света а)\ На основе такого прибора Д. С. Рождественским в 1912 г. были выполнены класси- классические исследования зависимости показателя преломления от длины волны вблизи линий поглощения (т. е. аномальной дисперсии, см. п. 2.5) в парах металлов. Гори- Горизонтальные интерференционные полосы в белом свете проецируются на вертикаль- вертикально расположенную входную щель спектрографа. Поло- Положение светлой полосы нулевого порядка не зависит от длины волны, и поэтому в сплошном спектре, давае- даваемом спектрографом, ей соответствует горизонтальная светлая полоса, тянущаяся вдоль всего спектра. Макси- Максимумы, соответствующие ненулевым порядкам интерфе- интерференции (т = ±1, ±2,...), находятся для разных длин волн падающего света на разных высотах щели спек- спектрографа. Им отвечают в сплошном спектре светлые полосы (рис. 5.29, а), лежащие выше и ниже нулевой полосы и постепенно расходящиеся веером от синей к красной области спектра, так как расстояние меж- между максимумами растет с увеличением длины волны. На коротком участке спектра, показанном на рис. 5.29, это расхождение полос практически не заметно (поло- (полосы почти параллельны). Направим ось х вдоль нулевой полосы в спек- спектре. Точки этой оси соответствуют разным значени- значениям длины волны А. Ось у направим параллельно щели Рис. 5.29. Интерференционные , ^ полосы, развернутые в спектр, спектрографа. Расстояние между интерференционными и крюки Рождественского максимумами пропорционально длине волны, поэтому для ординаты полосы т-го порядка можно написать ут = атА, где а — постоянная, определяемая геометрией установки. Наклон по- полос ёут/с1А = ат возрастает с увеличением порядка интерференции т. Если кювету на пути одного из пучков заполнить веществом с показателем преломления п = и (А), а вторую кювету откачать, то оптическая разность хода изменится на (п — 1)/ и поло- полосы сместятся вверх или вниз на расстояние а(п — 1)/. Тогда ордината полосы т-го по- порядка определяется выражением (л-1)/], E.57) причем знак зависит от того, в какое из плеч интерферометра введена кювета с иссле- исследуемым веществом. Полоса нулевого порядка (т = 0), ранее удовлетворявшая усло- условию у = 0 (т.е. совпадавшая с осью абсцисс), теперь будет описываться уравнением у — ±а(п — 1)/. Это значит, что нулевая полоса в определенном масштабе, завися- зависящем от настройки интерферометра, вычерчивает зависимость п — 1 от А, т. е. дает непосредственно кривую дисперсии. Полосы ст^О прочертят почти подобные кри- кривые, так как слагаемое атХ в E.57) обычно невелико и изменяется с длиной волны очень медленно. На рис. 5.29, б показаны полосы, воспроизводящие ход дисперсии с ее характерными особенностями вблизи линии поглощения. Описанный метод измерения «(А), предложенный Пуччианти в 1901 г., нагляден, но мало пригоден для количественного исследования дисперсии, так как измере- измерение положения точек на круто изменяющей свое направление кривой сопряжено
5.6. Двухлучевые интерферометры 237 с большими погрешностями. Рождественский разработал новый метод исследования дисперсии вблизи линии поглощения (так называемый метод крюков), позволяющий проводить измерения с большой точностью. В одно из плеч интерферометра вво- вводится тонкая плоскопараллельная стеклянная пластинка определенной толщины /'. Это ведет к большой добавочной разности хода {п! — I)/7, где п! — показатель пре- преломления пластинки. Пока в кювете, расположенной в другом плече, исследуемого вещества нет, будут наблюдаться наклонные интерференционные полосы высоких порядков т ^> 1 (рис. 5.29, в). При одновременном действии исследуемого вещества (паров металла) и стеклянной пластинки вызываемые ими противоположные сме- смещения полос суммируются для каждого значения А. Вдали от линии поглощения показатель преломления п разреженных паров близок к 1, поэтому наклон полос обусловлен только стеклянной пластинкой. Вблизи линии поглощения показатель преломления паров изменяется очень сильно и найдется такая длина волны, для ко- которой действия паров и пластинки будут точно скомпенсированы, так что наклон интерференционной кривой пройдет через нуль. В результате полосы вблизи линии поглощения своеобразно изгибаются, образуя крюки, положения вершин которых на шкале длин волн можно измерить со сравнительно высокой точностью (рис. 5.29, г). В электронной теории дисперсии зависимость показателя преломления от час- частоты в разреженных газах и парах описывается выражением B.51). В окрестности одиночной линии поглощения на частоте оHк можно оставить в B.51) только слага- слагаемое с а>Ок. Пренебрегая ук по сравнению с \а>Ок — а)\9 получаем для п(со) следующее выражение (формула Зельмейера): СГС: „2_1 = 4^_/^_; си. Й2_1 = ^1_А_ E58) Здесь N — концентрация атомов, находящихся в основном состоянии; т0 — масса электрона; /к — сила осциллятора для перехода из основного состояния Ео в воз- возбужденное с энергией Ек = Ео + ?шОк. Перейдем в E.58) от частот к длинам волн, подставив со = 2яс/А, и учтем, что п2 — 1 = (п — 1)(п + 1) « 2(п — 1): 2лт0с2 Х1к -Х2 4лт0с2(Х - ХОк)' Ме2/к$к E'59) ^ - А2 (H0( Ок) В последнем равенстве учтено, что в окрестности линии поглощения А« Теоретическая зависимость показателя преломления от длины волны, описыва- описываемая вблизи линии поглощения формулой Зельмейера E.59), была подтверждена экспериментально в работах Рождественского и его учеников. Основное достоин- достоинство метода крюков заключается в том, что он позволяет по расстоянию между вершинами крюков найти произведение N/к. Если число атомов в единице объема N известно, то можно найти одну из важных атомных констант — силу осциллятора /к. Покажем, как М/к можно вычислить по измеренному расстоянию между верши- вершинами крюков. При наличии кюветы с парами исследуемого вещества в одном плече
238 5. Интерференция света интерферометра и стеклянной пластинки в другом ордината ут полосы т-го порядка будет вместо E.57) определяться выражением ут = а[тХ ±(п- 1I т (*' - 1)/']. E.60) Для нахождения положения вершин крюков т-й полосы, т. е. экстремумов зависимо- зависимости ут от А, составим уравнение ф>т/с1А = 0: т±1*1' = ° Показатель преломления паров вблизи линии поглощения изменяется очень быст- быстро, в то время как для стекла во всей видимой области, где оно прозрачно, п! изменя- изменяется очень медленно. Поэтому последним членом в уравнении E.61) можно прене- пренебречь и для длин волн, соответствующих вершинам крюков, приближенно получаем <\п/6Х = ц^т/1 = — \т\/1. С другой стороны, формула Зельмейера E.59) позволяет связать эту производную йп/дЛ с М/к: сгс. <Ь ^/**о* . ги. Ф» ¦ дЛ 42(ЯЯJ' • 1А Приравнивая правые части последних двух выражений, получаем СГС: м/к = \т\*Щ^(&Х)>; СИ: Щ&ё? где ДА = А — Ао^ — расстояние от вершины крюка до центра линии поглощения. У одиночной линии поглощения крюки расположены симметрично, так что расстоя- расстояние между их вершинами равно 2АА. Для определения порядка интерференции \т\, соответствующего полосе, на которой измеряется расстояние 2АА между крюками, можно воспользоваться картиной наклонных полос, пока кювета с исследуемым ме- металлом не нагрета. В этом случае п - 1 = 0 и из E.60) ут = а\тХ =р {п' - 1)/']. Изме- Измеряя длину волны Аш в точке пересечения некоторой полосы с осью х (когда ут = 0), находим соответствующий этой полосе порядок интерференции \т\ = (п! - \I'/Хт. Можно обойтись и без знания величины (п! — 1)/', если измерить кроме Хт дли- длину волны Хт+р в точке пересечения оси х полосой, отстоящей от рассматриваемой на р порядков. Тогда тХт = (т + р)Хт+р и \т\ = рХт+р/(Хт - Аш+?). Определив по- порядок интерференции \т\ некоторой полосы, по измеренному на ней расстоянию 2АА между крюками находим с помощью E.62) силу осциллятора /к. Ореди двухлучевых интерферометров широкое распространение получили различ- различные модификации интерферометра Майкелъсона (см. рис. 5.11), принцип действия которого был рассмотрен в п. 5.3. О его применении для исследования тонкой струк- структуры спектральных линий говорилось в п. 5.4. Главная особенность интерферометра Майкельсона по сравнению с интерферо- интерферометрами других типов заключается в том, что с его помощью можно непрерывно из- изменять разность хода между пучками в широких пределах путем перемещения одного
5.6. Двухлучевые интерферометры 239 из зеркал и наблюдать при этом интерференционные полосы высоких порядков. Это необходимо как для измерения длины когерентности излучения узких спектральных линий, так и для выполнения метрологических работ по прямому сравнению длины световой волны (т. е. оптического эталона длины) с концевой мерой, представляю- представляющей собой металлический стержень с параллельными зеркально отполированными торцовыми плоскостями. Первые опыты по сравнению стержневого эталона метра с длиной световой волны были выполнены Майкельсоном и Бенуа в 1892—1893 гг. Использовался свет красной линии кадмия X « 644 нм, характеризующийся наибольшей известной тогда длиной когерентности. При этом пришлось использовать ряд промежуточных эталонов, длина которых определялась расстояни- расстоянием между двумя зеркалами, укрепленными строго параллельно на массивном металлическом основании. В результате дальнейших поисков более подходящих источников света была создана стан- стандартная криптоновая лампа, длина когерентности оранжевого излучения которой достига- достигает 0,8 м. Впоследствии это излучение использовалось в первичном эталоне длины: по опре- определению, 1 м принимался равным 1 650 763,73 длины волн в вакууме излучения, соответству- соответствующего переходу между уровнями 5с15 —* 2р10 атома криптона-86. В настоящее время первич- первичный эталон длины основан на стандарте частоты: 1 м по определению равен пути, проходимому светом за 1/299 792 458 с. Оптическая схема интерферометра Майкельсона применяется в современных спек- спектральных приборах нового типа — фуръе-спектрометрах, особенно эффективных для исследования инфракрасной части спектра сла- слабых источников, когда приходится применять срав- сравнительно малочувствительные приемники излучения с относительно большими собственными шумами. Рассмотрим кратко принцип их действия. Пусть подвижное зеркало М^ интерферометра Майкельсона перемещается с постоянной скорос- скоростью V перпендикулярно отражающей поверхности (рис. 5.30). Тогда разность хода между двумя ин- интерферирующими пучками будет изменяться по за- закону А = 2м. При монохроматическом освещении интерферометра интенсивность света, попадающего в приемник ^, в соответствии с E.8) изменяется по закону У Рис. 5.30. К объяснению принципа действия Фурье-спектрометра /(/) = /0A + СО8&Д) = /0A + E.63) Интенсивность, а вместе с ней и сигнал приемника оказываются промодулирован- ными с частотой п = 2кь = 2соу/с.*^ Частота модуляции п зависит от оптической частоты со монохроматического излучения. Измеряя п, можно найти со, т. е. получить информацию о спектре источника. *} Биение интенсивности попадающего в приемник света (см. E.63)) можно интерпретировать как ре- результат нестационарной интерференции двух когерентных волн с близкими частотами: волны частотой &>, отраженной неподвижным зеркалом М2, и волны, отраженной движущимся зеркалом Л/р частота которой вследствие эффекта Доплера сдвинута на Асо — ^/с)(о.
240 5. Интерференция света При освещении интерферометра немонохроматическим светом со спектральной плотностью 1(со) каждая монохроматическая составляющая дает в сигнал вклад, определяемый выражением E.63). Полный сигнал находится интегрированием по всем частотам: оо оо оо 7@ = [ 1{(о)\\ +С08(^')] Аа) = 11{р)*в>+ //(<ы)соз(— г) Аы. E.64) 0 0 0 Фурье-компонента тока приемника, соответствующая частоте п = 2соу/с, пропор- пропорциональна интенсивности спектральной компоненты излучения источника на часто- частоте со. Другими словами, спектр источника трансформируется в спектр тока прием- приемника — от оптических частот на низкие частоты модуляции интенсивности. Сигнал поступает с приемника на широкополосный усилитель переменного тока. Первое, не зависящее от времени слагаемое (постоянная составляющая) не пропускается уси- усилителем. Поэтому сигнал на выходе Г(() пропорционален второму слагаемому — фурье-образу функции 1(со'): РA) ~ [ 1(о))соз(-^ о Искомая функция 1(со) распределения энергии по частотам выражается через наблю- наблюдаемую функцию РA) с помощью обратного преобразования Фурье: оо 1(со) ~ [ Р{1) соз (— г) <Ь. E.64) Таким образом, для получения искомого спектрального распределения исследуе- исследуемого излучения нужно провести соответствующее преобразование Фурье E.64) на- наблюдаемого сигнала, чем и обусловлено название метода. Для выполнения этой опе- операции используются быстродействующие компьютеры. Преимущества фурье-спектрометра перед обычными спектральными приборами (напри- (например, с дифракционной решеткой, см. п. 6.6) обусловлены увеличением проходящего через прибор светового потока (для достижения высокого разрешения здесь не требуется умень- уменьшать ширину входной щели) и одновременной регистрацией всего спектра при использовании фотоэлектрических приемников. Для коротковолновой части спектра эти преимущества значи- значительно снижаются в связи с тем, что на приемник попадает одновременно с модулированной и немодулированная часть излучения, из-за чего возрастает уровень шумов на выходе. В ко- коротковолновой части спектра шум определяется полным световым потоком, в то время как для малочувствительных детекторов инфракрасного излучения основной шум обусловлен соб- собственными шумами детектора и в широких пределах не зависит от падающего на приемник потока излучения. Поэтому преимущества метода реализуются лишь в инфракрасной области, особенно в далекой. Рассмотренные примеры использования двухлучевых интерферометров дают пред- представление о широких возможностях интерференционных методов исследования, хотя многие их приложения остались, конечно, вне нашего поля зрения.
5.7. Многолучевая интерференция 241 5.7. Многолучевая интерференция При наложении двух когерентных световых пучков образуются интерференци- интерференционные полосы, в которых распределение интенсивности описывается функцией / ~ соз2(кА/2) (где А — разность хода пучков). Максимумы и минимумы интен- интенсивности, т. е. светлые и темные полосы, в двухлучевой интерференционной картине имеют одинаковую ширину. При наложении большого числа пучков распределение интенсивности в интерференционной картине существенно иное. Изменение харак- характера интерференционных полос при увеличении числа п пучков качественно можно предсказать на основе закона сохранения энергии. Амплитуда световых колебаний в максимумах интенсивности, где сложение колебаний происходит в одинаковой фа- фазе, в п раз больше, а интенсивность в п2 раз больше, чем от одного пучка (при условии, что когерентные пучки имеют одинаковую или почти одинаковую интенсив- интенсивность). Но полная энергия, приходящаяся на одну интерференционную полосу, лишь в п раз больше, чем в одном пучке. Увеличение интенсивности в максимумах в п2 раз возможно только в случае существенного перераспределения потока энергии в про- пространстве: при прежнем расстоянии между светлыми полосами их ширина должна быть примерно в п раз меньше этого расстояния. Благодаря образованию узких мак- максимумов, т. е. резких светлых полос, разделенных широкими темными промежутками, многолучевая интерференция получила важное практическое применение. Большое число когерентных световых пучков может возникнуть в результате ди- дифракции при прохождении плоской волны через экран с одинаковыми регулярно расположенными отверстиями (метод деления волнового фронта). Распределение ин- интенсивности в такой многолучевой интерференционной картине будет рассмотрено в п. 6.5 на примере дифракционной решетки. Здесь мы изучим интерференцию при многократных отражениях света от двух параллельных поверхностей (метод деления амплитуды). На этом принципе действует интерферометр Фабри-Перо, широко используемый в спектроскопии высокого разрешения и в метрологии. Он может быть выполнен в виде плоскопараллельной стеклянной или кварцевой пластины, на обе поверхности которой нанесены отражающие слои, либо в виде двух пластин, у ко- которых покрытые отражающими слоями плоскости установлены строго параллельно друг другу и разделены воздушным промежутком. Отражение света от двух параллельных плоскостей приводит (см. п. 5.3) к образо- образованию локализованных в бесконечности (или фокальной плоскости линзы) интер- интерференционных полос равного наклона. В некоторую точку Р фокальной плоскости линзы собираются лучи, которые до линзы образуют с ее оптической осью один и тот же угол в (рис. 5.31). Разность хода Д двух соседних интерферирующих лучей опре- определяется формулой E.10): Д = 2пксо$6'. Максимумы интенсивности в проходящем свете расположатся там, где Д составляет целое число длин волн: 2пксовв' =тА0. E.65) Линиям равных интенсивностей соответствует одно и то же значение угла 0, по- поэтому интерференционные полосы в фокальной плоскости линзы имеют вид концен- концентрических колец с центром на оси линзы. Центру картины соответствует наиболь- наибольший порядок интерференции. При этом расположение максимумов интенсивности
242 5. Интерференция света будет таким же, как в полосах равного наклона при двухлучевой интерференции. Однако для определения структуры максимумов в случае высокого коэффициента отражения светоделительных поверхностей необходимо учесть интерференцию всех приходящих в точку Р волн, образующихся при многократных отражениях. Рис. 5.31. Полосы равного наклона при многолучевой интерференции При каждом пересечении отражающей поверхности падающая световая волна по- порождает две волны: прошедшую и отраженную. Отношения амплитуд этих волн к ам- амплитуде падающей волны (коэффициенты пропускания г и отражения р), вообще говоря, зависят от угла падения и состояния поляризации света. Для границы двух прозрачных сред (без нанесенных на нее отражающих покрытий) это было показано в п. 3.2 с помощью формул Френеля. Мы здесь ограничимся исследованием распре- распределения интенсивности в интерференционных полосах равного наклона, которым соответствуют малые углы 9. В этом случае тир практически не зависят от угла падения и от поляризации падающего света (см. рис. 3.5 и 3.10) и для них можно принять значения, соответствующие нормальному падению. Пусть тир — амплитудные коэффициенты пропускания и отражения при перехо- переходе волны из окружающей среды в плоскопараллельную пластинку (которая, в част- частности, может быть воздушным промежутком между зеркалами), а т' и р' — при переходе из пластинки в среду. Согласно формулам C.12) г = 2п п — п п + пг , п — п E.66) где пип1 — показатели преломления пластинки и окружающей среды. На границе прозрачных сред тир вещественны, а отрицательное значение р при п > п' учиты- учитывает изменение фазы волны на л при отражении от оптически более плотной среды. Из формул E.66) легко видеть, что отражательная способность границы, или энер- энергетический коэффициент отражения К (см. п. 3.2), не зависит от того, идет свет из
5.7. Многолучевая интерференция 243 окружающей среды в пластинку или наоборот: К=р2=р'2, E.67) И ЧТО тт' = 1-р2 = 1-Я. E.68) В случае светоделительных поверхностей с нанесенными на них многослойны- многослойными непоглощающими диэлектрическими покрытиями (см. ниже) коэффициенты г, г' и р, р1 будут иными (в частности, отражательная способность К = р2 для опреде- определенной длины волны может иметь значения, очень близкие к единице). Но можно показать, что соотношение р' = -р остается в силе и связь г, г', р9 р1 с отражатель- отражательной способностью К по-прежнему выражается формулами E.67), E.68). Предположим, что на пластинку падает под углом в плоская монохроматическая волна с амплитудой Ео (см. рис. 5.31). При нахождении комплексной амплитуды суммарной волны, прошедшей через пластинку, нужно учесть, что фаза каждой последующей волны больше фазы преды- предыдущей на 8 = кА = 2пкксо$в\ E.69) где к = 2я/Я0 — волновое число. Поэтому комплексная амплитуда последующей волны отличается дополнительным множителем ехр(*5) от амплитуды предыдущей. В результате комплексная амплитуда всей прошедшей волны представится геомет- геометрической прогрессией: е2 = еотт' хУа^ Мы считаем здесь размеры пластинки и линзы достаточно большими, чтобы можно было не учитывать дифракцию на их краях (см. п. 6.3) и виньетирование наклонных пучков (т.е. ограничение их поперечного сечения краями пластинки и линзы). Для нахождения интенсивности прошедшей волны умножим Е2 в E.70) на комплексно- сопряженную величину и воспользуемся формулами E.67) и E.68): (I-/?J 1 , п Таким же способом легко получить выражение для амплитуды отраженной волны: Е =Е Л-Етт1 'ё*A+ /2е/5+ ) = Е (\ ТТ'** \ 1 - о/?+ оттр е +Р оРу х-р'2^)' Здесь учтено, что р' = —р. Для интенсивности отраженной волны находим [4Д/A -КJ]ъ\п2(8/2) 2/?Aсо53) - 'пад 1 + к2 _ 2К СО8<5 - 'пад
244 5. Интерференция света Соотношения E.71) и E.72) известны как формулы Эйри. Из них видно, что ^пр + ^отр = ^пад» как и должно быть при отсутствии поглощения. Очевидно, что ин- интенсивность в точке Р фокальной плоскости линзы (см. рис. 5.31) относится к ин- интенсивности в Р при отсутствии пластинки как /Пр//Пад- Поэтому формула E.71) да- дает распределение интенсивности в мно- многолучевой интерференционной картине для тех мест фокальной плоскости лин- линзы, где при отсутствии пластинки бы- была бы равномерная освещенность. Мак- Максимумы /пр/^пад = 1 получаются при 8/2 = тл (т — целое число). Подстав- Подставляя сюда 8 из E.69), получаем то же условие E.65), что и при двухлучевой интерференции. При малом коэффици- тп 2л-(/и+1) 8' енте отражения К < 1 формулы E.71) Рис. 5.32. Кривые распределения интенсивности и E-72) Дают т0 же самое и Д™ Рас" в свете, проходящем через интерферометр пределения интенсивности. Это распре- Фабри-Перо деление, однако, существенно изменяет- изменяется при увеличении /?, в особенности ког- когда К приближается к единице. На рис. 5.32 приведены построенные по форму- формуле E.71) кривые интенсивности прошедшего света в зависимости от 8. При Я <С 1 они имеют вид, типичный для двух интерферирующих пучков. С увеличением ко- коэффициента отражения К максимумы сужаются, а в промежутках между ними ин- интенсивность становится очень мала. Отношение интенсивности в максимумах и ми- минимумах, характеризующее контрастность интерференционных полос, как видно из E.71), определяется только коэффициентом отражения: Многолучевая интерференционная картина в прошедшем свете при значениях К, близких к единице, имеет вид узких светлых полос на почти совершенно темном фоне. В отраженном свете наблюдается дополнительная картина в виде узких тем- темных полос на почти равномерном светлом фоне. Подобное пространственное пере- перераспределение потока энергии с концентрацией его в некоторых преимущественных направлениях всегда возникает при интерференции многих пучков. Острота интерференционных максимумов характеризуется шириной контура интен- интенсивности на половине его высоты, т.е. расстоянием между точками, лежащими по обе стороны максимума в тех местах, где интенсивность уменьшается до полови- половины максимального значения. Около максимума порядка т эти точки находятся при 8 — 2лт ± г/2, где е в соответствии с E.71) определяется соотношением 1 1 2у/К . е л = х. т.е. 8т 1 1 + [4Д/A - цJ] 8ш2(г:/4) 2' 1 - К 4 При большом коэффициенте отражения К значение е настолько мало, что можно положить 8т(е/4) « г/4. Тогда для изменения разности фаз 8, соответствующего
5.7. Многолучевая интерференция 245 ширине контура интерференционной полосы, получаем с = 2A-Я)/л/Б. E.74) В случае е<1 описываемый формулой Эйри E.71) контур полосы в монохрома- монохроматическом проходящем свете в окрестности каждого максимума 8 = Ъпт принимает лоренцевскую форму: где Д<$ = 8 — Ъгт — отклонение 8 от его значения в максимуме. Отношение расстояния между соседними полосами (которому соответствует из- изменение 8 на 2л) к ширине максимума называется резкостью полос Р: С увеличением резкости полос распределение интенсивности становится более благоприятным для определения на опыте положения максимумов. Чем выше рез- резкость полос, тем более четко разделяются полосы, принадлежащие различным спек- спектральным компонентам падающего излучения. И.З формулы E.76) видно, что резкость полностью определяется коэффициентом Отражения Л. Она растет с увеличением К, стремясь в пределе к бесконечности при К —> 1. На границе воздух—стекло при нормальном падении коэффициент отра- отражения составляет всего 0,04. Необходимое для достижения хорошей резкости боль- большое значение /? может быть получено нанесением тонкого металлического покрытия (серебро, алюминий) путем термического испарения в вакууме. Но металлические пленки поглощают свет (см. п. 3.4), поэтому использованное при выводе формул Эй- ри условие E.68) должно быть для них заменено следующим: тт' = 1 -Д-А, где А — доля светового потока, поглощаемая слоем металла. Тогда из E.70) получим вместо E.71) выражение 7 "" I 1 Р I 1 . Г-.П//1 Г»\">1 _^_2/Р//"»\ ' (А' ') 7пад \ 1 - а/ 1 - 'пад При прежнем характере пространственного распределения интенсивности поглоще- поглощение приводит к ее общему уменьшению. Значительное расширение возможных применений интерферометра Фабри—Перо связано с использованием вместо металлических зеркал многослойных диэлектри- диэлектрических покрытий, которые обеспечивают высокий коэффициент отражения (и сле- следовательно, большую резкость полос) и в то же время не поглощают свет. Распре- Распределение интенсивности в интерференционной картине и в этом случае описывается формулой E.77), но пропускание в максимумах может быть значительно больше,
246 5. Интерференция света чем у интерферометра с металлическими зеркалами. Уменьшение интенсивности по сравнению с идеализированным случаем, выражаемым формулой E.71), обусловле- обусловлено здесь в основном рассеянием света на практически неизбежных неоднородностях покрытий. Рассмотрим идею получения диэлектрических зеркал. Пусть на поверхность стек- стекла (или кварца), показатель преломления которого л0, нанесен слой прозрачного диэлектрика с показателем преломления п > п0. Толщина слоя / выбрана так, чтобы его оптическая толщина п1 была равна Я0/4, т.е. чет- четверти длины волны в вакууме. При этом отражатель- отражательная способность поверхности возрастает. В самом де- деле, волны, отраженные (при нормальном падении) пе- передней и задней границами слоя, находятся в фазе, так как отставание фазы второй волны на я, накопившееся при ее распространении внутри пленки туда и обратно, компенсируется изменением фазы первой волны на я при ее отражении от оптически более плотной сре- среды. Покрытия из ТЮ2 {п = 2,45) или сернистого цин- цинка (п = 2,3) дают Я « 0,3. Но добиться более высоких коэффициентов отражения таким способом практиче- Рис. 5.33. Схема многослойного ски невозможно. Эффект можно значительно усилить, диэлектрического покрытия используя последовательность чередующихся диэлек- (щ>по> Щ>пг, /11/1=/12/2=Я0/4) трических слоев с высоким п^ и низким п2 показателя- показателями преломления (рис. 5.33). Если оптическая толщина всех слоев одинакова и равна Я0/4 (л^ = п212 = Я0/4), то отраженные их границами волны находятся, как легко заметить, в одинаковой фазе и в результате интерферен- интерференции усиливают друг друга. Такие многослойные диэлектрические покрытия дают высокую отражательную способность только в ограниченной области длин волн вблизи значения Яо, для ко- которого оптическая толщина слоев равна Я0/4. Обычно наносят от 5 до 15 слоев сульфида цинка (п^ = 2,3) и криолита (п2 = 1,35). С семью слоями легко добиться К = 0,9 в спектральной области шириной порядка 50 нм. Для получения коэффици- коэффициента отражения Я = 0,99 (такие зеркала используют в лазерных резонаторах) надо нанести 11 — 13 слоев. Нанесением на поверхность стекла диэлектрических покрытий можно решить и про- противоположную задачу уменьшения коэффициента отражения (просветление опти- оптики). Это очень важно для сложных оптических систем с большим числом преломля- преломляющих поверхностей, где даже при малом коэффициенте отражения (К « 0,04) в ито- итоге накапливаются значительные потери света. Очевидно, что нанесенный на стек- стекло слой диэлектрика оптической толщины п1 = Я0/4 при п < л0 приведет к умень- уменьшению /?, так как отраженные от его передней и задней границ волны находятся в противофазе. При п = х/^ весь падающий по нормали свет с длиной волны Яо проходит через границу (см. задачу 1). Использование более сложных трехслойных покрытий позволяет получить сравнительно высокое пропускание в широкой области спектра.
5.7. Многолучевая интерференция 247 При близких к единице значениях коэффициента отражения /? зеркал интерферо- интерферометра резкость полос, как видно из E.76), может быть очень большой. Однако сле- следует иметь в виду, что формула E.76) справедлива для идеального интерферометра, зеркальные поверхности которого абсолютно плоские и строго параллельны друг другу. Дефекты поверхностей приводят к уширению максимумов и уменьшению рез- резкости полос. Если в двух участках интерферометра расстояние между зеркальны- зеркальными поверхностями различается на АН, то разность хода (при малых углах падения) различается на 2Ак и кольца от этих участков смещены друг относительно друга на величину, составляющую 2Ак/Х от расстояния между соседними максимумами. Наложение колец от разных участков зеркал интерферометра уширяет максимумы и искажает их форму. Для достижения теоретической резкости E.76) при высоких коэффициентах отражения зеркала должны быть изготовлены с большой точностью. Именно дефекты поверхностей остаются главной причиной, ограничивающей дости- достижимые значения резкости полос и разрешающей способности (см. п. 6.6) интерферо- интерферометра Фабри—Перо. Остановимся на применении интерферометра Фабри—Перо в спектроскопии. Поло- Положение максимумов интерференционной картины в монохроматическом свете зависит от длины волны Я. Изменение их положения при изменении Я служит важной ха- характеристикой спектрального прибора, которая называется дисперсией.*^ В данном случае максимумы имеют форму колец в фокальной плоскости линзы (см. рис. 5.31) и их положение определяется углом 0, а величина йв/АХ характеризует угловую дис- дисперсию прибора. В соответствии с E.65) для максимума порядка т ^, E.78) откуда сШ/с1Я = —т/Bк$тв). Исключая отсюда т с помощью E.78), получаем с1Я Х\%в% йХ ~ Хв К } (последнее справедливо при малых 0, когда \%в « 0). Из E.79) следует, что угловая дисперсия не зависит от расстояния к между зеркалами и других параметров интер- интерферометра. Она неограниченно возрастает при приближении к направлению нормали 0 = 0. Знак минус в E.79) показывает, что с ростом Я угол 0 для фиксированного максимума убывает. Найдем угловое расстояние АО между соседними кольцами интерференционной картины в монохроматическом свете с данной длиной волны Я. Из E.78) видно, что соз@ -I- Д0) - СО8 0 = А/BА). Так как соз@ + А0) « соз0 - 8Ш0Д0, то Л0 = - Я л. E.80) С увеличением угла 0 кольца располагаются все ближе друг к другу. При боль- большом расстоянии к между отражающими плоскостями кольца расположены теснее, чем при малом. По известному угловому расстоянию между кольцами E.80) и угло- угловой дисперсии E.79) легко найти интервал длин волн, соответствующий расстоянию *) Термин «дисперсия» имеет здесь совсем другой смысл, чем в гл. 2, где дисперсией называлась зави- зависимость показателя преломления от длины волны.
248 5. Интерференция света между кольцами, т. е. между максимумами соседних порядков: Для малых углов падения со$0 « 1 и ДА = Я2/B/г). Спектральный интервал, за- занимаемый исследуемым излучением, не должен превышать этой величины, чтобы максимумы соседних порядков от отдельных монохроматических компонент излуче- излучения не перекрывались. По этой причине интервал АЯ называют свободной областью дисперсии или постоянной интерферометра. В п. 6.6 показано, что с увеличени- увеличением расстояния к между пластинами возрастает разрешающая сила прибора, харак- характеризующая способность разделять две близкие по длине волны монохроматиче- монохроматические спектральные линии. Однако из E.81) видно, что увеличение к сопровождается уменьшением области дисперсии АЯ = Я2/B/г). При типичных значениях (к = 5мм; Я = 0,5 мкм) АЯ составляет менее 0,03 нм. Это значит, что при работе с интерферо- интерферометром Фабри—Перо требуется (за очень редкими исключениями) дополнительный более грубый спектральный прибор для выделения в излучении источника спектраль- спектрального интервала, не превосходящего дисперсионной области интерферометра. В про- простейшем случае может быть применен фильтр, но чаще интерферометр «скрещива- «скрещивают» с призменным или дифракционным (см. п. 6.6) спектральным прибором. Мож- Можно, например, спроецировать интерференционные кольца на плоскость щели спектрографа так, чтобы центр карти- картины совпал с серединой щели. Когда исследуемый спектр но^лиЛя^Гз™ СОСТОИТ И3 отдельных линий' изображения щели в све- изотопа урана-233 те этих линий, получающиеся в соответствующих местах фокальной плоскости спектрографа, оказываются пересе- пересеченными поперечными дугами, представляющими участки колец (рис. 5.34). Таким образом можно изучать структуру спектральных линий, со- состоящих из нескольких близко расположенных компонент, так как каждая из компо- компонент образует свою систему интерференционных колец. Измеряя на спектрограмме, какую долю от расстояния АЯ между дугами колец соседних порядков составляет расстояние между дугами расщепившихся колец, можно определить спектральные интервалы между компонентами линии, структура которой не разрешается спектро- спектрографом. Измерения обычно производят на втором или третьем от центра кольце, где дисперсия еще достаточно велика, но изменяется не столь быстро, как в центре интерференционной картины. На рис. 5.34 приведен образец такой спектрограммы для излучения изотопа урана- 233. Каждое интерференционное кольцо расщеплено на шесть компонент. Такое расщепление спектральной линии возникает, как показывает теория атомных спек- спектров, в результате взаимодействия магнитного момента атомного ядра с электронной оболочкой атома (сверхтонкая структура). По характеру и величине сверхтонкого расщепления спектральных линий можно определить основные ядерные константы. В данном случае расщепление на шесть компонент свидетельствует о том, что мо- момент импульса (спин) / ядра исследуемого изотопа урана равен 5/2 (линия расщеп- расщепляется на 2/ + 1 = 6 компонент). Интерферометр Фабри—Перо применяется в метрологии для сравнения длины волны излучения эталонного источника с длинами волн других спектральных линий.
5.7. Многолучевая интерференция 249 Наиболее точные сравнения концевых мер с первичным эталоном длины (излучени- (излучением оранжевой линии криптона-86) также производятся с помощью этого интерферо- интерферометра. При исследовании формы контуров спектральных линий используют фотоэлектри- фотоэлектрическую регистрацию. Фотоумножитель (в отличие от фотопластинки) не обладает способностью пространственного разрешения, поэтому для измерения распределе- распределения интенсивности в центр интерференционной картины помещают круглую диа- диафрагму и каким-либо способом изменяют оптическую толщину пк интерферометра. Тогда через центр последовательно проходят максимумы разных порядков всех ком- компонент исследуемой линии и фотоумножитель регистрирует изменения проходящего через отверстие диафрагмы потока излучения. Размер диафрагмы выбирается так, чтобы вырезаемый ею спектральный интервал не превосходил существенно ширины отдельного максимума в монохроматическом свете — в противном случае уменьшится разрешающая способность (см. п. 6.6). Ска- Сканирование обычно осуществляется изменением давления и, следовательно, показате- показателя преломления газа, находящегося между отражающими поверхностями. Оптичес- Оптическую толщину можно изменять и перемещением зеркал. Это достигается изменением электрического напряжения, приложенного к изготовленному из пьезоэлектрическо- пьезоэлектрического материала распорному кольцу между пластинами. В 1968 г. А.М. Прохоров предложил использовать интерферометр Фабри-Перо в качестве высокодобротного открытого резонатора для электромагнитных коле- колебаний оптического диапазона. Такой резонатор был необходим для создания опти- оптического квантового генератора. Первый газовый лазер, осуществленный в 1961 г. А. Джаваном и др., представлял собой длинную газоразрядную трубку со смесью гелия и неона, помещенную внутрь резонатора, образованного плоскими зеркалами с очень высоким коэффициентом отражения (более 99%). В открытом резонаторе лазера размеры зеркал много меньше расстояния между ними. Теория такого резо- резонатора должна строиться с учетом потерь света в результате дифракции (см. п. 6.3) при ограничении площади поперечного сечения пучка света из-за конечных размеров зеркал. Этим она существенно отличается от элементарной теории интерферометра Фабри—Перо, в которой поверхности зеркал предполагались бесконечными. (Впро- (Впрочем, в обычных спектроскопических применениях интерферометра Фабри—Перо ди- дифракция несущественна и предположения элементарной теории вполне оправданны.) Впоследствии по ряду причин в газовых лазерах стали использовать открытые резо- резонаторы со сферическими зеркалами, дифракционные потери в которых могут быть значительно меньше (см. п. 6.4). Из других применений многолучевой интерференции отметим узкополосные опти- оптические фильтры, пропускающие свет лишь в узком спектральном интервале вблизи заданного значения длины волны. Принцип действия интерференционного фильтра легко понять, представив себе интерферометр Фабри—Перо с очень малым расстоя- расстоянием между отражающими слоями (от Я/2 до нескольких длин волн). При падении по нормали света с широким спектральным составом в проходящем свете возни- возникает система максимумов (рис. 5.35), расстояние ДА между которыми определяется в соответствии с E.81) оптической толщиной пк промежутка между отражающими
250 5. Интерференция света слоями: ДА =Х2/BпН). Подбором к можно совместить один из максимумов с тре- требуемым значением длины волны Ао. Например, при оптической толщине пк = |Я0 получим ДА = Ао/5. Если Ао = 500 нм, то со- ДА I ДА седние максимумы, лежащие при Ао ± ДА, со- соответствуют Хх = 400 нм и А2 = 600 нм. Они могут быть отделены от нужного максиму- максимума Ао с помощью обычного стеклянного цвет- - ного фильтра. Оставшийся максимум при до- 0 статочно высокой отражательной способно- Рис. 5.35. Полосы пропускания сти % зеркальных слоев может быть очень интерференционного фильтра „ О0 узок. Его ширина ал, т.е. полоса пропус- пропускания интерференционного фильтра, меньше расстояния ДА между соседними максимумами в Р раз, где Р — резкость по- полос многолучевой интерференции (см. E.76)). При К « 0,9 резкость Р « 30, и при ДА = ЮОнм имеем 8Х « 3 нм. Из падающего по нормали белого света такой фильтр выделит вблизи Ао = 500 нм узкий спектральный интервал шириной порядка 3 нм. Чтобы фильтр не давал заметного ослабления света в этой полосе, в качестве отра- отражающих поверхностей используют многослойные диэлектрические покрытия. Контрольные вопросы • Чем отличаются полосы равного наклона в двухлучевой и многолучевой интерференцион- интерференционных картинах? • Каким условием определяется положение максимумов и форма полос в наблюдаемой с ин- интерферометром Фабри—Перо интерференционной картине в проходящем свете? • От каких параметров, характеризующих интерферометр, зависит резкость полос? • Какими преимуществами обладают зеркала с многослойными диэлектрическими покрыти- покрытиями по сравнению с металлическими? В чем заключается принцип их действия? • Какие факторы ограничивают практически достижимую резкость полос в интерферометре Фабри—Перо? • Что такое дисперсионная область интерферометра? Как она зависит от его толщины? По- Почему в спектроскопических исследованиях интерферометр используют совместно с более грубым спектральным прибором? • Как устроены интерференционные оптические фильтры? Задачи 1. Каким показателем преломления п должен обладать материал для просветляющего покры- покрытия на поверхности стекла с показателем преломления п0 = 1,52? Решение. Коэффициент отражения на границе слоя диэлектрика с п <С 1,5 невелик (/? < 0,04), поэтому в первом приближении можно не учитывать многократные отраже- отражения. При оптической толщине покрытия п1 — А0/4 отраженные от передней и задней гра- границ слоя волны будут в противофазе. Чтобы они полностью погасили друг друга в ре- результате интерференции, их амплитуды должны быть одинаковы (по модулю). Используя
5.7. Многолучевая интерференция 251 формулы E.66) для амплитудных коэффициентов отражения, получаем 1 -п ^ п-п0 1 + п п + Пц* откуда п — ^/л^ = 1,23. Прозрачные диэлектрики со столь малым показателем преломле- преломления неизвестны. На практике для таких покрытий обычно применяют криолит (п = 1,35) и фтористый магний (п = 1,38). При однослойном покрытии этими диэлектриками полное просветление не достигается. Учет многократных отражений на границах слоя не меняет полученного результата (л = у/Щ). Это можно показать либо суммированием комплексных амплитуд всех отра- отраженных волн (они, как и в E.70), образуют геометрическую прогрессию), либо непосред- непосредственным применением граничных условий на поверхностях слоя (непрерывность танген- тангенциальных компонент векторов Е и В). При оптической толщине слоя в четверть волны это дает следующее выражение для амплитуды Ех отраженной волны: Р __ Р\~Рг р где р^ и р2 — амплитудные коэффициенты отражения на передней и задней границах слоя. Отсюда следует, что полное просветление (т.е. Ех = 0) достигается при рх = р2. Это усло- условие опять приводит кй = у/п^. Таким образом, точное значение показателя преломления покрытия, необходимого для полного просветления, совпадает с тем, что было получено выше без учета многократных отражений.
Дифракция света В явлениях дифракции, как и в интерференции, на первый план выступают волновые свойства света. Под дифракцией света обычно понимают отклонения от простых законов распростра- распространения света, описываемых геометрической оптикой. Дифракцию можно наблюдать, например, когда на пути рас- распространения света находятся препятствия, т.е. непрозрачные тела произвольной формы (обычно их называют в таких случаях экранами), или когда свет проходит сквозь отверстия в экранах. Геометрическая оптика (закон прямолинейного распростра- распространения света в однородной среде) предсказывает существование за экраном области тени, резко отграниченной от тех мест, куда свет попадает. Но тщательно поставленный эксперимент пока- показывает, что вместо резкой границы между светом и тенью полу- получается довольно сложная картина распределения освещенности, состоящая из темных и светлых участков — дифракционных полос. Дифракция выражена тем сильнее, чем меньше размеры экра- экранов (или отверстий в них) и чем больше длина волны. Характер- Характерные особенности дифракционных явлений в оптике обусловлены тем, что здесь, как правило, размеры экранов много больше дли- длины волны. Поэтому наблюдать дифракцию света можно только на достаточно больших расстояниях от преграды. Теория дифракции света дает строгое обоснование геометри- геометрической оптике и определяет условия ее применимости. В теории дифракции получают свое решение и многие во- вопросы инструментальной оптики, требующие выхода за рамки геометрической оптики, такие как предельное разрешение оп- оптических систем и спектральных приборов или структура опти- оптического изображения.
6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 253 6.1. Принцип Гюйгенса—Френеля. Зоны Френеля Первое объяснение дифракции света было дано Френелем в 1818 г. В своем мемуаре он по- показал, что количественное описание дифракционных явлений возможно на основе построения Гюйгенса, если его дополнить принципом интерференции вторичных волн. Кирхгоф в 1882 г. дал строгое математическое обоснование принципу Гюйгенса—Френеля. В рамках электромагнитной теории света для описания дифракционных явлений не тре- требуется вводить какие-либо новые принципы. Но точное решение задачи о распространении света на основе уравнений Максвелла с соответствующими граничными условиями пред- представляет большие математические трудности. В большинстве случаев, представляющих прак- практический интерес, вполне достаточным оказывается приближенный метод решения задачи о распределении света вблизи границы между светом и тенью, основанный на принципе Гюйгенса—Френеля. Согласно принципу Гюйгенса, каждую точку, в которую пришла волна от источ- источника, можно принять за центр вторичных волн, распространяющихся во все сторо- стороны. Результирующая волна рассматривается как наложение вторичных волн. Гюйгенс считал, что отдельные вторичные волны не обладают периодичностью, что они очень слабы и заметное действие производят только на их огибающей. При таком про- произвольном допущении принцип Гюйгенса дает лишь некоторый рецепт построения волновых фронтов, т. е. поверхностей, до которых дошло световое возмущение. По- Построения Гюйгенса наглядно объясняют законы прямолинейного распространения, отражения и преломления света. Но в этих построениях не используется понятие длины волны, поэтому они не позволяют определить условия применимости упЬмя- нутых законов. Френель вложил в принцип Гюйгенса ясное физическое содержание, отказав- отказавшись от искуственного предположения об огибающей вторичных волн и рассмат- рассматривая полное световое поле как результат интерференции вторичных волн. При этом не только получает физическое объяснение построение Гюйгенса (к точкам на огибающей все вторичные волны приходят в одинаковых фазах), но и появля- появляется возможность расчета распределения светового поля в пространстве. Изучая распределение света вблизи границы между светом и тенью на основе принципа Гюйгенса—Френеля, можно получить количественное описание дифракционных яв- явлений. Рассмотрим какой-либо экран с отверстием, через которое проходит свет от данного источника (рис. 6.1). Источник пока будем считать точечным и монохроматическим. Размеры отверстия много больше длины волны света. Будем под Е понимать любую из компонент векторов Е или В электромагнитного поля световой волны, опуская при этом множитель е~1С01, определяющий зависимость от времени. Задача состоит в определении ЕР в любой точке Р за экраном. При приближенном решении этой задачи по методу Френеля делается предположение, что напряженность Е в точках отверстия такова, какой она была бы в случае свободного распространения волны от источника вообще при отсутствии какого бы то ни было экрана, и что в точках, находящихся непосредственно за непрозрачным экраном, напряженность поля равна нулю. Очевидно, что в этом предположении совершенно не учитываются специфиче- специфические свойства экрана, в частности материала, из которого он сделан, — считается, что это не играет никакой роли. Существенна только форма края отверстия (или
254 6. Дифракция света края экрана) и совершенно несущественна форма удаленной от краев части экрана. Опыт показывает, что обсуждаемое предположение справедливо, когда размеры от- отверстия и расстояния до источника и точки наблюдения много больше длины волны, т. е. когда отклонения от геометрической оптики малы. Оно нарушается, например, для узкой ще- щели, ширина которой значительно меньше длины световой волны. Проведем мысленно произвольную поверх- поверхность 5, закрывающую отверстие в экране и ограниченную краями отверстия (см. рис. 6.1). Разделим эту поверхность на элементарные участки площадью с15, малые по сравнению с размерами отверстия, но большие по срав- сравнению с длиной волны. Можно считать, что каждый из этих участков сам становится ис- источником световой волны, распространяющейся во все стороны. Напряженность 6Ер, создавае- создаваемая элементарным участком с15 в точке Р, пропорциональна напряженности Е в са- самом участке с15 (какой она была бы при отсутствии экрана) и проекции 68п площа- площади A5 этого участка на плоскость, перпендикулярную вектору к луча, пришедшего из источника света в й5. Последнее связано с тем, что при любой форме участка A5 через него будут проходить одни и те же лучи от источника, если только проек- проекция <\5п будет неизменной. Поэтому можно предположить, что вклад такого участка поверхности 5 в напряженность поля в точке наблюдения Р будет тем же самым. При вычислении вклада участка A5 в Ер нужно учесть изменения амплитуды и фазы вторичной волны при ее распространении от с!5 к Р. Это приводит к появ- появлению в выражении для 6Ер множителя с1кК //?, где К — расстояние от с!5 до Р9 а к = 2л/X — волновое число. Таким образом, Рис. 6.1. К формулировке принципа Гюйгенса-Френеля = К (а) Е —- К F.1) где К(а) — некоторый «коэффициент наклона», учитывающий зависимость амплиту- амплитуды вторичных волн от угла а между вектором к и направлением на точку наблюде- наблюдения. Естественно предположить, что коэффициент К(а) максимален в первоначаль- первоначальном направлении распространения света, т. е. при а = О, и плавно убывает с увеличе- увеличением а. Многие практически важные задачи дифракции можно решить с достаточной точностью при этих весьма общих предположениях относительно К (а), не уточняя конкретного вида его зависимости от а. Теория Кирхгофа, основанная на том, что напряженность поля световой волны удовлетво- удовлетворяет волновому уравнению, дает следующее выражение для коэффициента наклона: К(а) = 2^т A + соза) = —A + соза). F.2) При малых углах дифракции (а< 1) можно положить соза « 1 и К (а) « к/{2л г) = —//Я. Согласно гипотезе Френеля, полное световое поле в точке Р представляет со- собой суперпозицию полей F.1) вторичных волн от всех элементов <15 поверхности,
6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 255 закрывающей отверстие в экране: Ер = F.3) В рассматриваемом приближении интеграл F.3) по поверхности 5 не зависит от формы этой поверхности. Формула F.3) дает математическое выражение прин- принципа Гюйгенса—Френеля. Применим принцип Гюйгенса—Френеля для определения напряженности поля в точке Р за круглым отверстием в экране. Будем считать, что точечный источ- источник О и точка наблюдения Р лежат на прямой, проходящей через центр отверстия и перпендикулярной его плоскости (рис. 6.2). В качестве вспомогательной поверх- поверхности 5 выберем часть сферы радиусом г0 с центром в источнике, проходящей через края отверстия. В соответствии с основным предположением напряженность поля на этой сфере будет такой же, как при отсутствии экрана. Поэтому напряженность поля одинакова на всех элементах ё$ поверхности 5: Е — Ег\ е F.4) В качестве элемента с15 удобно взять на сфере кольцо, все точки которого лежат на одинаковом расстоянии К от точки наблюдения Р. Пусть направления из ис- источника на внутренний и внешний края этого кольца составляют с осью симметрии Рис. 6.2. К вычислению напряженности поля в точке наблюдения Р Рис. 6.3. Построение зон Френеля углы в и 0 + йв соответственно. Площадь такого кольца 68 = й8п = 2л г ^ зт в <\6. Выберем # за переменную интегрирования в F.3). Из рис. 6.2 видно, что Я2 = г1 + (г0 + гJ - 2го(го + г) соз0, где г — расстояние от сферы до точки Р. Дифференцируя это уравнение (при пос- постоянных г0 и г), получаем КАК = го(го + г) $ш0<10, откуда й5п = 2л F.5)
256 6. Дифракция света Подставляя F.4) и F.5) в F.3), получаем ЕР = 2л -^- Ео ёкг* ^тах [ К(К) е1'** Ж. F.6) Для приближенного вычисления интеграла в F.6) воспользуемся следующим при- приемом. Построим сферы с центром в точке Р, радиусы которых равны г9 г + Я/2, г + 2(Я/2), ..., г + я(Я/2), ... (рис. 6.3). Они разобьют поверхность 5 на кольцевые области, называемые зонами Френеля. Из построения ясно, что вторичные волны от границ двух соседних зон приходят в точку наблюдения в противофазе. Легко показать, что радиус окружности, отделяющей п-ю зону Френеля от {п + 1)-й, приближенно равен V г + го Отсюда ясно, что площади зон Френеля приблизительно одинаковы. Так как Я «С г, то изменение К в пределах одной зоны незначительно и плавную функцию К (К) в подынтегральном выражении F.6) при интегрировании по я-й зоне можно считать постоянной. В этом приближении вклад п-й зоны в интеграл F.6) легко вычисляется: г+лА/2 Кп [ ёкк Ж = (-1)" ^ е''*г, F.8) г+(л-1)Л/2 где /Г/7 — значение функции ЛГ(/?) в пределах п-й зоны. Вычисление напряженности поля в точке Р сводится к суммированию знакопере- знакопеременного ряда: ЕР = Ч- Е0 "Г" е'*('-+г)(*1 ~К2 + К3-К4+ ...). F.9) Прежде чем анализировать полученные результаты, приведем наглядную геометри- геометрическую интерпретацию вычисления напряженности поля в точке Р на основе принци- принципа Гюйгенса—Френеля. Для сложения колебаний, производимых в точке наблюдения Р элементарными вторичными волнами от отдельных зон Френеля, воспользуем- воспользуемся методом векторных диаграмм. На векторной диаграмме (рис. 6.4) элементарные векторы 6А изображают колебания напряженности поля в точке Р, вызванные вто- вторичными волнами от элементарных кольцевых участков волновой поверхности. Все эти векторы вращаются по часовой стрелке с угловой скоростью о>, равной частоте излучения источника. Вектор 6А^ соответствует колебанию в Р от участка, лежа- лежащего в центре С отверстия (т.е. на линии ОР). Колебание, вызванное вторичной волной от следующего (такого же по площади) элементарного кольцевого участка, изображается таким же по модулю вектором 6А2, но повернутым относительно 6А^ на небольшой угол, так как это колебание несколько отстает по фазе. Вектор <М3 от
6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 257 следующего кольцевого участка повернут относительно 6А2 на такой же угол. Все звенья этой ломаной, образованной элементарными векторами 6А(9 в пределах одной зоны Френеля имеют равные длины, так как им соответствуют равные значения дК в интеграле F.8). Колебанию, приходящему в точку Р от участка, прилегающего к границе первой зоны Френеля, будет соответствовать вектор 6АП9 повернутый от- относительно йА^ на я, так как по самому определению зон Френеля разность хода соответствующих им вторичных волн равна Я/2. а) ^ Рис. 6.4. Векторные диаграммы для результирующего колебания в точке наблюденния Р: а — отверстие в экране открывает первую зону Френеля; б — две первые зоны; в — круглый экран перекрывает небольшое (нецелое) число зон Френеля Результирующее колебание в Р, вызываемое волнами от всей 1-й зоны Френе- Френеля, изображается на диаграмме рис. 6.4, а вектором А^ замыкающим ломаную ли- линию, образованную векторами АА^У ёА2» • • • ¦ &Ап. Ему соответствует первое слага- слагаемое в F.9). В пределе, когда все ё# —> 0, он проходит по диаметру полуокружности. Продолжим построение дальше. Векторная диаграмма результирующего колебания в Р от двух первых зон Френеля показана на рис. 6.4, б. При строгом равенстве амплитуд .складываемых колебаний йА1 от элементарных участков амплитуда резуль- результирующего колебания от двух открытых зон была бы равна нулю, т.е. вторичные волны в результате интерференции полностью гасили бы друг друга. Но коэффици- коэффициент наклона К(а)9 убывающий по мере увеличения а, характеризует постепенное уменьшение амплитуд вторичных волн, т.е. модулей элементарных векторов сМ,. Поэтому амплитуда А2 колебания от двух зон имеет конечное, хотя и очень малое, значение. Другими словами, первые два члена знакопеременного ряда F.9) не вполне компенсируют друг друга. Таким образом, освещенность в точке Р по мере увеличения диаметра отверстия в экране изменяется немонотонно. Пока открывается первая зона Френеля, освещен- освещенность в Р постепенно увеличивается и достигает максимума при полностью откры- открытой зоне. По мере открывания второй зоны Френеля освещенность убывает и при полностью открытых двух зонах уменьшается почти до нуля. Затем освещенность увеличивается снова и т.д. К таким же выводам мы придем, если вместо увеличения диаметра отверстия будем приближать точку наблюдения Р к отверстию вдоль пря- прямой РО (см. рис. 6.3). Так как радиусы зон Френеля в соответствии с F.7) зависят от расстояния г от точки наблюдения Р до экрана, то при этом будут последовательно открываться одна, две зоны и т.д. Поэтому при перемещении точки Р освещенность в ней будет изменяться от максимальных значений при нечетном числе открытых зон до минимальных — при четном. 9 Зак. 4498
258 6. Дифракция света Эти на первый взгляд парадоксальные результаты, предсказываемые на основе принципа Гюйгенса—Френеля, хорошо подтверждаются экспериментом. Реальные ди- дифракционные картины от круглого отверстия, открывающего в непрозрачном экране небольшое целое число зон Френеля, показаны на рис. 6.5. Заметим, что приведен- приведенные здесь теоретические и экспериментальные результаты находятся в противоречии с предсказаниями геометрической оптики, согласно которой освещенность в точке Р, лежащей на одной линии с источником и центром круглого отверстия, не должна за- зависеть от диаметра отверстия. Рис. 6.5. Дифракционные картины от круглого отверстия, открывающего небольшое целое число зон Френеля. Фотографии выполнены С. К. Стафеевым Перейдем к предельному случаю, когда радиус отверстия в экране неограниченно возрастает. Это равносильно отсутствию экрана вообще, т. е. свободному распростра- распространению света из О в Р. На векторной диаграмме этому предельному случаю соответ- соответствует спираль, витки которой постепенно сжимаются, закручиваясь вокруг фокуса, находящегося в центре окружности (см. рис. 6.4, в). Колебание в Р, вызываемое вто- вторичными волнами от полностью открытого волнового фронта, изображается векто- вектором А. Ему соответствует весь знакопеременный ряд в F.9). Сравнивая рис. 6.4, а и в, видим, что А =А}/2: амплитуда колебания в Р при отсутствии экрана вдвое меньше, а интенсивность в четыре раза меньше, чем при наличии экрана с круглым отверстием, открывающим только одну первую зону Френеля. Таким образом, сумма всего ряда F.9), описывающая амплитуду колебания на- напряженности в точке Р при полностью открытом волновом фронте, равна половине первого члена этого ряда: г0 + г '> Кх. F.10) Этим результатом можно воспользоваться для того, чтобы определить коэффи- коэффициент Кх. В самом деле, свободно распространяющаяся из точечного источника О сферическая волна, напряженность поля которой на поверхности 5, т. е. на расстоя- расстоянии г0 от источника, равна Еое1кго в соответствии с F.4), в точке Р, т.е. на расстоя- расстоянии г0 + г, имеет напряженность Ер = Ео -^— е'*(го+г), F.11) Сравнивая правые части выражений F.10) и F.11), находим *¦ - ^7 - -I- Г" FЛ2)
6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 259 что совпадает с F.2) при а <С 1 в теории Кирхгофа. Множитель ехр(—/яг/2) означает, что вторичные волны опережают исходную волну по фазе на л/2 (напомним, что в выражениях F.10) и F.11) для Ер опущен множитель ехр(—гш), описывающий зависимость напряженности поля от времени). Наиболее неожиданным в полученных выше результатах представляется, пожалуй, то, что в случае, когда отверстие в экране открывает две зоны Френеля (или вооб- вообще небольшое четное число зон), освещенность в точке Р равна нулю. Не менее неожиданно и то, что за круглым экраном как раз в центре его геометрической тени освещенность не равна нулю. Если экран перекрывает лишь несколько первых зон Френеля, то освещенность в центре тени почти такая же, как и при отсутствии экра- экрана. В этом легко убедиться с помощью векторной диаграммы (см. рис. 6.4, в), если представить вектор А, изображающий колебание напряженности поля в точке Р при полностью открытой волновой поверхности, как сумму двух векторов, один из кото- которых (В на рис. 6.4, в) изображает колебание от зон Френеля, перекрытых экраном, а другой (С) — колебание от открытого участка волновой поверхности, лежащего за пределами экрана. Вектор С лишь немного уступает по модулю вектору А. Следова- Следовательно, освещенность экрана в центре геометрической тени, отбрасываемой диском, почти такая же, как в отсутствие диска. Рис. 6.6. Дифракционные картины от непрозрачного круглого диска. Число зон Френеля, перекрываемых диском, уменьшается слева направо. В центре геометрической тени диска наблюдается светлое пятно, называемое пятном Араго-Пуассона. Фотографии выполнены С. К. Стафеевым Это предсказание теории Френеля произвело сильное впечатление на его совре- современников. В 1818 г. член конкурсного комитета Французской академии Пуассон, рас- рассматривавший представленный на премию мемуар Френеля по дифракции, пришел к выводу о том, что в соответствии с предлагаемой волновой теорией в центре тени маленького круглого диска должно находиться светлое пятно, но счел этот вывод столь абсурдным, что выдвинул его как возражение против волновой теории света, развивавшейся Френелем. Однако другой член того же комитета Араго выполнил экс- эксперимент, показавший, что это удивительное предсказание правильно. Долгий спор между приверженцами корпускулярной и волновой теорий света был решен в поль- пользу последней. Экспериментально наблюдаемые картины дифракции от непрозрачных круглых дисков разных диаметров приведены на рис. 6.6. Во всех случаях в центре геометрической тени отчетливо различимо светлое пятно (пятно Араго—Пуассона). Как уже отмечалось, когда круглое отверстие в экране открывает одну первую зо- зону Френеля, интенсивность в точке наблюдения Р в четыре раза больше, чем при
260 6. Дифракция света полностью открытой волновой поверхности. Интенсивность в Р можно во много раз усилить, если изготовить экран, который кроме первой зоны открывает третью, пятую и т. д., т. е. все нечетные зоны Френеля. Вторичные волны от всех открытых зон Френеля будут приходить в точку наблюдения в одинако- одинаковой фазе и в результате интерференции усилят друг дру- друга. Такой экран называют зонной пластинкой (рис. 6.7). Можно изготовить аналогичный экран, который открыва- открывает все четные зоны Френеля. Действие зонной пластинки описывается формулой F.9), если во входящем в нее ря- ряду оставить члены только одного знака. Зонная пластинка, содержащая п открытых зон, создает в Р освещенность при- приблизительно в п2 раз большую, чем отверстие в одну зону Рис. 6.7. Зонная пластинка френеля Усиление интенсивности света зонной пластинкой анало- аналогично фокусирующему действию линзы. Расстояния от пла- пластинки до источника О и до его «изображения» Р связаны таким же соотношением, что и соответствующие величины для линзы. В этом легко убедиться, переписав формулу F.7) в виде г0 1 = ^, «6ЛЗ, 0 * 1 пХ X 7'Ш'Щ- <614) где «фокусное расстояние» / — постоянная для данной пластинки величина (так как Кп ~ >/п, правая часть в F.14) не зависит от п). Но в отличие от линзы зонная пластинка имеет несколько фокусов. В самом деле, приблизив точку наблюдения Р к пластинке, можно найти такое ее положение, когда в центральном светлом круге пластинки уместятся три первые зоны Френеля (а не одна). Следующие три зоны будут перекрыты темным кольцом. Затем три зоны совместятся со светлым кольцом и т.д. Действия соседних зон Френеля практически уничтожают друг друга, поэтому результат будет таким, как в случае открытых 1, 7, 13-й зон и т.д. Поэтому в Р по- получится максимум, хотя и более слабый, чем в основном фокусе. Соответствующее ему фокусное расстояние /^ = //3. Аналогично для фокусов высших порядков мож- можно написать /п =//Bи+ 1), где п — целые числа. Отрицательным значениям п соответствуют дифрагировавшие волны, расходящиеся из мнимых фокусов, располо- расположенных перед пластинкой (т. е. со стороны источника). Интенсивность света в главном фокусе можно увеличить еще в четыре раза (по сравнению с зонной пластинкой), если изменить на л фазы вторичных волн, исходящих от всех зон с четными (или, наоборот, с нечетными) номерами. Такая пластинка была изготовлена Вудом: химическим травлением в нужных местах тол- толщина стеклянной пластинки уменьшалась на (п — 1)А/2. В этом случае вторичные волны от всех точек волновой поверхности приходят в Р в одинаковых фазах. .Метод кольцевых зон Френеля позволяет сравнительно просто найти интенсив- интенсивность при дифракции света на круглом отверстии для точки наблюдения Р9 лежащей на оси симметрии (см. рис. 6.2 или 6.3). Расчет распределения интенсивности для всей дифракционной картины оказывается значительно сложнее. Чтобы найти напря-
6.1. Принцип Гюйгенса—Френеля. Зоны Френеля 261 женность Ер, поля в какой-либо точке Р', не лежащей на оси ОС (рис. 6.8, а), можно построить кольцевые зоны, центр которых находится в точке С' на прямой ОР'. Отверстие экрана расположится не концентрически по отношению к этим зонам: открытая отверстием часть зон выглядит так, как показано на рис. 6.8,6. Действие вторичных волн в точке Р' зависит от того, какая часть а) I б) каждой из зон открыта. По- 1 этому точный подсчет Ер, сложен, но очевидно, что при удалении Р1 от Р периодиче- периодически будут встречаться места с большей и меньшей интен- Рис. 6.8. Зоны Френеля для внеосевой точки наблюдения Р' сивностью. Так как вся карти- картина должна обладать круговой симметрией, то вокруг точки Р образуются чередую- чередующиеся более светлые и менее светлые кольца (см. рис. 6.5). Число этих колец и их положение зависят от числа зон Френеля (для точки Р), умещающихся на площади отверстия. Пока на площади отверстия укладывается лишь одна центральная зона или ее часть, интенсивность максимальна в центре (т.е. в точке Р) и монотонно убывает при удалении от Р. Когда отверстие открывает две зоны Френеля, в точке Р получается темный кружок, а вокруг него — светлое кольцо, к которому и переме- перемещается максимум интенсивности. С увеличением числа открытых зон увеличивается и число максимумов и минимумов в радиальном распределении интенсивности. Когда на площади отверстия укладывается большое число зон Френеля, то интенсивность вблизи точки Р получается почти равномерной и лишь у краев геометрической тени отверстия наблюдается чередование весьма узких светлых и темных кольцевых по- полос. Радиальное распределение интенсивности при этом практически такое же, как и вблизи границы тени от прямолинейного края экрана (см. рис. 6.12). Совершенно аналогично в дифракционной картине от круглого диска центральную светлую точку (пятно Пуассона) окружает система чередующихся темных и светлых колец. При увеличении диаметра диска пятно Пуассона в центре растущей тени ослабевает и уменьшается в размерах, а окружающие внешний край геометрической тени дифракционные кольца становятся тоньше. Заметим, что характер дифракционных явлений (т. е. пространственное распределе- распределение интенсивности в дифракционной картине) определяется числом зон Френеля, перекрываемых экраном (или отверстием в экране), а не абсолютными размерами экранов или отверстий. Радиусы зон Френеля определяются формулой F.7). Для пер- первой зоны #! = у/Хгго/(г + го) = \Д/> гДе V/ = 1/г0 + 1/г- Если г = го, т. е. экран расположен посередине между источником и точкой наблюдения, то / = г/2. При дифракции плоской волны, что соответствует бесконечно удаленному от экрана то- точечному источнику, г0 —> оо и / = г. Отношение радиуса К^ первой зоны Френеля к линейному размеру В экрана или отверстия полностью определяет условия наблюдения, при которых дифракционные явления становятся существенными и распределение интенсивности заметно отличается от
262 6. Дифракция света предсказаний геометрической оптики. Параметр р лежит в основе классификации дифракционных явлений. Когда р <С 1, число зон Френеля, перекрываемых экраном или отверстием, велико, дифракционные эффекты незначительны и распределение интенсивности приближенно описывается законами геометрической оптики (прямо- (прямолинейным распространением света). При р « 1 (заметная часть одной зоны или небольшое число зон) наблюдается сложное распределение интенсивности, называ- называемое дифракцией Френеля. При р > 1 отверстие перекрывает малую часть первой зоны Френеля. В этом случае, называемом дифракцией Фраунгофера, дифракцион- дифракционная картина упрощается. Случай дифракции Фраунгофера имеет большое практиче- практическое значение для решения многих вопросов инструментальной оптики и подробно рассмотрен в п. 6.3. При изменении расстояния / в ц раз и размера экрана И в ^/ц раз значение пара- параметра р = у/Х//О останется прежним. Поэтому дифракционные картины от геомет- геометрически подобных экранов, наблюдаемые в таких условиях, также будут подобны- подобными. В эффектных опытах В. К. Аркадьева была получена фотография дифракционной картины на расстоянии 11 км от руки, держащей тарелку, с отчетливо различимым пятном Пуассона в центре тени. В действительности фотопластинка располагалась на расстоянии 40 м, что сравнительно легко осуществить, а преграда была заменена геометрически подобной моделью из жести, уменьшенной в у/\\ 000/40 «16,5 раза. Изучение дифракции Френеля в этом параграфе было проведено в предположении, что источник света точечный, а излучаемый им свет монохроматический. В случае протяженного источника свет от каждого его элемента дает свою дифракционную картину. Вследствие полной независимости (некогерентности) света отдельных эле- элементов происходит просто сложение интенсивностей в каждой точке и результат дифракции определяется наложением таких дифракционных картин, несколько сме- смещенных одна относительно другой. Для наблюдения дифракции на опыте размеры источника должны быть достаточно малы, чтобы темные и светлые полосы картин от его отдельных элементов не перекрывались. Аналогично, в случае немонохро- немонохроматического источника различные спектральные компоненты его излучения созда- создают несовпадающие дифракционные картины, так как размеры зон Френеля зависят от длины волны. Наблюдаемое распределение интенсивности соответствует наложе- наложению этих дифракционных картин. Контрольные вопросы • В чем заключается принцип Гюйгенса—Френеля? Приведите его математическую форму- формулировку. • Как выбирается вспомогательная поверхность 5 при нахождении дифракционной картины от отверстия в непрозрачном экране? Зависит ли результат от выбора этой поверхности? • Освещенность в точке Р за круглым отверстием, открывающим одну зону Френеля, при- примерно в четыре раза больше, чем при полностью открытом волновом фронте. Если увели- увеличить вдвое площадь отверстия, освещенность в Р уменьшится почти до нуля, несмотря на удвоение светового потока. Как эти факты согласовать с законом сохранения энергии? • Покажите с помощью векторной диаграммы, что освещенность в центре геометрической тени круглого диска, перекрывающего небольшое число зон Френеля, почти такая же, как и в освещенной области.
6.2. Дифракция на прямолинейном крае 263 • Во сколько раз интенсивность в главном фокусе зонной пластинки больше, чем в фокусе /1-го порядка? • В чем заключается принцип подобия дифракционных картин? Какие условия должны вы- выполняться для того, чтобы наблюдаемые в разных условиях дифракционные картины были подобными? • При каких условиях происходит дифракция Френеля? дифракция Фраунгофера? • Объясните, почему дифракционные полосы нельзя наблюдать при протяженном или при немонохроматическом источнике света. Задачи 1. Точечный источник монохроматического света расположен на расстоянии г0 от круглого отверстия, а экран — с противоположной стороны на расстоянии г. При каких значениях радиуса /? отверстия центр наблюдаемых на экране дифракционных колец будет светлым и при каких — темным? Ответ. При /? = л/ЪгЛ/ центр темный, при К = \/Bп — 1)А/ — светлый. Здесь / = гго/(г + го),л = 1,2,... 2. Монохроматический точечный источник расположен на оси зонной пластинки на расстоя- расстоянии а от нее. Наиболее яркое изображение источника получается на расстоянии Ъ от пла- пластинки. На каких расстояниях получаются другие изображения источника? Ответ. Положения всех изображений Ьк определяются формулой \/а + \/Ьк = 1/Д, где /к = //Bк + 1) при к — О, 1, 2, ... — фокус к-го порядка, / = аЪ/{а +Ъ) — глав- главный фокус пластинки. 6.2. Дифракция Френеля на прямолинейном крае экрана Принцип Гюйгенса—Френеля можно применить для нахождения распределения ин- интенсивности вблизи границы тени, отбрасываемой краем большого экрана. Когда точка наблюдения Р (рис. 6.9) находится на конечном расстоянии от экрана, задер- задерживающего свет, для определения Ер в интеграле F.3) играет роль сравнительно небольшой участок волновой поверхности, лежа- лежащий вблизи края экрана. В таких условиях край практически любого экрана можно считать прямо- линейным. Ограничимся случаем плоской волновой по- поверхности падающей волны, что соответствует бес- бесконечно удаленному точечному источнику (или то- точечному источнику в фокусе линзы), и введем В ЭТОЙ ПЛОСКОСТИ ОСИ X И V ПРЯМОУГОЛЬНОЙ СИСТе- т> * л тг л. / , Лл ,-Т *ис« 6.9. К расчету дифракционной мы координат (см. рис. 6.9). Пусть ось ч проходит картины Френеля вблизи границы через точку наблюдения Р, находящуюся на рас- тени от прямолинейного края полу- полустоянии ^ от плоскости ху, а прямолинейный край бесконечного непрозрачного экрана экрана проходит в плоскости ху параллельно оси у на расстоянии с1 от нее (при х = —й). Основной интерес представляет распределение интенсивности вблизи края геометрической тени, поэтому можно считать, что й!<1
264 6. Дифракция света Роль поверхности 5 при применении принципа Гюйгенса-Френеля F.3) будет иг- играть не закрытая экраном часть плоскости ху. Во всех ее точках поле Е падающей плоской волны одинаково. Рассматриваемому здесь случаю дифракции Френеля соот- соответствуют малые отклонения от геометрической оптики (т. е. от закона прямолиней- прямолинейного распространения света), поэтому основной вклад в интеграл F.3) при малых углах дифракции дают участки плоскости ху, близкие к началу координат. Тогда для коэффициента наклона К (а) можно принять значение К (а) « Кг = 1/(А/) = сопз* из F.12), а расстояние # от A8 до Р — приближенно записать в следующем виде (см. рис. 6.9): Я = у/ь2 +х2+у2 = Ы1 + х2+у2 г , х2+у2 I2 ^ 2^ В множителе \/К (см. F.3)), характеризующем уменьшение амплитуды вторичных волн с увеличением расстояния, можно положить # « Ь = соп§{. Тогда вклад участка волновой поверхности в виде параллельной оси у полосы, простирающейся от х = О до х = х |, в напряженность поля Ер принимает вид ОО Х\ = -1Л И ^^{ -оо О Интегрирование по у даст постоянный (т. е. не зависящий от ширины х 1 выде- выделенной полосы волновой поверхности) множитель, не представляющий интереса. Опуская его и другие постоянные множители, можно написать \ 1 [ ё^ЦЩ ^ „ [ ё^/2^ F щ О О где вместо х введена новая безраз ле кх2/Ь = лг]2, т.е. г] =ху/2/Щ). О О где вместо х введена новая безразмерная переменная интегрирования по форму- форму2 2 /Щ Вычисление Ер по формуле F.16) удобно проиллюстрировать с помощью вектор- векторной диаграммы аналогично тому, как это было сделано в задаче о дифракции на круглом отверстии (см. п. 6.1). Колебание в точке Р, вызываемое вторичной волной от элементарной полос- полоски волновой поверхности шириной (Ьс, расположенной вдоль оси у, т.е. при х = 0, изобразим вектором 6А^ (рис. 6.10). Колебание от следующей полоски изобра- изобразится таким же по модулю вектором йА2, поверну- повернутым относительно с1Л1 на небольшой угол, так как эта вторичная волна проходит до Р большее расстояние и несколько отстает по фазе. В дальнейшем угол меж- между соседними векторами элементарных колебаний дА1 _ ,<Л _ и йА:;,1 становится все больше, так как запаздывание Рис. 6.10. Векторная диаграмма 1+! для результирующего колебания по фазе вторичной волны от элементарной полоски, на- в точке наблюдения Рот полосы ходящейся на расстоянии х от оси у, пропорциональ- волновой поверхности но Квадрату этого расстояния х2 (см. F.16)). Этим
6.2. Дифракция на прямолинейном крае 265 рассматриваемая векторная диаграмма отличается от диаграммы на рис. 6.4 для ди- дифракции на круглом отверстии, где углы между любыми соседними векторами йА( и с!Л/+1 одинаковы, так как там фаза вторичных волн растет линейно с увеличени- увеличением К (см. F.6)). Колебание в Р от широкой полосы волновой поверхности изобразится суммой векторов <\А; от всех укладывающихся на ней элементарных полосок дх (вектор А на рис. 6.10). В пределе, когда ширина дх каждой элементарной полоски стремится к нулю, цепочка векторов дАр дА2,... превращается в плавную кривую, называемую спиралью Корню (рис. 6.11). Она состоит из двух симметричных ветвей, закручиваю- закручивающихся вокруг фокусов Р и Р*. Ее левая половина описывает действие вторичных волн от участков волновой поверхности, лежащих ниже оси у (при х < 0). Колебание в Р от всей волновой поверхности, лежащей выше оси у на рис. 6.9 (т. е. при 0 < х < оо), изображается вектором, проведенным из О в правый фокус Р спирали Корню. Коле- Колебание в Р от полной волновой поверхности (—оо < х < оо) изображается вектором, соединяющим фокусы Р и Р'. Для нахождения колебания в Р от какой-либо полосы волновой поверхности, лежащей между х =л:1 и х =дс2, нужно построить вектор, который замыкает соответствующий этой полосе участок спирали. 1,4 1,2 1,4 Рис. 6.11. Спираль Корню Выражение F.16) представляет собой параметрическое уравнение спирали Корню в ком- комплексной форме. Если в плоскости векторной диаграммы ввести прямоугольные координаты X и У так, как показано на рис 6.11, то уравнение спирали Корню примет вид Х(щ) = / F-17)
266 6. Дифракция света Функции Х(г]х) и У(г]х) называются интегралами Френеля. Их значения при г]х —¦ ±оо дают координаты фокусов спирали Корню: Хр = Ур = 1/2, Хр/ = Ур/ = —1/2. Из F.17) лег- легко найти, что дифференциал длины дуги спирали Корню у/(дХJ + (йУJ равен с^. Это значит, что параметр г]х есть длина дуги спирали, отсчитываемая от точки О на рис. 6.11. Напомним, что он пропорционален ширине соответствующей полосы волновой поверхности: Угловой коэффициент касательной к спирали Корню 1%а = дУ/дХ = 1§(я^/2), отку- откуда а = лг]\/2. При г)х = О угол а = О, т.е. в точке О спираль касается оси X. При щ = 1 угол а = л/2, т.е. касательная вертикальна. При щ = у/2 угол а = я, т.е. касательная снова горизонтальна, но направлена влево. При щ = у/Ъ угол а = Зя/2, т.е. касательная вертикаль- вертикальна и направлена вниз. Таким образом легко проследить, как спираль Корню обвивается вокруг фокусов, совершая при этом бесконечное число витков. Соотношение а = пг\\ /2 позволяет по заданному значению параметра цх найти соответствующую точку на спирали Корню. С помощью спирали Корню легко получить распределение интенсивности вблизи края геометрической тени при дифракции плоской волны на прямолинейном крае экрана. При любом расположении точки наблюдения Р относительно края экрана верхняя часть волновой поверхности полностью открыта (см. рис. 6.9). Поэтому на векторной диаграмме колебанию в Р сопоставляется вектор О?\ конец которого все- всегда находится в верхнем фокусе Р (см. рис. 6.11). Положение начала этого вектора (точки О) на спирали Корню зависит от положения точки наблюдения Р. Ког- Когда Р находится на границе геометрической тени (т. е. край экрана на рис. 6.9 совпадает с осью у и а1 = 0), точка B совпадает с О и колебание изображает- изображается вектором ОР, равным половине век- вектора РР\ сопоставляемого колебанию при полностью открытой волновой по- поверхности. Поэтому при й — 0 ампли- амплитуда колебаний в точке Р вдвое мень- меньше, чем в отсутствие экрана, а интен- интенсивность в четыре раза меньше интен- интенсивности /0. График зависимости интенсивности от положения точки наблюдения приве- приведен на рис. 6.12. Внизу показана фото- фотография дифракционной картины вбли- вблизи края геометрической тени. При пе- перемещении точки наблюдения Р в осве- Рис. 6.12. Распределение интенсивности вбли- щенную область, т.е. вверх на рис. 6.9, зи края геометрической тени прямолинейного точка 0 на векторной диаграмме (см. полубесконечного экрана рис 6П) будет перемещаться по ниж. ней ветви спирали Корню. При этом ин- интенсивность будет последовательно проходить через максимумы и минимумы (об- (область й > 0). В первом, наибольшем из максимумов / = 1,37/0, а в первом мини- минимуме / = 0,78 /0. С увеличением расстояния й от края геометрической тени размах колебаний интенсивности уменьшается и она приближается к значению /0, кото-
6.2. Дифракция на прямолинейном крае 267 рое было бы в отсутствие экрана, а места максимумов и минимумов постепенно сближаются друг с другом. Таким образом, при продвижении в освещенную область дифракционные полосы сгущаются и становятся все менее контрастными. При погружении точки наблюдения Р в область геометрической тени экрана (вниз на рис. 6.9) точка B перемещается по верхней ветви спирали Корню. Длина векто- вектора BР, а следовательно, и интенсивность монотонно уменьшаются с увеличением расстояния, асимптотически приближаясь к нулю (рис. 6.12, область й < 0). Зависи- Зависимость интенсивности от д, можно выразить аналитически через интегралы Френе- Френеля F.17). Проведенное исследование показывает, что между светом и тенью от края экра- экрана нет резкой границы: в области геометрической тени интенсивность спадает а) Рис. 6.13. Картины дифракции Френеля от щелей разной ширины. Штриховыми линиями показаны границы геометрической тени
268 6. Дифракция света постепенно и монотонно, а край освещенной области расщепляется в дифракционные полосы. Полученные закономерности хорошо подтверждаются на опыте. Совершенно аналогично с помощью спирали Корню или интегралов Френеля мож- можно рассчитать дифракционные картины от щели с прямолинейными параллельными краями (рис. 6.13, а и 6.13,6) или от непрозрачной полоски постоянной ширины (рис. 6.14). В зависимости от ширины щели В и расстояния Ь до точки наблюде- наблюдения (точнее, в зависимости от значения безразмерного параметра й/л/ХЕ) в сере- середине дифракционной картины может находиться темная (рис. 6.13, а) или светлая (рис. 6.13,6) полоса. Освещенная через щель область экрана имеет вид дифракцион- дифракционных полос сложной структуры, параллельных краям щели. При перемещении точки наблюдения в область геометрической тени переход от светлых полос к темноте про- происходит немонотонно, в отличие от рассмотренного выше случая полубесконечного экрана (см. рис. 6.12). Аналогично, границы тени от тонкой проволоки (см. рис. 6.14) из-за дифракции имеют вид параллельных полос со сложным распределением интен- интенсивности. Рис. 6.14. Картина дифракции Френеля от тонкой проволоки Сделаем несколько замечаний по поводу использованного выше приближенного ме- метода решения дифракционных задач. Чтобы с помощью принципа Гюйгенса—Френеля определить поле световой волны за экра- экраном, нужно знать поле на поверхности экрана и в отверстии. Предполагается, что напряжен- напряженность поля в точках отверстия такая же, как и при свободном распространении падающей волны при отсутствии каких бы то ни было экранов, а в точках, лежащих непосредственно за непрозрачным экраном, напряженность поля равна нулю. Это предположение позволяет решить задачу дифракции, но вместе с тем оно влечет за собой целый ряд принципиальных трудностей.
6.2. Дифракция на прямолинейном крае 269 •Си е Во-первых, оно математически противоречиво: если вычислить по принципу Гюйгенса— Френеля напряженность поля во всем пространстве, то на вспомогательной поверхности 5 она не совпадает с исходной напряженностью поля падающей волны, а на задней стороне экрана не обращается в нуль. Во-вторых, это предположение допускает разрыв напряженности по- поля на краю отверстия, что противоречит граничным условиям (непрерывности тангенциальных составля- составляющих). В-третьих, предположение приводит к проти- противоречию со свойством поперечности световых волн. В самом деле, допустим, что на экран с отверстием падает по нормали линейно поляризованная плоская волна (рис. 6.15). Тогда на вспомогательной поверх- поверхности 5 в соответствии с обсуждаемым предположе- предположением вектор Е имеет во всех точках одно и то же на- направление, параллельное плоскости экрана. Приме- Применяя принцип Гюйгенса—Френеля для вычисления Ер в точке Р, в результате сложения происходящих по этому направлению колебаний во вторичных волнах получим, что в дифрагировавшей волне вектор Ер всюду параллелен плоскости экрана. Но в действи- действительности на большом расстоянии отклоненная вол- волна поперечна и вектор Е в ней образует с плоскостью экрана некоторый угол (рис. 6.15). Отме- Отмеченные трудности характерны и для теории Кирхгофа, в которой принцип Гюйгенса—Френеля получил математическое обоснование на основе (скалярного) волнового уравнения для ком- компонент напряженности поля. Рис. 6.15. Векторы напряженности электрического поля Е падающей вол- волны в плоскости отверстия и дифрагиро- дифрагировавшей волны Е/> в точке наблюдения Р в приближении Френеля Подробный анализ показывает, что лежащие в основе метода Френеля допущения могут быть оправданы, когда размеры препятствий (или отверстий в экранах) вели- велики по сравнению с длиной световой волны. В этом случае отклонения от геомет- геометрической оптики малы, т. е. заметная интенсивность наблюдается только при малых углах дифракции. Различие в истинном и вычисленном направлениях Е при этом несущественно. Влияние края экрана на поле в отверстии простирается лишь на расстояние порядка длины волны, и при больших размерах отверстия замена истин- истинных значений Е в подынтегральном выражении формулы F.3) на напряженность Е падающей волны не приводит к заметным ошибкам, так как на большей части по- поверхности 5 эти значения совпадают. При больших по сравнению с длиной волны размерах отверстий расчеты дифракционной картины по методу Френеля хорошо подтверждаются на опыте и согласуются с результатами точного электродинами- электродинамического решения (в тех случаях, когда такое решение возможно). Подтверждается и предположение о независимости дифракционной картины в этих условиях от мате- материала экрана. Строгое электродинамическое решение задачи дифракции плоской электромагнит- электромагнитной волны на прямолинейном крае идеально проводящего полубесконечного экрана было получено в 1894 г. А. Зоммерфельдом. С тех пор было найдено строгое ре- решение лишь нескольких дифракционных задач (Л. И. Мандельштам, В. А. Фок и др.). Для большинства задач метод Френеля дает единственный путь решения и приво- приводит к практически удовлетворительным результатам. Несмотря на отмеченные выше принципиальные трудности и ограниченную применимость, он оказался чрезвычайно плодотворным.
270 6. Дифракция света Контрольные вопросы • Чем обусловлено различие векторных диаграмм для дифракции на прямолинейном крае экрана (см. рис. 6.10) и на круглом отверстии (см. рис. 6.4)? • Как с помощью спирали Корню найти вектор, изображающий световое колебание в точ- точке наблюдения Р, лежащей в области геометрической тени? в освещенной области? Как при этом объясняется основное различие в распределении интенсивности для этих двух случаев? • Какие трудности принципиального характера присущи приближенному методу решения дифракционных задач на основе принципа Гюйгенса—Френеля? • При каких условиях присущие методу Френеля трудности становятся несущественными и он приводит к правильным согласующимся с опытом результатам? Задачи 1. Оцените ширину дифракционных полос вблизи границы тени от прямолинейного края экра- экрана. Дифракционная картина наблюдается в плоскости, перпендикулярной направлению па- падающей плоской волны (Я = 500 нм) и расположенной на расстоянии 1 м от отбрасываю- отбрасывающего тень экрана. Решение. Максимумам и минимумам интенсивности на рис. 6.12 соответствуют точки нижней ветви спирали Корню, расстояние до которых от верхнего фокуса Р соответ- соответственно максимально или минимально (см. рис. 6.11). Приближенно можно считать, что эти точки находятся на пересечении спирали с продолжением прямой РР', проходящей через фокусы, так как в таких точках прямая РР' практически перпендикулярна спира- спирали Корню (см. рис. 6.11). Для нахождения положения максимумов воспользуемся тем, что угол а наклона касательной к спирали Корню связан с параметром г]{ соотношени- соотношением а = лт^/2, а г)\ пропорционален расстоянию й до точки наблюдения от края геомет- геометрической тени: щ = А ^/21 (XV). Поэтому а = л А2 /(XV). В первом максимуме ах « Зя/4, в п-и — «! « Зя/4 + 2л(п — 1). Таким образом, светлые полосы находятся на расстояни- расстояниях Ап — \/Bп — 5/4)Я^ (п — 1, 2, 3,...) от края геометрической тени. Для первой полосы й\ = у/ЗХП/4 « 0,6 мм. Расстояния между последующими максимумами постепенно умень- уменьшаются. 6.3. Дифракция Фраунгофера Наибольший практический интерес представляют дифракционные явления, наблю- наблюдаемые при падении на экран (или на отверстие в экране) параллельного пучка света. В результате дифракции пучок утрачивает параллельность, т.е. появляется свет, распространяющийся в направлениях, отличных от первоначального. Распре- Распределение его интенсивности на очень большом (в пределе — бесконечно большом) расстоянии от экрана соответствует дифракции Фраунгофера. Волны, возникающие в результате ограничения фронта падающей плоской волны при прохождении сквозь отверстие в экране, называют дифрагировавшими, а нормали к их волновым поверх- поверхностям — дифрагировавшими лучами. Они не существуют в рамках геометрической оптики. Возникновение дифрагировавших волн при прохождении через отверстие означает, что волна с ограниченной площадью поперечного сечения не может быть
6.3. Дифракция Фраунгофера 271 строго плоской. Разложение волны с ограниченным фронтом на сумму плоских волн (т.е. пространственное разложение Фурье) содержит слагаемые с волновыми век- векторами различных направлений. Эти слагаемые и соответствуют дифрагировавшим волнам. Угловой разброс в направлениях распространения для пучка шириной а из- за дифракции, как показано ниже, не может быть меньше Ыд « А/д. Практически дифракцию Фраунгофера наблюдают не «в бесконечности», а в фо- фокальной плоскости объектива (собирающей линзы с исправленными аберрациями) или с помощью зрительной трубы, установленной на бесконечность. Схема опы- опыта показана на рис. 6.16. Падающий на экран параллельный пучок мож- можно получить, если точечный ис- источник 5 поместить в фокус лин- линзы Ь' (формирующая параллель- параллельный пучок линза I! называется кол- коллиматором). Размеры линз должны быть много больше размеров от- отверстий в экране, чтобы наблюда- наблюдаемое распределение интенсивности Рис. 6.16. Схема наблюдения дифракции Фраунгофера было обусловлено дифракцией при в Фокальной плоскости собирающей линзы ограничении фронта волны именно отверстиями в экране, а не оправами линз. Если отверстие в экране представля- представляет собой узкую щель, изображение точечного источника 5 в фокальной плоскости объектива растянется в полоску, перпендикулярную щели. Освещенность полоски от середины к краям уменьшается немонотонно, проходя через ряд минимумов и макси- максимумов. При повороте щели вся картина также поворачивается. Вместо точечного ис- источника 5 можно взять светящуюся нить, параллельную щели. В этом случае наблю- наблюдаемое в фокальной плоскости объектива изображение нити оказывается растянутым в перпендикулярном щели направлении. При отсутствии экрана между линзами огра- ограничение поперечного сечения светового пучка осуществляется апертурной диафраг- диафрагмой (см. п. 7.3) оптической системы (роль которой в схеме на рис. 6.16 играет оправа меньшей из линз Ь и //). Создаваемое идеальной оптической системой изображение точечного источника 5 всегда представляет собой не точку в сопряженной с 5 плос- плоскости (как это следует из геометрической оптики), а фраунгоферову дифракционную картину, возникающую вследствие ограничения сечения светового пучка. В демонстрационных опытах с использованием лазерного излучения необходи- необходимость в коллиматоре I! и объективе ^ отпадает. Щель вводят непосредственно в пу- пучок. Световые колебания когерентны по всему поперечному сечению лазерного пуч- пучка. Это значит, что в отношении когерентных свойств излучения лазер можно рас- рассматривать как находящийся на большом расстоянии точечный источник. На экране, отстоящем от щели на расстояние порядка Юм, наблюдается фраунгоферова ди- дифракционная картина: пятно размывается в перпендикулярную щели длинную по- полоску с постепенно спадающей к краям освещенностью, прорезанную эквидистант- эквидистантными темными минимумами. Ширина центрального максимума вдвое больше, чем боковых. Распределение интенсивности света при дифракции Фраунгофера можно найти с по- помощью принципа Гюйгенса—Френеля F.3). Интенсивность в определенной точке Р
272 6. Дифракция света фокальной плоскости объектива Ь (см. рис. 6.16) обусловлена интерференцией вто- вторичных волн, исходящих от всех элементарных участков отверстия экрана, причем эти волны распространяются в одном и том же направлении 0, соответствующем точке Р. Когда размеры отверстий в экране, ограничивающих сечение пучка, велики по сравнению с длиной световой волны, напряженность поля на вспомогательной (плоской) поверхности 5, совпадающей с отверстием в экране, можно считать такой же, какой она была бы при отсутствии экрана. Заметную интенсивность при этом имеют лишь волны, дифрагировавшие на малые углы в. Рассмотрим сначала простой, но практически важный случай, когда отверстие в экране имеет вид узкой длинной щели с параллельными краями. Размер волновой поверхности в направлении вдоль щели ограничен только объективом, и если вноси- вносимую им дополнительную дифракцию во вни- внимание не принимать, то волны дифрагируют только в направлениях, перпендикулярных щели. Поэтому можно считать, что элемен- элементарные участки волнового фронта, имеющие вид узких длинных полосок, параллельных краям щели, становятся источниками цилин- цилиндрических вторичных волн. Амплитуды этих волн, приходящих в точку Р от разных поло- полосок, одинаковы, так как все элементы имеют Рис. 6.17. Вторичная волна, приходящая одинаковую площадь и одинаковый наклон в точку наблюдения Р из точки волнового к направлению вторичных волн. Соотноше- фронта с координатой х в отверстии экрана ,г г ние фаз вторичных волн в точке Р будет та- таким же, как и в любой плоскости, перпенди- перпендикулярной их направлению до линзы, например в плоскости АВ (рис. 6.17). Так как при нормальном падении света на щель фазы вторичных источников одинаковы, то исходящая под углом в волна из элемента с координатой х опережает по фазе волну того же направления из середины щели на кх &т в. Амплитуда результирующего ко- колебания в точке Р, обусловленного вторичными волнами от всей щели шириной а, пропорциональна выражению а/2 ЕР где ¦ВД / -а/2 ка ла и = — 81П в = — 81П в. F.18) F.19) При малых углах дифракции в коэффициент наклона К (в) в F.18) практически не зависит от в и его можно заменить значением при 0 = 0. Тогда зависимость интенсивности дифрагировавшего света от 0 определяется выражением 2, F.20) где /0 — интенсивность света при 0 = 0, т. е. по направлению падающей волны. График распределения интенсивности по направлениям приведен на рис. 6.18. В цен- центре дифракционной картины интенсивность максимальна и равна /0. При и = тл,
6.3. Дифракция Фраунгофера 273 где т = ±1, ±2,..., интенсивность равна нулю. Направления вт на эти минимумы, как видно из F.19), определяются условием а$твт = тХ. F.21) /=/,г и2 и = — 81П0 Первый минимум дифракционной картины (ти = 1) соответствует направлению 0р для которого зтб^ = А/а, а при Х/а <С 1 угол 01 « А/а. Это условие легко полу- получить без всяких вычислений. Рассмот- Рассмотрим две одинаковые элементарные по- полоски, находящиеся на расстоянии а /2. Вторичные волны от них, распростра- распространяющиеся под углом 0, имеют раз- разность хода (а /2) $т в. Если эта раз- разность хода равна А/2, т.е. ыпб = А/а, то вторичные волны гасят одна другую в результате интерференции. Вся щель состоит из таких пар элементарных по- полосок, поэтому при 8Ш в — Х/а интен- - сивность дифрагировавшего света об- обращается в нуль. Между минимумами интенсивности, определяемыми условием F.21), нахо- находятся максимумы различных порядков. Рис- «*• Угловое распределение интенсивности хж ; г г при дифракции Фраунгофера на щели и фотография Их положение определяется трансце- ^фракционныхполос.Центральныймакси^мна дентным уравнением 1%и = и9 имею- снимке сильно переэкспонирован для выявления щим корни мо=О; их = 1,43л; и2 = слабых боковых максимумов = 2,46я; м3 = 3,47я и т.д. Практически можно считать, что максимумы находятся посередине между соседними минимума- минимумами. Значения интенсивности в максимумах быстро убывают с увеличением порядка. Их отношения приближенно можно выразить в виде -2л- -я- 2л- Зл- 1 : [2/(Зл)]2 : [2/Eл)}2 :...»!: 0,047 : 0,017 :... F.22) Таким образом, основная часть светового потока сосредоточена в центральной дифракционной полосе между минимумами порядков т = ±1, т.е. в пределах уг- углов —#2 < в < вх, где 81П02 = А/а. Угловая ширина максимумов уменьшается при увеличении ширины а щели: если в <С 1, то 6Х = Х/а. Центральный максимум стано- становится резче, первые минимумы придвигаются ближе к центру картины. Высота мак- максимума интенсивности пропорциональна квадрату ширины щели, так как возраста- возрастающий пропорционально а световой поток распространяется в пределах убывающего угла (#2 ~ 1/а). Относительная интенсивность остается неизменной: распределение света по максимумам разных порядков F.22) не зависит от ширины щели. При сужении щели освещенность полос уменьшается, а вся картина расширяется, так как угловая ширина полос обратно пропорциональна ширине щели. Когда а приближается к А, центральный максимум охватывает все поле зрения; освещенность экрана уменьшается от центра к краям монотонно.
274 6. Дифракция света Полученные результаты можно использовать для оценки дифракционной расхо- расходимости пучков света, ширина которых ограничена, например, в результате про- прохождения через диафрагму. Основная часть светового потока приходится на цен- центральный дифракционный максимум, поэтому его ширину можно принять в качестве оценки угловой расходимости Д0 пучка с поперечным сечением а: Д0~-. F.23) а Это угловое уширение пучка обусловлено волновой природой света, и его в прин- принципе нельзя устранить при заданной ширине сечения пучка. Строго параллельных световых пучков не существует. На пути длиной / пучок претерпевает дифракци- дифракционное уширение порядка /Д0 = XI/а. Этим уширением можно пренебрегать лишь тогда, когда оно мало по сравнению с исходной шириной пучка, т.е. при XI <С а2. В таких условиях пучок приближенно можно считать параллельным и использовать для его описания геометрическую оптику. Рассмотрим, например, «параллельный» лазерный пучок диаметром а = 2 мм, све- световые колебания в котором когерентны по всему поперечному сечению. Его расши- расширение по мере распространения обусловлено дифракцией. При Я = 600 нм диаметр пучка на расстоянии / = 150 м составит приблизительно 2X1/а = 10 см. Для пучков света от нелазерных источников расширение обусловлено обычно не дифракцией, а конечными размерами источника. Если источник размером п (светящаяся нить) находится в фокусе линзы с фокусным расстоянием Р, то выходящие из линзы пуч- пучки света от краев источника в соответствии с геометрической оптикой образуют угол Э/Р. Чтобы этот угол был меньше дифракционной расходимости пучка диамет- диаметром а, размер источника должен удовлетворять условию В < ХР/а. При а — 2мм, Р = 5 см, Я = 600 нм это дает В < 10~3 см. Размеры реальных источников гораздо больше. Пучок света с минимально возможной при данном диаметре а угловой расхо- расходимостью Д0 ~ XIа формируется в результате интерференции вторичных волн от всего поперечного сечения. Такая интерференция возможна только тогда, когда све- световые колебания когерентны по всему поперечному сечению пучка. Высокая про- пространственная когерентность лазерного пучка обусловлена самой природой процес- процесса испускания света (вынужденное излучение). Когда направленный пучок («плос- («плоская» волна) формируется от обычного источника света, помещенного в фокус со- собирающей линзы или вогнутого зеркала, для достижения дифракционного предела расходимости необходимо, чтобы освещение всей поверхности линзы или зеркала было когерентным. Как было показано в п. 5.5, размер области когерентности от протяженного источника равен й « Я/0, где 0 = й/Ь — угловой размер источни- источника. В данном случае расстояние Ь от источника равно фокусному расстоянию Р и й = ХР/й. Из требования й > а получаем прежнее ограничение на размер ис- источника: В < ХР 1а. Для увеличения допустимого размера источника можно увели- увеличивать Р9 но при этом уменьшается та часть светового потока источника, которая попадает в формируемый пучок. Наглядное представление о суммировании вторичных волн для нахождения рас- распределения интенсивности при дифракции Фраунгофера на щели можно получить
6.3. Дифракция Фраунгофера 275 с помощью метода векторных диаграмм. Колебания в точке Р, вызываемые вторичны- вторичными волнами от одинаковых элементарных полосок вспомогательной поверхности 5, изображаются векторами дА- одинаковой длины (рис. 6.19). Центру дифракционной а) 0 = 0 в) С Рис. 6.19. Векторные диаграммы для дифракции Фраунгофера на щели картины F = 0), куда все вторичные волны приходят в одинаковой фазе, соответ- соответствует диаграмма на рис 6.19, а. Результирующая амплитуда равна А^. Диаграмма на рис. 6.19,5 соответствует такому направлению 6^ вторичных волн, когда разность фаз от краев щели равна 2я, т.е. азтв^ =А. Цепочка векторов сЬ4/5 повернутых друг относительно друга на один и тот же угол, в этом случае оказывается замк- замкнутой и амплитуда результирующего колебания равна нулю. Это первый минимум дифракционной картины. Легко видеть, что результирующая амплитуда равна нулю и тогда, когда разность фаз от краев щели равна 2лт9 где т — целое число. Цепочка векторов йА; при этом замыкается после т оборотов. Общий случай представляет диаграмма на рис. 6.19, в. Векторы 6А{ и 6Ап, изображающие колебания от краев щели, образуют угол ср = ка зт 0. Результирующее колебание в Р изображается век- вектором А(в) — хордой окружности с центром в точке С. Длина дуги, стягиваемой этой хордой, приближенно равна Ао — амплитуде в центре дифракционной картины, т. е. при 6 = 0. Это заключение справедливо, если при изменении 6 изменяется только на- направление векторов 6А( (фазы колебаний), но не их модули (амплитуды колебаний), т.е. когда коэффициент наклона К@) в F.3) считается постоянным: КF) « К@). Из рис. 6.19,в легко видеть, что АF) = 2К$т(ф/2) = BА0/ф)$т(ф/2). Отсюда для распределения интенсивности 1F) ~ А2F) снова получаем формулу F.20). Если плоская волна падает на щель наклонно под углом 6! к нормали, то раз- разность хода между вторичными волнами, распространяющимися от краев щели в на- направлении 6, составляет а($тв — зт0'). Условие дифракционных минимумов вме- вместо F.21) принимает вид а($тдт — зт0') = тХ. Угловое распределение интенсив- интенсивности по-прежнему определяется формулой F.20), в которой теперь зт0 следует заменить на зт0 — зт0' (см. задачу 1). Центральный максимум дифракционной кар- картины расположен при 6 = 0', т.е. в направлении падающей волны. До сих пор предполагалось, что в фокусе коллиматорной линзы I! находится точеч- точечный источник 5. Если в качестве 5 взять светящуюся линию, параллельную щели, то изображение каждой ее точки в фокальной плоскости объектива Ь вытянется в ли- линию, ориентированную перпендикулярно щели. Распределение интенсивности вдоль
276 6. Дифракция света а) б) всех этих линий будет одинаковым, поэтому образуется система параллельных щели дифракционных полос с описываемым формулой F.20) поперечным распределением интенсивности. В том случае, когда расположенный в фокальной плоскости коллиматора II ис- источник имеет конечный размер в перпендикулярном щели направлении (светяща- (светящаяся полоска шириной й)9 распределение интенсивности в фокальной плоскости объектива Ь можно рассматривать как наложение независимых дифракционных картин, создавае- создаваемых взаимно некогерентными световыми пучка- пучками от отдельных элементов протяженного источ- источника. Отстоящий на расстояние х от оси элемент источника посылает на щель плоскую волну, на- наклоненную на угол вг{х) « х/Р9 где Р — фокус- фокусное расстояние коллиматора. На такой же угол будет смещен центральный максимум соответ- соответствующей дифракционной картины. Централь- Центральные максимумы от краев источника смещены на углы 0тах « й/BР). Если щель широкая, так что ширина максимумов 9Х = Х/а значительно меньше #тах> то наложение узких максимумов от отдельных элементов создает в фокальной плоскости объектива изображение источника, ко- которое геометрически почти подобно источнику и лишь слегка размыто по краям из-за боковых максимумов от близких к краям элементов ис- источника (рис. 6.20, а, б). По мере уменьшения ширины щели угол 6^ « Х/а увеличивается, т. е. дифракционные максимумы от отдельных эле- элементов источника расширяются, а его изображе- изображение становится все более расплывчатым: дифрак- Рис. 6.20. Дифракция Фраунгофера на ционное уширение будет составлять значитель- щелиприпрагяженномисточникесвета ную часть геометрической ширины изображения (рис. 6.20, в, г). При очень узкой щели, когда #! = Х/а ^> 6'тах — й/BР)9 наблюдаемая в фокальной плоскости картина полностью утрачивает подобие источнику, так как «изображение» источника в этом случае по- почти не отличается от дифракционной картины, создаваемой линейным (бесконечно узким) источником. Характер дифракционной картины в свете от протяженного источника можно рас- рассмотреть и на основе введенной в п. 5.5 степени пространственной когерентности излучения. Размер области когерентности на поверхности коллиматорной линзы и, следовательно, на щели для источника в виде светящейся полоски шириной В в пер- перпендикулярном полоске направлении равен а1 — ХР/И. Если ширина а щели много меньше этого размера, т.е. а <С ХР/О, то световые колебания во всех точках щели (в поперечном направлении) почти полностью когерентны и распределение интен- интенсивности в фокальной плоскости объектива практически такое же, как в дифрак- дифракционной картине от линейного источника. В противоположном предельном случае
6.3. Дифракция Фраунгофера 277 широкой щели, когда а ^> ХР/И, когерентность колебаний поперек щели прости- простирается лишь на расстояния й «Я/7//), малые по сравнению с ее шириной а. Для оценки ширины изображения источника здесь можно считать, что дифракция про- происходит как бы на щели с эффективной шириной й, т.е. свет отклоняется на углы порядка & « Я/ й « В /Р. Это по порядку величины совпадает с угловой шириной изображения светящейся полоски. Таким образом, применение понятия частичной пространственной когерентности приводит к тем же результатам, что и суммиро- суммирование независимых дифракционных картин от отдельных элементов протяженного источника. Рассмотрим теперь дифракцию Фраунгофера при падении плоской волны на отверстие в плоском экране, В отличие от длинной щели здесь волны дифрагируют во всех направлени- направлениях. Каждой точке наблюдения Р соответству- соответствует определенное направление дифрагировавших волн, характеризуемое единичным вектором 8 (рис. 6.21). В качестве вспомогательной поверх- поверхности 5 выберем плоскость экрана ху. Раз- Разность хода идущих по направлению 8 вторич- вторичных волн из элемента д5 этой поверхности и из начала координат О равна проекции вектора г, определяющего положение ё5 в плоскости ху, на направление 8, т.е. скалярному произведению (гв). В соответствии с принципом Гюйгенса—Френеля напряженность поля в точке Р пропорциональна интегралу по всей площади отверстия в экране: Рис. 6.21. К расчету дифракции Фраунгофера от отверстия • [ I = /«(г). F.24) где к = #8 — волновой вектор света, дифрагировавшего в направлении 8. Опущен- Опущенный в F.24) коэффициент наклона К (а) можно считать постоянным, когда размеры отверстия много больше длины волны. Тогда заметную интенсивность имеют лишь волны, дифрагировавшие на малые углы а. Напряженность Е(г) в плоскости ху счи- считается равной напряженности поля падающей волны в пределах отверстия экрана и равной нулю за его пределами. Понимая функцию Е(х,у) именно так, можно рас- распространить интегрирование в F.24) на всю плоскость ху: Н =Е(кх,ку). F.25) Отсюда видно, что поле в фраунгоферовой дифракционной картине, т.е. на очень большом расстоянии от препятствия или в фокальной плоскости объектива, пред- представляет собой (с точностью до постоянного множителя) двухмерное преобразова- преобразование Фурье функции Е(х,у)9 описывающей световое поле в плоскости ху, где распо- расположен экран с отверстием. Функция Е(кх,ку)9 т.е. фурье-образ искаженного препят- препятствием волнового поля Е(х,у) в плоскости ху, пропорциональна комплексной ам- амплитуде плоской волны, дифрагировавшей в определенном направлении кх,ку. Иначе говоря, полное волновое поле на больших расстояниях позади препятствия можно
278 6. Дифракция света представить в виде суперпозиции плоских волн, распространяющихся в направле- направлениях, задаваемых поперечными компонентами кХ9 ку волнового вектора к. Поэтому величины кх, ку называют иногда пространственными частотами функции Е(х,у)9 а функцию Е(кх,ку)9 определяющую распределение амплитуд отдельных плоских волн в такой суперпозиции, — угловым спектром дифрагировавшего волнового по- поля. Пространственное разделение волн, дифрагировавших в разных направлениях, позволяет наблюдать на опыте отдельные фурье-компоненты функции Е(х,у). По- Поэтому можно считать, что в дифракции Фраунгофера физически осуществляется разложение функции Е(х,у) в двухмерный интеграл Фурье. При нормальном падении плоской волны на прямоугольное отверстие со сторо- сторонами а и Ь, параллельными осям х и у9 из F.25) получаем следующее выражение для амплитуды световых колебаний в точке Р: а/2 Ь/2 [ ^ -а/2 -Ь/2 и2 где их = кха/2, и2 = куа/2. Распределение интенсивности в дифракционной картине определяется формулой Когда длина одной из сторон много больше длины другой, мы приходим к по- полученному выше выражению F.20) для дифракции на длинной щели. В дифракци- дифракционной картине от прямоугольного отверстия (рис. 6.22) распределение интенсивно- интенсивности в соответствии с F.26) дается произве- произведением распределений от взаимно перпенди- перпендикулярных щелей. Интенсивность равна нулю вдоль двух рядов линий, параллельных сто- сторонам прямоугольника. Заметную интенсив- интенсивность имеют лишь средние цепочки макси- максимумов, образующие «крест» на рис. 6.22. От- Относительная высота максимумов интенсивно- интенсивности, расположенных вдоль этих линий, ха- характеризуется соотношением F.22). Величи- Величина остальных максимумов очень мала @,2 % для ближайших к центру), так что они по- Рис. 6.22. Дифракция Фраунгофера от прямо- чти не видны на приведенной фотографии, угольного отверстия. Центральная область Большая часть светового потока приходит- "^—^2%"™ « на центральный максимум, и именно его можно рассматривать как изображение на- находящегося в фокусе коллиматора точечного источника, получающееся в фокальной плоскости объектива при ограничении сече- сечения формирующего изображение пучка света прямоугольной диафрагмой. Это изоб- изображение шире в направлении более короткой стороны прямоугольника.
6.3. Дифракция Фраунгофера 279 Дифракция Фраунгофера от круглого отверстия представляет большой практиче- практический интерес, так как в оптических приборах оправы линз и объективов, а также диафрагмы имеют обычно круглую форму. При вычислении интеграла F.25) целесо- целесообразно перейти к полярным координатам р и ср в плоскости отверстия: х = р соз<р, у — р 8т<р. Направление 8 дифрагировавшей волны, соответствующее точке Р, удоб- удобно характеризовать углом в с осью г и азимутальным углом гр: кх = к зт в соз \р, ку = кьтвьтгр. Тогда кхх + куу = кр$твсо$(ф — гр) и интеграл F.25) принимает вид а 2л II О О Здесь а — радиус отверстия. Используя интегральное представление для бесселевых функций ^п{^) при п = О О выразим Ер через интеграл от /0(&р8т#), который вычисляется с помощью соотно- соотношения Таким образом, дифракционная картина от круглого отверстия имеет вид концен- концентрических светлых и темных колец (рис. 6.23) со следующим радиальным распреде- распределением интенсивности: 1@) = /0 и = 2ла 8Ш0 : 2ла в. F.27) Я Я График этой функции приведен на рис. 6.24. Она имеет главный максимум при и = О и с ростом и осциллирует с быстрым уменьшением амплитуды, подобно функ- функции (зт м/мJ, описывающей дифракцию на щели. Угловые радиусы вп темных 1 0,8 0,6 0,4 0,2 = ка 8Ш0 0 3,8 7,0 10,2 и Рис. 6.23. Дифракция Фраунгофера от круглого отверстия. Центральная область сильно переэк- переэкспонирована для выявления слабых побочных максимумов Рис. 6.24. График функции \1^(иIи^ для радиального распределения интенсивно- интенсивности в дифракционной картине Фраунгофера от круглого отверстия
280 6. Дифракция света колец равны 0,61А/а; 1,12А/а; 1,62А/#;... Расстояние между соседними кольцами с увеличением их номера приближается к Х/Bа). Эффективный размер дифракци- дифракционной картины и здесь обратно пропорционален размеру отверстия. Интенсивность максимумов быстро уменьшается: уже в ближайшем максимуме она составляет ме- менее 2% от интенсивности центрального максимума, на который приходится 84% проходящего через отверстие светового потока. Поэтому центральный максимум {диск Эйри), имеющий угловой радиус вх = 0,61 -, F.28) можно рассматривать как изображение точечного источника, уширенное дифракцией на круговой диафрагме радиусом а. Соотношение F.28) играет важную роль в во- вопросе о разрешающей силе оптических инструментов (см. п. 7.6). Важно отметить, что распределение интенсивности в фраунгоферовой дифракцион- дифракционной картине не изменится, если отверстие сместить в плоскости экрана в сторону, не изменяя его ориентации. Картина в фокальной плоскости объектива всегда сим- симметрична по отношению к его оси независимо от положения отверстия. Особый интерес представляет случай, когда в экране имеется большое число N одинаковых отверстий. При правильном, регулярном, расположении отверстий, когда их ориентация и расстояния между ними одинаковы, разность фаз между вол- волнами, дифрагировавшими от соседних отверстий, имеет определенное значение. Ин- Интерференция этих волн существенно влияет на дифракционную картину. В направле- направлениях, для которых разность фаз кратна 2л, амплитуда дифрагировавших волн в N раз больше, а интенсивность в М2 раз больше, чем от одного отверстия. Такое резкое увеличение интенсивности для некоторых направлений имеет большое практическое значение. Случай регулярного расположения отверстий подробно рассмотрен на при- примере дифракционной решетки в п. 6.5. При хаотическом, беспорядочном, расположении отверстий фазовые соотноше- соотношения между волнами от отдельных отверстий имеют случайный характер. Поэтому для каждого направления наблюдения происходит простое сложение интенсивностей волн, дифрагировавших от всех отверстий. Распределение интенсивности в дифрак- дифракционной картине от одного отверстия не зависит от его положения. От большо- большого числа N отверстий получается такая же картина, усиленная по интенсивности в N раз. Контрольные вопросы • Объясните назначение линз 11 и Ь в схеме для наблюдения дифракции Фраунгофера на рис. 6.16. • Как получить без вычислений соотношение 8тв1=Х/а9 определяющее направление на первый минимум при дифракции на щели шириной а! • Можно ли какими-либо способами получить узкий параллельный пучок света? • Какому условию должен удовлетворять размер источника, чтобы с помощью линзы или зеркала можно было получить пучок света с дифракционной расходимостью?
6.3. Дифракция Фраунгофера 281 Какой вид имеет фраунгоферова дифракционная картина при наклонном падении плоской волны на щель? Как изменится распределение интенсивности в дифракционной картине Фраунгофера от отверстия, если отверстие сместить в поперечном направлении? Чем отличаются дифракционные картины от большого числа одинаковых препятствий при хаотическом и упорядоченном расположениях? Задачи 1. Найдите угловое распределение интенсивности 1@) при дифракции Фраунгофера на щели шириной а в случае наклонного падения параллельного пучка света на плоскость щели (под углом 0' к нормали). Ответ. 1@) = /0($тм/мJ, где и — (ла/Х)($тО — 8т0'), а /0 — интенсивность при в = в\ т.е. в направлении падающей волны. Для малых углов дифракции, когда АО = в — 0' < 1, 8Ш0 — $тв' « со8 0'Д0 и и « (па соъв' /Х)Ав. Распределение интенсивности 1(А0) при на- наклонном падении на щель определяется проекцией а со$ & ширины щели на плоскость, перпендикулярную направлению падающей волны. 2. Оптическая система создает действительное изображение источника света размером п, находящегося на расстоянии Ь от нее. До какой величины ат^п можно уменьшить диаметр диафрагмы, чтобы размер изображения определялся размером источника, а не дифракцией? Ответ. а^ ХЕй 3. Описание картины полос в интерферометре Рэлея (см п. 5.6) приведено в предположе- предположении, что щели 5] и 52 бесконечно узкие. В действительности щели должны пропускать достаточно света и потому имеют конечную ширину а. Какой вид имеют при этом наблюдаемые через окуляр интерференционные поло- полосы? Другими словами, тре- требуется найти распределе- распределение интенсивности 1(х) Л плоскости -2ХР1а -ХР1а О ХПа 2ХР1а в фокальной объектива. Решение. В каждую точ- точку х фокальной плоскос- плоскости объектива Ь2 приходят две когерентные волны от_,___ , _ р. г „ р Рис. 6.25. Распределение интенсивности при дифракции Фраун- ооеих щелей, газность их гофера от двух одинаковых щелей. Центральная область сильно хода А(х)^0(х)с1^хс1/Р'2у переэкспонирована для выделения слабых боковых полос где д, — расстояние между серединами щелей, Р2 — фокусное расстояние объектива. Предполагается, что лгтах <С Р2> т. е. углы дифракции ма- малы: 0(х) « х/Р2 <С 1. Интенсивности 1Х (х) и 12(х) обеих волн в каждой точке х одинаковы, поэтому в соответствии с E.8) = 21х(х)[\ + со8*Д(*)] =
282 6. Дифракция света Распределение интенсивности /] (х) для одной волны определяется дифракцией на щели и дается формулой F.20): /,(*) = 1о(зти/иJ9 где и = кав(х)/2 = [ка/BР2)]х. Таким об- образом, $т2\ка/BР2)х) Цх) = 2/0 г 1 М 'V [B)]2 соз(^ F.29) — интерференционные полосы шириной ХР2/с1 промодулированы кривой дифракции на отдельной щели (рис. 6.25). Полная ширина главного максимума огибающей равна ХР2/а. В его пределах расположено N = 2с1/а интерференционных полос. 4. Исследуйте влияние ширины первичного источника 5 на интерференционную картину в ин- интерферометре Рэлея. Решение. Если ширина О щели 5, находящейся в фокальной плоскости коллиматорной линзы Ьх (см. рис. 5.23), достаточно мала, то освещение обеих щелей 5! и 52 в диафрагме будет полностью когерентным и полосы в фокальной плоскости объектива Ь2 описываются полученным в предыдущей задаче распределением интенсивности F.29), график которого приведен на рис. 6.25. Для этого размер области когерентности Я/^/О (/^ — фокусное рас- расстояние коллиматора Ьх) должен быть много больше расстояния А между щелями 5! и 52, откуда с1 <С Я/^/О. При увеличении В освещение щелей становится частично когерентным. Распределение интенсивности в интерференционных полосах описывается в этом случае выражением E.55), где степень пространственной когерентности у\2 колебаний в щелях ^ и 52 дается формулой E.56) с в = О/Р\. Если ширина а щелей 5] и 82 мала по сравнению с расстоянием д. между ними, то освещение каждой из щелей можно считать полностью ко- когерентным и принять для распределения интенсивности 1\(х) одной из интерферирующих волн, как и в предыдущей задаче, выражение F.20): 1\(х) = /0(япи/иJ с и = [ка/BГ2)]х а) -2ХЯа -ХР1а 2ХР1а б) -2ХР1а ХР1а 2ХР/а Рис. 6.26. Интерференционные полосы от двух щелей при освещении протяженным источником
6.4. Гауссовы пучки. Оптические резонаторы 283 (для этого размер области когерентности А/^/О должен быть больше ширины а щелей 5] и 52, т.е. В < А/^/а). Таким образом, „, *ш2[ка/(Щ)х] [ка/BГ2)х]2 = 2/0 С08 — График 1(х) для сравнительно узкого источника приведен на рис. 6.26, а. С увеличе- увеличением В (т.е. ширины источника 5) видность интерференционных полос уменьшается, и при В = А/7! /*/ они исчезают. При дальнейшем увеличении В полосы появляются вновь, однако их видность невелика, а в центре (при х = 0) расположен относительный минимум этой малоконтрастной интерференционной картины (рис. 6.26,6). При В — 2ХРх/с1 полосы снова исчезают и т.д. Когда ширина В источника 5 настолько велика, что размер области когерентности ХРХ/В становится меньше ширины а отдельной щели (В > ЛРх/а), в фо- фокальной плоскости объектива будет наблюдаться изображение источника 5, из-за дифрак- дифракции несколько размытое по краям. 6.4. Гауссовы пучки. Оптические резонаторы О п. 6.3 были рассмотрены световые пучки, возникающие при прохождении коге- когерентной плоской волны через отверстие в непрозрачном экране. В приближении Френеля—Кирхгофа амплитуда напряженности поля в плоскости экрана имеет в этом случае одно и то же значение на протяжении всего отверстия и равна нулю за его пределами. Другими словами, пучок имеет в плоскости экрана резко ограниченное краями отверстия поперечное сечение. По мере распространения из-за дифракции пучок расширяется и его границы расплываются. Но во многих практически важных случаях амплитуда напряженности поля плавно изменяется по поперечному сечению пучка. Такой пучок можно получить, например, в результате прохождения плоской волны через пластинку с изменяющимся от точки к точке коэффициентом пропускания. Особенно важен случай гауссовых пучков, для которых амплитуда напряженности поля максимальна на оси пучка и экспоненциаль- экспоненциально уменьшается к краям в соответствии с гладкой функцией Гаусса. Если выбрать ось I по направлению пучка, то в плоскости волнового фронта напряженность такого поля описывается выражением Е(х,у) = Ео ехр(-^^. F.30) Здесь, как и прежде, опущен множитель ехр(—%ш)9 выражающий зависимость на- напряженности поля от времени. Величина ш0 определяет расстояние от оси пучка, на котором напряженность поля уменьшается в е « 2,72 раза, а интенсивность — ве2» 7,4 раза по сравнению с максимальным значением. Несколько условно ш0 можно принять за меру ширины распределения интенсивности (радиальная ширина, или радиус пучка) в плоскости г — 0. В пределах этой ширины переносится 86 % всей энергии. Пучки когерентного излучения с гауссовым профилем распределения интенсивно- интенсивности обладают самой высокой направленностью, совместимой с волновой природой излучения. Гауссов пучок представляет собой наиболее близкое приближение, кото- которое допускает дифракция, к параллельному пучку света с ограниченным поперечным
284 6. Дифракция света сечением. Описываемое выражением F.30) поперечное распределение интенсивно- интенсивности характерно для света, излучаемого газовыми лазерами. При распространении в свободном пространстве (или однородной прозрачной сре- среде) гауссов пучок постепенно расширяется из-за дифракции. Представление о его структуре можно получить на основе принципа Гюйгенса—Френеля. Пусть при г = 0 волновая поверхность плоская и напряженность поля в разных ее точках дается фор- формулой F.30). Поле в некоторой точке Р с координатами х,у,г (рис. 6.27,а) опре- определяется суперпозицией вторичных волн от элементарных участков этой плоскости а) б) г° и Гиперболический \*гхьгт*\.тт\ п\/спла Ближняя (*',/) .—-—- 0 зона о — и 1 Перетяжка пучка _1 3 Дальняя зона Поверхности постоянной ^^ 1 ^> Р(Х, у, 2) 1 г • У (по уровню 1/е2) Энергетический профиль пучка Рис. 6.27. Гауссов пучок: а — к расчету напряженности поля в точке Р; б — гиперболические границы пучка и волновые поверхности (см. F.3)). Из-за быстрого убывания Е{х',у') при удалении от оси г заметный вклад в интеграл фактически дает только часть плоскости г=0в пределах круга ради- радиусом XV 0. При малой расходимости пучка можно считать, что точка наблюдения Р удалена от лежащего в этих пределах элемента A5 вдоль оси пучка на расстояние г, большое по сравнению с шириной пучка (параксиальное приближение). Тогда К в по- показателе экспоненты (см. F.3)) можно приближенно записать в виде а множитель \/Я заменить на 1/г и вынести из-под знака интеграла. По той же при- причине коэффициент наклона К (а) можно заменить его значением к/Bл1) (см. F.12)) при а = 0. Таким образом, для Е(х, у, г) из F.3) получаем Ът // ехр - х'2+у'2 Не 2г дх'йу'. F.31)
6.4. Гауссовы пучки. Оптические резонаторы 285 Двойной интеграл здесь распадается на произведение интегралов по х' и у', каждый из которых приводится к интегралу Пуассона: оо ( В результате из F.31) после громоздких, но простых преобразований находим Е(х, у, г) = #о ~ ехР ( 2— ) ехР гМ г "* тЪ— ) "*" *Ф » F.32) где „Г / ?г \21 Г /кт2\2Л киI -- -^. F.33) Структура такого пучка показана схематически на рис. 6.27, б. Из формулы F.32) следует, что волна с плоским фронтом и гауссовым распределением F.30) при г = 0 имеет при г ф 0 также гауссово распределение амплитуд ехр[— (х2 -\-у2)/и>2] с ши- шириной ю(г)9 постепенно возрастающей с расстоянием вдоль оси распространения пучка согласно формуле F.33). Зависимость ширины пучка от продольной координаты г характеризуется гипер- гиперболами ю2 г2 л кю1 лхюк Щ Ч 2 X Эти гиперболы дают представление о форме продольного сечения пучка, т. е. сечения плоскостью, проходящей через ось пучка. При г — 0 радиальная ширина имеет наи- наименьшее значение ю = ш0 {перетяжка, или шейка пучка). Расстояние го = яю^/Л от перетяжки называется радиусом дифракционной расходимости гауссова пучка. В области шейки, или в ближней зоне, пока |г| <С го> площадь сечения пучка практи- практически постоянна. При г = ±г0 она удваивается, а на больших расстояниях |г| > г0 (дальняя зона, или область дифракции Фраунгофера) ширина пучка возрастает ли- линейно с увеличением г: ш(г) &2г/(кю0) =Аг/(яи;0). Это показано пунктирными линиями (асимптоты гипербол) на рис. 6.27, б. Соответствующий угол дифракцион- дифракционной расходимости в = Х/(лю0) несколько меньше, чем при прохождении плоской волны через круглое отверстие (см. F.28)). Важное отличие от дифракции на от- отверстиях, выделяющих участок волновой поверхности с примерно равными ампли- амплитудами, заключается в том, что интенсивность дифракционной картины в гауссовом пучке монотонно и быстро уменьшается с ростом угла дифракции без характерных осцилляции (т.е. чередующихся темных и светлых колец). Это качество очень по- полезно в оптических приборах, и иногда для подавления дифракционной структуры вместо диафрагм с резкими краями вводят искусственно постепенное ослабление пучка от оси к периферии. Такой прием называется аподизацией. Поверхности постоянной фазы электромагнитной волны F.32) описываются урав- уравнением г + (х2 +у2)/{2К) = соп81. При х2 +у2 <^С К2 это уравнение сферы радиу- радиусом К с центром на оси г, т.е. волну приближенно можно рассматривать как сфе- сферическую. Однако в отличие от обычной сферической волны радиус К (г) сферы
286 6. Дифракция света Рис. 6.28. Открытый оптический резонатор и положение ее центра зависят от г, т.е. от выбранного сечения пучка (рис. 6.27,6). Если I ^> г0 = кю%/2, то из F.33) К « г и центр сферы находится при г — 0. В ближней зоне К « (кю^J/Dг) и в перетяжке пучка при г =0 волновая по- поверхность становится плоской. Наибольшую кривизну волновая поверхность имеет при г — го> т.е. на границе между ближней и дальней зонами: здесь К = 2г0 и центр кривизны расположен при г — -го- Выше исследовалось распространение гауссова пучка в свободном пространстве или в однородной среде. Рассмотрим теперь структуру электромагнитного поля в оптическом резонаторе, образованном двумя сферическими зеркалами, обра- обращенными друг к другу своими отражающими поверхностями (рис. 6.28). Резонатор, подобно маятнику в часах Я2 " или колебательному кон- контуру в генераторе неза- незатухающих колебаний, сос- составляет важную часть автоколебательной опти- оптической системы — опти- оптического квантового гене- генератора (ОКГ), или лазера. Стационарные состояния поля, как и в случае резонатора с плоскими параллельными зеркалами, представляют собой стоячие электромагнитные волны, т.е. нормальные колебания напряженности поля (моды) с определенными дискретными частотами (см. п. 1.3). Частоты мод определяются из условия цикличности: при двойном про- прохождении резонатора (туда и обратно) фаза волны изменяется на величину, крат- кратную 2л; другими словами, на двойной длине резонатора укладывается целое число ц длин волн: 2Ь = цХ(р откуда а)д = цпс/Ь. Условие цикличности требует, чтобы соответствующий рассматриваемой моде световой пучок полностью воспроизводил самого себя на протяжении одного цик- цикла, т.е. при двойном прохождении резонатора. В случае сферических зеркал этому условию удовлетворяет гауссов пучок с определенными параметрами, зависящими от геометрии резонатора. В самом деле, пусть в некоторых сечениях ^ и г2 (см. рис. 6.28) имеются сферические зеркала, отражающие поверхности которых совпада- совпадают с волновыми поверхностями гауссова пучка. Тогда исходный гауссов пучок после отражения будет преобразован в такой же пучок, распространяющийся в противопо- противоположном направлении, а после отражения от второго зеркала он полностью совпадает с исходным. При этом мы предполагаем, что диаметр 2ш(г) пучка в месте располо- расположения зеркал много меньше их диаметров. Практически достаточно, чтобы диаметр й зеркала в несколько раз превосходил диаметр пучка: интенсивность настолько быстро уменьшается при х2 Л-у2 > ю2, что, когда диаметр зеркала втрое больше диаметра пучка, мимо зеркала проходит лишь 0,01 % полного светового потока. Эта величи- величина характеризует дифракционные потери резонатора. Потери иного происхождения (например, из-за пропускания и поглощения света зеркалами), как правило, значи- значительно выше. Обычно одно из зеркал делается частично прозрачным, что позволяет выводить наружу и использовать часть накопленной в резонаторе энергии пучка. Все виды потерь приводят к затуханию собственных колебаний напряженности поля
6.4. Гауссовы пучки. Оптические резонаторы 287 в таком открытом резонаторе, что эквивалентно уменьшению добротности и уши- рению резонансных линий, соответствующих его отдельным модам. В условиях ге- генерации лазера потери компенсируются за счет усиления света при вынужденном излучении (см. п. 9.3) в активной среде, помещенной между зеркалами резонатора. Найдем связь параметров гауссова пучка с геометрией оптического резонатора. Бу- Будем сначала для простоты рассматривать только симметричные резонаторы, у кото- которых оба зеркала имеют одинаковые радиусы кривизны /?1 = К2 = #. В этом случае перетяжка пучка (г = 0) находится посередине между зеркалами, т. е. зеркала распо- расположены при I = ±Ь/2, где Ь — длина резонатора. Подставляя г = Ь/2 во вторую из формул F.33), находим связь между радиусом кривизны К зеркал, длиной Ь резона- резонатора и радиусом 16>О сечения пучка в перетяжке: Правая часть F.34) должна быть положительна, поэтому гауссов пучок в симмет- симметричном резонаторе может сформироваться лишь при выполнении условия К > Ь/2. Предельное значение К = Ь/2 соответствует случаю, когда сферические поверхности зеркал имеют общий центр кривизны {концентрический резонатор). При К —> Ь/2 радиус перетяжки ю0 —> 0, а радиус сечения пучка на зеркалах ю(Ь/2)9 как видно из первой формулы F.33), неограниченно возрастает, т.е. при зеркалах конечных раз- размеров значительная часть светового потока проходит мимо зеркал. Поэтому в таких условиях воспроизводящий самого себя после каждого цикла световой пучок образо- образоваться не может. Это тем более невозможно при К < Ь/2 (неустойчивый резонатор). Для зеркал определенной кривизны К наибольший радиус перетяжки ш0 полу- получается, как видно из F.34), при Ь = К9 т.е. когда центр кривизны каждого зер- зеркала находится на противоположном зеркале. В этом случае фокусы зеркал сов- совпадают и резонатор называется софокусным или конфокальным. Для гауссова пучка в конфокальном резонаторе границы между дальней и ближней зонами г0 = ±кю$/2 совпадают с положениями зеркал г — ±Ь/2 (это следует из F.34) при К = Ь). Радиус перетяжки ш0 равен при этом х/Ь/к = у/ЛЬ/Bл), а радиус пучка на зеркалах ю = \/2ш0 = л/ХП/л. У гелий-неонового лазера, генерирующе- генерирующего на длине волны Я = 0,63 мкм, при длине симметричного конфокального ре- резонатора Ь = 1 м радиус пучка на зеркалах составляет 0,45 мм, т. е. зеркала мо- могут иметь диаметр всего несколько миллиметров. С увеличением фокусного рас- расстояния зеркал (при заданной длине резонатора) диаметр пучка возрастает. При этом возрастают и дифракционные потери, однако из-за малой длины волны да- даже очень длиннофокусные зеркала оказываются вполне приемлемыми. Так, на- например, из F.34) находим, что при прежних значениях Я = 0,63мкм и Ь= 1м пучок в перетяжке будет иметь радиус ю0 = 1 мм, если взять зеркала с ра- радиусом кривизны К = 50,2 м. Радиус дифракционной расходимости г=лю$/Л при и>0 = 1 мм составляет 5,0 м, поэтому весь резонатор длиной Ь = 1 м находит- находится в пределах ближней зоны и пучок в резонаторе имеет практически постоянное сечение: ю « и>0 = 1 мм. Зеркала оптического резонатора могут иметь и разную кривизну. В самом де- деле, любую из сферических поверхностей равных фаз гауссова пучка (см. рис. 6.28)
288 6. Дифракция света можно заменить зеркалом того же радиуса кривизны, и это не приведет к измене- изменению структуры поля в резонаторе. В частности, одно из зеркал может быть плос- плоским (рис. 6.29, а). В этом случае перетяжка гауссова пучка расположена непосред- непосредственно в плоскости зеркала, и а) П*-*—--*__ если оно полУпРозРачное> то ла~ " зерный пучок на выходе из резо- резонатора имеет плоский волновой фронт. Если выходное зеркало сделать выпуклым (рис. 6.29, б), то перетяжка пучка расположит- расположится вне резонатора, т.е. выходя- выходящий из лазера пучок будет схо- сходящимся. Выше предполагалось, что находящаяся в резонаторе ак- активная среда (стеклянный или кристаллический стержень, газоразрядная трубка и т.п.) не оказывает влияния на форму волновых поверхностей. Эта идеализация допустима для многих газовых ла- лазеров низкой мощности, для некоторых лазеров на неодимовом стекле и красителях. I аким образом, параметры выходящего через частично прозрачное зеркало лазер- лазерного пучка — радиус кривизны волновой поверхности и ширина — полностью опре- определяются геометрией резонатора. Если пренебречь небольшим преломлением в ма- материале подложки,*) то кривизна волновой поверхности на выходе совпадает с кри- кривизной зеркала. При использовании лазерного излучения нередко возникает необ- Рис. 6.29. Оптические резонаторы с плоским (а) и выпуклым (б) выходными зеркалами а) Рис. 6.30. Преобразование гауссова пучка при прохождении через линзу *) Лазерные зеркала обычно представляют собой многослойную диэлектрическую структуру (см. п. 5.7) с высоким коэффициентом отражения для длины волны генерируемого излучения, нанесенную на подлож- подложку из стекла или плавленого кварца. Подложка зеркала не влияет на форму волнового фронта выходящего пучка, если обе ее поверхности имеют одинаковую кривизну. Если прозрачная поверхность плоская, то подложка действует как слабая рассеивающая линза.
6.4. Гауссовы пучки. Оптические резонаторы 289 ходимость преобразовать параметры пучка в зависимости от характера решаемой задачи. Рассмотрим преобразование гауссова пучка при прохождении через тонкую линзу. Пусть центр линзы лежит на оси пучка (рис. 6.30, а). Оптический путь луча, пересекающего линзу на расстоянии \/х2 +у2 от оси, меньше, чем у распространя- распространяющегося вдоль оси луча, на (х2 -\-у2)/BР), где Р — фокусное расстояние линзы. Поэтому при прохождении пучка через расположенную в точке г линзу величина г + (х2 +у2)/BК), входящая в выражение для фазы волны в формуле F.32), заме- заменится на другую величину: г + кх^+у*/1 а распределение амплитуды ехр[—(х2 + у2)/и)(г)] не изменится. Это значит, что после прохождения через линзу пучок остается гауссовым, но радиус кривизны его волновой поверхности становится другим: К1 К Р' Если Р < Я, то К' < 0, т. е. знак кривизны изменяется: расходящийся (/? > 0) гауссов пучок после прохождения через линзу будет сходящимся (рис. 6.30, а). Зная положе- положение г линзы и ее фокусное расстояние Р9 можно определить положение г1 и ради- радиус ю'о перетяжки преобразованного пучка. г ассмотрим несколько простых случаев преобразования пучков. Введем в исход- исходный пучок с радиусом перетяжки ю0 на расстоянии г0 = лю^/Х от нее, где радиус кривизны волнового фронта /? = 2г0, линзу с фокусным расстоянием Р = 2г0 (см. рис. 6.30,6). В соответствии с F.35) у выходящего из линзы пучка \/К! — 0, т.е. в плоскости линзы он имеет плоский волновой фронт. Это значит, что здесь распо- расположена перетяжка преобразованного пучка. Ее радиус ю'о равен, очевидно, радиусу исходного пучка при г = г0: ю'о — шA0) = \/2ю0. Радиус дифракционной расходи- расходимости ^о = лш'^/Х у нового пучка равен 2г0, т.е. в два раза больше, а угол рас- расходимости в дальней зоне в' — Х/(лю'о) = в/у/2 в \/2 раз меньше, чем у исходного пучка. Дифракционные потери энергии при преобразовании пучка будут тем меньше, чем больше диаметр линзы по сравнению с диаметром пучка. Если ввести в пучок тонкую линзу с фокусным расстоянием Р, равным поло- половине радиуса кривизны волновой поверхности в этом месте пучка (Р = Я/2), то после прохождения через линзу получим, как видно из F.35), пучок с К' = -К, в котором полностью воспроизводится геометрия исходного пучка. Можно, напри- например, выбрать Р равным радиусу дифракционной расходимости г0 = лю^/Х исходного пучка и поместить линзу на расстоянии г0 от перетяжки, так как /?(г0) = 2г0- Для гелий-неонового лазера (Я = 0,63 мкм) при радиусе перетяжки г/^0 = 1 мм, г0 = 5 м, т.е. требуется линза с Р — 5м (оптическая сила 0,2дптр). Последовательность та- таких линз, установленных на расстояниях 2г0 = 10 м, образует линзовый волновод (см. рис. 6.30, в). По этому волноводу пучок когерентного лазерного излучения мо- может распространяться на большое расстояние, не испытывая даже дифракционного расширения. 10 Зак 4498
290 6. Дифракция света В некоторых случаях требуется сконцентрировать энергию лазерного пучка на возможно меньшей площади, т.е. преобразовать пучок так, чтобы получить пере- перетяжку минимального радиуса. Для этой цели выбирают короткофокусную линзу и помещают ее, как это ни парадоксально, далеко от лазера, на расстоянии, боль- большом по сравнению с радиусом дифракционной расходимости лазерного пучка, так, чтобы пятно лазерного излучения заполняло возможно большую часть поверхности линзы (см. рис. 6.30, г). Радиус перетяжки преобразованного пучка получается при этом приблизительно равным 2ХР/(лс1), где й — диаметр линзы. Если й ~ Р, то вся энергия пучка концентрируется на площадке, линейный размер которой порядка длины волны Я. Заметим, что иллюстрируемая этими примерами возможность концентрации све- световой энергии в пространстве и концентрации по направлениям распространения связана с высокой пространственной когерентностью лазерного излучения. Контрольные вопросы • Чем гауссов пучок отличается от пучка света, получающегося при прохождении плоской волны сквозь круглое отверстие? Что понимают под шириной гауссова пучка? Какую фор- форму имеют его границы? • Как зависит кривизна волновых поверхностей гауссова пучка от расстояния до его пере- перетяжки? Где эта кривизна максимальна? • В чем заключается аподизация световых пучков? С какой целью она применяется? • Какими должны быть радиусы кривизны сферических зеркал открытого резонатора опреде- определенной длины, чтобы его дифракционные потери были минимальны? • Как изменится радиус кривизны волнового фронта гауссова пучка при прохождении через линзу с фокусным расстоянием Р"> • Где следует расположить линзу, чтобы сфокусировать лазерный пучок на возможно мень- меньшей площади? 6.5. Дифракционные решетки Важное практическое применение в спектроскопии имеет явление дифракции Фра- унгофера на системе из большого числа одинаковых параллельных щелей, находя- находящихся на равных расстояниях друг от друга. Так устроена простейшая дифракци- дифракционная решетка, впервые изготовленная в 1786 г. астрономом Риттенгаузом в виде натянутых на рамку параллельных тонких проволок. Начиная с Фраунгофера, вы- выполнившего в 1821 г. первые исследования с помощью дифракционного спектроско- спектроскопа, решетки изготовляют нанесением штрихов на поверхность стеклянной или зер- зеркальной металлической пластинки. Дифракционной решеткой можно считать любое устройство, обеспечивающее пространственную периодическую модуляцию падаю- падающей световой волны по амплитуде или фазе. Рассмотрим распределение интенсивности света в фраунгоферовой дифракцион- дифракционной картине, наблюдаемой на бесконечности либо в фокальной плоскости линзы при падении на решетку плоской монохроматической волны. В каждой точке на- наблюдения происходит многолучевая интерференция когерентных пучков света оди-
6.5. Дифракционные решетки 291 0' наковой интенсивности, дифрагировавших на отдельных одинаковых структурных элементах решетки, например на щелях (рис. 6.31). В направлении вдоль щелей (или штрихов) размер волновой поверхнос- поверхности ограничен лишь размерами линзы, по- поэтому можно считать, что волны дифраги- дифрагируют только в перпендикулярных штрихам направлениях. Обозначим Ех @) напряжен- напряженность поля в точке наблюдения Р в пучке света от первого структурного элемента ре- решетки. В случае решетки из щелей зависи- зависимость Ех от угла дифракции 0 выражается формулой F.18). Напряженность Е2 в точ- точке Р от второго элемента решетки отли- чается от Е{ только множителем ехр(^), Рис. 6.31. Дифракция Фраунгофера на системе одинаковыхпарадлельнш-щелей выражающим запаздывание этой волны по фазе. Напряженность от третьего элемента имеет вид Е^ = Ех ехрB/<$) и т.д. Полная напряженность в Р от всех N периодиче- периодических элементов решетки представляется суммой геометрической прогрессии: ЕР = = Ех(в) F.36) Умножая правую часть на комплексно-сопряженное выражение, для интенсивности в точке Р получаем: F.37) $Ш2(8/2) Здесь 1{(в) — интенсивность в Р от одной щели. В результате интерференции всех N когерентных вторичных волн происходит перераспределение светового потока по направлениям и получается существенно отличающееся от /|@) распределение ин- интенсивности в фраунгоферовой дифракционной картине. В тех направлениях 0Ш, для которых 8/2 = тп (т = 0, ±1, ±2,...) и второй сомножитель в F.37) принимает значение #2, интенсивность в #2 раз больше, чем от одной щели в том же на- направлении. Так происходит потому, что разность хода А вторичных волн от сосед- соседних щелей для этих направлений вт равна целому числу т длин волн (в = тк) и все они приходят в точку наблюдения в одинаковой фазе. Первый сомножи- сомножитель 1^@) в F.37), описывающий дифракцию от отдельной щели, сравнительно плав- плавно зависит от 0, поэтому можно считать, что в направлении вт будет наблюдать- наблюдаться максимум интенсивности, если только 1^@т) ф 0 (если данное направление не совпадает с минимумом распределения интенсивности от одной щели). Такие макси- максимумы называются главными, а целое число т — порядком главного максимума или порядком спектра. Выражение F.37) для интенсивности дифрагировавшего света обращается в нуль каждый раз, когда 8ш(М$/2) = 0, но §т(8/2) ф 0. В соответствующих таким значе- значениям 8 направлениях лежат минимумы, интенсивность света в которых равна нулю. Между ними находятся побочные (или дополнительные) максимумы. Между двумя
292 6. Дифракция света N=2 N=10 2ж(т-1) 2пт соседними главными максимума- максимумами расположены N — 1 миниму- минимумов и N — 2 побочных макси- максимумов. Графики второго сомножителя в формуле F.37), т.е. функции 8т^(М$/2)/8т2(Я/2), приведены на рис. 6.32 для нескольких зна- значений N. При N — 2 интенсив- интенсивность изменяется по косинусои- дальному закону в соответствии с рассмотренным в п. 5.1 случаем интерференции двух волн. Для «решетки» из двух щелей шири- ширина темных промежутков между максимумами равна ширине са- самих максимумов (светлых полос). С увеличением числа штрихов главные максимумы сужаются. При большом числе интерфери- интерферирующих пучков (в современных дифракционных решетках N до- достигает 200 тыс.) получаются Рис. 6.32. Распределение интенсивности при двухлуче- очень Узкие и Резкие главные вой и многолучевой интерференции одинаковых пучков максимумы с широкими темными (график функции 81п2(М/2)/81п*(Я/2) при N. равном 2,5 и 10) промежутками между ними. Ширина е главного максимума на половине высоты, т.е. на уровне Л/г2/2, опре- определяется из условия $т2^е/4)/(е/4J = N^/2. Обозначив х = N8/4, получим для нахождения х трансцендентное уравнение х = >/2зт;с. Его корень х = 1,39, отку- откуда с = 4x/N = 5,56/N. Разность фаз 8 между соседними интерферирующими пуч- пучками, приходящими в некоторую точку наблюдения Р, зависит от направления в и от постоянной решетки с1, т. е. от пространственного периода решетки. В случае простой щелевой решетки (рис. 6.33) пространственный период й равен суммарной ширине прозрачного и непрозрачного участков. При нормальном падении монохро- монохроматической волны на плоскость решетки (рис. 6.33, а) разность хода соседних пучков Рис. 6.33. К вычислению разности хода волн от соседних штрихов решетки
6.5. Дифракционные решетки 293 А = й 8т 0, откуда 5 = *Д = 2лА/А = Bя<//Л) вш 0, F.38) а направление вт на главный максимум т-го порядка определяется условием </8Ш0т=тА (т = 0, ±1,±2,...). F.39) При наклонном падении плоской волны под углом в' (рис 6.33, б) разность хода соседних пучков А = г/(8Ш0 — 8Ш0') и положение главных максимумов определяется условием - 8ш в') = /иА. F.40) Эта же формула справедлива и для отражательной решетки, если углы паде- падения в' и дифракции 0 отсчитывать в противоположных направлениях от нормали (рис. 6.33, в). Структура отдельного периодического элемента (штриха) решетки (например, от- отношение ширины прозрачного и непрозрачного участков в случае щелевой решетки) сказывается лишь на виде функции 1х{0) в F.37), которая меняется при измене- изменении угла 0 значительно медленнее, чем второй (интерференционный) сомножитель. Поэтому при большом числе штрихов огибающая функция 1^{в) модулирует мно- многолучевую интерференционную картину и определяет относительную интенсивность главных максимумов разных порядков, но практически не влияет на положение и ши- ширину главных максимумов. Их положение вт в соответствии с F.39)—F.40) зависит от периода решетки с1, а ширина е — еще и от полного числа штрихов N. Резкость Р многолучевой интерференционной картины в монохроматическом свете (т.е. отно- отношение расстояния между главными максимумами соседних порядков к их ширине) определяется полным числом штрихов: Р = 2л/е — (яУ2,78)# = 1,13 N. Направления вт на главные максимумы зависят от длины волны (за исключени- исключением случая т = 0). Поэтому решетка разлагает падающий немонохроматический свет в спектры нескольких порядков и может использоваться в качестве диспергирую- диспергирующего элемента в спектральных приборах. В спектрах каждого порядка наибольшее отклонение испытывают красные лучи, наименьшее — фиолетовые, в отличие от спектра, возникающего при преломлении в призме, где порядок расположения цве- цветов обратный, так как в стекле фиолетовые лучи преломляются сильнее красных. Максимальный порядок спектра при нормальном падении ограничивается условием 18Ш0| ^ 1, поэтому ттах ^ *//А. Чтобы решетка давала спектр хотя бы первого по- порядка, ее период должен быть больше длины световой волны: й > X (или й > А/2 в случае скользящего падения). Угловая дисперсия решетки Ид — A0/ЛЯ, характеризующая изменение положения главных максимумов при изменении длины волны, может быть найдена дифференци- дифференцированием обеих частей формулы F.40) по А при фиксированном в'\ 60 т _ 81П 0 — 8111 в' НА = </СО80 = АСО8 0 ' ^' ' При нормальном падении (т. е. при в' = 0) для угловой дисперсии получаем с10/с1А = A§0)/А. Таким образом, угловая дисперсия при данном значении 0 не
294 6. Дифракция света зависит от периода и других параметров решетки. Она растет с увеличением угла дифракции в. Для спектра определенного порядка т дисперсия тем больше, чем меньше период решетки й. Формула F.40) позволяет также определить свободную область дисперсии ре- решетки, т. е. максимальную ширину ДА спектрального интервала исследуемого излу- излучения, при которой спектры соседних порядков еще не перекрываются. Длинновол- Длинноволновый конец спектра т-го порядка совпадает с коротковолновым концом спектра (т 4- 1)-го порядка при выполнении условия т(\ 4- ДА) = (/я + 1)А, откуда ДА=-, F.42) т т.е. свободная область дисперсии решетки обратно пропорциональна порядку спек- спектра. При использовании спектров низких порядков (обычно второго или третье- третьего) решетка пригодна для исследования излучения, занимающего широкий спек- спектральный интервал. В этом состоит главное преимущество дифракционных реше- решеток перед интерференционными спектральными приборами (например, интерферо- интерферометром Фабри-Перо, см. п. 5.7), у которых из-за высоких порядков т свободные области дисперсии оказываются очень узкими. Для получения большой диспер- дисперсии в спектрах низких порядков требуется уменьшать период решетки й. Поэто- Поэтому современные решетки для видимой области спектра имеют до 2400 штрихов на 1 мм. При очень малом периоде решетки (порядка длины волны) перестают выполняться усло- условия применимости приближенного метода Френеля, с помощью которого получена основная формула F.37). В этом случае для нахождения распределения интенсивности 1{(в) от одной щели решетки требуется более тонкое исследование. Оказывается, что даже при щелях с шириной а ^ А приближение Френеля, в котором поле в пределах щели предполагается таким же, как и при отсутствии решетки, приводит к удо- удовлетворительным результатам. Второй сомножитель в F.37), обусловленный интерференцией вторичных волн от всех щелей, остается без изменения и при сколь угодно узких щелях. Поэтому сохраняют силу как формулы F.39)—F.40), определяющие положение главных мак- максимумов, так и все рассмотренные выше следствия из них. Структура отдельного периодического элемента решетки, т.е. форма ее штрихов, как уже отмечалось, не влияет на положение главных максимумов и, следовательно, дисперсию решетки. Не влияет она и на резкость интерференционной картины, так как резкость определяется только полным числом штрихов. От формы штрихов зави- зависит лишь плавная функция ^(в), модулирующая многолучевую интерференционную картину. Вид этой функции определяет распределение энергии дифрагировавшего света между главными максимумами разных порядков. Для простой решетки с ще- щелями шириной а функция 1^F) дается формулой F.20) см = (ла/Л)($тв — втв'). Ее график приведен на рис. 6.18. Значение и для направления на главный максимум порядка т в соответствии с F.40) равно ит = (ла/A) т. Так как интерференционный сомножитель в F.37) для этого направления принимает значение Л/, интенсивность т-го главного максимума определяется выражением
6.5. Дифракционные решетки 295 "То! Помимо общей тенденции к уменьшению интенсивности с увеличением т форму- формула F.43) показывает зависимость 1т от отношения ширины а прозрачного участ- участка к периоду й\ при а/й — т' 1т, где целое число т! < т, 1т = 0. Например, при а — й)Ъ исчезает каждый третий главный максимум, при а = с1/4 — каж- каждый четвертый. Если а = й/2, все четные главные максимумы выпадают, так как они совпадают с минимумами огибающей функции ^(в), а интенсивность нечетных убывает с увеличением т: 1т ~ 1/т2, так как в числителе форму- формулы F.43) $т2(тл/2) = 1. Можно показать, что для обычной щелевой решет- решетки интегральная интенсивность дифрагировавшего света, приходящегося на все главные максимумы, кроме т = 0, будет наибольшей при а = с1/2 и составит 1/4 интенсивности падающего света. Только малая часть падающего света попа- попадает в какой-нибудь один порядок с т ф 0. При исследовании излучения сла- слабых источников и при работе в инфракрасной области спектра это серьезный недостаток. У современных решеток он устраняется тем, что штрихам придают определенный профиль (рис. 6.34, а). Это позволяет сконцентрировать большую часть энергии дифрагиро- дифрагировавшего света в одном , ^ или двух главных макси- максимумах, лежащих по одну сторону от центрального (см. задачу 1). При грави- гравировке таких решеток при- применяют алмазные резцы, острие которых имеет нужную форму. Прозрачная или отра- отражательная решетка с про- ^ис# *>«34. Дифракционные решетки с профилированным штрихом филированным штрихом практически не влияет на амплитуду световой волны, а вносит периодические из- изменения в ее фазу. По этой причине такие решетки называют фазовыми. В случае отражательной решетки со ступенчатым профилем (см. рис. 6.34, б) максимальная интенсивность дифрагировавшего света наблюдается в направлении зеркального от- отражения от плоскости штриха, т. е. под «углом блеска» в — в' Л- 2е, где е — угол наклона грани штриха к поверхности решетки (см. задачу 2). Когда ширина рабочей грани занимает практически целый период {а « й), такие блестящие, или концен- концентрирующие, решетки со ступенчатым профилем могут сконцентрировать почти весь дифрагировавший свет в спектр одного порядка. Распределение дифрагировавшего света по главным максимумам разных порядков и в случае амплитудной решетки может существенно отличаться от закономернос- закономерности F.43), справедливой для простой щелевой решетки. Если пропускание решетки приводит к синусоидальной модуляции в пространстве амплитуды падающей волны, то возникают главные максимумы только ст = 0ит = ±1 (см. задачу 3). Так полу- получается потому, что всем остальным главным максимумам интерференционного со- сомножителя в общей формуле F.37) соответствуют направления, для которых моду- модулирующая функция ^(в) при синусоидальном пропускании обращается в нуль. Этот результат становится особенно понятным, если вспомнить, что в фраунгоферовой
296 6. Дифракция света дифракционной картине распределение напряженности поля представляет собой пре- преобразование Фурье функции Е(х), описывающей пространственное распределение напряженности поля падающей волны сразу за решеткой: й/2 й/2 Е(кх)~ [ Е(х)*-'1кхХ<Ъс~ [ Л+асо8^)е-'***A*, F.44) -О/2 -О/2 где Р = М/ — размер решетки в перпендикулярном к штрихам направлении, кх = к зт в характеризует направление дифрагировавшей волны. Вычисляя интеграл в F.44), находим зш(*,Р/2) а *т[(кх-2л/с1)Р/2] а *т[(кх 1 х) ~ кО/2 2 (к 2л/а)й/2 2 кхО/2 2 (кх- 2л/а)й/2 2 (кх + 2я/</)Р/2 * При больших размерах решетки напряженность поля дифрагировавшей волны Е(кх) заметно отлична от нуля только вблизи тех направлений в, которым соответствует обращение в нуль одного из знаменателей. Отсюда получаем три главных макси- максимума: кх — 0 (т.е. в = 0) и кх = ±2л/с1 (т.е. Лвтв = ±Л). В предельном случае бесконечной (Р —> оо) решетки с синусоидальным пропусканием и периодом д, па- падающая плоская волна порождает помимо прошедшей прямо волны две плоские дифрагировавшие волны, соответствующие спектрам порядков т = ±1. Этому физи- физическому процессу можно сопоставить математическое разложение функции пропус- пропускания 1 + асо$Bлх/с1) в ряд Фурье, содержащий лишь три члена с пространствен- пространственными частотами кх =0, кх = ±2л/с1. В случае более сложной функции пропускания (например, ступенчатой периодической функции щелевой решетки) ее разложение в ряд Фурье содержит и гармоники, соответствующие пространственным частотам кх = тBл/с1) с т = ±2, ±3,... Пространственная гармоника функции пропускания с некоторым номером т приведет к возникновению максимума порядка т в дифрак- дифракционной картине, если длина волны А падающей волны меньше, чем период этой гармоники ё/т, т. е. ттах = А/\. Интенсивность максимума определяется квадратом соответствующего коэффициента Фурье. Хехника изготовления дифракционных решеток доведена до высокой степени совер- совершенства. Высококачественные отражательные решетки впервые были созданы в кон- конце XIX столетия Г. Роуландом в США. В России усилиями Ф. М. Герасимова с со- сотрудниками разработана оригинальная аппаратура и налажен массовый выпуск пре- превосходных дифракционных решеток. Современные автоматизированные делительные машины с интерференционными следящими устройствами позволяют изготовлять решетки с почти строго эквидистантным расположением штрихов. Размеры грави- гравированных решеток достигают 40 х 40 см. В зависимости от области спектра они имеют от 4 (для инфракрасной) до 3600 штрихов на 1 мм (для ультрафиолетовой области). Это, как правило, отражательные решетки с почти треугольным профилем штриха (см. рис. 6.34, б), концентрирующие до 80 % падающего на решетку света в спектр какого-либо одного ненулевого порядка. Вследствие высокой стоимости оригинальных гравированных решеток получили распространение реплики, т. е. от- отпечатки с гравированной матрицы на специальных пластмассах, покрытые тонким металлическим отражающим слоем. По качеству реплики почти не уступают ориги- оригиналам.
6.5. Дифракционные решетки 297 От некоторых недостатков нарезных решеток свободны голографические (см. п. 7.7) дифракционные решетки, которые получают путем создания в специаль- специальных светочувствительных материалах пространственно-периодического распределе- распределения интенсивности, возникающего при интерференции когерентного лазерного излу- излучения. Контрольные вопросы • От каких параметров, характеризующих решетку, зависит положение главных максимумов дифракционной картины? • Какова наибольшая интенсивность побочных максимумов? • Каким условием определяется наибольший порядок спектра ттах? • Какую максимальную длину волны можно наблюдать в спектре решетки с периодом сП • В чем преимущество спектров низких порядков при использовании решетки в качестве диспергирующего элемента? • При каком отношении ширины а щели к периоду решетки А в дифракционной картине от щелевой решетки будет отсутствовать спектр 3-го порядка? • Какими преимуществами обладают дифракционные решетки с профилированным штрихом? • Как связано распределение интенсивности дифрагировавшего света по спектрам разных порядков т с разложением функции пропускания амплитудной решетки в ряд Фурье? Задачи 1. Найдите распределение интенсивности 1@) при дифракции монохроматической плоской волны, падающей по нормали на фазовую решетку, профиль штрихов которой показан на рис 6.34, а. Решение. Для нахождения распределения интенсивности в фраунгоферовой дифракцион- дифракционной картине от одного штриха воспользуемся принципом Гюйгенса-Френеля. Поместим начало координат в середине штриха. Оптическая разность хода распространяющихся под углом в вторичных волн от элементов волновой поверхности в начале координат и в точ- точке х равна А = х [бшЯ 4- (п — 1)а], где п — показатель преломления материала решетки, а — угол наклона плоскости штриха (а <^С 1). Складывая вторичные волны от всех эле- элементов в пределах штриха, т.е. интегрируя по х от -а/2 до а/2, получим , /ЛЧ . 5111 М Ли г . Л , , ч 1 Учитывая интерференцию волн от N штрихов, находим полную интенсивность света, ди- дифрагировавшего под углом в: Главный максимум 1Х(в) расположен при и = 0, т.е. $тв = — (п — \)а. Это соответствует углу отклонения луча при преломлении в призме с малым преломляющим углом а. Если в этом направлении расположен один из главных максимумов интерференционного сомно- сомножителя, то значительная часть дифрагировавшего света сконцентрируется в спектре одного порядка с т Ф 0. Для точного совпадения должно выполняться условие й вш в = тХ, т. е. с1(п — \)а = —тХ. Например, концентрация света в спектр с т = —1 будет происходить при наклоне штрихов а = Я/ [а*(п — 1)]. Подставляя это значение а в выражение для и, получаем и— (ла/Х)($т6 + А/й7). Ширина штриха а практически совпадает с периодом
298 6. Дифракция света решетки й, поэтому и « л(аЧ\ъО/Х 4-1). Для направлений 0т, соответствующих главным максимумам интерференционного члена, с1$тОт = тХ и ит = л(т 4-1). При этих значени- значениях ит (за исключением т = — 1) интенсивность 1\@т) в дифракционной картине от одного штриха обращается в нуль, в том числе и для т = 0. Таким образом, такая фазовая решетка с наклоном штрихов а = Х/[с1(п — 1)] дает единственный спектр порядка т = —1. 2. Найдите распределение интенсивности дифрагировавшего монохроматического света для отражательной решетки с профилированным штрихом (см. рис. 6.34, б). Решение. Пусть падающая волна составляет угол 0' с нормалью к плоскости решет- решетки, дифрагировавшая — угол 0. Плоскость грани штриха наклонена на угол е, поэтому с нормалью к грани угол падения равен 0х = 0' + с, угол дифракции равен 02 = 0' - е. Направим ось х вдоль грани (см. рис. 6.34, в) и выберем начало отсчета в середине штриха. Разность хода А вторичных волн от середины и от элемента с координатой х составляет А = х($тО2 — 5Ш #!). Суммируя по принципу Гюйгенса—Френеля вторичные волны от всех элементов штриха (интегрируя от — а/2 до а/2), находим распределение интенсивности 1Х в дифракционной картине от одного штриха: 51П и ла и^ ' Я Центральному максимуму соответствует и = 0, т. е. 02 = 0^, — он расположен в направле- направлении зеркального отражения падающей волны от плоскости грани (угол блеска). Переходя к углам 0 и 0', это условие запишем в виде 0 = 0' + 2е. Если в этом направлении находится какой-либо главный максимум интерференционного сомножителя &т2(Ы8/2)/$т2(8/2)9 то практически весь дифрагировавший свет сконцентрируется в спектр одного порядка. Пока- Покажем это, ограничиваясь случаем малых углов 0, 0' и е. Направление 0т на максимум поряд- порядка т определяется из условия F.40): A@т —0')= тХ. Направление зеркального отражения 0 = 0' + 2е совпадает с 0т, если наклон граней с таков, что 2е — 0т — б' = тХ/й. Тогда и » (ла/Х)@2 -0х) = (ла/Х)@ - 0' - 2е) = (ла/Х)@ - О1 - тХ/й). Ширина а отдельно- отдельного штриха для решетки рассматриваемого профиля (см. рис. 6.34, б) практически совпадает с ее периодом Л. Поэтому и « л\А@ — 0')/Х — т]. Отсюда следует, что для направлений на главные максимумы интерференционного сомножителя, т.е. когда с1@ — 9') — т'Х, по- получается и « л(т' — т) и интенсивность 1Х обращается в нуль для всех т', кроме т' = т. Решетка, у которой 2е — тХ/й, дает только один главный максимум порядка т. 3. Найдите распределение интенсивности 1@) дифрагировавшего света при падении по нор- нормали плоской монохроматической волны на амплитудную решетку, пропускание которой изменяется по синусоидальному закону в направлении оси х, перпендикулярной ее штри- штрихам, так что амплитуда прошедшей волны сразу за решеткой зависит от х по закону Е(х) = Е0[\+асо&Bлх/а)]; а < 1. Решение. Напряженность поля Ех@) в фраунгоферовой дифракционной картине от од- одного периода в соответствии с принципом Гюйгенса—Френеля определяется интегралом л 12 -а/2 где 8 = кхй = кАятО — Bла'/Х) $\пО. В результате интерференции вторичных волн от всех /V периодов решетки получается следующее распределение интенсивности: , $т(Ы8/2) Г, = /0 ~тг [х ~ Положения главных максимумов интерференционного сомножителя 8 = 2лт, за исключе- исключением т = 0 и т = ±1, совпадают с минимумами распределения интенсивности 1Х @) в диф-
6.6. Спектральные приборы 299 ракционной картине от одного штриха решетки. Этому совпадению соответствует сокра- сокращение 5ш2(E/2) в числителе и знаменателе. Поэтому амплитудная дифракционная решетка с синусоидальным пропусканием дает центральный максимум при в = 0 (т = 0) и только два спектра порядка т = ±1 в направлениях, которые удовлетворяют условию 8 = ±2л, т. е. й 5Ш #! = ±Я. Их интенсивность найдем, раскрывая неопределенность при 5 = 0, ±2л в полученном выражении: 1@) = /0УУ2, /(±0!) = /0№а2/4. 6.6. Спектральные приборы Любой спектральный прибор выполняет гармонический анализ падающего на него излучения, т. е. физическое разложение излучения на монохроматические составляю- составляющие. При математическом разложении некоторой функции времени в интеграл Фурье находятся амплитуды и фазы составляющих ее гармонических колебаний. В спек- спектральном приборе устанавливается распределение энергии исследуемого излучения по частотам, т. е. находятся интенсивности отдельных монохроматических составля- составляющих, а информация об их фазах оказывается утраченной. Спектральные приборы можно классифицировать по характеру решаемых с их помощью задач. Прибор для фотографической регистрации спектра исследуемого излучения называется спектрографом. Измерения распределения энергии по спек- спектру выполняются с помощью спектрофотометров. Монохроматор позволяет вы- выделить в спектре падающего излучения для дальнейшего использования некоторый (обычно довольно узкий) интервал частот и непрерывно перемещать его по спек- спектру. Спектральные приборы различают также по области спектра, для которой они предназначены. Действие спектральных приборов может быть основано на разных физических принципах. Основная часть прибора, называемая диспергирующим элементом, осу- осуществляет обычно пространственное разделение излучения разных длин волн, от- отклоняя его на различные углы. В призменных спектральных приборах, берущих свое начало от известного опыта Ньютона по разложению солнечного света, используется зависимость показателя преломления от длины волны (дисперсия). Диспергирующим элементом дифракционных спектральных приборов служит дифракционная решетка (см. п. 6.5). В приборах высокой разрешающей силы (интерферометр Фабри-Перо, см. п. 5.7; интерферометр Майкельсона, см. п. 5.6, и др.) используется многолучевая или двухлучевая интерференция при очень больших разностях хода. Существуют и новые типы спектральных приборов, основанные на селективной частотной и ам- амплитудной модуляции исследуемого излучения, возникающей при равномерном изме- изменении разности хода интерферирующих пучков. Это фурье-спектрометры (см. п. 5.6) и СИСАМы. Принципиальная схема спектрального прибора приведена на рис. 6.35 на примере призменного спектрографа. Кроме диспергирующего элемента прибор должен иметь фокусирующую оптику. Освещаемая исследуемым излучением входная щель 5 на- находится в фокальной плоскости коллиматорного объектива 1^, назначение которого в том, чтобы направить на диспергирующий элемент параллельный пучок лучей. Вы- Выходящие из диспергирующего элемента параллельные пучки имеют для разных длин
300 6. Дифракция света Рис. 6.35. Схема призменного спектрального прибора волн несколько различные направления. Второй (камерный) объектив Ь2 фокуси- фокусирует эти пучки. Создаваемые параллель- параллельными пучками изображения входной ще- щели — спектральные линии — получают- Р ся в разных местах фокальной плоскости объектива в зависимости от длины волны. Величина пространственного разделения изображений входной щели в разных дли- длинах волн определяется дисперсией спек- спектрального прибора. Угловая дисперсия Ив характеризует изменение угла отклонения параллельного пучка света диспергирующим элементом при изменении длины вол- волны: Ов = йв/ёА. Линейная дисперсия В{ зависит также от фокусного расстояния Р2 камерного объектива: й1 = ОвР2. Поместив в фокальной плоскости камерного объектива фотопластинку, можно сфотографировать спектр исследуемого излучения. Можно совместить с изображени- изображением щели 5 диафрагму (выходную щель) и вывести через нее излучение, соответствующее заданно- заданному участку спектра. Так работает монохроматор. Осуществляя непрерывную регистрацию энергии этого излучения с помощью фотоэлектрического приемника при перестройке(повороте) дисперги- диспергирующего элемента или перемещении диафрагмы в фокальной плоскости (сканирование), можно из- измерить распределение энергии по спектру. Фокусирующая оптика спектрального прибора может быть как линзовой, так и зеркальной. В ав- автоколлимационных приборах один и тот же объ- л ,., А , Рис. 6.36. Автоколлимационная схема ектив выполняет функции коллиматорного и ка- спектрального прибора мерного, а входная щель и ее цветные изобра- изображения лежат в одной его фокальной плоскости (рис. 6.36). В приборах с вогнутой отражательной дифракционной решеткой специ- специальная фокусирующая оптика отсутствует. Изображение щели создает сама решетка. Опектральный прибор можно считать идеальным, если распределение энергии на выходе не зависит от его особенностей, а определяется только свойствами источ- источника излучения. В действительности любой спектральный прибор и любой прием- приемник излучения вносят искажения в наблюдаемый спектр. Рассмотрим сначала иде- идеализированный случай, когда спектр падающего излучения состоит из нескольких монохроматических компонент. На выходе реального прибора вместо соответству- соответствующих этому излучению бесконечно узких спектральных линий будут наблюдать- наблюдаться линии, имеющие конечную ширину. Вносимое спектральным прибором ушире- ние линий обусловлено следующими причинами: 1) наблюдаемая спектральная ли- линия представляет собой изображение входной щели, имеющей конечную ширину; 2) дифракционные явления в диспергирующем элементе уширяют геометрическое изображение щели; 3) аберрации оптической системы и дефекты диспергирующего
6.6. Спектральные приборы 301 элемента также уширяют изображение; 4) система регистрации излучения дополни- дополнительно уширяет линию (из-за конечных размеров диафрагмы фотоприемника, его чувствительного элемента или зерна фотоэмульсии). Относительный вклад каждой из этих причин зависит от конструктивных особен- особенностей прибора. Но любой реальный прибор, регистрируя монохроматическое излу- излучение, дает некоторый контур конечной ширины, описываемый функцией /(Я). Эта функция определяется свойствами спектрального прибора и называется аппарат- аппаратной функцией или инструментальным контуром. Каждой длине волны А в прибо- приборе соответствует некоторый угол отклонения ф и определенная точка х фокальной плоскости камерного объектива. Поэтому инструментальный контур можно запи- записать также в виде /(<р) или /(*). Эта функция дает распределение интенсивности в фокальной плоскости прибора, создаваемое монохроматическим источником. Чем уже инструментальный контур, тем меньше искажений вносит спектральный прибор в измеряемый спектр. Аппаратную функцию принято нормировать на единицу, т. е. требовать, чтобы она удовлетворяла следующему условию нормировки: Г/(ф)йф = 1 или [/(х)дх = 1. F.45) Тогда на интервал (<р, ф + йф) приходится световой поток йФ = Ф/ (ф) йф9 где Ф — полный световой поток. х ассмотрим примеры инструментальных контуров разных спектрометров. Пусть входная щель бесконечно узка и аберрации оптической системы пренебрежимо ма- малы. Тогда причина уширения изображения щели лежит в самом диспергирующем элементе. В призменном спектрографе изображение щели расширяется вследствие дифракции при ограничении ширины падающего на призму параллельного пучка диафрагмой или краями призмы. Угловое распределение интенсивности монохрома- монохроматического дифрагировавшего света в этом случае будет таким же, как при дифракции Фраунгофера на щели, т.е. описывается формулой F.20) с и = (етд/А) зикр, где а — размер диафрагмы, ограничивающей ширину пучка. Угол ф отсчитывается здесь от направления на центр геометрического изображения щели. При достаточно большой ширине а пучка дифракционное уширение изображения невелико, т. е. существенны лишь малые углы ф <^ 1, для которых 8т<р « ф. Удовлетворяющая условию F.45) аппаратная функция имеет вид Такой обусловленный дифракцией аппаратный контур показан на рис. 6.37, а. Его ширина на половине высоты определяется корнем уравнения х = \/2$тх (х = 1,39) и равна 0,88 А/а. В приборе с дифракционной решеткой при работе в спектре т-го порядка вид ап- аппаратного контура (при бесконечно узкой входной щели) определяется распределени- распределением интенсивности монохроматического дифрагировавшего света в окрестности глав- главного максимума порядка т. При большом числе штрихов N ^$> I максимумы очень узкие, и поэтому в формуле F.37) плавный сомножитель 1^{в)> описывающий рас- распределение интенсивности в дифракционной картине от одного штриха, в пределах инструментального контура можно считать постоянным. Будем и здесь отсчитывать
302 6. Дифракция света угол ф от направления на центр геометрического изображения щели, т. е. от направ- направления вт на т-й главный максимум. Так как существенны только значения ф <С 1, то 81П в = 8ш@,„ + ф) « 81п вт + ф соз вт и разность фаз 8 волн от соседних штрихов в F.37) можно представить в виде Ъгё,, . Л . Л/Ч 2я^ ——(81ПУ — 81П0 ) « 2ят Л—— Я Я 8 = со80т где учтено, что для направления на главный максимум A{&т0т — &тв') = тХ {в' — угол падения). Подставляя это выражение для 8 в F.37) и учитывая, что в знаме- знаменателе можно заменить 8ш[(#*//А) со8 0т • ф] его аргументом (ф <С 1), получим для прибора с дифракционной решеткой такую же нормированную аппаратную функ- функцию F.46), что и для призмы с а = М/со8 0т. Этого и следовало ожидать, так как Ш — это полный размер решетки, а Ш соз вт — сечение дифрагировавшего пучка, образующего изображение входной щели в спектре т-го порядка (см. рис. 6.31). Л<Р) б)/(А8) 0,88 Я/а л<р) -На 0 Я/а <Р -<рх12 0 срх12 Рис. 6.37. Аппаратная функция спектрального прибора: а — спектрограф с призмой или диф- дифракционной решеткой при узкой входной щели; б — интерферометр Фабри-Перо с узкой диафрагмой; в — аппаратная функция в случае широкой входной щели (или диафрагмы) В интерферометре Фабри—Перо (см. п. 5.7) распределение интенсивности при освещении монохроматическим светом описывается формулой Эйри E.72). При вы- высоком коэффициенте отражения К зеркал отдельные максимумы имеют лоренцев- скую форму E.75). Такую же форму будет иметь и аппаратная функция, т.е. реги- регистрируемый в монохроматическом свете контур отдельной полосы равного наклона или сигнал фотоприемника при сканировании с использованием круглой диафрагмы очень малого диаметра (что соответствует бесконечно узкой щели в дифракционном или призменном приборе). Если аппаратную функцию рассматривать как функцию от А5 = 8 — 2лт, т. е. от отклонения разности фаз 8 от ее значения в соответствую- соответствующем максимуме, то в соответствии с E.75) 2/(яе) /(А5) = F.47) Здесь е = 2A —К)/у/К — ширина аппаратного контура на половине высоты. Вид этого контура показан на рис. 6.37, б. Рассмотрим теперь случай широкой входной щели, когда ширина ее геометриче- геометрического изображения в призменном или дифракционном спектрографе во много раз превышает ширину главного дифракционного максимума (~Я/#). В таких услови-
6.6. Спектральные приборы 303 ях дифракцией можно пренебречь и изображение щели в фокальной плоскости бу- будет равномерно освещенным. Аналогично в интерферометре Фабри—Перо с круглой (кольцевой) диафрагмой, размер которой много больше ширины отдельного макси- максимума, сигнал при сканировании остается постоянным, пока светлое кольцо находится в пределах диафрагмы. Соответствующий инструментальный контур имеет прямо- прямоугольную форму (рис. 6.37, в). В промежуточном случае, когда ширина геометрического изображения щели од- одного порядка с шириной дифракционного максимума, для нахождения аппаратного контура можно поступить следующим образом. Рассмотрим входную щель как источ- источник конечной ширины и разделим его мысленно на отдельные элементарные полоски. Считая их некогерентными бесконечно узкими источниками, найдем освещенность в фокальной плоскости как наложение описываемых формулой F.46) распределений, центр каждого из которых расположен при ф — ф\ т. е. там, где находится геометри- геометрическое изображение соответствующего элемента щели: Ф,/ F.48) А(<Р-<Р')М<Р') Получаемое в монохроматическом свете изображение входной щели из-за дифракции оказывается размытым по краям. Обе причины, т.е. конечная ширина входной ще- щели и дифракция в диспергирующем элементе, дают вклад в ширину результирующего аппа- аппаратного контура F.48). В более общем случае, когда одна из причин уширения дает контур, описывае- описываемый функцией /х(ф), а другая — функци- функцией / 2 (<р), результирующий аппаратный кон- контур можно получить тем же способом. Один из контуров, например /^ф), нужно разде- разделить на узкие элементы шириной Аф'. От- Отдельный элемент, лежащий при ф = ф', под 0 ^ <р действием второй причины дает контур, опи- Рис. 6.38. К нахождению результирующего сываемый функцией /2, но смещенный на <р', аппаратного контура т.е. /2(<Р — ф')- Его интенсивность пропорциональна ?\{ф')&ф' (рис. 6.38). Наложе- Наложение контуров от отдельных элементов F.49) дает результирующую аппаратную функцию. Стоящий в правой части F.49) инте- интеграл называется сверткой функций /| и /2. Когда есть несколько независимых причин уширения, аппаратный контур представляет собой свертку функций, каждая из которых описывает контур, обусловленный одной из причин уширения. Аппаратный контур характеризует те искажения, которые вносит прибор в спектр монохроматического излучения, т. е. при регистрации бесконечно узкой спектраль- спектральной линии.
304 6. Дифракция света Рассмотрим теперь немонохроматическое излучение, спектральное распределение интенсивности которого характеризуется некоторой функцией /(Я). В случае квази- квазимонохроматического света функция /(Я) описывает контур его спектральной линии с некоторой шириной ДЯ <С Я. Примеры спектральных линий и приводящих к ним статистических моделей излучения были приведены в пп. 1.8,5.4. Излучение слож- сложного спектрального состава можно представить в виде совокупности отдельных вза- взаимно некогерентных монохроматических компонент, отклик спектрального прибора на каждую из которых описывается аппаратным контуром пропорциональной интен- интенсивности с центром при соответствующем ее длине волны значении ф. Поэтому реально наблюдаемый контур 1тбл(<р) представляет собой свертку спектрального контура 1{ф) исследуемого излучения и общего инструментального контура Р{ф) независимо от того, в результате каких причин уширения последний образован: оо = / ПЯ>~ Я>') %') V- F-50) —оо Когда все спектральное распределение исследуемого излучения сосредоточено в ин- интервале, узком по сравнению с шириной инструментального контура Р (<р), наблюдае- наблюдаемый контур /набл(<Р) практически совпадает с инструментальным. Напротив, для того чтобы /набл(<Р) совпадал с /(<р), т.е. чтобы прибор непосредственно регистрировал спектральное распределение исследуемого излучения, аппаратный контур должен быть много уже деталей этого распределения. Цель спектральных измерений состоит в нахождении истинного, не искаженного прибором распределения энергии в спектре исследуемого излучения. Когда инстру- инструментальные искажения значительны, нахождение функции 1{ф) по известным функ- функциям /набл(<Р) и Р(Ф) сводится к решению интегрального уравнения F.50). Такая обратная оптическая задача, или задача редукции к идеальному прибору, в принципе разрешима даже при очень широком инструментальном контуре, если только функ- функции /набл(ф) и Р(ф) известны совершенно точно. В действительности они могут быть получены лишь в результате измерений распределения интенсивности в фокальной плоскости прибора. Эти измерения неизбежно содержат ошибки (шумы), что накла- накладывает ограничения на точность, с которой может быть восстановлена функция 1{ф). Восстановление 1(ф) относится к числу так называемых некорректных математи- математических задач, когда малые ошибки в значениях 1т^л(ф) могут приводить к очень большим погрешностям при нахождении 1(ф). Случайные ошибки измерений обусловлены не только погрешностями измери- измерительных приборов, но и самой природой измеряемой величины — световой энергии, излучение и поглощение которой имеет квантовый характер. Для точного измерения спектрального распределения энергии нужно уменьшать спектральный интервал АЯ, но при этом возрастают статистические погрешности результатов измерений. Воз- Возрастают они и при уменьшении времени измерения, а также при уменьшении самой измеряемой интенсивности. В самом деле, пусть в выделенном интервале АЯ за вре- время измерения регистрируется в среднем п квантов. Отклонение Аи числа зарегистри- зарегистрированных квантов в отдельном измерении от среднего значения п составляет в сред- среднем у/п. Поэтому относительная погрешность Ап/п = 1/у/п мала при п ^> 1, однако при п « 1 она приближается к 100%. Это налагает принципиальные ограничения на точность измерения распределения 1т$л(ф)- В то же время для детального нахожде-
6.6. Спектральные приборы 305 ния истинного спектрального распределения требуется тем точнее знать чем шире инструментальный контур. Таким образом, реальные возможности спектрального прибора более или менее детально исследовать спектр излучения в значительной степени определяются шири- шириной и формой его инструментального контура. Для характеристики этих возможно- возможностей вводится понятие разрешающей силы, или разрешающей способности. Так называется отношение длины волны Я к 8Х — наименьшей разности длин волн двух монохроматических спектральных линий, при которой спектральный прибор еще позволяет раздельно их наблюдать. Возможность разделить две монохромати- монохроматические линии зависит от точности, с которой измерен инструментальный контур и может быть измерен наблюдаемый контур. Поэтому количественный критерий раз- разрешающей способности можно сформулировать только условно в предположении определенной точности энергетических измерений распределения интенсивности. Условный критерий, удобный для сравнения разрешающей силы различных спек- спектральных приборов, был предложен Рэлеем для случая, когда инструменталь- инструментальный контур имеет дифракционную форму F.46). Согласно критерию Рэлея наи- наименьший разрешимый интервал 8Х равен расстоянию между главным максиму- максимумом и ближайшим к нему мини- минимумом аппаратной функции F.46). Две монохроматические линии оди- одинаковой интенсивности на таком расстоянии друг от друга (в угло- угловой мере оно равно 8д> — Х/а) да- дают суммарный контур с двумя мак- максимумами (рис. 6.39), провал меж- между которыми, как легко подсчитать, составляет около 20% от интен- интенсивности в максимумах. Благодаря провалу такой контур воспринима- воспринимается как двойная спектральная ли- линия. Если считать критерием разре- разрешения именно наличие провала, то можно обобщить критерий Рэлея на случаи, когда аппаратная функ- функция отличается от дифракционной: при любой форме инструментального контура две монохроматические линии одинаковой интенсивности находятся на пределе раз- разрешения 8Х, если провал в суммарном контуре составляет 20 %. Подчеркнем еще раз условный характер критерия Рэлея. Если интенсивность од- одной из линий существенно больше другой, то провал в наблюдаемом контуре может отсутствовать даже тогда, когда расстояние между ними значительно больше, чем требует критерий Рэлея. С другой стороны, линии, расположенные ближе, могут быть разрешены, если погрешность измерения наблюдаемого распределения интен- интенсивности меньше 20 %. Фактически возможность разрешения близких спектральных линий, как уже отмечалось, ограничивается шумами при измерениях: линии мож- можно разрешить, если наблюдаемое распределение отличается от распределения для одиночной линии больше, чем на ошибку измерения. Рис. 6.39. Критерий Рэлея
306 6. Дифракция света При дифракционной форме инструментального контура F.46), когда в соответ- соответствии с критерием Рэлея 8ср — А/а, предел разрешения 8Х в длинах волн и разреша- разрешающую силу Х/8Х можно выразить через угловую дисперсию прибора Ое = йв/йХ: м 8ф А А ,г ч 8Х = — = , — = аОд. F.51) Таким образом, теоретическая разрешающая сила равна произведению ширины а параллельного пучка, выходящего из диспергирующего элемента, и угловой диспер- дисперсии Ив. Эта вспомогательная формула удобна для нахождения обусловленного ди- дифракцией теоретического предела разрешающей способности разных спектральных приборов. В призменных спектральных приборах наибольшая разрешающая сила достигается при симметричной установке призмы, когда угол в отклонения параллельного пучка от первоначального направления минимален (рис. 6.40). В условиях минимального отклонения в = 2а — А, где а — угол падения, А — угол при вершине призмы. По- Поэтому для угловой дисперсии, обусловленной зависимостью показателя преломления материала призмы от длины волны, можно написать йв йв йп л йа йп Учитывая, что оптическая длина пути луча, идущего вдоль основания призмы, рав- равна сумме длин В А и АС, можем написать п1 = 2Ъ 8т а, где Ъ — длина ребра призмы. Отсюда 1йп = 2&со8аёа, т.е. йа/йп = 1/BЬсо$а). Но Ъсо$а = а, где а — ширина пучка, ограниченная размерами призмы. Подставляя йа/йп = //Bа) в F.52), полу- получаем следующее выражение для угловой дисперсии призмы: °е = [% F.53) Разрешающая сила Х/8Х в соответствии с F.51) 1 F.54) зависит от йп/йХ, т.е. дисперсии вещества, из которого она сделана, и пропор- пропорциональна длине / основания призмы, но не зависит от преломляющего угла А: призмы с разными углами Л, но равными осно- основаниями обладают одинаковой разрешающей си- силой. Однако с увеличением угла А уменьшает- уменьшается а (см. рис. 6.40) и, как ясно из F.53), дисперсия призмы возрастает, что облегчает задачу практи- практической реализации ее разрешающей способности (см. ниже). Поэтому предпочтение отдается приз- призмам с большим преломляющим углом, близким к предельному значению Лтах = 2агс8тA/л) (при бблыыих углах любой луч, вошедший в призму, испытывает на второй грани полное отражение). Наиболее часто используют призмы с преломляющим углом А « 60°. Угол отклоне- отклонения при этом близок к 45°. Рис. 6.40. К определению дисперсии и разрешающей способности призмы
6.6. Спектральные приборы 307 Один из существенных недостатков призмы состоит в быстром уменьшении раз- разрешающей способности и дисперсии при продвижении в длинноволновую часть спек- спектра. Для тяжелого стекла сорта «флинт» в синей части спектра дп/дл « 3200 см, в красной « 1700 см. При таких значениях разрешающая способность призмы с основанием / = 5см в синей части составляет « 15000, в красной — « 5000. Для увеличения разрешающей способности можно применить систему из несколь- нескольких последовательно расположенных призм, что эквивалентно увеличению / в фор- формуле F.54). Угловая дисперсия дифракционной решетки в спектре т-го порядка в соответ- соответствии с F.41) равна йв = т/(с1со$в). Учитывая, что ширина а параллельного пуч- пучка, дифрагировавшего под углом 0, для решетки из N штрихов равна М/со8 0 (см. рис. 6.31), из формулы F.51) найдем теоретическую разрешающую способность решетки: ^ F.55) Эту формулу можно получить и непосредственно, применяя критерий Рэлея к много- многолучевой интерференции волн, дифрагировавших от отдельных штрихов. Направление на главный максимум порядка т для длины волны Л + 8Л определяется из условия, что раз- разность хода Д от соседних штрихов равна т{Л + 8Х). В этом же направлении для длины волны Я будет расположен минимум, ближайший к главному максимуму порядка т, если Д = (т + 1/Лг)Я (между двумя главными максимумами расположен N — 1 минимум). Поэто- Поэтому т{Х + 8Х) = (т + 1/Ы) Я, откуда Х/8Х = тЫ. Отметим, что разрешающая способность решетки в спектре данного порядка т определяется только полным числом штрихов N в отличие от дисперсии, которая зависит от периода */, т. е. от числа штрихов на единицу длины решетки N/1. При за- заданном значении постоянной решетки й разрешающая способность возрастает с уве- увеличением длины / ее рабочей области. Для увеличения разрешающей силы стре- стремятся к изготовлению дифракционных решеток больших размеров (до 15-20см для видимой области и до 40 см для инфракрасной). В соответствии с формулой F.40) т = с1($твт — &твг)/Х, поэтому выражение F.55) для разрешающей силы можно также записать в виде 4 = ^гEт08т0')> F.56) т.е. разрешающая сила равна числу длин волн, укладывающихся в разность хода лучей, дифрагировавших в направлении в от крайних штрихов решетки (они нахо- находятся на расстоянии / = NA). Ее максимальное значение будет в спектре наиболь- наибольшего порядка ттах, который возможен при заданных й и Я. Так как ттах ^ 2с1/л, то максимальная разрешающая сила не превосходит 2М//Я, т.е. числа длин волн, укладывающихся на удвоенной длине рабочей части решетки. Она не зависит от то- того, образована ли решетка большим числом штрихов малого периода или малым числом штрихов большого периода, если общая длина NA одна и та же. Однако гру- грубые решетки будут иметь ту же дисперсию и разрешающую силу только в спектрах
308 6. Дифракция света высоких порядков т. Решетки с большим числом штрихов на единицу длины, пред- предназначенные для работы в спектрах низких порядков т, обладают важным преиму- преимуществом — большой свободной областью дисперсии ДА = Х/т F.42), что позволяет применять их для исследования излучения с широким спектральным составом. Ширина и форма инструментального контура прибора определяются, как уже от- отмечалось, суммарным действием ряда факторов. К ним относятся конечная ширина входной щели, несовершенство фокусирующей оптики, зернистое строение фото- фотоэмульсии и рассеяние света в ней, конечная ширина диафрагмы при фотоэлектри- фотоэлектрической регистрации. Поэтому далеко не просто реализовать в эксперименте высо- высокие значения теоретической разрешающей силы, обусловленной диспергирующим элементом. В частности, требуются высококачественные фокусирующие объективы большого диаметра и достаточно длиннофокусные, чтобы обеспечить необходимую линейную дисперсию В{ — йв — ОвР. При малой линейной дисперсии будет сказы- сказываться зернистость фотоэмульсии. При конечной ширине входной щели ширина и форма инструментального контура в соответствии с F.48) зависят от соотношения между шириной срх геометрического изображения щели и расстоянием 8ср = Х/а между двумя линиями, разрешимыми согласно критерию Рэлея. Если д>1 = 8ф9 щель называется нормальной. Зависимость практической разрешающей силы от ширины щели (для некогерентного освещения) показана на рис. 6.41. При расширении щели, по- пока она остается уже нормальной, ширина контура растет очень медленно. Так же медленно умень- уменьшается разрешающая способность: для нормаль- нормальной щели она составляет более 75 % от значения при бесконечно узкой щели. Когда ширина щели превышает нормальную более чем вдвое, ширина инструментального контура становится примерно 0246 равной ширине геометрического изображения ще- Рис. 6.41. Отношение разрешающей ли. На том же рисунке показана зависимость ин- силы к ее значению при бесконечно тенсивности в центре монохроматического изоб- узкой щели G) и интенсивность в цент- г г__ ре линии B) в зависимости от шири- ражения щели от ее ширины. Для узкой щели ин- ны входной щели (по оси абсцисс от- тенсивность растет пропорционально ширине, так ложено отношение ширины входной как растущий световой поток приходится на ту же щели к ширине нормальной щели) « * 1-т площадь дифракционного изображения щели. Пос- После достижения нормальной ширины рост интен- интенсивности резко замедляется и она приближается к постоянному значению, соответ- соответствующему бесконечно широкой щели, ибо одинаково быстро растут как световой поток, так и площадь изображения щели, по которой он распределяется. Для многих целей оптимальная ширина щели близка к нормальной. В тех случах, когда дифракци- дифракционный предел разрешающей способности не достигается из-за аберраций оптической системы или зерна фотоэмульсии, оптимальная ширина щели может быть в несколь- несколько раз больше нормальной. Как показывает формула F.55), разрешающая способность спектрального прибо- прибора равна произведению порядка интерференции т на число N интерферирующих
6.6. Спектральные приборы 309 световых пучков. Высокая разрешающая сила хороших дифракционных решеток до- достигается за счет больших значений общего числа штрихов N при низких порядках интерференции (т = 1,2, 3). В интерференционных спектральных приборах, наобо- наоборот, число пучков сравнительно невелико (Ы « 30 для интерферометра Фабри—Перо, N = 2 для интерферометра Майкельсона), а большое разрешение достигается за счет высоких порядков интерференции т. Для интерферометра Фабри—Перо с аппаратной функцией F.47) пределом раз- разрешения 8Х можно считать ширину контура на половине высоты. Провал в на- наблюдаемом контуре от двух находящихся на таком расстоянии монохроматиче- монохроматических линий составляет около 17%, т.е. это условие практически совпадает с обоб- обобщенным критерием Рэлея. Ширине контура соответствует изменение разности фаз на с = 2A — К)/у/К (см. E.74)). Разность фаз 8 интерферирующих волн в макси- максимуме т-го порядка равна 2лт. Изменению ее на е соответствует изменение длины волны на 8Х = (е/2лт) Я, откуда для разрешающей силы Х/8Х находим где Р = 2л/с = лу/К/{\ —К) — резкость интерференционных полос E.76). Сравни- Сравнивая F.57) с F.55), видим, что резкость Р играет роль эффективного числа пучков в интерферометре Фабри—Перо: такое число пучков равной интенсивности обес- обеспечивает ту же разрешающую способность, что и бесконечная последовательность пучков убывающей интенсивности. При К = 0,9 эффективное число пучков Р « 30. Порядок интерференции т для центра системы колец равен т = 2Н/Х. При тол- толщине Н « 1 см для Я = 500 нм т « 4 • 104 и теоретическая разрешающая сила пре- превышает 1 млн. Увеличивая толщину /*, можно добиться еще больших значений Х/8Х9 но это приведет к пропорциональному уменьшению свободной области дисперсии АЯ = XIт = Я2/B/г), что целесообразно лишь при исследовании очень узких спек- спектральных линий. Другая возможность увеличения разрешающей способности интерферометра Фабри—Перо заключается в повышении коэффициента отражения К зеркал. Однако в реальном приборе такая возможность ограничена несовершенством его поверх- поверхностей. Инструментальный контур неидеального интерферометра уширяется из-за наложения смещенных относительно друг друга контуров Эйри, создаваемых раз- разными участками его поверхностей (см. п. 5.7). При очень высоком коэффициенте отражения К контуры от отдельных участков становятся столь узкими, что форма результирующего контура будет целиком определяться дефектами поверхностей. Дальнейшее увеличение К в таких условиях нецелесообразно, так как разрешаю- разрешающая способность не возрастает, а количество пропускаемой световой энергии убы- убывает из-за сужения контуров от отдельных участков и получается лишь ухудшение отношения сигнала к шуму. Картина здесь аналогична той, что получается при суже- сужении входной щели спектрографа, когда ее ширина меньше нормальной: разрешающая способность остается прежней, а интенсивность уменьшается. При фотоэлектрической регистрации измеряется световой поток через круглую или кольцевую диафрагму, помещенную в плоскости, где фокусируются интерфе- интерференционные кольца. Из-за конечных размеров диафрагмы получающийся при ска- сканировании инструментальный контур отличается от кривой Эйри F.47). Сужение
310 6. Дифракция света диафрагмы до величины, значительно меньшей ширины отдельного максимума те- теоретического контура F.47), не дает заметного увеличения разрешающей силы, но резко сокращает попадающий на фотоприемник световой поток, что снижает отно- отношение сигнала к шуму. При компромиссном решении, когда спектральная ширина диафрагмы выбирается равной ширине 8Х контура Эйри, разрешающая способность в у/2 раз меньше теоретического значения тР F.57). Интерферометр Фабри—Перо проще в обращении и обеспечивает более высокую разрешающую силу, чем приборы с большими дифракционными решетками. Основ- Основной его недостаток — малая величина свободной области дисперсии. Система из двух последовательных интерферометров, толщины которых находятся в простом кратном отношении (мультиплекс), имеет область дисперсии, характерную для тонкого ин- интерферометра, а разрешающую способность — для толстого. Для исследования ши- широких участков спектра интерферометр Фабри—Перо «скрещивают» с призменным или дифракционным спектральным прибором (см. п. 5.7). Контрольные вопросы • Какие функции выполняют диспергирующий элемент, коллиматорный и камерный объек- объективы спектрального прибора? • Какие причины вызывают уширение наблюдаемой спектральной линии при регистрации прибором монохроматического излучения? • Что называется аппаратной функцией спектрального прибора? • Какой вид имеют аппаратные функции для призменного и дифракционного спектрографов с узкой входной щелью? для интерферометра Фабри—Перо? • Каким будет инструментальный контур при одновременном действии двух независимых причин уширения, действия которых описываются функциями /\{(р) и /2(<р)? • Как связан регистрируемый прибором спектр с истинным спектральным распределением исследуемого излучения? • Что имеют в виду, когда говорят об условном характере критерия Рэлея? • От каких величин, характеризующих призму, зависит разрешающая способность призмен- призменного спектрографа? Почему разрешающая способность максимальна при симметричной установке призмы? • Чему равна разрешающая способность дифракционной решетки с N штрихами в спектре порядка т! Каким параметром решетки определяется наибольшая достижимая разрешаю- разрешающая сила для длины волны XI • Как влияет ширина входной щели на разрешающую силу спектрографа? Что такое нор- нормальная щель? • Какие параметры интерферометра Фабри—Перо определяют его разрешающую способ- способность?
Геометрическая оптика и роль дифракции в оптических приборах Многие простые оптические явления, такие, например, как воз- возникновение теней и образование изображений в оптических приборах, можно объяснить на основе законов геометрической (или лучевой) оптики. Геометрическая оптика использует представление о световых лучах — математических линиях, вдоль которых происходит распространение энергии световых колебаний. Пучки света рассматриваются как совокупности бесконечно- бесконечного числа независимых лучей, удовлетворяющих хорошо извест- известным законам прямолинейного распространения в однородной среде, отражения и преломления на границе раздела двух сред. Законы геометрической оптики можно получить из волновой оптики в предельном случае исчезающе малых длин волн Я —> О, когда волновая природа света становится несущественной. Геометрическая оптика оказывается хорошим приближени- приближением при описании распространения света и позволяет решать простыми средствами широкий круг практически важных задач именно потому, что длина световой волны представляет собой малую величину по сравнению с характерными размерами эле- элементов оптических систем (зеркал, линз, диафрагм и т.п.). Однако для решения более тонких вопросов, таких, напри- например, как распределение света вблизи фокуса или разрешающая способность оптических инструментов, требуется выход за рам- рамки этого приближения. Обусловленные волновой природой света отклонения от простых законов геометрической оптики обнаруживают себя в явлениях дифракции. Теория дифракции устанавливает грани- границы применимости этого приближения.
312 7. Геометрическая оптика 7.1. Основные положения геометрической оптики х ассмотрим переход от волновой оптики к геометрической в предельном случае исчезающе малой длины волны (Я —> 0). Плоская волна характеризуется тем свойством, что ее поверхности постоянной фазы (волновые поверхности) представляют собой неограниченные плоскости, а на- направление ее распространения и амплитуда везде одинаковы. В общем случае све- световые волны таким свойством не обладают. Тем не менее зачастую световую волну можно приближенно рассматривать как плоскую в каждом небольшом участке про- пространства. Это возможно тогда, когда амплитуда световых колебаний и направление распространения волны почти не изменяются на расстоянии порядка длины вол- волны. Волновые поверхности при этом имеют небольшую кривизну, и на небольших участках пространства можно, как и у плоской волны, говорить об определенном направлении распространения, нормальном к волновой поверхности. Для характери- характеристики этого направления вводят понятие лучей, т. е. линий, касательная к которым в каждой точке совпадает с направлением распространения волны. Геометрическая оптика, отвлекаясь от волновой природы света, описывает его распространение с помощью лучей. При этом оказывается, что поведение лучей при Я —> 0 определяется теми же законами, что и для плоских волн: законы преломле- преломления и отражения, установленные для плоской волны, падающей на плоскую границу раздела, справедливы в приближении геометрической оптики при более общих усло- условиях. Например, при падении луча на поверхность линзы направление, интенсив- интенсивность и состояние поляризации отраженного и преломленного лучей можно найти из соответствующих формул для плоских волн. В плоской монохроматической волне, распространяющейся в изотропной одно- однородной среде с показателем преломления п, зависимость напряженности поля от координат и времени имеет вид Е(т9 г) = Ео е'О*-**) = Ео е^о"*-**). G.1) Здесь введен единичный вектор 8 (лучевой вектор), указывающий направ- направление распространения плоской волны: 8 = к/к. Поэтому к = к$ = коп$, где к0 = (о/с = 2я/Я0 — волновое число (для вакуума). В неоднородной среде показа- показатель преломления зависит от координат: п = л (г) — и выражение G.1) уже не будет решением уравнений Максвелла. Можно искать решение в виде монохроматической волны более общего типа: Е(г,1)=Ео(г)^ко8(г)-<°<\ G.2) где величина 5(г), называемая эйконалом, представляет собой вещественную ска- скалярную функцию координат, а амплитуда Е0(г) зависит от положения г рассматрива- рассматриваемой точки. Выражение G.2) будет давать приближенное решение уравнений Макс- Максвелла в предельном случае больших к0 (т.е. малых длин волн Яо) при условии, что функция 5 (г) удовлетворяет некоторому дифференциальному уравнению (уравнение эйконала). Найдем его. Напряженность поля Е(г9() в G.2) при Я —> 0, т.е. к0 —> оо, испытывает очень быстрые изменения в пространстве, но амплитуда Е0(г) и эйконал 5(г) изменяются
7.1. Основные положения геометрической оптики 313 постепенно и при к0 —> оо остаются конечными. В малых участках пространства 5(г) можно разложить в ряд, ограничившись членами первого порядка: 5(г) = 5(г0) + (г - го)(95/аг)г=Го = 50 + (г - го)У5. G.3) Подставляя это разложение в G.2), представим напряженность поля в окрестности точки г = го в виде Е(т, 0 = Ео е'(*оТО-г-**), е0 = Е0(г0) е<А)Р(го)-го'™]. G.4) Это и значит, что в каждом малом участке пространства, в пределах которого справедливо разложение G.3), произвольную волну G.2) можно рассматривать как плоскую, так как в G.4) зависимость напряженности от координат г такая же, как и в плоской волне G.1). Сравнивая G.4) с G.1), получаем дифференциальное урав- уравнение, которому должна удовлетворять функция 5(г): Л8 = У5(г), или (У5J = л2. G.5) Поверхности равных фаз (или волновые поверхности) монохроматической вол- волны G.2) определяются уравнением ко3(г) - Ш = сош*. G.6) Уравнение G.5) показывает, что лучи, т. е. линии, касательные к которым в каждой точке совпадают с направлением распространения волны, задаваемым единичным вектором 8, ортогональны к волновым поверхностям. В общем случае при показа- показателе преломления л (г), изменяющемся от точки к точке, лучи будут искривлены. Поверхности равных фаз перемещаются в направлении луча 8 со скоростью V = с/п. Чтобы выяснить, как искривляются лучи в оптически неоднородной среде, полу- получим из уравнения эйконала G.5) дифференциальное уравнение для лучей. Радиус- вектор г точки Р, лежащей на луче, будем рассматривать как функцию длины дуги /. Тогда Аг/А1 = 8 и из G.5) находим л Аг/А1 = У5. Продифференцируем это уравнение по / и преобразуем правую часть следующим образом: (й/ё/)(У5) = У(й5/й/) = У л (здесь мы воспользовались тем, что й8/<11 = У 5 • 8 = л). Таким образом, 2 (¦!)-*- <") В частности, в однородной среде п = сопз*, Уп = 0 и G.7) принимает вид й2г/<И2 = 0. Его решение г = а/ 4- Ь, где а и Ь — постоянные векторы, представ- представляет собой прямую линию, направленную по вектору а и проходящую через точку г = Ь. В однородной среде световые лучи прямолинейны. Но волновые поверхности 5 (г) = сош* при этом могут и не быть плоскими. Например, одно из возможных решений уравнения эйконала (УЗJ = п2 при п — сопз! имеет вид 5(г) = п\г — го| (особая точка при г = г0). В этом случае У 5 = л (г — го)/|г — го| и лучи света обра- образуют семейство прямых, расходящихся из точки г = г0, а волновые поверхности — концентрические сферы.
314 7. Геометрическая оптика Для неоднородной среды п = п(г) и уравнение G.7) преобразуется к виду (дп/61)з + п(й$/А1) = У п. Так как Ап/А1 = (Уп) • 8, то ^ = 1[уп-$(Уп-$)]. G.8) ш п Производная единичного вектора 8 по длине луча / характеризует кривизну луча: с1§/с1/ = N/7?, где N — единичный вектор главной нормали к лучу, К — радиус его кривизны. Умножая обе части G.8) скалярно на N и учитывая, что N • $ = 0, получа- получаем следующее выражение для радиуса кривизны луча: - = - N • Уп. G.9) К п Отсюда, в частности, следует, что N • Уп > 0, т. е. угол между N и Уп острый — луч изгибается в область с большим показателем преломления п. Для демонстрации искривления световых лучей можно взять две смешиваю- смешивающиеся жидкости с заметно различающимися показателями преломления, напри- например сероуглерод (п = 1,63) и бензол (п = 1,50), и расположить их слои один над другим. Граница между слоями вскоре пропадает вследствие диффузии, и по- получается среда с непрерывно изменяющимся показателем преломления. Исходя из уравнения G.8), можно показать (см. за- п(г)=по(\+а2) дачу 1), что в среде, показатель прелом- а) 2 г(х)=(сЪах-1)/а сопз1; ления которой изменяется в каком-либо одном направлении по линейному закону л (г) = поA +аг)9 лучи представляют собой цепные линии (рис. 7.1, а). Если начало ко- координат выбрать там, где вектор 8 направлен горизонтально (вдоль оси х), уравнение лу- ча имеет вид г(х) = (сЪах - \)/а. В соот- соответствии с G.9) луч сильнее всего искрив- лен там, где его направление перпендику- '' - ч тх „ лярно градиенту показателя преломления. Рис. 7.1. Искривление лучей света в оптиче- 1Я » ски неоднородной среде (а) и возникновение Искривлением лучей света в неравномер- миража, обусловленное градиентом показа- но нагретом воздухе объясняется явление теля преломления в нагретом слое воздуха, миража9 когда в жаркой пустыне возникает прилегающем к земле (б) „ г ч у иллюзия находящейся на горизонте водной глади или вдали на асфальте нагретого сол- солнечными лучами шоссе видны «лужи», исчезающие при приближении к ним. При- Прилегающие к раскаленной земле слои воздуха нагреты сильнее, поэтому плотность воздуха и его показатель преломления возрастают с высотой. Лучи света, входящие в такой слой под небольшими углами, искривляются и, не достигнув земли, выходят обратно под такими же углами (см. рис. 7.1,6). Мы настолько привыкли к прямоли- прямолинейному распространению света, что подсознательно считаем источник расположен- расположенным на прямолинейном продолжении попадающих в глаз лучей даже тогда, когда они искривлены; мы видим расположенные над горизонтом удаленные предметы как бы отраженными горизонтальной зеркальной поверхностью («водной гладью»). Другой пример искривления лучей дает явление астрономической рефракции^ обусловленное тем, что плотность земной атмосферы и, следовательно, ее показа- показатель преломления убывают с высотой. Наблюдаемая высота небесного светила над
7.1. Основные положения геометрической оптики 315 горизонтом оказывается больше истинной. Эффект особенно значителен, когда све- светило наблюдается у горизонта (рефракция при этом достигает 35') и быстро убывает с увеличением высоты. Этим объясняется сплюснутая форма солнечного диска при восходе и закате. Благодаря рефракции мы видим Солнце в течение нескольких ми- минут после того, как оно уже зашло. Выше предполагалось, что показатель преломления представляет собой непрерыв- непрерывную функцию координат. Чтобы рассмотреть поведение лучей при переходе через резкую границу раздела сред с различными показателями преломления, можно мыс- мысленно заменить граничную поверхность тонким переходным слоем, в котором пока- показатель преломления изменяется непрерывно. Тогда уравнение G.5) останется в силе. Применяя к обеим его частям операцию го* и учитывая тождество го*§гас15 = О, находим соотношение, которому должен удовлетворять лучевой вектор $: го* (не) = 0. G.10) Выберем небольшой прямоугольный контур / (рис. 7.2,а), стороны Р\0,\ и Р1(^2 которого параллельны поверхности раздела Т двух сред, а Р\Р2 и 6162 перпен- перпендикулярны Г. Пусть Ь — единичный вектор нормали к плоскости контура. Умно- Умножим G.10) скалярно на Ь и проинтегрируем по площади а, ограниченной контуром /. Поток ротора по теореме Стокса преобразуется в интеграл по контуру /: / Ь го* (ю) йсг = Ф п$ йг = 0. о1 I Переходя к пределу, когда длины сторон Р^2 и (^(^ стремятся к нулю, получим Ь[п12 х (п2«2 ~~ п\*\)\ = 0, или п2(п12 х 82) = п\(п\2 х 8^, G.11) где п12 — единичный вектор нормали к поверхности раздела Т. Из форму- формулы G.11) следует, что преломленный луч $2 лежит в плоскости падения (плоское- ти, образованной падающим лучом углов падения и преломления связа- связаи нормалью п12» см. рис. 1.2,6), а синусы ны соотношением п2 = п Как и следовало ожидать, закон пре- преломления, установленный для плос- плоских волн на плоской границе раздела, в приближении геометрической опти- оптики (Яо —» 0) справедлив для прелом- преломляющих поверхностей более офцей формы. Фактически для этого доста- достаточно, чтобы радиусы кривизны вол- новой поверхности падающей волны р„с. 7.2. К выводу закона преломления лучей света и поверхности раздела были велики на искривленной границе раздела двух сред по сравнению с Ао. Нахождение траекторий лучей света в приближении геометрической оптики мож- можно сформулировать как задачу вариационного исчисления, если воспользоваться
316 7. Геометрическая оптика V принципом Ферма, согласно которому свет распространяется между двумя точ- точками по такому пути, который требует для прохождения наименьшего времени. Принцип наикратчайшего оптического пути, сформулированный Пьером Ферма в середине XVII в., можно получить как следствие основного уравнения геометри- геометрической оптики G.5). Рас- а) ^ б) А п смотрим некоторую об- область с показателем пре- преломления л(г), через каждую точку которой проходит только один луч (например, от то- точечного источника), т.е. эти лучи в рассматрива- рассматриваемой области не пересе- пересекаются. Пусть точки А и В (рис. 7.3, а) лежат на одном луче. Используя уравне- уравнение G.5) из = ^(г), вычислим следующий интеграл вдоль произвольной кривой, соединяющей точки А и В: И Рис. 7.3. К обоснованию принципа Ферма АВ АВ G.12) Этот интеграл равен разности значений эйконала в точках А и В и, следовательно, не зависит от пути интегрирования (интегральный инвариант Лагранжа). Очевидно, что 5Aг = ё/со8E, йг) ^ <1/, поэтому 5(В)-5(А) АВ АВ G.13) причем знак равенства справедлив только в том случае, когда направления векторов 5 и йг совпадают в каждой точке рассматриваемой кривой, т. е. когда она представляет собой реальный луч (АСВ на рис. 7.3, а). Для любой другой кривой, соединяющей точки А и В (например, АЭВ на рис. 7.3, а), правая часть G.13), называемая опти- оптической длиной пути, оказывается больше, чем для реального луча АС В. Поскольку 61 = V A/ = (с/п) &, оптическая длина равна произведению скорости света в среде на время, которое требуется свету для прохождения вдоль этой кривой. Таким образом, свет между А и В распространяется по тому пути, который требует наименьшего времени. В приведенном выше доказательстве было использовано предположение о том, что через каждую точку рассматриваемой области проходит только один луч. Это условие во многих практически важных случаях не выполняется. Например, при отражении от зеркала света, испускаемого точечным источником А, через любую точку В проходят два луча (см. рис. 7.3,6). Чтобы охватить подобные случаи, прин- принцип Ферма можно сформулировать в более слабой форме, но применимой в более широкой области: реальный луч отличается от остальных кривых, соединяющих две заданные точки, тем, что соответствующая ему оптическая длина имеет стацио- стационарное значение, т.е. малое изменение траектории (например, точки падения на зеркало на рис. 7.3, б) не приводит в первом порядке к изменению оптической дли- длины. Эта формулировка вполне достаточна для практических приложений, ибо для
7.1. Основные положения геометрической оптики 317 нахождения реального луча можно ограничиться сравнением оптических длин для воображаемых путей, которые проходят бесконечно близко от действительного. Проиллюстрируем применение принципа Ферма на примере преломления луча на границе однородных сред. Пусть АО В — истинный путь света из А в В (рис. 7.4). Тогда при малом изменении траектории — смещении точки преломления из О в С — оптическая длина в первом приближении должна остаться неизменной. Оптический путь в среде 1 увеличивается на /11^С| = п1\0С\$т61, в среде 2 — уменьшается на п2\ОЕ\ = п2\ОС\$т62. Приравнивая эти величины, опять получаем закон пре- ломления: = п2 Если пучок лучей, выходящих из какой-либо точки Р, после отражений, преломлений на границах или искрив- искривлений в неоднородной среде сходится в точке Р;, то Р' называется действительным фокусом геометрического схождения лучей. Его можно рассматривать как опти- оптическое изображение точки Р. Изображение называют Рис. 7.4. Применение принци- „/ па Ферма к преломлению лучей мнимым, если в Р' пересекаются не сами лучи, а их света на границе раздела продолжения, проведенные в направлении, противопо- противоположном распространению света. Если источник Р и его изображение Р' поменять местами, то форма всех лучей останется без изменения и лишь их направление изменится на противоположное {принцип обратимости). Поэтому точки Р и Р' называются сопряженными. Когда все лучи пересекаются строго в одной точке Р;, изображение называется стигматическим (точечным). Пу- Пучок лучей, выходящих из одной точки или сходящихся в одну точку, называется гомоцентрическим. В соответствии с принципом Ферма оптическая длина всех лучей между со- сопряженными точками одинакова. В качестве примера рассмотрим зеркало в фор- форме эллипсоида вращения (рис. 7.5). Сумма расстояний \РО\ + \ОР'\ от его фокусов до точки О имеет одно и то же значение при любом положении точки О на его поверхности. Если в один из фокусов поместить точечный источник, в другом фокусе пучок отражен- отраженных от зеркала лучей образует стигматическое изоб- изображение источника. Исходящие из фокуса эллипсоида гомоцентрические пучки лучей в результате отражения превращаются снова в гомоцентрические. Совершенно Рис. 7.5. Эллиптическое зерка- аналогично в фокусе параболического зеркала образу- ло. Все лучи, выходящие из фо- ется стигматическое изображение находящегося на оси куса эллипса, после отражения - г проходят через второй фокус параболоида бесконечно удаленного точечного источ- источника (параболоид можно рассматривать как предельный случай эллипсоида, когда второй его фокус удаляется в бесконечность). Такие параболические зеркала используются в астрономических телескопах-рефлекторах. Эти примеры преобразования пучков света иллюстрируют скорее исключе- исключения, чем общее правило: обычно при отражении или преломлении пучок утра- утрачивает свойство гомоцентричности и не образует стигматического изображения
318 7. Геометрическая оптика точечного источника Например, отраженные параболическим зеркалом лучи от бесконечно удаленного источника, не лежащего на оси зеркала, пересекаются не в одной точке, а в некоторой ее окрестности, что ухудшает качество изобра- изображения. Используемые на практике оптические системы состоят из линз и зер- зеркал, преломляющие и отражающие поверхности которых, как правило, сфери- сферические или плоские. Ход приосевых лучей и образование изображений в цен- центрированных оптических системах рассматриваются в п. 7.2. Искажения изобра- изображений, связанные с нарушением гомоцентричности пучков, называются геомет- геометрическими или лучевыми аберрациями оптических систем (см. п. 7.4). Зависи- Зависимость показателя преломления от длины волны приводит к появлению хрома- хроматической аберрации (см. п. 7.4). Неизбежные в принципе погрешности отобра- отображения можно уменьшить до разумных пределов, используя многолинзовые кон- конструкции. В этом отношении инструментальная оптика достигла замечательных ре- результатов. Но даже в тех случаях, когда по законам геометрической оптики пучок лучей пересекается строго в одной точке, образование точечного изображения светящейся точки невозможно из-за дифракции света. Вблизи фокуса пучка лучей кривизна вол- волновых поверхностей становится значительной. Изменение амплитуды волны здесь уже нельзя считать малым на протяжении длины волны, т.е. условия применимо- применимости геометрической оптики не выполняются, и распределение интенсивности вблизи фокуса обусловлено волновой природой света. Волновые, или дифракционные, ис- искажения определяют теоретический предел разрешающей способности оптических инструментов (см. п. 7.5). Контрольные вопросы • В каком предельном случае волновая оптика переходит в геометрическую? Приведите при- примеры, в которых условия применимости геометрической оптики не выполняются. • Как из уравнения эйконала т = У5 получить дифференциальное уравнение для лучей? • В какую сторону искривляется луч в среде с зависящим от координат показателем прелом- преломления? Объясните явления миража и астрономической рефракции. • Как из уравнения эйконала получить закон преломления лучей на границе раздела сред? Сформулируйте принцип Ферма. Как его доказать с помощью основного уравнения геомет- геометрической оптики? Приведите примеры применения принципа Ферма. • Что такое сопряженные точки? • Какую форму должно иметь зеркало для получения стигматического изображения светя- светящейся точки? бесконечно удаленного точечного источника? Задачи 1. Показатель преломления среды изменяется в направлении оси г по линейному закону: п(г) = лго( 1 + аг). Найдите форму луча в такой среде г = г(х), если в начале координат вектор 8 направлен вдоль оси х. Решение. Обозначим г'(х) = 1%(р = р (см. рис. 7.1,а). Тогда с1/ = йг у/\ 4- р2/р, хх = \/у/\ 4- р2, зг = р/\/\ 4- р2. Рассмотрим проекцию уравнения для лучей G.8)
7.2. Центрированные оптические системы 319 на ось х: _ р 1 6п ~ 2 ё' Отсюда [р/(\ + Р2)]с1р = <1л/л. Интегрируя это уравнение с учетом того, что при г — О луч направлен вдоль х, т.е. р = 0, получаем 1 4-р2 = (п/п0J, или 1 +г' = A 4-«гJ. Интегрирование этого уравнения с начальным условием г @) = 0 дает При «х <1С 1 эта цепная линия аппроксимируется параболой г(х) « ах2/2. 7.2. Центрированные оптические системы оолыиинство используемых на практике оптических инструментов относится к цен- центрированным системам, у которых центры кривизны всех сферических преломля- преломляющих и отражающих поверхностей расположены на одной прямой, называемой глав- главной оптической осью. Теория таких систем становится особенно простой, когда все распространяющиеся в них пучки лучей параксиальны, т. е. проходят на небольшом расстоянии от оптической оси системы и образуют с ней малые углы. Гомоцентриче- Гомоцентрический пучок параксиальных лучей при прохождении через центрированную систему остается почти гомоцентрическим, поэтому для каждой точки протяженного пред- предмета система формирует стигматическое (резкое) изображение. Образование изобра- изображений в параксиальных лучах было систематически исследовано Гауссом в 1841 г., поэтому теорию центрированных оптических систем в параксиальном приближении обычно называют гауссовой оптикой. Преобразование луча в оптической системе удобно описывать с помощью специаль- специальных матриц. Достоинство матричного метода в том, что его можно использовать не только в геометрической оптике параксиальных лучей, но и при описании распрост- распространения гауссовых пучков с дифракционной расходимостью (лазерное излучение). В оптической системе сферические (и плоские) поверхности служат границами раздела различных однородных сред (материал линз и про- промежутки между ними). Траектория луча состоит из отрезков у\ ,оп прямых линий. Будем рассматривать только меридиональные лучи, т.е. лучи, лежащие в одной плоскости с главной опти- оптической осью (ось т. на рис. 7.6). Пусть это будет плоскость у т.. Выберем некоторую плоскость г = сопз*, перпендикулярную оптической оси, и назовем ее опорной плоскостью (ОП). Лю- Любой меридиональный луч можно определить заданием двух Рис 7.6. Параметры^, а „ меридионального луча параметров: координаты у точки его пересечения с опорной г ' плоскостью и угла а, который он составляет с осью г (см. рис. 7.6). Однако в дальнейшем для характеристики направления луча удобно вме- вместо а использовать параметр V — па, т. е. произведение показателя преломления сре- среды на угол а.
320 7. Геометрическая оптика Преобразование параметров у и V луча при переходе от одной опорной плос- плоскости ОП1 к другой ОП2 в параксиальном приближении будет линейным, т. е. для любой пары опорных плоскостей оно имеет вид у2=Ау1+ВУ1, У2 Это преобразование можно записать в матричной форме: У2 = А В ОП Опорные плоскости можно выбирать в разных местах оптической системы. Для данной пары плоскостей ОП1 и ОП2 преобразование параметров любого паракси- параксиального луча описывается одной и той же матрицей, сопоставляемой промежутку между ОП1 и ОП2. Ее элементы А9 В, С и й зависят от свойств этого промежутка, т.е. от того, какие преломляющие поверхности и какие среды находятся между О^ и ОП2. Матрица, описывающая преобразование лучей всей оптической системой, получается перемножением матриц, сопоставляемых отдельным промежуткам. Для исчерпывающего исследования поведения параксиального луча в центри- центрированной оптической системе достаточно получить матрицы преобразования для трех основных элементов: оптического промежутка (т.е. участка однородной среды), преломляющей и отражающей поверхностей. Оптический промежуток между ОП1 и ОП2 (рис. 7.7) характеризуется толщиной / и пока- показателем преломления п. Преобразование пара- параметра у находится из рис. 7.7: у2 = у х + И%ах. В параксиальном приближении углы наклона лучей считаются малыми. Тогда у2 « у{ + 1ах (при ах < 0,1, т.е. ах < 6°, погрешность не Рис. 7.7. К выводу матрицы преобразо- превышает 1%). Переходя от а, к Уи мо- вания параметров луча для оптического / ч промежутка жем написать у2ъух + A/п)пах = ух + ЬУХ, где Ь = 1/п — приведенная толщина оптичес- оптического промежутка. Наклон луча при переходе от ОП1 к ОП2 не изменяется, поэтому ^2 = 1^. Таким образом, преобразование параметров луча оптическим промежутком можно описать с помощью следующей матрицы ^7 G.15) Сферическая преломляющая поверхность, разделяющая две среды с показателя- показателями преломления пх и п2 (рис. 7.8), характеризуется радиусом кривизны /?. Что- Чтобы одни и те же формулы были справедливы и для выпуклой и для вогнутой поверхностей, значение К считают положительным, если центр кривизны лежит на оси 1 справа от границы, и отрицательным в противном случае. Для нахо- нахождения матрицы преломления выберем опорные плоскости ОП1 и ОП2 по обе
7.2. Центрированные оптические системы 321 стороны в непосредственной близости от преломляющей поверхности. Расстоя- Расстояние между ними КA — со§Р) &КE2/2 в параксиальном приближении пренебре- пренебрежимо мало. Поэтому можно считать, что луч пересекает их на одном и том же расстоянии от оси, т.е. у2&ух. Чтобы найти, как преобразуется параметр У = па, воспользуемся законом преломления пх $твх = л28т02, что для параксиальных лу- лучей сводится кп^! = п2в2' По теореме о внеш- внешнем угле треугольника можно написать (см. рис. 7.8) 6Х = ах + /?, в2 = «2 + Р- Умножая пер- первое из этих равенств на Лр второе на п2 и применяя закон преломления пхвх = л202, находим п2а2 =пхах +Р(пх -л2). Подставляя Рис. 7.8. К выводу матрицы преобразова- сюда поао = У~9 п,а, =Уи р =у,/К9 получа- ния параметров луча при преломлении ^ ^ * 1 1 1 Т7 Т7 на сферической поверхности ем закон преобразования параметра У: У2 = * г г = Ух-ух(п2-пх)/К или У2 = У\-РУ\> гДе введена величина Р = (л2 —пх)/К, назьгоаемая оптической силой преломляющей поверхности. Вместе с у2 =ух это дает закон преобразования параметров луча при преломлении, описываемый с помощью матрицы преломления 01\ G.16) В частном случае плоской поверхности К —> оо, Р = 0 и преломление описывается единичной матрицей, что заранее очевидно, так как при этом, по закону преломления, л2а2 =пха2,т.е. У2 = УХ. Чтобы включить в рассмотрение отражающие поверхности (плоские и сфери- сферические), вводят следующее правило: когда луч распространяется в отрицательном направлении оси г9 показатель преломления среды, через которую он проходит, считается отрицательным (—л). Тогда закон отражения в2 = —6Х формально мож- можно рассматривать как частный случай закона преломления при п2 = —пх. Матри- Матрица преобразования параметров луча при отражении от сферической поверхности имеет точно такой же вид G.16), как и матрица преломления, если в выражении для оптической силы Р заменить л2 на — пх: Р = —2пх/К. Для выпуклого зерка- зеркала К > 0 и оптическая сила отрицательна (Р < 0), для вогнутого — положитель- положительна (Р > 0). Толщина оптического промежутка / = г2 — %\ между опорными плоскостями I = 1Х и г = г2 положительна при г2 > гх и отрицательна при 12 < гх, т.е. / < 0 для лучей, распространяющихся влево. Так как для таких лучей и показатель пре- преломления нужно считать отрицательным, приведенная толщина ^ = 1/п будет поло- положительной. Поэтому матрица ^"G.15) для оптического промежутка не зависит от направления лучей. Параметры луча на выходе сложной оптической системы могут быть выражены через параметры входного луча путем последовательного применения преобразо- преобразований этих параметров ее отдельными элементами. Рассмотрим в качестве примера линзу, т.е. однородную среду с показателем преломления л (стекло), ограниченную 11 Зак 4498
322 7. Геометрическая оптика оп, сферическими поверхностями с радиусами кривизны ^ и^ (рис. 7.9). Расстояние между поверхностями вдоль оптической оси равно / (толщина линзы). Обозначим: К^у^У^) — пара- параметры некоторого луча на ОП1 (перед входом в линзу), К2 — на ОП2 (после преломления на первой поверхности), К^ — на ОП3 (после прохождения оптического промежутка приве- приведенной толщины Ь = 1/п), К4(у4, У4) — на ОП4 (после пре- преломления на задней поверхности). Пусть &~— матрица опти- _ _Л ~ ческого промежутка G.15), а ^?, и 01~, — матрицы преломле- Рис. 7.9. Толстая линза г •* ч ' 1 1 г г ния G.16) для первой и второй поверхностей соответственно. В них Р^ = (п — 1)/#р Р2 = A — п)/К2 (считаем, что линзу окружает среда с показателем преломления п0 = 1). Очевидно, что Таким образом, матрица *Л( преобразования луча в сложной системе равна произведению матриц для ее отдельных элементов, взятых в обратном порядке: ^Ж— @12&~01у Выполняя перемножение, находим р2-р1р2) \- GЛ8) В частном случае тонкой линзы, когда толщину оптического промежутка / между преломляющими поверхностями можно считать пренебрежимо малой (Ь —> 0), мат- матрица (Г вырождается в единичную и полная матрица ЛС имеет такой же вид, как и матрица 01 преломления на одной поверхности G.16), но с оптической силой G.19) Этим способом можно найти полную матрицу ^ преобразования параметров па- параксиального луча для произвольной центрированной оптической системы, если из- известны кривизна и взаимное расположение ее преломляющих и отражающих поверх- поверхностей и значения показателей преломления. Введем обозначения А, В, С и й для ее элементов: G.20) Рассмотрим луч, входящий в оптическую систему параллельно оптической оси на некоторой высоте у ^ (рис. 7.10). Для такого луча ах = 0 и, следовательно, Ух = 0. На выходе из системы луч имеет параметры у2 = Ау ^ и У2 = Су х. Угол его наклона к оп- оптической оси а2 = У2/п2, поэтому луч (или его продолжение) пересечет оптическую ось в точке Р2, отстоящей от последней преломляющей поверхности ОП2 на рас- расстояние г2 = -у2/а2 = -п2у2/У2. Подставляя сюда у2иУ2, получаем г2 = -п2А/С. Расстояние г2 не зависит от у^9 т.е. все лучи, входящие в систему параллельно опти- оптической оси, проходят (в параксиальном приближении) через одну и ту же точку Р2, называемую задней фокальной точкой или задним главным фокусом оптической системы.
7.2. Центрированные оптические системы 323 ОП1 оп2 Пересечение продолжений входящего параллельно оптической оси луча и вы- выходящего луча происходит в задней главной плоскости Н2. Определим фо- фокусное расстояние /2 как смеще- смещение вдоль оси от #2 Д° ^2* Т°г~ да /2 = ~У\/а2 = -п2ух/У2 (см. рис. 7.10). Подставляя У2 — Сух, получаем /2 = —п2/С, т. е. фокус- фокусное расстояние определяется эле- элементом С матрицы ^ оптической системы G.20). Чтобы найти положение перед- передней фокальной точки Рх, рассмот- рассмотрим луч, идущий через нее под / Ог> Рис. 7.10. К нахождению кардинальных точек некоторым углом ах. На выходе оптической системы из системы он должен быть па- параллелен оптической оси, т. е. для него У2 = 0. Поэтому У^ = Су\ + ИУХ =0. Подставив сюда Ух=пха[, найдем ух = —Опхах/С. Из рис. 7.10 видно, что гх = —у\/а\ = пхО/С. Мы получили, что расстояние 1Х не зависит от а[, т.е. все лучи из Рх после прохождения через систему будут параллельны оптической оси. Рассматривая продолжения падающего и выхо- выходящего лучей, определяем положение передней главной плоскости Нх и переднее фокусное расстояние, отсчитываемое от Я! до Рх равно /х = пх/С (при этом учте- учтено, что для матрицы ^, образованной произведением любого числа матриц 01 и ^ йеХЛ? = Аи — ВС = 1). Когда показатели преломления сред по обе стороны от сис- системы одинаковы (пх = п2), ее переднее и заднее фокусные расстояния равны по модулю, но противоположны по знаку: /2 = — /х. Фокусы Рх и Р2 и точки пересечения главных плоскостей Нх и Н2 с оптиче- оптической осью называются кардинальными точками оптической системы. Их положе- положение полностью определяет преобразование любого параксиального луча оптической системой. Если известно положение кардинальных точек, можно построить выходя- выходящий из системы луч, не рассматривая реального хода лучей в системе. Для удобства нахождения кардинальных точек по известным элементам матрицы ЛС оптической системы полученные выше результаты сведены в табл. 7.1. Таблица 7.1. Кардинальные точки оптической системы Расстояние ОЩ-РХ Нх-Рх оп,-//. ОП2-^2 Н2-Р2 ОП2-Н2 Общий случай л, О/С /, =пх/С «,(О-1)/С -п2А/С /2 = -пг/С п2(\-А)/С При П| = п2 = 1 О/С /1 = 1/С (О - 1)/С -А/С /2 = -1/С A-Л)/С
324 7. Геометрическая оптика Фокусное расстояние оптической системы полностью определяется элемен- элементом С матрицы преобразования лучей: /2 = — 1/С (при пх = п2 = 1). Как и у тон- тонкой линзы, этот элемент, взятый с противоположным знаком, называется оптиче- оптической силой системы: Р = —С. Для толстой линзы, как видно из матрицы G.18), р = рх + Р2 - РХР2Ь. Подставляя выражения для Рр Р2 и Ь, находим 1 (п-1)Г пК\К2 G.21) При Рис. 7.11. Расположение главных плоскостей для толстых линз > 0 линза называется собирающей, при Р < О — рассеивающей. Ис- Используя диагональные элементы А и й матрицы Л6 G.18), по формулам табл. 7.1. легко найти положение главных плоско- плоскостей толстой линзы. На рис. 7.11 показа- показаны главные плоскости некоторых типичных линз. До сих пор мы рассматривали матри- матрицу ЛС G.20) преобразования параметров лучей между передней (ОП^ и зад- задней (ОП2) преломляющими поверхностями оптической системы. Теперь легко получить матрицу ЛСН преобразования луча меж- между двумя главными плоскостями Нх и Н2: 1 °). с1'П Ч Таким образом, матрица *МН преобразования между двумя главными плоскостями произвольной центрированной системы совпадает с матрицей ш для тонкой линзы, имеющей оптическую силу Р = —С. Любой луч, падающий на Нх, выйдет из Н2 на той же высоте, так как У2=У\- Совершенно аналогично можно получить матрицу Лг преобразования луча меж- между двумя фокальными плоскостями, проходящими через Г{ и Г2: где 9ГХ — матрица G.15) оптического промежутка толщиной Ьх = A - О)/С от Н{ до ОПр &~2 — от ^Г12 до Н2 с ^2 = A — О2)/С. Перемножая атрицы и учитывая, что ёе1^ = АО — ВС = 1, получаем G.22) @ ~1/С\ = ( ° 72 ,С 0 ) 1-1//2 0; G.23) Эта матрица показывает, что все параллельные лучи, пересекающие переднюю фокальную плоскость на разной высоте, пересекут заднюю фокальную плоскость в одной точке, высота у2 которой зависит только от наклона ах падающих лучей (у2 = /2У\ = 1гп\а\) и не зависит от ^1 (Рис 7.12,а). Если же лучи идут из одной точки ;у| передней фокальной плоскости под разными углами а1? то заднюю плос- плоскость все они пересекут под одним и тем же углом а2 = -ух/(/2п2) (Рис- 7.12,6).
7.2. Центрированные оптические системы 325 а) б) Рис. 7.12. Преобразование параксиальных лучей между фокальными плоскостями Используя матрицу ЛСИ или ЛСР, не представляет труда найти матрицу ЛСаЬ преобразования луча между произвольными плоскостями ОПД и ОП^ (рис. 7.13). Пусть а — расстояние от Нх до Опа {а < О, если ОИа слева от Нх), Ъ — от #2 до ОП^. Иногда бывает удобно определять положение ОИа и ОП^ относительно фо- фокальных точек Рх и Р2, вводя расстояние гх от /^ до ОПЛ (гх = а — /х) и г2 от ^2 до ОП^ (г 2 = Ь — /2). Считая, что оптическую систему окружает среда с показате- показателем преломления пх = п2 = 1, получаем '\-ЪЦг -а <-гг112 G.24) Пусть расстояния а и Ь (или г( и г2) выбраны так, что правый верхний элемент матрицы ^аЬ равен нулю, т. е. _1 1-1. а+Ь~/2" ИЛИ G.25) Тогда у 2 = A - Ь//2)У1- Это значит, что все лучи, выходящие под любым углом ах из точки О с координатой ух на плоскости ОПД, пройдут через одну и ту же точ- точку О' с координатой у2 на плоскости ОП^, т.е. гомоцентрический пучок параксиаль- параксиальных лучей, идущих из О, на выходе из системы будет гомоцентрическим и образует в точке О1 стигматическое изображение точки О. Так как для любой точки на плоскости ОПд существует сопряженная точка на ОП^, оптическая система отоб- а| 0>Ь #1 оп„ \-Уг ражает плоскость ОПа на ОП^ с увели- увеличением у = у2/у! = 1 — Ь//2 = Ъ/а. По- Положение сопряженных плоскостей связа- связано основным соотношением G.25). При перемещении плоскости ОПД на расстояние Аа сопряженная с ней плос- плоскость ОП^ перемещается на некоторое расстояние АЪ, которое можно рассматри- рассматривать как длину изображения отрезка Аа, параллельного оптической оси. При малом Аа из G.25) получаем следующее со- соотношение: Аа/а2 = АЬ/Ь2. Отсюда продольное увеличение /3 = АЬ/Аа = (Ь/аJ. Оно всегда положительно, т.е. АЬ и Аа совпадают по направлению. Продольное увеличение равно квадрату поперечного ф = у2), поэтому изображение простран- Рис. 7.13. Образование изображения в оптической системе
326 7. Геометрическая оптика ственного предмета сохраняет геометрическое подобие с предметом только при |у| = 1. Такое изображение (в натуральную величину) получается, если а = —Ь9 т.е., как видно из G.25), при а = — 2/2, и расположено при Ь = 2/2. Изображение при этом перевернуто, так как у = — 1. Если нижний левый элемент С матрицы ^С G.20) преобразования лучей оптиче- оптической системой обращается в нуль, то (см. табл. 7.1) фокальные точки лежат в бес- бесконечности. Такая система называется телескопической или афокальной. Приме- Примером может служить зрительная труба, установленная на бесконечность, когда зад- задняя фокальная плоскость объектива совмещена с передней фокальной плоскостью окуляра. При С = 0 наклон выходящего луча а2 — Оах не зависит от ух, т.е. все лучи, падающие на систему параллельно друг другу, дадут на выходе также па- параллельный пучок лучей. Отношение углов наклона выходящих и входящих лучей а2/ах = В характеризует угловое увеличение телескопической системы. Оно опре- определяется элементом /) матрицы ЛС. Угловое увеличение зрительной трубы пока- показывает, во сколько раз угол, под которым бесконечно удаленный предмет виден в трубу, больше угла, под которым этот предмет был бы виден невооруженным глазом. Рассмотрим теперь преобразование гомоцентрического пучка параксиальных лучей, идущих из некоторой точки Ох на оптической оси системы (рис. 7.14). Соответству- Соответствующие такому пучку волновые поверхности представляют собой сферы с центрами в Ор Для любой опорной плоскости ОП отношение высоты у луча к углу наклона а одинаково у всех лучей пучка и равно радиусу кривизны г волновой поверхности в том месте, где она пересекает ОП: г = у/а. Поэтому весь пучок лучей можно характе- характеризовать на ОП одним параметром, в качестве кото- которого удобно использовать приведенное значение ради- радиуса кривизны волновой поверхности К = г/п = у/У. Когда пучок пересекает плоскую границу раздела двух сред, значение /? остается неизменным, так как у каж- каждого луча при пересечении границы параметры у и V = па остаются прежними. Значение К для пуч- пучка изменяется при пересечении сферической границы и при прохождении оптичес- оптического промежутка однородной среды. Изменение параметра /? легко выразить через элементы матрицы ЛК G.20) преобразования луча в оптической системе. Так как Рис. 7.14. Гомоцентрический пучок лучей Я2 = _У2 _ АУх+ВУх __ А(ух/Ух) G.26) Соотношение G.26), называемое правилом АВСО, позволяет вычислить приве- приведенный радиус кривизны волновой поверхности с центром на оптической оси при переходе от одной ОП к другой. Например, при прохождении оптичес- оптического промежутка приведенной толщины ^ = 1/п, когда ^# совпадает с матри- матрицей ^"G.15), из G.26) найдем К2= Кх+ Ь. При преломлении пучка в тонкой линзе с оптической силой Р, когда преобразование лучей описывается матри-
7.2. Центрированные оптические системы 327 цей 01 G.16), правило АВСй дает К2 = К{/A - РК{) или 1/Я2 = \/К{ - Р — кри- кривизна волновой поверхности уменьшается на величину, равную оптической силе линзы. Замечательно, что простое правило АВСВ применимо и для описания гауссовых пучков (см. п. 6.4) при их распространении в центрированных оптических систе- системах и тем самым дает удобный способ решения разнообразных задач, связанных с фокусировкой лазерного излучения. Гауссов пучок, пересекающий расположен- расположенную в некоторой точке г опорную плоскость, характеризуется двумя параметра- параметрами: радиусом кривизны волновой поверхности К{г) и радиусом поперечного се- сечения ю(г). Изменение этих параметров при распространении пучка в свободном пространстве описывается формулами F.33). При прохождении через тонкую линзу ширина ю(т.) пучка остается прежней, а кривизна волновой поверхности в соответ- соответствии с формулой F.35) уменьшается на величину, равную оптической силе линзы: Чтобы следить сразу за изменением обоих параметров Кию при распространении гауссова пучка через оптическую систему, вводят следующую их комбинацию д(г), называемую комплексным радиусом кривизны: +А -=*+А- Именно такая величина стоит множителем при (х2 + у2)/2 в выражении F.32) для напряженности поля в гауссовом пучке. Вещественная часть 1/# равна кривизне волновой поверхности \/К, а мнимая часть пропорциональна 1/ю2 и, следователь- следовательно, характеризует ширину пучка. Используя формулы F.33), легко убедиться, что Я = % + *> где <?0 = к\юу(И) — значение д(г) при г = 0 (перетяжка пучка). По- Поэтому при распространении пучка в свободном пространстве или через оптический промежуток приведенной толщины ^ = 1/п преобразование параметра д происходит по формуле ^2 = Я\+ Ь (точно так же, как для вещественных К по правилу АВСй). При преломлении на сферической границе раздела (или в тонкой линзе) ширина пуч- пучка не изменяется, и поэтому ш2 = ш15т.е. преобразование не затрагивает мнимой части параметра д. И здесь для комплексного <? формула преобразования в точно- точности такая же, как и для вещественного К: 1/#2 = ^1Ч\ —?• Отсюда следует, что при прохождении гауссова пучка через произвольную центрированную оптическую систему, преобразование параметров параксиального луча в которой дается матри- матрицей ^, изменение комплексного радиуса кривизны д можно находить с помощью того же правила АВСО, что и для вещественного К: Здесь параметр д2 на выходе из системы выражается через параметр ^ на входе и элементы матрицы <Ж. Применим эти результаты для нахождения положения перетяжки и ее радиуса после прохождения гауссова пучка через тонкую линзу (рис. 7.15). Выберем
328 7. Геометрическая оптика ОП Рис. 7.15. Преобразование гауссова пучка при прохождении через линзу в перетяжке исходного пучка, ОП2 — в перетяжке преобразованного. Их положения будем определять рассто- расстояниями хх и х2 от передней /^ и зад- задней Р2 фокальных точек линзы соот- соответственно. Матрица ЛС преобразова- преобразования лучей от ОП1 до ОП2 получается перемножением двух ^матриц G.15) для оптических промежутков и *ЖР- матрицы G.23) преобразования меж- между фокальными плоскостями линзы: О -1// О -!// х{// G.29) В перетяжках пучков волновые поверхности плоские (#р#2 —» оо), поэтому пара- параметр д на ОП! и ОП2 чисто мнимый. Его модуль пропорционален квадрату радиуса перетяжки ю1: Здесь ^01 и ^02 — радиусы дифракционной расходимости исходного и преобразо- преобразованного пучков. Применяя правило АВСО G.28) с элементами матрицы *Ж G.29), получаем _ !2хх^х\х2^г\ ^01 Приравнивая отдельно вещественные и мнимые части, получаем две формулы, по ко- которым параметры х2 и г02 = кю^2/2, определяющие положение и радиус перетяжки преобразованного пучка, выражаются через соответствующие параметры исходного пучка и фокусное расстояние линзы: G.30) 4г В частности, при /2 = х\ + г^ формулы G.30) дают г02 = г01 и ;с2 = -;ср т.е. пос- после прохождения через линзу с таким фокусным расстоянием воспроизводится гео- геометрия исходного гауссова пучка. Контрольные вопросы • Какие лучи называют параксиальными? Какими параметрами задают луч на опорной плос- плоскости? Приведите вид матриц преобразования параметров луча, сопоставляемых: 1) опти- оптическому промежутку; 2) сферической преломляющей поверхности; 3) отражающей поверх- поверхности; 4) тонкой линзе.
7.3. Ограничение световых пучков 329 Какими свойствами обладают фокальные точки оптической системы? Что такое главные плоскости? Как можно найти преобразование параксиального луча в оптической системе, если известно положение ее кардинальных точек? Что такое сопряженные плоскости? Как найти в пространстве изображений плоскость, сопряженную с определенной плоскостью в пространстве предметов? Какие условия должны выполняться для того, чтобы создаваемое оптической системой изображение трехмерного предмета было геометрически подобно самому предмету? Как в оптической системе изменение радиуса кривизны волновой поверхности выражается через элементы матрицы ЛС преобразования луча? Какими параметрами характеризуется гауссов пучок? Что такое комплексный радиус кри- кривизны? Как он преобразуется при прохождении пучка через оптическую систему? 7.3. Ограничение световых пучков в оптических системах В оптических инструментах обычно требуется получить изображение некоторого предмета на какой-либо поверхности, чаще всего на плоскости, перпендикулярной оптической оси (например, на фотопластинке в фотоаппарате). Предмет же в боль- большинстве случаев бывает пространственным, а не плоским. Однако даже идеальная оптическая система (центрированная система в параксиальном приближении) дает на некоторой плоскости Р1 рез- резкое изображение лишь тех точек предме- предмета, которые лежат в сопряженной с ней плоскости Р (точка А на рис. 7.16). По- Положение этой плоскости установки (или плоскости наводки) определяется формулой G.25). Когда точка предмета не ттежит и пттогкпгти ™>тянгттт ер ичоб ^ 7Л6'К зависимости глубины резкости от огра- не лежит в плоскости установки, ее изоО- ничения световых пучков в оптической системе ражение получается в виде кружка рас- рассеяния. Размер кружка, соответствующе- соответствующего изображению точки В в плоскости Р\ как видно из рис. 7.16, зависит от смеще- смещения В из плоскости установки Р (или от смещения В' из сопряженной с Р плоскос- плоскости Р')9 а также от угловой ширины реального пучка лучей, формирующих изобра- изображение. Эта ширина определяется ограничивающей пучок диафрагмой й или краями линзы. Ниже мы увидим, что ограничение реальных световых пучков в оптических системах играет доминирующую роль во всех вопросах, касающихся отображения. Для получения удовлетворительного изображения размер кружка рассеяния не должен превышать определенного предела. Этим объясняется существование неко- некоторой глубины пространства, резко отображаемого на плоскости. Очевидно, что глу- глубина резкости возрастает при уменьшении диаметра диафрагмы. Ограничение пучков в оптических системах в общем случае осуществляется по- разному для лучей, исходящих из разных точек предмета. Диафрагма, которая огра- ограничивает пучок лучей, формирующий изображение расположенной на оси системы
330 7. Геометрическая оптика точки предмета, называется апертур- апертурной или действующей. Ее роль может выполнять оправа какой-либо линзы или специальная диафрагма, располо- расположенная либо между линзами, либо пе- перед системой или после нее. Изоб- Изображение апертурной диафрагмы (дей- (действительное или мнимое), создавае- создаваемое находящейся перед ней частью оптической системы, называется вход- Рис. 7.17. Апертурная диафрагма (Я), входной фх) тачкам а и-юбпажение стла- и выходной (/у зрачки оптической системы ньш 3Рачком> а изооражение, созда ваемое расположенными за диафраг- диафрагмой оптическими элементами, — вы- выходным зрачком (рис. 7.17). Входным зрачком определяется апертура — угол рас- раскрытия пучка лучей, идущего из точки предмета Р через систему. В телескопах и зрительных трубах (см. рис. 7.19) апертурной диафрагмой обычно служит край объектива. Так как никаких линз перед ним нет, то он будет одно- одновременно и входным зрачком, а выходным будет изображение оправы объектива, создаваемое окуляром. Плоские изображения пространственно протяженных предметов всегда передают геометри- геометрическую перспективу (определенное соотношение между размерами изображений предметов, лежащих на различном удалении). Например, на фотоснимке получается центральная проек- проекция фотографируемых предметов с центром проекции в середине объектива, так как идущие через центр линзы лучи не отклоняются. Для получения правильного пространственного впе- впечатления при рассматривании фотоснимка нужно, чтобы видимые глазом угловые размеры изображений предметов были такими же, как и при непосредственном наблюдении. Это усло- условие выполняется, если рассматривать снимок одним глазом с такого расстояния, на каком (от пластинки) находился объектив при фотографировании. Для и-кратно увеличенных по сравнению с негативом фотоснимков это расстояние также следует увеличить в п раз. В боль- большой аудитории (кинозал) такое условие выполняется для немногих мест. При рассматривании с неправильного расстояния фотография создает пространственное впечатление с искаженной перспективой: при слишком большом расстоянии глубина снимка кажется увеличенной, а при слишком малом — уменьшенной. Искажение перспективы заметно и при непосредственном наблюдении в зрительную трубу или бинокль: при сильном увеличении все предметы и рас- расстояния кажутся укороченными в глубину. Еще большее впечатление производит обратный опыт: если смотреть в бинокль, направив на предмет не объектив, а окуляр, то протяженность предмета в глубину кажется сильно преувеличенной. Ограничение световых пучков оказывает решающее влияние не только на глубину про- пространства, резко изображаемого на плоскости, но и на характер передаваемой этим изображе- изображением перспективы. В общем случае перспектива определяется положением входного зрачка системы, ибо именно он служит центром проекции предмета на плоскость наводки. Проиллю- Проиллюстрируем это следующим примером. Пусть с помощью тонкой линзы на плоском экране соз- создается изображение одинаковых предметов А и В (рис. 7.18), находящихся на разных рассто- расстояниях. Если апертурная диафрагма О расположена рядом с линзой (см. рис. 7.18, а), ее изоб- изображение будет практически в том же месте, т. е. диафрагма служит одновременно и входным зрачком. Осевые лучи всех пучков, формирующих изображения предметов А и В, пересекают- пересекаются в центре входного зрачка. На плоскости экрана изображение близкого предмета А крупнее, чем изображение такого же, но более удаленного предмета В (нормальная перспектива).
7.3. Ограничение световых пучков 331 а) Когда апертурная диафрагма О расположена вблизи фокальной точки линзы (см. рис. 7.18,6), изображение диафрагмы в пространстве предметов удалено в бесконечность: через центр диафрагмы пройдут те лучи, которые до линзы шли па- параллельно оптической оси. Главные лучи (через центр диафрагмы) дей- действующих световых пучков, форми- формирующих изображения предметов А и В, перед линзой направлены па- параллельно оптической оси. Поэто- Поэтому на экране изображения предме- предметов А и В, лежащих на разных расстояниях, имеют одинаковые раз- размеры (телецентрическая перспекти- перспектива). Изменение расстояния до пред- предмета влияет в этом случае только на резкость изображения, но не на его размеры. Такая перспектива при- применяется в измерительных микро- микроскопах. Еще необычнее случай, когда апертурная диафрагма Э располо- расположена за фокусом (см. рис. 7.18, в). Ее изображение О{ (входной зра- зрачок, служащий центром проекции) лежит перед предметом. Изображе- Изображение на экране близкого предмета А имеет меньший размер, чем изобра- изображение такого же удаленного пред- Рис. 7.18. Влияние положения апертурной диафрагмы В мета В. Перспектива получается об- оптической системы на характер перспективы: нормаль- ращенной (гиперцентрической). ная <<* ^^^^^{^^^^ч^тя (в) От апертурной диафрагмы зави- зависит не только глубина резкости и ха- характер передаваемой перспективы, но и энергия света, проходящего через систему, т. е. фото- фотометрические характеристики изображения (см. п. 7.5). Кроме апертурной диафрагмы, ограничивающей действующие пучки света от ле- лежащих на оптической оси точек предмета, в оптической системе существует диа- диафрагма поля зрения. Поясним ее роль следующей аналогией: при наблюдении нево- невооруженным глазом через окно поле зрения ограничено рамой окна. Диафрагма поля зрения определяет ту часть поверхности протяженного предмета, которая отобра- отображается прибором. Рассмотрим этот вопрос на примере астрономической зрительной трубы (телескопа-рефрактора). Обычно задняя фокальная плоскость объектива, где образуется действительное изображение удаленных предметов, совпадает с передней фокальной плоскостью окуляра, так что падающий на объектив параллельный пучок лучей идет из окуляра также параллельным (рис. 7.19, а). Апертурной диафрагмой и входным зрачком служит оправа объектива, выходным зрачком — ее изображение, создаваемое окуляром. Наклонные пучки лучей, идущие от не лежащих на оптиче- оптической оси точек предмета, частично или полностью срезаются краями окуляра. Край
332 7. Геометрическая оптика окуляра в этом случае служит диафрагмой поля зрения. Его изображение, созда- создаваемое объективом, расположено в пространстве предметов и называется входным окном (входным люком) системы (на рис. 7.19 он слева за пределами чертежа). Угол 2ю, под которым входной люк виден из центра входного зрачка, называется углом поля зрения. Из-за частичного срезания диафрагмой поля зрения (краями окуляра) наклонных пучков лучей от внеосевых точек предмета освещенность видимого глазом изобра- изображения удаленного протяженного предмета постепенно уменьшается к краям поля зрения. Такой эффект называется затенением или виньетированием. Виньетирова- Виньетирования не будет, когда входной люк лежит в плоскости предмета. В рассматриваемом примере зрительной трубы устранить виньетирование и сделать границы поля зре- зрения резкими можно, поместив диафрагму в фокальной плоскости объектива вблизи промежуточного изображения. Но лучше в этой плоскости поместить дополнитель- дополнительную линзу (см. рис. 7.19,6), называемую коллективом или полевой линзой. При правильном выборе фокусного расстояния полевой линзы ее оправа служит диа- диафрагмой поля зрения. Этим достигается одновременно и устранение виньетирования, и увеличение поля зрения. Апертура, определяемая диаметром объектива, и угловое увеличение трубы остаются прежними, изменяется лишь положение выходного зрач- зрачка. Практически полевую линзу располагают позади плоскости первичного изобра- изображения, чтобы сделать незаметными загрязнения и дефекты ее поверхности и чтобы в плоскость изображения можно было внести измерительную шкалу или крест нитей. XV / у \ б) '^, *- ™ ™ " ™ - -- ¦" 1 у. '. \ \ ^<^ \х^~-*<7?1 * * * *" *** -^~~~^ 1/^ЛТ* ^^/'^^ Рис. 7.19. Ограничение поля зрения оправой окуляра и связанное с этим затенение изображения (а) и применение полевой линзы для увеличения поля зрения (б) Понимание роли ограничения световых пучков совершенно необходимо при ис- использовании любых оптических приборов. Ограничение пучков определяет не только пропускаемый системой световой поток, но и такие характеристики, как поле зрения, глубина резкости, передаваемая изображением перспектива. Ограничение пучков для всех оптических приборов определяет и предельную (дифракционную) разрешающую способность (см. п. 7.6). Для телескопа это наименьшее угловое расстояние между воспринимаемыми раздельно удаленными точечными источниками, для микроско-
7.4. Аберрации оптических систем 333 па — наименьший различимый размер предмета, для спектрального аппарата — наименьшее регистрируемое различие длин волн и т. п. Контрольные вопросы • Что называется апертурной диафрагмой оптической системы? входным и выходным зрач- зрачками? В каком случае входной зрачок совпадает с апертурной диафрагмой? • С какого расстояния нужно рассматривать фотоснимок, чтобы получить правильное про- пространственное впечатление? • Как положение апертурной диафрагмы влияет на характер перспективы, получающейся на плоском изображении? • Что называется диафрагмой поля зрения, входным и выходным окнами оптической систе- системы? • Какую роль в оптической системе выполняет полевая линза (коллектив)? 7.4. Аберрации оптических систем До сих пор предполагалось, что все действующие лучи параксиальны и, следователь- следовательно, гомоцентрический пучок лучей, идущих из некоторой точки предмета, при про- прохождении через оптическую систему остается почти гомоцентрическим. В практиче- практической оптике условия применимости этой идеализации для реальных пучков лучей, участвующих в формировании изображения предмета, выполняются крайне редко. Нарушение гомоцентричности пучков приводит к появлению погрешностей (абер- (аберраций) изображения, создаваемого оптической системой. Если при преломлении или отражении пучок лучей перестает быть гомоцен- гомоцентрическим, нормальная к лучам волновая поверхность уже не будет сфериче- сферической. Как известно из дифферен- дифференциальной геометрии, для любой точки О произвольной гладкой поверхности (рис. 7.20) сущест- существует два взаимно перпендикуляр- перпендикулярных направления АОВ и СОй, которым соответствуют наимень- наименьшее ч наибольшее К2 значе- ния радиуса кривизны. Лучи, про- проходящие через точки А, О и В, пересекаются в центре кривиз- кривизны Ср лежащем на расстоянии тре С2 на расстоянии /?2. При К2 с, с2 Рис. 7.20. Астигматический пучок лучей от поверхности; лучи через С, О и ^ — в цен- ценЯ\ пучок лучей называется астигматическим. В отличие от гомоцентрического бесконечно узкий астигматический пучок дает два точечных изображения С\ и С2, удаленных друг от друга вдоль оси пучка на рас- расстояние /?2 ~ К\9 называемое астигматической разностью. В пучке конечной ши- ширины все лучи пересекаются на двух взаимно перпендикулярных фокальных отрез- отрезках, проходящих через С1 и С2 (см. рис. 7.20). Произвольный широкий пучок лучей
334 7. Геометрическая оптика можно разложить на элементарные астигматические пучки, каждому из которых со- соответствует пара фокальных точек С1 и С2. Множество фокальных точек образует двухлистную поверхность, называемую каустикой пучка лучей. Рассмотрим, например, преломление гомоцентрических пучков лучей от точечно- точечного источника 5 (рис. 7.21) на плоской границе раздела прозрачных сред. Получающи- Получающиеся в результате преломления пучки во второй среде будут астигматическими. На рис. 7.21 по- казаны два близких меридиональных луча 8МР и 5М<2. Их продолжения пересекаются в точ- точке Ср координаты которой зависят от угла па- дения и могут быть найдены с помощью закона преломления. Чтобы получить узкий простран- ^ « ственный пучок лучей, мысленно повернем ри- Рис. 7.21. Образование астигматических сунок на небольшой угол вокруг оси симмет- пучков при преломлении гомоцентри- 80 Точка с ПрОчертит при этом неболь- ческих пучков на границе раздела сред г 1 г г г шую дугу, перпендикулярную плоскости рисун- рисунка. Это будет меридиональная фокальная линия астигматического пучка. Вторая (са- (сагиттальная) фокальная линия представляет собой отрезок идущей через источник 5 нормали к границе раздела (вблизи С2 на рис. 7.21). С увеличением угла падения воз- возрастает астигматическая разность преломленного пучка, так как фокальная точка С1 перемещается по некоторой кривой 81СХ8". Поэтому при рассматривании предметов, находящихся, например, под водой, четкость изображения ухудшается из-за астигма- астигматизма пучков при отклонении направления наблюдения от нормали к поверхнос- поверхности. Каустика меридиональных лучей широкого преломленного пучка представляет собой воронкообразную поверхность, получающуюся при вращении кривой З'С^З" вокруг нормали 50. Каустика сагиттальных лучей вырождается в отрезок перпенди- перпендикуляра З'О. Дадим краткую характеристику основных видов геометрических аберраций опти- оптических систем. (сферическая аберрация. Пусть точечный источник 5 расположен на оптической оси собирающей линзы (рис. 7.22, а). Выходящие из 5 параксиальные лучи после преломления в линзе образуют изображение 5' на расстоянии Ь от линзы, ко- которое определяется формулой G.25). Но лучи, пересекающие линзу вблизи ее кра- а) ев, преломляются сильнее и сойдутся на о оптической оси в точке 8", которая ле- лежит ближе, чем 8'. Расстояние 8'8" на- называется продольной сферической абер- аберрацией. На совмещенном с 8' экране бу- Рис. 7.22. Сферическая аберрация простой лин- г «г? зы (а) и сложная линза из разных сортов стекла, дет наблюдаться светлый кружок. Его ра- исправленная на сферическую аберрацию (б) диус называется поперечной сферической аберрацией. Наиболее отчетливым изоб- изображение источника 5 будет тогда, когда экран помещен посередине между 8' и 5". У несимметричной линзы аберрация зависит от того, какой стороной линза обращена к источнику.
7.4. Аберрации оптических систем 335 Для заданной пары сопряженных точек сферическая аберрация может быть ис- исправлена выбором более сложной формы преломляющих поверхностей. Но на прак- практике для уменьшения сферической аберрации используют комбинацию собираю- собирающей и рассеивающей линз со сферическими преломляющими поверхностями (см. рис. 7.22, б). Метод основан на том, что рассеивающая линза обладает сферической аберрацией противоположного знака. Сферическую аберрацию удается устранить лишь для определенного расстояния до предмета. Для зрительных труб и обычных фотообъективов выбирают удаленный предмет, объективы микроскопов коррегируют для положения предмета непосредственно перед фокусом. Сферическую аберрацию создают не только сферические, но и плоские поверхности. Поэтому объективы ми- микроскопов коррегируют для вполне определенной толщины плоскопараллельных по- покровных стекол. Поверхностям зеркал телескопов-рефлекторов для устранения сфе- сферической аберрации придают форму параболоида вращения. Все остальные виды геометрических аберраций (в монохроматическом свете) по- появляются лишь при отображении точек предмета, не лежащих на оптической оси системы. Кома. Эта аберрация возникает при отображении внеосевых точек предмета широ- широкими пучками лучей. Лучи из точки <2, проходящие ближе к краям линзы, преломля- преломляются сильнее, чем требуется для их схожде- схождения в точку О1 пересечения параксиальных лучей (рис. 7.23), и образуют в плоскости па- параксиальных изображений кружки рассеяния, которые заполняют область между прямыми, выходящими из О!. Это схематически показа- показано в правой части рис. 7.23. Такое «изображе- «изображение» точки напоминает комету, чем и объяс- объясняется название «кома». Аберрация комы отсутствует у систем, удовлетворяющих условию синусов Аббе. Изображение протяженного предмета будет резким, если оптические длины лучей между всеми парами сопряженных точек предмета и его изображения одинаковы (см. задачу 2). Пусть небольшой предмет Р() длиной у расположен перпендикулярно оптической оси (рис. 7.24, а). Рассмотрим два параллельных луча, выходящих из Р и <2 под произвольным углом и к оптической оси. После преломления эти лучи пересекутся в точке С фокальной плоскости и пройдут через сопряженные с Р и <2 Рис. 7.23. К возникновению комы 8' Ч. Рис. 7.24. К выводу условия синусов (а) и апланатические точки при преломлении на сферической поверхности (б)
336 7. Геометрическая оптика точки Р1 и B'. Если предмет Р<2 мал, то лучи РР' и BB* и после преломления по- почти параллельны, т. е. можно считать, что они наклонены к оптической оси системы под одним и тем же углом и!. Проведем ортогональные к лучам волновые поверх- поверхности 0№ и B'Ы. Оптические длины всех лучей между ними одинаковы. Поэтому оптические длины лучей РР1 и <2(У будут равны при условии равенства оптических длин отрезков РМ и Р'М Пу 8111 и = п'у' 8111 и', G.31) где п и п! — показатели преломления сред со стороны предмета и изображения. Таким образом, для получения стигматических изображений малых участков поверх- поверхности, перпендикулярной оси, с помощью широких пучков синусы углов и и и! рас- раскрытия пучков должны удовлетворять условию G.31). Отображение, при котором выполнено условие синусов, принято называть апланатическим. Оптическая систе- система может дать апланатическое отображение только для определенных расстояний до предмета и изображения, на которые она рассчитана при изготовлении. Напри- Например, сопряженные апланатические точки Р и Р1 (см. рис. 7.24, б) для преломления на поверхности стеклянного шара радиусом К лежат на расстояниях пК и К/п от его центра (см. задачу 3). Это свойство шара используется в иммерсионных объек- объективах микроскопов, когда между покровным стеклом и передней линзой объектива вводится слой жидкости (иммерсия) с таким же, как у стекла, показателем прелом- преломления (кедровое масло). Передняя линза представляет собой стеклянное полушарие, плоской стороной обращенное к предмету, который помещается в точке Р на рас- расстоянии К/п от центра О (см. рис. 7.24, б). Благодаря иммерсии лучи не испытывают преломления на плоской границе, и Р будет апланатической точкой. Мнимое изобра- изображение предмета находится в сопряженной апланатической точке Р1 на расстоянии пК от центра О, Таким способом уменьшаются углы наклона лучей к оптической оси. Получение апланатического изображения, т. е. устранение сферической аберрации и комы, особенно существенно для микроскопов с большим увеличением, где исполь- используются максимально широкие апертуры (вплоть до теоретического предела 180°), что необходимо для достижения высокой разрешающей способности (см. п. 7.6). Астигматизм наклонных пучков и кривизна поля изображения. Даже узкие пучки лучей при прохождении через оптическую систему, как правило, утрачивают гомо- центричность и становятся астигматическими, если они составляют значительный угол с оптической осью. Такие пучки вместо одного фокуса дают две фокальные линии (см. рис. 7.20). Пусть центральный луч преломленного пучка лежит в мери- меридиональной плоскости (плоскости чертежа на рис. 7.25, а). Меридиональные лучи этого пучка пересекаются на фокальной линии С|, перпендикулярной плоскости чертежа. Сагиттальные (т.е. лежащие в перпендикулярной чертежу плоскости) лу- лучи пересекаются на фокальной линии С2, лежащей в плоскости чертежа. Расстояние между фокальными линиями (астигматическая разность) возрастает с увеличением угла наклона пучка. При отображении плоскости множество отрезков С| и С2, ко- которые можно рассматривать как «изображения» точек плоскости 5 меридиональны- меридиональными и сагиттальными лучами, образует две искривленные поверхности с симметрией вращения относительно оси системы, касающиеся друг друга в точке пересечения с оптической осью.
7.4. Аберрации оптических систем 337 Аберрация астигматизма ярко проявляется при получении изображения плоского объекта, имеющего форму «колеса со спицами» (см. рис. 7.25,6), центр которого ле- лежит на оптической оси. При перемещении плоского экрана А (см. рис. 7.25, а) вдоль оси можно получить резкое изображение определенной окружности, когда экран сов- совмещается с положением соответствующих меридиональных фокальных линий Сг Эти фокальные линии дают черточки изображения, ориентированные по дугам ок- окружности, и при наложении друг на друга образуют ее резкое изображение, в то время как изображения радиусов («спиц») окажутся размытыми. Если же плоскость экрана совпадает с положением вытянутых вдоль радиусов фокальных линий С2 для сагиттальных лучей, на изображении будут резкими соответствующие участки «спиц», а окружности будут размыты. Подбирая комбинацию линз из разных сортов стекла и с разной кривизной пре- преломляющих поверхностей, можно приблизительно совместить поверхности мериди- меридиональных и сагиттальных фокальных линий (т.е. уменьшить астигматизм) и одно- одновременно до некоторой степени выпрямить их, т.е. сделать поле изображения до- достаточно плоским. Это особенно важно для фотообъективов, которые должны давать резкое изображение на плоской поверхности. Исправленные на астигматизм системы называют анастигматами. Астигматизм пучков, параллельных оптической оси, возникает при нарушении осевой симметрии системы, например когда кривизна преломляющей поверхности неодинакова в различных сечениях. Таким астигматизмом нередко обладает челове- человеческий глаз, что проявляется в неспособности видеть одинаково резко взаимно пер- перпендикулярные полосы на испытательных таблицах. Для коррекции этого недостатка применяют очки с цилиндрическими линзами. Рис. 7.25. Астигматизм наклонных пучков и кривизна поля изображения (а) и объект для испытания линз на астигматизм (б) Рис 7.26. Дисторсия изображения при разных положениях диафрагмы. Справа показаны изображения квадрата Дисторсия. В отличие от рассмотренных выше аберраций, ухудшающих резкость изображения, в оптических системах возможно искажение (дисторсия) геометриче- геометрической формы изображения протяженного предмета. Если линейное увеличение растет
338 7. Геометрическая оптика по мере удаления от оптической оси к краям поля зрения, изображение квадрата приобретает вид «подушки» (рис. 7.26, а). Так бывает при расположении ограничи- ограничивающей пучки диафрагмы позади линзы. Если диафрагма находится перед линзой, увеличение по краям поля зрения меньше, чем в центре, и изображение квадрата приобретает вид «бочки» (рис. 7.26, б). В системе двух линз при расположении диа- диафрагмы между линзами можно добиться почти полного уничтожения дисторсии, так как подушкообразная дисторсия, создаваемая первой линзой, компенсируется бочко- бочкообразной дисторсией второй линзы. В телескопах и приборах для визуальных наблюдений дисторсия не имеет боль- большого значения, так как она не влияет на резкость изображения. Но в фотообъективах (особенно для аэрофотосъемки) и в приборах для геодезических измерений дистор- дисторсия вредна и должна быть по возможности исправлена. Хроматическая аберрация. Все оптические стекла обладают дисперсией, и пото- потому угол отклонения луча при преломлении в линзе зависит от длины волны. При использовании белого света оптическая система создает множество монохроматиче- монохроматических изображений, которые не совпадают ни по положению, ни по размерам. В ре- результате их наложения изображение предмета получается нерезким и с окрашенными краями. Это явление называется хроматической аберрацией. Для уменьшения хроматической аберрации используют комбинации собирающих и рассеивающих линз из сортов стекла с различающейся дисперсией. Устранить ее для всего спектра невозможно. *) Обычно стремятся совместить изображения для каких-либо двух длин волн, выбор которых определяется назначением оптической системы. В приборах для визуальных наблюдений ахроматизацию производят для фраунгоферовых спектральных линий Р {ХР = 480 нм) и С (Ас = 656 нм), при этом во всей видимой части спектра аберрация будет значительно ослаблена. х ассмотрим способы ахроматизации тонких линз, ограничиваясь параксиальным приближением. Согласно формуле G.19), для линзы с определенными значениями радиусов кривизны К1 и К2 произведение (п- 1)/ не зависит от длины волны. Отсюда легко выразить изменение 8/ ее фокусного расстояния при изменении 8п показателя преломления п: 8/ 8п / л-Г Для характеристики разных сортов стекла вводят величину G.32) А='^ 7' G-33) по - 1 где пР, пс и по — показатели преломления для Р-, С- и ^-линий Фраунгофера (Хо = 589 нм). У флинта Д « 1/30, у крона А « 1/60. Полагая 8п = пс — пР, п « по, формулу G.32) можем записать в виде Ц-=А. G.34) + ) Полностью свободны от хроматической аберрации зеркальные системы (телескоп-рефлектор), так как лучи всех длин волн отражаются одинаково.
7.4. Аберрации оптических систем 339 Фокусное расстояние системы из двух тонких линз, находящихся на расстоянии / друг от друга, в соответствии с G.18) определяется выражением / /, /2 /./2 Отсюда следует, что для ахроматизации фокусного расстояния системы (8/ = 0) должно выполняться условие /Г . которому с помощью G.34) можно придать вид G.35) Возможный способ ахроматизации состоит в использовании двух соприкасающих- соприкасающихся тонких линз, одна из которых сделана из крона, другая — из флинта. В этом случае / = 0 и из G.35) /2Д1 -I- /1Д2 = 0. Так как для всех сортов стекла Д > 0, то фокусные расстояния /1 и /2 должны иметь противоположные знаки. Если задано общее фокусное расстояние /, то для данных сортов стекла фокусные расстояния /1 и /2 определяются однозначно: 1,1 *2 1 1 *1 Чтобы общее фокусное расстояние / было положительно, собирающая линза должна изготовляться из крона, рассеивающая — из флинта (рис. 7.27). Так как /1 и /2 зависят от трех радиусов кривизны, то один из них можно выбрать произвольно. Наличие свободного парамет- параметра позволяет одновременно с ахроматизацией значитель- значительно уменьшить сферическую аберрацию такой составной линзы. Другая возможность получения ахроматической сис- системы состоит в использовании двух линз из одинако- одинакового стекла (Д1 = Д2), находящихся одна от другой на расстоянии, равном полусумме их фокусных расстояний: / = (/] +/2)/2. Ахроматизация фокусного расстояния та- такой системы сразу для всего спектра непосредственно еле- ли^за:";' дует из формулы G.35). Однако это лишь частичная ахро- ахроматизация, так как она обеспечивает совпадение углового увеличения изображений в разных цветах, но не их местоположения (из-за различия в положении главных плоскостей). Такой способ применяется в окулярах зрительных труб. Путем построения более сложных систем можно добиться совпадения фокусов для трех различных цветов. Таковы наиболее совершенные объективы микроскопов (апохроматы), разработанные Аббе. Геометрооптические качества 10-линзового апо- апохромата Аббе настолько высоки, что он позволяет достичь теоретического дифрак- дифракционного предела разрешающей способности, обусловленного волновой природой света (см. п. 7.6). 2 Рис. 7.27. Ахроматическая 1крон; 2 флинт
340 7. Геометрическая оптика Уменьшение многочисленных аберраций возможно лишь путем устройства слож- сложных специально рассчитанных оптических систем. Однако одновременное устранение всех аберраций может оказаться неразрешимой задачей. Поэтому приходится идти на компромисс: рассчитывая оптику для определенной цели, стремятся избавиться от особенно вредных недостатков и мирятся с неполным устранением других. Каж- Каждый оптический прибор должен отвечать своему специальному назначению. К объ- объективам телескопов, микроскопов и фотообъективам предъявляются совсем разные требования. Если для телескопа с малым угловым размером поля зрения достаточно устранить хроматическую и сферическую аберрации, то для объективов микроскопов и фотообъективов с широким полем зрения необходимо еще устранение дисторсии и кривизны поля изображения. Для наблюдения объектов малой яркости необходимы светосильные объективы с большим относительным отверстием, и это вынуждает ми- мириться с некоторыми аберрациями, неизбежными при использовании широких пуч- пучков. Объектив коллиматора спектрографа должен быть исправлен на сферическую аберрацию и хорошо ахроматизирован, так как для получения параллельного пучка входная щель должна находиться в общем для всех длин волн фокусе. Для камер- камерного объектива ахроматизация вообще не обязательна, так как различие фокусных расстояний для красных и фиолетовых лучей можно скомпенсировать наклонным расположением кассеты с пластинкой, но зато он должен быть хорошо исправлен на астигматизм и кому, так как лучи разных длин волн выходят из диспергирующего элемента под разными углами к его оптической оси, и т.д. В построении систем, свободных от тех или иных аберраций, инструментальная оптика достигла поразительных результатов. Контрольные вопросы • Какими способами устраняют сферическую аберрацию в зеркальных и линзовых объекти- объективах телескопов? • Какое условие должно выполняться для того, чтобы оптическая система создавала резкое изображение точек предмета, не лежащих на оптической оси? • Где расположены сопряженные апланатические точки для сферической преломляющей по- поверхности? • В чем заключается аберрация астигматизма? • Какое физическое явление вызывает хроматическую аберрацию? Какими способами удается ее уменьшить? • Какие аберрации должны быть устранены в первую очередь у объективов: а) телескопа; б) фотоаппарата; в) микроскопа; г) коллиматора спектрографа; д) камеры спектрографа? Задачи 1. Точечный источник 5 находится под водой на глубине И от поверхности (см. рис. 7.21). Найдите каустическую поверхность пучка выходящих из воды преломленных лучей. Решение. Направим ось х вдоль поверхности воды, ось у — вдоль нормали к поверхнос- поверхности. В узком астигматическом пучке преломленных лучей, выходящем под углом а к нор- нормали, меридиональные лучи пересекаются в точке С], координаты х и у которой даются
7.5. Яркость и освещенность изображений 341 формулами _ Н(п2 - 1)зт3а (л2-зт2аK/2' у(а) = Нп2 соз3 а Это параметрическое уравнение каустики меридиональных лучей. При а = О точка С! лежит на одной нормали с источником 5 на глубине Н/п: х = О, у = -Н/п (точка 51). При а = л/2 (скользящий вдоль поверхности пучок преломленных лучей) х — Н/л/п2 — 1, у = 0 (точка 5")- Сагиттальные лучи всех пучков пересекаются в точках нормали 5О. Каустика таких лучей вырождается в отрезок З'О длиной Н/п. 2. Докажите, что в оптической системе, создающей резкое отображение плоскости предмета на плоскость в пространстве изображений, оптические длины лучей от точки предмета до ее изображения одинаковы для всех пар сопряженных точек. 3. Докажите, что для преломления света на поверхности шара точки Р и Р', лежащие на расстояниях К/п и пК от центра О, образуют сопряженную пару апланатических точек (см. рис. 7.24,6). Решение. По условию, 1ЛО1/1ОР] — п и |О/>'|/|ЛО| — п. Это значит, что треугольни- треугольники АРО и АР10 подобны. Из подобия треугольников АРО и АР10 следует, что угол АР'О равен углу падения а на поверхность шара луча, выходящего из точки Р. Из треуголь- треугольника АР'О получаем, что зш/З/зша = |0^'|/И0| = л» т-е- прямая Р1 А дает направление преломленного луча. Таким образом, если в Р поместить точечный источник, то после пре- преломления получится широкий гомоцентрический пучок лучей, расходящихся из точки Р1. Ввиду сферической симметрии рассматриваемой системы не только точки Р и Р\ но и це- целиком сферы 5 и 8' отображаются стигматически друг в друга широкими пучками лучей. Так как радиусы сфер 5' и 5 относятся как л2, то поперечное линейное увеличение при таком апланатическом отображении равно п2. 1.5. Яркость и освещенность оптических изображений Оптический прибор формирует изображение предмета, которое рассматривается глазом или воздействует на какой-либо иной приемник излучения. Точки предмета до сих пор считались математическими точками, но в действительности излучение с конечной энергией испускается элементом поверхности, который имеет конеч- конечные размеры. Будем считать, что поверхность предмета излучает по закону Лам- Ламберта (см. п. 1.10), т.е. характеризуется яркостью В, не зависящей от направления. Допустим, что небольшой элемент по- поверхности, имеющий площадь а, рас- расположен перпендикулярно оптической оси системы (рис. 7.28) и отображает- отображается апланатически с выполнением усло- условия синусов G.31). Найдем световой по- поток Ф от этого элемента, проходящий через систему и достигающий изобра- изображения. Поток в элементарный телесный угол <\п — ьтвйвйф равен Рис. 7.28. К расчету освещенности изображения, йФ = а В соз в АО — аВ соз в зш в <№ йф. формируемого оптической системой
342 7. Геометрическая оптика Интегрируя выражение по всей входной апертуре, т. е. по <р в пределах от 0 до 2л и по в от 0 до м, находим полный световой поток: Ф = лаВ 8ш2 и. G.36) Аналогично для светового потока Ф\ исходящего от площадки — изображения а\ можно написать фГ = яа'В'*ш2и', G.37) где В' — яркость изображения; 2и! — апертура со стороны изображения. Если поте- потерями излучения из-за отражений, рассеяния и поглощения в стекле пренебречь, то потоки через входной и выходной зрачки одинаковы: Ф = Ф'. Приравнивая правые части G.36) и G.37) и учитывая, что из условия си- синусов G.31) при п'=п (одинаковая среда по обе стороны системы) следу- следует а 81П2 и = а' ш? и', получаем В' = В — яркость изображения равна яркости предмета. Совпадение яркостей (при отсутствии потерь) обусловлено тем, что при апланатическом отображении увеличение площади изображения сопровождает- сопровождается уменьшением в то же число раз телесного угла, в котором распространяется световой поток. С помощью оптических приборов невозможно увеличить яркость. А практически неизбежные потери света из-за отражений, рассеяния и поглощения приводят к тому, что яркость создаваемого оптической системой изображения может быть только меньше яркости самого предмета. Формулу G.37) можно трактовать и иначе, а именно как поток излучения, прихо- приходящего на площадку а1 от воображаемого протяженного источника с поверхностной яркостью В\ как бы заполняющего выходной зрачок системы. Но, как было показано выше, В' = В, т.е. поверхность этого воображаемого источника излучает с той же яркостью, что и сам предмет. В то же время видимый из а1 угловой размер этого источника, равный выходной апертуре 2и\ может быть много больше углового раз- размера самого предмета. Это легко продемонстрировать следующим простым опытом. Источник с маленькой светящейся поверхностью помещают в фокус большой линзы или в фокус автомобильной фары. Тогда большая поверхность линзы или отверстие зеркала фары излучает с той же яркостью, что и маленькая поверхность источника. Хотя этот опыт и тривиален, он производит сильное впечатление. Если в плоскость изображения поместить экран, освещенность площадки а' мо- может значительно превышать ту освещенность, которую создавал бы источник а при отсутствии оптической системы. Это легко понять на примере всем знакомого дет- детского «зажигательного» стекла. Чтобы получить непосредственно от Солнца такую же освещенность, как в фокусе линзы, пришлось бы приблизиться к Солнцу настоль- настолько, чтобы солнечный диск был виден невооруженным глазом под тем же углом, что и поверхность линзы из ее фокуса. Освещенность Е площадки а1 равна Ф'/а'. Поэтому из G.37) с учетом того, что В' = В, получаем Е = л В зш2 и'. Для систем, формирующих изображения удаленных предметов (зрительные трубы и телескопы, фотообъективы), зш к! в параксиальном приближении пропорционален отношению диаметра В входного зрачка к фокусному расстоянию /. Отношение О// называется относительным отверстием. Освещен- Освещенность формируемого объективом изображения практически не зависит от расстоя- расстояния до предмета, а определяется поверхностной яркостью предмета В и квадратом
7.5. Яркость и освещенность изображений 343 относительного отверстия (О//J, принимаемым за светосилу такого объектива. Для характеристики объективов микроскопов часто используют числовую аперту- апертуру (Ч. А.), которая определяется как произведение синуса половины входной апер- апертуры на показатель преломления среды в пространстве предметов: Ч. А. = п зт и. От нее зависит не только светосила, но и предельная разрешающая способность микро- микроскопа (см. п. 7.6). При визуальных наблюдениях оптический прибор и глаз наблюдателя образуют еди- единую систему, все элементы которой должны быть согласованы друг с другом. Это требование налагает определенные условия на выбор разумного увеличения. Напо- Напомним, что увеличением прибора называется отношение углов, под которыми про- протяженный предмет виден через прибор и при наблюдении невооруженным глазом. Например, для зрительной трубы (см. рис. 7.19) увеличение Г = ю'/ю равно отно- отношению фокусных расстояний объектива и окуляра: Г — /\//2- Уменьшая фокусное расстояние окуляра, можно получить с данным объективом большее увеличение. Однако не всегда следует стремиться только к получению большого увеличения. При наблюдении протяженных предметов малой яркости нужно, чтобы освещен- освещенность их изображения, получающегося на сетчатке глаза, была как можно больше. Для этого диаметр выходного зрачка трубы не должен быть меньше входного зрач- зрачка глаза, чтобы именно зрачок глаза служил апертурной диафрагмой всей систе- системы. Тогда освещенность изображения на сетчатке будет максимальной — такой же (в пренебрежении потерями света на отражение и рассеяние), как и при наблюдении невооруженным глазом. Диаметр Л выходного зрачка трубы с данным объективом диаметра й зависит от увеличения: как видно из рис. 7.19, а, О/с! = /\//2 — Г- личение называется нормальным или равнозрачковым, когда диаметр й выходного зрачка прибора равен диаметру с10 зрачка глаза. При больших увеличениях д, < с10 и освещенность изоб- изображения уменьшится. При увеличениях, не превосходящих нор- нормальное, освещенность изображения максимальна и не зависит от увеличения. Однако применять увеличение меньше нормаль- нормального нецелесообразно, так как при этом используется только центральная часть объектива: при й> с10 периферийные лучи не попадают в зрачок глаза. Диаметр с!0 зрачка глаза зависит от условий освещения и из- изменяется от 6—8 мм в полной темноте до 2 мм при ярком днев- дневном свете. Поэтому при работе с телескопом, имеющим опре- определенный диаметр О объектива, следует учитывать условия на- наблюдения, влияющие на зрачок глаза, и выбирать окуляр, обес- обеспечивающий оптимальное увеличение Г = й/с10. Увеличением микроскопа называют отношение угла ф\ под ко- которым малый предмет виден в микроскоп, к углу <р, под кото- которым он был бы виден невооруженным глазом с расстояния яс- ясного зрения Ь. Предмет помещают в передней апланатической точке объектива (рис. 7.29), а его действительное изображение ^нормального^ получается в сопряженной апланатической точке. Так как она личения микроскопа
344 7. Геометрическая оптика находится на большом расстоянии, апертура выходящих из объектива лучей мала (м' с 1) и условие синусов можно записать в виде пу зтм = у'и', где у — размер предмета, у' — его изображения. Окуляр с фокусным расстоянием / располагается, как и в зрительной трубе, таким образом, чтобы изображение предмета находилось в его фокальной плоскости. Поэтому ширина с1 выходящего из окуляра пучка лучей, т.е. диаметр выходного зрачка, составляет 2/м' = 2/пу $ти/у'. Выразим у/у* через увеличение микроскопа Г = <р'/<р9 учитывая, что ср = у/Ь и ср1 = у'//. В результате получим Л — 2Ьп 8ш и/Г. Для нормального увеличения фокусное расстояние окуля- окуляра / следует выбрать так, чтобы диаметр д, выходного зрачка был равен диаметру с10 зрачка глаза. Отсюда получаем следующее выражение для нормального увеличения: Г=—лети. G.38) Для нормального глаза обычно полагают </0 = 2 мм, Ь = 250 мм. Наибольшее дости- достижимое значение числовой апертуры пзти у сухих объективов равно 1, у иммер- иммерсионных — 1,5. Соответствующие этим случаям нормальные увеличения по G.38) должны составлять Г = 250 и Г = 375. В условиях хорошего освещения предме- предмета допустимо применять увеличение, превосходящее нормальное в 2-4 раза. Таким путем нельзя выявить новые детали рассматриваемого предмета, но можно обеспе- обеспечить менее напряженные условия для глаза, чтобы не заставлять его работать на пределе разрешающей способности. Однако увеличения, значительно превосходящие нормальное, не только бесполезны, но и вредны, так как сужение выходящего пучка может внести в наблюдаемое изображение сильные искажения из-за дифракции. По- Поэтому предельное увеличение в лучших сухих системах можно принять равным 1000, в иммерсионных — 1500. Вопрос об оптимальном выборе увеличения оптических приборов рассмотрен в п. 7.6 в связи с их предельной разрешающей способностью, обусловленной вол- волновой природой света. Контрольные вопросы • Объектив фотоаппарата создает в фокальной плоскости действительное изображение уда- удаленного протяженного источника света, поверхность которого излучает по закону Лам- Ламберта. Как будут изменяться при изменении светосилы объектива (диаметра диафрагмы) яркость изображения источника и освещенность фотопластинки в том месте, где получает- получается изображение? • Объясните, почему (при отсутствии потерь света) яркость создаваемого оптической систе- системой изображения источника равна яркости самого источника. • В каком случае увеличение прибора, предназначенного для визуальных наблюдений, назы- называется нормальным? • Каким должен быть диаметр О линз объективов бинокля с десятикратным увеличением, если диаметр зрачка глаза равен <^0 = 5 мм? 7.6. Разрешающая способность оптических инструментов В оптической системе с исправленными геометрическими аберрациями гомоцен- гомоцентрический пучок лучей, расходящихся от точечного источника, превращается в схо-
7.6. Разрешающая способность инструментов 345 дящийся гомоцентрический пучок, фокус которого и служит совершенным, с точ- точки зрения геометрической оптики, изображением источника. Однако на сравнимых с длиной волны расстояниях от фокуса пучка кривизна волновых поверхностей ста- становится значительной и условия применимости геометрической оптики перестают выполняться. Создаваемое системой изображение точечного источника имеет вид некоторой дифракционной картины, т. е. светлого пятнышка конечного размера. Это обстоятельство ограничивает возможность различать на изображении близкие точки предмета. Таким образом, обусловленное волновой природой света и принципиаль- принципиально неустранимое явление дифракции определяет теоретический предел достижимой разрешающей способности оптических приборов, формирующих изображение. Распределение интенсивности света в плоскости, проходящей через фокус схо- сходящегося пучка, определяется дифракцией Фраунгофера (см. п. 6.3). Вид дифракци- дифракционной картины зависит от формы отверстия диафраг- диафрагмы, ограничивающей поперечное сечение пучка. Для оп- оптических инструментов наиболее важен случай кругло- круглого отверстия (такую форму обычно имеют диафрагмы, оправы линз и объективов), когда дифракционная карти- картина состоит из концентрических светлых и темных колец (см. рис. 6.17, б). Радиальное распределение интенсив- интенсивности в ней выражается по формуле F.27) через функ- функцию Бесселя первого порядка ^^(г) (см. рис. 6.18) от аргумента г = 2ла6/Л, где а — радиус выходного зрач- зрачка, а угол в характеризует направление из его центра на точку наблюдения Р (рис. 7.30). Пусть г — рассто- расстояние от фокуса О пучка лучей до точки Р9 а Ъ — от фокуса до плоскости выходного зрачка. Тогда в « г/Ъ и г = 2лга/(ХЪ) — 2пги!/А, где и! = а/Ъ — половина выходной апертуры. Функция ^^(г) обращается в нуль при значениях аргумента 1Х = 3,83; г2 — 7>02; г3 = 10,17;... Первый минимум ин- интенсивности соответствует г^ откуда для радиуса гх первого темного кольца, окру- окружающего центральный максимум, получаем г1=0,61~. G.39) На центральный максимум, называемый диском Эйри, приходится 84 % светового потока, и его можно считать изображением точечного источника, создаваемым оп- оптической системой. Размер этого изображения (см. G.39)) определяется выходной апертурой и'. Протяженный предмет можно рассматривать как совокупность точечных источни- источников, каждый из которых отображается системой в виде диска Эйри с окружающи- окружающими его дифракционными кольцами. Если соседние точки предмета можно считать некогерентными источниками, то испускаемые ими волны не интерферируют и про- происходит сложение интенсивностей, т. е. результирующее изображение находится как простое наложение дифракционных картин от отдельных точек. Этот случай реализу- реализуется для самосветящихся (или некогерентно освещенных) объектов и важен в теории телескопа. Другой предельный случай когерентно освещенных объектов может быть Рис. 7.30. К нахождению рас- распределения интенсивности вблизи фокуса сходящегося пучка лучей
346 7. Геометрическая оптика реализован при наблюдении в микроскоп. Здесь для нахождения изображения требу- требуется сложить напряженности полей в дифракционных картинах от отдельных точек предмета. Пусть предмет состоит из двух одинаковых точечных источников 5^ и $2. Если расстояние между центрами их изображений в оптическом приборе мало по сравне- сравнению с размерами дисков Эйри, то результирующая картина практически не отличает- отличается от изображения одного точечного источника. В таком случае говорят, что прибор не разрешает рассматриваемые точки. Если увеличивать расстояние между 5! и 52, то расстояние между центрами их изображений 8\ и 8'2 также будет увеличиваться при неизменном размере соответствующих им дисков Эйри. Начиная с некоторого расстояния \8\$'2\ на графике суммарного распределения интенсивности вдоль линии \8'Х8'2\ = /Ш1П в середине появится провал. Такая картина будет восприниматься как раздельное изображение двух точек. В этом случае говорят, что прибор разрешает точки 5! и 52, а величину 1т[п называют разрешаемым расстоянием. а) б) 1 1 1 ./ ¦Дх) у Л 1{х) V \ 0,37 \ 0,61А/м' 0,74 X X Рис. 7.31. Условный критерий разрешения изображений точечных некогерентных источников (критерий Рэлея) Количественный критерий разрешающей способности, как и в случае спектраль- спектрального прибора (см. п. 6.6), может быть сформулирован только условно, так как воз- возможность отличить дифракционное изображение двух близких точек от изображения одиночного точечного источника зависит от той точности, с которой производится измерение наблюдаемого распределения интенсивности. Такой условный критерий был предложен Рэлеем: как и в случае узких спектральных линий (см. п. 6.6), два точечных некогерентных источника считаются разрешенными, если центр дифракци-
7.6. Разрешающая способность инструментов 347 онной картины от одного из них совпадает с ближайшим к центру минимумом кар- картины от другого. Это соответствует расстоянию /т1п между центрами изображений, равному радиусу диска Эйри G.39): 1т{п = 0,61 А/м'. Такое взаимное расположение контуров радиального распределения интенсивности в дифракционных картинах от отдельных источников показано на рис. 7.31, а. Результирующий контур показан на рис. 7.31,6. Значение функции [2/^(г)/г]2 при г =^/2 = 1,91 равно 0,37, поэто- поэтому интенсивность в провале составляет 74 % от максимальной. Фотографии изобра- изображений двух одинаковых близких точечных источников, иллюстрирующие критерий Рэлея, приведены на рис. 7.32. Случай б соответствует расположению источников на пределе разрешения, определяемом критерием Рэлея. Рис. 7.32. Изображения двух близких точечных источников: а — согласно критерию Рэлея, источники не разрешены (расстояние между центрами дисков Эйри равно половине рас- расстояния до первого минимума дифракционной картины); б — источники разреше- разрешены (расстояние между центрами равно расстоянию до первого минимума); в — расстоя- расстояние между центрами равно расстоянию до второго минимума дифракционной картины. На снимках центральная область переэкспонирована Для телескопа предположение о некогерентности точек предмета всегда оправдано. Такими «точками» могут быть, например, две близкие звезды. Из-за очень большого удаления от Земли звезды можно считать точечными источниками, несмотря на их гигантские линейные размеры. Изображение звезды в фокальной плоскости объекти- объектива телескопа никак не отражает реальной формы и размеров звезды, а представляет собой лишь дифракционную картину, создаваемую круглой оправой объектива. Ра- Радиус гх первого темного кольца в ней равен 0,61А/м' = 1,22А//О, где / — фокусное
348 7. Геометрическая оптика расстояние объектива, В — его диаметр. Отсюда для минимального углового рас- расстояния вт{п между двумя звездами, разрешаемыми телескопом, получаем 0тт = ^ = 1>22^. G.40) Величину 1/#т1П, обратную предельному разрешаемому угловому расстоянию, назы- называют разрешающей способностью телескопа. Она пропорциональна действующему диаметру объектива. Этим отчасти объясняется стремление строить большие теле- телескопы. Телескоп с диаметром главного зеркала В = 5 м при условии устранения гео- геометрических аберраций может обеспечить угловое разрешение (для света с длиной волны Я = 560 нм) вт[п = 1,4 • 10~7 = 0,028". Попытки повышения разрешающей способности телескопов путем сооружения гигантских механических конструкций имеют естественный предел, вытекающий из прочности конструкционных материалов. Этот предел практически уже достигнут. Принципиально новые возможности повышения разрешающей способности связа- связаны с направлением, получившим название апертурного синтеза или адаптивной оптики, суть которого состоит в построении большой оптической системы из эле- элементов сравнительно небольшого размера. В случае оптико-механического апертурного синтеза формируется параболическое составное зеркало, большая апертура которого тесно заполняется прилегающими друг к другу малыми зеркалами. Специальная автоматическая система юстировоч- ных механизмов поддерживает взаимное положение сегментов так, чтобы они обра- образовали единую поверхность. Использование таких «активных» систем для телескопов позволяет существенно уменьшить массу зеркала заданного диаметра. Систему с разреженной апертурой образует совокупность малых зеркал, не прилегающих друг к другу. Простейший пример такой системы — звездный ин- интерферометр Майкельсона (см. п. 5.5). Наименьшее угловое расстояние, доступное измерению, определяется не диаметром И объектива (или зеркала) телескопа, на котором он смонтирован, а максимальным расстоянием между внешними подвиж- подвижными зеркалами М3 и М4 (см. рис. 5.22), которое может значительно превосхо- превосходить й. Предельное разрешение разреженной апертуры близко к разрешению такой же по размерам сплошной апертуры. К недостаткам систем с разреженной апер- апертурой следует отнести потери энергии и значительное усложнение формы изобра- изображения точечного источника (аппаратной функции), связанное с тем, что по мере «разбавления» апертуры возрастает относительная интенсивность боковых максиму- максимумов дифракционной картины. В частности, в предельном случае разрежения апер- апертуры, т. е. в звездном интерферометре, боковые максимумы сравниваются по интен- интенсивности с центральным, образуя систему одинаковых интерференционных полос. Поэтому он пригоден лишь для измерения комплексной степени когерентности из- излучения и угловых размеров источника, но не для регистрации оптического изобра- изображения. Измеряемое распределение интенсивности в создаваемом прибором изображении некоторого объекта можно представить как свертку аппаратной функции (изоб- (изображения точечного источника) и функции объекта (распределения интенсивности, которое создавалось бы идеальным прибором). Чем больше ширина аппаратной
7.6. Разрешающая способность инструментов 349 функции и чем сложнее ее форма, тем ббльшие искажения вносит прибор в функ- функцию объекта. Однако даже при широкой, но точно известной аппаратной функции путем математической обработки измеряемого распределения можно восстановить вид функции объекта, иначе говоря, произвести редукцию к идеальному прибору. Успех решения этой обратной задачи определяется погрешностями при измерени- измерениях, т. е. уровнем шумов. Анализ показывает, что при наличии шумов прибор с узкой аппаратной функцией обеспечивает лучшее восстановление функции объекта и, сле- следовательно, характеризуется более высокой разрешающей способностью. Таким образом, реальные возможности получения более или менее детального изображения объекта в значительной степени определяются шириной и формой аппа- аппаратной функции прибора. Ее вид в общем случае обусловлен не только дифракцией, но и геометрическими аберрациями, полное устранение которых невозможно. У зер- зеркал больших телескопов аберрации возникают из-за деформаций отражающей по- поверхности, вызываемых трудноустранимыми механическими напряжениями. Полной реализации разрешающей способности препятствует также наличие земной атмосфе- атмосферы. Возникающие в ней неоднородности сопровождаются локальными изменениями показателя преломления воздуха. Связанные с этим искажения изображения и ухуд- ухудшение разрешения особенно существенны у больших телескопов, поэтому обсерва- обсерватории для них стремятся строить в высокогорных районах. По указанным причинам главное преимущество больших телескопов заключается не в высокой разрешаю- разрешающей способности, а в увеличении формирующего изображение светового потока, что позволяет обнаруживать и фотографировать слабые небесные объекты. При визуальных наблюдениях телескоп и глаз образуют единую систему. Для реа- реализации разрешающей силы объектива требуется согласование всех элементов сис- системы, что достигается выбором окуляра, обеспечивающего оптимальное увеличение телескопа. Остановимся на этом вопросе подробнее. При рассматривании удаленных предметов глаз действует так же, как объектив телескопа: свет от точечного источника образует на сетчатке дифракционную карти- картину, угловой радиус центрального максимума которой определяется той же форму- формулой G.40), если заменить в ней О на диаметр г/0 зрачка глаза. Поэтому разрешаемое невооруженным глазом угловое расстояние 0О при Я = 550 нм, */0 = 4 мм составля- составляет 1,22А/*/0 = 1,7 • 10~4рад = 0,5'.*) Это значение очень близко к остроте зрения нормального глаза, которая определяется расстоянием между соседними чувстви- чувствительными элементами (колбочками) в центральной части сетчатки, где плотность их размещения наибольшая. Это значит, что, совершенствуясь в процессе эволю- эволюции, наш орган зрения фактически достиг максимума, принципиально допустимого законами физики. Предположим, что угловое расстояние между двумя удаленными точками как раз равно предельному значению вт{п = 1,22А/# G.40), которое еще может разре- разрешить объектив телескопа. В телескоп с увеличением Г эти точки видны под углом в = Гвт1п. Чтобы точки воспринимались глазом как раздельные, угол в не должен быть меньше предельного угла 0О = 1,22АД/0, разрешаемого глазом. Отсюда нахо- находим Г ^ О/^о- Знак равенства здесь соответствует введенному в п. 7.5 нормальному *) В условиях плохого освещения диаметр с10 зрачка глаза может увеличиться до 8 мм, но это не приводит к увеличению разрешающей способности из-за геометрических аберраций.
350 7. Геометрическая оптика увеличению, при котором наиболее эффективно используется световой поток, попа- попадающий в объектив телескопа. При увеличениях, меньших нормального, апертурной диафрагмой служит зрачок глаза и используется только центральная часть объектива, диаметр которой меньше Б. Это приводит к уменьшению разрешающей способности всей системы. Применение увеличений больше нормального лишь снижает освещенность изоб- изображения на сетчатке глаза и не улучшает разрешения, так как не может выявить новых деталей рассматриваемого объекта, отсутствующих в первичном изображе- изображении, которое представляет собой совокупность дифракционных картин от оправы объектива. Однако в некоторых случаях (см. п. 7.5) допустимо применять увеличе- увеличения, в 2—4 раза превосходящие нормальное, чтобы создать менее напряженные усло- условия для работы глаза. Угловые размеры почти всех звезд много меньше углового разрешения даже са- самых больших телескопов. Поэтому, как уже отмечалось выше, изображение звезды в фокальной плоскости объектива неотличимо от изображения точечного источни- источника и представляет собой дифракционный кружок. Диаметр этого кружка настолько мал, что при использовании нормального увеличения он, как и сама звезда, для глаза неотличим от точечного источника. Это значит, что размер дифракционного пятна на сетчатке глаза не зависит от того, наблюдается ли звезда в телескоп или непосредственно. Но световой поток, приходящийся на это дифракционное пятно, и, следовательно, освещенность изображения при наблюдении в телескоп во столько раз больше, чем при наблюдении невооруженным глазом, во сколько раз площадь отверстия объектива больше площади зрачка глаза. В то же время освещенность изображения протяженных предметов (фона), как было показано в п. 7.5, не изменя- изменяется. Этим объясняется, почему в телескоп звезды на фоне неба видны и днем. Разрешающую способность микроскопа в случае самосветящихся объектов мож- можно найти тем же способом, что и для телескопа. Предмет расположен в передней апланатической точке объектива (см. рис. 7.30). Получающееся в сопряженной плос- плоскости изображение отдельной точки предмета представляет собой фраунгоферову дифракционную картину, возникающую при дифракции на круглой апертурной диа- диафрагме. По критерию Рэлея, две точки предмета считаются разрешенными, если рас- расстояние между центрами их изображений не меньше радиуса диска Эйри г^ G.39): /' ^ 0,6 \Х/и'. Величина /' связана с расстоянием / между точками самого предмета условием синусов G.31), которое при и1 < 1 (что практически всегда выполняется) и п' = 1 принимает вид 1п §1П и = /V. Поэтому для минимального расстояния 1т[п между двумя точками предмета, разрешаемыми микроскопом, получаем 'шт = 0,61 —5—. G.41) ШШ /2 51ПМ В отличие от телескопа разрешающая способность микроскопа определяется не диаметром объектива, а углом раствора 2м конуса исходящих от предмета лучей, улавливаемых объективом. Стоящая в знаменателе формулы G.41) числовая апер- апертура пзти должна быть как можно больше для достижения высокого разреше- разрешения. В лучших объективах апертура приближается к своему теоретическому пределу 2м = я, а для увеличения числовой апертуры применяют иммерсию (жидкость с вы- высоким показателем преломления и), вводимую между покровным стеклом и перед-
7.6. Разрешающая способность инструментов 351 ней линзой объектива. Наличие п в формуле G.41) связано с тем, что разрешаемое расстояние должно определяться длиной волны не в вакууме, а в той среде, где на- находится предмет, т.е. А /п. При п = 1,5 максимальное значение числовой апертуры составляет 1,5, что в соответствии с G.41) дает 1т{п = 0,4А. Этот предел разреше- разрешения обусловлен волновой природой света. Никакие технические усовершенствова- усовершенствования микроскопа не позволят его превзойти. Для видимого света (А « 5 • 10~5 см) /т1п = 2 • 10~~5 см. Улучшить разрешение можно в ультрафиолетовых лучах, но это требует использования кварцевых объективов и перехода к фотографической реги- регистрации. Радикальное увеличение разрешающей способности достигается в электронном микроскопе, где вместо световых лучей используются электроны. Соответствующая электронам длина волны де Бройля А = к/{ту) при ускоряющем напряжении ЮкВ равна 10 * м, что уже меньше размеров атома (~ 100 м). В формирующих изобра- изображение системах электронных линз (магнитных и электростатических) из-за больших аберраций используются только узкие параксиальные пучки с малыми апертурами (~ 0,01—0,1), и все же разрешающая способность электронного микроскопа в сотни раз больше, чем оптического. Это позволяет разрешать детали, всего в несколько раз превосходящие размеры отдельных атомов. При визуальных наблюдениях для полной реализации разрешающей способности объектива требуется правильный выбор увеличения микроскопа. Минимальное рас- расстояние /т|п, разрешаемое объективом, с расстояния ясного зрения Ь видно нево- невооруженным глазом под углом <р = 1т^/Ь- В микроскоп с увеличением Г то же расстояние видно под углом ср' = Г<р = Г1т^/Ь. Угол <р' не должен быть меньше предельного угла в0 — 1,22А/^0, разрешаемого глазом. Используя для /т1п выраже- выражение G.41), условие (р> ^ 0О запишем в виде Г^^пыпи. G.42) Знаку равенства здесь соответствует введенное в п. 7.5 нормальное (равнозрачко- вое) увеличение G.38), при котором весь проходящий через микроскоп световой поток попадает в глаз. Таким образом, нормальное увеличение совпадает с наимень- наименьшим увеличением, при котором полностью используется разрешающая способность объектива. Как и в случае телескопа, применение увеличений, превышающих нор- нормальное, не может выявить новых деталей изображения и лишь снижает освещен- освещенность, но, как уже отмечалось, в некоторых случаях оно оказывается целесообразным по причинам физиологического характера. Если не требовать геометрического подобия между предметом и его изображени- изображением, то с помощью микроскопа можно обнаружить частицы, размер которых меньше предельного 1т^п, устанавливаемого формулой G.41). Для этого сильный боковой пучок света фокусируют на кювету с жидкостью, в которой во взвешенном состоя- состоянии находятся «ультрамикроскопические» частицы (например, коллоидные частицы металлов размером около 5нм), и наблюдают в микроскоп рассеянный частицами свет на черном фоне. Изображение частицы, как и изображение звезды в теле- телескопе, имеет вид дифракционного кружка от оправы объектива. Этот кружок да- дает представление о положении и перемещении частицы, но не о ее форме и раз- размерах.
352 7. Геометрическая оптика л» с До сих пор при обсуждении условий разрешения предполагалось, что две точки предмета 5^ и 52 представляют собой некогерентные точечные источники, и в плос- плоскости создаваемого оптической системой изображения происходит простое наложе- наложение дифракционных картин от каждого из них. Несамосветящийся объект должен быть освещен каким-либо источником света. Если этот источ- источник точечный, то световые колебания в точках 51 и 52 осве- освещаемого им предмета когерентны. Любой реальный источник имеет конечные размеры, поэтому в общем случае световые колебания в близких точках 51 и 52 освещаемого предмета будут частично когерентны. Степень пространственной коге- когерентности у12 световых колебаний в точках 5^ и 52 зависит от расстояния / между ними и от угловых размеров источника света (см. п. 5.5). Когда применяется оптическая осветитель- осветительная система (конденсор), отображающая светящуюся поверх- поверхность источника на плоскость объекта (рис. 7.33), роль угло- углового размера источника играет выходная апертура 2м0 осве- осветителя: в пределах центрального максимума дифракционной картины от его оправы световые колебания частично коге- ^ т„ „ рентны, ибо каждая точка источника отображается конденсо- Рис. 7.33. К вопросу о ко- ^ ' п^ герентности освещения Ром в виДе кружка конечных размеров. Радиус этого кружка, предмета в микроскопе т.е. размер области когерентности, порядка А/м0. Если апер- апертура осветителя мала по сравнению с числовой апертурой объектива микроскопа, то расстояние 1т^п между точками 5 ^ и 52, лежащими на пределе разрешения, много меньше ширины дифракционного кружка от оправы кон- конденсора и световые колебания в $! и 52 можно считать полностью когерентными. Теория разрешающей способности микроскопа для предельного случая полностью когерентного освещения была развита Эрнстом Аббе. Теория Аббе дает наглядное представление о дифракционном характере формирования изображения в оптической системе. Чтобы облегчить учет интерференции лучей от разных мест протяженного объекта, освещаемого когерентным светом, будем в качестве объекта рассматривать простую щелевую решетку (рис. 7.34). Свет от точечного источника, помещенного в фокус конденсора, образует плоскую волну, которая испытывает дифракцию на решетке-объекте РР. В фокальной плоскости РР объектива возникает фраунгоферо- ва дифракционная картина, положение главных максимумов которой определяется периодом д, решетки: в случае нормального падения д, ът вт = тк. На оптической оси находится максимум нулевого порядка (т = 0), по обе стороны от него на рас- расстоянии /1§01 расположены максимумы первого порядка А^ и А_х и т.д. Минуя эти точки, когерентные лучи встречаются в сопряженной с РР плоскости Р'Р'9 где интерферируют между собой и образуют более или менее верное увеличенное изоб- изображение решетки-объекта. Если с помощью диафрагмы, помещенной в фокальную плоскость РР объектива, перекрыть часть главных максимумов Ат, то изображение решетки в плоскости Р'Р' ухудшается, так как оно соответствует решетке, у которой при дифракции эти мак- максимумы не возникают. Когда диафрагма пропускает только один пучок До, достига- достигающий плоскости Р'Р' свет будет состоять только из одной волны, как было бы при замене решетки РР прозрачной плоскопараллельной пластинкой. Никакой информа-
7.6. Разрешающая способность инструментов 353 р -ЧУУ- - ции о структуре решетки эта волна не несет, и в плоскости изображения Р'Р' будет наблюдаться равномерно освещенное поле. Когда диафрагма в плоскости РР откры- открывает кроме главного максимума Ло еще и максимумы первого порядка Л1 и Л_15 ин- интерферирующие волны создают в плоскости Р'Р' изоб- изображение решетки с плавным переходом от прозрачных к непрозрачным участкам. Легко понять, что точно та- такая картина наблюдалась бы в случае, если на месте щелевой решетки РР находилась бы решетка того же периода Л, но с синусоидальным пропусканием. Как бы- было показано в п. 6.5 (задача 3), при дифракции на такой решетке возникают главные максимумы только поряд- порядков т = О, ±1. Пропускание щелевой решетки характеризуется сту- ступенчатым профилем. Функцию пропускания можно разложить в ряд Фурье, т.е. представить решетку как наложение синусоидальных решеток с периода- периодами <^, й?/2, ^/3 и т.д., каждая из которых дает толь- только по одному главному максимуму справа и слева от Ао. Главные максимумы порядка ±т при дифрак- дифракции на щелевой решетке обусловлены соответствующи- соответствующими фурье-компонентами ее функции пропускания (или пространственными гармониками). При дифракции плоской волны на решетке происходит как бы физи- Рис. 7.34. К дифракционной тео- ческое разложение функции пропускания в ряд Фу- рии образования изображения рье, причем в фокальной плоскости объектива наблю- в микРоскопе дается пространственное разделение дифрагировавших волн, обусловленных ее отдельными пространственными гармониками. Неискажен- Неискаженное изображение решетки со всеми деталями получилось бы тогда, когда распре- распределение света в плоскости Р'Р' представлялось бы рядом Фурье с теми же коэф- коэффициентами. Однако для данной длины волны Я при дифракции на решетке перио- периода д, образуются главные максимумы только порядков не выше ттах = ^/Я, которые несут информацию о фурье-компонентах с пространственными периодами не меньше ^шп = ^/ттах = ^- Детали структуры решетки-объекта, пространственный масштаб которых меньше длины волны, не влияют на дифрагировавший свет. Кроме того, на изображении в плоскости Р'Р' отсутствуют и те пространственные гармоники вы- высоких порядков, которым соответствуют волны, дифрагировавшие на большие углы: если вт > м, где 2м — входная апертура объектива, эти волны не попадают в объек- объектив. Поэтому фактически максимальный порядок ттах пространственной гармоники, дающей вклад в изображение Р'Р\ определяется условием $твт = и*тах^/^ ^ 8тм> откуда ттах ^ (</8тм)/Я. Минимальный размер различимых деталей объекта равен периоду этой пространственной гармоники: /т1п = Л/ттах ^ Я/ §т и. Если между ре- решеткой и объективом находится среда с показателем преломления п (иммерсия), то в выражение для /т-п вместо Я нужно подставить длину волны в среде Х/п: П81ПМ G.43) 12 3ак 4498
354 7. Геометрическая оптика Это выражение отличается от полученного выше значения минимального разре- разрешимого расстояния для некогерентного освещения /т^ G.41) малосущественным числовым коэффициентом. Предел разрешения G.43) можно превзойти примерно вдвое, если использовать наклонное освещение. Пусть плоская волна падает на ре- решетку под углом и. Тогда неотклоненная волна (максимум нулевого порядка) пройдет в объектив вблизи края апертуры, а вблизи противоположного края пройдет пучок порядка 2/ятах, который обеспечит появление на изображении пространственных гармоник вдвое меньшего периода, чем при освещении вдоль оси. Следовательно, при наклонном когерентном освещении можно получить /т;п = 0,5А/(л8тм). Изложенные выше представления о дифракционном характере формирования изоб- изображения в оптической системе позволяют уяснить идею метода фазового кон- контраста, предложенного в 1935 г. Цернике для наблюдения совершенно прозрачных объектов, изменяющих только фазу, а не амплитуду падающего на них света. Таки- Такими свойствами обладают многие препараты, встречающиеся в биологии и медицине (тонкие срезы тканей). Традиционный метод, позволяющий сделать их изображе- изображение в микроскопе видимым, состоит в окрашивании, превращающем фазовый объект в абсорбционный. Красители проникают в разные структурные элементы препарата в неодинаковой степени, что создает заметные различия в поглощении света отдель- отдельными его участками. Однако красители нарушают нормальную жизнедеятельность тканей и микроорганизмов. Поэтому желательно сделать видимыми различия в пока- показателе преломления, воздействуя не на сам объект, а на пропускаемый им свет. Для этого нужно вносимые разными участками объекта изменения фазы световой вол- волны превратить на изображении в изменения ее амплитуды и, следовательно, интен- интенсивности. Рассмотрим прозрачный объект в виде одномерной фазовой решетки. Падаю- Падающая на нее по нормали плоская волна окажется промодулированной в пространст- пространстве по закону Е(х) = Еоехр[/<р(;с)], где (р{х) — вещественная периодическая функ- функция с периодом й. Главные дифракционные максимумы Ат (т = 0, ±1,...) фра- унгоферовой картины в фокальной плоскости объектива РР (см. рис. 7.33) соот- соответствуют отдельным фурье-компонентам (пространственным гармоникам) функ- функции Е{х). Проходящие через Ат дифрагировавшие волны интерферируют между собой и в сопряженной с решеткой плоскости Р'Р' дают результирующее свето- световое поле, воспроизводящее (в увеличенном масштабе) функцию Е(х). Впрочем, как уже отмечалось, воспроизведение будет не вполне точным, так как в нем участву- участвует ограниченное число фурье-компонент. Предположим, что объект (решетка) вно- вносит малые по сравнению с я сдвиги фаз между соседними участками. Тогда Е(х) можно приближенно записать в виде Е{х) « Ео[\ + 1<р(х)]. Постоянной составляю- составляющей Ео соответствует неотклоненная волна, образующая центральный максимум Ло. В методе фазового контраста в фокальную плоскость РР помещают прозрачную пластинку, в центре которой в том месте, где располагается максимум Ло, на- нанесен тонкий слой прозрачного вещества, изменяющий фазу проходящей волны на я/2. Для этого толщина слоя (с показателем преломления п) должна быть рав- равна |А(га— 1). Фазы других дифрагировавших волн, проходящих мимо слоя через точки А±\>А±2> • • -9 остаются без изменения. Поэтому воспроизводимое в плоскос- плоскости изображения Р'Р1 поле описывается функцией вида Е(х') = Ео[1 4- 1ф(х')]9 где
7.6. Разрешающая способность инструментов 355 х' = ух (у — поперечное увеличение). Оно соответствует объекту, вызывающему пространственную модуляцию амплитуды, а не фазы проходящей через него вол- волны. Интенсивность в плоскости изображения изменяется в зависимости от х1 по закону 1{х') « /0[1 4- 2<р(х')]9 т.е. вносимый элементом х объекта сдвиг фазы (р{х) превращается в пропорциональное изменение интенсивности и становится видимым на изображении. В предшествующем изложении в качестве объекта рассматривалась одномерная ди- дифракционная решетка лишь для наглядности и упрощения рассуждений. Все выводы остаются в силе для любых плоских структур. В общем случае проходящая через объект плоская волна оказывается промодулированной в плоскости ху объекта по амплитуде и фазе, так что ее комплексная амплитуда дается некоторой функци- функцией Е(х,у). Поле световой волны в плоскости ху можно разложить в двухмерный интеграл Фурье, т. е. представить в виде суперпозиции бесконечного числа плоских дифрагировавших волн. Комплексная амплитуда дифрагировавшей волны с волновым вектором к пропорциональна соответствующей фурье-компоненте (пространствен- (пространственной гармонике) Е(кх, ку) функции Е(х,у): Е{кхЛу) = ИЕ(х,у)е-1{к*х+куу)<1хйу. G.44) Каждой точке фокальной плоскости РР объектива (см. рис. 7.33) соответствует вполне определенное направление (в, (р) дифрагировавшей волны: кх = к зт в соз <р, ку = к 81П в 81П ср. Поэтому распределение амплитуды света в фокальной плоскости представляет собой фурье-образ G.44) функции Е(х9у). В оптической системе с ис- исправленными аберрациями оптические пути между всеми парами сопряженных точек одинаковы. Поэтому при интерференции волн в некоторой точке плоскости изобра- изображения Р'Р1 их сложение происходит с теми же относительными фазами, какие они имели в соответствующей точке (х,у) плоскости объекта РР. Распределение ампли- амплитуды света Е(х',уг) в плоскости изображения Р'РГ описывается (с точностью до масштаба) таким же интегралом Фурье, что и в плоскости ху: Е(х',у') = -^ Л Е(кх,ку)е^'+куУ'икхйку, G.45) где интегрирование по кх и ку, т.е. по направлениям в и (р дифрагировавших волн, производится в пределах, определяемых апертурой оптической системы. Так как в G.45) входят только те фурье-компоненты функции Е(х, у) объекта, которым соот- соответствуют прошедшие через оптическую систему дифрагировавшие волны, то рас- распределение амплитуды света Е{х',у') в плоскости изображения не дает точного воспроизведения функции объекта. Пространственные гармоники, соответствующие мелким деталям объекта, отсутствуют в формируемом системой изображении. По- Поэтому наименьший размер различимых деталей объекта зависит от апертуры опти- оптической системы. Если в фокальной плоскости РР объектива поместить экран с небольшим отвер- отверстием в центре, то он пропустит только дифрагировавший свет от крупных деталей объекта. Если же, напротив, экранировать центральный участок фокальной плос- плоскости, то будет проходить свет, соответствующий пространственным гармоникам
356 7. Геометрическая оптика сравнительно малого периода, что увеличит контраст мелких деталей на изобра- изображении. Помещая в фокальную плоскость специальные фильтры, можно изменять относительные амплитуды и фазы разных фурье-компонент и тем самым влиять на характер изображения (подобно тому, как это делается в методе фазового контраста). Такой метод фильтрации пространственных гармоник применяется в оптических системах обработки информации. Обычно для передачи сообщений (например, по радио или телевидению) исполь- используют несущую волну высокой частоты, которую модулируют во времени по ам- амплитуде или фазе существенно более низкими частотами (например, звуковыми час- частотами при передаче речи или музыки). В спектре модулированной волны по обе стороны от несущей частоты возникают «боковые полосы», которые и содержат весь объем передаваемой информации. Для получения информации приемник должен по возможности полно воспринять их. Формирование оптического изображения также можно интерпретировать как пе- передачу информации. В этом случае отображаемый объект осуществляет простран- пространственную модуляцию световой волны, вызывая появление дифрагировавших волн. Эти отклоненные на разные углы волны, подобно боковым полосам при временнбй модуляции, несут информацию о структуре объекта, о его пространственных гар- гармониках. Информация передается тем точнее, чем полноценнее используется ча- частотный спектр при временнбй модуляции и угловой спектр — при пространст- пространственной. Контрольные вопросы • Какие величины, характеризующие оптическую систему, определяют размер создаваемого ею дифракционного изображения точечного источника (диска Эйри)? • Когда два одинаковых точечных источника считаются, по Рэлею, разрешенными на изобра- изображении? В чем заключается условность этого критерия? • Чему равно минимальное угловое расстояние между одинаковыми звездами, разрешаемое объективом телескопа с диаметром О? Почему оно не зависит от фокусного расстояния объектива? • Какими преимуществами и недостатками обладают системы с разреженной апертурой, по- подобные звездному интерферометру? • Как нужно выбирать окуляр оптической системы для визуальных наблюдений, чтобы реа- реализовать разрешающую способность ее объектива? • Почему в телескоп звезды видны днем, когда их наблюдение невооруженным глазом невоз- невозможно? • С какой целью в сильных микроскопах применяют иммерсию? • Как теория Аббе объясняет зависимость разрешающей способности микроскопа от число- числовой апертуры объектива при когерентном освещении? • Можно ли с помощью оптического микроскопа обнаружить частицы, размер которых мень- меньше длины световой волны? • Объясните идею метода фазового контраста и метода фильтрации пространственных гар- гармоник.
7.7. Физические принципы голографии 357 7.7. Физические принципы голографии Голографией называют метод записи и последующего восстановления структуры световых волн, основанный на явлениях интерференции и дифракции когерентных пучков света. Как и фотография, она обеспечивает возможность записи, хранения и воспроизведения зрительных образов предметов. Однако обычная фотография дает лишь плоское изображение объемной картины, видимое из определенной точки. Рас- Рассматривая фотоснимок, невозможно заглянуть за предметы, находящиеся на перед- переднем плане. В отличие от фотографии голография позволяет записать и восстановить не двухмерное распределение освещенности в плоскости снимка, а рассеянные пред- предметом световые волны со всеми их характеристиками — направлением распростра- распространения, амплитудой, фазой, длиной волны. Восстановленные голограммой световые волны создают полную иллюзию реальности наблюдаемых предметов. Голограмма представляется наблюдателю окном, сквозь которое видно снятую объемную сцену во всей ее глубине. Близкие и далекие предметы видны одинаково четко. Изменяя точку зрения, можно видеть предметы в разных ракурсах. На голограмме регистрируется не оптическое изображение объекта, а интерфе- интерференционная картина, возникающая при наложении световой волны, рассеянной объ- объектом, и когерентной с ней опорной волны. Эта интерференционная картина фикси- фиксирует информацию о распределении амплитуд и фаз в предметной волне. Освещение голограммы восстанавливающей волной, идентичной с той, что служила опорной при регистрации, вызывает появление дифрагировавших волн, одна из которых представ- представляет собой более или менее точную копию волны, рассеянной предметом. Попадая в глаз наблюдателя, она создает такие же ощущения, как и при непосредственном рассматривании предмета. Идеи, лежащие в основе голографической записи и восстановления зрительной информации, были высказаны и продемонстрированы на опыте Габором в конце со- сороковых годов XX столетия. Для практической реализации голографии необходимы источники света с высокой пространственной и временнбй когерентностью. Поэто- Поэтому широкое распространение она получила лишь после создания лазеров, начиная с работ Лейта и Упатниекса A963) и Ю. Н. Денисюка A962-1963), предложившего записывать голограммы на толстослойных фотоэмульсиях, что позволяет восстанав- восстанавливать изображение в белом свете. Уяснить принцип голографии легче всего, рассматривая простейшие объекты. Наи- Наиболее прост для понимания случай голографической записи и восстановления плос- плоской волны. Пусть такая волна 7, исходящая от предмета, падает на фотопластинку под углом в' к нормали (рис. 7.35, а). Мгновенное распределение фаз световых ко- колебаний на поверхности пластинки зависит от направления волны, но светочувстви- светочувствительный слой способен зарегистрировать лишь среднее за время экспозиции распре- распределение освещенности. В результате пластинка окажется равномерно почерневшей. По степени почернения можно судить об амплитудах световых колебаний, но инфор- информация об их фазах полностью теряется. Определить направление воздействовавшей на фотопластинку волны / таким способом невозможно. Теперь представим себе, что на ту же фотопластинку одновременно с предмет- предметной волной 1 падает по нормали когерентная с ней плоская волна 2 (опорная,
358 7. Геометрическая оптика или референтная, волна). В результате их интерференции на поверхности фотопла- фотопластинки устанавливается стационарное распределение освещенности в виде системы параллельных эквидистантных полос, ориентированных перпендикулярно плоскости чертежа на рис. 7.35, а. Зависимость интенсивности от координаты х (см. п. 5.1) вы- выражается формулой 1(х) = /] + /2 4- 2у/Т^со&Щх), G.46) Г2 — интенсивности предметной и опорной волн, к = 2л/X — вол- где 1\ = 1 т=0 новое число, а Д(*)=;с8т0' — разность их хода (точка х — О выбрана там, где А = 0). Расстояние между соседними полосами, как следует из G.46), равно (I — 2л/(к 8Шв') = Я/ 8Ш0'. При правильном выборе экспозиции и режима обработки пластинки ее пропускание будет зависеть от х по тому же закону G.46), что и /(*), т. е. мы получим на голограмме дифракци- дифракционную решетку с синусоидальным пропус- пропусканием. Структура зарегистрированных на голограмме интерференционных полос со- содержит информацию о распределении фаз световых колебаний в предметной волне. Легко понять, как с помощью такой го- голограммы можно воспроизвести записан- записанную на ней предметную волну. Направим на голограмму восстанавливающую волну, идентичную с опорной волной 2, исполь- использовавшейся при записи (см. рис. 7.35, б). В результате ее дифракции на решетке с синусоидальным пропусканием возника- возникают (см. п. 6.5) три плоские волны: одна Рис. 7.35. Получение (а) и восстановление (б) Из них соответствует главному максимуму голограммы плоской волны порядка щ = 0 и распр0СТраняеТСя в на- правлении падающей волны, две другие — главным максимумам порядка т — ±1. Наибольший интерес для голографии пред- представляет волна с т = 1. Ее направление 0 определяется условием с1§тв = Я. Так как д. — Я/8Ш0', то 0 = 0', т.е. направление этой волны (как и все остальные характери- характеристики) точно такое же, как у предметной волны / при записи голограммы. Попадая в глаз наблюдателя при рассматривании голограммы, восстановленная волна вызы- вызывает при отсутствии предмета такие же ощущения, какие вызвала бы предметная волна при непосредственном его наблюдении. При голографировании сложного объекта его освещают когерентным лазерным пуч- пучком. Рассеянное объектом волновое поле можно в соответствии с теоремой Фурье представить в виде совокупности плоских волн. Каждая из них при интерференции с опорной волной, получаемой из того же лазерного пучка, создает на фотопластинке свою систему интерференционных полос с характерными для нее ориентацией и про- пространственным периодом. После проявления на голограмме образуется совокупность дифракционных решеток с синусоидальным пропусканием. Каждая из этих решеток на этапе восстановления при дифракции пучка, идентичного с опорным, формирует
7.7. Физические принципы голографии 359 соответствующую ей исходную элементарную плоскую волну. Это главный дифрак- дифракционный максимум с т = 1. Все восстановленные элементарные волны находятся в таких же амплитудных и фазовых соотношениях, как и при записи голограммы. Их совокупность воссоздает полное рассеянное объектом световое поле и вызывает те же зрительные образы, что и при непосредственном наблюдении объекта. Други- Другими словами, в том месте, где находился объект при записи голограммы, возникает его мнимое изображение. Кроме того, каждая элементарная система дифракционных полос (решетка) формирует еще две волны, соответствующие главным максимумам с т = О и т = — 1. Волны с т = 0 распространяются в направлении опорной вол- волны и не попадают в глаз наблюдателя при надлежащем его расположении. Волны с т = — 1 формируют, как показано ниже, еще одно (действительное) изображение объекта. Кроме совокупности дифракционных решеток, возникших при интерференции элементарных предметных волн с опорной, голограмма содержит дополнительную структуру, возникающую из-за интерференции элементарных предметных волн меж- между собой. Обычно опорная волна значительно интенсивнее предметных, так что эта структура выражена слабо. При восстановлении она приводит к образованию допол- дополнительных дифрагировавших волн, концентрирующихся вблизи направления опорной волны. Они не мешают наблюдению восстановленного голограммой мнимого изобра- изображения объекта, если угол падения опорной волны в достаточной степени отличается от углов падения предметных волн. К объяснению принципа голографии можно подойти и иначе, рассматривая про- процесс записи и восстановления сферических волн, рассеиваемых отдельными точками объекта. Интерференция сферической волны, исходящей из точки 5 (рис. 7.36, а), и когерентной с ней плоской опор- опорной волны, падающей по нормали а) на фотопластинку, приводит к об- образованию стационарной картины в виде концентрических колец. Ра- Радиальное распределение интенсив- интенсивности в интерференционной карти- картине опять дается формулой G.46), но разность хода А(х) между плос- плоской опорной волной и сфериче- сферической предметной зависит от х по закону 2 21/2 = (К2 + х2I/2 - К б) « х2/BК) (если в точке х — О раз- разность хода А = 0). Радиус хп п-го светлого кольца находится из усло- условия А(хп) = лЛ, откуда хп = \/2Кп\. Как раз такими должны быть ра- радиусы колец в зонной пластинке Френеля (см. п. 6.1) с фокусным расстоянием / = К. Отличие го- рис# 7.36. Запись (а) и восстановление (б) голограммы лограммы точечного источника от точечного источника
360 7. Геометрическая оптика а) зонной пластинки, показанной на рис. 6.5, состоит только в том, что переход от свет- светлых колец к темным происходит в соответствии с G.46) плавно, по синусоидальному закону. На стадии восстановления полученную голограмму освещают плоской волной, идентичной с опорной (см. рис. 7.36,6). Как и в случае зонной пластинки, в результа- результате дифракции возникают кроме проходящей прямо волны сходящаяся и расходящаяся сферические волны. Из-за плавного перехода от светлых колец к темным здесь об- образуются, как и у дифракционной решетки с синусоидальным пропусканием, только три главных максимума т = 0, ±1. Центр расходящейся дифрагировавшей волны 5' расположен как раз в том месте, где находился точечный источник 5 при записи голограммы. В самом деле, когда продолжения дифрагировавших лучей пересекают- пересекаются в 5', разность хода между лучами от соседних светлых колец голограммы равна длине волны Я. Это эквивалентно отсутствию разности хода вообще, и такие лу- лучи будут восприниматься глазом как выходящие из точки 5'. Они образуют мнимое изображение источника. Наблюдатель видит сквозь голограм- голограмму находящийся в 5' точечный источник, хотя никакого источника там нет. Возникающая при дифракции восстанавливающего пучка на голо- голограмме расходящаяся сферическая волна созда- создает такой же зрительный образ, как и исходная предметная волна. Сходящаяся дифрагировавшая волна создает в точке 5" действительное изоб- изображение точечного источника. Так как здесь пе- пересекаются сами дифрагировавшие лучи, а не их продолжения, действительное изображение мож- можно получить на помещенном в это место экране в виде светлого дифракционного кружка. Оно формируется голограммой без помощи линз или зеркал. В схеме на рис. 7.36, б для наблюдения мни- мнимого изображения 5/; глаз должен располагаться выше или ниже голограммы, так как в противном Рис. 7.37. Схема получения (а) и вое- СЛуцас прошедшая прямо или сходящаяся волна становления (б) голограммы предмета ^ г г тт _ создают сильные помехи. Чтобы избежать этого, используют угловое разделение прошедшей и ди- дифрагировавшей волн при наклонном падении опорной волны. Возможная схема за- записи и восстановления приведена на рис. 7.37. Параллельный пучок лазерного из- излучения, предварительно расширенный простой оптической системой, направляется на объект и расположенное рядом с ним зеркало. Отраженная зеркалом волна коге- когерентна с волнами, рассеянными предметом, и используется в качестве опорной. При восстановлении прошедшая прямо волна и дифрагировавшие волны, образующие мнимое 5' и действительное 57/ изображения, оказываются хорошо разделенными в пространстве, что позволяет без помех наблюдать мнимое изображение. Сложный объект, рассеивающий когерентный лазерный свет, можно рассматривать как совокупность точечных источников, испускающих сферические волны. В резуль-
7.7. Физические принципы голографии 361 тате их интерференции с опорной волной на голограмме возникает сложный узор в виде наложения элементарных зонных решеток. На этапе восстановления при ди- дифракции опорной волны каждая такая решетка формирует волну, расходящуюся от центра, где находилась соответствующая рассеивающая свет точка предмета при за- записи голограммы. Совокупность этих волн, создающих мнимое изображение всего объекта, неотличима от волн, рассеянных объектом при записи, так как характеризу- характеризуется тем же распределением амплитуд и фаз. Поэтому голограмма полностью восста- восстанавливает его объемную структуру и передает не только видимое пространственное расположение предметов, но и эффект параллакса, заключающийся в изменении это- этого расположения при перемещении точки наблюдения. Совокупность сходящихся волн, возникающих при дифракции восстанавливающей волны на голограмме, без всяких линз формирует действительное изображение пред- предмета. Увидеть его можно лишь при определенном положении глаза, когда изображе- изображение находится между голограммой и глазом. При этом изображение предмета рас- рассматривается с задней стороны и выпуклые места предмета выглядят на нем как во- вогнутые, и наоборот, т. е. изображение будет как бы вывернутым (псевдоскопическим). Важное свойство голограмм заключается в том, что восстановить предметную волну можно с помощью небольшого участка голограммы. В случае голограммы плоской волны это свойство очевидно: если закрыть часть дифракционной решетки, то направ- направление дифрагировавших волн останется прежним. При этом лишь уменьшится их ин- интенсивность и несколько увеличится ширина главных максимумов. Этот вывод спра- справедлив и для зонной пластинки, небольшую часть которой можно рассматривать как дифракционную решетку с искривленными штрихами и постепенно изменяющимся периодом. Изменение шага решетки приводит к локальным изменениям направления дифрагировавших пучков, так что любой участок зонной пластинки восстанавливает часть одной и той же сферической волны. В отличие от обычной фотографии, где информация о какой-либо точке предмета фиксируется в одной определенной точке, каждый участок голограммы содержит в закодированной форме информацию о всех точках предмета, так как при ее записи свет, рассеянный каждой точкой предмета, обычно падает на всю поверхность фотопластинки. По мере уменьшения размеров голограммы лишь ухудшается разрешающая способность и сужается поле зрения. Наблюдение мнимого изображения фактически эквивалентно рассматриванию са- самого предмета через отверстие, совпадающее с рабочей частью голограммы. При фиксированном положении глаза используется только часть дифрагировавшего из- излучения, ограниченная действующим конусом лучей, попадающих в глаз. Ясно, что при рассматривании определенной точки предмета в этом конусе распространяется свет, претерпевший дифракцию на небольшом участке голограммы (см. рис. 7.37). Если изменить положение глаза, изображение той же точки будет восстанавливаться другим участком голограммы. Создаваемое голограммой изображение (мнимое или действительное) точки пред- предмета, как и в любой другой оптической системе, имеет вид дифракционного пят- пятна, размеры и форма которого определяются раствором (угловой апертурой) пучка дифрагировавшего на голограмме света, формирующего изображение точки. Ми- Минимальное расстояние 1т1п между близкими точками предмета, разрешимыми на изображении, как и для случая когерентного освещения в микроскопе, дается
362 7. Геометрическая оптика выражением G.43): 1тт= Л/&\пи (или 1т{п= Л/B$ти) при наклонном падении опорной волны). Здесь 2и — угол, под которым из места расположения точек пред- предмета видна действующая часть голограммы. При визуальном наблюдении мнимо- мнимого изображения глаз пропускает лишь часть восстановленной голограммой волны (рис. 7.36), действующая часть голограммы (и апертура 2и) ограничена не размером голограммы, а конусом попадающих в глаз дифрагировавших лучей. В этом случае предельное разрешение определяется глазом, т.е. разрешающая способность голо- голограммы полностью не используется. До сих пор предполагалось, что светочувствительный слой, регистрирующий ин- интерференционную картину, полностью передает все ее детали. Для этого требуется фотографическая эмульсия высокого качества. Если опорная волна падает на плас- пластинку под углом 0, а предметная — приблизительно по нормали, то соседние интер- интерференционные полосы проходят на расстоянии й = Я/ аш в. Чтобы при восстанов- восстановлении прямая волна (т = 0) не мешала наблюдению мнимого изображения, угол в должен быть достаточно большим. Уже при в « 20° расстояние между полосами й « 2 мкм, т. е. 500 полос на 1 мм, а при встречном направлении опорной и предмет- предметной волн (метод Ю.Н. Денисюка, см. ниже) */ = А/2, что соответствует примерно 3000 полос на 1 мм. Применяемые в обычной фотографии фотоматериалы позволя- позволяют зарегистрировать около 100 штрихов на 1 мм. Чтобы размер зерна не ограничи- ограничивал разрешающей способности голограмм, специально для голографии разработаны мелкозернистые фотоэмульсии, регистрирующие несколько тысяч линий на 1 мм. Для восстановления изображения в равной мере пригодны как позитив, так и нега- негатив голограммы. В случае зонной пластинки это очевидно: действие ее одинаково как при четных, так и при нечетных открытых зонах Френеля. В общем случае это следует из теоремы Бабине, согласно которой дополнительные экраны создают оди- одинаковые дифракционные картины в тех местах, куда не попадает прямая волна (вос- (восстанавливающий пучок). Важно только, чтобы амплитудное пропускание голограммы линейно зависело от освещенности зарегистрированной на ней интерференционной картины. Тогда при записи плоской волны получается дифракционная решетка с си- синусоидальным пропусканием, которая даст при восстановлении главные максимумы только порядков т — 0,*±1. В противном случае функция пропускания будет иметь пространственные гармоники более высоких порядков т = ±2, ±3,..., которые при- приведут на стадии восстановления к возникновению соответствующих главных дифрак- дифракционных максимумов, т.е. дополнительных мнимых и действительных изображений предмета. В голографии они играют роль помех. Наряду с рассмотренными выше амплитудными голограммами применяют и про- прозрачные фазовые голограммы, в которых интерференционный узор зафиксирован в изменениях не коэффициента поглощения, а показателя преломления (оптической толщины) регистрирующего слоя. Это достигается соответствующей химической об- обработкой (отбеливанием) светочувствительного материала. Такая голограмма при- приводит к пространственной модуляции фазы восстанавливающей волны, из-за чего возникают дифрагировавшие волны. Они создают, как и в случае амплитудной голо- голограммы, мнимое и действительное изображения предмета. Опорная волна при записи голограммы должна быть когерентна со светом, рассе- рассеянным всеми точками объекта. Для получения голограммы большого объекта необ-
7.7. Физические принципы голографии 363 ходимо излучение с высокой степенью временной и пространственной когерентно- когерентности. Длина когерентности должна превосходить максимальную разность хода между опорной и предметными волнами, которая для трехмерного объекта практически совпадает с его размерами. Размеры области пространственной когерентности долж- должны быть больше размеров голограммы. Одновременное выполнение этих условий возможно только при использовании лазерного излучения. Для получения четкой интерференционной картины при записи голограммы необходимо также обеспечить во время экспозиции неподвижность всех элементов с точностью до долей длины волны. гСогда пучок света при восстановлении идентичен опорному пучку, использованно- использованному при записи, мнимое изображение расположено там же, где находился предмет, и полностью ему подобно. Но в стадии восстановления можно использовать свет с другим направлением распространения. Если восстанавливающий пучок повернуть на небольшой угол, направления пучков, образующих действительное 5' и мнимое 57/ изображения, повернутся на такой же угол. Изобра- Изображения 5' и 5" расположены симметрично относитель- относительно плоскости Я, перпендикулярной направлению вос- восстанавливающего пучка (рис. 7.38). На стадии восстановления можно использовать мо- монохроматический свет с другой длиной волны, неже- нежели при записи. Тогда линейный размер восстановлен- восстановленного изображения будет отличаться от размера пред- предмета и оно будет находиться от голограммы на ином расстоянии. В качестве опорного и восстанавливаю- восстанавливающего излучений можно использовать не только плос- ^^ ^*?8. Расположение изображе- , ~ ний объекта при восстановлении кие, но и сферические волны. Однако во всех случаях, голограммы когда восстанавливающая волна не идентична опор- опорной волне, использованной при записи, пучки дифра- дифрагировавших на голограмме лучей, формирующие изображения отдельных точек пред- предмета, перестают быть гомоцентрическими. Восстановленному изображению в боль- большей или меньшей степени присущи сферическая аберрация, кома, астигматизм, дис- торсия и хроматизм, аналогичные соответствующим аберрациям оптических систем (см. п. 7.5). При изложении предполагалось, что толщина светочувствительного слоя много меньше пространственного периода регистрируемой на голограмме интерференци- интерференционной картины. Такие голограммы называют плоскими (двухмерными). Если тол- толщина слоя регистрирующей среды существенно превосходит этот период, говорят об объемной (трехмерной) записи. Для уяснения особенностей толстослойных голо- голограмм рассмотрим простейший случай интерференции плоских опорной и предмет- предметной волн с волновыми векторами к2 и к^ Как было показано в п. 5.1, поверхности равной интенсивности представляют собой эквидистантные плоскости Кг = сопз*, перпендикулярные вектору К = к2 — к] (см. рис. 5.2) и отстоящие на расстояние А(х) =А/[2мп(а/2)], где а — угол между к] и к2 (см. E.5)). После проявления в толще фотоэмульсии на месте максимумов интенсивности образуется система полупрозрачных зеркальных плоскостей, расположенных параллельно биссектрисе
364 7. Геометрическая оптика угла между направлениями опорной и предметной волн (рис. 7.39, а). Будем для простоты пренебрегать преломлением света в материале эмульсии, считая рассто- расстояние между плоскостями равным Ад:. Пусть на голограмму падает плоская волна с длиной волны Я' (рис. 7.39,6), направление которой, как и у опорной, составляет угол а/ 2 с зеркальными плоскостями. Легко видеть, что разность хода волн, отра- отраженных соседними плоскостями под таким же углом а/2, составляет 2Дх &т(а/2). Если подставить сюда Ал: = Я/[28т(а/2)], то получим, что разность хода равна Я, т.е. длине волны излучения, использованного при записи голограммы. Чтобы эти волны при многолучевой интерференции усиливали друг друга, должно выполнять- выполняться условие Я' = Я. Если Я' ф Я, то отраженные разными плоскостями волны имеют всевозможные разности фаз и не дают конструктивной интерференции. При осве- освещении пучком белого света в восстановлении изображения участвуют только волны с Я' = Я. Таким образом, на стадии восстановления толстослойная голограмма дей- действует как интерференционный фильтр, выделяя из падающего света излучение с той длиной волны, которая использовалась при записи. Конечно, такой фильтр характеризуется ограниченным спектральным разрешением, и выделяемое им излу- излучение не столь монохроматично, как при записи. Чем больше отражающих слоев содержит объемная голограмма, тем выше степень монохроматичности восстанов- восстановленного пучка. Если восстановление производится монохроматическим светом с той же длиной волны, что и при записи, то отраженные зеркальными слоями волны лишь тогда бу- будут находиться в фазе и при интерфе- ренции усилят друг друга, когда на- направление восстанавливающего пуч- пучка совпадает с опорным. Голограмма действует как оптический коллима- коллиматор. Отраженные волны, как видно из рис. 7.39, б, имеют при этом то же направление, что и предметная волна. Поэтому толстослойная го- голограмма восстанавливает лишь од- одно (мнимое) изображение предме- предмета. Для получения действительного изображения восстанавливающий пу- пучок должен иметь направление, про- противоположное опорному, т.е. должен освещать голограмму с обратной стороны. При этом восстанавливается волна с такой же формой волновых поверхностей, что и предметная, но с противоположным направлением распространения. Иначе можно сказать, что в процессе восстановления реализуется обращение волнового фронта предметной волны. Изображение получается в том же месте, где находился предмет. Особенности объемной голограммы как интерференционного фильтра проявля- проявляются наиболее сильно, когда отражающие поверхности располагаются почти парал- параллельно границам эмульсионного слоя, т.е. когда опорная и предметные волны рас- распространяются почти навстречу. Такое расположение (рис. 7.40) используется в ме- методе, предложенном Ю.Н. Денисюком. Плоская опорная волна лазерного излуче- излучения падает на фотопластинку со стороны стекла и, проходя через фотослой толщи- Длг81п(а/2) Рис. 7.39. К объяснению свойств толстослойных голограмм
7.7. Физические принципы голографии 365 \ ной 15—20мкм, освещает предмет. Рассеянные предметом волны распространяются почти навстречу опорной волне и при интерференции с ней образуют в толще фо- фотоэмульсии системы из нескольких десятков параллельных полупрозрачных отража- отражающих слоев. При освещении белым светом такая голограм- голограмма восстанавливает только одно изображение. Из-за усадки фотоэмульсии в процессе химической обработки простран- пространственный период регистрируемой трехмерной интерферен- интерференционной структуры уменьшается и цвет восстановленного изображения отличается от опорного лазерного излучения сдвигом в сторону синего конца спектра. При изменении направления восстанавливающего пучка цвет изображения изменяется. Изображение в натуральных цветах можно получить, ес- если на одной объемной голограмме зарегистрировать интер- рис 7.40. Схема получения ференционные картины при освещении предмета излучени- толстослойной голограммы ем, имеющим в своем спектре три монохроматические ли- по методу Ю.Н.Денисюка нии (красную, зеленую и синюю), которые вместе вызыва- вызывают ощущение белого света. При восстановлении с помощью источника белого света возникают три совмещенных изображения предмета в трех спектральных цветах, воспринимаемые глазом как одно объемное изображение, передающее натуральную окраску предмета. Из многочисленных практических применений голографии отметим прежде все- всего голографическую интерферометрию, позволяющую наблюдать интерференцию волн, зарегистрированных в разные моменты времени. Используя один и тот же опорный пучок, на одной фотопластинке можно дважды последовательно запечат- запечатлеть рассеянные предметом волны. Если между экспозициями какие-то части пред- предмета несколько сместились или деформировались, то при восстановлении две одно- одновременно возникающие когерентные предметные волны будут иметь определенную разность хода и изображение поверхности предмета будет покрыто системой интер- интерференционных полос (рис. 7.41), аналогичных обычным полосам равной толщины. По расположению этих полос можно судить об изменениях предмета между экс- экспозициями. Замечательно, что изучаемый предмет может при этом отражать свет диффузно, иметь сложный рельеф и шероховатую поверхность, так как все эти фак- факторы одинаково влияют на обе восстанавливаемые предметные волны. Несмотря на очень сложную форму волновых поверхностей, эти волны вполне подобны и создают простые и легко наблюдаемые интерференционные полосы. Методом двойной экспозиции можно исследовать и изменения, происходящие в прозрачных (фазовых) объектах (см. рис. 7.41). На пути просвечивающего объ- объект пучка ставят прозрачный рассеивающий экран (матовое стекло), чтобы свет от каждой точки объекта попадал на всю поверхность голограммы. Так как этот экран и объект неподвижны и экспонируются дважды, их оптические неоднородности, сколь сложными бы они ни были, никак не влияют на расположение интерференцион- интерференционных полос, наблюдаемых на восстановленном изображении. Эти полосы характери- характеризуют локальные изменения оптической толщины объекта между двумя экспозиция- экспозициями. В противоположность этому в традиционной интерферометрии для выполнения
366 7. Геометрическая оптика аналогичных измерений поверхности объекта должны обладать высокими оптически- оптическими качествами. В другом варианте метода на голограмме регистрируют волну, рассеянную объек- объектом только в некотором начальном состоянии. Затем при восстановлении полученной голограммы объект не удаляют, а освещают так же, как и при регистрации голо- голограммы. В результате возникают две волны: распространяющаяся от самого объекта в данный момент и восстановленная голограммой предметная волна, соответствую- соответствующая начальному состоянию объекта. Непрерывно наблюдая создаваемую этими коге- когерентными волнами интерференционную картину, можно судить о происходящих с течением времени изменениях состояния объекта. Такой метод называют голографиче- ской интерферометрией реального времени. Применение голографии в микроскопии позволяет преодолеть серьезный недостаток микроскопа при силь- сильном увеличении — очень малую глубину резкости изоб- изображения. Вместо того чтобы регистрировать изображе- изображение, можно записать на голограмме проходящую через микроскоп предметную волну. При восстановлении та- такой голограммы можно наблюдать находящиеся в разных плоскостях детали предмета, перемещая только оптичес- оптическую систему наблюдения. Используя вместо когерентного света ультразвуковые волны, можно получить акустическую голограмму. Звук проникает в оптически непрозрачные предметы. Поэтому акустическая голограмма позволяет восстановить трех- трехмерное изображение внутренних частей предмета, напри- например органов человеческого тела или глубин океана, что Рис. 7.41. Интерференцион- открывает широкие перспективы для применений в меди- ные полосы, наблюдаемые при цине, в подводных исследованиях, геофизике, археологии, п^™" Х°КГй Специально изготовленные голограммы могут исполь- экспозиции зоваться в качестве определенных оптических элементов. Голограмма—зонная решетка может выполнять некото- некоторые функции линзы, голограмма—дифракционная решетка может служить дисперги- диспергирующим элементом спектрального прибора, а толстослойная голограмма с парал- параллельными отражающими слоями — интерференционным фильтром и т. п. С помощью одной голограммы можно записать и восстановить огромное коли- количество информации. Большое число независимых сведений, регистрируемых голо- голограммой, внешне проявляется в чрезвычайной сложности ее структуры. Под микро- микроскопом такая голограмма производит впечатление хаотического набора пятен все- всевозможной формы и ориентации в отличие от регулярной структуры голограммы простейшего объекта. Очень важно, что декодирование этой огромной информации на этапе восстановления происходит просто и чрезвычайно быстро. Способность голографии к регистрации, хранению и быстрому преобразованию информации от- открывает перспективы создания новых систем памяти для компьютеров, оптических систем обработки данных, систем распознавания образов и символов с помощью оптической фильтрации сигналов.
7.7. Физические принципы голографии 367 Контрольные вопросы • В чем заключается основная идея голографической записи зрительных образов? • Как выполняется декодирование информации, зарегистрированной на голограмме? • Какими преимуществами обладает голография по сравнению с обычной фотографией? • Объясните физическую сущность записи и восстановления голограммы на примере плоской предметной волны. • Какой вид имеют интерференционные полосы на голограмме точечного источника? В чем сходство и различие такой голограммы и зонной пластинки Френеля? • Почему целесообразно использовать наклонное падение опорной волны на голограмму? • Какие требования предъявляются в голографии к источнику света и к регистрирующей среде (фотоэмульсии)? • В каких случаях возникают аберрации восстанавливаемого голограммой изображения? • Какими преимуществами обладают толстослойные голограммы? • Что дает применение голографии в интерферометрии и микроскопии? в системах оптичес- оптической обработки информации?
Оптика движущихся сред В этой главе основное внимание сосредоточено на оптических явлениях, в которых или источник света, или наблюдатель, или среда движутся относительно друг друга. Закономерности таких явлений могут быть существенно иными, чем в случае, когда эти тела покоятся. Длительный путь развития оптики движущихся тел привел в начале XX столетия к созданию частной теории относительности — фундаментальной физической теории, лежа- лежащей в основе современной научной картины физического мира. Исчерпывающее решение основных проблем оптики движущих- движущихся тел фактически содержится уже в первой работе Эйнштейна «К электродинамике движущихся тел» с изложением основ те- теории относительности 1905). Теория относительности базируется не на гипотезах, а на твердо установленных на опыте принципах (постулатах). Боль- Большую роль в их становлении сыграли оптические опыты с дви- движущимися телами и попытки теоретической интерпретации их результатов. Но наше убеждение в полноте экспериментально- экспериментального обоснования теории относительности основано не на отдель- отдельном опыте или группе опытов, а на всей совокупности опы- опытов, результаты которых подтверждают ее постулаты и след- следствия из них. Наиболее точные опыты относятся к физике вы- высоких энергий (например, столкновения релятивистских частиц, ядерные превращения), а не к оптике движущихся тел. В наши дни сомневаться в справедливости теории относительности — это то же самое, что сомневаться в реальности ускорителей заряженных частиц или атомных электростанций. Но фунда- фундаментальность представлений теории относительности и пара- парадоксальность ее следствий до сих пор приводят к попыткам ее пересмотра. Поэтому не прекращается и постановка новых опы- опытов (в том числе и оптических) с использованием усовершен- усовершенствованных приборов и новых эффектов для проверки основных принципов теории относительности.
8.1. Безуспешные поиски «светоносной среды» 369 8.1. Безуспешные поиски «светоносной среды» Вопрос о законах оптических явлений в случае движущихся тел возник задолго до создания электромагнитной теории света. Высказанная Гюйгенсом мысль о волновой природе света требовала введения особой среды, в которой могли бы распространять- распространяться световые колебания. Эту среду Гюйгенс назвал эфиром. Так в физике возникло понятие, несостоятельность которого была окончательно установлена лишь теорией относительности. Убедительное подтверждение волновая теория света получила в начале XIX в., когда на ее основе было дано исчерпывающее объяснение явлениям интерферен- интерференции и дифракции. Открытие поляризации света свидетельствовало о поперечности световых волн. В рамках механической волновой теории, рассматривавшей свет по аналогии со звуковыми волнами, эфир пришлось наделить механическими свойства- свойствами твердого тела, так как поперечные упругие волны могут распространяться только в твердых телах. Конечно, это была странная среда: заполняя все пространство и про- пронизывая все тела, она при этом никак не влияла на их движение. Но даже если оставить в стороне трудный вопрос непротиворечивого объяснения столь экзотических свойств эфира, со всей остротой вставала задача обнаружения связанной с ним системы отсчета. Движение тел относительно эфира можно было бы рассматривать как некоторое абсолютное движение. Пришедшая на смену старой волновой теории электромагнитная теория света практически не внесла ничего нового в постановку этого вопроса. Рассматривая свет как частный вид электромагнитных волн, она позволила обойтись без противоречи- противоречивых механических представлений об эфире, но не затронула предположения о воз- возможности определять движение тел относительно эфира. Считалось, что уравнения Максвелла справедливы в определенной системе отсчета, за которой и сохранилось название эфира. Задача экспериментального обнаружения этой привилегированной системы отсчета по-прежнему оставалась актуальной. Предполагалось, что при пе- переходе к другой инерциальной системе отсчета уравнения Максвелла в отличие от уравнений механики Ньютона должны изменить свой вид. Другими словами, счи- считалось, что принцип относительности, т.е. утверждение об эквивалентности всех инерциальных систем отсчета, выполняется только для механических явлений и не справедлив для электромагнитных и оптических явлений. Гипотеза о существовании эфира как выделенной системы отсчета выдвигала по- постановку ряда опытов в целях выяснения законов распространения света в телах, движущихся относительно эфира, и опытов, связанных с движением наблюдателя относительно эфира. Результаты этих опытов вскрыли противоречия в самом по- нятии эфира и привели в конечном счете к отказу от представлений о возможности определить «абсолютное» движение тел с помощью оптических явлений. Принцип относительности был распространен не только на механические явления, но и на все явления вообще. Было признано также, что скорость света в пустоте имеет универ- универсальное значение, одинаковое во всех инерциальных системах отсчета. Эти утверждения — принцип относительности, распространенный на все явле- явления, и существование предельной скорости распространения сигналов, совпадающей со скоростью света в пустоте и одинаковой во всех системах отсчета, — и составля- составляют содержание двух принципов, или постулатов, лежащих в основе частной теории относительности.
370 8. Оптика движущихся тел Влияние движения тел на оптические явления впервые было обнаружено в астроно- астрономических наблюдениях. В 1676 г. Ремер при наблюдении периодических затмений га- лилеевых спутников Юпитера заметил, что времена их обращения возрастают, когда Земля в своем орбитальном движении удаляется от Юпитера, и уменьшаются, ког- когда она приближается. Ремер объяснил изменения наблюдаемых периодов обращения конечной скоростью света (см. п. 2.11). Орбитальное движение Земли приводит также к явлению звездной аберра- аберрации, которое было открыто Брэдли A725-1728). В своих наблюдениях он пы- пытался обнаружить годичный параллакс, т.е. кажущуюся траекторию, которую опи- описывает проекция звезды на небесный а) АХ(ГГГ^ б) свод из-за изменения положения наблю- наблюдателя при движении Земли по орбите (рис. 8.1, а). В общем случае такая тра- траектория должна быть эллипсом, выро- вырождающимся в окружность для звезды, расположенной вблизи полюса эклипти- эклиптики (как на рис. 8.1, а), или в отрезок пря- прямой для звезды, лежащей в плоскости эклиптики. Брэдли нашел, что звезда ^ ^^ действительно описывает эллипс, боль- шая ось которого равна 41", однако на- Рис. 8.1. Отклонение наблюдаемого положе- правление углового отклонения звезды ния звезды из-за параллакса (а) и аберрации (б) совершенно иное> чем должно быть при параллаксе (рис. 8.1,6): когда Земля на- находится в точке А, ее наблюдаемое положение смещено не в точку Ар а в точку А2, т. е. отклонение происходит в направлении движения Земли. Кроме того, отклонение не зависит от расстояния до звезды и значительно больше, чем параллактическое смещение даже ближайших звезд. Существование параллакса неподвижных звезд бы- было твердо установлено Бесселем лишь сто лет спустя. Найденное Брэдли объяснение аберрации опирается на то, что свет распространя- распространяется с конечной скоростью. При движении наблюдателя кажущееся направление на звезду отличается от истинного подобно тому, как отвесно падающий дождь кажется косым наблюдателю в движущемся вагоне. Угол отклонения равен у/с (при V <С с). Через полгода направление движения Земли изменится на противоположное и ка- кажущееся положение звезды будет смещено на такой же угол в противоположную сторону. Разность видимых направлений составит 2ь/с. Учитывая, что V = 30 км/с, с = 3 • 105 км/с, получаем 2ь/с = 2 • 10~4 = 41"; это совпадает с измеренным значе- значением полного смещения. Из своих наблюдений Брэдли сделал важный вывод о равен- равенстве скоростей света от разных звезд. Отметим, что наблюдение аберрации возможно лишь потому, что Земля в своем орбитальном движении изменяет направление ско- скорости. Наблюдаема не сама аберрация, а ее изменение. Если бы Земля двигалась прямолинейно и равномерно, ни о каком обнаружении аберрации земным наблюда- наблюдателем не могло бы быть и речи. Брэдли в своем объяснении аберрации исходил из корпускулярной картины рас- распространения света. Такой же результат получается и из волновой теории (впервые это было показано Юнгом), если считать, что «светоносная среда» покоится в гелио- гелиоцентрической системе отсчета. К представлению о «неподвижном эфире» приводят
8.1. Безуспешные поиски «светоносной среды» 371 и наблюдения за изменением периодов затмений спутников Юпитера, т. е. измерения скорости света по методу Ремера, выполненные при разных положениях Юпитера на эклиптике. Если эфир неподвижен в гелиоцентрической системе, то орбитальное движение Зем- Земли должно вызывать «эфирный ветер». Первые попытки его обнаружения на опыте были сделаны Араго в 1810 г. Араго наблюдал преломление света от неподвижной звезды в призме, когда Земля, а вместе с ней и призма, двигалась к звезде и от звез- звезды. При разных направлениях движения призмы относительно неподвижного эфира должен быть различен ее показатель преломления. Араго не обнаружил ожидаемо- ожидаемого эффекта, и хотя точность его опытов была недостаточна, он интуитивно сделал правильный вывод о том, что никакой зависимости от движения Земли нет. Этот отрицательный результат легко объяснить, предположив, что эфир полно- полностью увлекается движущейся Землей, но тогда возникают непреодолимые трудности в объяснении аберрации. Выход из противоречий был найден Френелем на основе гипотезы о том, что плотность эфира в прозрачных телах больше, чем в пустоте (при неизменной упругости). Такое предположение вместе с требованием неразрывности эфира приводило к заключению о том, что внутри движущегося тела с показате- показателем преломления п, где эфир уплотнен, его скорость относительно тела в п2 раз меньше, чем снаружи. Иначе об этом можно говорить как о частичном увлечении эфира движущимся телом с коэффициентом увлечения 1 - \/п2. Объяснение абер- аберрации при этом не претерпевает никаких изменений (при п = 1 эфир остается непо- неподвижным), и в то же время движение тел (вместе с наблюдателем) относительно эфира не оказывает влияния на любые оптические явления в первом порядке по \)/с. Во втором порядке это влияние должно проявиться, но при максимальной доступ- доступной скорости тел относительно эфира — скорости орбитального движения Земли — (ь/сJ = 10~8, что лежит за пределами достижимой точности таких экспериментов. Таким образом, френелевский коэффициент увлечения объясняет отрицательные ре- результаты опытов, в которых среда движется вместе с наблюдателем относительно эфира. При этом безразлично, делается ли опыт со светом от звезды или от земно- земного источника, так как по волновой теории (в отличие от корпускулярной) скорость света не зависит от движения источника.*) Прямое измерение коэффициента увлечения возможно в опытах, где изучается рас- распространение света в телах, движущихся относительно наблюдателя. Такие опыты с движущейся водой были выполнены Физо в 1851г. и повторены с большей точ- точностью Майкельсоном и Морли в 1886 г. Луч света от источника 5 расщепляется полупрозрачной пластинкой Р (рис. 8.2) на два луча, один из которых распростра- распространяется в трубах по направлению течения воды, другой — против. Затем эти лучи соединяются и дают систему интерференционных полос, наблюдаемую в зрительную трубу. Смещение полос по сравнению с их положением при неподвижной воде позво- позволяет измерить вносимую движением воды разность хода и тем самым найти скорость света в движущейся воде. В покоящейся воде скорость света с/п. Результаты опытов * > Вопрос о зависимости скорости света от движения источника, на который волновая теория давала определенно отрицательный ответ, вновь возник значительно позже, в полемике Ритца с Эйнштейном по основам теории относительности. В 1913 г. де Ситтер указал, что независимость скорости света от дви- движения источника с высокой точностью вытекает из наблюдений за двойными звездами (безотносительно к принятой теоретической концепции — волновой или корпускулярной).
372 8. Оптика движущихся тел совершенно определенно показали, что в воде, движущейся со скоростью у, скорость света определяется выражением с Л 1 \ и= - + у 1 - -=• , п V п2 (8.1) полностью соответствующим выводу Френеля о частичном увлечении эфира. Электромагнитная теория света, отказавшись от механического эфира, сохранила представление о существовании выделенной системы отсчета, в которой справедли- справедливы уравнения Максвелла и скорость света в пу- пустоте по всем направлениям равна с. Изменение скорости света в неподвижном веществе и = с/п в электронной теории Лоренца объяснялось как макроскопический эффект, обусловленный выну- вынужденными колебаниями входящих в его состав зарядов. Введенное Френелем чисто феномено- Рис. 8.2. Схема опыта Физо логически частичное увлечение эфира движущи- движущимися телами получает при этом простое физиче- физическое истолкование. По Лоренцу, эфир неувлекаем и внутри тел; увлекаются, т. е. движутся вместе с телом, только заряды, из которых оно построено. Макроскопически это движение зарядов приводит к появлению фре- нелевского коэффициента увлечения 1 — \/п2. Еще одно важное открытие, хорошо укладывавшееся в схему неподвижного, неувле- каемого эфира, — теоретически предсказанный в 1842 г. Доплером эффект влияния движения источника волн или наблюдателя на воспринимаемую частоту. Элемен- Элементарное объяснение эффекта предполагает определенную скорость с распространения волн относительно эфира, подобно скорости звука в неподвижной среде (например, в воздухе). Тогда частота со воспринимаемых наблюдателем колебаний связана с час- частотой &>0 колебаний в источнике соотношением „ = ^1^, (8.2) где 1>! и у2 — проекции скорости наблюдателя и источника относительно среды на направление от источника к наблюдателю. Формула (8.2) дает разные результаты в зависимости от того, движется источник или наблюдатель, но это различие сказыва- сказывается лишь начиная с членов второго порядка по ух/с и У2/с. В первом порядке сдвиг частоты Асо = со — со0 определяется только относительной скоростью у = 1>1 — у2, а именно Асо /со « — (у^ — у2)/с = —у/с. Эффект Доплера получил опытное под- подтверждение как в астрономических, так и в лабораторных наблюдениях. О некоторых его применениях сказано в п. 8.3. Глубокие противоречия концепции неподвижного эфира со всей отчетливостью про- проявились лишь в оптических опытах второго порядка по у/с. Идея эксперимента, ко- который давал бы принципиальную возможность непосредственно обнаружить движе- движение Земли относительно эфира, была высказана Максвеллом в 1878 г. Но Максвелл полагал, что из-за малости ожидаемого эффекта (при орбитальном движении Зем- Земли (у/сJ = 10~8) необходимая точность измерений недостижима. Однако в 1881 г.
8.1. Безуспешные поиски «светоносной среды» 373 М7 такой опыт с использованием интерференции света был осуществлен Майкельсоном и повторен им совместно с Морли в 1887 г. с большей точностью. Опыту Майкельсо- на суждено было стать самым знаменитым в оптике движущихся тел, и впоследствии он многократно воспроизводился разными иссле- исследователями с улучшенной экспериментальной тех- никой и в новых вариантах. Чтобы понять идею опыта Майкельсона по об- обнаружению абсолютного движения Земли, нужно *- встать на точку зрения физики конца XIX в., со- согласно которой скорость света только в одной системе отсчета одинакова по всем направлени- направлениям и равна с. Пусть интерферометр Майкельсона (см. п. 5.3) ориентирован так, что одно из его оди- одинаковых плеч, например РМр параллельно скорости орбитального движения Земли (рис. 8.3, а). Тогда промежутки времени ^ и Г2> которые затрачивает свет для прохо- прохождения туда и обратно одинаковых расстояний вдоль плеч РМ1 и РМ2, оказываются различными. В самом деле, используя гелиоцентрическую систему отсчета, в кото- которой гипотетический эфир неподвижен, для ^ находим: Рис. 8.3. Схема опыта Майкельсона С — V + У С \ - У2/С2' Свет, распространяющийся в перпендикулярном направлении, за время г2 проходит путь РМ2РГ (рис. 8.3,6), длина которого 2*//2 + (*я2/2J. С другой стороны, эта же длина равна а2, так как свет проходит ее за время г2 со скоростью с. Решая полу- полученное уравнение для г2, находим 2/ (8.4) К этому же результату можно прийти, используя связанную с Землей систему отсче- отсчета, если считать, что скорость света в ней складывается из скорости с относительно эфира и скорости орбитального движения Земли. 5*' \ Рис. 8.4. Оптическая схема (а) и общий вид (б) интерферометра Майкельсона
374 8. Оптика движущихся тел Времена ^ и г2 различаются на величину, зависящую от квадрата малого отно- отношения р = у/с: А/ = гх - B « A/с)(у/сJ = A/с)Р2. Если повернуть прибор на 90°, то эта разность изменит знак и наблюдаемые интерференционные полосы должны сместиться. Ожидаемое смещение полос ДМ определяется удвоенным значением А/: ДМ = 2Д//Г = 2(//Я)у32. При V = 30 км/с параметр уЗ2 = 10~~8 и смещения интерфе- интерференционной картины на одну полосу можно ожидать при длине плеча интерферомет- интерферометра / = 5 • 107 Я = 30 м. В опытах 1887 г. эффективная длина плеч с помощью системы зеркал была доведена до 11 м (рис. 8.4, а). Для уменьшения вибраций и изгибов при повороте интерферометр был смонтирован на квадратной каменной массивной плите (рис. 8.4,6) со стороной 1,5 м, кольцеобразная подставка которой плавала в сосуде с ртутью. Измерения положения полос производились при непрерывном медленном равномерном вращении установки. В пределах точности измерений @,01 полосы) никакого смещения полос не наблюдалось, хотя ожидаемое смещение составляло более трети полосы. Майкельсон пришел к совершенно определенному заключению об отрицательном результате опыта. Отсутствие эфирного ветра было подтверждено во всех повторениях опыта Май- кельсона. Например, Иос в 1930 г. получил отрицательный результат, используя ин- интерферометр, рассчитанный на обнаружение эфирного ветра со скоростью 1,5 км/с. В опытах Кеннеди и Торндайка A932) наблюдения велись непрерывно в течение длительного времени, так что Земля при движении вокруг Солнца успевала значи- значительно изменить направление скорости. Это можно рассматривать как переход из одной инерциальной системы отсчета в другую. Если бы скорость света в вакууме при этом изменялась, то возникло бы смещение полос. Прибор был настолько чув- чувствителен, что позволял обнаружить изменение на 2 км/с. Но никакого смещения полос не наблюдалось, что свидетельствовало о неизменности скорости света при переходе в другую систему отсчета. Изобретение лазеров (см. п. 9.4) позволило упростить постановку подобных опы- опытов и значительно повысить их точность. В 1964 г. Таунс, Джаван и другие использо- использовали установку с двумя одинаковыми газовыми лазерами, расположенными перпен- перпендикулярно друг другу на поворотной платформе. Частота генерации в соответствии с формулой (9.39) зависит от скорости света с. С позиций гипотезы неподвижного эфира поворот установки на 90° должен вызвать из-за орбитального движения Земли изменение разности частот лазеров приблизительно на 3 МГц, что легко наблюдать при смешении их излучения на фотокатоде приемника. На основании таких опытов было установлено, что скорость эфирного ветра не превышает 30 м/с (при скорости орбитального движения Земли 30 км/с). В опытах с использованием гамма-излучения и эффекта Мессбауэра этот предел был уменьшен до 5 м/с. Отрицательный результат опыта Майкельсона проще всего было объяснить, пред- предположив полное увлечение эфира движущейся Землей. Но такое предположение противоречило наблюдаемому эффекту аберрации и результатам опыта Физо с дви- движущейся водой. Чтобы объяснить опыт Майкельсона и сохранить эфир, Лоренц и независимо от него Фитцджеральд предположили, что все тела при движении от- относительно неподвижного эфира испытывают сокращение в у/\ — ь2/с2 раз в на- направлении движения. Причину такого сокращения Лоренц находил в изменении электромагнитных сил и, следовательно, положений равновесия образующих тело
8.1. Безуспешные поиски «светоносной среды» 375 заряженных частиц из-за движения в эфире.*) Но гипотеза лоренцевского сокра- сокращения обнаруживает свою несостоятельность при интерпретации отрицательного результата выполненного Кеннеди и Торндайком несколько видоизмененного опы- опыта Майкельсона с разной длиной плеч интерферометра. К такому же заключе- заключению приводит анализ более поздних (и более точных) опытов на основе эффекта Мессбауэра. Хотя подобные эксперименты не могли быть выполнены во времена Лоренца, он предвидел, что, подобно опыту Майкельсона, они могут дать отрицательный резуль- результат. Поэтому он ввел еще одну гипотезу об изменении хода часов при их движении относительно эфира. Уравнения для изменения длины и времени таковы, что при измерении скорости света в любой системе отсчета будет получаться одна и та же величина. Новая теория не только объяснила отрицательный результат опыта Май- Майкельсона, но и приводила к принципиальной невозможности обнаружения движения относительно эфира. Этим Лоренц лишил эфир последнего и единственного свой- свойства, которое в электромагнитной теории еще позволяло называть его некоторой средой, — свойства локализации по отношению к определенной системе отсчета. Спасая привычные классические представления о пространстве и времени, Лоренц пришел к теории, не удовлетворяющей критерию наблюдаемости: нельзя предста- представить себе хотя бы принципиальных возможностей ее опытного подтверждения или опровержения. Трудно поверить в то, что эфир существует, если природа устроена так, что его в принципе невозможно обнаружить. Непротиворечивое объяснение всех оптических опытов с движущимися телами дала частная теория относительности. Релятивистский подход к их истолкованию обсуждается в п. 8.3. Здесь же отметим, что преодоление трудностей оказалось воз- возможным благодаря отказу от представлений об эфире как выделенной системе от- отсчета и распространению принципа относительности на все явления. Полная экви- эквивалентность инерциальных систем означает, что равномерное прямолинейное дви- движение замкнутой системы тел по отношению к инерциальной системе отсчета не влияет ни на какие физические явления в системе тел. С таких позиций отрицатель- отрицательный результат опыта Майкельсона очевиден и не требуется придумывать гипотезы ас! Нос (т.е. только для данного случая). Но преимущество теории относительно- относительности не только в гораздо более ясной и удовлетворительной постановке всего во- вопроса, а прежде всего в плодотворности, эвристичности: она предсказывает новые явления, и все выполненные по сей день эксперименты оправдывают эти предска- предсказания. Контрольные вопросы • Поясните исторические предпосылки возникновения в физике концепции эфира. • Какие изменения понятие эфира претерпело после создания электромагнитной теории света? • Какую роль играет изменение направления орбитального движения Земли в наблюдениях аберрации звезд? + ) Теория относительности также предсказывает сокращение тел в направлении движения, но там это чисто кинематический эффект зависимости результатов измерений от относительного движения (см. п. 8.2). Здесь же сокращение Лоренца—Фитцджеральда обусловлено движением относительно эфи- эфира, т. е. привилегированной системы отсчета.
376 8. Оптика движущихся тел • Как результаты опыта Физо объясняются в теории эфира и в электронной теории Лоренца? • Изложите идею опыта Майкельсона. • Почему предложенное Лоренцем объяснение отрицательного результата опыта Майкель- Майкельсона не может считаться удовлетворительным? 8.2. Основные положения частной теории относительности Как уже отмечалось, частная теория относительности основана на двух принци- принципах, или постулатах, в которых из всего огромного экспериментального матери- материала выделены бесспорные, не вызывающие сомнений положения. Первый посту- постулат — это принцип относительности, распространенный на все физические яв- явления. Он утверждает полное равноправие всех инерциальных систем отсчета. Другими словами, неускоренное движение замкнутой физической системы как цело- целого не влияет на законы любых явлений. Второй постулат утверждает существование предельной скорости распространения сигналов, совпадающей со скоростью света в пустоте. Эти принципы содержат очень сильные и общие утверждения. Например, второй постулат утверждает, что любые взаимодействия между телами распространяются в пустоте с одной и той же конечной скоростью, не зависящей от движения тел. В соответствии с первым постулатом эта скорость одинакова во всех инерциальных системах. В итоге скорости света в вакууме придается универсальное значение, не связанное с физической природой взаимодействия, а отражающее некоторое общее свойство пространства и времени. Поэтому едва ли можно говорить о каких-либо «решающих» опытах, доказывающих справедливость этих принципов. Нельзя счи- считать, что они вытекают из рассмотренных выше оптических опытов. Но, как уже отмечалось, оптические опыты с движущимися телами сыграли большую роль в их становлении. Неудивительно, что именно с позиций теории относительности вся со- совокупность этих опытов получает исчерпывающее и в то же время наиболее простое и естественное объяснение. Признание существования абсолютной, одинаковой во всех системах отсчета скорости потребовало отказа от классических ньютоновских представлений о про- пространстве и времени и замены их новыми релятивистскими представлениями. Это, в свою очередь, привело к созданию релятивистской механики, которая сводится к ньютоновской только в предельном случае движения тел со скоростями, малыми по сравнению со скоростью света. Напомним кратко основные положения частной теории относительности. Анализ операций измерения промежутков времени и расстояний, проведенный в рамках по- постулатов теории, привел к необходимости отказаться от представлений классической физики об абсолютном характере таких понятий, как одновременность событий, промежуток времени между событиями, расстояние между точками в про- пространстве. Проиллюстрируем зависимость этих понятий от системы отсчета на простых примерах. Рассмотрим две инерциальные системы отсчета К и К', причем К' движется отно- относительно К с постоянной скоростью V. Условимся, как это обычно принято, выбирать
8.2. Частная теория относительности 377 Х)Т направления одноименных осей координат в К и К' одинаковыми, причем оси х их' направим вдоль вектора V (рис. 8.5). Пусть в некоторой точке А на оси х' проис- происходит короткая вспышка света, т. е. из А в противоположных направлениях отправ- отправляются сигналы. Рассмотрим приход сигналов в точки В и С системы К\ равно- равноудаленные от А. Так как скорость света не зависит от направления, эти события в К' происходят одновременно. Легко ви- видеть, однако, что эти же два события — приход сигналов в В и С — уже не бу- будут одновременными в системе отсчета К. В самом деле, в соответствии с постула- постулатами скорость сигналов в системе К так- также не зависит от направления, но точка В движется относительно К навстречу сиг- сигналу, а точка С — от посланного в нее сигнала. Поэтому с точки зрения наблю- ?„,, 8>5. Мысленные опыты, шшослрирующие дателя в К сигналу, распространяющему- относительность одновременности событий ся с конечной скоростью, приходится на и промежутков времени между событиями пути в С преодолевать большее расстоя- расстояние, чем на пути в В, и приход сигнала в С произойдет позже, чем в В. Значит, понятие одновременности событий зависит от системы отсчета. Классиче- Классическое представление об абсолютном характере одновременности оказывается прибли- приближенным. Оно возникло потому, что в повседневном опыте приходится иметь дело с движениями, скорости которых малы по сравнению со скоростью света. Исходя из постулатов теории относительности легко показать относительный характер промежутков времени между событиями и найти закон их преобра- преобразования при переходе из одной системы отсчета в другую. Рассмотрим для этого следующий мысленный опыт. На концах стержня длиной /, ориентированного пер- перпендикулярно оси х и неподвижного в системе отсчета К\ закреплены параллель- параллельные зеркала (см. рис. 8.5). Между зеркалами движется короткий световой импульс. Рассмотрим один цикл таких «световых часов», т.е. выход светового импульса от нижнего зеркала и его возвращение после отражения от верхнего зеркала, с точки зрения наблюдателей в каждой из систем отсчета. В К' оба события происходят в од- одной и той же точке, и измеренный в К' промежуток времени между ними называется собственным временем т0. Очевидно, что т0 = 21/с. В системе К стержень находится в движении и световой импульс движется зигзагообразно (рис. 8.5). Свет проходит за один цикл больший путь, и следовательно, промежуток времени т между теми же событиями в К оказывается больше, чем в К\ ибо скорость света, согласно второму постулату, одинакова в К и К'. Как видно из рис. 8.5, для определения т можно на- написать уравнение ст = 2\/12 + {ут/2J. Отсюда, учитывая, что 21/с = т0, находим т = (8.5) При любой скорости V ф О, как видно из (8.5), г > г0. Поэтому с точки зрения наблюдателя в К движущиеся часы (т.е. часы в К') идут медленнее, чем его соб- собственные, идентичные по устройству. Подчеркнем, что речь здесь идет о сравнении показаний одних и тех же движущихся часов с показаниями разных (находящихся
378 8. Оптика движущихся тел в разных точках) неподвижных часов. Синхронизированные для неподвижного на- наблюдателя, эти часы не будут синхронизированы для движущегося (из-за относи- относительного характера одновременности событий). Рассмотренный релятивистский эффект замедления времени, как того требует рав- равноправие инерциальных систем отсчета К и К', является взаимным: с точки зрения наблюдателя в К' медленнее идут часы, связанные с системой К. Аналогичным образом непосредственно на основе постулатов можно найти ре- релятивистский закон преобразования пространственных расстояний. Для это- этого можно, например, рассмотреть мысленный эксперимент с теми же «световыми часами», но ориентированными иначе — параллельно направлению относительной скорости систем отсчета. В результате получим, что длина их стержня (и следова- следовательно, любого тела) относительна, т.е. зависит от системы отсчета. Наибольшее значение /0 длина имеет в системе отсчета, где тело покоится {собственная длина). В другой системе, относительно которой тело движется со скоростью V, его длина / в направлении движения сокращается: (8.6) Этот релятивистский эффект, как и эффект замедления времени, становится за- заметным при движениях со скоростями, сравнимыми со скоростью света. При V <^с расстояние между точками и промежуток времени между событиями приобретают практически абсолютный смысл в полном соответствии с классическими представле- представлениями о пространстве и времени, сформировавшимися на основе опыта наблюдений над сравнительно медленными движениями. Отметим, что релятивистские кинематические эффекты сокращения длины и за- замедления времени означают лишь, что измеряемый промежуток времени и измеря- измеряемая длина зависят от относительного движения. Теория относительности предска- предсказывает влияние движения наблюдателя на результаты измерений. Собственное время и собственная длина (т.е. длина тела в системе отсчета, где оно покоится), по определению, абсолютны. Для объяснения замедления времени и сокращения длины нет необходимости искать какие-либо процессы или динамические изменения в дви- движущихся часах и движущемся стержне: эти эффекты непосредственно следуют из анализа самого процесса измерения. Используя формулу (8.6), связывающую расстояние между двумя точками в разных системах отсчета, можно написать релятивистский закон преобразования коорди- координат и времени произвольного события при перехо- % к< де от одной системы отсчета к другой. Рассмотрим описание некоторого события А в двух инерциаль- ных системах отсчета: К и К'. Пусть координаты и время этого события в К равны х,у, т, и /, а в К' равны х',у',1г и г1 (рис. 8.6). Будем считать, что О)— ,) -|—<ь »: ^, при г = О точки О и О7 совпадают. Расстояния в на- х правлении, перпендикулярном относительной ско- скорости V систем отсчета, одинаковы в К и К\ поэтому Рис. 8.6. К выводу преобразований У = / и г = г'. Координату х можно рассматривать Лоренца как собственную длину Ь* отрезка ОБ, неподвижно- У
8.2. Частная теория относительности 379 го в системе К. Длина Ь этого же отрезка в системе К\ где измерение производится в момент времени /', равна х' + ы'. В соответствии с (8.6), ^ = ^\Л — у2/с2, по- поэтому х' + ы' = ху/1 — у2/с2, откуда х = (л:7 Н- уг')/у/\ — ь2/с2. Эта формула вы- выражает координату л: события А в системе ЛГ через координату х' и время /' этого же события в К'. Чтобы получить формулу для момента времени г через х' и /', рассмотрим отре- отрезок О'В, неподвижный в системе К' (рис. 8.6). Собственная длина /0 этого отрезка — это координата х' события А. Длина / этого же отрезка в системе отсчета К (отно- (относительно которой он движется со скоростью и), измеряемая в момент времени /, равна х — VI. Учитывая снова релятивистское сокращение длины (8.6), можем напи- написать х — VI = х1 \/\ — у2/с2. Подставляя сюда полученное выше выражение для х, после простых преобразований находим выражение для г через х' и /', которое вме- вместе с формулой для х дает искомый закон преобразования координат и времени произвольного события: Это и есть релятивистские преобразования Лоренца. Обратные преобразования от К и К' можно получить из (8.7), разрешив их относительно х' и %'. Разумеется, они отличаются от (8.7) лишь заменой V —> — V и перестановкой штрихов в полном соответствии с принципом относительности, утверждающим равноправие систем от- отсчета К и К'. Преобразования Лоренца (8.7) в предельном случае V < с переходят в преобразо- преобразования Галилея, выражающие классические представления о пространстве и времени: х=х' + ьи У=у\ 1=1, * = *'. (8.8) Это значит, что теория относительности не отвергает классическую нерелятивист- нерелятивистскую физику, а ограничивает ее применимость областью сравнительно медленных движений. Промежуток времени между событиями и расстояние между точками в классической физике абсолютны, т. е. одинаковы во всех системах отсчета. Другими словами, это инварианты преобразований Галилея. Теория относительности перевела эти понятия из абсолютных в относительные. Преобразования Лоренца (8.7) для координат и времени события можно рассмат- рассматривать как геометрические преобразования в четырехмерном пространстве-времени. При переходе от одной системы отсчета к другой пространственные координа- координаты х, у у г и время I события изменяются, но определенная их комбинация , = ^Л2-(*2+У2 + г2), (8.9) называемая интервалом, остается неизменной. Интервал обобщает понятия рассто- расстояния в трехмерном пространстве и промежутка времени. Его можно считать расстоя- расстоянием в четырехмерном пространстве-времени от начала координат до мировой точки (с/, х, у, г), изображающей данное событие. По аналогии с трехмерным евклидовым пространством, координаты мировой точки (с1, х,у,г) можно рассматривать как про- проекции четырехмерного радиуса-вектора события, а интервал я (8.9) — как его длину. Преобразования Лоренца (8.7) дают закон изменения этих проекций при переходе от одной системы отсчета к другой, подобно тому, как проекции радиуса-вектора
380 8. Оптика движущихся тел точки в трехмерном пространстве преобразуются при повороте системы коорди- координат. Но в отличие от евклидовой геометрии пространства, где инвариант выражает- выражается через сумму квадратов проекций, в псевдоевклидовой геометрии пространства- времени инвариантная «длина» вектора выражается через разность квадратов вре- временной и пространственных проекций. Для анализа некоторых оптических экспериментов с движущимися телами полезен релятивистский закон преобразования скорости. Пусть и = ёг/д/ — скорость неко- некоторой частицы относительно системы отсчета ЛГ, а и' = йг'/й!* — скорость той же частицы относительно К'. Рассматривая движение частицы как непрерывную после- последовательность событий (а, г), можно найти связь между и и и': Входящие сюда производные находятся дифференцированием правых частей фор- формул преобразований Лоренца (8.7). При этом нужно учесть, что х и I зависят от I1 не только явно, но и через х'. Подставляя производные в (8.10), получаем _игУ\-у/с Ых~ 1+уи'х/с*' Ыу~ \+уи'х/с2 ' "* " 1+К/с2 ' ( } При у«с формулы (8.11) переходят в классический закон сложения скоростей, но в релятивистском случае преобразование скорости (8.11) при переходе в другую систему отсчета отнюдь не сводится к векторному сложению относительной и пе- переносной скоростей. В то же время при разложении скорости частицы на составля- составляющие в какой-либо одной системе отсчета она ведет себя как обычный трехмерный вектор (т.е. равна векторной сумме своих составляющих по разным направлениям). Формулы для обратного преобразования скорости от К к К' получаются из (8.11) изменением знака скорости у. Контрольные вопросы • Сформулируйте постулаты частной теории относительности. В какой мере оптические опы- опыты с движущимися телами подтверждают их справедливость? • С помощью простых мысленных экспериментов покажите, что из постулатов следует от- относительность таких понятий, как одновременность событий и промежуток времени между событиями. • Докажите с помощью преобразований Лоренца инвариантность пространственно- временнбго интервала между событиями. • Получите формулы для преобразования энергии и импульса частицы при переходе к другой системе отсчета. • Как преобразуется скорость частицы при переходе к другой системе отсчета? 8.3. Теория относительности и оптика движущихся тел Отрицательные результаты всех опытов, в которых предпринимались попытки об- обнаружить влияние равномерного движения Земли на оптические явления, с реляти-
8.3. Теория относительности и оптика движущихся тел 381 вистских позиций представляются самоочевидными. Об этом прямо говорит первый постулат теории — принцип относительности, утверждающий эквивалентность всех инерциальных систем отсчета. Равномерное движение лаборатории относительно ге- гелиоцентрической системы отсчета не может быть обнаружено как в оптических опы- опытах первого порядка по у/с9 берущих свое начало с опыта Араго по преломлению световых лучей в призме, так и в опытах второго порядка, к которым относятся опыт Майкельсона и его многочисленные модификации. В лабораторной системе отсчета, где прибор покоится, скорость света, как и в гелиоцентрической системе, одинако- одинакова по всем направлениям и равна с. Вид наблюдаемой интерференционной картины обусловлен только геометрической разностью хода лучей, которая не изменяется при повороте установки. Что касается электромагнитных и оптических явлений в равномерно движущихся телах, то их законы могут быть найдены из соответствующих законов для неподвиж- неподвижных тел путем чисто кинематического пересчета к другой системе отсчета на основе преобразований Лоренца (8.7) или вытекающих из них формул (8.11) преобразова- преобразования скорости. Рассмотрим с этой точки зрения интерпретацию результатов опыта Физо по измерению скорости света в движущейся воде. Пусть вода покоится в сис- системе отсчета К'. Тогда скорость света в К' равна и' = с/п. Подставляя это значение в (8.11), найдем скорость и распространяющегося вдоль направления течения воды света в лабораторной системе отсчета К: и = /, ?.//^л ^(~ + г;)A~7г)^Т + г;A-~т)- (8Л2) Здесь отброшены малые члены порядка у2/с2. Френелевское «частичное увлечение эфира», описываемое формулой (8.1), можно рассматривать как простое следствие релятивистской кинематики. Тот факт, что электронная теория дает такое же вы- выражение для скорости света в движущейся среде, совсем не удивителен, так как уравнения электродинамики удовлетворяют принципу относительности (сохраняют свой вид при преобразованиях Лоренца). Закон преобразования скорости (8.11) дает релятивистское объяснение и явле- явлению звездной аберрации. Пусть в гелиоцентрической системе К направление на некоторую удаленную звезду составляет прямой угол с направле- направлением скорости орбитального движения Земли. В каком направле- * * нии видит эту звезду находящийся на Земле наблюдатель? Выберем ось х в направлении скорости Земли, ось у — в направлении на у звезду (рис. 8.7). Тогда для скорости света от звезды в системе К можно написать: их = 0, иу = —с, иг = 0. Переходя в систему от- отсчета К'9 связанную с Землей, с помощью формул (8.11) находим: их = —у, и у = —су/1 — у2/с29 и'г = 0. Поэтому для земного наблю- наблюдателя кажущееся направление на звезду составляет с направлени- направлением в гелиоцентрической системе угол 8 (угол аберрации) такой, что 8ш5 = \и'х\/у1и'х2 + и'у2 = у/с. (Классическая теория для угла аберрации дает выражение 1%8 = у /с9 которое при у/с < 1 сов- РИф08'7' ^ падает с релятивистским.) Заметим, что в явлении аберрации на- аберрации света блюдается не сам угол аберрации, а его изменение при изменении (зт<5 = у/с)
382 8. Оптика движущихся тел направления орбитальной скорости Земли. Поэтому наблюдаемая аберрация одина- одинакова для всех звезд и не зависит от их движения относительно Солнца. Столь же простое кинематическое объяснение получает в теории относительности и эффект Доплера. Для волн в среде, например для звука в воздухе, скорость волн зависит от системы отсчета: если в системе отсчета, где среда покоится, скорость волн равна м, то в любой другой системе отсчета, движущейся со скоростью у, скорость волн зависит от их направления и изменяется от и + у до и — у (при у <^с). Сдвиг частоты при эффекте Доплера зависит от скоростей источника и наблюдателя относительно среды. Для распространения электромагнитных волн (света) в пустоте никакой среды не требуется, и их скорость во всех системах отсчета одинакова. Поэтому сдвиг частоты определяется только относительной скоростью источника и наблюдателя. Приведем сначала элементарный вывод релятивистского выражения для продоль- продольного эффекта Доплера, когда относительная скорость источника и приемника направ- направлена вдоль соединяющей их линии. Пусть, например, источник находится в начале координат системы К1, его координата х' = О, а приемник — в начале координат х = О системы К. Источник посылает сигналы через одинаковые промежутки време- времени, которые равны г0 по часам системы К\ где он покоится. Найдем промежутки времени Т между моментами приема последовательных сигналов по часам систе- системы К, где покоится приемник. Пусть для определенности первый сигнал, например кратковременная вспышка света, посылается в момент времени I = О, когда начала координат К и К' сов- совпадают, т.е. источник и приемник находятся рядом. Сигнал будет принят в тот же момент времени г = 0. Следующий сигнал посылается из точки х' = 0 спустя промежуток времени г0 по часам в К\ т.е. в момент времени т = го/\Л — У2/с2 по часам системы К (см. (8.5)). Источник в этот момент находится в точке х = ут. Поэтому сигнал, распространяющийся со скоростью с, достигнет приемника в мо- момент Т = г + х/с = т + ут 1с. Подставляя сюда выражение для т через г0, находим промежуток времени между принимаемыми сигналами: Т = тОу/A -Ь у/с)/A — у /с). Частота со = 2л/Т принимаемых периодических сигналов связана с собственной час- частотой источника со0 = 2л/г0 соотношением (8.13) Здесь относительная скорость у источника и приемника положительна, если они удаляются друг от друга, и отрицательна, если они сближаются. Из приведенного вывода видно, что возникновение эффекта Доплера связано, во-первых, с изменением расстояния между источником и приемником и, во-вторых, с преобразованием промежутков времени при переходе от одной системы отсче- отсчета к другой. Первое обстоятельство не имеет отношения к теории относительности, и именно оно объясняет существование эффекта Доплера в нерелятивистской теории. Зависимость же скорости волн от системы отсчета приводит к тому, что в случаях движения источника относительно среды или движения наблюдателя классическая формула (8.2), справедливая для упругих волн, дает для сдвига частоты разные ре- результаты при одной и той же относительной скорости у источника и наблюдателя.
8.3. Теория относительности и оптика движущихся тел 383 Различие исчезает только в первом порядке по у/с, т.е. в предельном случае мед- медленного (по сравнению со скоростью волн) движения. Тогда со = со0A — у/с) или Асо/со = —ь/с. Релятивистская формула (8.13) в первом порядке по у/с дает то же самое. При сближении источника и наблюдателя регистрируемая частота больше собствен- собственной, при удалении — меньше («красное смещение»). Предсказав этот эффект теоре- теоретически, Доплер пытался объяснить им различие в цвете компонент двойных звезд. Однако в случае сплошного спектра малый сдвиг частоты не приводит к заметным изменениям. В 1848 г. Физо высказал мысль, что по смещению спектральных линий можно обнаружить движение небесных тел относительно Земли. Эта идея сыграла важнейшую роль в астрономии. После открытия спектрального анализа и установле- установления тождественности химических элементов на Земле и небесных телах эффект До- Доплера стали применять для определения радиальных (лучевых) скоростей небесных тел. Впервые таким способом в 1868 г. была измерена радиальная скорость Сириуса по смещению водородной линии в его спектре относительно той же линии в спектре лабораторной разрядной трубки. Для экспериментальной проверки принципа Доплера в оптике необходимо неза- независимое измерение скорости источника. В первых попытках использовался свет от краев солнечного диска, скорость которых может быть найдена из движения солнечных пятен. Первое убедительное подтверждение принципа Доплера в усло- условиях земной лаборатории было получено только в 1900 г. русским астрофизи- астрофизиком А. А. Белопольским. В опытах Штарка, начатых в 1905 г., наблюдалось сме- смещение спектральных линий, испускаемых быстродвижущимися ионами и атома- атомами в каналовых лучах. Определенная по принципу Доплера скорость излучаю- излучающих частиц оказалась в хорошем согласии с оценками этой скорости другими ме- методами. Расщепление спектральных линий некоторых звезд на две компоненты позволя- позволяет сделать вывод о том, что наблюдается система двух звезд, обращающихся вок- вокруг центра масс. Если обычными или интерференционными методами эти звезды разрешить не удается, то систему называют спектрально-двойной звездой. С по- помощью эффекта Доплера можно определить скорости компонент и период обра- обращения. Измеряя доплеровское смещение линий в спектрах галактик, американский астро- астроном Хаббл сделал в 1929 г. на самом большом в то время телескопе с диаметром зеркала 2,5 м важнейшее открытие в астрофизике. Он установил, что удаленные га- галактики разбегаются, причем их скорость у растет пропорционально расстоянию К до них в соответствии с соотношением у = Я/?, получившим название закона Хаб- бла. В модели однородной и изотропной Вселенной закон Хаббла соответствует равномерному расширению, когда скорость удаления любых двух точек пропорцио- пропорциональна расстоянию между ними. Картина разбегания галактик выглядит одинаково из любой точки. Расширение Вселенной подтверждает нестационарную космологи- космологическую модель, впервые построенную в 1922 г. А. А. Фридманом на основе общей теории относительности. В спектроскопии проявление эффекта Доплера состоит в том, что хаотическое тепловое движение испускающих свет атомов или ионов приводит к уширению на- наблюдаемых спектральных линий. В случае максвелловского распределения атомов
384 8. Оптика движущихся тел по скоростям обусловленная эффектом Доплера форма спектральной линии описы- описывается колоколообразной функцией Гаусса (см. п. 1.8). Доплеровская ширина линии зависит от температуры (~ л/Т), что используется в спектроскопических методах измерения температуры светящегося газа. Первое экспериментальное подтверждение правильности квадратичных по у/с членов в релятивистской формуле (8.13) было получено Айвсом и Стилуэллом в 1938-1941 гг. Измерялся сдвиг частоты определенной спектральной линии све- света, испускаемого быстродвижущимися (у/с « 5 • 10~3) атомами водорода в пучке каналовых лучей. Для выделения эффекта второго порядка по у /с в спектрограф од- одновременно направлялся свет, испускаемый атомами по направлению их движения, и отраженный от неподвижного зеркала свет, испускаемый против движения. Из-за квадратичных членов смещение соответствующих частот со^ и со2 относительно час- частоты со0 света, испускаемого неподвижными атомами, оказывается несимметричным: (8.14) Согласие экспериментальных результатов с вычислениями по релятивистской формуле (8.14) было очень хорошим. Фактически в этих опытах был впервые под- подтвержден релятивистский закон преобразования промежутков времени (8.5), так как с ним связан вклад в квадратичные по у/с члены доплеровского сдвига частоты. Релятивистское преобразование промежутков времени проявляется не только в квадратичных членах продольного эффекта Доплера, но и в появлении поперечного эффекта. Когда направление на источник составляет прямой угол с его скоростью (угол должен быть прямым в системе отсчета, связанной с приемником), расстояние остается неизменным и весь эффект уменьшения наблюдаемой частоты связан с тем, что регистрируемый наблюдателем промежуток времени г между двумя событиями больше собственного времени т§ между ними (т.е. времени в той системе, где они происходят в одном месте) в соответствии с формулой (8.5). Поэтому (8.15) Сдвиг частоты в поперечном эффекте Доплера проявляется лишь с квадратичных по у/с членов. Напомним, что по классическим представлениям время абсолютно и потому поперечного эффекта Доплера не должно быть. Приведем релятивистское объяснение эффекта Доплера и аберрации света с несколько иной точки зрения, рассматривая одну и ту же плоскую монохрома- монохроматическую электромагнитную волну в двух инерциальных системах отсчета. При пре- преобразовании от одной инерциальной системы отсчета к другой векторы Е и В элек- электромагнитного поля волны в каждой пространственно-временной точке (г, г) изменя- изменяются, но их скалярное произведение Е • В и разность квадратов Е2 — с2В2 (СИ), или Е2 — В2 (СГС), остаются неизменными. Поэтому свойство ортогональности векто- векторов Е и В в бегущей электромагнитной волне в вакууме, а также соотношение A.31) между их модулями выполняются сразу во всех инерциальных системах отсчета. Од- Одно и то же значение во всех системах отсчета имеет, разумеется, и скорость с волны,
8.3. Теория относительности и оптика движущихся тел 385 но направление распространения и частота, вообще говоря, различны. Эффект До- Доплера можно рассматривать как преобразование частоты волны, а аберрацию — как преобразование ее направления при переходе от одной инерциальной системы отсче- отсчета к другой. Состояние электромагнитного поля рассматриваемой волны в некоторой мировой точке (а9 г), например максимум или нуль напряженности, не может зависеть от выбора системы отсчета. Так как это состояние определяется фазой волны (ш — кг), то фаза должна быть инвариантом преобразований Лоренца. Инвариантность фазы можно пояснить еще и следующим образом. Представим себе цуг электромагнит- электромагнитных волн с одинаковой длиной волны, имеющий конечную протяженность. Число отдельных волн, т.е. периодов в этом цуге, определяется разностью значений фа- фазы, соответствующих началу и концу цуга. Но число периодов, укладывающихся на протяжении данного цуга, одинаково для всех наблюдателей. Поэтому фаза должна оставаться неизменной при переходе от одной системы отсчета к другой. Инвариантность фазы (сог — кг) относительно преобразований Лоренца позволя- позволяет рассматривать это выражение как скалярное произведение 4-векторов: четырех- четырехмерного радиуса-вектора (с*, г) и четырехмерного волнового вектора (со/с, к), про- пространственной компонентой которого служит трехмерный волновой вектор к, а вре- меннбй — частота волны со, деленная на с. Для электромагнитной волны в вакууме к = со/с, по- поэтому четырехмерный волновой вектор имеет ну- нулевую инвариантную длину. Введение четырехмерного волнового вектора удобно потому, что закон преобразования его проекций при переходе из одной инерциальной системы отсчета в другую позволяет сразу най- / / х ти преобразование частоты волны и ее направ- г ления, т.е. получить релятивистские выражения Рис. 8.8. Преобразование волнового ¦,-, у, <~ „ вектора световой волны при перехо- для эффекта Доплера и аберрации. Проекции че- де из одаой системы отсчет! в другую тырехмерного волнового вектора волны в систе- системе К (со/с, кХ9ку9кг) выражаются через проекции в системе К1 (со' /с,кх, ку9к'г) по формулам преобразований Лоренца (8.7), если К К' У 0' в них сделать замену а —> со /с, х —> кХ9 у г —> кг. Пусть в системе отсче- та К направление волны образует угол в с осью х (рис. 8.8), частота волны равна со. Тогда к = со/с и кх = (со/с) СО8 0, ку — (со/с) 8Ш0, кг = 0. Подставляя эти величины в формулы (8.7), получаем: СО л СО СО8 0 +У/С — СО8 в = С С — 81П в = — 81П в , С С (8.16) СО = + Укх у/\ - Ь2/С2 __ ,1 + (у/с) СО8 0; (8.17) Будем для определенности систему отсчета К' связывать с источником волны, а систему К — с наблюдателем (т.е. с приемником). Формулу для аберрации можно 13 Зак 4498
386 8. Оптика движущихся тел получить, разделив почленно второе из равенств (8.16) на первое: ь со8 0' + и/<? к ; Если в системе К' направление волны перпендикулярно скорости наблюдателя [в = 90°), то для системы К, связанной с наблюдателем, формула (8.18) дает = \/с2/у2 — 1. Отсюда для угла аберрации 8 = л/2 — в получаем 8пк$ = у/с, что совпадает со значением, найденным выше из релятивистского закона преобразо- преобразования скорости. Формула (8.17) выражает воспринимаемую наблюдателем частоту со волны че- через собственную частоту (частоту источника) со0 = со'. Если источник удаля- удаляется от наблюдателя вдоль соединяющей их линии, то О1 — л и (8.17) дает со = оH\/A — у/с)/{\ 4- у /с), что совпадает с относящейся к этому случаю форму- формулой (8.13). В общем случае вместо (8.17) удобнее иметь формулу, в которой часто- частота со выражалась бы не через угол 0', а через угол 0, характеризующий направление волны в системе отсчета К, связанной с наблюдателем. Для этого выразим со8 0; с помощью формулы (8.16), подставив в нее предварительно со /со1 из (8.17): (8.19) Подставляя это выражение*) в (8.17), окончательно находим: (8.20) Эта формула описывает релятивистский эффект Доплера при произвольном на- направлении волны. Случай 0 = 0 (или 0 = л) соответствует сближению (или уда- удалению) источника и приемника вдоль одной прямой, т.е. продольному эффекту Доплера. Если волна приходит к наблюдателю по направлению, перпендикулярно- перпендикулярному скорости источника, то в формуле (8.20) следует положить 0 = л/2, что дает со = о>0\/1 - у2/с2. Это совпадает с приведенным выше выражением (8.15) для по- поперечного эффекта Доплера. Контрольные вопросы • Как в теории относительности объясняются отрицательные результаты всех опытов, в ко- которых делались попытки обнаружить равномерное движение Земли с помощью оптических явлений? • Как получить законы распространения света в равномерно движущихся относительно на- наблюдателя телах? Приведите релятивистское объяснение результатов опыта Физо. • Какие причины вызывают изменение периода принимаемых сигналов при движении источ- источника или приемника? В чем состоит главное отличие эффекта Доплера для электромагнит- электромагнитных волн в вакууме и для волн в среде? С чем связано возникновение поперечного эффекта Доплера? • Перечислите основные проявления и применения эффекта Доплера в астрофизике и спек- спектроскопии. ) Заметим, что эта формула эквивалентна (8.18), т.е. также описывает аберрацию.
8.4. Эффект Саньяка. Лазерный гироскоп 387 • Какие свойства и характеристики плоской электромагнитной волны в вакууме изменяются при переходе в другую систему отсчета и какие остаются без изменения? Дайте обоснова- обоснование инвариантности фазы. • Получите релятивистские формулы для эффекта Доплера и аберрации, рассматривая пре- преобразование четырехмерного волнового вектора. Задачи 1. Пусть в системе отсчета К направление светового луча составляет угол в с осью х. Направ- Направление этого луча в системе к! определяется углом в' — в + 80. Используя релятивистскую формулу (8.19), покажите, что в первом порядке по у/с угол аберрации 89 равен (у/с) $тв. Рис. 8.9. Схема опыта Саньяка 8.4. Эффект Саньяка. Лазерный гироскоп До сих пор в этой главе рассматривались оптические опыты, в которых движение тел происходило с постоянной по модулю и направлению скоростью относительно некоторой инерциальной системы отсчета (например, гелио- гелиоцентрической). В полном соответствии с принципом относи- относительности все опыты, в которых делаются попытки обнаружить влияние равномерного движения лаборатории на оптические явления, дают отрицательный результат. Но ускоренное дви- движение, в частности вращение относительно инерциальной сис- системы отсчета, сказывается на характере протекающих явлений и может быть обнаружено как механическими, так и оптиче- оптическими опытами. В опыте Саньяка A913) три зеркала А, В и С и полу- полупрозрачная пластинка Г> вместе с источником света и фо- фотопластинкой Р смонтированы на платформе, которую мож- можно приводить во вращение (рис. 8.9). Пластинка В делит свет от источника на два пучка, которые обегают контур АВСЭ во встречных направлениях и затем образуют на фотопластинке интерференци- интерференционную картину. Луч света, направление которого совпадает с на- направлением вращения, затратит на обход контура большее время, чем луч противоположного направления. Поэтому при вращении установки возникает разность фаз между интерферирующими лу- лучами, пропорциональная угловой скорости платформы. В резуль- результате интерференционные полосы оказываются смещенными от- относительно их положения при неподвижной платформе. Количественный расчет сдвига полос при вращении проведем, Рис. 8.10. К расчету предположив для простоты, что свет распространяется по кру- запаздывания п , о 1ЛЧ ~ <- встречных волн говому контуру радиуса К (рис. 8.10). Результат будет справед- справедлив и для контура произвольной формы. Точка О, где пучок от источника разделяется на два, обегающих контур в противопо- противоположных направлениях, движется в лабораторной системе отсчета по окружности со скоростью V = ОК, где п — угловая скорость платформы. Так как рассматриваемый
388 8. Оптика движущихся тел эффект проявляет себя уже в первом порядке по у /с, то можно не принимать во внимание релятивистские эффекты сокращения длины и замедления времени, ибо они квадратичны по у/с. За время тх обхода контура светом, распространяющим- распространяющимся по направлению вращения, точка В перемещается в положение В', и поэтому пройденное светом расстояние стх равно ЪхК 4- утх. Отсюда _ 2лК _ 2лК 1 _ 2лК 1 с — у с \ — у/с ~ с Аналогично, время т2 обхода контура светом, распространяющимся навстречу, равно Bя7?/с)A —у/с). Разность Г| — т2 дает относительное запаздывание встреч- встречных волн при вращении платформы: _ АлК у _ 4лК2п _ А8О с с с2 с2 где 5 = лК2 — площадь, охватываемая контуром. Разделив это запаздывание на пе- период световых колебаний Т = Х/с, найдем число полос ДМ, на которое происходит сдвиг интерференционной картины из-за вращения платформы: ДЛГ=-—. (8.22) В условиях опыта Саньяка расчет по формуле (8.22) дает ДМ = 0,079; эксперимент дал 0,077. В 1925 г. Майкельсон и Гэйл поставили опыт, в котором роль вращающейся плат- платформы играла Земля. Из-за малой угловой скорости п в этом случае требуется большая площадь контура 5. Майкельсон проложил около двух километров труб (они охватывали площадь 0,208 км2), из которых был выкачан воздух для получения устойчивой интерференционной картины. Ожидаемое смещение составляло в таких условиях 0,236 полосы, а среднее значение по большому числу наблюдений ока- оказалось равным 0,235 ± 0,005. Опыт Майкельсона—Гэйла можно рассматривать как оптический аналог механического опыта Фуко с маятником, цель которого состояла в обнаружении суточного вращения Земли. В наши дни эффект Саньяка находит практическое применение для обнаружения и измерения вращательного движения без всяких внешних ориентиров. Основным элементом оптического гироскопа является кольцевой лазер, резонатор которого образован тремя (реже че- четырьмя) зеркалами (рис. 8.11). В отличие от линейного лазера с двухзеркальным резонатором, в котором фор- формируется стоячая волна, кольцевой лазер может гене- генерировать распространяющиеся по замкнутому контуру бегущие волны. При вращении платформы с лазером резонансные частоты для волн, обегающих контур во ФЭУ встречных направлениях, становятся различными. В са- самом деле, в условиях генерации за время обхода контура Рис. 8.11. Кольцевой лазер с в кажД°й из волн должно совершиться (одно и то же) трехзеркальнымрезонатором целое число д полных колебаний: Т| = дТ^ = 2лд/сох,
8.4. Эффект Саньяка. Лазерный гироскоп 389 т2 = дТ2 = 2лд/со2. Подставляя т1-т2=тв формулу (8.21), получаем А8О = 2яд( — - — 2лдАсо где Д&> = @2— со{ — разность частот генерации для встречных волн. Учитывая, что 2лс/со = Я и д = ^Я ^ — периметр контура), находим выражение для Асо: А(о = ХЬ (8.23) Таким образом, разность частот Асо встречных волн в кольцевом лазере пропорци- пропорциональна угловой скорости его вращения. Для измерения Асо выходящие через частич- частично прозрачное зеркало волны с помощью дополнительного зеркала 4 (см. рис. 8.11) совмещаются по направлению распространения и направляются на катод фотоумно- фотоумножителя. Ток ФЭУ содержит составляющую на частоте биений интенсивности, равной разности частот встречных волн. Чтобы составить представление о порядке величины расщепления частот, рассмотрим равносторонний трехзеркальный резонатор с пери- периметром ^ = 1 м, работающий на длине волны Я = 632 нм и вращающийся вместе с Землей с угловой скоростью О = 15 град/ч. По формуле (8.23) для этого случая имеем Ду = Асо/Bл) = 21,7 Гц. При практическом измерении угловой скорости вращения с помощью кольцевого лазера необходимо учитывать ряд явлений, усложняющих зависимость расщепления частот встречных волн от угловой скорости. Выражаемая формулой (8.23) линей- линейная зависимость Асо от п получена в предположении отсутствия связи встречных волн. Неизбежные отражения от неоднородностей зеркал, активной среды и дру- других элементов, размещенных в резонаторе, приводят к тому, что часть энергии одной волны передается д^ другой волне. В результате при относительно медлен- медленном вращении кольцевого лазера возникает затяги- затягивание частоты, проявляющееся в нелинейном ха- характере зависимости Асо от п (рис. 8.12), и взаимная синхронизация (захват) встречных волн, когда часто- частота их биений обращается в нуль. С увеличением связи волн полоса синхронизации расширяется. Для расши- о рения диапазона измерения малых значений угловых рис.в.п.Зависимоспъраспределе. скоростей стремятся выбором конструкции кольцево- ния частот встречных волн от уг- го лазера обеспечить по возможности малую связь ловой скорости п: 1 — теоретиче- встречных волн либо используют метод «частотной ^ка^-г подставки», позволяющий вывести тем или иным спо- способом рабочую точку п^ за пределы полосы синхро- синхронизации. Такую «подставку» можно получить дополнительным принудительным вра- вращением кольцевого лазера с заданной угловой скоростью либо включением в ре- резонатор невзаимных элементов, обеспечивающих различие частот генерации для встречных волн уже при неподвижном резонаторе. Наибольшее распространение в современных конструкциях лазерных гироскопов получили невзаимные устройства, основанные на различии фазовых скоростей волн
390 8. Оптика движущихся тел правой и левой круговой поляризаций при их распространении в прозрачной среде, помещенной в продольное магнитное поле (ячейки Фарадея). Поскольку волны в ре- резонаторе кольцевого лазера поляризованы линейно, на торцы стеклянного стержня (рис. 8.13) наклеены четвертьволновые пластинки, превращающие линейную поля- поляризацию вне стержня в круговую внутри него. Магнитное поле в стержне создает- создается с помощью соленоида или постоянного магнита. Е Оптическая длина такой ячейки различна для волн, распространяющихся навстречу. При помещении в резонатор с периметром 1 м ячейки длиной 1 см, находящейся в поле с индукцией 10~2Тл, часто- частота расщепления встречных волн составляет 65 кГц. Этого достаточно для работы вдали от зоны синхро- синхронизации. Лазерные гироскопы обладают рядом преимуществ по сравнению с гироскопами других типов и исполь- используются в системах навигации, стабилизации и управ- управления кораблями, самолетами и космическими аппаратами, а также в геодезии и в из- измерительной технике. Контрольные вопросы • Объясните, почему в опыте Саньяка возникает сдвиг интерференционных полос при враще- вращении установки. Можно ли обнаружить вращение с помощью интерферометра Майкельсона? • Как в кольцевом лазере связана разность частот генерации для встречных волн с угловой скоростью вращения и с параметрами резонатора? • Каково назначение невзаимных элементов в конструкциях лазерных гироскопов? • Объясните принцип действия и устройство ячейки Фарадея. В Рис. 8.13. Схема ячейки Фарадея
Термодинамика излучения. Световые кванты Электромагнитная теория света, дополненная представления- представлениями электронной теории о взаимодействии света с веществом, позволила к концу XIX столетия с исключительной простотой и ясностью разрешить многие проблемы, оказавшиеся непре- непреодолимыми для старой волновой теории. Но в то же время воз- возникли новые задачи, решение которых в рамках классической электромагнитной теории было невозможным. Так, например, безуспешны были все попытки получить количественное описа- описание спектрального распределения света, излучаемого нагреты- нагретыми телами. Безупречный с позиций классической физики вывод формулы Рэлея—Джинса для спектральной плотности излуче- излучения черного тела приводил к противоречащему данным опыта и физически абсурдному результату. Решение проблемы было найдено Планком в конце 1900 г. введением несовместимой с принципами классической физи- физики гипотезы о квантовании энергии осциллятора. Эта гипоте- гипотеза с очевидностью указывала на ограниченность классических представлений и дала толчок революционному процессу ломки старых понятий, завершившемуся созданием квантовой физики. Эйнштейн, развивая гипотезу Планка, в 1905 г. пришел к вы- выводу о наличии у излучения корпускулярных свойств. Введен- Введенное им представление о квантах излучения — световых части- частицах, получивших впоследствии название фотонов, — позволило объяснить непонятные в рамках электромагнитной теории экс- экспериментальные закономерности фотоэффекта. Проявление у излучения как волновых, так и корпускулярных свойств, несовместимых с точки зрения классической физики, привело к формированию новых представлений о природе света, получивших название корпускулярно-волнового дуализма.
392 9. Термодинамика излучения. Световые кванты 9.1. Тепловое излучение в замкнутой полости. Черное тело Испускаемый источником свет уносит с собой энергию. В зависимости от того, где черпается эта энергия, различаются и виды свечения. Излучение, возникающее при химических превращениях, называют хемилюминесценцией. Примером может слу- служит свечение фосфора, медленно окисляющегося на воздухе. Испускание лучистой энергии в этом случае происходит за счет уменьшения внутренней энергии тела при изменении его химического состава. Электролюминесценцией называют свечение, возникающее при электрическом воздействии на вещество. В полупроводниках излу- излучение может происходить при рекомбинации инжектированных через р—«-переход носителей тока (инжекционная электролюминесценция). Другой пример — свечение газов или паров в электрическом разряде. В этом случае необходимая для излу- излучения энергия сообщается атомам или молекулам газа электронами, ускоряемыми электрическим полем разряда. Бомбардировка электронным пучком может вызвать также свечение твердых тел, например сернистого цинка, нанесенного на экран ва- вакуумной электронно-лучевой трубки (катодолюминесценция). Процессы излучения, вызываемые предварительным или одновременным освещением тела, объединяются под названием фотолюминесценции. При этом необходимая для излучения энергия доставляется светом от внешнего источника. В тех случаях, когда необходимая энергия сообщается нагреванием, т. е. подводом теплоты, излучение называется тепловым или температурным. Среди различных видов свечения оно занимает особое место. В противоположность всем видам лю- люминесценции это единственный вид излучения, который может находиться в состоя- состоянии термодинамического равновесия с телами. Поэтому физика теплового излучения представляет собой связующее звено между термодинамикой и оптикой. Объедине- Объединение статистической механики и электромагнитной теории в проблеме теплового из- излучения разорвало рамки классической физики и дало начало одной из величайших революций в физике. Чтобы составить представление о характере теплового излучения, рассмотрим несколько тел, нагретых до различной температуры и помещенных в замкнутую полость, стенки которой полностью отражают падающее на них излучение. Опыт показывает, что такая система рано или поздно приходит в состояние теплового равновесия, при котором все тела приобретают одинаковую температуру. Так про- происходит и в том случае, когда внутри полости абсолютный вакуум и тела могут обмениваться энергией только путем испускания и поглощения электромагнитных волн. Испускаемая телами лучистая энергия за каждый промежуток времени ста- становится в среднем равной поглощаемой энергии, и плотность энергии излучения в пространстве между телами достигает определенной величины, соответствующей установившейся температуре тел. Макроскопически такое состояние излучения в по- полости остается неизменным во времени. Это излучение, находящееся в термодина- термодинамическом равновесии с телами, имеющими определенную температуру, называется равновесным или черным излучением. Плотность энергии равновесного излучения и его спектральный состав совершен- совершенно не зависят от размеров и формы полости и от свойств находящихся в ней тел. Свойства равновесного излучения зависят только от температуры. Поэтому мож- можно говорить о температуре самого излучения, считая ее равной температуре тел,
9.1. Тепловое излучение в замкнутой полости 393 с которыми оно находится в тепловом равновесии. Равновесное излучение однород- однородно, изотропно и неполяризовано, т.е. в каждой точке имеет одинаковую плотность и спектральный состав, а все направления распространения и все направления коле- колебаний напряженности поля представлены с одинаковой вероятностью. В пустой полости с идеально отражающими стенками поглощения и испускания света не происходит. Если каким-либо образом ввести в нее излучение, то направ- направление его распространения будет изменяться при отражении от стенок, но спек- спектральный состав сохранится прежним. Такое излучение неравновесно и неустойчиво. Сколь угодно малого отклонения свойств стенок от идеальности уже достаточно для того, чтобы излучение пришло к равновесию. Это произойдет и при идеальных стенках, если ввести в полость сколь угодно малое тело («пылинку»), способное поглощать и излучать. Такая «пылинка», не сказываясь на энергетическом балансе, переведет излучение в полости из любого неравновесного состояния в равновесное. От свойств «пылинки» зависит только время установления равновесия. Для экспериментального изучения спектрального состава равновесного излуче- излучения можно проделать небольшое отверстие в стенках полости, поддерживаемых при определенной температуре. Излучение, выходящее наружу через отверстие, обладает точно таким же спектральным составом. От равновесного оно отличается только тем, что распространяется в пределах некоторого телесного угла в одном направлении, т. е. оно не изотропно. О увеличением температуры внутри полости будет возрастать энергия выходяще- выходящего из отверстия излучения, что обусловлено увеличением объемной плотности {] энергии равновесного излучения в полости. При повышении температуры в полости изменяется и спектральный состав излучения, выходящего из отверстия: максимум спектрального распределения смещается в область более коротких волн. Действи- Действительно, выходящий из горячей печи свет имеет красноватый оттенок при сравни- сравнительно невысокой температуре и становится желтым и даже белым по мере ее роста. Для характеристики распределения энергии по длинам волн или по частотам вво- вводят спектральную плотность излучения С/я или С/^, так что величина С/я с!Я дает энергию единицы объема излучения с длинами волн в интервале от Я до Я Ч- с!Я, а 1]^ да) — с частотами в интервале от со до со Ч- дсо. Если это один и тот же спектральный интервал, то С/я йХ = С/^ да). Отсюда легко выразить С/я через С/^ или наоборот, принимая во внимание, что Я = 2лс/со (см. задачу 1). Очевидно, что ск». (9.1) В случае равновесного излучения спектральная плотность Ц^ (или С/я) представ- представляет собой универсальную функцию только частоты (или длины волны) и темпе- температуры. Основная задача теории теплового излучения состоит в определении этой функции С/а,(Г) (или Щ(Т)). Универсальный характер спектральной плотности равновесного излучения, как впервые показал Кирхгоф в 1860 г., непосредственно вытекает из второго начала термодинамики. В самом деле, предположим противное, т.е. что С/^(Г) каким-то образом зависит от природы тела, с которым излучение находится в равновесии, на- например, зависит от особенностей его спектра поглощения и испускания. Возьмем две
394 9. Термодинамика излучения. Световые кванты полости, в которых излучение находится в равновесии с разными телами, имеющими одинаковую температуру. Соединим полости небольшим отверстием так, чтобы они могли обмениваться излучением. Если плотности энергии излучения в них различны, то возникнет направленный перенос лучистой энергии, который приведет к самопро- самопроизвольному нарушению теплового равновесия между телами (т.е. к установлению некоторой разности температур). Это противоречит второму началу термодинамики. В то время как спектральное распределение энергии излучения, выходящего из отверстия в полости, имеет универсальный характер, для теплового излучения с от- открытой поверхности тела это не так: его спектральное распределение зависит не только от температуры, но и от материала поверхности. Для количественной ха- характеристики этого спектрального распределения вводят понятие испускательной способности тела г^ (или гя), т.е. спектральной плотности потока энергии излу- излучения, испускаемого единичной площадкой поверхности по всем направлениям, так что г^ да) (или гя дЯ) представляет собой поток излучения в соответствующем спек- спектральном интервале. Полный поток излучения всех длин волн представляет собой энергетическую светимость Я поверхности (см. п. 1.10). Очевидно, что <&. (9.2) о о Подчеркнем, что испускательная способность г^ характеризует только тепловое излучение тела (все виды люминесценции исключаются). Для данного тела вид функ- функции г^ зависит только от его температуры. Испускательная способность тела не зависит от окружающей среды, в частности от того, находится тело в равновесии с излучением или нет. Падающее на поверхность тела излучение частично отражается или рассеивается поверхностью, частично проходит через поверхность. Ограничимся случаем, когда тело непрозрачно, т.е. толщина его достаточна для того, чтобы прошедшее в него излучение успевало полностью поглотиться, не достигнув противоположной поверх- поверхности. Тогда можно условно говорить о поглощении самой поверхностью. Поглоще- Поглощение, как правило, имеет селективный характер и зависит от температуры поверх- поверхности. Так, например, тонкий слой сажи практически полностью поглощает видимый свет, но в значительно меньшей степени поглощает инфракрасное излучение. Плав- Плавленый кварц прозрачен в широком интервале длин волн, но начинает заметно погло- поглощать свет при температуре около 1500°С. Для характеристики таких свойств вводят поглощательную способность а^ (или ая) тела, под которой понимают безраз- безразмерную величину, показывающую, какая доля энергии падающего излучения данной частоты (или длины волны) поглощается поверхностью. Из определения поглоща- тельной способности следует, что а^ ^ 1. Опыт показывает, что чем больше поглощательная способность тела в некото- некотором спектральном интервале, тем интенсивнее его тепловое излучение при той же температуре и для тех же длин волн. Например, кварц, окрашенный небольшими примесями редких земель, имеет полосы поглощения в видимой области. При нагре- нагревании такого кварца в спектре его теплового излучения можно наблюдать светлые полосы, максимумы которых соответствуют областям поглощения при температуре, близкой к температуре свечения.
9.1. Тепловое излучение в замкнутой полости 395 Существование упомянутой связи между тепловым излучением и поглощением сле- следует из общих принципов термодинамики. Так как испускательная и поглощательная способности характеризуют само тело и не зависят от окружения, то для нахождения связи между ними можно рассмотреть частный случай, когда тело окружено равно- равновесным излучением с той же температурой, например заключено в полость, стенки которой либо идеально отражают излучение, либо поддерживаются при той же тем- температуре, что и тело. Выразим поток Ф^ этого излучения в единичном спектральном интервале вблизи частоты со, падающий на единичную площадку поверхности тела, через спектральную плотность И^ равновесного излучения. Так как оно изотропно, то в пределах телесного угла <Ю = $т в йв йд> распространяется энергия, составля- составляющая <Ю/Dл) часть от всей энергии. Если выбранное направление образует угол О с нормалью к поверхности, то поток с1Ф^, падающий в пределах <Н2 на единицу площади, равен сШ[а)со$Ойп/Dл). Для нахождения потока со всех направлений это выражение нужно проинтегрировать по ср в пределах от 0 до 2л и по О в пределах от 0 до л/2: 2л я/2 ф^ = ^ [дду [ ЗШ0СО8 060 = 7^й>- (9.3) 4л у ] 4 О О Часть этого потока, равная а^Ф^, поглощается, остальная часть A - а^Ф^ от- отражается и рассеивается. С отраженным и рассеянным потоком складывается поток собственного теплового излучения поверхности, равный испускательной способно- способности гю поверхности. В соответствии с принципом детального равновесия полный исходящий от поверхности поток излучения A — а^)Фш Н- г^ должен быть равен падающему потоку Ф^ из этого же спектрального интервала. Приравнивая эти выра- выражения, находим г^/а^ = Ф^ или, с учетом (9.3) \1> — отношение испускательной способности тела к его поглощательной способно- способности с точностью до множителя с/4 совпадает со спектральной плотностью энергии равновесного излучения 1/^G"), которая, как уже отмечалось, представляет собой универсальную функцию частоты и температуры. Каждая из величин г^ и а^ мо- может изменяться чрезвычайно сильно при переходе от одного тела к другому, но отношение г^/а^ одинаково для всех тел. В этом заключается содержание закона Кирхгофа A860). Тело, которое поглощает целиком всю энергию падающего на него излучения, на- называется черным. Его поглощательная способность а^ равна единице для всех час- частот и температур. Из закона Кирхгофа (9.4) следует, что испускательная способ- способность черного тела только постоянным множителем с/4 отличается от спектраль- спектральной плотности равновесного излучения: г^ = сЦ^/4. Спектральное распределение теплового излучения черного тела будет таким же, как у равновесного излучения при той же температуре. Поэтому равновесное излучение иначе называют черным излучением.*) *) Впрочем, как заметил Планк, равновесное излучение с не меньшим основанием можно назвать и белым, имея в виду надлежащее обобщение того, что понимают под «совершенно белым светом».
396 9. Термодинамика излучения. Световые кванты Сажа и платиновая чернь в видимой области имеют поглощательную способ- способность а^, близкую к единице. Но в далекой инфракрасной области а^ и для них заметно меньше единицы. Абсолютно черных тел, как и других идеализированных объектов, в природе не существует. Но можно создать устройство, по своим свойст- свойствам сколь угодно близкое к абсолютно черному телу. Это уже рассмотренная вы- выше замкнутая полость, в стенке которой имеется малое отверстие. Падающее извне излучение через отверстие проникает внутрь, попадает на стенки полости, частично поглощается ими, частично отражается или рассеивается и вновь попадает на стенки. Из-за малых размеров отверстия это произойдет многократно, прежде чем какая-то часть излучения снова попадет на отверстие. Поэтому практически весь падающий свет любой частоты полностью поглотится. Материал стенок полости значения не имеет. Отверстие полости в отношении падающего на него снаружи излучения и, следовательно, в отношении выходящего из него теплового излучения ведет себя как поверхность абсолютно черного тела с температурой, равной температуре сте- стенок полости. Описываемую модель черного тела можно проиллюстрировать простыми демон- демонстрациями. Если взять коробку, покрашенную внутри белой краской, то малое от- отверстие в ней будет казаться совершенно черным даже на фоне выкрашенной чер- черной краской наружной стенки. Черными выглядят снаружи открытые окна зданий, несмотря на то что в помещении стены и потолок светлые. Если же раскалить стенки полости из материала с малой поглощательной способностью, например фарфора, то ее отверстие будет ярко светиться на тусклом фоне прямого излучения самих стенок. Источник в виде полости с малым отверстием, стенки которой поддерживаются при постоянной температуре, используется при количественных измерениях излуче- излучения черного тела. Аналогичным образом устроен стандартный излучатель, служащий эталоном единицы силы света (канделы). На основе анализа экспериментальных данных Стефан в 1879 г. пришел к заклю- заключению, что полная испускаемая телом энергия при тепловом излучении пропорци- пропорциональна четвертой степени термодинамической температуры. В 1884 г. Больцман, используя вытекающее из электродинамики Максвелла выражение для давления изо- изотропного излучения р = {У/3, с помощью термодинамических соображений теорети- теоретически получил эту закономерность для излучения черного тела: 6@ = аТ\ (9.5) Теоретическое соотношение (9.5) между энергетической светимостью черного те- тела и термодинамической температурой, называемое законом Стефана-Болъцмана, хорошо подтверждается экспериментальными данными. Числовое значение посто- постоянной а по современным измерениям составляет 5,67 • 10~~8 Вт/(м2 • К4). Следует отметить, что этот закон справедлив только для черного тела. Для нечерных тел не существует простой аналитической зависимости светимости от температуры. Следующий важный шаг в теоретическом изучении равновесного излучения был сделан Вином в 1893 г. Рассматривая адиабатное сжатие равновесного излучения в полости с зеркальными стенками и учитывая изменение частоты света при отра- отражении от движущегося зеркала (эффект Доплера), Вин показал, что спектральная
9.1. Тепловое излучение в замкнутой полости 397 плотность ^у(Г) должна иметь вид (9.6) где / — некоторая функция отношения частоты к температуре, конкретный вид которой в рамках электромагнитной теории и феноменологической термодинами- термодинамики установить невозможно. Соотношение (9.6) сводит задачу нахождения универ- универсальной функции ^у(Г), зависящей от двух аргументов, к задаче нахождения функ- функции /(со/Т), зависящей только от одного аргумента со/Т. Это значит, что если из- известно спектральное распределение энергии равновесного излучения при какой-либо одной произвольной температуре, то с помощью формулы (9.6) можно найти его при любой другой температуре. Закон Вина (9.6) включает в себя как следствие и закон Стефана—Больцмана. Вы- Выражая испускательную способность черного тела гю через Ию с помощью соотноше- соотношения (9.4) и переходя при интегрировании по частотам к новой переменной х = со/Т, получим 0 0 0 Таким образом, интегральная светимость пропорциональна Г4, поскольку инте- интеграл по х не зависит от Т. Измерения распределения по длинам волн интенсивности излучения из отверстия в полости, стенки которой поддерживаются при постоянной температуре (Люммер и Прингсгейм, 1899 г.), показали, что при некотором значении длины волны Ят кри- кривая г^(Т) имеет ярко выраженный максимум (рис. 9.1). С увеличением температуры максимум смещается в область более коротких длин волн, причем так, что произве- произведение температуры на длину волны, отвечающую максимуму, остается прежним: ХтТ = Ъ. (9.7) Значение константы Ъ = 0,29 см • К определено из опытных данных. Соотноше- Соотношение (9.7) получило название закона смещения. Оно непосредственно следует из термодинамической формулы Вина (9.6). Переходя в ней от частот к длинам волн, получим (см. задачу 1) ) (9.8) где /! (ЯГ) = Bя"сL/(ЯГM/B#с/ЯГ) — новая неопределенная функция от аргумен- аргумента ЯГ. Обозначив х = ХТ, при фиксированной температуре для определения положе- положения максимума зависимости Щ{Т) от Я получим уравнение АХ их -о. „ которое имеет некоторый корень х = хт. Это значит, что при любой температу- температуре максимум зависимости ^(Г) от Я получается при одном и том же значении
398 9. Термодинамика излучения. Световые кванты к 1650К 12 3 4 5 Я,мкм аргумента х = хт, т.е. ХтТ = хт = сопз*, что и доказывает закон смещения. Из (9.8) следует, что значение спектраль- спектральной плотности 1/^{Т) в максимуме, т.е. при Я = Яш, пропор- пропорционально пятой степени термодинамической температуры. При практически достижимых температурах максимум испускательной способности черного тела лежит в инфра- инфракрасной области. Так, при Т = 3000 К максимуму соответ- соответствует длина волны Я = 0,96 мкм. Только при Т > 5000 К максимум попадает в зеленую область спектра, к кото- которой глаз наиболее чувствителен. Светимость черного те- тела быстро растет с температурой (~ Г4) и при высо- высоких температурах достигает очень больших значений. При Т = 6000 К (температура поверхности Солнца) с каждо- каждого квадратного сантиметра черного тела излучается поток мощностью 7,4 кВт, но лишь небольшая часть этой мощно- мощности приходится на видимую область спектра. Рассмотренные выше закономерности теплового излуче- способностъ^шог^ ния используются в оптических методах измерения темпе- при разных температурах ратуры (оптическая пирометрия). Контрольные вопросы • При каких условиях тепловое излучение будет термодинамически равновесным? Перечис- Перечислите основные свойства равновесного излучения. Будет ли равновесным излучение, выхо- выходящее из маленького отверстия в полости? • Как испускательная способность тела связана с его энергетической светимостью? Докажите с помощью второго закона термодинамики, что отношение испускательной и поглощатель- ной способностей одинаково для всех тел. • Покажите, что испускательная способность черного тела с точностью до множителя с/4 совпадает со спектральной плотностью равновесного излучения. • Как на опыте можно реализовать черное тело? • Как энергетическая светимость абсолютно черного тела зависит от температуры? • Каким образом по измеренной спектральной зависимости испускательной способности чер- черного тела гш при некоторой температуре Т построить график гш для другой температу- температуры ТХ1 • Как изменяется положение максимума на кривых гш и гя при изменении температуры черного тела? Задачи 1. Выразите спектральную плотность (/д энергии равновесного излучения в шкале длин волн через спектральную плотность {]ш в шкале частот. Решение. Объемная плотность энергии излучения в интервале частот от со до со + йсо равна Цц, йсо. Эта же энергия, выраженная через длины волн, равна (/д (Ц. Подставим в Цыйсо выражения со = 2яс/Я и йсо = — Bяс/Я2)с1Я. Знак минус здесь означает только то, что с возрастанием длины волны частота убывает, поэтому его можно опустить. Таким
9.2. Спектральная плотность равновесного излучения 399 образом, (/я = Bяс/Я2). Если для {]ш воспользоваться законом Вина (9.6), выражающим ее через универсальную функцию /, то для Их{Т) получим: 9.2» Спектральная плотность равновесного излучения. Формула Планка Изложенными в п. 9.1 результатами исчерпывается все то, что может дать элек- электромагнитная теория и феноменологическая термодинамика в проблеме теплового излучения. Термодинамическая формула Вина (9.6) теоретически обосновывает за- законы смещения (9.7) и Стефана—Больцмана (9.5), но числовые значения входящих в них постоянных Ь и а оставляет неопределенными, так как выражает спектраль- спектральную плотность равновесного излучения ^(Т) через некоторую функцию /(со/Т), вид которой в этих рамках установить невозможно. Для решения основной задачи теории теплового излучения — нахождения испускательной способности черного тела г^Т) или связанной с ней соотношением гю = с 6^/4 спектральной плотно- плотности энергии равновесного излучения \]ы — необходимо применение статистических методов с привлечением какой-либо конкретной физической модели. Из термодинамических соображений ясно, что вид искомой функции ^(Г) не должен зависеть от того, с какими телами излучение находится в тепловом равнове- равновесии. Поэтому, следуя Планку, рассмотрим простейший пример излучающего тела — линейный гармонический осциллятор с собственной частотой &>0, зарядом е и мас- массой т (электрон, связанный квазиупругой силой). Пусть осциллятор находится в замкнутой полости, заполненной равновесным из- излучением с температурой Т. Под действием поля излучения со сплошным спект- спектром ^у(Г) он совершает вынужденные колебания. Благодаря резонансным свойст- свойствам осциллятора эти колебания будут иметь заметно отличную от нуля амплитуду лишь в узкой области частот вблизи собственной частоты осциллятора со0. При этом поглощаемая осциллятором мощность Рпогл может быть выражена через значение спектральной плотности излучения V^ на частоте со0. В динамическом равновесии с излучением поглощаемая мощность Рпогл в среднем равна испускаемой осциллято- осциллятором мощности Рисп, которая, в свою очередь, может быть выражена через среднюю энергию (е) осциллятора при температуре Т. Таким путем можно связать 1]^ (Т) со средней энергией (е) теплового возбуждения осциллятора. Последняя вычисляется методами статистической механики. Так как все это справедливо для осциллятора с произвольным значением <у0, то такой путь позволяет рассчитать спектральную плотность равновесного излучения на всех частотах. Вынужденное движение осциллятора под действием гармонической внешней си- силы РхA) = еЕхA) = Ке [еЕОх ехр(-/й#)] рассматривалось в п. 2.3 при изучении те- теории дисперсии. Установившиеся колебания происходят на той же частоте со: хA) = Ке [*0 ехр(—1Ш)], где комплексная амплитуда *0 в соответствии с B.32) равна х0 = —ту г——— Ео . (9.9) @$ ~ (О1 - 21у(О
400 9. Термодинамика излучения. Световые кванты Здесь постоянная затухания у дается формулой A.73). Среднюю поглощаемую осциллятором мощность (т.е. работу, совершаемую над ним внешним полем за единицу времени) Рпогл = (е/^ (*)*(*)) проще всего найти, если учесть, что при установившихся колебаниях она равна средней мощности силы радиацион- радиационного трения Р^{г) = 2тух{г)\ РПОГЛ = (/^(ФКО) = 2ту\х2{г)). Так как ±{г) = = Ке [—1(ох0 ехр(—1Ш)]9 то (х2(()) = со2\х0\2/2. Поэтому -2 4с- (9Л°) Нас интересует случай, когда действующее на осциллятор поле излучения изо- изотропно и не поляризовано. Выразим квадрат его проекции на ось осциллятора Е$х через объемную плотность энергии: /"Ч/* тт AР (^\\ ([Т<И\\ -Х- AР A\\ -4- /Я* СИ: Ц = ео(Е2A)) = ео((Е2A)) + (Е2{г)) + (Е2({))). Так как в изотропном поле все направления колебаний вектора Е(г) представлены одинаково, то V = ^{Е2(г)) — ^ Е$х (СГС) или V = Зео(Е2(()) = \ ео(Е$х(()) (СИ) и в правую часть (9.10) можно подставить Е$х = %л1/ (СГС) или Е$х = \и 1г§ (СИ). В немонохроматическом поле такое выражение для поглощаемой мощности спра- справедливо для каждой из его монохроматических составляющих, не скоррелированных между собой. Мощность, поглощаемая осциллятором в спектральном интервале от со до со + йсо, получится из (9.10), если заменить V на 1]^ йсо. Тогда полная поглощае- поглощаемая мощность в интервале частот от 0 до оо ГГГ- Р -*ЛУ<2 7 ^ Г! А,- Ч ^ ''поп, " "з^- ] {(О2 ^2J+4^2 "« ^ 2 ГЦ- р _ ~г~ * (О О*/ К(О$-(О2J о Для всех частот со0, лежащих в оптическом диапазоне, выполняется сильное нера- неравенство у <^С соц. При этом условии первый сомножитель в подынтегральном выра- выражении в (9.11) имеет резко выраженный резонансный характер: он имеет острый максимум при со = со0 и быстро приближается к нулю, как только со отклоняется от (Оц более чем на у. Поэтому заметный вклад в интеграл дает лишь узкая область частот вблизи со = со0. Второй сомножитель 11^ подынтегрально выражения — иско- искомое спектральное распределение излучения — представляет собой плавную функцию частоты, так что в пределах этой области его можно считать постоянным и вынести за интеграл, заменив значением при со = со0. Кроме того, можно заменить в пер- первом сомножителе со на со0, а со%-со2 на 2со0(со0 - со). При у < со0 нижний предел
9.2. Спектральная плотность равновесного излучения 401 интегрирования можно распространить до — оо. Тогда и ¦ от ° ] [со* — соI + у* Зт —оо 2 <? 2 (9Л2) °2 г ску яге2 (со0 - ^J Теперь нужно рассчитать испускаемую осциллятором мощность Рисп. Как следует из (9.9), вынужденные колебания осциллятора под действием излучения с непре- непрерывным спектром 1]ы имеют заметную амплитуду только в узкой полосе час- частот вблизи собственной частоты со0 осциллятора. Поэтому при расчете испус- испускаемой мощности Рисп можно считать, что осциллятор совершает гармоничес- гармонические колебания с частотой со = со0, и воспользоваться результатами п. 1.5. Соглас- Согласно формулам A.72)—A.73), Рисп = 2у(е)9 где (е) — средняя энергия осциллятора, а у = е2й>$/Cтс3) (СГС) или у = [1/Dле0)]е2со$/(Зтс3) (СИ). Таким образом, г <*}. (9-13) I/' -ч^*». * ИСП л 4ле0 Так как в состоянии динамического равновесия с излучением энергия осциллятора в среднем остается неизменной, поглощаемая осциллятором мощность должна быть равна испускаемой мощности. Приравнивая правые части (9.12) и (9.13), получаем Здесь опущен индекс у со, так как это условие должно выполняться для осциллятора с любой собственной частотой. Соотношение (9.14) связывает спектральную плотность ^(Т) равновесного из- излучения со средней энергией (с) осциллятора при температуре Т. Заряд е и масса т осциллятора, т. е. его частные характеристики, выпали из этой формулы, ибо в теп- тепловом равновесии как Г/дДГ), так и (е) определяются только температурой. .Классическая статистическая механика дает для средней энергии гармоническо- гармонического осциллятора в тепловом равновесии при температуре Т значение (е) = кТ9 где к = 1,38 • 10~~23 Дж/К — постоянная Больцмана. Это частный случай закона класси- классической статистики о равнораспределении, согласно которому в тепловом равновесии на каждую степень свободы в среднем приходится ^кТ кинетической энергии. Для осциллятора, совершающего колебания на собственной частоте, средние значения кинетической и потенциальной энергии одинаковы, так что средняя энергия тепло- теплового возбуждения каждой колебательной степени свободы составляет кТ: (е) = {еК) + (еП) = 2{еК)=кТ. (9.15) Если подставить классическое значение средней энергии осциллятора (9.15) в со- соотношение (9.14), то для спектральной плотности равновесного излучения
402 9. Термодинамика излучения. Световые кванты получается выражение, известное под названием формулы Рэлея-Джинса: (9.16) Это соотношение согласуется, как и следовало ожидать, с формулой Вина (9.6), которая как непосредственное следствие термодинамики должна выполняться незави- независимо от конкретной модели. В самом деле, (9.16) совпадет с (9.6), если там неопреде- неопределенную функцию / положить равной /(со/Т) = кТ/(л2с^(о). В длинноволновой об- области, т.е. при малых со, формула Рэлея-Джинса (9.16) хорошо согласуется и с экс- экспериментальными результатами: в этой области испускательная способность черно- черного тела растет пропорционально квадрату частоты. Но при дальнейшем увеличении частоты обнаруживается резкое расхождение с экспериментом, так как (9.16) пред- предсказывает такой рост спектральной плотности для всех частот, вплоть до бесконечно больших значений при со —> оо. В соответствии с (9.16) в полости при любой конеч- конечной температуре должны преобладать ультрафиолетовые и рентгеновские лучи. Из-за неограниченного роста 1/ш с частотой получается, что объемная плотность Ц энергии излучения бесконечно велика: интеграл в (9.1) с /7^ из (9.16) расходится. Если же считать полную энергию конечной, то по этой теории получается, что при установ- установлении равновесия между телом и излучением вся энергия тела перейдет в энергию высоких частот излучения, т. е. термодинамическое равновесие при конечной плот- плотности энергии излучения вообще невозможно. В то же время опыт показывает, что равновесие устанавливается, плотность энергии излучения II остается при этом ко- конечной, а ее спектральное распределение Ь^ растет с частотой, достигает максимума при некоторой частоте и затем снова падает. Таким образом, безупречный с точки зрения классической физики вывод дает оче- очевидно абсурдную формулу (9.16), находящуюся в разительном противоречии с опы- опытом. Такое положение Эренфест назвал «ультрафиолетовой катастрофой». По вы- выражению Лоренца, уравнения классической физики оказались неспособными объяс- объяснить, почему угасшая печь не испускает синих лучей наряду с излучением больших длин волн. Г> 1900 г. Планк получил формулу для спектральной плотности ^(Т) равновес- равновесного излучения, хорошо согласующуюся с опытом при всех частотах. Оказалось, что для теоретического вывода этой формулы необходима гипотеза, коренным об- образом противоречащая представлениям классической физики. Планк предположил, что энергия осциллятора может принимать не любые, а только вполне определенные дискретные значения еп9 отделенные друг от друга конечными интервалами. Переход осциллятора из одного состояния в другое сопровождается поглощением или испус- испусканием конечной порции (кванта) энергии излучения. В такой системе с дискретным энергетическим спектром среднюю энергию (е) в тепловом равновесии при темпера- температуре Т уже нельзя находить по формуле (9.15). Вероятность рп того, что осциллятор находится в состоянии с энергией еп, в соответствии с распределением Больцмана пропорциональна ехр[—еп/(кТ)]9 но при вычислении средних значений интегралы за- заменяются суммами:
9.2. Спектральная плотность равновесного излучения 403 Еще одна гипотеза необходима для установления значений энергии еп разрешен- разрешенных состояний осциллятора. По предположению Планка, гармонический осциллятор имеет эквидистантный энергетический спектр, так что энергия еп в состоянии с но- номером п составляет целое кратное наименьшей порции энергии е^: еп = пе^ где п = 0, 1, 2,... *) Тогда стоящая в знаменателе формулы (9.17) сумма представляет собой просто бесконечную геометрическую прогрессию со знаменателем ехр(— / Легко видеть, что сумма, стоящая в числителе (9.17), равна производной с!5(/?)/<1/?, взятой с противоположным знаком: Подставляя (9.19) и (9.18) в (9.17), находим ^ А-1 <9-20) Этот результат совпадает с классическим выражением (9.15) только в предельном случае при е^/{кТ) —* 0. Подставляя полученное значение средней энергии квантового осциллятора **) (9.20) в (9.14), получаем для спектральной плотности равновесного излучения вме- вместо формулы Рэлея—Джинса выражение и* ~ я2сЗ ехр[ео/(*Г)] - Г Чтобы оно не противоречило термодинамической формуле Вина (9.6), согласно которой температура может входить в 1]^ только в комбинации со/Т, необходимо принять, что е0 = Па>9 (9.22) где К — универсальная постоянная (постоянная Планка), имеющая размерность про- произведения энергии на время. В результате для спектральной плотности равновесного излучения получаем формулу Планка: иМ) 1- (9<23) %) Современная квантовая механика дает для уровней энергии гармонического осциллятора значения *+) В оригинальной работе Планка 1900 г. средняя энергия осциллятора находилась путем вычисления средней энтропии на основе соотношения Больцмана 5 = к 1п № между энтропией и термодинамической вероятностью \У.
404 9. Термодинамика излучения. Световые кванты График функции ^(Т) приведен на рис. 9.2. Формула Планка прекрасно со- согласуется с опытом при всех частотах и температурах. Для малых частот (длин- (длинных волн) и высоких темпера- 11Ш(Т)\ ТУР* когда Ьхо/{кТ) <С 1, экспо- '"^ ненту можно разложить в ряд по степеням Нсо/(кТ). Если ограничиться линейным членом этого разложения, то формула Планка (9.23) перейдет в фор- формулу Рэлея—Джинса (9.16). Но в области высоких частот и низ- низких температур формула План- 0 2,5 5,0 7,5 10 Ъ(о/(кГ) ка предсказывает совершенно Рис. 9.2. График спектральной плотности равновесного иное поведение 1]^(Г), неже- теплового излучения (функции ^(Г)), построенный ли классическая теория. При по формуле Планка ы/{кт) >> 1 экспонента в зна- менателе гораздо больше едини- единицы. Поэтому поведение /7^(Г) в области коротких волн приближенно описывается формулой ЗД (924) Такая формула была предложена Вином еще в 1896 г. для описания эксперименталь- экспериментальных результатов в коротковолновой области спектра. Экспоненциальное убывание спектральной плотности с ростом частоты устраняет «ультрафиолетовую катастро- катастрофу» классической теории. Между предельными случаями, соответствующими применимости формул Рэлея—Джинса (9.16) и Вина (9.24), лежит обширная область, в которой и нахо- находится максимум кривой спектрального распределения. При повышении температуры этот максимум в согласии с законом смещения (9.7) сдвигается в сторону коротких волн, причем значение постоянной Ъ в (9.7) может быть теперь найдено из решения трансцендентного уравнения (см. задачу 1): 6=1,265^. (9.25) к Объемная плотность V энергии равновесного излучения (9.1) при интегрировании по всем частотам с 17^ из формулы Планка (9.23) получается конечной (см. задачу 2). Константа а в законе Стефана—Больцмана (9.5) приобретает теперь вполне опреде- определенное теоретическое выражение (см. задачу 2): л2к4 Соотношения (9.25) и (9.26) выражают константы Ъ и а, непосредственно измеря- измеряемые на опыте, через фундаментальные физические постоянные Ник. Исторически первое определение числового значения Н, как и наиболее точное для того време- времени A900 г.) определение значения постоянной Больцмана к, было сделано Планком на основе закона Стефана—Больцмана (9.5) и закона смещения (9.7). Полученные
9.2. Спектральная плотность равновесного излучения 405 Планком значения очень близки к принятым в настоящее время: П = 1,05 • 10~34Дж-с, Н = 2лП = 6,626 • 10~34Дж-с, к = 1,38 • 10~23Дж/К. Поучительна история открытия закона излучения (9.23). Подлинная история создания те- теории далеко не всегда отражает логику ее построения. Формула Вина (9.24), квантовая по своей сути, была установлена раньше, чем классическая формула Рэлея—Джинса (9.16). (Ра- (Работа Джинса, вызвавшая «ультрафиолетовую катастрофу», датируется 1905 г.) Вин исходил из аналогии между наблюдаемой на опыте экспоненциальной зависимостью 13^ от Нсо/(кТ) в области высоких частот и максвелловским распределением молекул газа по скоростям. В те- теоретическом выводе формулы (9.24) Вин, развивая идеи русского физика В. А. Михельсона, делает ряд произвольных допущений, содержащих в скрытом виде квантовую гипотезу о свя- связи частоты излучения с энергией элементарного процесса испускания света. Но в области низких частот полученная Вином формула не давала хорошего описания экспериментальных данных. К формуле (9.23) Планк пришел сначала полуэмпирическим путем, стараясь улуч- улучшить согласие с экспериментом в области низких частот, т.е., как это ни парадоксально, именно в той области, где квантовые свойства несущественны. Первое сообщение Планка 19 октября 1900 г. так и называлось: «Об одном улучшении закона излучения Вина». Полу- Полученная им формула была проверена на опыте Рубенсом, а также Луммером и Прингсгеймом. Хорошее согласие с опытом побудило Планка к настойчивым поискам истинного содержа- содержания своей формулы. И через два месяца, 14 декабря 1900 г., Планк делает доклад, в котором приводится полное решение поставленной задачи. Эту дату можно считать днем рождения квантовой теории. Планк доказал, что формулу (9.23) можно вывести только в том случае, если допустить квантование энергии, противоречащее классическим представлениям. Нелегко было примириться с таким отказом от классических представлений, и Планк, со- совершив великое открытие, еще в течение нескольких лет пытался понять квантование энергии с позиций классической теории. Безуспешность этих попыток привела его к окончательному выводу, что в рамках классической физики излучение черного тела понять невозможно. Постоянная Планка Й играет в квантовой физике такую же роль, как скорость све- света с в релятивистской физике. Эти фундаментальные мировые константы определяют границы применимости классического описания. В масштабах макромира числовое значение постоянной Планка чрезвычайно ма- мало. Этим объясняется широкая применимость классической физики с лежащей в ее основе концепцией непрерывности к описанию макроскопических явлений. Решение проблемы теплового излучения исторически было первым шагом на пути к раз- разгадке «тайны потерянной константы». Впоследствии ограниченность представлений классической физики обнаружила себя при исследовании фотоэффекта (см. п. 9.5) и при попытках объяснения устойчивости атомов и закономерностей в спектрах их излучения. В начале XX века была создана так называемая «старая квантовая тео- теория», в основе которой лежат гипотеза Планка о дискретном характере испускания и поглощения света осциллятором, введенные Эйнштейном представление о квантах света (фотонах) и уравнение фотоэффекта, построенная Бором теория простейших атомов. Но старая квантовая теория не представляла собой стройной, логически замкнутой науки. Удачно описав некоторые экспериментальные факты, она не могла дать правильного объяснения и количественного описания всего многообразия явле- явлений микромира. С наступлением второй четверти XX столетия начинается период создания современной квантовой теории с ее надежными логически непротиворечи- непротиворечивыми основными положениями и адекватным математическим аппаратом.
406 9. Термодинамика излучения. Световые кванты Фундаментальная константа /г — постоянная Планка, играющая выдающуюся роль в современной физике, — может быть определена экспериментально не только с по- помощью законов излучения черного тела, но и другими, более прямыми и точными методами. Некоторые из них рассмотрены ниже. Значения /г, полученные на основе разных физических явлений (тепловое излучение, фотоэффект, коротковолновая гра- граница сплошного рентгеновского спектра, эффект Джозефсона в сверхпроводимости и др.), хорошо согласуются друг с другом. Контрольные вопросы • Как связана мощность, поглощаемая одномерным гармоническим осциллятором в поле равновесного излучения, со спектральной плотностью энергии этого поля? • Как испускаемая осциллятором мощность выражается через его среднюю энергию? • Получите выражение, связывающее спектральную плотность энергии равновесного излу- излучения со средней энергией осциллятора, находящегося в термодинамическом равновесии с излучением. • К каким теоретическим результатам для зависимости 1]ш от частоты и для объемной плот- плотности энергии Ц приводит применение классической статистической механики? • Как найти среднюю энергию теплового возбуждения осциллятора при температуре Г, если предположить, что его энергия может принимать только дискретные значения еп = пе^1 В каком случае результат совпадает с тем, что дает теорема о равнораспределении? • Какую зависимость Ц^ от частоты дает формула Планка? Рассмотрите также предельные случаи низких и высоких частот. • Какую роль в современной физике играет постоянная Планка? Задачи 1. Вычислите константу Ъ в законе смещения, основываясь на формуле Планка (9.23). Решение. Переходя в формуле Планка от частот к длинам волн (см. задачу 1 в п. 9.1), получим -*ЕЕ.п - 8я/*с 1 Я~ А2 <°~ А2 ехр(Лс/А*Г) - Г Для нахождения максимума функции Цх введем вместо А безразмерную переменную х = кс/(ХкТ). Тогда задача сводится к нахождению положения минимума функции /л(х) = х (ех — 1). Приравнивая к нулю ее первую производную, получаем трансцен- трансцендентное уравнение л: = 5A — е~^), корень которого легко найти методом последователь- последовательных приближений: х$ = 5; х^ = 5A — е~5) = 4,966; х2 = 5A — е~~*1) = 4,965. Отсюда Ь = Х,ПТ = Нс/(кх,п) = 0,201кс/к = 2,90- 10~3м/К. Если же рассматривать спектраль- спектральную плотность 1}(О в шкале частот, то ее максимум соответствует минимуму функции /аД*) = *~3(е* — 1), где х = Нсо/(кТ) = Нс/{ХкТ) имеет прежний смысл. Положение ми- минимума находится из трансцендентного уравнения х = 3A — е"*), которое имеет корень х'т = 2,821. Отсюда сот/Т = кх'т/!г = 2,82\к/К. Максимуму функции []ш соответствует длина волны А/„ = 2лс/сот = кс/(кТх'т) > Хт. Таким образом, максимум спектральной плотности в шкале частот сдвинут в длинноволновую сторону по отношению к максимуму спектральной плотности в шкале длин волн: ЯтАи = х'т/хт = 1,760.
9.3. Спонтанное и вынужденное излучения 407 2. Пользуясь формулой Планка, найдите теоретическое значение постоянной а в законе Стефана—Больцмана. Решение. Для нахождения светимости К абсолютно черного тела нужно проинтегриро- проинтегрировать испускательную способность гш = сб^/4 по всем частотам: оо оо оо -_^_ [ со6(О = кТ [ х ** ^ 4л2с2 У ехр{Нсо/(кТ)} - 1 4л2с2& ] е* - Г 0 0 0 Здесь введена безразмерная переменная интегрирования х = Нсо/(кТ). Рассматривая 1/F* — 1) = е~~*/A — е~*) как сумму бесконечно убывающей геометрической прогрес- прогрессии е~*A + е~* +е"~^ + ...)> почленным интегрированием получаем: о Таким образом, а = л2 к4/{60с2 П3) = 5,67 • 10~8 Вт/(м2 • К4). 9.3. Световые кванты. Спонтанное и вынужденное излучения Гипотеза Планка о квантовании энергии осциллятора приводит, как было показано в п. 9.2, к формуле (9.23), которая прекрасно подтверждается экспериментом. Однако эта гипотеза не сразу встретила признание. Считалось, что новые идеи представля- представляют собой лишь искусственный математический прием, которому можно найти ин- интерпретацию в рамках классической физики. Но все попытки такого рода оказались неудачными. Революционные идеи Планка были оценены по достоинству и получили дальней- дальнейшее развитие прежде всего в работах Эйнштейна. Он первый указал на то, что кроме теплового излучения существуют и другие явления, которые можно объяснить на основе квантовой гипотезы. В частности, поведение теплоемкости твердых тел при низких температурах (отклонения от закона Дюлонга и Пти) получает объяснение, если для средней энергии осциллятора использовать квантовое выражение (9.20). Основанная на этих идеях количественная теория теплоемкости твердых тел была развита Дебаем. В 1905 г. Эйнштейн выдвинул гипотезу световых квантов. Он предположил, что дискретный характер присущ не только процессам испускания и поглощения света, но и самому свету. Гипотеза о корпускулярных свойствах света позволила объяс- объяснить результаты экспериментов по фотоэффекту, совершенно непонятные с позиций классической электромагнитной теории (см. п. 9.5). Однако представление о свете как потоке классических корпускул несовместимо с эмпирически совершенно явны- явными волновыми свойствами света. Эйнштейн пришел к заключению, что «природа излучения должна быть не такой, какой мы ее считаем в настоящее время». За этими словами скрывается то, что теперь принято называть двойственной природой света или корпускулярно-волновым дуализмом (см. п. 9.6). Корпускулярный аспект излуче- излучения проявляется наиболее отчетливо в коротковолновой части спектра, где для спек- спектральной плотности 11Ю(Т) справедлива формула Вина (9.24), волновой аспект —
408 9. Термодинамика излучения. Световые кванты в длинноволновой, где применима формула Рэлея—Джинса (9.16). Ни один из этих аспектов не дает полного представления об излучении, ибо для полного объясне- объяснения наблюдаемых явлений необходимо их сочетание. Закон излучения Планка (9.23), который содержит в себе предельные случаи, соответствующие корпускулярному и волновому аспектам, представляет собой диалектический синтез двух, казалось бы, несовместимых теорий и снимает противоречие между ними. Но вывод закона излучения по методу Планка, приведенный в п. 9.2, в какой-то мере неудовлетворителен, поскольку он во многом основан на законах классичес- классической физики и лишь частично использует квантовые представления. В самом деле, формула (9.14), связывающая спектральную плотность энергии равновесного излу- излучения Ь^(Г) со средней энергией (е) осциллятора, получена чисто классическим путем, так как поглощение и испускание света осциллятором рассчитывались с по- помощью классической электродинамики, в то время как при нахождении (е) использо- использована квантовая гипотеза о дискретных энергетических уровнях осциллятора. Успех такой эклектической теории связан со спецификой выбранной модели: для осцил- осциллятора, как это уже отмечалось при обсуждении классической теории дисперсии (см. п. 2.3), классическое и квантово-механическое рассмотрение процессов погло- поглощения и испускания приводит к одинаковым результатам. Другая трактовка равновесного излучения, восходящая к Рэлею, состоит в том, чтобы само электромагнитное поле в полости рассматривать как набор осцилля- осцилляторов. Можно говорить о собственных колебаниях этого поля и применить к ним методы статистической механики, а не вводить вспомогательный планковский осцил- осциллятор, взаимодействующий с излучением. Пусть для определенности полость име- имеет форму куба с ребром Ц а ее стенки — зеркальные. Собственные нормальные колебания поля в таком объемном резонаторе представляют собой стоячие волны различных частот. Полное поле можно представить как суперпозицию таких стоя- стоячих волн, и в энергетическом отношении оно ведет себя как система невзаимодей- невзаимодействующих гармонических осцилляторов. Для нахождения спектральной плотности энергии поля в состоянии термодинамического равновесия нужно подсчитать число независимых стоячих волн в полости с частотами в интервале от со до со + дсо. Как и в одномерном случае струны, закрепленной на концах, здесь для любого нормаль- нормального колебания необходимо, чтобы вдоль каждого ребра укладывалось целое число полуволн. Пусть направление волны (нормаль к плоскостям равных фаз) образует углы а, р и у с ребрами куба. Проекция любого ребра на это направление должна быть равна целому числу полуволн: Ьсоьа = П\\/2, Ьсо$E = я2А/2, Ьсоьу = я3А/2. Возводя в квадрат и складывая эти три равенства, с учетом того, что со82 а + со82/3 + соз2 у = 1, получаем I? = (я2 + я2 4- я2)(А/2J. Отсюда следует, что частота со = 2лс/Х — (я2 + п\ + п^)*/2лс/Ь каждого нормального колебания определяется суммой квадратов трех целых чисел я1? я2, Пу Нормальное колебание удобно изобразить точкой в трехмерном пространстве. Совокупность таких точек образует кубическую решетку. Поэтому число <Ш различных колебаний с частотами в интервале от со до со + ск*> равно числу точек с целочисленными координатами в пределах лежащего в первом октанте шарового слоя (рис. 9.3) радиусом Ьсо/(лс)
9.3. Спонтанное и вынужденное излучения 409 пъ и толщиной Ьдсо/(лс): _ 1?0J&а) 2л2с2 ' Кроме того, следует учесть, что каждому нормальному колебанию, задаваемому це- целыми числами Яр п2, Пу соответствуют две независимые стоячие волны с ортого- ортогональными состояниями поляризации. Применяя гипотезу Планка к отдельному нор- нормальному колебанию с частотой ш, будем считать, что его энергия е может быть равна целому чис- числу элементарных квантов Нсо, т. е. е = пНсо. Тогда в состоянии теплового равновесия средняя энер- энергия, приходящаяся на одно нормальное колебание, выражается формулой (9.20) с^0 = Нсо, а имен- именно {е} = Нсо/{схр[1ш/(кТ)} — 1}. Умножая (е) на число независимых колебаний поля со2 й(о/(л2с^), приходящихся на 1 м3 объема полости, получаем для спектральной плотности равновесного излу- излучения 11и(Т) формулу Планка (9.23). Этот резуль- Рис. 9.3. Кподсчету числа нормальных тат выведен здесь для кубической полости, но он должен быть верен для полости любой формы (ес- (если интересоваться волнами, длина волны которых мала по сравнению с размерами полости). В противном случае, вопреки тому, что нам известно о равновесном излучении, его плотность ^4,(Г) зависела бы от формы полости. Если же к осцилляторам поля применить теорему о равнораспределении энер- энергии в состоянии теплового равновесия, т.е. положить среднюю энергию, приходя- приходящуюся на одно нормальное колебание, равной кТ, то мы сразу придем к формуле Рэлея—Джинса (9.16). Причина «ультрафиолетовой катастрофы» проявляется здесь со всей отчетливостью: чем выше частота (о, тем большее число осцилляторов поля приходится на единичный интервал частот. Это число (о2/(л2с^) растет неограни- неограниченно при со —> оо. Ясно, что классический закон равнораспределения становится неприменимым для осцилляторов поля с высокими частотами. В приведенном здесь выводе формулы Планка предполагалось, что каждое нормаль- нормальное колебание (мода) электромагнитного поля в полости может обладать энергией е = пНсо. Возникает вопрос, как нужно интерпретировать целое число п в рамках гипотезы световых квантов. Предположение, что энергия одного кванта света может быть равна пНсо, противоречит опыту (фотоэффект, см. п. 9.5). Поэтому нужно счи- считать п числом тождественных световых квантов (фотонов) в одной моде. Когда п уменьшается или увеличивается на единицу, говорят о поглощении одного фотона или испускании одного фотона в данную моду. В состоянии теплового равновесия среднее число фотонов в моде Псо ехр(Па)/кТ) - 1' (9.27)
410 9. Термодинамика излучения. Световые кванты Такое распределение характерно для газа невзаимодействующих тождественных час- частиц, подчиняющихся статистике Бозе—Эйнштейна. Неклассический характер этой корпускулярной картины проявляется здесь в принципиальной неразличимости све- световых частиц — фотонов. В отличие от рассмотренной Планком простейшей модели системы, взаимодей- взаимодействующей с излучением, — гармонического осциллятора — к процессам испускания и поглощения света реальными атомами классическое описание неприменимо. Ис- Исчерпывающее описание этих процессов дается квантовой электродинамикой, но их можно исследовать и на основе простой феноменологической теории, развитой Эйн- Эйнштейном в 1916 г. В этой теории впервые было введено представление о вынужден- вынужденном излучении, которое впоследствии нашло практическое применение в квантовых генераторах когерентного излучения — мазерах и лазерах. Будем считать, что свободный атом может находиться только в стационарных состояниях с определенной энергией Яр г2,... Переход атома из одного стационар- стационарного состояния в другое может происходить скачком в результате поглощения или испускания электромагнитного излучения, причем для такого элементарного процес- процесса выполняется закон сохранения энергии: ет — еп = Нсо — энергия поглощаемого или испускаемого фотона равна разности энергий соответствующих стационарных состояний атома. Эти квантовые представления о строении атома и характере его взаимодействия с излучением, обобщающие гипотезу Планка о гармоническом ос- осцилляторе, были введены Бором в 1913 г. и полностью подтверждаются современной квантовой теорией. Пусть свободный, не подверженный внешним влияниям атом находится в возбу- возбужденном состоянии с энергией я2. С точки зрения классической физики атом начина- начинает излучать сразу же после того, как он попадает в возбужденное состояние, и этот процесс длится в течение некоторого времени г (см. п. 1.5). По квантовым представ- представлениям, самопроизвольный переход атома при отсутствии внешних воздействий из возбужденного состояния е2 в основное ех с испусканием фотона {спонтанное из- излучение) происходит мгновенно, скачком. В какой именно момент произойдет этот переход, предсказать невозможно. Момент испускания фотона есть случайная вели- величина, суждения о которой могут носить лишь статистический характер. Обозначим через А21 вероятность спонтанного перехода атома в единицу времени из воз- возбужденного состояния в основное. Рассмотрим совокупность очень большого числа одинаковых атомов, которые образуют настолько разреженный газ, что взаимодей- взаимодействием между атомами можно пренебречь. Пусть в момент времени г в первом возбужденном состоянии е2 находится М2 атомов. В течение промежутка времени от г до / + A/ часть из них спонтанно перейдет в основное состояние с энергией е\. Невозможно указать, какие именно атомы совершат переход, но, зная вероят- вероятность А21, можно указать среднее число с!М21 таких переходов: (Ш21 =А21#2с1/. (9.28) Если при этом никаких процессов возбуждения атомов не происходит, то измене- изменение числа М2 возбужденных атомов за промежуток времени от г до г + &, соглас- согласно (9.28), равно ёЛГ2 = -А21#2с1г. (9.29)
9.3. Спонтанное и вынужденное излучения 411 Коэффициент Эйнштейна А2\ характеризует рассматриваемый атом и не зависит от времени. Поэтому решение уравнения (9.29) имеет вид #2@ = #20 ехр(-Л210 = #20 ехр(-//т), (9-30) где #20 — число возбужденных атомов при / = 0. 1аким образом, при отсутствии внешних воздействий в результате спонтанного излучения число возбужденных атомов убывает со временем по экспоненциально- экспоненциальному закону. Промежуток времени г = 1/А21, в течение которого Ы2 уменьшается ве« 2,72 раза, равен среднему времени жизни атома в возбужденном состоянии. По такому же экспоненциальному закону (9.30) должно убывать со временем свечение газа возбужденных атомов. Напомним, что радиационное затухание колебаний клас- классического осциллятора формально описывается точно таким же законом (см. п. 1.5). Однако физический смысл времени жизни г в этих случаях совершенно различен. Согласно классической электродинамике, все излучающие осцилляторы одновремен- одновременно совершают затухающие колебания и время г одинаково для всех. По квантовым представлениям, спонтанное излучение — это совокупность независимых переходов: один из возбужденных атомов может вернуться в основное состояние через короткий промежуток времени, другой может прожить в возбужденном состоянии значительно дольше, но среднее для большой совокупности атомов время жизни г имеет вполне определенную величину.*) Радиационное затухание собственных колебаний классического возбужденного ос- осциллятора приводит к тому, что излучаемый при этом свет характеризуется не од- одной частотой, а узким спектральным распределением, заполняющим интервал частот Ар ~ 1/г. Контур такой спектральной линии имеет лоренцевскую форму (см. п. 1.7). На квантовом языке это означает, что спонтанному излучению атома при переходе из возбужденного состояния в основное соответствует узкий, но конечный интер- интервал частот. Так как частота излучения определяется условием Бора Ъ\> = е2 — €19 то разброс частот свидетельствует о конечной ширине Ас энергетического уровня возбужденного состояния е2. Это заключение находится в полном соответствии с со- соотношением неопределенностей Гейзенберга между энергией и временем (8е)т > /г, связывающим неопределенность 8е в изменении энергии системы с неопределенно- неопределенностью г момента времени, когда это изменение происходит. Экспериментальная проверка закона распада (9.30) и определение среднего време- времени жизни г возбужденного состояния наиболее непосредственно были произведены в опытах Вина (см. п. 1.5) со свечением каналовых лучей. Этим методом для крас- красной линии водорода (Я = 656,2 нм) было получено г = 1,5 • 10~8 с, для резонансной линии ртути (Я = 253,7 нм) г = 9,8 • 10~8 с. Статистический, случайный характер процессов спонтанного излучения приводит к тому, что фазы, направления распространения и состояния поляризации световых волн, испускаемых отдельными атомами, не согласованы друг с другом. Это значит, что спонтанное излучение некогерентно. *}Для высоколежащего возбужденного состояния атома с энергией ек обратное время жизни равно сумме вероятностей перехода за 1 с в основное состояние и все нижележащие возбужденные состояния с энергией е{ < ек: \/тк — У"\ Д.,..
412 9. Термодинамика излучения. Световые кванты В электромагнитном поле кроме спонтанного испускания будут происходить и про- процессы возбуждения атомов, т.е. переходы из основного состояния в возбужденное с поглощением фотонов с энергией Но) = е2 — ех. Вероятность такого перехода в еди- единицу времени пропорциональна плотности энергии электромагнитного поля Ьтш на частоте перехода со и некоторому коэффициенту #12, характеризующему вероят- вероятность возбуждения атома. Среднее число дЛ^2 переходов из основного состояния в возбужденное за промежуток времени от / до / + A/ пропорционально также чис- числу Л^ атомов в основном состоянии: Щ2=ЩВ12Ца>&. (9.31) Коэффициент Эйнштейна В12 зависит от выбранных состояний с^ие2 атома и мо- может быть рассчитан методами квантовой механики. Здесь его можно рассматривать как феноменологическую постоянную. Заметим, что ВХ2 определен так, что он не за- зависит от спектральной плотности энергии П^ поля. Пропорциональность числа с1Л^2 актов поглощения (9.31) величине Ь^ соблюдается тогда, когда спектральная плот- плотность Ц^ плавно зависит от частоты со вблизи частоты перехода. Допустим теперь, что атомы находятся в термодинамическом равновесии с по- полем излучения. Тогда на основании принципа детального равновесия число пере- переходов с испусканием фотонов и с поглощением должно быть одинаково. Осно- Основываясь на этом, можно, приравнивая правые части (9.28) и (9.31), найти вид функции {/<у, т.е. спектральную плотность энергии равновесного излучения. Од- Однако при этом для П^ получается не формула Планка (9.23), а ее предель- предельный случай при Нсо/(кТ) > 1, т.е. формула Вина (9.24). Чтобы таким спосо- способом получить согласующуюся с опытом формулу Планка, необходимо предполо- предположить, как впервые показал Эйнштейн, что электромагнитное поле вызывает не только переходы из основного состояния в возбужденное, но и обратные пере- переходы из возбужденного состояния в основное, сопровождающиеся испусканием фотонов. Такие переходы под действием внешнего поля в отличие от спонтан- спонтанных получили название индуцированного или вынужденного (стимулированно- (стимулированного) излучения. Индуцированное излучение, как и спонтанное, имеет классический аналог. Осциллятор в поле световой волны будет совершать вынужденные колебания. В неустановившемся режиме вблизи резонанса в зависимости от соотношения фаз между колебаниями осциллятора и внешнего поля энергия может переходить как от поля к осциллятору (поглощение), так и от осциллятора к полю (вынужденное испускание). Число вынужденных переходов дЛ^12 за промежуток времени от I до I + д/ пропор- пропорционально спектральной плотности энергии \]ш поля на частоте перехода, числу М2 атомов в возбужденном состоянии е2 и некоторому коэффициенту #21, характери- характеризующему вероятность такого перехода в атоме. С учетом спонтанного излучения полное число переходов за A/ из возбужденного состояния в основное равно с^21=#2(Л21+Я21<У„)а/. (9.32) В состоянии термодинамического равновесия следует приравнять правые части выражений (9.31) и (9.32) и учесть, что населенности уровней ех и е2 связаны
9.3. Спонтанное и вынужденное излучения 413 соотношением Больцмана: Легко убедиться в том, что для данной пары уровней коэффициенты Эйнштейна #12 и В 21 равны друг другу. В самом деле, при очень высокой температуре плотность энергии \]ш становится настолько большой, что в формуле (9.32) можно пренебречь первым слагаемым по сравнению со вторым. Это значит, что в равновесии при высокой температуре вынужденное испускание преобладает над спонтанным. При- Приравнивая для этих условий правые части (9.31) и (9.32), имеем М^В12 = А^21* ^° в равновесии при кТ/(Нсо) —¦ оо населенности уровней, как видно из (9.33), вырав- выравниваются: Л^ = Л^2. Поэтому #12 = В2\- Коэффициенты #12 и #21 зависят только от свойств атома и не зависят от внешних условий, в которых происходят переходы. Поэтому равенство #12 = #21, полученное для предельного случая Т —> оо, справед- справедливо всегда, в том числе и в отсутствие теплового равновесия. При произвольной температуре из равенства правых частей (9.31) и (9.32) с уче- учетом (9.33) и равенства #12 = #21 для спектральной плотности равновесного излуче- излучения получаем тт — 21/ 21 /о пд\ ш охр[По)/(кТ)) - Г { } Это выражение совпадает с формулой Планка (9.23), если отношение коэффици- коэффициентов спонтанного и вынужденного испускания ^21/#21 = Ъм? 1{л2с2). Таким обра- образом, все три коэффициента Эйнштейна связаны между собой. Наиболее важный результат, который следует из вывода формулы Планка по Эйн- Эйнштейну, — это заключение о существовании вынужденного излучения. Только в этом случае теория Эйнштейна не противоречит законам теплового излучения. При Нсо/(кТ) > 1 в (9.34) можно пренебречь единицей по сравнению с ехр[Нсо/(кТ)] и (9.34) перейдет в формулу Вина. К такой формуле для Ц^ мы бы пришли сразу, если бы не приняли во внимание вынужденное испускание. Физически это означа- означает, что при Нсо^> кТ для поддержания термодинамического равновесия практически достаточно спонтанного испускания. Вынужденное испускание в таких условиях за- заметно меньше поглощения, так как при кТ <^Нсо термически возбужденных атомов мало. Напротив, при низких частотах и высоких температурах, когда Нсо/(кТ) <^ 1, в тепловом равновесии переходы с вынужденным испусканием происходят почти так же часто, как и переходы с поглощением. Вынужденное излучение обладает замечательными свойствами, на что впервые обратил внимание Дирак в 1927 г., применив квантовую механику к полю излуче- излучения. В каждом акте вынужденного испускания происходит увеличение на единицу числа фотонов в той моде излучения, под действием которой произошел переход. Все фотоны одной моды тождественны. Это значит, что новый фотон неотличим от фотонов, вызывающих его испускание. Частота, фаза, направление распространения и поляризация волн, испущенных при вынужденных переходах, точно такие же, как у излучения, вызвавшего переходы. С классической точки зрения пояснить когерентный характер вынужденного из- излучения можно следующим образом. Процесс вынужденного испускания обратен по
414 9. Термодинамика излучения. Световые кванты отношению к поглощению (иногда его называют отрицательным поглощением). При распространении светового пучка в поглощающей среде происходит уменьшение ин- интенсивности, но полностью сохраняются свойства когерентности. Это следует хотя бы из того, что в любых интерференционных опытах прохождение исходного пучка света через серый фильтр, уменьшающий интенсивность без изменения спектрально- спектрального состава, не разрушает интерференционной картины. Поэтому можно ожидать, что при прохождении света через среду, содержащую возбужденные атомы, в результате вынужденного испускания будет происходить усиление распространяющейся волны при сохранении ее когерентности. Коэффициенты Эйнштейна #12 и В2\ характеризуют переходы между уровня- уровнями энергии Е\ и е2 рассматриваемого атома под действием падающего излучения, спектральная плотность которого И^ практически постоянна в пределах контура спектральной линии, соответствующей данному переходу. Обладающее сплошным спектром равновесное излучение удовлетворяет этому требованию. Чтобы получить выражения для числа переходов с!М12 и сШ21 под действием монохроматического из- излучения с объемной плотностью Ц, нужно в формулах (9.31) и (9.32) заменить Ию на иг((о), где Р(о)) есть нормированная на единицу функция формы спектральной линии рассматриваемого перехода (т.е. произведение Р(о))й(о дает ту долю полного числа переходов между данными уровнями, для которой частота лежит в интервале между со и со + йсо). Рассмотрим связь коэффициентов Эйнштейна с макроскопическими оптическими параметрами среды. Пусть в разреженной среде распространяется параллельный пу- пучок монохроматического излучения с частотой со, лежащей в пределах контура спек- спектральной линии для каких-либо двух уровней энергии атомов среды. Изменение чис- числа AМ фотонов в потоке при прохождении слоя толщиной ск = с с1/ за счет процессов поглощения и вынужденного испускания в соответствии с (9.31) и (9.32) равно а# = (#2я21 - ихвп)ир((о) —. (9.35) с Вкладом спонтанного испускания в направленный зондирующий поток можно пре- пренебречь, так как спонтанное излучение распространяется по всем направлениям и в фиксированное направление рассматриваемого пучка попадает ничтожная его часть. Формула (9.35) позволяет выяснить, какие условия необходимы для непо- непосредственного экспериментального обнаружения вынужденного испускания. Так как /?12 = #21» то ^ = (^2 ~~ ^1)^12^7({У) ^х/с и ВИДНО» что ПРИ распространении зон- зондирующего пучка поглощение преобладает над вынужденным испусканием и интен- интенсивность пучка убывает во всех случаях, когда Л^2 < Л^, т.е. число возбужденных атомов меньше числа атомов в основном состоянии. Так обычно и обстоит дело, если пучок распространяется в среде, находящейся в состоянии термодинамического равновесия или близком к нему. Чтобы наблюдать нарастание интенсивности зонди- зондирующего пучка (отрицательное поглощение) и тем самым экспериментально выявить вынужденное испускание, необходимо создать в среде неравновесное состояние, при котором число атомов на более высоком энергетическом уровне было бы больше, чем на низком (Ы2 > Л^). Первая попытка обнаружить вынужденное испускание в видимой области спектра на опыте в парах ртути, возбужденных электрическим разрядом в неравновесное состояние, была предпринята В. А. Фабрикантом A939 г.).
9.3. Спонтанное и вынужденное излучения 415 Им же впервые была высказана идея использования вынужденного излучения для усиления света. Найдем закон изменения интенсивности пучка по мере его распространения в сре- среде. Средняя плотность потока энергии 5 волны равна произведению объемной плот- плотности V на скорость света: 8 = с11. Так как изменение потока фотонов на интер- интервале дх равно с (Ш, то изменение потока энергии A5 на том же отрезке 6х равно Нсос AЛЛ Умножая обе части равенства (9.35) на Нсос, найдем с1$ = — (#! - Ы2)В12Р(й>)Здх, (9.36) откуда ^ = -ОВД, а = ~ (М2 - ЛГ,)В,2ад. (9.37) Если населенности уровней Л^ и М2 не зависят от х (однородная среда), то реше- решение уравнения (9.37) имеет вид 5(*)=50ехр(-ак). (9.38) Здесь 50 — плотность потока энергии зондирующего пучка при х = 0. Если а > 0, что бывает при Л^2 < Л^, то поток энергии экспоненциально убывает по мере рас- распространения пучка. Мы приходим к закону Бугера B.29), а формула (9.37) выража- выражает коэффициент поглощения а через коэффициент Эйнштейна #12 и населенности уровней Л^ и Л^2. В тех случаях, когда в среде выполнено условие Ы2 > Л^9 известное как инвер- инверсия населенностей, в (9.37) а < 0 (отрицательный коэффициент поглощения) и ин- интенсивность волны в соответствии с (9.38) нарастает по мере ее распространения. Усиление падающего пучка света осуществляется за счет того, что при Л^2 > Л^ переходы с вынужденным испусканием фотонов происходят чаще, чем переходы с поглощением. Так как возникающие при вынужденном испускании фотоны тож- тождественны с фотонами, вызвавшими испускание, когерентные свойства исходного пучка полностью сохраняются. Таков принцип действия квантового усилителя из- излучения. Различные способы создания необходимой для его работы среды с инверси- инверсией населенностей {активной среды) рассмотрены в п. 9.4. Важно отметить, что для создания активной среды всегда требуется подведение извне дополнительной энер- энергии, которая затем при вынужденном испускании частично преобразуется в энергию усиливаемого электромагнитного излучения. Квантовый усилитель можно превратить в генератор излучения, если ввести в нем положительную обратную связь. Для этого часть выходящего из усилителя излучения должна возвращаться в активную среду. Тогда отпадает необходимость во входном сигнале, так как происходит самовозбуждение системы. Обратную связь можно осу- осуществить, помещая активную среду в резонатор, образованный двумя параллельными зеркалами. Бурно развивающаяся область науки и техники, занимающаяся исследованием и применением квантовых явлений для усиления, генерации и преобразования коге- когерентного излучения, называется квантовой электроникой. Действие приборов кван- квантовой электроники основано на явлении вынужденного излучения при квантовых переходах электронов, входящих в состав атомов, ионов, молекул и кристаллов.
416 9. Термодинамика излучения. Световые кванты Контрольные вопросы • Как подсчитать число различных нормальных колебаний электромагнитного поля в куби- кубической полости, приходящихся на интервал частот от со до со + дсо? • Получите формулу Планка для спектральной плотности равновесного излучения, рассмат- рассматривая излучение в полости как совокупность стоячих волн (нормальных колебаний). • Покажите, что при экспоненциальном распаде возбужденного состояния по закону (9.30) вследствие спонтанного излучения среднее время жизни возбужденного атома равно г = 1/Л21. • Зависят ли коэффициенты Эйнштейна А2\, В12> #21 от спектральной плотности действую- действующего на атом поля излучения? • Укажите основные моменты вывода формулы Планка по Эйнштейну. Почему при этом необходимо предположить существование вынужденного излучения? • Как связаны между собой коэффициенты Эйнштейна Л21> #12 и #21? Почему эта связь, полученная для частного случая теплового равновесия, справедлива всегда? • Какими свойствами характеризуется вынужденное излучение? Сравните его со спонтанным излучением. • При каких условиях возможно нарастание интенсивности пучка монохроматического света по мере его распространения в среде? Поясните принцип действия квантового усилителя. 9.4. Лазеры Принцип работы лазера,*) или оптического квантового генератора (ОКГ), основан на трех фундаментальных идеях, родившихся в разное время в различных областях физики. Первая идея связана с использованием вынужденного испускания света атомными системами, открытого Эйнштейном в 1917 г. при теоретическом изучении некогерентного теплового излучения. Как показал Дирак, испускаемые при этом фо- фотоны неотличимы от тех, что вызвали испускание. Вторая идея заключается в приме- применении термодинамически неравновесных систем, в которых возможно усиление, а не поглощение света. Она была высказана В. А. Фабрикантом в 1940 г. Третья идея, берущая начало в радиофизике, состоит в использовании положительной обратной связи для превращения усиливающей системы в генератор когерентного излучения. Первые квантовые генераторы, работающие в микроволновом диапазоне (мазе- (мазеры), были созданы в 1954 г. Н.Г. Басовым и А.М. Прохоровым в СССР и Гордоном, Цайгером и Таунсом в США. Активной средой в них служил пучок молекул ам- аммиака; инверсия населенностей на рабочем переходе достигалась пространственным разделением молекул в различных квантовых состояниях при прохождении пучка через неоднородное электрическое поле. За разработку нового принципа усиления и генерации электромагнитных волн и создание первых молекулярных генераторов когерентного микроволнового излучения Н. Г. Басову, А. М. Прохорову и Ч. Таунсу была присуждена Нобелевская премия 1964 г. по физике. Первый оптический кван- квантовый генератор (лазер), работающий в импульсном режиме, был создан в 1960 г. Мейманом. Активной средой в нем служил стержень из кристалла рубина, возбу- * ) 1л§Ы АтрНпсаНоп Ьу 8Ити1а1ес1 Ептвюп оТ КасНайоп — усиление света индуцированным испуска- испусканием излучения.
9.4. Лазеры 417 ждаемый светом от лампы-вспышки. Годом позже Джаваном, Беннетом и Эрриотом был построен первый лазер непрерывного действия с газообразной активной средой (смесь неона и гелия). Исключительные свойства когерентного лазерного излучения, коренным образом отличающие его от некогерентного излучения традиционных для оптической области тепловых, газоразрядных и люминесцентных источников света, обусловили бурное развитие лазерной техники и широкое применение лазеров в научных исследованиях и в практике. В настоящее время существует много типов лазеров, различающих- различающихся видом активной среды и способами ее возбуждения, физическими параметрами, спектральной областью, мощностью, временными и спектральными характеристика- характеристиками излучения и т. п. Существуют разные способы получения необходимой для работы лазера усиливаю- усиливающей излучение активной среды. Преобладание процессов вынужденного излучения над поглощением осуществляется при инверсии населенностей (Л^ > Л^) рабочих уровней энергии е^ и е2 (см. п. 9.3). В импульсных твердотельных лазерах использу- используется оптическая накачка светом мощной газоразрядной лампы-вспышки. В полупро- полупроводниковых лазерах непрерывного действия неравновесное состояние достигается при пропускании электрического тока через р-п-переход. В газовых лазерах ато- атомы или ионы рабочего вещества возбуждаются в условиях электрического разряда. Во всех случаях затраченная на это энергия внешнего источника в конечном свете частично преобразуется в энергию когерентного излучения. Для осуществления положительной обратной связи часть генерируемого излуче- излучения должна оставаться внутри рабочего вещества и вызывать вынужденное испуска- испускание все новыми и новыми возбужденными атомами. С этой целью активную среду помещают в оптический резонатор (см. п. 6.4), образованный двумя параллельны- параллельными плоскими или сферическими зеркалами, одно из которых полупрозрачно. Возник- Возникшая в каком-либо месте в результате спонтанного излучения возбужденного атома световая волна усиливается за счет вынужденного испускания при распространении через активную среду. Эффективно усиливаются только те волны, направление рас- распространения которых совпадает с осью резонатора, так как при всех других направ- направлениях волна быстро покидает пределы активной среды. Дойдя до полупрозрачного зеркала, волна частично выходит наружу, а частично отражается назад. Отраженная волна, проходя вдоль резонатора от одного зеркала до другого путь Ь через активную среду, в соответствии с формулой (9.38) усиливается в ехр(—аЬ) раз, где (—а) — ко- коэффициент усиления (9.37). Отразившаяся от второго зеркала волна снова на длине резонатора усиливается в ехр(—аЬ) раз и опять падает на полупрозрачное зеркало. Пусть на двойной длине резонатора укладывается целое число длин волн: 2Ь = тХ. Этим обеспечивается положительная обратная связь: при втором и всех следующих прохождениях через резонатор волна согласована по фазе с исходной, т. е. фактиче- фактически неотличима от нее. Все элементарные волны, возникающие в разные моменты времени при вынужденных переходах атомов, расположенных в разных точках актив- активной среды, создают одну когерентную волну. Таким образом, оптический резонатор увеличивает эффективное расстояние, которое распространяющаяся вдоль его оси волна проходит в активной среде, и способствует формированию когерентного мо- монохроматического излучения, выходящего через полупрозрачное зеркало. 14 Зак 4498
418 9. Термодинамика излучения. Световые кванты Оптический резонатор можно рассматривать как колебательную систему, в ко- которой собственные нормальные колебания (моды) имеют вид стоячих электромаг- электромагнитных волн с узлами на зеркалах. Частоты о)A таких мод определяются условием 2Ь = дХ, где д — целое число, т. е. они образуют эквидистантный спектр: 2лс лс а< = 1а; = 971' (939) где п — показатель преломления активной среды. Поэтому лазер представляет собой автоколебательную систему, в которой возможны незатухающие колебания на одной из собственных частот резонатора. Описанная выше волновая картина возникновения когерентного излучения при вынужденном испускании света находящимися в разных местах атомами активной среды имеет следующую квантовую интерпретацию. Одна из мод резонатора может возбудиться в результате спонтанного испускания фотона каким-либо возбужденным атомом. В дальнейшем каждый акт вынужденного испускания приводит к увеличе- увеличению на единицу числа фотонов в этой моде. Фотоны одной моды тождественны, несмотря на то что они были испущены находившимися в разных местах атомами активной среды в разные моменты времени. Этим объясняется когерентность резуль- результирующего излучения. Падающая на полупрозрачное зеркало волна частично выходит из резонатора. Это и есть генерируемый лазером пучок. Кроме того, существуют и другие (бесполезные) потери энергии излучения, обусловленные рассеянием света на неоднородностях за- заполняющей резонатор среды, дифракцией на краях зеркал и т. п. Очевидно, что генерация возможна только тогда, когда падающая на полупрозрач- полупрозрачное зеркало после очередного прохода волна имеет энергию не меньшую, чем при предыдущем падении. Это значит, что усиление света в активной среде должно быть достаточно большим, превышающим некоторое значение, называемое пороговым. Если усиление на двойном проходе резонатора больше суммарных потерь, то с каж- каждым проходом интенсивность волны возрастает. Это возрастание не может, конеч- конечно, продолжаться беспредельно. При фиксированной мощности источника накачки инверсия населенностей рабочих уровней будет убывать с увеличением плотности энергии излучения в резонаторе, что в соответствии с (9.37) приведет к уменьше- уменьшению коэффициента усиления. В результате этого нелинейного эффекта насыщения (см. п. 10.1) в лазерах непрерывного действия устанавливается стационарный режим генерации, когда суммарные потери энергии в точности компенсируются усилением в активной среде. При этом мощность генерируемого излучения пропорциональна превышению ненасыщенного коэффициента усиления над его пороговым значением, т. е. линейно зависит от мощности источника накачки, поддерживающего в активной среде инверсную населенность. Спектральная линия, соответствующая переходу между рабочими уровнями ато- атомов активной среды, имеет конечную ширину. Возможные причины уширения были рассмотрены в п. 1.8. Помимо радиационного затухания вклад в ширину линии дают столкновения и тепловое движение атомов (в газовой среде), а также возмущение энергетических уровней атомов под влиянием окружения (полей заряженных частиц в газовом разряде, кристаллических полей в твердых телах и т.п.). При однород- однородном уширении контур спектральной линии Р(со) с хорошей точностью описыва-
9.4. Лазеры 419 ется лоренцевской функцией, при неоднородном — гауссовой. Ширина линии Да> много меньше частоты со0, соответствующей центру линии, поэтому спектральная зависимость коэффициента усиления а(со) (9.37) повторяет ход функции формы ли- линии Р((О). Обычно в пределах контура усиления умещается несколько собственных частот резонатора (рис. 9.4). Если постепенно увеличивать степень возбуждения активной среды, т. е. инверсию населенностей уровней рабочего перехода, то первой достигает порога мода, частота которой расположена ближе к центру спектральной линии. На ней и начинается генерация. Даль- Дальнейшее увеличение уровня возбуждения ( . активной среды приводит к достижению порога другими модами. Тогда становит- становится возможной генерация излучения одно- одновременно на нескольких частотах. В случае однородно уширенной линии перехода различные моды получают энер- энергию от одних и тех же атомов, что при- Рис. 9.4. Спектральный контур линии усиления водит к эффектам нелинейного взаимо- взаимодействия {конкуренции) мод. Насыще- Насыщение усиления до уровня потерь происходит быстрее для той моды, частота которой лежит дальше других от центра линии усиления. Продолжающийся рост поля других мод вызывает уменьшение усиления и приводит к затуханию этой моды. В резуль- результате возможно затухание всех мод, кроме одной, частота которой наиболее близка к центру линии усиления. При неоднородном уширении линии перехода каждая мода получает энергию от тех атомов, центральные частоты которых совпадают с ее частотой. Поэтому эффек- эффекты насыщения приводят к образованию в контуре усиления «провалов» на частотах соответствующих мод резонатора. Это способствует многомодовой генерации, так как становится возможным почти независимое усиление мод, отстоящих друг от друга по частоте больше чем на ширину линии отдельного атома. В условиях стационарной генерации потери в резонаторе компенсируются за счет вынужденного излучения в активной среде. Отсутствие затухания означает, что до- добротность, сопоставляемая соответствующей «активной» моде, бесконечно велика, а спектральная линия излучения лазера на этой моде бесконечно узка. Другими словами, усиление в активной среде поддерживает постоянную амплитуду гармо- гармонического выходного сигнала, препятствуя его затуханию, но при этом не вносит возмущений в его фазу. Спектр такого излучения состоит из единственной часто- частоты. Фактически же излучение одномодового лазера, хотя и обладает очень высокой степенью монохроматичности, все же по ряду причин имеет конечную спектраль- спектральную ширину. До сих пор не учитывалось спонтанное испускание возбужденными атомами активной среды, которое также способствует вводу энергии в резонатор. Так как вводимая за счет спонтанных процессов энергия не скоррелирована с полем излучения генерируемой моды, спонтанное излучение вносит случайные флуктуации в его фазу и амплитуду, что приводит к конечной ширине спектра выходного из- излучения. Иначе можно сказать, что в стационарном режиме при учете спонтанного
420 9. Термодинамика излучения. Световые кванты испускания потери в резонаторе не полностью компенсируются вынужденным излу- излучением (какая-то часть потерь компенсируется спонтанным излучением). Поэтому добротность активной моды уже не обращается в бесконечность, хотя и может быть очень большой. Чем больше выходная мощность, тем уже спектральная линия из- излучения, так как с ростом плотности энергии поля в резонаторе вынужденное ис- испускание все в большей степени преобладает над спонтанным в механизме передачи энергии от активной среды в моду резонатора. Как показывают расчеты, естествен- естественная ширина линии лазерной генерации, обусловленная спонтанным излучением, для гелий-неонового лазера (Я = 632,8 нм) с выходной мощностью 1 мВт при пропуска- пропускании зеркал 1 % и длине резонатора 1 м составляет Ду ~ 5 • 10~~4 Гц. Это фантастиче- фантастически малая величина. Соответствующее ей время когерентности т « 1/Ду ~ 2 • 103 с, а длина когерентности ^ = ст ~ 6 • 1011 м больше диаметра земной орбиты! На опыте реализовать столь узкую линию излучения не удается из-за технических причин уширения спектра. Согласно (9.39), частота моды оуС{ зависит от длины резо- резонатора и от показателя преломления среды п. Это обстоятельство позволяет плавно перестраивать частоту генерации, например перемещением одного из зеркал. Но из- изменения длины резонатора и показателя преломления могут происходить и случай- случайным, неконтролируемым образом из-за вибраций, колебаний температуры и давления и т. п. Ценой значительного усложнения конструкции техническое уширение линии излучения может быть существенно уменьшено и относительную ширину Асо/со уда- удается довести до значений 10~14—10~16. Наряду со столь высокой временндй когерентностью, недостижимой никакими другими способами, лазерное излучение характеризуется также практически полной пространственной когерентностью. Это легко продемонстрировать, раздвигая ще- щели в опыте Юнга (без первой входной щели) до самых краев поперечного сечения лазерного пучка. Видность интерференционной картины при этом не уменьшается. Количественные измерения показывают, что для излучения гелий-неонового лазера (Я = 632,8 нм) степень пространственной когерентности у12 (см. п. 5.5) отличается от единицы менее чем на 10~~3 даже для тех точек поперечного сечения пучка, где интенсивность составляет всего 0,1 % от интенсивности на оси пучка. Пространственная структура лазерного пучка зависит от геометрии оптического резонатора. От других известных типов резонаторов (например, микроволновых) оп- оптический отличается тем, что его размеры велики по сравнению с длиной волны [Ь ~ A04—107)Я], поэтому он обладает большим числом мод. Однако это «откры- «открытый» резонатор, образованный двумя далеко разнесенными зеркалами, и большин- большинство мод характеризуется сильным затуханием из-за ухода излучения за его пределы. Моды с малыми потерями должны (в приближении геометрической оптики) соответ- соответствовать такому направлению распространения излучения, чтобы после повторных проходов и отражений излучение не выходило из резонатора. Требование сущест- существования таких мод налагает ограничения на соотношение между длиной резонатора и радиусами кривизны его зеркал, известные как условия устойчивости (неустой- (неустойчивый резонатор может использоваться только в системах с очень высоким уровнем усиления в активной среде). Из-за ограниченного размера зеркал распространение света в резонаторе сопровождается дифракционными явлениями, и в общем случае задача расчета поля в резонаторе оказывается довольно сложной.
9.4. Лазеры 421 Электромагнитное поле в резонаторе должно иметь такое распределение ампли- амплитуды по поперечному сечению пучка, которое воспроизводит себя на протяжении одного цикла. Для резонатора, образованного сферическими зеркалами, таким свой- свойством обладает гауссов пучок (см. п. 6.4), характеризуемый быстрым спаданием ин- интенсивности от оси к краям по закону ехр[— (х2 + у2)/ю2]. Распространяющиеся на- навстречу гауссовы пучки образуют стоячую волну при условии, что на длине ре- резонатора укладывается целое число полуволн. Такие моды имеют эквидистантный частотный спектр (9.39). Почти вся энергия излучения в них сосредоточена вбли- вблизи оси резонатора в области радиусом ~ ю. Этот радиус не зависит от апертуры зеркала. Увеличение апертуры зеркала приводит лишь к уменьшению дифракцион- дифракционных потерь и не влияет на поперечный размер пучка. Например, для конфокального резонатора гелий-неонового лазера (Я = 632,8 нм) при ^ = 1 м радиус пучка на зер- зеркалах ю — 0,32 мм. Помимо обладающего осевой симметрией гауссова пучка возможны моды с более сложным распределением амплитуды по поперечному сечению, описываемым (в слу- случае прямоугольной апертуры зеркал) функциями вида где Нп(х) — полиномы Эрмита. При п, т = 0, 1,2 они имеют вид Н0(х) = 1, Н^(х) = 2х9 Н2(х) = 4х2 — 2. Такие моды называют поперечными. На рис. 9.5 пока- показано распределение амплитуды напряженности поля вдоль направления х для неко- некоторых поперечных мод низкого порядка. Отрицательные значения Е(х) свидетель- свидетельствуют об обращении фазы: при переходе от одного пятна к другому фаза колеба- колебаний в данной моде изменяется на противоположную. Это легко продемонстрировать, помещая в пучок экран с двумя отверстиями. Когда отверстия располагаются в со- соседних пятнах, светлые и темные полосы интерференционной картины меняются местами по сравнению со случаем, когда оба отверстия находятся в пределах одного пятна. Дифракционные потери поперечных мод с т, п ф 0 выше, чем у основной мо- моды (т = и = 0), и для их возбуждения требуется более высокое усиление в активной среде. При заданной длине резонатора поперечный размер пучка будет наименьшим для конфокального резонатора. При предельном переходе к плоским зеркалам попереч- поперечный радиус ю пучка становится очень большим. Фактически это означает, что в резо- резонаторе с плоскими зеркалами гауссов пучок сформироваться не может. В этом случае поле в резонаторе представляет собой стоячую волну с почти плоскими волновыми поверхностями, а поперечное распределение амплитуды для прямоугольной аперту- апертуры зеркал а х Ъ приближенно описывается произведением гармонических функций, которые обращаются в нуль на краях зеркал: 8т\(т + 1)я — 8т (п 4- 1)я - I. а\ V ъ где целые числа т, п = 0, 1, 2,... характеризуют число узлов, т.е. линий нулевой амплитуды светового поля на зеркалах в соответствующей поперечной моде (на- (начало координат в плоскости ху совмещено с одной из вершин зеркала). Стоячую волну с таким поперечным распределением поля можно представить как суперпо- суперпозицию бегущих плоских волн, направления которых образуют с осью резонатора
422 9. Термодинамика излучения. Световые кванты Е(х) Е(х) т=0,п=0 Е(х)\ Е(х) т=3,п=0 Е(х). т=4, п=0 •»м# т=Ъ, п=2 ттт Рис. 9.5. Распределение амплитуды поля по поперечному сечению пучка и вид картины, наблюдаемой при освещении экрана лазерным пучком, для некоторых поперечных мод низкого порядка
9.4. Лазеры 423 углы фт — (т+ \)Х/Bа), фп — (т+ \)Х/BЪ). Отсюда ясно, что минимальной уг- угловой расходимостью обладает лазерный пучок при генерации на основной моде т = п = 0. При заданных длине волны Я и поперечном размере а эта расходимость имеет дифракционный характер, т. е. приближается к наименьшей возможной, допус- допускаемой волновой природой света (в ~ Х/а). Таким образом, как для сферических, так и для плоских зеркал каждой про- продольной моде, т.е. стоячей волне с определенным значением # (числа полуволн, укладывающихся на длине резонатора), имеющей в соответствии с (9.39) частоту о)я = д(лс/пЬ), соответствует набор поперечных мод с различными значениями т и п, которые обычно отстоят по частоте на расстояние (от 0,2 до 5 МГц), малое по сравнению с интервалом Асо = лс/пЬ (« 150 МГц при Ь = 1 м) между соседними продольными модами. В резонаторах с плоскими зеркалами интенсивность поля при удалении от оси спадает медленнее, чем при сферических зеркалах. Поэтому дифракционные потери здесь больше (около 0,1 % при а = Ь = 1см,Ь= 1м,Х = 0,63 мкм) и больше должна быть площадь поперечного сечения активной среды. С этим обстоятельством, а так- также с более жесткими требованиями к юстировке плоских зеркал (их параллельность должна быть выдержана с точностью до угловых секунд) связано широкое распро- распространение резонаторов со сферическими зеркалами. Рассмотрим кратко особенности конструкции и работы некоторых основных типов лазеров. В качестве примера твердотельных лазеров возьмем лазер на кристал- кристалле рубина. Рубин — это кристалл оксида алюминия А12О3 (корунд), в котором небольшая часть ионов алюминия (~ 0,05 %) при выращивании замещена ионами хрома Сг3+. Сам корунд в видимой области прозрачен, и основную роль в работе лазера играют ионы хрома. Упрощенная схема энергетических уровней иона хрома приведена на рис 9.6, а. Инверсия населенностей создается между основ- основным состоянием е^ и уровнем е2. Этому переходу соответствует длина волны Я = 694,3 нм в красной облас- области спектра. Выше уровня е2 а) е'ъ 'шшшщШ.^ б) лежат широкие полосы энер- энергетических уровней е^ и Су Переходам в них из основного состояния соответствуют две широкие полосы поглощения в зеленой и синей областях спектра. С этим поглощением *«•*•*• Энергетические уровни иона хрома в рубине (а) г - и рубиновый стержень со спиральной лампой-вспышкой (б) связана розовая окраска руби- рубина. Цилиндрический стержень рубина длиной несколько сантиметров и диаметром около 1 см освещается мощным импульсом белого света от лампы-вспышки, обвивающей его в виде спирали (см. рис. 9.6, б). Длительность импульса около 1 мс. При достаточной энергии вспышки большая часть ионов хрома, поглощая свет, переходит в состояния ^ и ^. Затем ионы хрома за время порядка 10~~8 с безызлучательно переходят на уровень е2, пе- передавая избыток энергии колебаниям кристаллической решетки. Время жизни ионов хрома в возбужденном состоянии е2 составляет несколько миллисекунд, что на несколько порядков величины превышает типичные времена жизни возбужденных
424 9. Термодинамика излучения. Световые кванты состояний A0~7—10"~8с). Возбужденные уровни со столь большим временем жиз- жизни называют метастабильными. При недостаточной энергии вспышки на уровне е2 окажется меньше половины всех ионов хрома. Тогда обратный их переход в основное состояние происходит спонтанно (за время « 1 мс) и сопровождается люминисцен- цией на длине волны 694,3 нм. Если же в результате поглощения света вспышки и последующих безызлуча- тельных переходов на уровне е2 накопится более половины всех ионов, то между уровнями е^ и е2 возникает инверсия населенностей (Л^ > Л/^). Такой механизм образования инверсии населенностей называют оптической накачкой. Если рубино- рубиновый стержень помещен во внешний оптический резонатор или имеет посеребренные плоскопараллельные торцы, в нем возникает короткий импульс лазерной генерации на длине волны 694,3 нм. Лазерный импульс имеет сложную временную структуру и состоит из нерегулярной последовательности отдельных импульсов длительностью около 1 мкс. Из-за малой длительности импульса (порядка 1 мс) мощность рубино- рубинового лазера в импульсе достигает нескольких киловатт при сравнительно небольшой энергии (несколько джоулей). Мощность излучения в импульсе можно повысить, если добиться сокращения его длительности. Для этого используют режим модулированной добротности, сущ- сущность которого заключается в следующем. Генерация в лазере начинается, когда инверсия населенностей превысит пороговое значение, зависящее от потерь в резо- резонаторе. Можно задержать начало развития генерации и получить более высокую кон- концентрацию возбужденных ионов хрома в освещенном кристалле рубина, если на пер- первом этапе возбуждения повысить порог искусственным увеличением потерь, т. е. вы- выключением обратной связи. Для этого одно из зеркал резонатора заменяют быстро- вращающейся призмой полного отражения. Включение обратной связи и снижение порога генерации происходит только при определенном положении призмы. К это- этому моменту лампа-вспышка обеспечивает перевод значительной части ионов хрома в возбужденное состояние, и в результате развивается очень короткий (до 10~7с) импульс генерации с мощностью до 107 Вт. Еще более короткие импульсы можно получить, если модулировать доброт- добротность резонатора с помощью оптического затвора, основанного на эффекте Керра (см. п. 4.5). Малая инерционность эффекта Керра позволяет получить импульсы ге- генерации длительностью до 10~8 с. Используя последующие каскады усилителей све- света, можно еще больше сократить длительность импульса, так как при достаточной мощности уже начальная часть задающего импульса вызывает вынужденное высвечи- высвечивание всех возбужденных ионов в усилителях. Таким путем получают наносекундные гигантские импульсы света мощностью 104МВт и выше. Расходимость излучения рубинового лазера не достигает предела, определяемо- определяемого дифракцией на выходной апертуре. Это связано с оптической неоднородностью кристалла, а также с многомодовым характером излучения. Наряду с рубиновым лазером, работающим по трехуровневой схеме, широкое рас- распространение получили четырехуровневые лазеры на ионах редкоземельных эле- элементов (неодим, самарий), внедренных в кристаллическую (флюорит кальция) или стеклянную матрицу. Эти ионы обладают чрезвычайно подходящей для лазеров структурой энергетических уровней (рис. 9.7). При комнатной температуре разность
9.4. Лазеры 425 е2 — ^1 в несколько раз превосходит кТ, поэтому уровень 2 практически пуст. С по- помощью сильного света лампы накачки ионы неодима возбуждаются в широкую по- полосу уровней 4. Время жизни иона в состоянии 4 очень мало, так как с большой вероятностью происходит безызлучательный пере- переход в метастабильное состояние 3. Инверсия на- 4 Ц селенностей между уровнями 2 и 3 лазерного пе- перехода достигается очень легко, поскольку нижний уровень 2 практически не заселен. Лазер на неодимовом стекле генерирует излу- излучение на длине волны 1,06 мкм в виде импульсов с очень большими энергиями (около 1 кДж). По четырехуровневой схеме работает лазер непрерыв- непрерывного действия на кристалле иттрий-алюминиевого Рис. 9.7. Энергетическая диаграмма граната (УАО) с примесью неодима с выходной четырехуровневого лазера мощностью до 1 кВт. Газовые лазеры по многим характеристикам превосходят лазеры других типов. Они перекрывают широкий спектральный диапазон (от субмиллиметрового до уль- ультрафиолетового). Среди газовых лазеров всегда можно найти лазер, обладающий по крайней мере одним из следующих свойств: высокой степенью монохрома- монохроматичности излучения, малой расходимостью излучения (вплоть до дифракционно- дифракционного предела), предельными значениями мощности в непрерывном режиме, высо- высоким к. п. д. Устройство наиболее распространенного гелий-неонового лазера схематически по- показано на рис. 9.8. Газоразрядная трубка с внутренним диаметром 1-10 мм и дли- длиной от нескольких десятков сантиметров до 1,5-3,0 м имеет торцовые плоскопарал- плоскопараллельные стеклянные или кварцевые окна, установленные под углом Брюстера к ее оси. Для линейно поляризованного излучения с электрическим вектором в плоскос- плоскости падения коэффициент отражения от них равен нулю. Поэтому брюстеровские окна П7 <^"~11 ^11~^> ТЗ обеспечивают линейную поляризацию из- ^ ^г-' ^—<г Ш лучения лазера и исключают потери энер- ,> л о г» - гии при распространении света из актив- Рис. 9.8. Разрядная трубка газового лазера, к к к к окна которой установлены под углом Брюсгера ной среды к зеркалам и обратно. Трубка помещена в резонатор, образованный зер- зеркалами с многослойными диэлектрически- диэлектрическими покрытиями (см. п. 5.7). Такие зеркала имеют очень высокий коэффициент отра- отражения в нужном спектральном интервале и почти не поглощают свет. Пропускание зеркала, через которое выводится излучение, выбирается обычно около 1—2%, дру- другого — менее 1 %. Особенно удобен резонатор, близкий к конфокальному, так как он вносит малые дифракционные потери и легко поддается юстировке. Разрядная трубка заполнена смесью гелия и неона в молярном отношении 5:1 при давлении 102 — 103 Па. К электродам подключен источник с напряжением в несколько киловольт. Типичная сила тока в разряде — десятки миллиампер. Упрощенная схема энергетических уровней атомов неона и гелия приведена на рис. 9.9. Тлеющий раз- разряд создает условия для возникновения инверсии населенностей уровней в неоне. Ге- Гелий служит лишь для резонансного возбуждения неона. Атом гелия обладает двумя
426 9. Термодинамика излучения. Световые кванты метастабильными состояниями 2 и 3. При столкновениях с электронами плазмы атомы гелия возбуждаются в эти состояния, и из-за большого времени их жизни концентрация атомов в разряде, возбужденных в метастабильные состояния, очень велика. Энергии состояний 2 и 3 близки к энергиям возбу- возбужденных состояний 28 и 38 атома неона, что благоприят- благоприятно сказывается на передаче энергии возбуждения от атома гелия атому неона при столкновении. В результате таких процессов населенность уровней 2з и 38 неона возрастает и возникает инверсия населенностей на переходах 38—Зр (А = 3392 нм), 2з-2р (А = 1153нм) и Зз-2р (А = 632,8 нм). На этих переходах и возможна генерация. Для получения генерации на одной из указанных длин волн используют зеркала с высоким коэффициентом отражения в соответ- соответствующей спектральной области. Высокая оптическая одно- Рис. 9.9. Упрощенная схе- родность газовой активной среды позволяет получать из- маэнергетичес™^фовне лучение с очень высокой степенью временной и простран- пространственной когерентности. Замечательной чертой лазеров, тесно связанной с когерентностью их излучения, является исключительная способность к концентрации световой энергии: в спек- спектре — очень узкая спектральная линия излучения; во времени — возможность получения сверхкоротких импульсов света; в пространстве и по направлению рас- распространения — возможность получения направленного пучка с предельно малой (дифракционной) расходимостью и фокусирования всего излучения в малой области с размерами порядка длины волны. Исключительные свойства лазерного излучения открывают широкие перспективы для использования лазеров в различных областях науки и техники: монохроматич- монохроматичность и когерентность — в голографии, при обработке информации, в измерительной технике; высокая мощность — в лазерной технологии и энергетике, в нелинейной оп- оптике; малая расходимость излучения — в оптических устройствах записи и чтения информации, в лазерной связи, локации, геодезии, строительстве и т.д. Контрольные вопросы • Какие функции в лазере выполняют активная среда и резонатор? • Какими факторами определяется частота, на которой происходит лазерная генерация? • Какими условиями определяется пороговое усиление? • Какие процессы ведут к установлению стационарного режима генерации в случае превы- превышения коэффициента усиления над его пороговым значением? • При каких условиях возможна многомодовая генерация? • В чем заключаются естественные и технические причины уширения линий генерации? • Как на опыте можно продемонстрировать пространственную когерентность лазерного из- излучения? • Почему дифракционные потери в резонаторе с плоскими зеркалами больше, чем в конфо- конфокальном резонаторе таких же размеров?
9.5. Фотоэлектрический эффект 427 • Поясните способы получения инверсии населенностей в трехуровневых и четырехуровне- четырехуровневых лазерах. • В чем заключается режим модулированной добротности? • Назовите основные области применения лазеров. 9.5. Фотоэлектрический эффект Корпускулярные свойства излучения наиболее отчетливо обнаруживаются в явле- явлении освобождения электронов из вещества под действием света — фотоэффекта. Влияние света на электрические процессы было открыто Герцем, заметившим, что проскакивание искры между находящимися под напряжением цинковыми элек- электродами облегчается при освещении их ультрафиолетовым излучением. Первое об- обстоятельное исследование фотоэффекта было выполнено в 1888—1890 гг. А. Г. Сто- Столетовым. Им было установлено, что под действием света тело теряет отрицательный заряд, что действие пропорционально световому потоку и вызывается преимуще- преимущественно ультрафиолетовыми лучами, что явление протекает практически безынерци- безынерционно. Впоследствии Ленардом и Томсоном было измерено отношение заряда испус- испускаемых частиц к массе с помощью опытов по отклонению в электрическом и маг- магнитном полях. Эти измерения показали, что под действием света освобождаются электроны. б) в) 0 ОK О) Рис. 9.10. Схема опыта для исследования фотоэффекта (а), вольт-амперная характеристика (б) и зависимость задерживающего напряжения от частоты (в) Для исследования закономерностей фотоэффекта используют установку, схема- схематически показанную на рис. 9.10, а. В сосуде поддерживается высокий вакуум. При освещении металлической пластины Р через кварцевое окно в цепи возникает ток (фототок), измеряемый гальванометром С. Явление в сильной степени зависит от чистоты освещаемой поверхности, поэтому в точных опытах используют све- свежие поверхности (срезы или поверхности, напыленные в вакууме). Для зависимо- зависимости силы фототока от приложенного напряжения при неизменном световом потоке (см. рис. 9.10,6) характерно существование участка тока насыщения /н, когда все освобождаемые светом электроны (фотоэлектроны) достигают анода, и участка на- нарастания, начинающегося при некотором значении задерживающего напряжения Ц3. По измерениям Ц3 можно определить максимальную скорость V освобождаемых
428 9. Термодинамика излучения. Световые кванты светом электронов с помощью соотношения е1/3 = \ть2. Многочисленными экс- экспериментами установлены следующие основные закономерности фотоэффекта: 1. Сила тока насыщения прямо пропорциональна падающему световому потоку (при неизменном спектральном составе). Этот закон проверен для очень широкого ин- интервала интенсивностей. Отсюда следует, что число электронов, освобождаемых светом за 1 с, пропорционально мощности падающего излучения. 2. Для каждого металла существует максимальная длина волны света (минимальная частота), при которой еще происходит освобождение электронов. Если длина вол- волны превышает эту так называемую красную границу фотоэффекта, то эмиссия электронов отсутствует даже при сравнительно большой интенсивности облучаю- облучающего света.*) 3. Максимальная энергия фотоэлектронов линейно зависит от частоты со падающего света (см. рис. 9.10, в) и не зависит от его интенсивности. С точки зрения классических волновых представлений о природе излучения сам факт освобождения электронов из металла неудивителен, так как падающая на по- поверхность электромагнитная волна вызывает вынужденные колебания электронов в металле. Поглощая энергию волны, электрон может накопить ее в количестве, до- достаточном для преодоления потенциального барьера, удерживающего электрон в ме- металле (т. е. для совершения работы выхода). Если эта картина верна, то энергия фо- фотоэлектрона должна находиться в прямой связи с интенсивностью падающего света. Но опыт показывает, что энергия фотоэлектронов совершенно не зависит от ин- интенсивности света. Увеличение интенсивности приводит лишь к пропорциональному увеличению числа фотоэлектронов. Энергия же отдельного фотоэлектрона зависит только от частоты падающего света. Более того, даже при очень малой интенсивности фотоэлектроны появляются практически сразу после начала освещения (безынерционно), хотя, по классическим представлениям, в таких условиях требуется конечное время, чтобы электрон мог накопить необходимую энергию. В 1905 г. Эйнштейн объяснил экспериментальные закономерности фотоэффекта на основе гипотезы световых квантов. Качественная картина с этой точки зрения выгля- выглядит следующим образом. Падающее монохроматическое излучение рассматривается как поток фотонов, энергия которых связана с частотой соотношением е = Нсо. При поглощении фотона его энергия целиком передается одному электрону, и если эта энергия достаточна для того, чтобы освободить электрон от удерживающих его свя- связей, то он может выйти за пределы поверхности металла. Вероятность одновременно- одновременного поглощения двух фотонов одним электроном мала, поэтому каждый фотоэлектрон получает энергию от одного фотона.**) (Отметим, что, вообще говоря, не каждый поглощенный фотон приводит к освобождению электрона, т. е. квантовый выход — *> При очень высоких интенсивностях (сфокусированное лазерное излучение) возможен многофотон- многофотонный фотоэффект (см. п. 10.1), для которого красная граница исчезает. **)Это утверждение справедливо при не слишком большой интенсивности падающего света. В 1967 г. был обнаружен многофотонный (нелинейный) фотоэффект в металлах под действием сверхкоротких им- импульсов лазерного излучения.
9.5. Фотоэлектрический эффект 429 отношение числа фотоэлектронов к числу поглощенных фотонов — обычно меньше единицы.) По квантовым представлениям, полное число освобожденных электронов пропор- пропорционально числу поглощенных фотонов, т. е. сила тока насыщения пропорциональна интенсивности. Но энергия отдельного фотоэлектрона определяется энергией по- поглощенного фотона е = Нсо. Отсюда ясно, почему энергия фотоэлектронов линейно зависит от частоты падающего света и совсем не зависит от его интенсивности (т.е. числа падающих фотонов). Приобретаемая электроном энергия е = Нсо частично затрачивается на освобожде- освобождение из металла. Ее излишек остается в форме кинетической энергии освобожденного электрона. Минимальную энергию А9 необходимую для освобождения электрона из металла, называют работой выхода. Таким образом, для фотоэлектронов, имеющих максимальную скорость, закон сохранения энергии в элементарном акте поглощения фотона (уравнение Эйнштейна) можно записать в виде Псо = ^ту2+А. (9.40) Очевидно, что при Нсо < А электрон не может выйти из металла. Это значит, что существует некоторая минимальная частота излучения сот = Л/Й, при которой еще возможен фотоэффект. При меньших частотах со < сот фотоэффект не наблюдается. Мы видим, что уравнение Эйнштейна (9.40) сразу объясняет существование красной границы фотоэффекта. Для различных металлов работа выхода А и, следовательно, граничная частота сот имеют разные значения. Кроме того, на работу выхода суще- существенное влияние оказывают состояние и чистота поверхности металла, в особен- особенности наличие пленки адсорбированного газа. Для большинства металлов красная граница фотоэффекта приходится на ультрафиолетовую область спектра (в опытах Столетова с освещением цинковой пластинки фотоэффект пропадал при переходе от ультрафиолетовых к видимым лучам). Только у щелочных металлов красная гра- граница попадает в область видимого света. Поэтому они используются для покрытия поверхности фотокатода у фотоэлементов, предназначенных для работы с видимым светом. Значения работы выхода А, определяемые по красной границе фотоэффекта, находятся в хорошем согласии со значениями, полученными при изучении термо- термоэлектронной эмиссии. Максимальная кинетическая энергия фотоэлектронов ^ть2 измеряется на опыте по задерживающему напряжению Ц39 которое необходимо приложить между фото- фотокатодом и анодом для полного прекращения фототока: ^ть2 = е113. Уравнение Эйн- Эйнштейна (9.40) предсказывает линейную зависимость от частоты падающего света: е^, = П(со-сот). (9.41) Соотношение (9.41) было подтверждено в тщательных опытах Милликена A916), создавшего прибор, в котором поверхности исследуемых металлов подвергались очистке в вакууме. По наклону прямой, изображающей зависимость задерживаю- задерживающего напряжения Ц3 от частоты со, находится отношение Н/е. Этот наклон одинаков для всех металлов. Полученное таким методом значение универсальной постоянной Планка Н находится в хорошем согласии со значениями, найденными другими мето- методами (по излучению черного тела, см. п. 9.2; по коротковолновой границе сплошного
430 9. Термодинамика излучения. Световые кванты рентгеновского спектра, см. п. 9.6). Точка пересечения с осью абсцисс графика зави- зависимости 1/3 от частоты (9.41) со = сот позволяет определить значение работы выхода А — Нсот для исследуемого металла. Принято считать, что фотоэффект дает наиболее прямое экспериментальное дока- доказательство квантовой природы излучения. Квантовая гипотеза и в самом деле поз- позволяет непринужденно объяснить все основные экспериментальные закономерности фотоэффекта. Но тем не менее следует отметить, что эти закономерности получают исчерпывающее объяснение и в полуклассической теории взаимодействия излучения с веществом, рассматривающей вещество на основе квантовой механики, а излуче- излучение — как классическое электромагнитное поле. Это показал Г. Вентцель в 1927 г. С аналогичным положением вещей мы сталкиваемся и в проблеме равновесного излучения. Спектральное распределение энергии (формулу Планка) можно полу- получить, рассматривая нормальные колебания электромагнитного поля в полости как набор квантовых осцилляторов, т. е. как идеальный газ частиц излучения — фотонов (см. п. 9.3). Но формулу Планка можно получить и иначе, рассматривая излучение как классическое электромагнитное поле и применяя квантовую гипотезу лишь к на- находящемуся в равновесии с ним веществу (осцилляторам). Именно так и поступал Планк (см. п. 9.2). Полуклассическая теория взаимодействия света с веществом, не привлекая понятия фотона, дает количественное объяснение большинству наблюдае- наблюдаемых явлений. Квантование электромагнитного поля принципиально необходимо для правильного описания лишь некоторых явлений, включающих его флуктуации: спон- спонтанного излучения, лэмбовского сдвига, аномального магнитного момента электрона. Остановимся теперь на практических применениях фотоэффекта. Фотоэлектриче- Фотоэлектрические приемники излучения, преобразующие световой сигнал в электрический, разра- разработаны практически для всего оптического диапазона и широко используются в науке и технике. Устройство простейшего вакуумного фотоэлемента показано на рис. 9.11. Половина небольшого откачанного стеклянно- стеклянного или кварцевого баллона покрыта изнутри тонким слоем металла, который служит фото- фотокатодом. Для видимой и близкой ультрафиоле- ультрафиолетовой области применяют сурьмяно-цезиевые фотокатоды, имеющие максимум чувствитель- чувствительности в сине-фиолетовой области спектра (А«450нм), для красной и ближней инфра- ¦ красной — серебряно-кислородно-цезиевые с максимумом в области Л « 800 нм. Анод в ви- Рис. 9.11. Схема простейшего де небольшого кольца или сетки находится фотоэлемента _ _ , в центре баллона. При освещении фотокатода в цепи возникает ток. Приложенное напряже- напряжение должно быть достаточным для насыщения фототока. Применение фотоэлемен- фотоэлемента для фотометрических измерений основано на строгой пропорциональности силы тока насыщения и потока излучения. Иногда используют прерыватель света, преоб- преобразующий постоянный сигнал в переменный, который затем усиливается обычными радиотехническими методами.
9.5. Фотоэлектрический эффект 431 Множество научных и практических задач, решаемых с помощью фотоэлементов, вызвало к жизни большое разнообразие типов фотоэлементов с различными техни- техническими характеристиками. Существенный прогресс в фотоэлектрических измерениях был достигнут в 1940—50-е годы, когда в практику начали широко внедряться фотоэлектронные умножители (ФЭУ). Основной недостаток вакуумных фотоэлементов — малая ве- величина вырабатываемых ими электрических сигналов — преодолевается в ФЭУ уси- усилением фототока с помощью вторичной электронной эмиссии. Это явление заклю- заключается в освобождении электронов из металла или полупроводника при бомбарди- бомбардировке поверхности пучком быстрых электронов. Отношение числа освобождаемых электронов к числу падающих на поверхность, называемое коэффициентом вторич- вторичной эмиссии, зависит от скорости и угла падения пучка электронов, вида и состояния поверхности и для некоторых веществ может достигать весьма больших значений — 10 и выше. Значительное усиление потока электронов получается при использовании в качестве материала эмиттеров сплава сурьмы и цезия. Схема устройства фотоумножителя приведена на рис. 9.12. Фотоэлектроны, эмит- тируемые при освещении поверхности фотокатода ФК9 ускоряются электриче- электрическим полем и попадают на первый промежуточный электрод (динод) Д1? вы- вызывая эмиссию вторичных электронов. Конфигурация и расположение фотокато- фотокатода и динодов выбраны так, что создаваемые ими элек- электрические поля обеспечи- обеспечивают попадание большин- большинства фотоэлектронов на ди- динод Др а большинство вто- вторичных электронов после ускорения попадает на сле- следующий динод Д2, где про- процесс умножения повторяет- повторяется, и т.д. Между последова- последовательными динодами долж- должно быть приложено опреде- определенное напряжение. Оно подается через делители напряжения от высоковольтно- высоковольтного стабилизированного источника. Вторичные электроды с последнего из динодов (их может быть 10-15) собираются на анод (коллектор) Л. Общий коэффициент усиления в такой системе достигает 106-108, а интегральная чувствительность — тысяч ампер на люмен, что позволяет измерять очень малые световые потоки. Однако предельная чувствительность фотоэлектрических приемников излучения (как и других физических измерительных приборов) лимитируется не достижимым усилением сигнала, а собственными шумами измерительного устройства. Собствен- Собственными шумами называют случайные, нерегулярные изменения (флуктуации) сигнала, вносимые самим прибором. Ясно, что одновременное усиление сигнала и шума не даст никакой выгоды. Поэтому реальные возможности регистрации и измерения сла- слабых световых потоков определяются отношением полезного сигнала к шуму. В тех случаях, когда измеряемый поток значительно превосходит предел чувствительности, шумами определяется погрешность измерений. Рис. 9.12. Принципиальная схема фотоэлектронного умножителя (ФЭУ)
432 9. Термодинамика излучения. Световые кванты Некоторые виды шумов связаны с техническим несовершенством прибора. Напри- Например, небольшие непостоянные утечки зарядов по поверхности стекла колбы фото- фотоумножителя могут вызвать нерегулярные движения стрелки измерительного прибо- прибора. Такие технические флуктуации можно в значительной степени устранить, если приемник выполнить достаточно тщательно и принять необходимые меры предосто- предосторожности при работе с ним. Но существуют принципиально неустранимые флук- флуктуации, связанные с атомной структурой вещества (пример таких флуктуации дает хорошо известное броуновское движение), с конечной величиной элементарного за- заряда и с квантовой природой взаимодействия излучения с веществом. Обусловленные собственными флуктуациями шумы в измерительных устройствах рассчитываются на основе статистической механики. В вакуумном фотоэлементе (см. рис. 9.11) одна из наиболее очевидных причин возникнове- возникновения флуктуации фототока связана с тем, что элементарные акты испускания фотоэлектронов происходят в случайные моменты времени аналогично актам термоэлектронной эмиссии из накаленного катода в вакуумных электронных лампах. Обусловленный этой причиной шум получил образное название дробового. При постоянной интенсивности падающего излучения, когда можно считать, что за некоторый промежуток времени г на катод падает вполне опре- определенное число фотонов УУф, среднее число испускаемых электронов за время г составит (М) = ^]Nф, где ц — квантовый выход фотокатода. Однако от измерения к измерению чис- число N фотоэлектронов только в среднем остается неизменным, испытывая флуктуации около среднего значения (Ы). Вероятность Р(Л^) испускания за время г определенного числа N фото- фотоэлектронов в отдельном измерении дается распределением Пуассона: Р(М) = е~~ааЛ//N1, где а = (Ы). Мерой флуктуации числа фотоэлектронов служит величина 8N = ((УУ — (Я)J)^2, называемая среднеквадратичной флуктуацией. Можно показать, что для пуассоновского слу- случайного процесса, описываемого распределением />(Л^), среднеквадратичная флуктуация равна корню из среднего числа событий: 8N = л/Щ)- Поэтому флуктуация силы фототока / = €N/7 равна 51 = еШ 1т = ^\/(Л^)/г = у/е1/т. В результате дробовой эффект приводит к появ- появлению на нагрузочном сопротивлении /? (см. рис. 9.11) флуктуирующего напряжения илр, средний квадрат которого равен (и2р) = (81JН2 — еШ2/т. При измерении изменяющихся во времени (модулированных) световых потоков в это выражение вместо времени измерения г (т.е. постоянной времени прибора) войдет величина 1/BД/), где А/ — полоса пропускания последующей регистрирующей системы, т. е. интервал частот, в пределах которого происходит дальнейшее усиление переменного выходного напряжения ((/д2р> = 2е1К2А/. (9.42) Фотоэлемент дает некоторый ток даже при отсутствии падающего излучения. В этот тем- новой ток наряду с утечками изоляции электродов, которые в совершенных приборах малы и постоянны, дает вклад термоэлектронная эмиссия с фотокатода. Термоэмиссия электронов, как и фотоэмиссия, подвержена флуктуациям, приводящим к дробовому шуму. Мощности шумов от статистически независимых источников флуктуации просто складываются, поэтому полный дробовой шум определяется тем же выражением (9.42), если в нем под / понимать полный ток с поверхности фотокатода, т. е. сумму фототока и темнового тока: / = /ф + /т- При измерении слабых световых потоков, когда /ф < /т, основной вклад в дробовой шум дают флуктуации темнового тока. Для увеличения пороговой чувствительности иногда прибегают к охлаждению фотокатода и уменьшению его размеров (до размеров фокусируемого на нем светового пятна). Так, при охлаждении сурьмяно-цезиевого катода до температуры жидкого азота темновой ток уменьшается в 104 раз, что в соответствии с (9.42) приводит к снижению шумового напряжения и увеличению пороговой чувствительности в \/Ю4 = 100 раз. Конеч- Конечно, охлаждение фотокатода, как и уменьшение его размеров, целесообразно лишь тогда, когда
9.5. Фотоэлектрический эффект 433 ток термоэмиссии /т больше фототока /ф, так как в противном случае шумы темнового тока тонут в дробовых шумах фотоэмиссии. Другая причина флуктуации выходного напряжения фотоэлемента (см. рис. 9.11) связана с ха- хаотическим тепловым движением электронов в нагрузочном сопротивлении /?. Тепловой шум в проводниках, интенсивность которого (т. е. средний квадрат хаотического напряжения) рас- растет линейно с увеличением температуры Т и сопротивления К, был обнаружен Джонсоном в 1927 г. Спектральная плотность джонсоновского шума в области частот Нсо <С кТ постоянна, и средний квадрат напряжения тепловых шумов определяется формулой Найквиста Таким образом, для отношения сигнал/шум, определяющего теоретические предельные ха- характеристики вакуумного фотоэлемента, можно написать следующее выражение: Р = , {/сиг" = , /ф —• (9.43) /& 4 / ] Повышение чувствительности и точности фотоэлектрических измерений может быть до- достигнуто уменьшением полосы пропускания А/. Узкополосный фильтр, настроенный на ча- частоту модуляции переменного светового сигнала, или фильтр нижних частот в случае посто- постоянного сигнала позволяет отфильтровать большую часть шума, энергия которого в отличие от полезного сигнала равномерно распределена по всем частотам. Сужение полосы пропус- пропускания А/ ведет к неизбежному увеличению времени регистрации сигнала (г ~ 1/А/). При увеличении г в п раз отношение сигнал/шум, как видно из (9.43), возрастает в у/п раз. Предел чувствительности фотоэлемента с последующим усилителем (см. рис. 9.11) опреде- определяется обычно джонсоновскими шумами в нагрузочном сопоставлении /?, которые в дальней- дальнейшем усиливаются вместе с полезным сигналом и дробовым шумом. Это ограничение устра- устраняется в фотоумножителе, где ток с фотокатода, т. е. сигнал вместе с дробовым шумом, мно- многократно усиливается уже внутри самого ФЭУ без заметного добавления каких-либо новых шумов (при достаточно высоком коэффициенте вторичной эмиссии (> 4) ее шумы малосуще- малосущественны). Если сигнал ФЭУ оказывается все же недостаточным для измерительного прибора, используют, как и в схеме с фотоэлементом, внешний усилитель. Но тепловой шум от на- нагрузочного сопротивления здесь уже обычно значительно меньше дробового шума на выходе фотоумножителя. В этом главное преимущество фотоумножителя перед простым фотоэлемен- фотоэлементом. Для отношения сигнал/шум вместо (9.43) теперь получим р = где /ф и /т — фототок и темновой ток фотокатода ФЭУ Оценим пороговую чувствительность фотоумножителя. При регистрации очень сла- бых сигналов темновой ток больше фототока и, согласно (9.44), р = 1^/л/2ёЦК/. Число фотонов, достигающих фотокатода за 1 с, равно Ф/(Нсо)9 где Ф — падающий поток излучения (в энергетических единицах). Среднее число фотоэлектронов за 1 с составит т]Ф/(Нсо) (г) — квантовый выход). Умножая это число на заряд е электрона, получим фототок /ф = ет]Ф/(На)). Для уверенного обнаружения сигнала должно быть
434 9. Термодинамика излучения. Световые кванты р^1. Условно можно принять, что пороговый сигнал Фпор соответствует р = 1. Тог- Тогда /ф = у/2е1тА/ и для пороговой чувствительности получаем (9.45) Отсюда следует, что основные параметры, определяющие предельную чувствитель- чувствительность ФЭУ, — это квантовый выход и темновой ток фотокатода. В лучших образ- образцах ФЭУ при охлаждении число термоэлектронов с 1 см2 площади катода состав- составляет 5-10 в 1с. При г] = 0,01 по формуле (9.45) получаем для пороговой чувстви- чувствительности ФПОр/(?1со) величину порядка нескольких сотен фотонов в секунду при ширине полосы пропускания А/ = 1 Гц. Минимальный регистрируемый поток мож- можно уменьшить сужением полосы пропускания, т. е. увеличением времени регистрации («накоплением») сигнала. При низком уровне собственных шумов для измерения слабых световых пото- потоков наилучшие результаты дает работа ФЭУ в режиме счета фотонов. Каждый фотоэлектрон после размножения в динодной системе создает на выходе ФЭУ им- импульс тока. Эти импульсы регистрируются хорошо разработанными в ядерной физике методами. Таким способом можно решать задачи, недоступные другим методам реги- регистрации световых сигналов, в частности задачи непосредственного измерения времен жизни возбужденных состояний атомов. При использовании фотоумножителя для обнаружения слабого модулированно- модулированного сигнала в присутствии значительно большего постоянного потока темновой ток может быть малым по сравнению с фототоком. В этом случае точность измерений лимитируется дробовым шумом фототока. Формула (9.44) при /т < /ф принимает вид р = */1./BеА/) = у/г]Ф/BА/Нсо). Величина, обратная отношению сигнал/шум, характеризует относительную погрешность таких измерений: (9.46) При Я = 0,5мкм, Ф=10 7Вт, г] = 10 * и ширине полосы А/ = 1 Гц это приво- приводит к относительной погрешности АФ/Ф « 10~5. Технические флуктуации обычно превосходят этот уровень, так что на практике достижимая точность фотоэлектриче- фотоэлектрических измерений составляет 10~3-10~4. В проведенном выше рассмотрении шумов фотоэлектрических приемников излучения пред- предполагалось, что источник света имеет постоянную интенсивность, т.е. число фотонов, па- падающих на фотокатод за время наблюдения г, не испытывает флуктуации. Такая модель применима к излучению стабилизированного одномодового лазера непрерывного действия. Статистической моделью излучения нелазерных источников может служить хаотически моду- модулированное колебание, амплитуда и фаза которого представляют собой случайные функции времени (см. п. 5.4). Характерный временной масштаб изменения амплитуды и фазы — это время когерентности излучения тког. Можно показать, что интенсивность такого излучения также хаотически изменяется со временем, испытывая случайные отклонения от среднего зна- значения, причем флуктуации интенсивности равны средней интенсивности. Несмотря на столь
9.5. Фотоэлектрический эффект 435 большие флуктуации интенсивности, обнаружить их проявление в эксперименте трудно. Объ- Объясняется это тем, что временной масштаб флуктуации интенсивности равен времени коге- когерентности гКог, которое обратно пропорционально ширине спектрального распределения из- излучения Ду: гког ~ 1/Ду. Даже для наиболее узких спектральных линий время когерентности мало по сравнению с достижимыми значениями времени наблюдения г. (Для фотоумножите- фотоумножителей постоянная времени г достигает 10"~8—10"~9 с.) При гког «С т флуктуации интенсивности не влияют на число фотоэлектронов И, эмиттируемых за время г. Закон распределения числа фотоэлектронов Р(М) по-прежнему определяется только случайным характером фотоэмиссии и будет пуассоновским независимо от статистического распределения интенсивности излу- излучения. Сведения о флуктуациях интенсивности сохраняются в статистике фотоэлектронов, когда гког ^> т. Это условие может выполняться для многомодового лазерного излучения или для лазерного света, рассеянного в турбулентной среде. В подобных случаях статистические свойства излучения могут быть найдены из экспериментальных измерений распределения фо- фотоотсчетов. Красная граница фотоэффекта ограничивает возможности применения фотоумно- фотоумножителей в инфракрасной области спектра. Для уменьшения работы выхода изготов- изготовляют сложные фотокатоды. Нанесение на поверхность серебра кислородно-цезиевого монослоя позволяет расширить спектральную область чувствительности приблизи- приблизительно до 1,3 мкм, но у таких «длинноволновых» фотокатодов очень мал квантовый выход (/7тах = 0,5 %)> что ограничивает возможности их применения. Более широкой областью спектральной чувствительности характеризуются фото- фотоэлектрические приемники излучения на основе внутреннего фотоэффекта в полу- полупроводниках. Поглощение фотона с энергией, превышающей энергетический интер- интервал между заполненной валентной зоной и свободной зоной проводимости, приводит к образованию пары неравновесных носителей тока — электрона и дырки. Красная граница внутреннего фотоэффекта определяется шириной запрещенной зоны. Она зависит от природы полупроводника и может лежать в области значительно более длинных волн, чем у приемников с внешним фотоэффектом. Увеличение числа свободных носителей под действием света ведет к возраста- возрастанию электропроводимости (фотопроводимость). Основанные на этом явлении при- приемники излучения называются фотосопротивлениями. Фотосопротивления в ви- виде тонких пленок на основе 1пАз, РЬ8, РЬТе и других полупроводниковых соеди- соединений обладают чувствительностью вплоть до длин волн 7—8 мкм. Для видимой и ближней ин- а) \ фракрасной области спектра большей эффектив- эффективностью обладает другой тип фотоприемника — фотодиод. Фотодиод представляет собой полу- полупроводниковую пластинку, внутри которой бла- благодаря различным примесям имеются две облас- области с электронной и дырочной проводимостями Рис# 9«13. Принщшиальная схема (а) / П1-5 \ тт и устройство (б) фотодиода (рис. 9.13, а). Напряжение от внешнего источ- ' у к '^ ника приложено к п—р-переходу в запирающем направлении, для которого сопротивление перехода велико. При освещении облас- области п—р-перехода в ней появляются неосновные носители (электроны в р-области и дырки в л-области), что приводит к возникновению тока в цепи. Обычно фотодиод изготавливается так, чтобы свет падал перпендикулярно границе раздела, проходя через тонкий р-слой (см. рис. 9.13,5).
436 9. Термодинамика излучения. Световые кванты Фотодиоды характеризуются широкой спектральной чувствительностью (от уль- ультрафиолетовой области до 1,8 мкм у германиевых фотодиодов) и высоким кванто- квантовым выходом {г]тах « 0,9), их постоянная времени г » 1 мкс. Характеристики совре- современных фотодиодов позволяют предпочесть их другим приемникам излучения для решения многих практических задач. Фотодиод без внешнего источника ЭДС, называемый вентильным фотоэлемен- фотоэлементам, осуществляет непосредственное преобразование энергии падающего излучения в электрическую энергию. Неравновесные электроны и дырки, образующиеся при по- поглощении света, пространственно разделяются в переходном слое (фото-ЭДС), что приводит к возникновению тока во внешней цепи. Кремниевые фотоэлементы тако- такого типа имеют сравнительно высокий к. п. д. A4—16%) и используются в качестве источника энергии в солнечных батареях космических аппаратов. Контрольные вопросы • Приведите схему экспериментальной установки для изучения фотоэффекта. Каким спосо- способом измеряется максимальная скорость фотоэлектронов? • Назовите основные закономерности фотоэффекта. Как объяснить их на основе квантовых представлений? • Как из опытов по фотоэффекту определить постоянную Планка? • Объясните принцип действия фотоэлектронного умножителя. • Какие причины вызывают появление собственных шумов вакуумных фотоэмиссионных при- приемников излучения? • Какие приемы используют для увеличения отношения сигнал/шум? • Какие факторы определяют пороговую чувствительность фотоумножителя и относитель- относительную погрешность при измерении больших световых потоков? • Почему большие флуктуации интенсивности излучения нелазерных источников не влияют на статистическое распределение фотоотсчетов? • Какими преимуществами обладают приемники излучения на основе внутреннего фотоэф- фотоэффекта? 9.6. Энергия и импульс фотона. Дуализм света Электромагнитная теория, рассматривающая свет как классические электро- электромагнитные волны (т.е. как возможные решения уравнений Максвелла), исчерпы- исчерпывающе описывает распространение света в пустоте, интерференцию и дифракцию. Будучи дополненной электронной теорией, она оказывается в состоянии охватить и широкий круг вопросов, относящихся к взаимодействию света с веществом, таких как рассеяние, поглощение, преломление, дисперсия. Но применимость классичес- классической теории в вопросах взаимодействия света с веществом имеет предел. Так, напри- например, в фотоэффекте проявляется внезапная пространственная локализация конечной порции энергии света на одном электроне. Такое поведение несовместимо с класси- классической волновой картиной, но получает естественное объяснение в корпускулярной
9.6. Энергия и импульс фотона. Дуализм света 437 картине, трактующей свет как поток фотонов. Ведь именно частица может доставить конечную порцию энергии в определенную точку. Локализация кванта энергии излучения в пространстве особенно ярко проявляется в фотоэффекте на отдельных атомах или молекулах (фотоионизация). В классичес- классической электромагнитной волне энергия непрерывно распределена по всему волновому фронту. Исходя из известного значения площади эффективного сечения, можно оце- оценить, сколько времени должно пройти с момента начала облучения для того, чтобы атом мог накопить достаточную для вырывания электрона (ионизации) энергию Е-. В условиях реального эксперимента это могут быть недели или месяцы. Однако опыт показывает, что фотоэлектроны с энергией Нсо — Е1 появляются практически сразу после начала облучения. Значит, классическое непрерывное распределение энергии по фронту характеризует перенос энергии излучения только в среднем, но не для элементарных актов взаимодействия света с веществом, свидетельствующих о пространственной локализации переносимой энергии, что характерно для потока частиц. Волновой и корпускулярный аспекты излучения связаны друг с другом: атрибут волновой картины — частота со — входит в соотношение е = 1ш>, определяющее энергию световой частицы — фотона. В опытах по фотоэффекту это соотношение проверяется измерением энергии фотоэлектронов, образуемых фотонами монохро- монохроматического излучения известной частоты. Другое подтверждение ему дает обрат- обратный процесс — испускание фотонов быстрыми элек- электронами при торможении. Это происходит, например, в антикатоде рентгеновской трубки. Опыт показывает, что при данном ускоряющем напряжении \] в рент- рентгеновском спектре отсутствует излучение с длинами волн, меньшими некоторого значения Хт[п. Коротковол- Коротковолновая граница тормозного излучения Ят|п определяет- определяется ускоряющим напряжением V и не зависит от мате- материала мишени (рис. 9.14). В целом процесс излучения при торможении электрона в электрических полях, со- создаваемых атомами мишени, весьма сложен, но корот- 50 кВ 8 10 Я,нм коволновая граница в корпускулярной картине получа- Рис« 9.14. Коротковолновая гра- грает очень простое объяснение. Как и в уравнении Эйн- нВДатоРмозн^^^гггеновского штейна (9.39) для фотоэффекта, можно записать закон сохранения энергии в элементарном акте испускания кванта излучения. Фотон получает наибольшую энергию в том случае, когда элек- электрон полностью останавливается при столкновении с ядром атома мишени. Из-за большой массы ядра такой процесс не противоречит закону сохранения импульса. Значит, максимальная энергия испускаемых фотонов Тьсотах равна кинетической энер- энергии электронов ^ ту2 = е\]\ ск или Я^п = —. (9.47) Существование граничной частоты сотах демонстрирует квантовый характер ис- испускания рентгеновского излучения. По измерению зависимости сотах от ускоря- ускоряющего напряжения можно с высокой точностью определить значение постоянной
438 9. Термодинамика излучения. Световые кванты Планка Н, при этом получается хорошее согласие со значениями, найденными на основе черного излучения и фотоэффекта, что экспериментально свидетельствует 0 выполнении соотношения е = Нсо между энергией фотона и частотой для очень широкой области спектра и указывает на его всеобщий характер. Согласно классической электромагнитной теории, бегущая электромагнитная волна обладает импульсом р, направленным вдоль волнового вектора к и пропорциональ- пропорциональным энергии волны: р = М/с (см. п. 3.5). Можно ожидать, что такое соотношение между энергией и импульсом выполняется и для элементарного кванта излучения — фотона: р = Нсо/с. Учитывая, что отношение со/с равно волновому числу к, запишем его в векторном виде (вместе с соотношением между энергией фотона и частотой): е = /м», р = Пк. (9.48) Частота со и волновой вектор к характеризуют волновые свойства монохрома- монохроматического излучения, а энергия е и импульс р — корпускулярные. Второе соотно- соотношение (9.48), связывающее импульс фотона с волновым вектором, неизбежно сле- следует из первого, связывающего энергию с частотой, если обратиться к требованию равноправия всех инерциальных систем отсчета, т.е. к принципу относительности. В самом деле, энергия (деленная на постоянный множитель с) и импульс частицы образуют четырехмерный вектор (е/с9 р), а частота (деленная на с) и волновой век- вектор образуют четырехмерный волновой вектор (со/с, к) монохроматической волны. При переходе от одной инерциальной системы отсчета к другой пространственные и временные компоненты 4-векторов в соответствии с преобразованиями Лорен- Лоренца (8.7) «перемешиваются» друг с другом. Фундаментальное соотношение е = Нсо между временными компонентами 4-векторов (с/с, р) и (со/с, к) будет удовлетво- удовлетворять требованию релятивистской инвариантности, т. е. выполняться одновременно во всех системах отсчета, тогда и только тогда, когда такое же соотношение р = Нк имеет место и между их пространственными компонентами. Обращаясь к релятивистской формуле (е/сJ — р2 = т^с2, связывающей энергию и импульс частицы,*) и учитывая, что для фотона р = е/с, видим, что масса покоя фотона т0 = 0. Если мы склонны рассматривать фотон как частицу, этот результат на первый взгляд может показаться странным. Однако это говорит лишь о том, что, обладая некоторыми свойствами частицы, фотон не во всех отношениях похож на обычную частицу: он в любой системе отсчета имеет скорость с, и не существует системы отсчета, в которой бы он покоился. Равенство нулю массы покоя означает, что фотон в состоянии покоя — понятие, лишенное смысла. 1 аким образом, квант монохроматического электромагнитного поля во взаимодей- взаимодействии с веществом проявляет себя как частица с энергией и импульсом, определя- определяемыми соотношениями (9.48). Взаимодействие света с веществом можно рассмат- рассматривать как совокупность элементарных актов поглощения, испускания и рассеяния фотонов, в каждом из которых выполняются законы сохранения энергии и импульса. *) Напомним, что разность квадратов временнбй и пространственной компонент любого 4-вектора оди- одинакова во всех инерциальных системах отсчета (релятивистский инвариант). Приведенное соотношение получается, если эту разность квадратов для 4-вектора энергии-импульса приравнять ее значению в сис- системе отсчета, где частица покоится, и воспользоваться формулой е0 = тос2.
9.6. Энергия и импульс фотона. Дуализм света 439 а) 0 = 45° 90° В рассмотренных выше явлениях фотоэффекта и тормозно- тормозного излучения мы учитывали только закон сохранения энер- энергии при поглощении или испускании фотона, так как мас- массивный катод мог, не участвуя в энергетическом балансе, «принять на себя» любой импульс и этим обеспечить вы- выполнение закона его сохранения. Но существуют явления, в которых импульс фотона обнаруживает себя явно и соот- соотношение р = Нк допускает экспериментальную проверку. В качестве примера рассмотрим рассеяние рентгеновского излучения электронами, впервые количественно исследо- исследованное Комптоном в 1923 г. Опыты Комптона показали, что при рассеянии пучка мо- монохроматических рентгеновских лучей на мишени из ве- вещества с небольшим атомным номером в рассеянном излу- излучении наряду с неизменной длиной волны появляется спек- спектральная компонента, смещенная в сторону длинных волн. Наблюдаемое изменение длины волны ДА = А' — Я не за- зависит от материала мишени, а определяется лишь углом в между направлением падающего пучка и направлением рас- рассеянного излучения. С увеличением угла в интенсивность несмещенной компоненты падает, а смещенной — растет (рис. 9.15). В атомах легких элементов энергия связи электрона (энергия ионизации) порядка 10 эВ, что примерно в тысячу рис. 9.15. Спектр рассеян- раз меньше энергии рентгеновского фотона {Нсо « ЮкэВ). ного на графите излучения Поэтому электроны в этих опытах можно считать прак- ^-линии молибдена тически свободными. Энергия покоя электрона тс2 « « 0,5 МэВ, что много больше энергии фотона. Поэтому электрон, который до столк- столкновения покоился или двигался в атоме с нерелятивистской скоростью, и после столкновения с таким фотоном останется нерелятивистским. Пренебрегая начальной энергией электрона, запишем закон сохранения энергии г) , р2 ?ш = Гш) +—. 2т Здесь р — импульс электрона после столкновения с фотоном. Пусть импульс фотона до и после рассеяния. Закон сохранения импульса Рф = Рф + Р (9.49) и р^ — (9.50) запишем с помощью теоремы косинусов (рис. 9.16) в следующем виде: Р2 = Рф + Уф ~ 2-РфРф с°з 0- (9-51) импульса в°э^екте Подставим в это равенство выражение для импульса фотона че- Комптона рез его частоту р. = Нсо/с и квадрат импульса электрона из
440 9. Термодинамика излучения. Световые кванты закона сохранения энергии (9.49): 2тП(а) - о)') = [со2 + о)'1 - 2о)О)' созв)Н2/с2. Переписав это уравнение в виде со - со' = -—2 [«> + 2о/СО50 (9.52) и учитывая, что Нсо/(тс2) <С 1, видим, что изменение частоты Асо = со' — со мало по сравнению с самой частотой. Поэтому в правой части (9.52) можно заменить со' на со. Тогда для относительного сдвига частоты Асо/со при рассеянии получаем Асо Нсо ,л ЛЧ 2Нсо . о в __ ^^^^^ / 1 Л»Г»О Н\ — С1ТЛ — «• ^ 1 — С/ОЬ С/) — «" МП ~ • со тс* тс* 2 Знак «—» здесь показывает, что частота излучения при рассеянии уменьшается. Это и понятно, так как часть своей энергии фотон передает электрону. Переходя теперь от частот к длинам волн А = 2лс/со, ДА/А = —Асо/со, окончательно получаем М=^мп2?==2Лмп2?, А = А. (9.53) тс 2 2 тс к } Соотношение (9.53) очень хорошо описывает наблюдаемую на опыте зависимость увеличения длины волны от угла рассеяния (см. рис. 9.15). Входящая в (9.53) кон- константа Л, называемая комптоновской длиной волны электрона, выражается в виде комбинации трех универсальных постоянных: А = Н/(тс). Подставляя их числовые значения, получаем А = 0,24 нм, что совпадает с величиной, найденной из измерений смещения длины волны при рассеянии. Происхождение несмещенной компоненты в спектре рассеянного излучения обусловлено внутренними электронами атомов мишени. Их энергия связи, особенно в тяжелых атомах, сравнима с энергией рентгеновских фотонов, и, следовательно, такие электроны уже нельзя рассматривать как свободные. Поэтому в акте рассеяния фотон обменивается энергией и им- импульсом с атомом в целом, а так как масса атома велика, то по закону сохранения импульса фотон практически не передает ему своей энергии. Фотоны, рассеянные внутренними электро- электронами, образуют несмещенную компоненту. Из приведенных рассуждений ясно, почему эффект Комптона нельзя наблюдать в видимой области спектра. Энергия фотона видимого света сос- составляет лишь несколько электрон-вольт. При этом даже внешние электроны нельзя считать свободными. При рассеянии фотона часть его энергии передается электрону. Электроны от- отдачи играют важную роль в процессе ионизации газов рентгеновским излучением. Используя камеру Вильсона, помещенную в магнитное поле, можно найти импульс и энергию электронов отдачи, что позволяет еще более полно проверить выполнение законов сохранения. Измерения показали, что в каждом элементарном акте рассея- рассеяния электрон приобретает как раз такие энергию и импульс, какие теряет фотон. Опыты Комптона ярко продемонстрировали, что энергия и импульс фотона дей- действительно выражаются формулами (9.48) и что законы сохранения энергии и им- импульса выполняются в элементарных актах рассеяния.
9.6. Энергия и импульс фотона. Дуализм света 441 1 аким образом, результаты экспериментов говорят о том, что в ряде явлений свет обнаруживает корпускулярные свойства: взаимодействие с веществом имеет характер дискретных процессов, в которых поглощается, испускается или рассеивается целый квант. Но представление о свете как потоке классических корпускул несовместимо с классической картиной электромагнитных волн, которая, в свою очередь, находит опытное подтверждение в явлениях интерференции и дифракции. Впрочем, вопрос о природе света не всегда стоит так категорично: или частицы, или волны. Существует ряд явлений, допускающих корректное объяснение с любой из этих точек зрения. В качестве примеров можно приве- привести эффект Доплера и давление света. Покажем, что типично волновое на первый взгляд яв- явление Доплера можно объяснить с корпускулярной точки зрения, рассматривая свет как поток фотонов. Пусть «за- «закрепленный» неподвижный атом при переходе в состоя- ние с меньшей энергией испускает фотон с энергией ?ко. Разность энергий рассматриваемых состояний атома рав- равна Нсо и не зависит от того, покоится атом или движется. При испускании фотона незакрепленным, свободно движущимся атомом импульс атома изменяется, поскольку испущенный фотон обладает импульсом. Это значит, что изменяется и кинетическая энергия атома. На основании закона сохранения энергии 2 „/2 **>+%* =Л*>' + ЧП> (9.54) 2М 2М где Нсо1 — энергия испущенного фотона, р и р1 — импульс атома до и после ис- испускания фотона, М — масса атома. Начальный и конечный импульсы атома можно связать с импульсом р. испускаемого фотона с помощью закона сохранения импуль- импульса: р = р' + Рф (рис. 9.17). Перенесем здесь Рф в левую часть и возведем полученное равенство в квадрат. Учитывая, что импульс фотона крайне мал по сравнению с им- импульсом движущегося излучающего атома (р. < /?), получаем*) Используя это соотношение, перепишем закон сохранения энергии (9.54) в следу- следующем виде: Ъы1 -На) = —- соз0. М Подставляя сюда импульс испущенного фотона р± = Ьхо'/с и учитывая, что р/М есть скорость V движения излучающего атома, находим для относительного сдвига частоты , (9.55) (ОС *) Пренебрегая квадратом импульса фотона, мы теряем сдвиг частоты из-за эффекта отдачи атома, ко- который может быть существенным при излучении у-квантов атомным ядром (см. задачи 1, 2). В оптической области эффект отдачи приводит к ничтожному сдвигу частоты.
442 9. Термодинамика излучения. Световые кванты что совпадает с обычным нерелятивистским выражением для эффекта Доплера. Бо- Более точную (релятивистскую) формулу можно получить, если в закон сохранения энергии подставлять релятивистское выражение для энергии атома (см. задачу 2). Впрочем, возможность как волновой, так и корпускулярной трактовки эффекта Доплера сразу видна из релятивистски инвариантного характера соотношений (9.48). Преобразование энергии фотона е (т.е. корпускулярной характеристики) при пере- переходе от одной инерциальной системы отсчета к другой происходит по тем же форму- формулам, что и преобразование частоты со электромагнитной волны, поскольку е и со во всех системах отсчета пропорциональны друг другу (коэффициент пропорционально- пропорциональности — универсальная постоянная К) и представляют собой временные компоненты соответствующих четырехмерных векторов. Давление света, предсказываемое электромагнитной теорией Максвелла и впер- впервые обнаруженное в опытах П. Н. Лебедева, по корпускулярным представлениям ин- интерпретируется как результат передачи импульса фотонов поглощающей или отража- отражающей стенке. При нормальном падении каждый поглощенный фотон передает стенке импульс Нсо/с, отраженный — вдвое больший импульс 2Нсо/с. На единицу площади стенки в единицу времени падает энергия излучения Цс, где V — объемная плот- плотность энергии. Поэтому число падающих фотонов N = Цс/На). Из него N8 фотонов отразится, NA —К) — поглотится (К — энергетический коэффициент отражения поверхности). Давление р света равно полному импульсу, передаваемому падающи- падающими фотонами на 1 м2 поверхности за 1 с, т. е. р = Ш— +NA -Я)—= 1/A+Л), (9.56) с с что совпадает с выражением (см. п. 3.5), полученным на основе электромагнитной теории. Изотропное излучение, распространяющееся по всем направлениям, оказы- оказывает на стенку давление р = 17/3. Такое выражение можно получить, рассматривая излучение в замкнутой полости как идеальный газ фотонов. Учет светового давления необходим при применении термодинамических методов к проблеме равновесного теплового излучения. -Рассмотренные примеры показывают, что при анализе конкретных явлений двой- двойственность света не приводит к противоречиям. Противоречие возникает только тогда, когда мы пытаемся составить общее представление о свете. В самом деле, соотношения (9.48) связывают волновые и корпускулярные свойства света: правые части содержат частоту со и волновое число к, определяемые из интерференционных явлений, а левые части е и р характеризуют фотон как частицу. Но именно сосу- сосуществование этих свойств и не может быть логически непротиворечиво объяснено классической физикой, с точки зрения которой понятия волны и частицы исключают друг друга, так как описывают полярно противоположные формы движения. Каким образом частица может иметь некоторую частоту или длину волны? Для иллюстрации возникающих логических трудностей и того, как они преодоле- преодолеваются квантовой теорией, рассмотрим простой интерференционный опыт. Свет от точечного источника 5 падает на непрозрачный экран Л, в котором прорезаны две узкие параллельные щели С и О (рис. 9.18). Расстояние между экранами А и В ве- велико по сравнению с расстоянием й между щелями, которое, в свою очередь, много больше длины световой волны. На экране В возникают интерференционные поло-
Рис. 9.18. Интерференционный опыт с двумя щелями 9.6. Энергия и импульс фотона. Дуализм света 443 сы. Каждый фотон, попадая на экран В, ведет себя как частица, вызывая в опреде- определенной точке почернение фотопластинки при фотографической записи или вырыва- вырывание фотоэлектрона при фотоэлектрической регистрации. Но распределение большо- большого числа таких точек регистра- регистрации фотонов описывается клас- классической картиной интерферен- интерференции волн, приходящих от двух ^ щелей. * - Придерживаясь корпускуляр- корпускулярных представлений, можно было бы пытаться объяснить интер- интерференционные полосы каким-то взаимодействием между фотона- фотонами, проходящими через разные щели. Но тогда при очень слабом источнике 5, когда в каждый момент в установ- установке не может находиться более одного фотона, интерференционные полосы должны исчезнуть. Прямые опыты такого типа (Тэйлор, 1909 г.) показывают, что никаких из- изменений в интерференционной картине при уменьшении интенсивности источника не происходит. Это значит, что интерференция представляет собой статистическое свойство отдельного фотона. Если закрыть одну из щелей, то интерференционные полосы пропадают: распре- распределение интенсивности на экране становится таким же, как при дифракции на одной щели, т. е. при достаточно узкой щели практически равномерным. Это вынуждает нас считать, что на пути от источника через щели к экрану В излучение ведет себя как волна, ибо появление полос наблюдается лишь в том случае, когда свет проходит через обе щели. Невозможно представить себе классическую частицу, которая про- проходила бы сразу через обе щели. Но если фотон проходит через одну щель, то каким образом другая щель, через которую он не проходит, не позволяет ему попасть в те места экрана, куда он мог бы попасть, если бы эта щель была закрыта? Такая постановка вопроса основана на естественном для классической физики допущении, что частица в любой момент времени имеет определенные координа- координаты, доступные измерению, и, следовательно, движется по определенной траектории. Современная квантовая теория отказывается от этого допущения, утверждая, что го- говорить об определенном положении частицы имеет смысл лишь в том случае, если при постановке опыта мы позаботимся об измерении ее координаты. Значит, если мы хотим считать, что каждый фотон, подобно частице, проходит только через одну из щелей, то мы должны поставить какой-либо измерительный прибор, который бы фиксировал нам факт прохождения фотона через определенную щель. Можно, напри- например, попытаться с помощью счетчиков Си/) фиксировать, через какое отверстие проходит каждый фотон. При этом фотоны демонстрируют действительно корпуску- корпускулярное поведение: счетчики никогда не срабатывают одновременно, т.е. отдельный фотон сразу через две щели не проходит. Но оказывается, что такое «вмешательство» счетчиков выразится в полном размытии интерференционных полос на экране В\ В самом деле, сохранение интерференционных полос в такой ситуации про- противоречило бы соотношениям неопределенностей Гейзенберга. Чтобы установить факт прохождения частицы через определенную щель, счетчик должен определять
444 9. Термодинамика излучения. Световые кванты координату х фотона (в направлении, перпендикулярном щелям) с погрешно- погрешностью Ах, не превышающей половины расстояния между щелями: Ах < й/2. Та- Такое измерение в соответствии с основными положениями квантовой теории неизбежно вносит неконтролируемое изменение ^-составляющей импульса фо- фотона Арх > к/Ах, т.е. неопределенность АО в направлении его распростране- распространения (см. рис. 9.18): АО = Арх/р>к/(рАх). Так как Ах < Л/2, а импульс фотона р = Ьк — к/Л, то АО > 1X1 Л. Эта неопределенность в направлении импульса фотона, вносимая определением щели, через которую он прошел, превышает угловую ши- ширину отдельной интерференционной полосы А/г/, т. е. приводит к полному размытию интерференционной картины. Установив, через какую щель проходит фотон, мы утра- утрачиваем интерференционную картину и не можем говорить о проявлении фотонами волновых свойств. Подведем некоторые итоги. Попадая на экран В, фотоны обнаруживают корпус- корпускулярное поведение, заключающееся в том, что они взаимодействуют с веществом экрана только в отдельных точках. Если при этом не пытаться экспериментально наблюдать траектории фотонов до попадания их на экран (т. е. не устанавливать, че- через какую щель проходит каждый из них), то, пропустив большое число фотонов, на экране В мы получим интерференционную картину, которую нельзя объяснить иначе как на основе волновых представлений. Предсказать, в какое место экрана по- попадет отдельный фотон, нельзя. Это можно сделать только в статистическом смысле: вероятность зарегистрировать фотон в области максимума интерференционной кар- картины велика, а в области минимума — мала. Плотность энергии электромагнитного поля, вычисляемая в классической волновой теории на основе уравнений Максвел- Максвелла, определяет вероятность того, что фотон будет зарегистрирован в данном месте, т.е. дает среднее пространственное распределение, наблюдаемое с очень большим числом фотонов. В этом смысле классическая волновая теория вполне справедлива. Если же мы пытаемся наблюдать отдельные фотоны, например, фиксируем их траек- траектории, как в рассмотренном выше опыте, то фотоны совсем не проявляют волновых свойств. Квантовая теория не отвергает полностью классическую волновую картину, а указывает на ее ограниченность. Итак, что же такое свет — частицы или волны? Квантовая теория отвечает на этот вопрос так: ни то, ни другое. Когда мы описываем поведение фотона как по- поведение частицы или волны, мы навязываем классическое описание этому объек- объекту, имеющему существенно неклассическую природу. Свет может характеризовать- характеризоваться только с той его стороны (корпускулярной или волновой), проявление которой обусловлено внешними условиями, создаваемыми экспериментальными средства- средствами наблюдения. Такая постановка вопроса позволяет рассматривать и тот случай, когда один и тот же исследуемый объект (свет) обладает несовместимыми по клас- классическим представлениям корпускулярными и волновыми свойствами. В квантовой теории эти свойства не исключают, а дополняют друг друга, так как в чистом виде они могут проявиться лишь в разных опытах, производимых при взаимоисключа- взаимоисключающих условиях. Этим и объясняется отсутствие логического противоречия в поня- понятии «корпускулярно-волновой дуализм». Действительно, нет необходимости пытать- пытаться представить себе, как это фотон может быть сразу и волной, и частицей. Свет обладает потенциальной возможностью проявлять и волновые, и корпускулярные свойства, но эти дополнительные свойства в чистом виде проявляются лишь при вза-
9.6. Энергия и импульс фотона. Дуализм света 445 имоисключающих условиях эксперимента. Адекватный способ описания света опре- определяется выбранным способом наблюдения, а вопрос о том, что же существует «на самом деле» — волна или частица, лишен содержания. Важно подчеркнуть, что изложенные здесь теоретические идеи не могут быть чисто логически выведены из каких-то общих принципов. Они возникли на осно- основе анализа большой совокупности экспериментальных результатов. Заметим, что корпускулярно-волновой дуализм присущ не только фотонам, но и любым другим микрообъектам — электронам, протонам, нейтронам и т. п. Математический аппарат современной квантовой теории (изложение которого вы- выходит за рамки данной книги) органически включает в себя возможность проявления изучаемым микрообъектом (фотоном, электроном) как волновых, так и корпускуляр- корпускулярных свойств. Этот аппарат свободен от абстракций, присущих классическому опи- описанию и заключающихся в абсолютизации физического процесса и принципиальной возможности неограниченной его детализации. В его основе лежит явный учет реаль- реальных возможностей измерений, проводимых над микрообъектами (относительность к средствам наблюдения). Результат взаимодействия микрообъекта с классически описываемым прибором при заданных внешних условиях характеризуется некоторой вероятностью. Вероятности в квантовой физике имеют совсем иной характер, неже- нежели в классической, где они отражают неполноту наших знаний о физической системе. Здесь они принципиально необходимы, так как отражают объективно существующие при данных условиях потенциальные возможности. Математический аппарат кван- квантовой теории позволяет находить как возможные значения физических величин, так и вероятности получения на опыте тех или иных значений этих величин при изме- измерении в определенных условиях. Контрольные вопросы • В каких явлениях обнаруживаются волновые и в каких — корпускулярные свойства света? • Как объясняется происхождение коротковолновой границы спектра тормозного рентгенов- рентгеновского излучения? • Какие явления свидетельствуют о том, что фотон обладает импульсом? Как связаны им- импульс фотона и волновой вектор? • Как объясняется изменение длины волны при рассеянии рентгеновских лучей свободными электронами? • Приведите примеры явлений, допускающих как волновое, так и корпускулярное объясне- объяснение. • Объясните, в чем заключается происхождение противоречий, возникающих при попытках составить общее представление о свете, проявляющем то волновые, то корпускулярные свойства. Как эти логические трудности преодолеваются квантовой теорией? Задачи 1. Первоначально покоившийся атом (или ядро) массы М испускает фотон (у-квант) при пе- переходе между энергетическими уровнями, разность которых равна Нсоо. Найдите частоту со испущенного излучения. Оцените Асо/со0 для желтой линии натрия и для у-линии ПЗкэВ ядра изотопа гафния ^НЕ
446 9. Термодинамика излучения. Световые кванты Ответ, со = аH[\ — Нсо0/BМс2)]. Эта формула описывает эффект отдачи при испуска- испускании фотона, аналогичный откату ствола орудия при выстреле. Частота (и энергия) фотона всегда меньше той, которую он имел бы при бесконечно большой массе ядра. Для оптиче- оптических фотонов эффект отдачи ничтожен (сдвиг частоты много меньше естественной ширины линии). 2. Используя законы сохранения энергии и импульса, получите релятивистскую формулу для частоты фотона, испускаемого движущимся атомом (с учетом эффекта отдачи). Ответ. &Цр \ у/1 -у1!с1 ) \ у/ ) \- 2Мс2> Здесь в — угол между направлением испущенного фотона и скоростью атома V. При V = О полученное выражение совпадает с ответом предь формулу для релятивистского эффекта Доплера. полученное выражение совпадает с ответом предыдущей задачи. При /го>0 <^ Мс2 получаем
Основы нелинейной оптики Вскоре после создания лазеров началось бурное развитие нели- нелинейной оптики, объединяющей круг явлений, обусловленных зависимостью оптических параметров среды от интенсивности света. Такие оптические характеристики среды, как показатель преломления и коэффициент поглощения, не зависят от интен- интенсивности света, если реакция среды на электрическое поле све- световой волны описывается линейным материальным уравнением Р = хЕ, т. е. поляризованность пропорциональна напряженнос- напряженности поля, а коэффициент пропорциональности — восприимчи- восприимчивость х — зависит только от свойств среды, но не от напряжен- напряженности поля. Но это материальное уравнение приближенно: оно справедливо лишь при напряженностях Е электрического поля световой волны, малых по сравнению с напряженностями Еа внутриатомных электрических полей. Для оценки внутриатомных полей можно считать, что по порядку величины Еа ~ е/а2, где а — размер атома. Так как а ~ 10~8см, то Еа ~ 108 — 109 В/см. В пучках света от нела- нелазерных источников достижимые значения напряженности поля не превосходят 0,1 —10 В/см. Поэтому линейное материальное уравнение выполняется с большой точностью. Но в интенсивных лазерных пучках напряженность Е поля достигает значений 108—109 В/см. В таких полях модель гар- гармонического осциллятора для описания поведения оптического электрона атома уже неприменима и связь поляризованности среды с напряженностью поля световой волны становится нели- нелинейной. В результате возникает зависимость оптических харак- характеристик среды от интенсивности излучения, которая приводит не к каким-либо малым поправкам, а к принципиально новым эффектам, не существующим в линейной оптике. Нелинейная оптика существенно расширяет наши представления о взаимо- взаимодействии света с веществом.
448 10. Основы нелинейной оптики ЮЛ. Некогерентные нелинейные эффекты Первый нелинейный эффект был открыт С. И. Вавиловым и В. Л. Левшиным еще в 1925 г. Несмотря на трудности опытов с нелазерными источниками, им удалось наблюдать небольшое уменьшение (до 1,5%) коэффициента поглощения уранового стекла с увеличением интенсивности света. Возникновение этого нелинейного эф- эффекта насыщения обусловлено выравниванием населенностей двух уровней энер- энергии, между которыми происходят квантовые переходы с поглощением и испусканием света (см. задачу 1). При большой интенсивности падающего света вероятность выну- вынужденных переходов может приблизиться к вероятности релаксационных спонтанных переходов, посредством которых возбужденные атомы или молекулы избавляются от избытка энергии и возвращаются в основное состояние. С увеличением интенсив- интенсивности рост поглощаемой мощности замедляется и она приближается к некоторому пределу, определяемому скоростью, с которой возбужденные атомы отдают избыток энергии окружающей среде (скоростью релаксации). Уменьшение доли поглощаемой мощности с увеличением интенсивности света, т.е. просветление нелинейной поглощающей среды при прохождении сильных све- световых пучков, нашло применение в лазерной технике, где оно используется для модуляции добротности оптических резонаторов в целях генерации сверхкоротких мощных импульсов (см. п. 9.4). Ячейка с нелинейной поглощающей средой представ- представляет собой автоматический затвор, открывающийся под действием мощного свето- светового пучка. Очень важно, что такой затвор обладает малой инерционностью, так как после прохождения мощного светового импульса среда быстро становится снова непрозрачной для слабого света. В активной среде с инверсией населенностей эффект насыщения приводит к уменьшению коэффициента усиления при увеличении интенсивности света и тем самым к установлению стационарного режима генерации в лазерах. непрозрачная для слабого света среда становится прозрачной в сильных све- световых пучках благодаря эффекту насыщения, то прямо противоположная ситуация наблюдается в области оптической прозрачности среды. Здесь в результате много- многофотонного поглощения интенсивный свет может поглощаться гораздо сильнее, чем слабый. При больших плотностях излучения система с уровнями энергии е^ и е2 может поглотить в элементарном акте два фотона с частотами со^ и со2 такими, что Нсо^ + Ьх^2 = ^2 ~~ е\ (в частном случае со1 = со2 = \{е2 ~ е\)/^)- Вероятность поглощения двух фотонов пропорциональна произведению интенсивностей пучков с частотами со^ и а>2 (или квадрату интенсивности при со^ = со2). Возможно так- также одновременное поглощение трех фотонов и более. Многофотонное поглощение находит применение в нелинейной лазерной спектроскопии и позволяет получать информацию об энергетических уровнях квантовых систем, недоступную для тради- традиционных методов спектроскопии. К нелинейным эффектам поглощения примыкает и многофотонный фотоэф- фотоэффект. В экспериментах с фокусируемыми лазерными пучками достигаются столь высокие плотности световой энергии, что становятся доступными наблюдению про- процессы, в которых атом одновременно поглощает до 7-8 фотонов. В результате может произойти фотоионизация атома светом малой частоты, т. е. в интенсивных световых пучках исчезает красная граница фотоэффекта на отдельном атоме. Интересно, что Эйнштейн в работе 1905 г., содержащей вывод основного уравнения фотоэффекта,
10.1. Некогерентные нелинейные эффекты 449 не исключал принципиальной возможности процессов с участием более чем одного фотона. Рассмотренные выше нелинейные оптические эффекты относятся к числу некоге- некогерентных, так как в различных участках среды они развиваются в значительной мере независимо и не связаны с передачей нелинейного возбуждения от одной точки сре- среды к другой. Преимущество лазерного излучения для их наблюдения обусловлено его большой мощностью, а роль высокой пространственной когерентности сводится лишь к возможности фокусировки в область малого размера для получения больших плотностей энергии. Высокие монохроматичность и направленность лазерного излучения играют прин- принципиально важную роль для наблюдения когерентных нелинейных оптических эф- эффектов, таких как генерация оптических гармоник и параметрическое взаимодей- взаимодействие волн. Для них важны фазовые соотношения взаимодействующих волн и харак- характерна возможность получения в определенных условиях пространственного накоп- накопления нелинейных эффектов по мере распространения света в среде. Когерентным эффектам уделено основное внимание в дальнейшем изложении. Контрольные вопросы • Объясните возникновение эффекта насыщения, используя простейшую модель поглощаю- поглощающей среды. Чем объясняется замедление роста поглощаемой мощности при увеличении интенсивности? • Какую роль играют эффекты насыщения в лазерах? • В чем состоят основные отличия закономерностей многофотонного поглощения и много- многофотонного фотоэффекта от законов соответствующих однофотонных явлений? • Почему рассмотренные здесь нелинейные оптические эффекты называют некогерентными? Задачи 1. Атомы среды могут находиться в двух состояниях с энергиями ех и е2. Рассмотрите рас- распространение в такой среде света с частотой со, соответствующей переходу между этими уровнями (Нсо = е2 — ех). Покажите, что при больших интенсивностях света коэффициент поглощения уменьшается (насыщение). Решение. Пусть N — концентрация атомов, из них Л^ находятся на нижнем уровне (в основном состоянии), И2 — на верхнем. Изменение Л^ и Ы2 происходит из-за спон- спонтанных переходов с верхнего уровня со скоростью Л2^29 определяемой коэффициентом Эйнштейна Д21 — 1/г (Т — время жизни атома в возбужденном состоянии), и из-за выну- вынужденных переходов с поглощением и испусканием, вероятность которых пропорциональна интенсивности света. Учитывая все три процесса, скорость изменения Л^ представим в виде Учитывая, что В12 = В21 = В, и вводя для краткости обозначения А = Д21, ^ — 1В/с9 по- получаем уравнение ёЛ^/ё/ = АЫ2 — 1У(Л^ — М2), которое вместе с условием Л^ + Ы2 = N позволяет найти населенности Л^ и /У2. Для стационарного состояния (ёЛ^/с!/ = 0) реше- решение имеет вид 15 Зак 4498
450 10. Основы нелинейной оптики Поглощаемая в единичном объеме мощность Р и коэффициент поглощения а (см. (9.36), (9.37)) выражаются через разность населенностей Л/^1 — А^2 = NА|{А + 21У): Р = Нсо№(Ы1 -Ы2), а = ПсоВ(Ы1 - Ы2)/с. При малой интенсивности падающего излучения AУ — 1В/с <А) почти все атомы на- находятся в основном состоянии: Л^ « М, Ы2 ~ 0, а коэффициент поглощения не зависит от интенсивности и равен а0 = НсоВМ/с. С увеличением интенсивности происходит выравни- выравнивание населенностей: при 1У —> оо Л^ и М2 стремятся к N/2, а коэффициент поглощения а стремится к нулю (просветление среды). Если ввести значение интенсивности /нас, при котором а уменьшается вдвое, зависимость а от интенсивности принимает вид Поглощаемая мощность Р при увеличении интенсивности растет сначала линейно, затем этот рост замедляется и РA) при / —> оо стремится к конечному значению ^макс = Ткх)ИА/2 = /го>Л7Bг). Таким образом, при насыщении поглощаемая мощность определяется временем жизни г атома в возбужденном состоянии: среда поглощает столь- столько энергии из падающего света, сколько ее могут спонтанно излучить возбуждаемые атомы. 10.2. Материальные уравнения для нелинейных сред Действующее на молекулу или атом электрическое поле световой волны вызывает смещение зарядов (деформацию электронного облака), что приводит к появлению у молекулы индуцированного дипольного момента. Этот дипольный момент пропор- пропорционален напряженности поля волны при не слишком больших ее значениях. В таком приближении поляризуемость молекулы (или атома) и, следовательно, все оптиче- оптические характеристики среды не зависят от интенсивности световой волны. Но в ин- интенсивных лазерных световых пучках напряженность электрического поля нельзя считать пренебрежимо малой по сравнению с внутриатомными электрическими по- полями, и связь индуцированного дипольного момента с напряженностью поля уже не будет линейной. Чтобы составить представление о нелинейной поляризуемости молекулы, будем исходить из простой модели, лежащей в основе классической электронной теории дисперсии (см. п. 2.3). Согласно этой модели, смещение х(г) оптического электро- электрона из положения равновесия в поле световой волны ЕA) описывается уравнением тх = еЕ{г) + Р9 где Р — сила, удерживающая электрон в положении равновесия. В первом приближении, соответствующем линейной оптике, предполагается квази- квазиупругий характер этой силы, т.е. ее пропорциональность смещению из равновесия р — — кх, что отвечает квадратичной зависимости потенциальной энергии электро- электрона от его смещения Ц(х) = ^кх2.В следующих приближениях нужно учесть члены более высокой степени при разложении Ц(х) в ряд по степеням смещения из равно- равновесия: Ц(х) = I кх2 - \ тРх3 - 2 ш8хл 4-... A0.1) Коэффициенты /3 и 8, как и к, определяются строением молекулы. Нечетные степе- степени в разложении Ц(х) могут быть только у систем без центра симметрии. В такой
10.2. Материальные уравнения для нелинейных сред 451 усовершенствованной модели уравнение движения электрона в пренебрежении зату- затуханием принимает вид х +со$х = - Е{1) + Д*2 + 8хъ + ... , A0.2) тп где а>0 = у/к/ш — частота собственных гармонических колебаний при небольших амплитудах. Когда ангармонические члены Дх2, &с3,... имеют характер неболь- небольших поправок, уравнение A0.2) можно решать методом последовательных прибли- приближений. В нулевом приближении ангармонические члены отбрасываются и A0.2) сводится к основному уравнению B.30) классической теории дисперсии линей- линейной оптики. В монохроматическом поле ЕA) =Е0созш его решение имеет вид *0(/) = (е/т)Е0/(а>ц — со2)со$ш, что дает обычное выражение линейной поляри- поляризуемости а0 = (е2/те0)/((Оц - со2) (СИ) или а0 = (е2/т)/(со% - оJ) (СГС). Реше- Решение нулевого приближения д:0(/) подставляется в ангармонические члены уравне- уравнения A0.2) вместо лс(/), и в следующем приближении нужно решать линейное урав- уравнение, в котором правая часть, играющая роль вынуждающей силы, содержит кроме соз ш гармонические слагаемые на удвоенной и утроенной частотах: СО52 Ш — - A + СОЗ 2Ш), СО83 0I = - СОЗ Ш + - СОЗ ЗШ. Поэтому и частное решение неоднородного уравнения, описывающее установившие- установившиеся вынужденные колебания, кроме слагаемого д;0(/) на основной частоте со содержит слагаемые с частотами 2а), Ъсо,...: , ч е/т „ р\(е/т)Е0]2\ 1 соз2<»/ й)§ - оJ 2 10)$-со2] 1(о* со* - Bо)J $CJ} Совершающий колебания оптический электрон становится источником вторичных волн. Вынужденные колебания электрона под действием падающей волны на удвоен- удвоенной и утроенной частотах приводят к генерации в среде световых волн с частотами, кратными частоте падающей на среду волны. Это значит, что в сильных оптических полях нарушается один из основных принципов линейной оптики, заключающийся в неизменности частоты света при переходе из одной среды в другую. Считалось, что частота задается процессами в источнике света, а именно частотой колебаний оптического электрона в излучающем атоме, и не меняется при изменении усло- условий распространения. Но при выполнении определенных условий (см. п. 10.3) даже небольшой ангармонизм оптических электронов прозрачной среды позволяет полу- получить удвоение частоты проходящего света. Кроме того, кубичная ангармоничность (слагаемое &с3 в уравнении A0.2)) вызы- вызывает изменение поляризуемости молекулы на основной частоте со. Объединяя члены с созш в A0.3), находим, что эта поляризуемость равна ^ И|тё)Г <104>
452 10. Основы нелинейной оптики Таким образом, в поляризуемости молекулы появляется член, пропорциональный интенсивности световой волны. Он приводит к зависимости показателя преломления от интенсивности волны, проявляющейся в эффектах самовоздействия. Если ангармонический осциллятор подвержен одновременному действию двух мо- монохроматических полей с частотами сох и ^2, то в спектре его вынужденных колеба- колебаний помимо основных и кратных частот присутствуют комбинационные (суммарные и разностные) частоты. Этим объясняется эффект взаимодействия волн в нелинейной среде, ведущий к генерации волн на суммарной и разностной частотах. Вынужденное движение электронов среды в поле световой волны макроскопиче- макроскопически проявляется в возникновении поляризованности среды, которая складывается из индуцированных электрическим полем волны дипольных моментов отдельных моле- молекул. Из-за ангармонических членов в потенциальной энергии электрона A0.1) эти дипольные моменты помимо линейного члена, пропорционального напряженности электрического поля световой волны, содержат члены, пропорциональные более вы- высоким степеням напряженности поля. Поэтому в сильных световых полях материаль- материальное уравнение, связывающее поляризованность среды с напряженностью электричес- электрического поля, становится нелинейным. Для однородной анизотропной среды такое мате- материальное уравнение в общем случае можно записать в виде СГС: />,. = ^Х|*Я* + ][>шад + к к,1 к,1,т A0.5) СИ: Р1 = е0 (^2 %1кЕк + ^ ХшЕкЕ1 + ^2 Ък\тЕкЕ1Ет + •••)• к кЛ к,1,т где г,&,/,/п пробегают значения декартовых индексов х,у,1. Тензор второго ранга XIк представляет собой обычную, или линейную, восприимчивость среды (см. п. 2.2), а тензоры высших рангов %/*/»%/*/,„> называются соответственно квадра- квадратичной и кубичной восприимчивостями. Их значения могут быть выражены через соответствующие физические характеристики среды (нелинейные поляризуемости молекул и концентрацию молекул). Но чтобы не ограничивать применимость матери- материального уравнения A0.5) рамками выбранной модели среды, линейную и нелинейные восприимчивости можно рассматривать как феноменологические параметры среды. Поле Е в A0.5) предполагается монохроматическим, а восприимчивости %^, %^,... зависят от его частоты со. Выше на примере простой классической модели было показано, что нелиней- нелинейные восприимчивости появляются за счет ангармонических членов в потенциальной энергии оптического электрона. Электронный механизм возникновения нелинейно- нелинейности преобладает в твердых телах. Но зависимость оптических характеристик среды от интенсивности световой волны может быть обусловлена не только влиянием поля волны на поляризуемость молекулы (ее внутренние степени свободы), но и воздей- воздействием на концентрацию и ориентацию молекул, т.е. на внешние степени свободы. Эти факторы играют главную роль в жидкостях. Одна из причин локальных изменений концентрации молекул в световой волне связана с электрострикцией. Электрическое поле в диэлектрике создает всесторон- всестороннее давление, пропорциональное квадрату напряженности поля. В результате сжатия
10.2. Материальные уравнения для нелинейных сред 453 возникают локальные изменения плотности среды (т. е. концентрации молекул), а тем самым и ее оптических характеристик. Если молекулы среды анизотропны, но при отсутствии внешнего поля все ори- ориентации молекул равновероятны (что характерно для газов и жидкостей), то среда в целом изотропна. При большой интенсивности излучения электрическое поле вол- волны оказывает ориентирующее действие на анизотропные молекулы (высокочастот- (высокочастотный эффект Керра, см. п. 4.5). В результате среда оказывается двоякопреломляющей, причем добавки к показателям преломления по и пе пропорциональны интенсивности света. Феноменологическое материальное уравнение A0.5) учитывает все возможные механизмы возникновения нелинейных восприимчивостей. Однако следует иметь в виду, что оно справедливо только в установившемся режиме, т.е. не описывает переходных процессов. В то же время разные причины зависимости оптических ха- характеристик среды от интенсивности обладают разной степенью инерционности. При электрострикции время установления стационарного распределения плотности по порядку величины равно отношению размера а поперечного сечения светового пучка к скорости и3в упругих волн (звука). При а ~ 1 мм и узв ~ 1 км/с это время поряд- порядка 10~6с. Инерционность ориентационного механизма возникновения нелинейной восприимчивости определяется временем поворота молекулы, равным по порядку величины 10~~12с. Поэтому в случае коротких лазерных импульсов (короче 10~6с) основной вклад дает эффект Керра, тогда как в импульсах большой длительности вклад электрострикции в некоторых веществах становится преобладающим. В анизотропной среде направление вектора Р в общем случае не совпадает с на- направлением напряженности Е электрического поля. Поэтому материальное уравне- уравнение A0.5) имеет тензорный характер. Если среда обладает центром симметрии, то в A0.5) все тензоры % нечетных рангов обращаются в нуль. Так будет, например, в изотропной среде или в кубическом кристалле. Поэтому в них невозможны нели- нелинейные эффекты, обусловленные квадратичной восприимчивостью %т, например ге- генерация второй гармоники. Тем не менее при качественном изучении таких явлений можно воспользоваться упрощенной изотропной моделью нелинейной среды, считая поляризованность Р параллельной напряженности Е и полагая в материальном урав- уравнении A0.5) восприимчивости всех рангов скалярами: сгс: р = % х2%3; A0.6) СИ: Р = ео(ХЕ + %2Я Е + ХзЕ2Е + ...). Используя эту упрощенную модель, следует помнить, что в кристалле в каждом данном направлении могут распространяться волны только с определенными поля- поляризациями. В материальном уравнении A0.6) восприимчивости #, #2» #з» Для каждой из волн имеют свои значения. Остановимся кратко на эффектах самовоздействия, возникающих при распростра- распространении в нелинейной среде интенсивного светового пучка, имеющего ограниченное поперечное сечение. Будем рассматривать только ту часть электромагнитного поля в среде, которая изменяется с частотой со падающей световой волны. В феноме- феноменологическом материальном уравнении A0.6) вклад в поляризованность среды на
454 10. Основы нелинейной оптики частоте о) дают первый и третий члены, содержащие линейную и кубичную вос- восприимчивости. Наличие члена с %3 в поляризованности на частоте со эквивалентно появлению в диэлектрической проницаемости е(о)) и, следовательно, в показателе преломления п(со) слагаемого, пропорционального квадрату амплитуды Ео, т.е. ин- интенсивности световой волны: п(со) =по + п2Е$, A0.7) где п0 — показатель преломления, фигурирующий в линейной оптике, т.е. при ма- малых интенсивностях света, а п2(а)) — зависящий от свойств среды коэффициент, выражающийся через кубичную восприимчивость Ху Из A0.7) следует, что ограни- ограниченный интенсивный пучок света делает среду оптически неоднородной. В пределах пучка, где Ео ф 0, показатель преломления будет иным, чем вне его, где Ео = 0. Как известно (см. п. 7.1), луч в неоднородной среде отклоняется от прямолинейно- прямолинейного направления в сторону больших значений показателя преломления. В результате возникает явление самофокусировки (при п2 > 0) и дефокусировки (при п2 < 0), предсказанное теоретически Г. А. Аскарьяном в 1962 г. и впервые наблюдавшееся Н.Ф. Пилипецким и А. Р. Рустамовым в 1965 г. Сущность явления самофокусировки проще всего понять, рассматривая вхо- входящий в однородную среду пучок с одинаковой по всему сечению амплитудой (рис. 10.1). Тогда в среде под воздействием пучка образуется как бы стержень из вещества с более высоким (при п2 > 0) коэффициентом преломления. Лучи, рас- распространяющиеся внутри такого «стержня» -^ п ^г -*г ^ под небольшим углом к его оси, испытыва- *- ^* ют полное отражение. Предельный угол лу- луча с осью пучка #0, при котором происхо- дит полное отражение, определяется соот- ношением (п0 + п2Е%)соз0о = по. При ма- 0 2%о о ^ по " ^г -&" лых значениях этого угла соб#0 « 1 — ^ Рис. 10.1. К оценке порога самофокусировки поэтому в$ « 2п2Е$/п0. Наклоненные к оси пучка лучи возникают в результате дифрак- дифракции при ограничении диафрагмой его попе- поперечных размеров, причем максимальный угол отклонения 0диф по порядку величи- величины равен Я/а =Ао/(иоа), где а — поперечный размер пучка, Яо — длина волны в вакууме. При 0диф > #0 пучок света по мере распространения расширяется из- за дифракции, но это происходит медленнее, чем в линейной среде. При 0, = в0 полное отражение полностью компенсирует дифракцию и площадь сечения пучка остается неизменной, т.е. пучок создает в среде своеобразный световод, в котором свет распространяется без дифракционной расходимости. Такой режим называется самоканализацией светового пучка. Приравнивая выражения для 0Д, и 0О, нахо- находим пороговое значение амплитуды #отш = ^о/(^поп2а2)* ОТС1°Да по известному значению п2 для данной нелинейной среды можно оценить минимальную мощность светового пучка, необходимую для наблюдения этого явления. В случае сероуглеро- сероуглерода и рубинового лазера (Яо = 694,3 нм) Рт{п « 20 кВт. Для некоторых сортов стекла Рт4п ~ 1 Вт, что позволяет наблюдать явление даже в малоинтенсивных пучках ла- лазеров непрерывного действия.
10.2. Материальные уравнения для нелинейных сред 455 В реальных световых пучках интенсивность и, следовательно, показатель прелом- преломления возрастают от краев к оси пучка. Поэтому при превышении пороговой мощ- мощности лучи искривляются в сторону оси и концентрируются в области большей ин- интенсивности, т. е. нелинейная среда ведет себя подобно объемной собирающей линзе, фокус которой находится на некотором расстоянии от входа пучка в среду, пропор- пропорциональном начальному радиусу пучка и обратно пропорциональном квадратному корню из его интенсивности. По мере приближения к фокусу лучи все более искрив- искривляются, т. е. самофокусировка имеет лавинообразный характер. В мощном световом пучке вслед за первым фокусом может появиться ряд последующих, причем с ро- ростом мощности их число увеличивается и они приближаются к месту входа пучка в нелинейную среду. В случае коротких световых импульсов фокусы могут двигаться с околосветовыми скоростями. О уравнения Максвелла B.3)-B.4), описывающие распространение света в веще- веществе, поляризованность Р среды входит в качестве источников в правую часть. Когда в материальном уравнении A0.6), связывающем Р с Е, квадратичные и кубичные по степеням Е члены существенны, подстановка Р в уравнения Максвелла приводит к системе нелинейных уравнений для векторов Е и В световой волны. Нелинейность уравнений означает нарушение принципа суперпозиции, согласно которому распро- распространение световой волны в среде никак не сказывается на распространении других световых волн. Таким образом, справедливость принципа суперпозиции для света в веществе ограничивается приближением линейной оптики. Для описания нелинейных эффектов удобно разделить поляризованность среды на линейную и нелинейную части: Р = Рл Н- Р™1. Влияние обусловленных линейной частью Р зарядов и токов (т.е. источников полей в уравнениях Максвелла) удобно учесть, вводя вектор электрической индукции СГС: Б = Е + 4яРл; СИ: В = который связан с напряженностью Е электрического поля линейным материальным уравнением B.13): СГС: В = ф>)Е, ф>) = 1+4*г*(й>); СИ: Б = е0е{(о) Е, е(а>) = 1 + %{(о), Входящая в A0.8) диэлектрическая проницаемость выражается только через ли- линейную восприимчивость, т. е. имеет тот же смысл, что и в линейной оптике. Если в линейной оптике таким путем для векторов Е, Б и В в среде получалась система однородных уравнений B.6)-B.9), аналогичная уравнениям поля в вакууме, то те- теперь справа остаются члены, связанные с нелинейной частью поляризованности: V • В = -4яУ • Р™, с Ы У • В = 0, + с "эТ ~ с д( ' СИ: V 1 еос2 V-! Ух Ух Е + В- эв ¦ РШ|, д1 = 0. арнл ' дг ' A0.9) A0.10) A0.11) A0.12)
456 10. Основы нелинейной оптики Эту систему, как и уравнение A0.2) для ангармонического осциллятора, мож- можно решать методом последовательных приближений. В нулевом приближении пра- правые части отбрасываются, и A0.9)—A0.12) превращаются в обычные однородные уравнения линейной оптики. Возможное их решение — плоская монохроматиче- монохроматическая волна Е(г, {) = Е0соа(кг — ш)9 волновой вектор которой удовлетворяет соот- соотношению B.23): к2 = е(о))(о2/с2. Для нахождения следующего приближения в пра- правые части уравнений A0.9) и A0.10) подставим нелинейную поляризованность рнл = ео(х2ЕЪ + ХЪЕЧ + ...) (СИ) или Рнл = %2ЕЕ + ХзЕ2Е + ... (СГС), в кото- которой Е(г, I) заменено выражением из нулевого приближения. В результате получа- получаются линейные, но неоднородные уравнения с известными правыми частями. Эти правые части можно рассматривать как дополнительные источники волн, обуслов- обусловленные нелинейной поляризованностью среды. Каждый элемент объема среды йУ излучает как осциллирующий диполь с дипольным моментом Рнлс1К. Если в ну- нулевом приближении есть только одна монохроматическая волна с частотой со, то эти осцилляции происходят на частотах со, 2со, Зсо,... Соответствующие решения уравнений A0.9)—A0.12) нужно искать в виде распространяющихся в среде волн с такими же частотами. При этом для волны каждой частоты в левых частях урав- уравнений A0.9)—A0.10) при переходе от Б к Е следует брать значение диэлектрической проницаемости е(со) при той же частоте, т.е. е(а))9 еBсо)9 гCа>),... Контрольные вопросы • Как нужно видоизменить модель, используемую в классической электронной теории дис- дисперсии, чтобы объяснить нелинейную поляризуемость молекул? • Объясните с помощью модели ангармонического осциллятора возникновение вторичных волн с кратными частотами. • Какими причинами может быть обусловлена зависимость показателя преломления от ин- интенсивности света? • Какой вид имеет феноменологическое материальное уравнение для нелинейной среды? • В чем заключается метод последовательных приближений для решения уравнений Макс- Максвелла в случае нелинейной среды? 10.3. Генерация второй гармоники Рассмотрим нелинейные эффекты, обусловленные квадратичной восприимчиво- восприимчивостью %2 в (Ю.6). В поле монохроматической волны с частотой со нелинейная часть поляризованности имеет вид СГС: Рнл = х2Е0Щ со*2(кг -*>') = 5 Х2Е°Е° + 2 Х2Е°Е° °082(кГ " Ш)* СИ: Рнл = еох2ЕоЕо со82(кг - ш) = A0.13) ^Е + 2 г0%2^0Е0 соз2(кг - ш).
10.3. Генерация второй гармоники 457 Первый член здесь не зависит от времени. Это значит, что в нелинейной среде с квадратичной восприимчивостью при прохождении через нее интенсивной световой волны возникает статическая поляризованность, создающая постоянное однородное электрическое поле, как в плоском конденсаторе. Такой эффект получил название оптического детектирования, так как он вполне аналогичен выпрямлению пере- переменного электрического тока и находит применение в детекторах мощных световых пучков. В детекторе «проходного» типа измеряется напряжение на обкладках кон- конденсатора, нанесенных на боковые грани нелинейного кристалла, возникающее при прохождении сквозь него лазерного импульса. Преимущество такого детектора за- заключается в том, что кристалл почти не поглощает измеряемый пучок света. Второй член в правой части A0.13) изменяется во времени с удвоенной часто- частотой основной волны: со2 = 2со. С ним связана генерация второй гармоники в нели- нелинейной среде. Представим в нем со8 2(кг — ш) как вещественную часть комплекс- комплексного выражения ехр[2/(кг — ш)] и подставим в правые части уравнений Максвел- Максвелла A0.9)—A0.10). Частное решение этих уравнений, соответствующее вынужден- вынужденным колебаниям на частоте 2а>, можно искать в виде Е(/) = Е^ ехр[2/(кг - ш)]9 В(/) = В1 ехр[2/(кг — ш)}. Используя также материальное уравнение A0.8), из урав- уравнений Максвелла получаем: СГС: кЕ1=0, СИ: к-Е^О, A0.14) к х В! + еBа)) —Ех= с\ хЪх+ еBсо) соЕ] = к к В, хЕ = --Х2о>Е0Е0, = 0, , - о)Ъ, = 0. A0.15) A0.16) A0.17) к • Вх = 0, кхЕ, --В, =0; с Из A0.14) и A0.16) видно, что векторы Е] и Вх ортогональны вектору к, а из A0.17) — что они взаимно перпендикулярны, причем векторы Ер Вр и к об- образуют правую тройку, как орты 1,^ к. Выразим с помощью A0.17) В1 через Ех и подставим в уравнение A0.15): СГС: к х (к х Ех) + еBа>) ^- Е, = -2п%2 ^- Е0Е0; С С A0.18) СИ: с\ х (к х Е,) + еB(о)(о% = -^2^2Е0Е0; Преобразуем двойное векторное произведение к х (к х Е^ = к(к • Е^ - к2Ех и учтем, что к • Е1 =0, а квадрат волнового вектора волны нулевого приближения удовлетворяет соотношению к2 = е{со)со2/с2. Тогда из A0.18) получим амплитуду напряженности Е1 электрического поля вынужденной волны на удвоенной частоте: СГС: Е,=2я *2*°ЕД • СИ: ЕХ=\-^Щ—. A0.19) 1 е((о)-сBо)) ' 2 е((о) - еB(о) '
458 10. Основы нелинейной оптики Выберем ось г вдоль направления входящей в нелинейную среду интенсивной волны с частотой со. На границе среды (при г = 0) амплитуда второй гармоники равна нулю. Чтобы удовлетворить этому условию, к найденному выше частному решению нужно прибавить общее решение однородной системы уравнений, соответ- соответствующей A0.9)—A0.12). Такое решение представляет собой свободно распространя- распространяющуюся в среде волну Е(г, г) = Е2 соз(к2г — сх>2г) с частотой а>2 = 2со и волновым вектором к2, удовлетворяющим соотношению к\ = е(со2) со2/с2. Ее направление рас- распространения и амплитуду Е2 следует выбрать так, чтобы на всей плоскости г = 0 суммарная напряженность поля вынужденной и свободной волн частоты 2со обраща- обращалась в нуль. В результате для второй гармоники получаем следующее выражение: СГС: Е(г, $) = 2я , %^\ ч [совB*г - 2сог) - со*(к2г - 2ш)]; €{(О) — еB(о) 1 -1 A0.20) СИ: Е(г ./) = | ^ ^ ^ Здесь первое слагаемое представляет собой вынужденную волну, фазовая скорость которой совпадает со скоростью распространения поляризованности, т. е. со скорос- скоростью у{ исходной волны с частотой со: ь^ = с/п((о). Второе слагаемое описывает сво- свободное распространение в среде вторичных волн с частотой 2а>, которое происходит с иной фазовой скоростью у2 = с/пBсо). Сложение волн одинаковой частоты 2со, но распространяющихся с различными фазовыми скоростями, дает волну A0.20), амплитуда напряженности которой периодически зависит от г, т.е. от глубины про- проникновения в нелинейную среду: A0.21) Зависимость интенсивности второй гармоники от г показана на рис. 10.2. Ин- Интенсивность обращается в нуль при (к/2 — к) г = тл, где т — целое число. В таких точках вторичные волны с частотой 2о>, испущенные разными точка- точками среды, гасят друг друга в ре- зультате интерференции. Так как к2/2 -к = [пB(о) - п(а))] со/с, то это условие можно записать в ви- виде г = 2т/ког, где расстояние /ког = ког ког 0 2/ког 4/ког Ь г ^ (Я/4)/[лBй>) - п(а))] называют та -л<> г, о когерентной длиной. На интервале Рис. 10.2. Зависимость интенсивности второй гармо- л / ж ники от глубины проникновения в нелинейную среду от ^ Д° *ког фазовые соотношения таковы, что энергия от исходной волны передается второй гармони- гармонике, а на интервале от /ког до 2/ког возвращается в исходную волну. Этот процесс периодически повторяется по мере распространения исходной волны в нелинейной среде.
10.3. Генерация второй гармоники 459 Впервые генерация второй гармоники была осуществлена Франкеном с сотрудника- сотрудниками в 1961 г. при прохождении импульса излучения рубинового лазера (А = 694 нм) через пластинку кварца. Излучение второй гармоники (А = 347 нм) соответствует ближней ультрафиолетовой области. Измерения показали, что ее интенсивность ис- испытывает осцилляции по мере наклона пластинки к оси лазерного пучка. Эти ос- осцилляции объясняются изменением длины пути пучка в пластинке: когда эта длина равна нечетному числу длин /К0Г5 интенсивность выходящей из пластинки второй гармоники максимальна (см. рис. 10.2). Полученное из периода осцилляции значе- значение когерентной длины хорошо согласуется с известными значениями показателя преломления кварца для А = 694 нм и А = 347 нм. Однако коэффициент преобразования энергии основного пучка в энергию второй гармоники в описываемых опытах был чрезвычайно мал (~ 10~8). Для кварца в слу- случае А = 694нм пB(о) - п(со) = 0,025 и /ког = 10А = 0,7 • 10~2мм, т.е. эффективное расстояние, на котором энергия основного пучка передается второй гармонике, оказывается очень малым — всего лишь несколько длин волн. Эту трудность в 1962 г. преодолели Джордмейн, Мейкер и Терхьюн, предложив простой и весьма остроум- остроумный метод согласования показателей преломления для основного пучка и второй гармоники. Когда показатели преломления на частотах со и 2а> одинаковы, когерентная дли- длина /ког обращается в бесконечность. В этом случае на протяжении всего пути в нели- нелинейной среде наблюдается переход энергии от исходной волны ко второй гармонике. Так происходит потому, что при пBсо) = п(со), т.е. при к2 = 2к, исходная волна, со- создающая нелинейную поляризованность среды на частоте 2со, и испускаемые средой на этой частоте вторичные волны распространяются с одинаковой фазовой скоростью и фазовые соотношения между ними всюду одинаковы. Вся нелинейная среда дей- действует как объемная сфазированная решетка элементарных диполей с максимумом излучения в направлении распространения. Условие пB(о) = п(со) или еB(о) = е((о) называется фазовым или пространственным синхронизмом исходной волны и ее второй гармоники. При его выполнении выражение A0.21) становится неопределен- неопределенным. Чтобы раскрыть неопределенность при еB(о) = е((о)9 преобразуем в нем знаме- знаменатель: еB(о) - е((о) = п2Bео) - п2(со) = [пBоо) + п(а>)] [пBоо) - п((о)] « 2пАп, где Ап = пBсо) — п{(о). Учитывая, что (к2 — 2к)/2 = Апсо/с, получаем из A0.21) следу- следующее выражение для интенсивности второй гармоники: > « = ДА A0.22) При выполнении условия фазового синхронизма и = 0 для всех г и отношение (зтм)/м принимает максимальное значение, равное 1. Происходит пространственное накопление эффекта обмена энергией, и интенсивность второй гармоники пропор- пропорциональна квадрату толщины нелинейной среды. Конечно, ее энергия черпается из исходной волны, и формула A0.22) верна лишь для не слишком больших значений г, пока /2 <С /0- В противном случае метод последовательных приближений, которым она получена, становится неприменимым, так как в нем интенсивность исходной волны полагается заданной и неизменной. Но вывод о том, что для эффективного преобразования энергии исходной волны в энергию второй гармоники необходимо выполнение условия фазового синхронизма, остается, конечно, в силе.
460 10. Основы нелинейной оптики Для изотропной среды выполнение условия п{2(о) — п((о) невозможно, так как в об- области ее прозрачности показатель преломления монотонно изменяется с частотой (нормальная дисперсия). Однако фазовый синхронизм можно осуществить между обыкновенной и необыкновенной волнами в некоторых кристаллах. На рис. 10.3 приведены сечения поверхностей, изображающих зависимость показателей прелом- преломления по и пе от направления волновой нормали для отрицательного одноосного кристалла дигидрофосфата калия КН2РО4 (КХ)Р). Сплошные линии соответству- соответствуют частоте со, пунктирные — удвоенной частоте 2а). ел- п пеB(о) ел п Видно, что поверхность по((о) пересекается с по- \верхностью пеBсо). Поэтому для обыкновенной вол- волны с частотой со и необыкновенной волны с часто- той 2&>, распространяющихся под определенным уг- углом в к оптической оси, соответствующим направле- направлению из центра на точку пересечения по{со) и пеB(о), выполняется условие пространственного синхрониз- синхронизма. Несмотря на различное направление поляриза- поляризации этих волн, оказывается возможным их нелиней- нелинейное взаимодействие, так как в анизотропной среде Рис. 10.3. Сечение поверхностей квадратичная восприимчивость представляет собой показателей преломления по и пе тензор %[к1. Электрическое поле исходной обыкно- в кристалле КИР и направление вешюй во напряженность которого направлена фазового синхронизма г г г перпендикулярно оптической оси, вызывает смеще- смещение зарядов на удвоенной частоте и в других направ- направлениях, порождая волну второй гармоники, поляризованную в плоскости главного сечения. При правильном выборе направления исходной волны таким путем удает- удается ббльшую часть ее энергии перевести во вторую гармонику. Отклонение от на- направления синхронизма приводит к уменьшению интенсивности второй гармоники в соответствии с множителем (зт2и)/и2 в A0.22). Для инфракрасного излучения гелий-неонового лазера (А = 1,15 мкм) в кристалле КОР направление синхронизма образует угол в = 41,5° с оптической осью. Интенсивность второй гармоники спада- спадает почти до нуля при отклонении направления исходной волны в кристалле от угла в всего на 3'. Генерация второй гармоники в нелинейных кристаллах используется для преобра- преобразования инфракрасного излучения мощных лазеров в видимое. Например, вторая гармоника лазера на иттрий-алюминиевом гранате, активированном неодимом, пред- представляет собой зеленый свет, весьма удобный для разнообразных оптических ис- исследований. При выполнении условия фазового синхронизма удается получить к.п.д. преобразования около 20—30%. Однако более эффективными оказались системы, в которых нелинейный кристалл помещается внутри лазерного резонатора. Как вид- видно из A0.22), интенсивность второй гармоники пропорциональна квадрату интенсив- интенсивности исходного излучения, которое внутри резонатора имеет значительно большую мощность, чем на выходе лазера. Зеркала резонатора с многослойными диэлектриче- диэлектрическими покрытиями обеспечивают очень высокий коэффициент отражения на основ- основной частоте (99,8-99,9%) и пропускание свыше 90% для второй гармоники. На торцовые поверхности нелинейного кристалла наносится просветляющее покрытие, препятствующее отражению основного излучения. Кристалл преобразует энергию
10.4. Параметрическое преобразование частоты 461 основного пучка во вторую гармонику, которая практически полностью покидает ре- резонатор. При оптимальном согласовании оптических элементов можно обеспечить выходное излучение лазера только на частоте второй гармоники. Генерация второй гармоники с точки зрения квантовой теории представляет со- собой процесс с участием трех фотонов: два фотона исходного излучения частотой со превращаются в один фотон второй гармоники. Удвоению частоты со2 = 2@ соот- соответствует сохранение энергии в элементарном акте, так как энергия фотона второй гармоники НаJ равна суммарной энергии двух исходных фотонов 2Нсо. Условию про- пространственного синхронизма к2 = 2к соответствует сохранение импульса: Ьк2 = 2Ьк. Генерацию третьей гармоники в нелинейной среде можно получить за счет кубич- кубичной восприимчивости #з в A0.6). Исходное излучение с частотой со создает в нели- нелинейной среде поляризованность, осциллирующую на утроенной частоте 3@. Эле- Элементарные вторичные волны третьей гармоники, испускаемые разными элементами объема среды, будут иметь всюду одинаковое фазовое соотношение с возбуждающей их волной поляризованности при совпадении показателей преломления на часто- частотах со и За). Дисперсия среды на интервале (<у, Зсо) еще больше, чем в случае вто- второй гармоники. Это ограничивает выбор кристаллов, в которых возможно выполне- выполнение условия пространственного синхронизма пC(о) — п((о), так как двупреломление должно быть настолько большим, чтобы поверхности по(со) и пеCсо) еще пересека- пересекались. Но главная трудность связана с малым значением кубичной восприимчивости, что вынуждает применять очень интенсивное исходное излучение. Интенсивность третьей гармоники пропорциональна кубу его интенсивности. Контрольные вопросы • В чем заключается эффект оптического детектирования? • Как изменяется интенсивность второй гармоники в зависимости от расстояния, пройденно- пройденного волной в нелинейной среде? • Что называется когерентной длиной и каков ее физический смысл? • Какое условие должно выполняться для эффективной передачи энергии исходного пучка во вторую гармонику? • Как можно обеспечить пространственный синхронизм исходной волны и второй гармоники? • В чем преимущество внутрирезонаторного метода удвоения частоты лазерного излучения? 10.4. Параметрическое преобразование частоты В п. 10.2 говорилось о том, что при распространении в среде двух монохромати- монохроматических волн с частотами со1 и со2 в спектре вынужденных колебаний оптических электронов из-за квадратичного ангармонизма помимо основных и кратных частот появляются суммарная и разностная частоты. Такое нелинейное взаимодействие волн можно трактовать как следствие изменения оптических параметров среды под дей- действием сильного поля одной из волн на ее основной частоте со^. В результате воз- возникает модуляция с частотой со1 фазы второй волны, имеющей частоту (о2, что эквивалентно появлению волн на боковых частотах (о^ + со2 и а)^ — со2. Эти про- процессы аналогичны рассмотренной в п. 10.3 генерации второй гармоники. Они также
462 10. Основы нелинейной оптики обусловлены квадратичной восприимчивостью среды в A0.6), которая может быть отлична от нуля в кристаллах без центра симметрии. По существу генерация второй гармоники представляет собой частный случай процесса генерации суммарной часто- частоты, когда складываемые частоты сох и а>2 одинаковы и берутся от одного источника. Практический интерес процессов генерации суммарных и разностных частот обу- обусловлен тем, что, смешивая излучение двух лазеров в нелинейной среде, можно получить когерентное излучение в области спектра, отличной от исходной, т. е. рас- расширить спектральный диапазон доступных источников когерентного излучения. Дру- Другое важное применение процесса сложения частот связано с возможностью созда- создания чувствительных и малоинерционных детекторов инфракрасного излучения. Если в видимой области (Я « 500 нм) фотоумножители позволяют регистрировать потоки порядка 100 фотонов в 1 с, то в области ~ Юмкм для надежной регистрации суще- существующими приемниками необходимы потоки порядка 108 фотонов в 1 с. Поэтому возможность преобразования инфракрасного излучения в видимое даже с относи- относительно невысокой эффективностью представляется чрезвычайно привлекательной. Преобразование «вверх» частоты о)х сигнальной волны от слабого источника возможно при ее взаимодействии в нелинейной среде с сильной «волной на- накачки» с частотой (о2. Нелинейная поляризованность среды ^"л = ]С*/Хш^м х х соз^г — аI1)Е21 со$(к2г — оJ1) содержит слагаемое на частоте (о^—(ох-\-оJ. Полагая для простоты направления напряженностей электрических полей обеих волн одинаковыми, это слагаемое запишем в виде Рнл = 2%2^1^2СО8[(^1 +^2)г~ -(а)} + (О2){\ (СГС; в СИ в формулах для Рнл следует добавить множитель е0). В ре- результате в среде возникает вторичная волна с суммарной частотой со^ = (о^ + а>2. Интенсивность этой волны нарастает по мере распространения, если ее фазовая скорость и направление такие же, как у возбуждающей ее волны поляризованно- сти Рнл. Другими словами, для эффективного перехода энергии сигнальной волны и волны накачки к волне с суммарной частотой <у3 должно выполняться следую- следующее векторное условие пространственного синхронизма: к3 = к1 4- к2. В изотропной прозрачной среде в области нормальной дисперсии удовлетворить этому условию од- одновременно с условием а)^ = (о{ + а>2 невозможно (см. задачу 1). Пространственный синхронизм, как и в случае генерации второй гармоники, можно получить в некото- некоторых кристаллах, если использовать обыкновенные и необыкновенные волны. Условия синхронизма для разных процессов (удвоения частоты, генерации суммарной и раз- разностной частот) не совпадают, что позволяет реализовать на опыте какой-либо один нелинейный процесс при полном подавлении остальных. Процесс параметрического взаимодействия в нелинейной среде трех волн, частбты которых связаны соотношением со1 4- (о2 = со^, можно использовать для усиления слабой волны с частотой со^ или а>2 за счет энергии мощной волны накачки с боль- большей частотой соз (рис. 10.4). Принцип параметрического усиления света был пред- предложен С. А. Ахмановым и Р. В. Хохловым в 1962 г. и осуществлен Джордмейном и Миллером в 1965 г. Взаимодействие сильной волны накачки с частотой со^ и слабой сигнальной вол- волны с частотой &>! за счет квадратичной восприимчивости %2 приводит к появлению в нелинейной поляризованности осцилляции на разностной частоте со2 = о)^ — (о^. При выполнении векторного условия пространственного синхронизма к2 = к3 + к!
10.4. Параметрическое преобразование частоты 463 распространяющиеся в направлении вектора к2 вторичные волны частотой со2, ис- испускаемые во всем объеме нелинейной среды, складываются синфазно. В результате энергия сильной волны накачки с частотой со^ эффективно передается «холостой» волне с разностной частотой со2 = со^ — со] и сигнальной волне с частотой о>^9 вызы- вызывая ее усиление. К1)Р ли *- '. У' у '/' '' '/ ' —и ^ Рис. 10.4. Схема параметрического генератора света: 1 — лазер накачки с удвоителем частоты; 2 — нелинейный кристалл в оптическом резонаторе На квантовом языке параметрическое усиление можно рассматривать как процесс вынужденного распада фотона волны накачки с энергией Нсо^ на два фотона с энер- энергиями Ыох и Нсо2. Поэтому при прохождении некоторого расстояния в нелинейной среде увеличение плотности потока фотонов в сигнальной и холостой волнах одина- одинаково и равно уменьшению плотности потока фотонов волны накачки. Соотношение соз = (ох +со2 выражает закон сохранения энергии в таком процессе. Условие пространственного синхронизма к3 = к1 + к2 можно рассматривать как закон сохранения импульса Як3 = /1к1 + Ш2 для элементарного акта распада фотона волны накачки. Наряду с рассмотренным выше вынужденным процессом распада фотона волны накачки на два фотона, вероятность которого пропорциональна интенсивности сиг- сигнальной волны, в нелинейной среде возможен и соответствующий спонтанный про- процесс распада, происходящий и при отсутствии сигнальной волны. Такое явление было обнаружено на опыте в 1967 г. и называется параметрической люминесценцией или параметрическим рассеянием. Процессы параметрического усиления и люминесцен- люминесценции находятся в такой же связи, как вынужденное и спонтанное испускание фотона квантовой системой при переходе из возбужденного состояния в основное. Введением положительной обратной связи параметрический усилитель можно пре- превратить в генератор. Для этого нелинейную среду, как в лазерах, помещают в опти- оптический резонатор, образованный двумя зеркалами (см. рис. 10.4). Нелинейный кри- кристалл ориентируется так, что для волн, распространяющихся в одном направлении перпендикулярно зеркалам, выполняется условие пространственного синхронизма к^ -Ь к2 = Щ либо к^ -Ь к| = ку Зеркала М1 и М2 имеют высокие коэффициенты отражения для частот а)х и со29 так что сигнальная и холостая частоты а)х и аJ соот- соответствуют высокодобротным модам резонатора. Зеркало М1 одновременно должно быть прозрачно для частоты со^ излучения накачки. При достаточно большой мощ- мощности волны накачки параметрическое усиление одной из волн о>х или со2 на длине нелинейного кристалла превысит суммарные потери за проход, возникающие из-за неполного отражения от зеркал, поглощения, рассеяния и других причин. Тогда про- происходит самовозбуждение генератора (с затравкой из-за параметрической люминес- люминесценции) и возникает когерентное излучение на частотах а)х и со2.
464 10. Основы нелинейной оптики В перпендикулярном зеркалам резонатора направлении, соответствующем его максимальной добротности, условие пространственного синхронизма к3 = к! + к2 при фиксированной частоте накачки &>3 выполняется для вполне определенных час- частот сох и со2, связанных соотношением о>1 + со2 = о)у На них и происходит парамет- параметрическая генерация. При изменении ориентации кристалла или его температуры или при наложении постоянного электрического поля частоты со^ и со2 изменяются. Эти обстоятельства можно использовать для плавной перестройки частоты параметри- параметрического генератора. Полоса перестройки частот генерации определяется диапазоном частот, для которого в данном нелинейном кристалле возможен пространственный синхронизм. Весьма жесткие требования предъявляются к источнику накачки. Его из- излучение должно иметь высокую монохроматичность и малую угловую расходимость. Недостаточная временная и пространственная когерентность излучения накачки на- нарушает условие пространственного синхронизма и поэтому увеличивает пороговую мощность и снижает к.п.д. Обычно в качестве излучения накачки используют вторую гармонику неодимового лазера на иттрий-алюминиевом гранате (УАО:ЫA). Созданные на основе высокока- высококачественных нелинейных кристаллов ниобата лития ЫМЮз, ниобата бария-натрия Ва2Ма]ЧЪ5С>15, дигидрофосфата калия КОР и аммония АОР параметрические гене- генераторы света позволяют получать когерентное излучение с плавной перестройкой частоты во всем видимом и инфракрасном диапазоне спектра. Контрольные вопросы • В чем заключается процесс параметрического преобразования частоты света в нелинейной среде? • Какие перспективы связаны с возможностью параметрического преобразования «вверх» частоты слабого инфракрасного излучения? • Объясните принцип параметрического усиления света в нелинейной среде. Какую роль играет здесь условие пространственного синхронизма? • В чем состоит параметрическое усиление света с точки зрения квантовых представлений? • Объясните принцип действия параметрического генератора света. • Каким способом можно осуществлять плавную перестройку частоты генерируемого излу- излучения? Задачи 1. Покажите, что в изотропной среде в области нормальной дисперсии невозможно выпол- выполнение условия пространственного синхронизма к3 = к! + к2 для волн, частоты которых связаны соотношением со^ = (ох + со2. Решение. Так как к = а>п(а>)/с, то /:3 = <^3и(<^3)/с = (сох + а>2)п(а>з)/с = о)хп{(о^)/с + + а>2п(сйз)/с. Но (^з > <О\ и а>з > а>2, поэтому в области нормальной дисперсии п{(о^) > п{сох) и п(а>з) > п(а>2)- Таким образом, волновое число /:3 > а)\п(а)х)/с + + оJп(аJ)/с = к] + к2. Поэтому условие к3 = к] + к2 не может выполняться даже тогда, когда все три волны распространяются в одном направлении. Это тем более невозможно при различных направлениях векторов к|, к2, и к3, так как в противном случае в обра- образованном ими треугольнике одна сторона к3 была бы длиннее суммы длин двух других сторон.
10.5. Вынужденное рассеяние Мандельштама—Бриллюэна 465 10,5, Вынужденное рассеяние Мандельштама—Бриллюэна Параметрические процессы преобразования частоты (см. п. 10.4) происходят при взаимодействии трех электромагнитных волн в нелинейной среде. Взаимное вли- влияние этих волн через нелинейную восприимчивость приводит к обмену энергией между ними и делает возможным усиление слабой волны за счет энергии мощной когерентной волны накачки. Здесь мы рассмотрим аналогичный нелинейный про- процесс взаимодействия в среде трех волн, из которых две электромагнитные, а одна упругая. Пусть в среде распространяется упругая плоская монохроматическая волна с час- частотой п и волновым вектором ^. Ее фазовая скорость С2/ц — это скорость зву- звука V, зависящая от упругих характеристик и средней плотности среды. Происхо- Происходящие в упругой волне периодические изменения плотности 8р — а соз^г — &*) приводят к пространственной модуляции показателя преломления среды 8п ~ 8р, т.е. создают своеобразную объемную прозрачную (фазовую) синусоидальную ди- дифракционную решетку. Эта решетка ничем не отличает- отличается от фазовой объемной голограммы (см. п. 7.7), на ко- торой зарегистрирована интерференционная картина от опорной волны Ео соз(кг — ш) и плоской предметной ^^Л Я волны Е^ соз(к1Г — соу!) (рис. 10.5). Пусть для опреде- __Г^!>^^ ленности угол между векторами ц и к острый. Отража- Отражающие поверхности голограммы будут иметь такую же ориентацию и интервал, как и плоскости равных зна- *>ис# *^# Плоскости равных г „ „ значении плотности в упругой чении показателей преломления в упругой волне, если волне с волновым вектором ц волновые векторы опорной и предметной волн удовле- удовлетворяют условию к — к! = ^ (см, задачу 1). Чтобы эти поверхности перемещались вдоль направления ц со скоростью звука, частота пред- предметной волны о>1 должна быть меньше со на частоту О упругой волны: со — со1 = п. Так как п <С со, то векторы кик! имеют почти одинаковую длину к — соп/с и образуют равнобедренный треугольник (см. рис. 10.5). При падении на голограмму только одной опорной волны Ео соз(кг — ш) в ре- результате дифракции произойдет восстановление предметной волны Е^ соз^г — со^). Поэтому дифракция монохроматической световой волны Е§ соз(кг — ш) на упругой волне 8р = а соз(яг — &1) должна приводить к возникновению как раз такой дифра- дифрагировавшей волны Е^ со$(к}Г — со}*) с волновым вектором к! = к — ^ и частотой а)х — со — п. Когда же угол между я и к тупой, дифрагировавшая волна имеет вол- волновой вектор к! = к -Ь я и частоту со 4- С2. В конденсированных средах тепловое движение проявляется в колебаниях атомов и молекул. Из-за сильной связи атомов друг с другом колебание одного из них неиз- неизбежно передается соседним атомам. В целом тепловое движение в твердых телах можно рассматривать как совокупность всевозможных упругих волн, соответствую- соответствующих различным нормальным колебаниям. Их спектр простирается от низких звуко- звуковых частот до гиперзвуковых (~ 109—1011 Гц). На основе такой модели теплового движения Дебай объяснил наблюдаемую на опыте температурную зависимость теп- теплоемкости твердых тел с простыми кристаллическими решетками. Рассеяние света
466 10. Основы нелинейной оптики на упругих волнах, обусловленных тепловым движением, называется рассеянием Манделыитама-Бриллюэна (см. п. 2.10). С квантовой точки зрения рассеяние Манделыптама-Бриллюэна представляет со- собой рассеяние фотона исходного светового пучка с испусканием или поглощени- поглощением кванта упругих колебаний среды — фонона, т.е. квазичастицы с энергией М2 и импульсом 1щ. В элементарном акте рассеяния выполняются законы сохранения энергии Нсо±Нп = Нсо^ и импульса Нк±йц = Нк19 соответствующие изменению частоты со ± С2 = со^ и направления света к ± ц = 1^2 в классической волновой кар- картине рассеяния. Вероятность испускания фонона и появления нового рассеянного фотона не зависит от наличия таких фотонов, т.е. от интенсивности рассеянного света, и в этом смысле рассматриваемое рассеяние следует считать спонтанным процессом. Существует аналогичный процесс вынужденного рассеяния фотона с испусканием фонона, вероятность которого пропорциональна интенсивности рассеянного света. Вынужденное рассеяние Манделыитама-Бриллюэна (ВРМБ) было открыто на опы- опыте в 1964 г. Чиао, Таунсом и Стойчевым. Они обнаружили, что мощное лазерное излучение частоты со вызывает в кристалле появление когерентной упругой волны частоты С2 с одновременным испусканием света на частоте со — п. Явление наблю- наблюдается лишь тогда, когда мощность лазерного излучения превышает некоторое поро- пороговое значение. С точки зрения классической электромагнитной теории ВРМБ можно рассмат- рассматривать как процесс параметрического усиления упругой волны с частотой п и хо- холостой электромагнитной волны с частотой со — п за счет энергии мощной элек- электромагнитной волны накачки с частотой со. Поясним это. При больших значе- значениях напряженности электрического поля световой волны становится существен- существенным не только влияние создаваемых упругой волной оптических неоднородно- стей на распространение света, но и влияние света на оптические параметры сре- среды. Такое влияние обусловлено, в частности, явлением электрострикции: в элек- электрическом поле в диэлектрике возникает дополнительное давление, пропорцио- пропорциональное квадрату напряженности электрического поля р ~ Е2. Пусть, например, в результате рассеяния интенсивной световой волны Ео соз(кг — ш) на упругой волне а соз(яг — Bг) появилась световая волна Е^ соз [(к — ^)^ — (со — п)(]. Рас- Рассмотрим суммарную напряженность электрического поля падающей и рассеян- рассеянной волн. Для нахождения создаваемого ими давления нужно сумму напряжен- ностей возвести в квадрат, что после элементарных тригонометрических преоб- преобразований даст слагаемые, изменяющиеся на удвоенных световых частотах, и од- одно слагаемое с частотой п. Упругие волны с оптическими частотами существо- существовать не могут, поэтому соответствующие слагаемые в р можно не учитывать и возбуждение упругих волн в среде под действием света будет описываться выра- выражением р ~ Е0Е1 со8(яг - пг). A0.23) Эта волна создаваемого светом давления распространяется в том же направлении и с той же скоростью, что и первичная упругая волна, благодаря которой возникла рассеянная световая волна. Поэтому будет происходить параметрическое усиление
10.5. Вынужденное рассеяние Мандельштама—Бриллюэна 467 первоначально слабой тепловой упругой волны, как и рассеянного на ней света. При достаточно большой интенсивности исходного светового пучка, когда усиление превысит потери, амплитуды упругой волны и рассеянного света будут нарастать по мере распространения в нелинейной среде. Их энергия черпается из волны накачки, поэтому нарастание продолжается до тех пор, пока интенсивность рассеянного света не станет сравнима с интенсивностью волны накачки. В отличие от некогерентного спонтанного рассеяния на тепловых флуктуациях плотности возникающее при ВРМБ излучение когерентно. При ограниченных размерах нелинейной среды и поперечного сечения светово- светового пучка накачки наиболее интересен случай рассеяния назад, когда усиливаемые упругая и световая волны распространяются навстречу и каждая из них обеспе- обеспечивает положительную обратную связь для процесса параметрического усиления другой. Если когерентный падающий пучок пространственно неоднороден, т.е. его интенсивность не постоянна по поперечному сечению, то при ВРМБ происходит интереснейшее явление обращения волнового фронта, не имеющее аналога в клас- классической оптике. Схема эксперимента по его наблюдению приведена на рис. 10.6. Волновой фронт интенсивного лазерного пучка, имеющего высокую направлен- направленность, существенно искажается поставленной на его пути фазовой пластинкой П со случайными неоднородно- стями. Расходимость пучка воз- возрастает при этом в десятки раз. Затем линза Л с большой апер- апертурой, достаточной для того, чтобы перехватить весь расши- расширенный пучок, направляет свет в кювету К, заполненную се- сероуглеродом или метаном при высоком давлении. Небольшая часть лазерного пучка отража- **ис# ^.6. Схема эксперимента по наблюдению обращения и волнового (Ьоонта ется плоскопараллельной пла- ^ стинкой, и его угловое распре- распределение в дальней зоне регистрируется измерительной системой Су Аналогичная система С2 регистрирует рассеянный назад свет, также прошедший через линзу Л и фазовую матовую пластинку /7. Эксперименты показали, что первоначально широкий пучок рассеянного света после прохождения через те же оптические элементы в обратной последовательно- последовательности становится столь же направленным, как и в первоначальный лазерный пучок. Так происходит потому, что волновой фронт излучения, рассеянного назад в нелинейной среде, в точности воспроизводит сколь угодно сложную структуру волнового фронта падающей волны, отличаясь лишь противоположным направлением распростране- распространения (небольшое уменьшение частоты можно не принимать во внимание, так как его относительная величина Асо/со = О /со = 2пь/с имеет порядок отношения скорости звука к скорости света). По выражению академика Р. В. Хохлова, «кювету с рассеи- рассеивающим веществом можно рассматривать как волшебное зеркало, изменяющее знак времени».
468 10. Основы нелинейной оптики Эффект обращения волнового фронта, как и голография, уточняет наши представ- представления о необратимых и обратимых оптических явлениях. Информация о первона- первоначальной структуре когерентного светового пучка не теряется при его прохождении через непоглощающую матовую пластинку. Механизм вынужденного рассеяния об- обращает искаженный волновой фронт с сохранением этой информации. При прохо- прохождении в обратном направлении через ту же пластинку все внесенные ею искажения волнового фронта полностью компенсируются и пучок восстанавливает свою струк- структуру, т.е. возвращается в исходное состояние, но обращенное во времени. Конечно, абсолютная обратимость здесь все же не достигается как в отношении мощности, так и в отношении частоты, которая получает небольшой сдвиг из-за затраты энергии на возбуждение упругих волн в нелинейной среде. .Можно провести аналогию рассматриваемых явлений с топографическим восста- восстановлением волнового фронта (см. п. 7.7). Если при восстановлении объемной голо- голограммы использовать волну противоположного направления по сравнению с опор- опорной волной, то происходит восстановление действительного изображения предмета, которое расположено там, где находился предмет при записи. Это значит, что та- такое восстановление голограммы также приводит к обращению волнового фронта предметной волны. Восстановление формы волнового фронта при повторном прохо- прохождении через фазовую пластинку после его обращения в нелинейной среде можно сопоставить со свойствами голографических интерферограмм с двойной экспозици- экспозицией. Наличие фазовых неоднородностей на пути от объекта к голограмме, искажаю- искажающих волновой фронт предметной волны, не сказывается на виде интерференционных полос, так как все искажения, создаваемые статическими неоднородностями, компен- компенсируются при второй экспозиции. Поясним, почему для обращения золнового фронта при ВРМБ исходный когерент- когерентный пучок должен быть пространственно неоднородным. Выделим из общего пада- падающего пучка с плохой направленностью две плоские волны, распространяющиеся под некоторым углом друг к другу. В результате их интерференции распределение интенсивности в каждом сечении имеет вид дифракционной решетки с чередующи- чередующимися максимумами и минимумами. Такое же пространственное распределение имеет и вероятность вынужденного рассеяния. Поэтому интерференция рассеянных волн должна дать точно такую же картину, что и возбуждающие исходные волны, так как при этом положение максимумов интенсивности рассеянного света совпадает с по- положением максимумов вероятности рассеяния. Чтобы волновой фронт рассеянной волны в деталях воспроизводил фронт падающей, в ограниченном поперечном сече- сечении должно умещаться достаточное число полос этой картины, т. е. две выделенные волны исходного пучка должны иметь заметно различные направления. Если обе волны распространяются почти параллельно, то в среде конечных размеров никакой «решетки» распределения интенсивности не возникает, т. е. не фиксируется информа- информация о том, какие направления энергетически выгодны для образования рассеянных волн. Эксперимент подтверждает этот вывод: если исходный пучок имеет предельно высокую направленность, то никакого обращения волнового фронта не происходит, так как пучок вынужденно рассеянного света имеет существенно большую расходи- расходимость, чем исходный.
10.5. Вынужденное рассеяние Мандельштама—Бриллюэна 469 С помощью обращения волнового фронта в нелинейной среде возможно решение актуальной проблемы получения мощного излучения с предельно малой расходи- расходимостью от лазеров с оптически неоднородными усиливающими средами. Случайные неоднородности искажают волновой фронт и ухудшают направленность лазерного излучения. Улучшение направленности излучения мощных лазерных систем может быть достигнуто по следующей схеме. Пучок света с дифракционной расходимо- расходимостью от маломощного задающего лазера проходит через мощный усилитель с актив- активной средой низкого оптического качества, значительно увеличивая при этом свою расходимость. После обращения волнового фронта в кювете с нелинейной средой излучение вновь проходит через тот же усилитель в противоположном направле- направлении. При этом одновременно с дальнейшим увеличением интенсивности происходит компенсация искажений волнового фронта и выходящее излучение имеет близкую к предельной направленность. Таким методом можно решить задачу фокусировки мощного излучения в предельно малом объеме. Контрольные вопросы • Проведите аналогию между рассеянием когерентного света на упругой волне и восстанов- восстановлением фазовой объемной голограммы. • Какими элементарными процессами описывается рассеяние Манделыптама-Бриллюэна в квантовой теории? • В чем заключается вынужденное рассеяние Манделыптама-Бриллюэна? • Поясните физический механизм параметрического усиления упругой и рассеянной волн за счет энергии волны накачки при ВРМБ. • Почему для обращения волнового фронта с помощью ВРМБ световой пучок должен быть пространственно неоднородным? Задачи 1. Покажите, что в фазовой объемной голограмме, получаемой с опорной волной Ео соз(кг — ш) и плоской предметной волной Е\ соз(к!Г — со^)9 частота которой со^ близ- близка к а), пространственное распределение показателя преломления имеет вид 8п(г, г) = = Ъ соз(яг — пг), где я = к — к] и п — со — со^ <^со. Решение. Представим амплитуду опорной волны в виде суммы Ео = Е1 + {Ео — Е^). Ин- Интерференционный узор на голограмме обусловлен только слагаемым с амплитудой Е{. Складывая его с предметной волной, находим Е\ [соз(кг — ш) 4- соз^г — о)\1)\ = к —к1 со — а)] \ /к + к, со 4- сол _-1г ~СО8(~Т~^ Г" Пусть для определенности <О\ < со> так что со — со1 = п > 0. По условию, частота сох мало отличается от соь поэтому первый сомножитель в полученном выражении можно рас- рассматривать как медленно меняющуюся амплитуду Л (г, I) — 2Е^ соз^яг — &*)]. Вариации показателя преломления в фазовой голограмме пропорциональны интенсивности в интер- интерференционной картине, т.е. квадрату амплитуды Д2(г, () = 2Е\[1 + соз(яг — Х2г)]. Отсюда 8п(г, г) = Ъ соз(яг — Ог). Если же со^ > соь то п = со^ — со и я = к1 — к.
470 10. Основы нелинейной оптики 10.6. Вынужденное комбинационное рассеяние При распространении монохроматического излучения в среде, молекулы которой могут совершать собственные колебания на частоте п, в спектре рассеянного света появляются линии, сдвинутые относительно частоты со падающего излучения на ±С2. Происхождение этих линий комбинационного рассеяния (см. п. 2.10) объясняется тем, что при колебаниях атомов в молекуле, когда нормальная координата х, опи- описывающая отклонение атомов от равновесной конфигурации, изменяется по закону х{1) = а соз&/, электронная поляризуемость молекулы а изменяется на частоте п: а(г) = а0 + (да/дх)охA) =ао-\-^а соз&/, A0.24) где а0 — поляризуемость в равновесной конфигурации, а коэффициенту = (да/дх)о характеризует изменение поляризуемости при смещении атомов из равновесных по- положений. Индуцируемые падающим излучением осцилляции дипольного момента мо- молекулы СГС: р = аЕ = [а0 + (да/дх)о х]Е = (а0 + /на соз пг) Ео соз ш; СИ: р = е$аЕ = е0 [а0 + (да/дх)ох] Е = го(ао Н- /иа созпг) Е$ созал оказываются промодулированными, и в их спектре присутствуют составляющие с частотами со±п (см. A.79)), которыми и обусловлено появление соответству- соответствующих спектральных компонент в рассеянном излучении. По квантовым представле- представлениям, стоксова компонента с частотой (со — п) возникает, когда энергия фотона Нсо уменьшается на величину Ш, равную энергии возбуждаемого при рассеянии кван- кванта колебаний молекулы, антистоксова (а) + п) — когда квант Ни первоначально возбужденной молекулы передается излучению. Интенсивность антистоксовой ком- компоненты, пропорциональная числу возбужденных молекул, много меньше интенсив- интенсивности стоксовой, так как отношение числа возбужденных и невозбужденных молекул ехр[-Ш/(*Г)] < 1. Явление вынужденного комбинационного рассеяния (ВКР), соответствующее описанному выше спонтанному процессу, было открыто на опыте Вудбери и Нг в 1962 г. ВКР также заключается в испускании спектральных компонент, сдвинутых относительно возбуждающего излучения на частоту внутримолекулярных колебаний, но вероятность этого процесса зависит от интенсивностей падающего и рассеянного излучений. ВКР возникает только при интенсивности падающего пучка, превышаю- превышающей некоторую пороговую величину. В отличие от спонтанного рассеяния, интен- интенсивность которого очень мала A0~7—10~8 часть возбуждающего потока), при ВКР доля рассеянного потока достигает десятков процентов. Помимо линий с частота- частотами со ± п появляются линии более высоких порядков со ± 2п,..., и рассеяние имеет четко выраженный направленный характер. Некоторые из особенностей ВКР можно понять с помощью простой классичес- классической модели явления. При объяснении спонтанного комбинационного рассеяния при- принималось во внимание только влияние колебаний молекулы на рассеиваемые ею световые волны. Но поле световой волны оказывает и обратное влияние на мо- молекулу, раскачивая ее колебания. Покажем это. Энергия диполя с моментом р, индуцированным полем с напряженностью Е, равна -рЕ/2 = -аЕ2/2 (СГС) или —рЕ/2 = —е0аЕ2/2 (СИ). Поэтому сила, действующая на диполь со стороны поля,
10.6. Вынужденное комбинационное рассеяние 471 равна Рх = -дЦ/дх = /иЕ2/2 (СГС) или Рх = ефЕ2/! (СИ). Эту силу нужно вклю- включить в правую часть уравнения, описывающего колебания атомов в молекуле: СГС: х + 2Гх+О2х = ^; СИ: Х + 2Гх + О2х = ^^-. A0.26) 2м 2М Здесь М — приведенная масса атомов, константа Г характеризует затухание собственных колебаний. Ограничимся в A0.26), кроме напряженности поля воз- возбуждающего излучения ЕцСоьш, вкладом только первой стоксовой компоненты Ес = соз(й> — п)г, и из квадрата их суммы учтем лишь член, изменяющийся с час- частотой п, т. е. в резонансе с собственными колебаниями молекулы: СГС: ^; 2М A0.27) СИ: х + 2Гх + п2х = €^Е 2М Решение этого уравнения, описывающее вынужденные колебания, в случае слабого затухания (Г <С п) имеет вид СГС: *@=*0зтЛг, СИ: х(<)=хо*тп<9 _»ОС _ 0 " 4МГГ2' ° " 4МГЛ ' Таким образом, поля возбуждающего и стоксова излучений приводят к резонансной раскачке колебаний молекулы с амплитудой, пропорциональной ЕОЕС. Эти индуци- индуцированные колебания, в свою очередь, вызывают еще большую модуляцию колебаний дипольного момента, происходящих под действием возбуждающего излучения, и тем самым приводят к усилению стоксова излучения и к возникновению у дипольно- дипольного момента новых спектральных компонент. Чтобы увидеть это, подставим х($) из A0.28) в выражение /? = (а0 +дх)[Я0со8&# + Ессо$(со — п)г]. После простых преобразований получим СГС: р = а0ЕA) - - /лх0Е0 8т(<н - п) г + - /их0Ес зшШ + + 2 А^0Е0 ^(^ + °)г - 2 ^0Ес 81п(^ ~ 2п) Ъ A0.29) СИ: р = гоаоЕ(/) - - с0^л:0Е0 8т(й> - Я) / + - 1 1 + 2 г0 ^0^0 81п(^ + д)г - 2 с° ^О^с ап(<ы - 2О) /. Здесь первый член соответствует линейной поляризованности среды, которая опре- определяет индукцию Я = Е + 4яРл (СГС) или Я = с0Е + Рл (СИ). Второй член с час- частотой со — п описывает усиление стоксова излучения. В самом деле, совершаемая над молекулой за 1 с работа поля стоксова излучения СГС: РС = -\^ЕйЕс{а>-п) = -^^> - Д); СИ: Рс = -^о^о^с(^- Д) ^-^ {<°п) отрицательна, т.е. происходит усиление излучения, пропорциональное Е% и Е^. С третьим членом в A0.29) связана работа поля возбуждающего излучения над
472 10. Основы нелинейной оптики молекулой Р = ц/лх0Е0Ессо = (/иЕ0ЕсJа)/A6МГО) > |РС|, которая идет на уси- усиление колебаний молекулы и стоксовой компоненты рассеянного излучения. Возбуждающее излучение и испытавшая большое усиление стоксова компонен- компонента рассеянного излучения создают в среде, как видно из четвертого и пятого чле- членов A0.29), когерентный ансамбль диполей, излучающих на антистоксовой частоте со 4- О и стоксовой частоте второго порядка со — 2п. Излучение на второй стоксовой частоте возникает еще и потому, что первая стоксова компонента со — п, дости- достигая большой интенсивности, сама начинает играть роль возбуждающего излучения и испытывает вынужденное рассеяние с уменьшением частоты еще на п. Процесс увеличения числа спектральных компонент рассеянного излучения ограничивается из-за конечного запаса мощности исходного возбуждающего пучка. Направленный характер ВКР обусловлен интерференцией когерентных вторич- вторичных волн, испускаемых диполями в различных точках рассеивающей среды. Резуль- Результат интерференции зависит от фазовых соотношений между этими волнами и от геометрических условий эксперимента. Для стоксова излучения условия фазового синхронизма, обеспечивающие пространственное накопление эффекта преобразова- преобразования энергии возбуждающего излучения в рассеянное, выполняются в любом направ- направлении. На опыте обычно возбуждается только одна стоксова мода с наименьшими потерями. Если рассеивающая среда находится вне резонатора, наиболее благопри- благоприятные условия для преобразования энергии узкого возбуждающего пучка в стоксово излучение соответствуют его распространению по ходу пучка, так как при параллель- параллельном расположении пучков объем среды, где происходит их взаимодействие, намного больше, чем для внеосевого направления. Для антистоксова рассеяния в среде с нормальной дисперсией условия простран- пространственного синхронизма выполняются в направлениях, образующих небольшой угол C° в нитробензоле для излучения рубинового лазера) с возбуждающим пучком, по- поэтому излучение с частотой со + О распространяется вдоль конической поверхности, ось которой совпадает с возбуждающим лазерным пучком. На опыте ВКР сопровождается обычно другими нелинейными явлениями, в част- частности самофокусировкой (см. п. 10.2) возбуждающего лазерного пучка, благодаря которой облегчается достижение порогового значения интенсивности. Контрольные вопросы • Почему интенсивность антистоксовой компоненты спонтанного комбинационного рассея- рассеяния много меньше, чем стоксовой? • В чем заключаются основные отличия ВКР от спонтанного? • Как на основе классической модели объясняется возникновение вынужденного когерентно- когерентного стоксова и антистоксова рассеяния? • Чем объясняется направленный характер рассеянного излучения при ВКР?
Заключение ... физика — это нечто намного большее, чем набор законов, применение которых — дело элементарного навыка. Физика — прежде всего живое творение рук и мозга, которое переда- передается более примером, чем зубрежкой. Она во- воплощает искусство решать проблемы матери- материального мира. И поэтому физике надо учиться, но учиться как искусству. Брайен Пиппард Вот и подошло к концу изучение очередного раздела курса физики. Пройден дол- долгий путь, на котором пришлось преодолеть немало трудностей. Для многих из вас оптика — лишь составная часть общего физического образования, нужная главным образом для успешного занятия другими науками. Для других — это основа будущей профессии, необходимая не только для формирования современного научного мыш- мышления, но и для успешного решения конкретных научных и технических проблем, выдвигаемых практикой. Хочется надеяться, что в любом случае изучение этой книги доставило читателю не только муки преодоления трудностей, но и радость открытий и постижений и не отбило вкус к дальнейшему продвижению по избранному пути. Очень важно сознавать, что наука как род человеческой деятельности — это от- отнюдь не то, что включено в учебники. Неизбежное для учебника «причесанное» изложение науки создает у читателя иллюзию завершенности: кажется, что все уже сделано, осталось, быть может, уточнить лишь некоторые детали. История науки постоянно опровергает такое заблуждение. Учебникам полувековой давности тоже присуща подобная завершенность, но сколько замечательных научных открытий при- принесли нам последние десятилетия! Пример оптики показывает, что открытия совер- совершаются не только в таких новых областях науки, как физика высоких энергий и кос- космология, где основные принципы еще не установлены и необходим выход за пределы уже известных представлений. Физический фундамент для создания лазеров, откры- открытия голографии и многих эффектов нелинейной оптики был заложен очень давно, и тем не менее потребовались долгие годы, чтобы настало время для этих открытий. Опыт прошлого, в том числе и совсем недавнего, говорит о том, что оптика еще не раз вознаградит усилия исследователей новыми открытиями, преображающими жизнь человека и раскрывающими красоту и гармонию окружающего мира.
Алфавитный указатель Аббе рефрактометр 146 — условие синусов 335 аберрация 333 — геометрическая (лучевая) 318 — звездная 370, 381,384 — сферическая 334 — хроматическая 318, 338 абсорбция 99 автокорреляционная функция 215 адаптивная оптика 348 активность оптическая 106 анализатор 21 анастигмат 337 апертура 330 — интерференции 225 — полной поляризации 182 — разреженная 348 — числовая 343, 350 апертурная диафрагма 330,331 апертурный синтез 348 аподизация 285 астигматизм 336, 337 астигматический пучок лучей 333 астрономическая рефракция 314 афокальная оптическая система 326 ахроматизация 338, 339 Билинза Бийе 196 бипризма Френеля 196 Брюстера закон 140 — угол 140 Бугера закон 80,415 Вавилова—Черенкова излучение 131 вектор волновой 16 комплексный 78, 79 — лучевой 171,312 — Пойнтинга 32, 41 Верде постоянная 100 видность 69 — интерференционных полос 196, 207 Вина закон 396 Винера опыт 28 виньетирование то же, что затенение Волластона призма 182 волновая зона 40 — поверхность 16,313 волновод 149 волновое уравнение см. уравнение волновое — число 16 волновой вектор 16 — фронт см. фронт волновой волновые группы 126 волны (электромагнитные) 12, 15, 36, 75, 170 —, длина волны 16 —, — комптоновская 440 —, поляризованные линейно 19 —, — по кругу 22 —, — циркулярно 22 —, поперечность 17 —, спектр волны 48 —, фаза волны 16 —, энергия см. энергия волн — гауссовы 18 волны модулированные 123 — необыкновенные 175 — неоднородные 16, 78 плоские 78 — обыкновенные 174 — однородные 16, 80 плоские 80 — опорные (референтные) 357 — предметные 357 — стоячие 25 — сферические 36 восприимчивость диэлектрическая 76 временная когерентность см. когерентность временная время, эталон 124 — жизни атома в возбужденном состоянии 42, 411 — когерентности 208 — радиационного затухания 43 — релаксации 98 входное окно (входной люк) 332 входной зрачок 330, 330 вынужденное (индуцированное) излучение 410,412, 413,416 — комбинационное рассеяние света 470 выходной зрачок 330 Галилея преобразования 379 Гаусса закон 12 гауссова оптика 319 гауссовы волны 18 — пучки 283,327 генератор квантовый оптический 416 гипотеза статистическая 54 гироскоп лазерный 389 гиротропия 106 глубина резкости 329 голографическая интерферометрия 365 реального времени 366 голография 357 гомоцентрический пучок лучей 317 граница фотоэффекта красная 435 граничные условия 135, 177 групповая скорость света 122,126 группы волновые 126 Гюйгенса принцип 253 Гюйгенса-Френеля принцип 253, 263, 268 Давление световое 158, 442 двойное лучепреломление 166,184 детектирование оптическое 457 детекторы 34 диафрагма апертурная 330, 331 — поля зрения 331 дипольное излучение 39 дипольный момент 73, 97, 103 — осциллятор 39 дискЭйри 280,345 дисперсионная кривая 89 — формула 97 дисперсия 79, 82, 99, 125 —, закон 76 — аномальная 88, 127 — временная 109 — нормальная 85, 126 — ориентационная 96, 98
Алфавитный указатель 475 дисперсия отрицательная 92 — пространственная 109 — релаксационная 98 — спектрального прибора 247, 300 , свободная область дисперсии 248, 294 , угловая дисперсия 293, 300 дисторсия 337 дифракционная расходимость пучка лучей 274, 285 — решетка 290 дифракционные (волновые) искажения 318 — потери 286 дифракция Фраунгофера 262, 270, 277, 290 — Френеля 262, 263 диэлектрическая восприимчивость 76 — проницаемость 77, 173 диэлектрические зеркала 246 — покрытия многослойные 245, 246 — световоды 149 длина волны 16 комптоновская 440 — когерентности 208 —пути оптическая 316 — собственная 378 Доплера эффект 57, 372, 382, 441, 442 поперечный 384 доплеровское уширение спектральной линии 59 Естественный свет 20, 59, 119, 143 Жамена интерферометр 234 Закон Брюстера 140 — Бугера 80, 415 — Вина 396 — Гаусса 12 — дисперсии 76 — Кирхгофа 395 — Ламберта 68 — отражения 135 — преломления 135 — преобразования пространственных расстояний 378 — равнораспределения энергии 401 — Рэлея 115 — смешения 397 — сохранения импульса 439 энергии 32 — Стефана—Больцмана 396 — Хаббла 383 — электромагнитной индукции 14 затвор оптический 187 затенение 332 затухание, показатель затухания 80 —, постоянная затухания 52 — радиационное 42, 83, 411 , время затухания 43 затягивание частоты 389 звездная аберрация 370, 381 звездный интерферометр 231 Зеемана эффект 61, 99 аномальный 65 нормальный 64 обратный 100 Зельмейера формула 237 зеркала диэлектрические 246 — лазерные 288 — Френеля 196 зеркало Ллойда 227 зона волновая 40 зонная пластинка 260 зоны Френеля 256 зрачок входной 330, 330 — выходной 330 Излучение, поток 66 —, приемники 20, 34, 46, 430, 431 —, спектральная плотность 49, 392, 399 —, условие излучения 136 — Вавилова—Черенкова 131 — вынужденное (индуцированное) 410, 412, 413, 416, — дипольное 39 — квазимонохроматическое 52 — лазерное 319 — неполяризованное 59 — переходное 133 — равновесное (черное) 392, 395 — спонтанное 410 — тормозное 437 изображение оптическое 317 — стигматическое 325 иммерсионные объективы 336 иммерсия 336 импульс электромагнитного поля 160 инверсия населенностей (инверсная населенность уровней) 92,415 индикатриса рассеяния 114 индуцированное излучение то же, что вынужденное излучение интеграл Фурье 48, 55, 277 интегралы Френеля 266 интенсивность света 33, 66, 117 интервал пространства-времени 379 интерференционная картина 357 , центр 193 интерференционные полосы 192 , видность 196, 207 , резкость 245 равного наклона 200 равной толщины 203 интерференционный фильтр 249, 364 — член 190 интерференция 190, 205 —, апертура интерференции 225 —, порядок интерференции 193 интерферометр 200 см. также радиоинтерферометр —, постоянная интерферометра 248 — Жамена 234 — звездный 231 — Майкельсона 200,238 — Рождественского 235 — Рэлея 234 — Фабри-Перо 241 интерферометрия голографическая 365 реального времени 366 — интенсивностей 220, 232 искажения волновые (дифракционные) 318 испускательная способность 394 источник, спектр излучения 56 — протяженный 68, 222 — точечный 67 Кардинальные точки оптической системы 323 катодолюминесценция 392 каустика пучка лучей 334 квазимонохроматический свет (квазимонохро- (квазимонохроматическое излучение) 52,54 квантовый оптический генератор 416 — осциллятор 403 — усилитель 415
476 Алфавитный указатель Керра эффект 184 Кирхгофа закон 395 когерентность 112 —, область когерентности 230 — временная 208, 215, 420 , степень когерентности 215, 216, 218, 229 полная 216 продольная 215 частичная 216 — пространственная 228, 420 , степень когерентности 228, 229 частичная 228 коллектив то же, что линза полевая кольца Ньютона 203 кома 335 комбинационная частота 120 комбинационное рассеяние света 119, 470 вынужденное 470 компенсатор 169 комплексная степень когерентности 215, 229 Комптона опыт 439 Комптона эффект 162, 440 комптоновская длина волны 440 конкуренция мод 419 контур линии спектральной 52 — лоренцевский 53, 57, 89 — спектральный линии поглощения 88 Корню спираль 265 корреляционная функция 229 Коттона—Мутона эффект 188 коэффициент отражения 141, 142 — поглощения 81,415 — увлечения эфира 371,381 коэффициенты Эйнштейна 411,412—414 красная граница фотоэффекта 435 критерий Рэлея 305, 346 Лазерное излучение 319 лазерные зеркала 288 лазерный гироскоп 389 лазеры 388 Ламберта закон 68 линза 321 — ахроматическая 338 — полевая (коллектив) 332 линия поглощения, спектральный контур 88 — спектральная, контур 52 , уширение 57 , ширина доплеровская 57 , — естественная 53, 57, 58 , — неоднородная 58 , — однородная 58 , — столкновительная 57 Ллойда зеркало 227 Лоренца преобразования 379 лоренцевский контур 53, 57, 89 лучевая (геометрическая) аберрация 318 — поверхность (поверхность лучевых скоростей) 175 — скорость света 171 лучевой вектор 171,312 лучи, астигматический пучок 333 —, гомоцентрический пучок 317 —, дифракционная расходимость пучка 274 —, каустика лучей 334 — параксиальные 319 люминесценция параметрическая 463 Майкельсона интерферометр 200, 238 — опыт 371,373 Максвелла распределение 58 — уравнения 12, 72, 77 Мандельштама—Бриллюэна рассеяние 466 метод крюков Рождественского 90 — скрещенных призм 90 — фазового контраста 354 Ми рассеяние 115 микроскоп, разрешающая способность (сила) 350 мираж 314 модулирование добротности резонатора 424 модулированные волны 123 — колебания 46 модуляция пространственная 356 — рассеянного света 119 — хаотическая 215 момент дипольный 73,97,103 — импульса электромагнитного поля 163 мультиплеты 64 Накачка оптическая 424 намагниченность 74 населенность уровней инверсная 92, 415 насыщение см. эффект насыщения Николя призма 181 Ньютона кольца 203 Обращение волнового фронта 364, 467 объективы иммерсионные 336 одновременность событий 376, 377 опорные (референтные) волны 357 оптика, просветление 246 — адаптивная 348 — гауссова 319 — интегральная 149 опыт Винера 28 — Комптона 439 — Майкельсона 371,373 — Поля 198 — Смита и Парселла 134 — Физо 381 — Юнга 195, 196, 222, 226, 228, 420 освещенность 357 — энергетическая 67 осциллятор, собственная частота 83, 88 —, энергия 42 — дипольный 39 — квантовый 403 осцилляторов силы 91 ось оптическая 167,180 отверстие относительное 342 «отдача» см. эффект отдачи отражение, закон отражения 135 —, коэффициент отражения 141,142 — полное 93, 146 нарушенное 148 , предельный угол 95, 143 — света от металлических поверхностей 153 Параксиальные лучи 319 параллакс звезд 370 параллелепипед Френеля 151 Парселла и Смита опыт 134 перспектива 330 Планка формула 403 пластинка в четверть длины волны 168 плотность излучения спектральная 49, 392, 399 — энергии магнитного поля 33 поверхность волновая 16,313 — лучевых скоростей 175
Алфавитный указатель 477 поглощательная способность 394 поглощение, коэффициент поглощения 81, 415 —, спектральный контур 88 — многофотонное 448 — света 89, 100 Пойтинга вектор 32, 41 показатель затухания 80 — преломления 79 комплексный 80 Поккельса эффект линейный 188 электрооптический 188 покрытия диэлектрические многослойные 245, 246 поле зрения 331 , диафрагма 331 , угол 332 полоса пропускания 432 Поля опыт 198 поляризаторы оптические 21, 106 поляризационная призма 181 поляризационный ток 73 поляризация волн 19, 105 , плоскость поляризации 19 , степень поляризации 144 , угол полной поляризации 140 — ионная 96 — квазимонохроматического света 54, 168 — круговая 22, 28, 109, 111, 168 — линейная 19, 168 — плоская 19 — полная, апертура 182 — эллиптическая 151,169 поляризованность 73 поляризуемость атомная 84 поляроид 183 поперечность электромагнитных волн 17 порядок интерференции 193 постоянная Верде 100 — затухания 52 — интерферометра (свободная область дисперсии) 248 — решетки 292 — электродинамическая 12 потеря полуволны 139 поток излучения см. энергия волн, поток энергии преломление, закон преломления 135 —, показатель преломления 79 —, комплексный 80 преобразование скорости 380 преобразования Галилея 379 — Лоренца 379 приемники излучения 20, 34, 46, 430, 431 призма Волластона 182 — Николя 181 — поляризационная 181 — Френеля 107 — Фуко 182 принцип Гюйгенса 253 — Гюйгенса-Френеля 253, 263, 268 — обратимости 317 — относительности 376 — причинности 136 — суперпозиции 45 — Ферма 316 проницаемость диэлектрическая 77, 173 просветление оптики 246 пространственная когерентность см. когерентность пространственная пучки гауссовы 283, 327 пучок лучей, дифракционная расходимость 274 , каустика пучка лучей 334 астигматический 333 гомоцентрический 317 Радиационное затухание 42, 83, 411 , время затухания 43 радиоинтерферометр 232 радиус электрона классический 118 разность хода 192 оптическая 193 разрешающая способность (сила) 305, 332 микроскопа 350 спектральная 305 телескопа 348 распределение Максвелла 58 рассеяние света, индикатриса 114 , модуляция 119 , сечение эффективное 117 комбинационное 119, 470 вынужденное 470 Мандельштама—Бриллюэна 466 Ми 115 молекулярное 116 рэлеевское 119 резкость, глубина резкости 329 резонансная флуоресценция 118 резонатор конфокальный (софокусный) 287 — концентрический 287 — неустойчивый 287 — оптический 286, 417 — открытый 249, 287 референтные волны то же, что опорные волны рефрактометр Аббе 146 рефракция астрономическая 314 — удельная 87 Рождественского интерферометр 235 — метод крюков 90 рэлеевское рассеяние света 119 Рэлея закон 115 — интерферометр 234 — критерий 305, 346 — формула 127 Рэлея—Джинса формула 402 ряд Фурье 48, 296 Самофокусировка 454 Саньяка эффект 387,388 сателлиты 119 свертка функций 303 свет, интенсивность 66,117 —, сила света 69 —, энергетическая 67 — естественный 20, 59, 119, 143 — квазимонохроматический 54 , поляризация 54 — неполяризованный 59, 143 — поляризованный 60 частично 60, 143 — рассеянный 120 светимость энергетическая 68 световая эффективность спектральная 69 световоды диэлектрические 149 световое давление 158, 442 световой эталон 69 световые величины 69 сечение рассеяния эффективное 117
478 Алфавитный указатель сила оптическая 321, 324 — разрешающая то же, что разрешающая способность — света 69 энергетическая 67 силы осцилляторов 91 синхронизм фазовый (пространственный) 459 система оптическая, кардинальные точки 323 афокальная 326 телескопическая 326 центрированная 319 скорость атома наивероятнейшая 59 — предельная 122 — распространения энергии 128 — света в вакууме 122 в веществе 124 групповая 122, 126 лучевая 171 сигнальная 85, 130 фазовая 16,79, 122 — фронта импульса 130 Смита и Парселла опыт 134 собственная длина 378 — частота осциллятора 83, 88 спектр волны 48 — излучения источника 56 спектральная плотность излучения 399 спектральный контур линии поглощения 88 спираль Корню 265 спонтанное излучение 410 способность испускательная 394 — поглощательная 394 — разрешающая см. разрешающая способность среда идеально однородная 113 — мутная 113 статистическая гипотеза 54 степень поляризации 144 Стефана—Больцмана закон 396 стигматическое изображение 325 Телескоп, разрешающая способность (сила) 348 телескопическая оптическая система 326 тело черное 68 Тиндаля эффект 113, 114 ток поляризационный 73 туннельный эффект 148 Увеличение 325 — нормальное (равнозрачковое) 343, 349 — прибора 343 — продольное 325 — угловое 326 увлечение эфира 372, 381 , коэффициент увлечения 371 угловая дисперсия 293, 300 угловое увеличение 326 угол Брюстера 140 — полного отражения предельный 95, 143 — полной поляризации 140 — поля зрения 332 умножители фотоэлектронные 35, 431 уравнение волновое 15 — непрерывности 13, 31 — эйконала 312 — Эйнштейна 429 уравнения Максвелла 12, 72, 77 — материальные 75, 450 усилитель квантовый 415 условие излучения 136 — синусов Аббе 335 — цикличности 286 условия граничные 135, 177 уширение спектральной линии см. ширина спектральной линии Фабри—Перо интерферометр 241 фаза волны 16 фазовая скорость света 16, 79, 122 фазового контраста метод 354 фазовый (пространственный) синхронизм 459 Фарадея эффект 99, 100 — ячейка 390 Ферма принцип 316 Физо опыт 381 фильтр интерференционный 249, 364 фильтрация пространственных гармоник 356 фильтры оптические узкополосные 249 флуктуации плотности 116 — технические 432 флуоресценция резонансная 118 формула дисперсионная 97 — Зельмейера 237 — Планка 403 — Рэлея 127 — Рэлея-Джинса 402 формулы Френеля 139 — Эйри 244 фотодиод 35,435 фотолюминесценция 392 фотосопротивление 35 фотоэлектрический эффект 427 фотоэлектронные умножители (фотоумножители) 35, 431 фотоэлектроны 427 фотоэлемент 35 фотоэффект, красная граница 435 Фраунгофера дифракция 262, 270, 277, 290 Френеля бипризма 196 — дифракция 262, 263 — зеркала 196 — зоны 256 — интегралы 266 — параллелепипед 151 — призма 107 — формулы 139 фронт волновой 194 , обращение волнового фронта 364, 467 Фуко призма 182 функции, свертка функций 303 функция автокорреляционная 215 — аппаратная 348 — корреляционная 229 — объекта 348 Фурье интеграл 48, 55, 277 — ряд 48, 296 фурье-спектрометры 239 Хаббла закон 383 хемилюминесценция 392 хроматическая аберрация 318,338 Центр интерференционной картины 193 центрированная оптическая система 319 центры окраски в кристаллах 98
Алфавитный указатель 479 Частота комбинационная 120 — плазменная 80, 92, 93 — собственная осциллятора 83, 88 черное излучение 392, 395 — тело 395 Ширина спектральной линии доплеровская 57 естественная 53, 57, 58 неоднородная 58 однородная 58 столкновительная 57 Штарка эффект 65 Эйконал 312 Эйнштейна коэффициенты 411, 412—414 — уравнение 429 Эйридиск 280,345 — формулы 244 экспозиция энергетическая 67 электролюминесценция 392 энергетическая освещенность 67 — светимость 68 — сила света 67 — экспозиция 67 — яркость 68 энергия, закон равнораспределения 401 — волн 30 , закон сохранения энергии 32 , локализация потока энергии 34 , поток энергии 32, 34, 41, 66 , скорость распространения 128 энергия осциллятора 42 эталон времени 124 — световой 69 эфир 369,369 —, коэффициент увлечения 371 —, увлечение эфира 372, 381 эффект Доплера 57, 372, 382, 441, 442 поперечный 384 — Зеемана 61,99 аномальный 65 нормальный 64 обратный 100 — Керра 184 — Комптона 162,440 — Коттона—Мутона 188 — насыщения 418, 448 — отдачи 162, 446 — Поккельса линейный 188 электрооптический 188 — Саньяка 387, 388 — Тиндаля 113, 114 — туннельный 148 — Фарадея 99, 100 — фотоэлектрический 427 — Штарка 65 эффективность световая спектральная 69 Юнга опыт 195, 196, 222, 226, 228, 420 Яркость энергетическая 68 ячейка Фарадея 390
Учебное издание БУТИКОВ Евгений Иванович Оптика Редактор О. Л/. Рощиненко Издательство «Невский Диалект» 195220, Санкт-Петербург, Гражданский пр., 14. Лицензия ЛР № 065012 от 18.02.1997. Издательство «БХВ-Петербург» 198005, Санкт-Петербург, Измайловский пр., 29. Лицензия ИД № 02429 от 24.07.2000. Подписано в печать 23.06.2003. Формат 70 х 100 1/16. Бумага офсетная. Печать офсетная. Гарнитура ТипеКотап. Усл. печ. л. 39,0. Тираж 3000 экз. Заказ № 4498 Отпечатано с готовых диапозитивов в Академической типографии «Наука» РАН 199034, Санкт-Петербург, 9 линия, 12.