Text
                    УДК 530.1
К41
ББК 22.3
Кингсеп А. С, Л о к ш и н Г. Р., О л ь х о в О. А. Основы физики.
Курс общей физики: Учебн. В 2 т. Т. 1. Механика, электричество и маг-
магнетизм, колебания и волны, волновая оптика / Под ред. А.С. Кингсепа. —
М.: ФИЗМАТЛИТ, 2001, - 560 с. — ISBN 5-9221-0164-1 (Т. 1).
Книга представляет собой первый том двухтомного курса общей физики, под-
подготовленного в соответствии с программой бакалавриата по техническим специаль-
специальностям. Данный учебник — победитель конкурса Министерства образования РФ —
адресован студентам технических университетов с углубленным изучением физики,
а равно и студентам физико-математических факультетов классических универси-
университетов. Изложение ведется на современном уровне при достаточно высокой степени
формализации, но математической подготовки, выходящей за рамки технического
университета, у читателя не предполагается — все необходимые дополнительные све-
сведения включены непосредственно в данный курс. Предметом первого тома являют-
являются механика, электродинамика и физика волновых процессов (включая физическую
оптику).
ISBN 5-9221-0163-3
ISBN 5-9221-0164-1 (Т. 1)	© ФИЗМАТЛИТ, 2001.


ОГЛАВЛЕНИЕ Предисловие 10 Часть I. Механика Введение 13 Глава 1. Пространство, время, движение 15 1.1. Механика и математика. Научный метод познания 15 1.2. Пространство и время 16 1.3. Системы отсчета. Гадиус-вектор движущейся точки 20 1.4. Частицы и поля. Классическая механика Ньютона 22 Вопросы 25 Глава 2. Введение в кинематику 26 2.1. Кинематика материальной точки 26 2.2. Гавномерное движение по окружности 28 2.3. Приближение абсолютно твердого тела и приближение материальной точки . 31 2.4. Преобразования Галилея и закон сложения скоростей 34 Вопросы и задачи 36 Глава 3. Законы Ньютона 37 3.1. Закон инерции 37 3.2. Второй закон Ньютона 38 3.3. Выбор единиц измерения и системы единиц. Размерности физических величин 41 3.4. Понятие импульса. Третий закон Ньютона 44 Вопросы 47 Глава 4. Примеры приложений законов Ньютона 48 4.1. Исследование закона движения материальной точки 48 4.2. Движение материальной точки под действием постоянной силы 50 4.3. Реактивное движение 54 4.4. Колебательное движение: гармонические колебания, резонанс 57 Вопросы и задачи 62 Глава 5. Работа и энергия. Закон сохранения энергии при движении материальной точки во внешнем силовом поле 63 5.1. Работа и кинетическая энергия 63
ОГЛАВЛЕНИЕ 5.2. Потенциальная энергия материальной точки во внешнем силовом поле. Закон сохранения энергии 67 5.3. О законе сохранения энергии и непотенциальных силах 72 5.4. Простые примеры 75 5.5. Равновесие и устойчивость 77 Вопросы и задачи 79 Глава 6. Замкнутая система тел. Энергия взаимодействия и внутренняя энергия.... 81 6.1. Особенности движения замкнутой системы из двух взаимодействующих ма- материальных точек. Приведенная масса 81 6.2. Центр масс системы материальных точек 83 6.3. Потенциальная энергия взаимодействия. Закон сохранения энергии для зам- замкнутой системы материальных точек 86 6.4. Закон всемирного тяготения 90 6.5. Упругие и неупругие соударения 96 Вопросы и задачи 100 Глава 7. Уравнение моментов. Динамика твердого тела 101 7.1. Момент импульса и момент силы 101 7.2. Законы Кеплера 103 7.3. Вращение абсолютно твердого тела вокруг неподвижной оси 106 7.4. Следствия уравнения моментов 111 7.5. Трехмерное движение твердого тела. Гироскопы 114 7.6. Плоское движение твердого тела 116 Вопросы и задачи 119 Глава 8. Элементы механики сплошных сред 120 8.1. Упругие деформации. Закон Гука 120 8.2. Сдвиг и кручение 123 8.3. Течение идеальной жидкости. Уравнение непрерывности 125 8.4. Архимедова сила. Уравнение Бернулли 127 8.5. Вязкость. Течение Пуазейля 130 8.6. Турбулентность 133 Вопросы и задачи 135 Глава 9. Законы механики в неинерциальных системах отсчета 137 9.1. Принцип относительности Галилея 137 9.2. Законы механики в неинерциальных системах отсчета. Силы инерции 139 Вопросы и задачи 145 Глава 10. Введение в релятивистскую механику 147 10.1. Постоянство скорости света для всех систем отсчета. Принцип относитель- относительности Эйнштейна и преобразования Лоренца 147 10.2. Следствия из преобразований Лоренца. Сокращение длины и замедление времени 151 10.3. Импульс и энергия в релятивистской механике 154 Вопросы и задачи 157
ОГЛАВЛЕНИЕ Часть II. Электричество и магнетизм Введение 159 Глава 1. Электрическое поле в вакууме 162 1.1. Электрический заряд 162 1.2. Электрическое поле 163 1.3. Теорема Гаусса 165 1.4. Потенциал. Понятие электрической емкости 168 1.5. Уравнения Лапласа и Пуассона 170 1.6. Электрический диполь 171 Задачи 173 Глава 2. Электрическое поле в веществе 175 2.1. Проводники в электрическом поле 175 2.2. Поляризация диэлектриков. Понятие электрической индукции 176 2.3. Граничные условия в электростатике 180 2.4. Диэлектрики с квазиупругими и жесткими диполями 182 2.5. Пьезоэлектрики и сегнетоэлектрики 183 2.6. Энергия электрического поля в вакууме и в веществе 185 Задачи 189 Глава 3. Постоянный ток 191 3.1. Ток как движение зарядов 191 3.2. Закон сохранения заряда. Постоянный ток 193 3.3. Закон Ома. Закон Джоуля-Ленца 195 3.4. Электродвижущая сила. Правила Кирхгофа 198 Задачи 201 Глава 4. Магнитное поле тока 203 4.1. Взаимодействие проводников с током. Понятие о магнитном поле 203 4.2. Магнитные поля простейших токовых конфигураций. Векторные свойства магнитного поля 207 4.3. Вектор-потенциал 211 4.4. Магнитный диполь. Понятие о магнитном моменте 212 Задачи 216 Глава 5. Магнитное поле в веществе 218 5.1. Микро- и макроскопическое описание поля в веществе 218 5.2. Диа- и парамагнетизм 221 5.3. Ферромагнетизм 223 5.4. Граничные условия на поверхности раздела 226 5.5. Магнитные цепи 228 5.6. Эффект Холла 230 Задачи 231 Глава 6. Электромагнитная индукция 233 6.1. Индуктивность и взаимная индукция 233 6.2. Принцип Ленца. Закон Фарадея 235 6.3. Интегральная и локальная форма закона электромагнитной индукции 237 Задачи 238
ОГЛАВЛЕНИЕ Глава 7. Энергия и силы в магнитном поле 240 7.1. Проводники в магнитном поле. Магнитное давление 240 7.2. Диполь в магнитном поле 242 7.3. Энергия магнитного поля 244 7.4. Подъемная сила электромагнита 248 Задачи 250 Глава 8. Квазистационарное электромагнитное поле 252 8.1. Условие квазистационарности электрической цепи. Релаксационные процессы 252 8.2. Колебательный контур 255 8.3. Вынужденные колебания. Переменный ток 258 8.4. Скин-эффект 262 Задачи 265 Глава 9. Уравнения Максвелла 268 9.1. Ток смещения. Обобщение теоремы о циркуляции 268 9.2. Уравнения электромагнитного поля 270 9.3. Теорема Пойнтинга 272 9.4. Импульс электромагнитного поля 274 Задачи 277 Глава 10. Электромагнитные волны 278 10.1. Вопросы волновой динамики. Волновое уравнение 278 10.2. Плоская монохроматическая волна 280 10.3. Электромагнитные волны в вакууме. Скорость света 282 10.4. Энергия и импульс электромагнитной волны 285 10.5. Излучение электромагнитных волн 288 Задачи 290 Глава 11. Электромагнитные волны в прозрачных средах 293 11.1. Распространение волн в сплошной среде. Показатель преломления 293 11.2. Отражение и преломление на плоской границе 295 11.3. Формулы Френеля 297 11.4. Поляризационные эффекты. Поток энергии через границу 299 11.5. Электромагнитные волны и теория относительности 301 Задачи 303 Глава 12. Элементы физики плазмы 305 12.1. Газовый разряд 305 12.2. Понятие плазмы 309 12.3. Ленгмюровские колебания и дебаевское экранирование 312 12.4. Электромагнитные волны в плазме 314 Задачи 317 Часть III. Физика колебаний и волн. Волновая оптика Введение 319 Глава 1. Кинематика колебаний 320 1.1. Гармонические колебания 320
ОГЛАВЛЕНИЕ 1.2. Векторная интерпретация и комплексное представление гармонических колебаний. Фазовая плоскость 321 1.3. Модулированные колебания 325 1.4. Спектральное разложение 328 1.5. Векторные колебания. Фигуры Лиссажу 334 Задачи 336 Глава 2. Колебания в линейных системах 338 2.1. Примеры простейших колебательных систем. Общность уравнений, описываю- описывающих колебания различной физической природы 338 2.2. Свободные колебания гармонического осциллятора 341 2.3. Превращения энергии при свободных колебаниях в гармонических осцилляторах 342 2.4. Затухающие колебания гармонического осциллятора 345 2.5. Связанные осцилляторы 352 2.6. Вынужденные колебания гармонического осциллятора 355 2.7. Спектральный анализ линейных колебательных систем 361 Задачи 365 Глава 3. Параметрические колебания. Ангармонический осциллятор. Автоколебания 366 3.1. Параметрические колебания 366 3.2. Ангармонический осциллятор 368 3.3. Автоколебания 371 3.4. Автогенератор Ван-дер-Поля 373 Глава 4. Кинематика волн 379 4.1. Основные понятия и определения. Простейшие типы волн. Волновое уравнение 379 4.2. Монохроматические волны. Комплексная амплитуда. Уравнение Гельмгольца 386 4.3. Векторные волны 387 Задачи 389 Глава 5. Упругие волны 390 5.1. Продольные упругие волны в твердом теле 390 5.2. Упругие волны в жидкостях и газах 392 5.3. Плотность и поток энергии в упругой волне. Вектор Умова 394 5.4. Стержень, закрепленный на концах. Собственные моды колебаний 397 5.5. Поведение звука на границе раздела двух сред 399 5.6. Поперечные волны в струне 400 5.7. Общие выводы 402 5.8. Эффект Доплера 403 Задачи 405 Глава 6. Электромагнитные волны 407 6.1. Уравнения Максвелла и волновое уравнение 407 6.2. Поляризация электромагнитных волн 411 6.3. Энергетические характеристики электромагнитных волн. Вектор Пойнтинга 412
ОГЛАВЛЕНИЕ 6.4. Стоячая электромагнитная волна 414 6.5. Излучение колеблющегося диполя 415 6.6. Отражение электромагнитной волны от идеального проводника 418 6.7. Волноводы 419 6.8. Электромагнитная волна на границе раздела двух диэлектриков 422 Глава 7. Интерференция волн 424 7.1. Принцип суперпозиции волн 424 7.2. Интерференция монохроматических волн 425 7.3. Квазимонохроматические волны 428 7.4. Функция когерентности 433 7.5. Интерференция квазимонохроматических волн 436 7.6. Связь функции когерентности и распределения энергии по спектру. Соотно- Соотношение неопределенностей 440 7.7. Пространственная когерентность и интерференционные явления при исполь- использовании протяженных источников 443 7.8. Интерферометры и интерферометрия 448 Вопросы и задачи 450 Глава 8. Дифракция 452 8.1. Граничные условия Кирхгофа 453 8.2. Спектральный метод решения задачи дифракции 455 8.3. Область геометрической оптики 458 8.4. Принцип Гюйгенса-Френеля 459 8.5. Дифракция Френеля. Дифракционные задачи с осевой симметрией 460 8.6. Дифракция Френеля на одномерных структурах 465 8.7. Дифракция Френеля на периодических структурах. (Эффект Талбота) 468 8.8. Дифракция Фраунгофера 470 8.9. Разрешающая способность спектральных приборов 476 8.10. Оптическое изображение и пространственная фильтрация. Разрешающая способность оптических систем 482 8.11. Принципы голографии 493 8.12. Разрешающая способность голограммы 497 8.13. Схема с наклонным опорным пучком 498 8.14. Объемная голограмма 499 8.15. Чем отличается голографическое изображение от фотографии 502 Вопросы и задачи 503 Глава 9. Дисперсия волн 505 9.1. Фазовая и групповая скорость. Формула Релея 505 9.2. Дисперсия электромагнитных волн 509 Вопросы и задачи 515 Глава 10. Волны в анизотропных средах. Элементы кристаллооптики 517 10.1. Модель анизотропной среды 517 10.2. Волны в одноосных кристаллах 519 10.3. Преломление на границе анизотропной среды, двойное лучепреломление ... 522 10.4. Дихроизм. Поляризаторы 525 10.5. Электрооптические и магнитооптические эффекты 526 Вопросы и задачи 531
ОГЛАВЛЕНИЕ Глава 11. Элементы нелинейной оптики 532 11.1. Модель нелинейной среды 532 11.2. Эффект удвоения частоты. Оптическое выпрямление 533 11.3. Генерация третьей гармоники. Самофокусировка и самоканализация 539 11.4. Параметрические процессы в нелинейных средах 541 11.5. Комбинационное рассеяние света 543 11.6. Вынужденное (стимулированное) комбинационное рассеяние 546 11.7. Вынужденное рассеяние Манделыптама-Бриллюэна (ВРМБ) 547 11.8. Обращение волнового фронта 549 Предметный указатель 551
ПРЕДИСЛОВИЕ То, что мы сейчас понимаем под словом «физика», сформировалось как наука совсем недавно, примерно 200 лет тому назад. До этого все ученые назывались «естествоиспытателями», а в древние времена просто «филосо- «философами». По-гречески «фило» — значит «любить», а «софия» — мудрость. Поэтому философами называли людей, любивших мыслить. Конечно, чело- человек всегда задумывался над тем, как произошел мир, что лежит «в осно- основе вещей», почему планеты движутся по небосклону, камень скатывается с горы в ущелье и т. п. Инстинктивно, начиная с глубокой древности, наши предки пытались обобщить свои наблюдения над окружающим миром таким образом, чтобы придать им предсказательную силу, пытаясь определить за- заранее, когда наступит засуха, произойдет затмение Солнца или наводнение. Со временем багаж познаний древних естествоиспытателей пополнялся, од- одновременно расширялся и круг вопросов. Сегодня под естественными на- науками мы понимаем те области знания, в которых может быть проведен эксперимент, т. е. проверка тех предположений, моделей, которые следуют из вновь выдвинутых или хорошо известных теорий, из анализа проведен- проведенных опытов. Тем самым естественные науки существенно расширили свою методологию по сравнению с философией, превратившись из чисто созерца- созерцательных в экспериментальные. Физика — одна из естественнонаучных дисциплин, но найти ее точное определение очень трудно, а может быть, и невозможно. Она тесно пере- переплетена со многими другими дисциплинами, которые зачастую выделились в самостоятельные области исследований. Не всегда легко провести грань между собственно физикой и механикой, между атомной физикой и хими- химией; существуют также и пограничные науки (например, биофизика, хими- химическая физика), активно использующие физические методы для решения задач другой области знания либо технических приложений. Впрочем, одну отличительную черту физики можно указать точно: физика — это наука об основополагающих закономерностях, определяющих процессы и явления в природе. Ее основная задача — выявлять фундаментальные черты нашего мира, предоставляя другим наукам основы знаний, открывая новые возмож- возможности инженерных решений, прорыв в новые технологии. Физика тесно свя- связана с развитием нашего понимания природы, фактически она определяет современное естественнонаучное мировоззрение. Как и все естественные науки, физика — наука экспериментальная, но, как наука фундаментальная, она более всех формализована, в ней чрез- чрезвычайно важную роль играет теория. Теория в физике — не только обоб- обобщение массива экспериментальной информации, но и метод исследования,
ПРЕДИСЛОВИЕ 11 связанный с разработкой предположений и постановкой экспериментальных задач. Но надо четко представлять, что теоретические выводы признаются в физике фактом лишь после полного экспериментального подтверждения, оставаясь до того лишь гипотезами. Трудно переоценить и ту огромную роль в развитии человеческой цивили- цивилизации, которую играли и играют казалось бы чисто научные успехи физики в понимании законов природы. Достаточно вспомнить, что развитие термо- термодинамики оказало существенное влияние на создание и совершенствование тепловых машин, создание электродинамики уже напрямую предопределило появление электродвигателя, электрического освещения, телефона и теле- телеграфа, радиосвязи и телевидения. Понимание процессов, происходящих в полупроводниках, обусловило грандиозные успехи электроники и, в част- частности, вычислительной техники (а значит, в немалой степени, современной информатики). Создание лазеров революционизировало всю оптику и ока- оказывает все большее влияние на электронику. Достижения ядерной физики XX в. послужили основой для ядерной энергетики; следует отметить, что во многих европейских странах более половины энергии производится на АЭС. Помимо физиков-профессионалов, с физикой соприкасаются так или иначе специалисты самых различных профессий. Химик, использующий эффект Мессбауэра, биолог, изучающей строение вируса с помощью элек- электронного микроскопа, археолог, применяющий метод радиоактивного дати- датирования для определения возраста найденных им предметов быта древнего человека, металлург, определяющий по спектру излучения температуру рас- расплавленного металла, инженер, проектирующий современные здания либо бытовую технику, — все они, быть может, непосредственно не ощущают не- необходимость понять, что такое волновая функция электрона или энтропия, но их работа базируется на достижениях естественных наук, и прежде всего физики. Поэтому физика является неотъемлемой частью профессионально- профессионального образования в большинстве областей человеческой деятельности. Традиционно физика делится на, казалось бы, очень разные, независимые друг от друга разделы — механику, термодинамику, оптику, электричество, атомную физику. Такой подход позволяет выделить из всего многообразия явлений природы тот круг вопросов, который можно описать с единой точки зрения, на основе общих для них законов. С другой стороны, все окружаю- окружающие нас явления взаимосвязаны и успехи науки во многом обязаны именно пониманию единых закономерностей природы. Она ведь не знает, на какие главы и параграфы мы разделили ее изучение. Эту диалектику в изучении явлений природы мы старались по мере возможности воспроизвести в нашей книге. Этот учебник написан в соответствии с программой бакалавриата по физи- физике, утвержденной Министерством общего и профессионального образования РФ для технических направлений и специальностей высших учебных заве- заведений. Учебник назван нами «Основы физики», потому что авторы старались из- изложить основополагающие современные экспериментальные факты и их те- теоретические обоснования, идеи и принципы, которые прежде всего должны помочь молодому человеку понять окружающий мир и мощь человеческо- человеческого познания природы. Кроме того, и может быть это главное, эти знания должны послужить основой для дальнейшего изучения либо прикладных
12 ПРЕДИСЛОВИЕ дисциплин, либо курсов, конкретизирующих общие положения физической науки. Фундамент физических знаний должен помочь будущему инжене- инженеру разбираться в постоянно возникающих новых технологиях, материалах, приборах и методах измерений. Современный курс физики никоим образом не может сводиться только к учебнику и лекционному курсу. Не меньшая роль принадлежит лабора- лабораторным работам и семинарским занятиям, а также заданиям для самосто- самостоятельной работы. Чтобы помочь студенту в самостоятельной работе, мы дополнили практически каждую главу вопросами и задачами, часть задач приводится с решениями, в некоторых даны только указания к решению, а в остальных приводятся только ответы. Мы старались написать этот учебник так, чтобы при его чтении как можно реже нужно было обращаться к пособиям по математике — математические понятия и приемы, которые выходят за рамки стандартного курса, объясня- объясняются в тех местах, где изложение материала требует обращения к высшей математике. Конечно, мы предполагаем у нашего студента знание школьно- школьного курса математики, он должен также уметь дифференцировать и интегри- интегрировать простейшие математические выражения, владеть экспоненциальной формой записи комплексных чисел и уметь решать простые дифференци- дифференциальные уравнения. Любой учебник предназначен не только для студентов, но и для препода- преподавателей. Мы надеемся, что они найдут в нем много полезного для своей ра- работы, выделяя те моменты, которые принципиально важны, либо, напротив, опустив несущественные для конкретного вуза, конкретной специальности. Учебник написан профессорами кафедры общей физики Московского фи- физико-технического института и состоит из двух томов. В первый том, общим редактором которого является А.С. Кингсеп, вошли следующие разделы: «Механика» (автор О.А. Ольхов при участии В.Е. Белонучкина и А.С. Кинг- сепа), «Электричество и магнетизм» (автор А.С. Кингсеп) и «Колебания и волны» (автор Г.Р. Локшин). Во второй том, редактором которого являет- является Ю.М. Ципенюк, включены «Квантовая механика» (авторы Д.А. Заикин и Ю.М. Ципенюк) и «Статистическая физика и термодинамика» (авторы В.Е. Белонучкин и Ю.М. Ципенюк). Мы глубоко признательны нашим редакторам Е.С. Артоболевской, О.А. Лениной, Н.С. Рытовой и О.В. Савельяновой, доброжелательные кри- критические замечания которых и полезные советы способствовали существен- существенному улучшению содержания учебника. Особую благодарность мы выражаем и СВ. Баевой, которая, творчески выполняя компьютерный набор книги, обеспечила прекрасный вид этого издания. Мы далеки от мысли, что данный учебник лишен недостатков, и заранее благодарны нашим коллегам и читателям за любые замечания. Авторы
ЧАСТЬ I МЕХАНИКА ВВЕДЕНИЕ Открывая курс общей физики, полезно прежде всего отметить то обсто- обстоятельство, что физика — наука естественная, а следовательно — экспери- экспериментальная. Среди естественных наук физика — в силу фундаментальности объектов исследования и их свойств — наиболее формализована. Поэтому ее первичное изучение нередко порождает иллюзию «выводимости» или ак- сиоматичности физических законов. На самом деле все основные сведения в естественных науках следуют из эксперимента, им же проверяются в ко- конечном счете любые теоретические модели. Механика может рассматриваться как наиболее фундаментальная есте- естественная наука. С нее обычно и начинается изучение всего курса общей физики. Предметом механики являются законы движения и равновесия тел при известном и/или заданном взаимодействии между ними. (Подчеркнем еще раз, что аксиоматичность есть свойство математики, но не естествен- естественных наук, поэтому наши начальные определения с неизбежностью будут не полны, полуинтуитивны). Механика изучает перемещение тел в простран- пространстве, а, в конце концов, любое изменение, развитие, взаимодействие пред- предполагает и перемещение чего-либо, будь то галактики, звезды и планеты, машины и механизмы, атомы и молекулы, клетки живых организмов и сами живые организмы, электромагнитные и звуковые сигналы. По этой причи- причине механические представления о движении пронизывают все естественные науки, в том числе и физику. А кроме того, решая задачи повседневной жиз- жизни и наблюдая все то, что нас окружает, мы с первых шагов нашей жизни оказывемся непрестанно вовлеченными в мир бесчисленных перемещений и механических воздействий. Но есть и другая, не менее важная причина, почему механика являет- является стартовым курсом при изучении физики. Дело в том, что история ее становления как науки в современном понимании, это есть одновременно и история развития и становления того, что принято называть «современ- «современным научным подходом». Сейчас трудно представить, что первые (не слиш- слишком успешные) попытки четко сформулировать правила движения тел при различных условиях предпринимались уже более двух с половиной тысяч лет назад в Греции, в знаменитой школ е-лицее, руководимой выдающимся мыслителем древности Аристотелем. Но как отличить ошибочное прави- правило от истинного, и что вообще понимать под истинными законами движе- движения или каких-либо других явлений природы? Чтобы найти ответы на эти естественные вопросы, потребовалось более двух тысячелетий напряженной работы бесчисленной армии исследователей в различных областях знания, пока не были выработаны общие принципы установления, формулировки и
14 ВВЕДЕНИЕ проверки законов, описывающих наблюдаемые явления природы, и именно эти принципы лежат в основе того, что называется современным научным мировоззрением. Именно при изучении законов механики из-за ее непростой и долгой истории и блестящих результатов можно одновременно осваивать и основные элементы современного метода познания любых явлений природы, понимать приближенный характер наших знаний о природе, представлять место и взаимосвязь теории и эксперимента и, наконец, даже грамотно вести спор на профессиональную тему. Все это не менее важно, чем знание законов движения и умение решать задачи из задачника, так как понимание логи- логики научного мышления окажется неоценимым подспорьем и при изучении других наук, и при овладении любой новой профессией, да и при решении многих проблем повседневной жизни. В соответствии с международным стандартом, мы отдаем в нашем кур- курсе предпочтение системе единиц СИ; впрочем, в механике, в отличие от электродинамики или атомной физики, никакого различия в формализме из предпочтения той или иной традиционной системы единиц не следует. Необ- Необходимые сведения из курса математики, существенно выходящие за пределы школьного курса, будут даны по мере надобности, но за доказательствами соответствующих теорем нам придется отослать любознательного читателя к специальной литературе.
ГЛАВА 1 ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ 1.1. Механика и математика. Научный метод познания Как уже было отмечено, первые попытки установления объективных за- законов, управляющих движением, предпринимались еще в античные време- времена. Но, благодаря создателю механики И. Ньютону A642-1727 гг.) анализ опытных данных, введение новых физических понятий и установление соот- соответствия между ними были впервые поставлены на строгое математическое основание, и математика стала единым языком науки и могучим средством, помогающим использовать ее достижения для практических целей челове- человеческого сообщества. Как язык науки математика играет двоякую роль. Во-первых, точность математических формулировок позволяет определять физические величины универсальным способом, когда задание конкретного значения этой вели- величины любым специалистом, находящимся в любом месте, будет правильно и однозначно понято любым другим специалистом. Например, если через научный журнал сообщается, что измеренная на опыте скорость какого- либо объекта была равна одному метру в секунду, то эта информация будет одинаково и однозначно понята всеми заинтересованными читателями толь- только потому, что существует строгое математическое определение скорости v = dr/dt, точно указывающее, что именно означают слова «один метр в секунду». И мы далее увидим, что именно проблема строгого, объективно- объективного определения понятия скорости движения тела дала толчок к развитию высшей математики. Во-вторых, формулировка наблюдаемых взаимосвязей каких-либо явле- явлений с помощью математических соотношений исключает их неверное, не- неоднозначное истолкование, неизбежное, если ту же взаимосвязь явлений пытаются выразить, не прибегая к математическому языку, а просто «на словах». Например, Аристотель так формулировал на словах основной за- закон движения: для того чтобы поддерживать движение тела с постоянной скоростью, на него необходимо воздействовать некоторой силой. С точки зрения повседневного опыта, это утверждение кажется почти очевидным: действительно, чтобы передвигать, например, какой-либо предмет по гори- горизонтальной поверхности, необходимо прилагать определенное усилие. Тем не менее, с точки зрения современной механики, это утверждение ошибоч- ошибочно, и эта ошибка, обусловленная невозможностью в те времена строго ма- математически определить понятие «сила», продержалась в умах философов и ученых более двух тысяч лет (в частности, благодаря огромному авто- авторитету Аристотеля среди ученых древности). Эта ошибка была исправлена только после того, как Ньютон дал современное, знакомое нам по школе, определение силы F = та. Из него, в частности, следует, что для движения
16 ГЛ. 1. ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ с постоянной скоростью (когда ускорение а равно нулю) внешней силы не требуется, а повседневный опыт свидетельствует в этом случае о равновесии сил, приложенных к телу. В сравнении с другими естественными науками, физика и, в частности, механика в наибольшей степени допускают количественное описание и наи- наиболее формализованы. Но тем более важно подчеркнуть, что, как и во всех естественных науках, базовая информация при этом следует исключительно из эксперимента. Равным образом не нужно забывать, что основные понятия в естественных науках, включая механику, отнюдь не аксиоматичны — при любом уровне формализации — но являются следствием человеческого опы- опыта и отражают достигнутое на сегодняшний день понимание материального мира. Практически количественные соотношения между ними определяют- определяются по имеющимся экспериментальным данным. Таким образом, математика дает лишь один из инструментов исследова- исследования природы, но не может подменять собою естественные науки. (Непони- (Непонимание этого обстоятельства является источником многих «школьных» оши- ошибок — и не только у школьников). Но есть еще одно принципиальное свой- свойство естественных наук, которое выходит за рамки математических моде- моделей — принципиальная неточность, приблизительность любого количе- количественного описания. Ни одна формула в механике, физике, химии и т. д. не может считаться абсолютно точной, она справедлива лишь в пределах границ ее применимости, указанных или подразумеваемых. И ни одна экс- экспериментально определенная величина не имеет смысла, если не указано, в каких условиях и с какой точностью она измерена. 1.2. Пространство и время Попытаемся определить, что мы понимаем под словом «движение». Хотя это понятие и представляется совершенно очевидным, нам необходимо сфор- сформулировать такое его определение, которое содержало бы в себе указание, во-первых, на способ измерения различных свойств возможных движений и, во-вторых, давало бы возможность выразить эти измеряемые свойства на общепринятом научном языке, то есть с помощью математических знаков и формул. Достаточно популярным является следующее определение: движе- движение — это изменение относительного положения тел в пространстве с тече- течением времени. В таком утверждении как бы заранее подразумевается, что понятия «пространство» и «время» являются совершенно естественными и не нуждающимися в каком-либо специальном, формальном определении. В действительности оказывается, что сами эти понятия могут быть опре- определены лишь через материальные предметы и события, с ними происходя- происходящие. Можно сказать, что движение есть перемещение рассматриваемого тела относительно других тел. Нет других тел — нет и движения. Таким обра- образом, пространство задается расположением материальных объектов. Время, в свою очередь, воспринимается через последовательность событий. Если ничего не происходит, нет и течения времени. Зададимся вопросом: что бы- было за секунду до Большого взрыва, с которого, по современным понятиям, началась эволюция нашего мира? Ответ: если наши представления об эво- эволюции Вселенной правильны, то этот вопрос не имеет смысла, поскольку не было самого этого до.
1.2. ПРОСТРАНСТВО И ВРЕМЯ 17 В отличие от пространства, которое для нас представимо хотя бы какими- то зрительными ассоциациями, время — понятие более абстрактное, осно- основанное более всего на нашем жизненном опыте, который, в частности, свиде- свидетельствует о таком его фундаментальном свойстве, как однонаправленность. На нем базируются понятия причинно-следственных связей. Эта парадоксальная ситуация не приводит, однако, к каким-либо практи- практическим затруднениям. Дело в том, что хотя мы и не можем сформулировать логически безупречного определения пространства или времени, мы, тем не менее, можем сделать самое главное, что необходимо для описания и из- изучения любого явления, а именно, мы можем указать способ измерения его свойств и способ представления результатов измерений на математическом языке. Введем определение: измерение какой-либо величины — это сравне- сравнение с однородной величиной, условно принятой за эталонную единицу из- измерения. Тогда, если мы, например, представляем себе пространство как нечто, от- отделяющее одно тело от другого, то мы можем измерить это «нечто» с помо- помощью твердого однородного прямолинейного стержня, который договоримся считать эталонной мерой расстояния между двумя любыми телами в про- пространстве. Измерив, сколько раз уложится наш эталон (или доли этого эта- эталона) на кратчайшем расстоянии между нашими телами, мы выразим это расстояние, или, как еще говорят, длину, в виде определенного числа. Это число и будет выражать интересующее нас расстояние в «единицах длины», определяемых выбором эталонного стержня. В течение долгого времени эталоном длины, который получил название метр, служило определенное расстояние между двумя штрихами, нанесен- нанесенными на стержне особой формы, изготовленном из сплава платины и иридия и находившемся в Международном бюро мер и весов во Франции. И точные копии этого эталона имелись в других странах. Сейчас, однако, отказались от такого эталона, так как он слишком чувствителен к изменению внешних условий и уже не удовлетворяет возросшим требованиям современной науки и техники. В настоящее время в качестве эталона длины принята длина вол- волны электромагнитного излучения, которое испускается атомом химического элемента криптона при определенном изменении его внутреннего состояния. На практике при этом по-прежнему пользуются привычной единицей длины в 1 метр, на котором укладывается 1 650 763,73 вышеуказанных эталонных длин волн. Имея в своем распоряжении способ измерения пространственных интерва- интервалов между телами, можно на этой основе перейти к обсуждению тех свойств пространства, которые могут быть исследованы с помощью указанных изме- измерений. Таких свойств два: трехмерность и эвклидовость. Начнем по поряд- порядку с того свойства пространства, которое на словах выражается утверждени- утверждением, что «наше пространство трехмерно». В повседневной жизни мы связыва- связываем это свойство с тем очевидным и привычным фактом, что всякий предмет (а следовательно, и занимаемый предметом элемент пространства) можно с той или иной точностью охарактеризовать тремя параметрами: «высотой», «длиной» и «шириной». Более строго, трехмерность пространства опреде- определяется тем, что для однозначного определения положения одной точки про- пространства А относительно другой В необходимо в общем случае задать три пространственных интервала (рис. 1.1). В частном случае, когда с точкой В
18 ГЛ. 1. ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ совпадает начало прямоугольной системы координат, вышеупомянутые три пространственных интервала совпадают с соответствующими координатами i ха-> Уа-> za точки А. Л а ?1 Теперь — о втором свойстве пространства, которое также определяется опытным путем и которое формулируется в виде утверждения о том, что «наше пространство является эвкли- эвклидовым пространством», то есть в нем выпол- В |/о^ !/^л \/ няются все теоремы известной нам эвклидовой длина ^ / геометрии, такие, например, как теорема Пи- Пифагора или теорема о том, что сумма углов треугольника равна 180°. Как и трехмерность, это свойство кажется очевидным и не требующим для его подтверждения никаких измерений. Однако оно станет не столь очевидным, если мы рас- рассмотрим возможные геометрические свойства не трехмерного пространства, а более простого для восприятия двумерного пространства, примером кото- которого является, например, поверхность стола, где положение любого предме- предмета определяется всего двумя координатами (рис. 1.2). На плоской поверхно- поверхности стола выполняются все теоремы эвклидовой геометрии, и поэтому такое Одномерные пространства Рис. 1.1 Двумерное эвклидово пространство Двумерные неэвклидовы пространства "Наше" трехмерное пространство Рис. 1.2 двумерное пространство является эвклидовым двумерным пространством. Но дело в том, что двумерное пространство может быть не только плоским, но и «кривым», как, например, поверхность шара. На поверхности шара те- теоремы эвклидовой геометрии перестают быть справедливыми. Это свойство «неэвклидовости» может быть установлено путем прямых измерений.
1.2. ПРОСТРАНСТВО И ВРЕМЯ 19 Но если двумерное пространство может быть кривым (неэвклидовым), то откуда мы знаем, что наше трехмерное пространство не является таковым? Кривизну двумерного пространства, кривизну поверхности шара, мы воспри- воспринимаем, находясь в пространстве трех измерений. Точно так же искривление трехмерного пространства реализуется в четвертом измерении, которое мы, трехмерные существа, представить не в состоянии. Однако астрономические исследования свидетельствуют о том, что на доступных исследованию рас- расстояниях (а это миллиарды световых лет) кривизна мирового пространства в среднем отсутствует. Имеются лишь указания на ничтожное локальное искривление пространства в непосредственной близости от звезд. Поэтому в рамках излагаемой в этой книге классической механики пространство счи- считается эвклидовым (не «искривленным»), то есть таким, в котором всюду строго выполняются все теоремы привычной для нас эвклидовой геометрии. Итак, наше пространство трехмерно и эвклидово. Характерные простран- пространственные масштабы, с которыми приходится сталкиваться при исследовании природы, приведены в табл. 1. Таблица 1. Пространственно-временные масштабы окруэюающего мира Пространство Между звездами 1016 м (световой год) Солнечная система 10" м Земля 106 м Человек 1 м Живая клетка 10~6 м Атом Ю0 м Атомное ядро Ю-15 м Время Homo sapiens 1012 с A00000 лет) Оборот Земли вокруг Солнца 107 с (один год) Оборот Земли вокруг оси 104 с (одни сутки) Один удар сердца 1 с Прохождение электромагнитного импульса по нервному волокну 10 с Время одной операции ЭВМ Ю"9 с Время жизни некоторых элементарных частиц Ю-23 с Движение, как уже говорилось, происходит не только в пространстве, но и во времени. На примере с определением пространства мы уже поняли, что более важным для описания свойств какого-либо первичного понятия явля- является не возможность его безупречного формального определения, а указа- указание на возможность его измерения с помощью какого-то единого эталона. С доисторических времен в качестве меры времени было принято рассматри- рассматривать какое-либо повторяющееся явление природы, так как число циклов, число повторов этого явления является удобным и естественным способом измерения времени. В течение многих столетий использовались хорошо из- известные песочные часы. Как любопытный исторический факт, можно от- отметить, что Галилей при изучении законов движения тел использовал в качестве часов биение собственного пульса. Поскольку развитие науки и практические нужды общества потребовали единого эталона времени, по ко- которому можно было бы сверять ход любых часов, то до недавнего времени таковым являлся период обращения Земли вокруг своей оси. Точнее, за эта- эталонную единицу времени, называемую секундой, принималась 1/86 400 часть
20 ГЛ. 1. ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ средних суток. Однако сейчас физики научились использовать периодиче- периодические процессы, которые происходят в микромире и которые могут служить гораздо более точными эталонами времени, чем средний период вращения Земли вокруг своей оси. Конкретно, за эталон времени принят сейчас пери- период колебаний электромагнитного поля, испускаемого атомами химического элемента цезия при определенном изменении их внутренней энергии. В те- течение одной секунды совершается 9 192 631 770 вышеуказанных эталонных колебаний. Из табл. 1 можно получить представление о характерных вре- временных интервалах, с которыми приходится иметь дело в житейской и на- научной практике. Можно в принципе поставить вопрос о том, как связан ход часов с их соб- собственным движением. На сегодняшний день установлено, что в движущих- движущихся друг относительно друга часах время течет по-разному, но это отличие можно обнаружить лишь при относительных скоростях, близких к скорости света, с ~ 300 000 км/с. С такими скоростями физикам приходится иметь дело при изучении движения и превращений элементарных частиц, приле- прилетающих к нам из космоса или разогнанных до таких скоростей в специаль- специальных ускорителях. При v <^ с указанное изменение хода часов ничтожно, что позволяет считать время абсолютным. 1.3. Системы отсчета. Радиус-вектор движущейся точки Принципиально важным оказывается свойство относительности всяко- всякого движения. В самом деле, находящийся в нашей ладони и покоящийся относительно нее предмет может совершать при этом сложное движение вместе с рукой относительно нашего тела. А если мы не стоим на месте, этот же предмет будет совершать еще более запутанное движение относи- относительно каких-либо окружающих нас вещей. И, наконец, вместе с нами тот же предмет будет участвовать в очень сложном движении, обусловленном вращением Земли вокруг своей оси и вокруг Солнца. Любые попытки установить какие-либо закономерности движения есте- естественно начинать с выбора той совокупности тел, относительно которых представляется важным или удобным рассматривать движение интересу- интересующего нас объекта, и такую совокупность тел принято называть системой отсчета. В качестве системы отсчета можно себе представить, например, три взаимно перпендикулярных недеформируемых прямолинейных стерж- стержня, пересекающихся в одной точке и жестко связанных в этой точке друг с другом. Главное свойство этой системы отсчета состоит в том, что в каком бы месте она ни находилась, положение любой точки интересующего нас тела однозначно определяется в ней тремя расстояниями вдоль стержней-линий, отсчитанными от точки их пересечения. Эти расстояния принято обозна- обозначать буквами ж, у, z, и они образуют хорошо известную декартову систему координат (см. рис. 1.1). Существуют и другие системы координат, выбор которых определяется соображениями целесообразности и удобства: поляр- полярные, сферические, параболические и т. д. Например, для определения поло- положения объектов у поверхности Земли часто используется «географическая» система, где вместо параметров x,y,z используются широта, долгота и вы- высота над уровнем моря. Число независимых координат равно размерности пространства, т. е. в общем случае 3, но нередко физические явления уда- удается смоделировать задачей меньшей размерности. Подчеркнем особо, что
1.3. СИСТЕМЫ ОТСЧЕТА. РАДИУС-ВЕКТОР ДВИЖУЩЕЙСЯ ТОЧКИ 21 система координат — понятие математическое, тогда как система отсчета — физическая категория. Итак, мы видим, что положение любой точки тела относительно выбран- выбранной системы отсчета однозначно определяется тройкой чисел жА, уА и zA. С другой стороны легко видеть, что вместо этой тройки чисел положение той же точки тела можно определить, задав одно число — длину отрез- отрезка, соединяющего точку с началом координат, и указав направление этого отрезка из начала координат в выбранную точку тела. Такая величина, ко- количественная характеристика которой имеет не только числовое значение, но и направление, назывется вектором. Строго говоря, не всякую величи- величину, характеризующуюся модулем и направлением, можно назвать вектором. Принципиально важным оказывается правило сложения векторов, которое должно удовлетворять известным условиям: а + b = b + а; (а + b) + с = а + (b + с); А(а + Ь) = Аа + АЬ. В трехмерном пространстве правила сложения векторов имеют вид, пред- представленный на рис. 1.3. Из них, как мы вскоре увидим, прямо вытекает фун- фундаментальный закон классической механики — преобразования Галилея. Алгебраическим операциям с векторами однозначно соответствуют точно такие же операции с их компонентами (проекциями): (а + Ъ)х = ах + Ьх; (а — Ь)^ = ау — Ъу и т. д. Существенность правил сложения иллюстрируется таким примером: вели- величина, имеющая то же направление, что и вектор Ь, но по модулю равная д/Ь, этим правилам не удовлетворяет, а значит, и вектором именоваться не может. Истин- Истинный вектор должен к тому же вполне опре- определенным образом вести себя при преобра- преобразовании системы координат. Наконец, для векторов определены известные операции скалярного произведения (ab), векторно- векторного произведения [ab ного произведения с утверждение о том, что некоторая величина есть вектор, будет достаточно сильным, и достаточно много говорящим о ее физических свойствах. Векто- Вектором (векторной величиной) определяется не только положение какой-либо точки в пространстве, но и многие другие важные величины, используе- используемые для описания явлений природы, такие как, например, скорость и си- сила, напряженность электрического поля и т. д. Для сравнения заметим, что такие физические величины, как длина, масса, энергия, температура, впол- вполне определяются заданием одного единственного числа, и их свойства не связываются в нашем сознании с каким-либо направлением в пространстве (в отличие от векторных величин их называют скалярами или скалярны- скалярными величинами). Что касается вектора, задающего положение любой точки движущегося тела в заранее выбранной системе координат, то такой вектор принято называть радиусом-вектором рассматриваемой точки, а декартовы координаты точки жА, уА, zA являются проекциями этого вектора на соот- соответствующие координатные оси, однозначно определяющими как длину, так и направление этого радиуса-вектора. Обычно радиус-вектор обозначают г, либо той же буквой со стрелкой сверху г. Длину любого вектора называ- или а х Ь, смешан- рис 13 ab]. Таким образом,
22 ГЛ. 1. ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ ют его модулем и обозначают обыкновенной, не жирной буквой без стрелки сверху, так что модуль радиуса-вектора обозначается, как г. Модуль любого вектора — скаляр, по определению всегда положительный: г = л/(гг). При движении тела его различные точки изменяют с течением времени свое положение в пространстве и, соответственно, изменяются со временем их радиусы-векторы, то есть радиус-вектор г в общем случае является функ- функцией времени ?, г = г(?), которая полностью определяется зависимостью от времени трех его проекций ж(?), y(t) и z(t) в заданной системе отсчета. Мы сделали первый важный шаг на пути привлечения математики для описа- описания движения тел, показав, что положение любой точки тела в простран- пространстве определяется векторной величиной — радиусом-вектором г(?), который изменяется по величине и направлению вместе с изменением со временем положений точек движущегося тела. Это сразу позволяет нам объединить словесное, зачастую недостаточно четкое описание механических явлений со строгим, единым для всех языком математики. В частности, утверждение, что «движение тела это есть его перемещение в пространстве относительно других тел с течением времени», является, как мы видим, утверждением, что «движение тела — это изменение со временем радиусов-векторов всех точек рассматриваемого тела в выбранной системе отсчета». Итак, мы мо- можем сказать, что основная задача механики состоит в нахождении мате- математических соотношений, определяющих, как радиусы-векторы различных точек движущихся тел меняются со временем. Умение находить эту вре- временную зависимость решает одну из главных практических задач — пред- предсказать, как будут двигаться тела в зависимости от возможных начальных условий. Графически изменение со временем радиуса-вектора любой точки можно изобразить в виде линии, вдоль которой перемещается конец радиуса- вектора. Эта линия и является траекторией движения соответствующей точки. 1.4. Частицы и поля. Классическая механика Ньютона Принципиальным для классической механики является понятие матери- материальной точки. По сути вся она и строится на основании законов движения материальной точки, постепенно усложняясь и переходя к рассмотрению все более сложных объектов — и так вплоть до механики жидкости и газа. Первоначальное понятие материальной точки базируется на системах ко- координат, которые обсуждались в предыдущем параграфе. Это означает, что физическое тело рассматривается в качестве материальной точки, если для описания его движения достаточно временной зависимости трех координат или, что то же, одного радиуса-вектора г(?). Прежде всего, это соответствует телу пренебрежимо малых размеров — отсюда и термин. Но так же можно описывать перемещение тел совершенно произвольных размеров и формы, если они совершают поступательное движение, т. е. траектории всех точек тела идентичны и могут быть совмещены параллельным переносом. Нако- Наконец, и при более сложных движениях, когда существенны ориентационные координаты, движение центра масс тела, как мы увидим в последующих главах, подчиняется законам механики материальной точки. Механика Ньютона называется классической потому, что ее становление произошло задолго до утверждения современных атомистических предста- представлений о строении вещества. Как уже говорилось, любое количетвенное
1.4. ЧАСТИЦЫ И ПОЛЯ. КЛАССИЧЕСКАЯ МЕХАНИКА НЬЮТОНА 23 соотношение (а значит — и любая область физики, представляемая неко- некоторой совокупностью количественных соотношений) имеет смысл лишь при указании границ применимости. Таким образом, в современном понимании термин «классическая механика» должен быть определен количественно, а именно: должны быть сформулированы условия, при которых ее можно ис- использовать с заданной точностью и/или оценена максимальная возможная ошибка. Во-первых, сложение движений в рамках классической механики сводит- сводится к сложению радиусов-векторов. Если материальная точка в некоторой системе отсчета перемещается по закону ri(t), а сама система отсчета дви- движется так, что ее начало координат в некоторой новой системе перемещается по закону Г2(?), то в этой новой системе отсчета материальная точка дви- движется по закону ri (?) + Г2(?). Это эквивалентно преобразованиям Галилея, о которых мы будем говорить в следующем параграфе. Сколь ни естествен- естественным выглядит это правило, уже в XX в., почти через 200 лет после смерти Ньютона было установлено (прежде всего здесь следует назвать имя Эйн- Эйнштейна), что оно представляет собой лишь частный случай, приближение, отвечающее пределу т. н. нерелятивистских скоростей v <С с с± 3 • 108 м/с. Механика тел, движущихся с относительными скоростями, сравнимыми со скоростью света с, выглядит заметно сложнее и в гораздо меньшей степени согласуется с нашим здравым смыслом, поскольку опыта с такими движе- движениями человек в повседневной практике не имеет. Эта механика называет- называется релятивистской; иногда ее по традиции называют специальной теорией относительности. Мы с ней познакомимся в одной из последующих глав данного раздела. Во-вторых, существенной ревизии подвергается механика Ньютона при пе- переходе к рассмотрению физики молекул, атомов и еще более элементарных частиц. И это обстоятельство было понято в XX в. усилиями Бора, Гей- зенберга и многих других замечательных ученых. Механика микромира — квантовая механика — не может использовать понятие материальной точки, поскольку все частицы, как оказывается, обладают волновыми свойствами. Пренебречь этим обстоятельством позволительно лишь до тех пор, пока ре- реальные размеры тел, рассматриваемых нами как материальные точки, или расстояния между телами, другими словами пространственные масштабы задачи, существенно превышают т. н. длину волны де Бройля: АБ = h/(mv), где т — масса тела, v — его скорость, a h — 6,6 • 10~34 Дж/с — постоянная Планка. Квантовая механика необходима уже для ответа на вопрос, что такое валентность с точки зрения физики или, например, что такое твер- твердое тело и как оно устроено. С этой наукой наше знакомство состоится в заключительных разделах нашего курса. Можно сказать, что механика Ньютона корректна в случае предельного перехода h —>> 0 и одновременно v/c —>> 0. Но этот предельный случай вмеща- вмещает такое многообразие предметов и явлений и столь важен с практической точки зрения, что классическая механика и на сегодняшний день остается не только предметом утилитарного применения, но и живой, развивающейся областью естествознания. Подавляющая часть объектов окружающего мира, в особенности, доступ- доступных непосредственному человеческому восприятию (с помощью органов
24 ГЛ. 1. ПРОСТРАНСТВО, ВРЕМЯ, ДВИЖЕНИЕ чувств), состоит из мельчайших частичек вещества — атомов. В дальнейшем мы будем называть их частицами, поскольку структура атомов и законы их «внутренней жизни» не могут быть предметом рассмотрения классической механики. Частицами называют также обычно и входящие в состав атомов электроны, атомные ядра, протоны, нейтроны и множество других, так на- называемых, элементарных частиц, о которых будет идти речь в соответству- соответствующем разделе курса общей физики. Наконец, физики используют понятие макрочастиц, состоящих из большого числа атомов. В рамках классической механики частицей можно называть любой физический объект, который с достаточной точностью описывается приближением материальной точки. Но окружающий нас мир состоит не только из атомов. Так например, иначе устроены электромагнитные волны, пронизывающие окружающее нас пространство и почти непрестанно воздействующие на наши органы чувств либо как видимый свет, либо как радиоволны или телевизионные сигналы. (Более того, по сути все наши органы чувств, а равно и все наши измеритель- измерительные приборы воспринимают окружающий мир через электромагнитное взаи- взаимодействие). Электромагнитные волны представляют собой электрические и магнитные поля — особый вид объектов природы, отличных от частиц. Опыт показывает, что все, что нас окружает, есть либо частицы, либо поля, либо структуры, объединяющие частицы и поля, и все они могут совершать движение друг относительно друга. Заметим, однако, что в релятивистской квантовой физике принципиальная разница между частицей и полем исче- исчезает (иногда говорят, что частица есть квант соответствующего поля). В классической и даже релятивистской (но не квантовой) физике поня- понятия частицы и поля разграничены. Движение частиц или их ансамблей — макроскопических тел — оказывается главным предметом рассмотрения, тогда как полем обусловлено взаимодействие частиц. В том случае, когда источники поля остаются за рамками механической задачи, рассматрива- рассматривается движение в заданном поле, если же исследуется движение замкнутой системы как результат действия полей, ею же порожденных, то задача на- называется самосогласованной. Поля, известные физике на сегодняшний день, бывают четырех видов и, соответственно, представляют четыре типа взаимодействия. Мы с детства знакомы с силой тяжести и в какой-то мере умеем измерять ее. Самое есте- естественное понятие о массе следует из измерения веса тел. Это дает нам по- понятие о гравитационном взаимодействии. Очень многие хрестоматийные за- задачи механики рассматривают поведение частицы или системы частиц в гравитационном поле. Столь же универсальным в окружающем нас мире оказывается электро- электромагнитное взаимодействие; как уже отмечалось, вся наша связь и взаимо- взаимодействие с внешним миром именно этим взаимодействием обусловлены. Это, правда, лишь в XX в. было понято должным образом. Подобно гравитаци- гравитационному, электромагнитное взаимодействие не ограничено расстоянием, что и отражает, в сущности, поэтический штамп «свет далекой звезды». Еще два типа полей и взаимодействий — сильное и слабое — напротив, ограничены радиусом действия, и притом столь малым, что рассматривать их можно только в контексте квантовой физики. В нашем курсе мы рас- рассмотрим их во втором томе применительно к физике ядра и элементарных частиц. Классическая механика с этими полями дела иметь не может.
ВОПРОСЫ 25 Теперь, наконец, мы можем определить содержание данного раздела на- нашей книги. В ней рассказывется о законах движения макроскопических тел при скоростях и<<си пространственных масштабах, примерно соответству- соответствующих нашему повседневнеому опыту. Наука, которая изучает относительное движение таких тел, называется классической механикой. Вопросы 1. Каковы основные физические свойства нашего пространства? 2. Чему равна сумма углов треугольника, изображенного на рис. 1.2, включающего в себя четверть верхней полусферической поверхности? 3. Что такое часы? 4. Является ли проекция векторной величины на одну из координатных осей (ж, у или z) скалярной величиной?
ГЛАВА 2 ВВЕДЕНИЕ В КИНЕМАТИКУ 2.1. Кинематика материальной точки Кинематикой называется раздел механики, в котором изучаются самые общие характеристики движения, не зависящие от характера взаимодей- взаимодействия между телами. Существует следующее простое определение кинема- кинематики: геометрия движения. В классической и релятивистской механике кинематика оказывается раз- различной. Кинематика движения тела конечных размеров сложнее, чем кине- кинематика точки, хотя в классической механике она и сводится к последней. Темой данного параграфа будет нерелятивистская кинематика материаль- материальной точки. Фундаментальные кинематические понятия — скорость и ускорение. Из школьного курса физики читателю знакомы средняя скорость и среднее ускорение. Пусть материальная точка совершает одномерное перемещение, и пусть она сместилась на расстояние Ах за промежуток времени At. Тогда, по определению, средняя скорость есть (v) = Ax/At. B.1) Пусть, далее, средние скорости на двух последовательных участках пу- пути, отстоящих друг от друга на At, отличаются на величину A(v). Среднее ускорение может быть определено как (а) = A(v)/At. B.2) Естественным обобщением этих первичных определений оказываются по- понятия мгновенной скорости и ускорения: v = lim (Аж/At), B.3) At^O а= lim (Av/At). B.4) Заметим, что именно необходимость адекватного кинематического описа- описания послужила Ньютону и Лейбницу стимулом для создания основ диффе- дифференциального и интегрального исчисления. Следующим естественным обоб- обобщением определений B.3, 2.4) будет переход к неодномерному движению, которое, естественно, уже нельзя будет описать одной координатой х. В тех случаях, когда по условиям задачи движение тела можно заменить на движение материальной точки, его положение в пространстве определяется радиусом-вектором r(t) этой точки, который при движении меняется со вре- временем, и нахождение закономерностей этого изменения и является основной задачей механики.
2.1. КИНЕМАТИКА МАТЕРИАЛЬНОЙ ТОЧКИ 27 Пусть тело движется по криволинейной траектории (см. рис. 2.1 а). И пусть в момент времени t оно оказалось в точке А, положение которой от- относительно выбранной системы координат определяется радиусом-вектором rA(t). Через промежуток времени At тело оказа- оказалось в точке В с радиусом-вектором rB (t + At). Расстояние вдоль траектории между точками (на- (например, между точками А и В) называется пу- путем AsAB, пройденным телом, а разность векторов гв — тА = АтАВ называется вектором перемещения тела из точки А в точку В. Если нам известен за- закон движения тела по траектории, т. е. известна функция времени r(t), то мы всегда сможем най- найти и длину пути, скажем, из точки А в точку Б, и вектор перемещения АтАВ (построив, например, траекторию графически). А чему же при этом рав- равняется скорость тела, допустим, в точке А1 Идея определения скорости в точке А в момент време- времени t состоит в том, чтобы выразить ее, как частное от деления перемещения из точки А в соседнюю, близкую к ней точку траектории, на промежуток времени, которое затрачивает тело на это переме- перемещение. Таким образом, в трехмерном случае, то есть при движении в пространстве, естественно, изменяется не только величина, но и направление скорости. Поэтому скорость должна быть определена, как предел отношения приращения вектора Аг к промежутку времени At Рис. 2.1 vA = lim (Ar/At) = dr/dt. B.5) Хотя определение скорости и содержит предел At —>> 0, но мы должны по- понимать, что в реальном опыте предел At = 0 все равно никогда не дости- достижим, так как любое измерение осуществляется всегда с некоторой ошибкой, как говорят, с конечной точностью. Более того, экспериментальное значе- значение любой физической величины имеет смысл лишь постольку, поскольку указано, с какой точностью эта величина измерена. Поэтому для опытно- опытного измерения скорости тела в какой-то точке его траектории необходимо с максимальной точностью измерить приращение Аг за минимально возмож- возможный при заданной точности промежуток времени At. Частное от деления этих величин и определит экспериментальное значение скорости, а исполь- используемые при этом приборы и метод измерения определят, с какой конкретно точностью известна скорость интересующего нас тела. Определение B.5) скорости можно выразить следующими словами: ско- скорость материальной точки является производной ее радиуса-вектора по времени. Правила вычисления производных различных функций изучают- изучаются в соответствующих разделах математики. Для нас важно понимание того, что если нам известен закон движения тела по траектории (известна функ- функция времени r(t)), то мы по известным и простым математическим правилам сможем вычислить v(t) — значение скорости тела в любой точке этой тра- траектории.
28 ГЛ. 2. ВВЕДЕНИЕ В КИНЕМАТИКУ Какие свойства скорости как физического понятия особенно важны? Пре- Прежде всего, скорость является векторной величиной и, следовательно, од- однозначно определяется, например, тремя своими проекциями на оси какой- либо декартовой системы координат. В такой системе координат указанные проекции vx, vy и vz определяются в соответствии с B.5) как vx = dx/dt, vy = dy/dt, vz = dz/dt, B.6) где x(t), y(t) и z(t) — проекции радиуса-вектора r(t) движущейся матери- материальной точки на соответствующие оси координат. Любой вектор можно определить, не только указав три его координаты в какой-либо системе отсчета, но задав его направление и его модуль (длину). В пределе At —>> 0 бесконечно малое перемещение dr совпадает с бесконечно малым элементом траектории, точнее, в этом пределе модуль dr совпадает с бесконечно малым изменением пути ds, направление dr совпадает с на- направлением движения, которое определяется касательной к траектории в заданной точке (см. рис. 2.1 б), а модуль скорости равен производной пути по времени v = ds/dt. С учетом B.6) модуль скорости можно представить также в виде v= Когда при движении тела модуль скорости остается постоянным (равным, например, г>о), то такое движение называют равномерным. Если при этом весь пройденный телом путь s представить как сумму элементарных пере- перемещений ds, то из B.5) мы получим s = V^ ds = V^ vq dt = vq У^ dt = v^t. где мы учли, что сумма элементарных промежутков времени dt равна вре- времени t, за которое тело прошло путь s. Таким образом, для равномерного движения мы получаем ^о = s/t, то есть модуль скорости равномерного движения равен пути, проходимому телом за единицу времени. Именно таково понимание скорости в обыденной жизни. Аналогичным образом определяется при неодномерном движении и вектор ускорения материальной точки: a(t) = dv/dt = lim (Av/At). B.7) Д?>0 Итак, ускорение — это производная скорости по времени. Так же, как радиус-вектор r(t) и скорость v(t), ускорение a(t) является векторной величиной. Модуль и направление a(t) можно всегда вычислить, если известен закон движения тела по траектории, то есть известна зависи- зависимость радиуса-вектора от времени. 2.2. Равномерное движение по окружности В качестве примера таких вычислений рассмотрим, как определяется мо- модуль и направление ускорения при равномерном движении материальной точки по окружности радиуса R со скоростью, модуль которой равен v.
2.2. РАВНОМЕРНОЕ ДВИЖЕНИЕ ПО ОКРУЖНОСТИ 29 С таким типом движения приходится сталкиваться очень часто: от враще- вращения на карусели до движения спутников и космических кораблей. Важным шагом при решении любой механической задачи является выбор системы отсчета. В нашем случае мы поместим начало декартовой системы координат в центр окружности, по которой движется тело, а оси х и у рас- расположим в плоскости движения (см. рис. 2.2). Пусть в начальный момент времени тело находилось в наивысшей точке ок- окружности А, то есть начальные значения проек- проекций радиуса-вектора равны х@) = 0, у@) = R. Проекция z(t) всегда равна нулю, так как дви- движение происходит в плоскости ху. Обозначим ме- меняющийся со временем угол между г(?) и Оу через (f(t). Тогда траектория движения будет опи- описываться зависимостью от времени проекций ра- радиуса-вектора г(?), а именно: x(t) = R sin<p(t), y(t) = R cos <p(t). B.8) Отношение пройденной телом дуги окружности АВ к радиусу R определяет угол (p(t), измерен- измеренный в радианах. При равномерном движении тела по окружности длина дуги АВ равна пройденному пути s(t) = vt, и поэтому Рис. 2.2 = s(t)/R = (v/R)t = ut, B.9) где ио = v/R — угловая скорость движения тела по окружности. Определим сначала проекции скорости vx и vy. Используя правила для вычисления производных от тригонометрических функций, получаем с по- помощью B.8, 2.9): vx = dx/dt = R(d/dt) (sin ujt) = Rcucosujt, vy = dy/dt = — Rcjsinujt. Как следствие, получаем известную формулу, связывающую линейную и угловую скорости при равномерном движении по окружности: Теперь можно получить и значения проекций ускорения на оси декартовых координат: ах = dvx/dt = —Rlo sinc<;?, ay = dvy/dt = —Rlo cos cut. Отсюда находим окончательное выражение для модуля вектора а: а? = Ruj2 = v2/R. а = B.10) Нетрудно усмотреть, что ах и ау меняются со временем синхронно с проек- проекциями радиуса-вектора x(t) и y(t) по законам sinc^t и cosc^t, то есть векторы а(?) и r(t) связаны соотношением = -uj2r(t). B.11) Знак «минус» означает, что вектор а направлен противоположно векто- вектору г, т. е. ускорение материальной точки при ее равномерном движении по
30 ГЛ. 2. ВВЕДЕНИЕ В КИНЕМАТИКУ окружности направлено к центру. По этой причине ускорение, модуль ко- которого определяется формулой B.10), а направление совпадает с нормалью к траектории, называют обычно центростремительным ускорением. Если же сама скорость неодномерного движения меняется по величине, этому соответствует ненулевая компонента ускорения по направлению ка- касательной. А вот по направлению так называемой бинормали — вектора, ор- ортогонального плоскости, содержащей векторы нормали и касательной, про- проекции как скорости, так и ускорения всегда равны нулю. Понятие угловой скорости можно обобщить и на этот случай, подобно тому, как это делается при рассмотрении прямолинейного неравномерного движения для линей- линейной скорости. Определим угловую скорость при неравномерном движении по окружности как производную по времени естественной — угловой — ко- координаты: u{t) = d(p(t)/dt. B.12) Более сложные траектории, а также основные законы неравномерного дви- движения по криволинейной траектории будут рассмотрены в последующих главах нашего курса. В механике, как и в любом последующем разделе физики, особую ценность количественным результатам придает их инвариантность по отношению к выбору системы координат. В частности, векторная алгебра (а в дальней- дальнейшем — векторный анализ) тем и привлекательны в качестве языка, на ко- котором формулируются законы физики. Формулы B.11), B.12) представляют собой первый шаг в данном направлении, но и они оставляют без должной определенности вопрос о плоскости, в которой проис- ходит движение тела по окружности. Иными словами, мы полностью определим движение тела в пространстве, если дополним наше рассмотрение уравнением плоско- плоскости рис. 2.2. Эту проблему мы можем с успехом разрешить, вве- введя вектор угловой скорости — см. рис. 2.3. Определя- Определяем вектор о; как перпендикулярный плоскости нашей окружности и направленный так, чтобы при наблюде- р ^ q нии со стороны его конца движение точки по окружно- окружности происходило против часовой стрелки. Иначе говоря, он как бы «ввинчивается» в пространство по закону правого винта. Тогда скорость и ускорение при равномерном движении по окружности могут быть представлены в виде векторных произведений: dr/dt = [wr]; dv/dt = [ш v]. B.13) Напомним, что по определению векторного произведения вектор с = [ab] ортогонален плоскости (ab), образует с этими векторами правую тройку: (а, Ь, с) ~ (ж, у, z) и равен по модулю с = ab sin/a, b. Остановимся кратко на инвариантности формул B.13), т. е. на независимо- независимости этих соотношений от выбора системы координат. Первое из этих соотно- соотношений позволяет выбирать начало координат в любой точке оси вращения, в данном случае — прямой, нормальной к плоскости нашей окружности и проходящей через ее центр. Эта инвариантность прямо следует из свойства векторного произведения: если а || Ь, то [ab] = 0. Второе из равенств B.13)
2.3. ПРИБЛИЖЕНИЕ АБСОЛЮТНО ТВЕРДОГО ТЕЛА 31 справедливо всегда, если центр окружности неподвижен. Заметим, что ки- кинематически оно эквивалентно первому. Действительно, оба вектора, г и v, при указанных выше условиях равномерно вращаются, не изменяя модуля, с одной и той же угловой скоростью о;. Таким образом, можно сформули- сформулировать и более общее утверждение. Если некоторая векторная величина b изменяется во времени так, что это изменение можно представить как вра- вращение с угловой скоростью о;, то имеет место соотношение db/dt= [wb]. B.14) Далее, в гл. 7 будет рассмотрено вращательное движение твердого тела, и тогда первое из соотношений B.13) можно будет трактовать уже как век- векторное поле скоростей, т. е. заданную векторную функцию в пространстве (и может быть, во времени). Скорость v привязывается в этом случае не к материальной точке как элементу твердого тела, но к точке пространства, и с этой скоростью движется элемент тела в тот момент, когда он «посещает» данную точку пространства. (В дальнейшем такое представление переносит- переносится на течение жидкости). Следует, отметить, что о; — не совсем обычный вектор. При поворотах си- системы координат он, подобно истинным векторам, например, г и v, сохраняет величину и направление. Но если подвергнуть систему координат операции отражения {ж, у, z => —ж, —у, —^}, то мы должны поменять знак с*;. Это следует формально из того, что формулы B.13) должны определять г и v инвариантным образом. Возможна и простая физическая (или геометриче- геометрическая) интерпретация этого свойства: мы определили о; через правило винта, но при перемене знака всех трех координат правый винт трансформируется в левый и наоборот. Такие величины называются псевдовекторами. Псевдовектором оказыва- оказывается векторное произведение любых двух истинных векторов. (Соответствен- (Соответственно, смешанное произведение а[Ьс] называется псевдоскаляром). Таким обра- образом, мы видим, что объявлять векторной любую величину, имеющую напра- направление и представимую в трех проекциях, было бы неразумно. Повышенные требования к объекту, претендующему на звание вектора, придают истинно векторным законам дополнительную доказательную силу. Но пока и поскольку мы не оперируем отражением системы координат, о; может рассматриваться именно как вектор, из чего проистекают вполне практические следствия. При решении задач на динамику твердого тела конечных размеров часто бывает удобно представлять движение тела как сумму двух или более вращений, либо производить обратную операцию. Что же касается переноса начала ко- координат либо перехода в систему отсчета, движущуюся относительно данной с некоторой скоростью, то к этим операциям в контексте формул B.13) мы еще вернемся в последующих главах. 2.3. Приближение абсолютно твердого тела и приближение материальной точки Не только история науки, но и повседневный человеческий опыт пока- показывают, что приступая к изучению какого-либо нового явления, разумно не пытаться сразу же искать объяснения всех его зачастую очень сложных
32 ГЛ. 2. ВВЕДЕНИЕ В КИНЕМАТИКУ У Рис. 2.4 сторон и деталей, а двигаться шаг за шагом от понимания простых законо- закономерностей к пониманию все более полной картины. Так и нам при изуче- изучении механики следует начать с рассмотрения простейших типов движения, на примере которых мы освоим основные идеи и понятия этой науки, по- после чего круг изучаемых движений можно будет расширить. В самом деле, трудно рассчитывать на то, что мы с первых же шагов сможем, например, разобраться в законах птичьего полета. Только лишь для строгого опре- определения положения птицы относительно выбранной системы координат в некоторый момент времени необходимо знать радиусы-векторы различных точек крыльев, корпуса, хвостового оперения, головы (см. рис. 2.4), так что математическое описание полета неизбежно будет содержать соотношения между большим числом зависящих от времени величин. Полу- Получить из этих соотношений траекторию полета наверняка окажется необычайно сложной за- задачей. Сформулируем теперь наше первое важное упрощение. Оно состоит в том, что мы будем на первых этапах изучать движение только абсолютно твердых тел. Этим термином при- принято обозначать тела, при движении которых можно пренебречь их деформациями, то есть смещениями одних частей тела относитель- относительно других. Под влиянием внешних воздействий все тела испытывают те или иные деформации. Стальной стержень даже при обычных изменениях ат- атмосферного давления и температуры меняет свои размеры и форму, хотя эти изменения можно заметить только с помощью весьма чувствительных приборов. Но если этот стержень является деталью достаточно грубого ме- механизма, то такими деформациями можно пренебречь и его движение можно будет рассчитывать при конструировании механизма по законам движения абсолютно твердого тела, о которых пойдет речь в дальнейшем. Однако, если тот же стержень является деталью сложного электронного прибора, то учет его деформаций может оказаться главной задачей конструктора, и тогда приближение абсолютно твердого тела будет неприменимо. Поэто- Поэтому представление об абсолютно твердом теле, как о теле, не подверженном вообще никаким деформациям, является всего лишь определенным прибли- приближением к реальной действительности, удобной идеализацией (или, как го- говорят физики, моделью), применимость или неприменимость которой при рассмотрении движения тела зависит от конкретных условий. Относительная простота законов движения абсолютно твердого тела об- обусловлена уже тем, что для строгого математического описания его поло- положения в какой-либо системе координат требуется задавать гораздо меньше параметров (координат), чем для деформируемого тела. Число независимых параметров, однозначно определяющих положение тела в пространстве, на- называют числом степеней свободы. Посмотрим, чему равно число степеней свободы абсолютно твердого тела. Представим для большей наглядности, что наше тело имеет форму параллелепипеда, как изображено на рис. 2.5, и пусть линия АВ является пересечением каких-либо двух его граней. Пол- Полное число степеней свободы такого тела можно определить, например, как
2.3. ПРИБЛИЖЕНИЕ АБСОЛЮТНО ТВЕРДОГО ТЕЛА 33 сумму двух слагаемых: одно — это число степеней свободы точки А и дру- другое — это число независимых параметров, которые однозначно определяют положение тела при уже фиксированном в пространстве положении точ- это, например, три Д. 'vA{xA,yA,zA) У ки А. Число степеней свободы точки А равно трем декартовы координаты хА1 уА1 zA определяющие ра- радиус-вектор гА точки А в заранее выбранной системе координат (рис. 2.5 а). При фиксированном положении одной точки А положение всего тела еще может быть различным, и это положение можно окончательно за- зафиксировать, если задать три угла поворота #, (р и ш (рис. 2.5 б). Угол в — это угол наклона линии АВ к оси z исходной системы координат. Угол ср — это угол поворота линии АВ вокруг оси z при фиксированном угле наклона в. И, наконец, угол ш — это угол поворо- поворота всего тела вокруг линии АВ. Итак, число степеней свободы абсолютно твердого тела равно 6: три коор- координаты точки А — хА, уА, zA, и три угла поворота — #, <р, ио. Таким образом, для описания произвольного движе- движения абсолютно твердого тела необходимо знать, как меняются со временем всего 6 параметров, т. е. необхо- /д у димо знание 6 функций от времени: xA(t), yA(t), zA{t)^ 0(t), <p(t), uj(t). Хотя мы пока еще не знаем законов движения твердого тела, т. е. соотношений или урав- уравнений, позволяющих определить эти функции и, тем самым, предсказать траекторию движения тела, можно заранее предположить, что эти законы будут в общем случае очень сложными — даже из школьной математики мы знаем, что чем больше число неизвестных, тем сложнее решение задачи. Поэтому рассмотрим сначала движения, описание которых не требует столь большого количества зависящих от времени величин. Заметим для этого, что любое движение абсолютно твердого тела мож- можно разложить на два основных вида движения — поступательное и вра- вращательное. Поступательное движение — это такое движение, при котором .тис. 2.5 Рис. 2.6 Рис. 2.7 любая прямая, связанная с движущимся телом, остается параллельной са- самой себе (рис. 2.6). При вращательном движении все точки тела движутся по окружностям, центры которых лежат на одной и той же прямой, назывемой осью вращения (рис. 2.7). При этом происходит изменение ориентации те- тела. Отметим, что при конечных перемещениях поворота тела относительно
34 ГЛ. 2. ВВЕДЕНИЕ В КИНЕМАТИКУ только одной оси, вообще говоря, недостаточно, чтобы перевести его в новое положение. Сама ось вращения может находиться вне тела. Например, пере- перемещение тела из положения а в положение в на рис. 2.8 можно представить, как поступательное движение из положения а в положение б и последующего поворота тела на 180° вокруг оси АВ. Главным для нас является сейчас тот факт, что если абсолютно твердое тело совершает только поступательное движение, то все его положения в пространстве однозначно опреде- определяются положением всего одной какой-либо его точки, например, точки А на рис. 2.8. Сле- Следовательно, при математическом описании по- поступательного движения твердого тела его раз- размеры не играют роли, и все это тело можно С А В 1 ! Рис. 2.8 заменить точкой, положение которой в пространстве определяется в общем случае всего тремя степенями свободы — например, декартовыми коорди- координатами ж(?), y(t), z(t), определяющими радиус-вектор этой точки. Это и есть приближение материальной точки. Рассмотренный выше пример с поступательным движением твердого те- тела — не единственный, когда при описании движения «большого» тела его можно заменить материальной точкой. Замена «реального» тела на матери- материальную точку может быть оправдана и во всех тех случаях, когда в рамках поставленной задачи влиянием размеров тела можно пренебречь. Например, при вычислении траектории движения Земли вокруг Солнца можно прене- пренебречь ее вращением вокруг своей оси, а также ее размерами, т. к. они малы по сравнению с расстоянием до Солнца. В результате положение Земли в пространстве будет определяться одной точкой и описание ее движения зна- значительно упростится. Имеется еще одна очень важная причина, почему приближение матери- материальной точки играет в механике исключительную роль. Дело в том, что тело любого размера и любой формы можно представить как совокупность очень малых его частей, взаимодействующих друг с другом. Каждую из таких частей-частичек можно рассматривать как материальную точку и, следовательно, задачу о движении любого тела можно свести к задаче о движении совокупности материальных точек. И мы увидим в дальнейшем, что именно такой прием используется, например, при нахождении законов вращательного движения твердого тела и законов движения жидкости. Из всего вышесказанного следует, что приближение материальной точки (или, как говорят иногда, модель материальной точки) лежит в основе классиче- классической механики. 2.4. Преобразования Галилея и закон сложения скоростей Остановимся теперь на вопросе о том, как изменяется скорость и ускоре- ускорение материальной точки для наблюдателя, который переходит из одной си- системы отсчета в другую, движущуюся относительно первой. Так, например, если космическую ракету запускают с поверхности Земли, то ее скорость относительно Солнца определится правилом, по которому следует сложить
2.4. ПРЕОБРАЗОВАНИЯ ГАЛИЛЕЯ И ЗАКОН СЛОЖЕНИЯ СКОРОСТЕЙ 35 скорость ракеты относительно Земли и скорость самой Земли относительно Солнца. Принципиальный ответ на наш вопрос следует из того факта (являющего- (являющегося обобщением огромного массива опытных данных), что положение точки в пространстве и, соответственно, ее скорость и ускорение представляются векторными величинами. Тогда правило сложения векторов дает Г2 dr dt dr2 dt dt d^r_ dt2 " + a2. d2r2 dt2 dt2 r = ri или, что то же, v = vi + v2; a = Рассмотрим этот вопрос подробнее. Пусть имеются две системы отсче- отсчета, движущиеся друг относительно друга с постоянной скоростью vq (cm. рис. 2.9). Систему, обозначенную на рисунке буквой К, будем условно счи- считать неподвижной. Тогда вторая система К' будет двигаться равномерно и прямолинейно. Координатные оси обеих систем выберем так, чтобы оси Ох и О'х' совпадали, а оси Оу и 0'у' и оси Oz и O'z' были параллельны друг другу. Пусть коор- координаты некоторой движущейся материаль- материальной точки М в системе К равны ж, у, z, а в системе К' — ж7, у7, z'. Время начнем отсчитывать с того момента, когда начала координат обеих систем совпали. Установим сначала связь между координатами нашей движущейся точки в системах К и К', а по- потом определим связь между скоростями в разных системах. Как видно из рисунка х = х' + v^t. Очевидно также, что у = у' и z = z'. Одно из основных положений классической механики, обоб- обобщающее как повседневный опыт, так и огромный массив экспериментальной информации, утверждает, что при v <С с время абсолютно, т. е. в обеих на- наших системах время течет одинаково: t = t'. В результате получаем четыре соотношения: т — т7 4- vnt' 7/ — ?/ 7 — 7' t — t' A 1М называемых преобразованиями Галилея. Помня, что скорость — это производная радиуса-вектора по времени, най- найдем связь между скоростями точки М в обеих системах, продифференциро- продифференцировав соотношения B.15) по времени: dx dx' dy dy' dz dz' dt dt ' dt dt dt dt то есть соотношения между проекциями скоростей имеют вид Рис. 2.9 vv = v' vz = v' Последние три формулы эквивалентны следующему соотношению между вектором скорости v по отношению к системе К и вектором скорости v7 по отношению к системе К'\ v = v7 + v0. B.16)
36 ГЛ. 2. ВВЕДЕНИЕ В КИНЕМАТИКУ Продифференцируем по времени равенство B.16). Учитывая, что vq по- постоянна, получим % = % или а = а'. B.17) at at Другими словами, ускорение какого-либо тела во всех системах отсчета, движущихся друг относительно друга равномерно и прямолинейно, одина- одинаково. Вопросы и задачи 1. Сколько степеней свободы у материальной точки? Сколько степеней свободы у вело- велосипеда? 2. Придумайте задачу, когда при рассмотрении движения велосипеда его можно считать материальной точкой. 3. Вычислите ускорение Земли при ее движении вокруг Солнца, считая ее орбиту кру- круговой, и сравните это ускорение с ускорением свободного падения на поверхности Земли. Ответ: a/g ~ 6 • 10~4. 4. Начертите приближенно траекторию движения относительно Солнца какого-либо тела, покоящегося на экваторе Земли. 5. На рис. 2.10 — график зависимости скорости некоторого тела от времени. Постройте графики ускорения этого тела и пройденного им пути. 1 -1 / м/с /\ 1 \ 2\ \/ / А /\ 5 \ \/ /, с Рис. 2.10 Рис. 2.11 6. Шар радиуса R катится по горизонтальной плоскости без проскальзывания с уско- ускорением А. Определите ускорение точки В (рис. 2.11) в момент времени, когда скорость тела равна v. Ответ: ав = ^А2 + (v2/RJ.
ГЛАВА 3 ЗАКОНЫ НЬЮТОНА Как известно, основные законы механики в ее классическом варианте бы- были сформулированы Ньютоном. И хотя их формулировка была не вполне адекватна современному пониманию, они, тем не менее, с успехом послу- послужили основанием для построения динамики — науки о движении тел при заданном взаимодействии между ними. Благодаря глубокому пониманию физики дела и сильной математической интуиции, Ньютон ввел именно столько законов, сколько было нужно для этой цели — три. «Школьная» их формулировка читателю хорошо известна: v = const, если F = 0; C.1) F = та; C.2) Pi2 = -F21. C.3) Мы опускаем подробные пояснения, поскольку все обозначения — общепри- общепринятые. На сегодняшний день такая трактовка едва ли может нас удовлетворить. В самом деле, почему первый закон Ньютона C.1) не рассматривается как тривиальное следствие второго? Еще сложнее обстоит дело с зависимостью C.2). Эта формула содержит сразу две новых величины — силу и массу, которые следовало бы определять независимо. Поэтому нам следует дать согласованную и по возможности непротиворечивую формулировку главных законов динамики C.1)—C.3). 3.1. Закон инерции Ньютон при формулировке законов механики придавал должное значе- значение системе отсчета. Он полагал, однако, что не только время, но и про- пространство абсолютно, иными словами, постулировал существование выде- выделенной системы отсчета, связанной с пространством как таковым. Хорошим приближением к такой системе он считал систему координат, привязанную к «неподвижным» звездам. Именно в такой системе отсчета формулирова- формулировались законы Ньютона. Как следствие сильных неравенств, обуславливаю- обуславливающих применимость классической механики, это приближение оказалось не так уж и плохо. Но в действительности, как мы теперь знаем, звезды неподвижными не являются. Более того, развитие физики заставило научное сообщество от- отказаться от идеи абсолютного пространства. По современным представле- представлениям, никаких его аналогов (вроде, например, «мирового эфира») также не существует. Тем не менее, законы механики, включая релятивистскую и квантовую (но не общую теорию относительности!), принято формулировать
38 ГЛ. 3. ЗАКОНЫ НЬЮТОНА изначально в особой системе отсчета. Она базируется на понятии свободного физического тела. Свободно оно должно быть от взаимодействия с другими телами, а это возможно лишь для тела, абсолютно уединенного. В самом деле, сколь ни слабы были бы взаимодействия между двумя, тремя и т. д. телами, все же поля — их носители — на конечном расстоянии никогда в точности нулевыми не будут. Значит, совершенная свобода предполагает бесконечную удаленность тела, являющегося предметом рассмотрения, от любых других тел. Реальная физика, конечно, может трактовать это свойство исключитель- исключительно в смысле некоторого предельного перехода, а реальные ситуации рассма- рассматривать как приближения к описанному идеальному случаю с той или иной точностью. «Привязав» некоторую систему отсчета к такому телу, мы обнаружим, что в ней тело, ни с чем не взаимодействующее, покоится. Но тогда и в любых системах отсчета, движущихся относительно нашей выделенной равномер- равномерно и прямолинейно, ускорение свободного тела должно быть равно нулю. В нерелятивистской механике это прямо следует из соотношений B.17), в релятивистской же это свойство придется постулировать особо. Таких си- систем — бесконечно много (континуум), и все они равноправны, в каждой из них некоторое абсолютно свободное тело покоилось бы, а в общем случае произвольное свободное тело в произвольной системе отсчета такого рода должно двигаться с некоторой постоянной скоростью v. Система отсчета, в которой абсолютно свободное тело должно пребы- пребывать в состоянии покоя или равномерного прямолинейного движения, на- называется инерциальной. Именно в них принято формулировать физические законы, в частности законы механики, дабы придать им по возможности универсальную силу. Поскольку абсолютно свободное тело может мыслить- мыслиться лишь как идеализация, предельный случай, существование таких систем должно постулироваться на основе опыта обращения с физическими зако- законами. Существование хотя бы одной, а следовательно бесконечного числа инерциальных систем отсчета, и есть первый закон Ньютона в современ- современном его понимании. 3.2. Второй закон Ньютона Попытаемся привести закон C.2) к корректному виду. Для этого нам по- понадобится некоторое обобщение совокупности экспериментальных данных применительно к приближению материальной точки. Во-первых, опыт говорит о том, что для тел пренебрежимо малых раз- размеров или в случаях, когда по условиям задачи ориентационные степени свободы несущественны, взаимодействием тел определяется вектор уско- ускорения каждого тела. Во-вторых, если с телом, ускорение которого определяется в заданном си- силовом поле, жестко связать еще одно, точно такое же тело, то ускорение падает в два раза (при том, однако, что оба тела могут рассматриваться порознь и вместе как материальные точки). Дальнейшее обобщение этого факта может быть выражено так: при ускорении стоит некоторый аддитив- аддитивный коэффициент т. Это значит, что при жестком соединении любого числа произвольных тел закон C.2) останется в силе, причем масса совокупного
3.2. ВТОРОЙ ЗАКОН НЬЮТОНА 39 тела будет равна сумме масс тел, его составляющих. Мера коэффициента т произвольна и должна эталонироваться. В третьих, взаимодействие материальных точек друг с другом, а равно и их поведение во внешнем поле задается некоторой векторной величиной F — со всеми типичными свойствами векторов, включая правило векторного сложения (см. гл. 1). Ускорение каждого тела пропорционально F. Эта величина связана с законом Гука (см. гл. 9), а также с законом всемир- всемирного тяготения (см. ниже), и в итоге механика представляет собой сложную замкнутую систему взаимосвязанных физических соотношений. То обсто- обстоятельство, что закон C.2) подразумевает, как мы уже отмечали, введение сразу двух новых понятий, создает известные логические трудности. (Они обусловлены возможным произволом в определении массы и силы). Разуме- Разумеется, система всех физических понятий в целом свободна от этого парадокса, и в принципе, современная физика и рассматривает их в совокупности, опи- опираясь на известные экспериментальные данные. Обсудим более подробно вопрос о массе тела. Являясь фундаментальной физический величиной, масса определяет и инерционные и гравитационные свойства тел, т. е. определяет различные физические явления. В ньютонов- ньютоновской теории гравитации масса служит источником силы всемирного тяготе- тяготения, притягивающей все тела друг к другу. Как следствие, ускорение тела, свободно падающего в гравитационном поле, не зависит ни от его массы, ни от свойств вещества, из которого оно состоит. Эта закономерность проверена в поле Солнца с точностью порядка 10~12. Обычно ее называют равенством инертной и гравитационной масс. В нерелятивистском приближении, т. е. когда мы имеем дело со скоростя- скоростями, много меньшими скорости света, масса тела служит мерой содержаще- содержащегося в теле вещества и имеет место закон сохранения и аддитивности массы: масса изолированной системы тел не меняется со временем и равна сумме масс тел, состовляющих эту систему. Поэтому в нерелятивистской механике масса тела пропорциональна его объему. В то же время в релятивистской механике масса тела не является аддитивной величиной. Правильно гово- говорить лишь об энергии покоя тела. Эта энергия не равна сумме энергий покоя ее составляющих, необходимо учитывать еще энергию связи между части- частицами. Именно поэтому, например, масса ядра не равна сумме масс составля- составляющих его частиц — нейтронов и протонов. Однако, когда мы переходим к макроскопическим телам, величина энергии связи и поверхностная энергия оказываются столь малыми, что их можно не учитывать. Так, например, свободная поверхность воды дает вклад в массу порядка 7 • 10 кг/м2. В настоящее время за единицу массы принят килограмм — масса пла- тино-иридиевого тела, хранящегося в Международном бюро мер и весов во Франции. Определиться с соотношением между силой, массой и ускорением помо- помогает измерение веса тел в однородном поле тяжести. В земных условиях оно, правда, не так уж однородно, но того, с чем реально приходится иметь дело в повседневной жизни, вполне достаточно для введения первичного понятия. Опираясь на эксперименты с пружинными весами, — при малом относительном удлинении пружины (чтобы не сказалась нелинейность де- деформации) — можем ввести понятие веса как величины, пропорциональной удлинению пружины. Вес оказывается пропорционален массе тела: Fg ос га.
40 ГЛ. 3. ЗАКОНЫ НЬЮТОНА Затем, убедившись, что все тела в пустоте падают с одинаковым ускорени- ускорением д, приходим к соотношению Fg = тд. Оно явно выглядит как частный случай формулы C.2). Уравнение C.2) при исследовании движения тел предпочтительнее ис- использовать в виде F = m^. C.4) Тем самым исключаются возможные недоразумения в случае неравноуско- неравноускоренного или непрямолинейного движения. Второй закон Ньютона, согласно опыту, описывает произвольное движение материальлной точки. Сила тяжести представляет собой гравитационное взаимодействие, или гравитационное поле. Как мы уже отмечали в гл. 1, помимо гравитацион- гравитационного, лишь электромагнитное взаимодействие может быть предметом рас- рассмотрения классической механики. Но последнее проявляется часто не в «чистом» виде типа закона Кулона, а в форме приближенных, усреднен- усредненных сил, таких, например, как упругие силы и силы трения. Вывод их из основных законов электродинамики далеко выходит за рамки классической механики, которая пользуется феноменологическим описанием таких сил, базирующемся на обширном экспериментальном материале. Под действием приложенных сил всякое реальное тело деформируется, то есть изменяет свои размеры и форму. При этом меняют свое расположе- расположение и входящие в состав молекул тела элементарные электрические заряды. Под действием электромагнитных сил они стремятся восстановить свое пер- первоначальное положение, а вместе с ними и все тело стремится вернуться в исходное положение. Если после прекращения действия внешних сил тело принимает в точности первоначальные размеры и форму, деформация на- называется упругой. Упругие деформации наблюдаются в том случае, когда сила, обусловившая деформацию, не превосходит некоторого определенно- определенного для каждого конкретного тела предела (предела упругости). Возникаю- Возникающая в результате упругой деформации сила со стороны тела, обусловленная стремлением внутренних электрических зарядов восстановить свою перво- первоначальную конфигурацию, называется упругой силой. Возьмем пружину, имеющую в недеформирован- ,2 ном состоянии длину /о •> и приложим к ее концам равные по величине, противоположно направлен- направленные силы Fi и F2 (рис. 3.1). Под действием этих сил пружина растянется на некоторую величину А/, после чего наступит равновесие. Это означает, в со- соответствии со вторым законом Ньютона, что равна рис з.1 нулю векторная сумма сил, приложенных к телу. В точке, где приложена внешняя сила, равновесие об- обусловлено равенством этой силы и упругой силы. В то же время в каждой внутренней точке растянутой пружины равновесие обусловлено упругими силами, возникающими в пружине. Опыт показывает, что при небольших деформациях удлинение пружины А/ оказывается пропорциональным рас- растягивающей силе: А/ ~ F (F = F\ = F2). Соответственно, упругая сила оказывается пропорциональной удлинению пружины: F = kAl. C.5) А/
3.3. ЕДИНИЦЫ ИЗМЕРЕНИЯ И РАЗМЕРНОСТИ ФИЗИЧЕСКИХ ВЕЛИЧИН 41 Коэффициент пропорциональности к называется коэффициентом жест- жесткости пружины. Утверждение о пропорциональности между упругой силой и деформацией носит название закона Гука, названного в честь известного современника Ньютона. Оно относится не только и не столько к деформации пружины, но прежде всего к малым деформациям простых образцов, выпол- ннных из кристаллических веществ, а также — с большими оговорками — аморфных и высокополимерных материалов. Электромагнитное взаимодействие лежит также в основе сил трения, ко- которые играют очень важную роль при движении окружающих нас тел. Мы еще остановимся подробнее на этом явлении, здесь же отметим, что эффект трения обусловлен взаимодействием электронных оболочек атомов (моле- (молекул), прилежащих к поверхности тела. Из закона C.4) можно определить размерность силы через базовые (эта- (эталонные) величины и, соответственно, единицу силы — 1 ньютон: [*1 = N Ж =Я Н = 1 кг • м/с2. C.6) 3.3. Выбор единиц измерения и системы единиц. Размерности физических величин Остановимся подробнее на весьма важном вопросе о единицах физических величин. (Поскольку физика занимается самыми фундаментальными зако- законами природы, она порождает единицы измерения, которые используются также в химии, биологии и технических науках.) Законы физики устанавливают соотношения между физическими величи- величинами, доступными измерению. Измерить какую-либо физическую величину (например, время) означает сравнить ее с величиной того же вида (в нашем случае — с определенным промежутком времени), принятой за единицу из- измерения этой величины. В принципе, для каждой физической величины, не- независимо от других, можно выбрать свою единицу измерения. Например, за единицу ускорения можно было бы выбрать ускорение свободного падения д и «присвоить» ей какое-либо специальное название. Оказывется, однако, что можно ограничиться выбором единиц всего для нескольких величин, принятых за основные. При этом единицы измерения для всех остальных величин будут уже определяться автоматически через эти основные еди- единицы с помощью физических законов, связывающих выбранные величины друг с другом. Именно таким образом в настоящее время установлена Международная система единиц СИ (от начальных букв английского названия System In- International). Основными единицами СИ в Механике являютя единицы из- измерения для трех фундаментальных свойств окружающего нас мира: про- пространства, времени и массы. Конкретно, такими единицами в системе СИ являются: единица длины — метр (сокращенное обозначение — м), единица времени — секунда (с) и единица массы — килограмм (кг). Кроме этих трех единиц, СИ принимает в качестве основных единицу силы тока — ампер (А), единицу температуры — кельвин (К), единицу силы света — канделу (кд) и единицу количества вещества — моль. Об этих единицах пойдет речь в соответствующих разделах курса.
42 ГЛ. 3. ЗАКОНЫ НЬЮТОНА Выбранные единицы соответствующим образом связаны с эталонами ос- основных величин, о которых мы говорили ранее. Так метр равен 1 650 763,73 длин электромагнитных волн определенного типа, излучаемых атомами криптона (оранжевая линия криптона-86) и, приближенно, метр равен 1/40 000 000 доле длины земного экватора. Секунда равна сумме 9 192 631 770 периодов электромагнитных волн определенного типа, испускаемых атомом цезия, и приближенно она равна 1/86 400 средних солнечных суток. Нако- Наконец, килограмм совпадает с эталоном массы, то есть равен массе платино- иридиевого стержня, хранящегося в Международном бюро мер и весов во Франции. Эта масса близка к массе 1000 см3 чистой воды. На практике применяются также кратные единицы: километр Aкм = 103 м), сантиметр A см = 10~2 м), миллиметр A мм = 10~3 м), микрометр или микрон A мкм = = 1/i = 10~6 м), минута, равная 60 секундам, один грамм, равный 1/1000 килограмма и т. д. В исследовательской практике иногда пользуются вне- внесистемными единицами, удобными для каких-либо конкретных задач, на- например: 1 ангстрем (А) = 10~10 м; 1 электронвольт (эВ) ~ 1,6 • 10~19Дж; 1 парсек (пк) ~ 3,1 • 1016 м и т. д. В зависимости от порядка величины производных единиц для их наименования используются приставки: мил- ли- = Ю~3 микро- = 10~6, нано- = 10~9, пико- = 10~12, фемто- = 10~15; кило- = 10 , мега- = 106, гига- = 109, тера- = 1012 и т. д., а для обозначе- обозначения — соответственно: м, мк, н, п, ф; к, М, Г, Т. Как мы говорили, единицы измерения всех системных физических вели- величин являются производными от основных единиц. Так за единицу скорости в СИ принимается скорость равномерно движущегося тела, проходящего в единицу времени (секунду) путь, равный единице длины (метр). Обознача- Обозначается эта единица м/с. За единицу ускорения принимается ускорение равно- равномерно-переменного движения, при котором скорость тела за единицу време- времени (секунду) меняется на единицу скорости (на 1 м/с). Эта единица в СИ обозначается м/с2. Единица силы в СИ определяется соотношением C.6), 1 ньютон равен силе, под действием которой тело с массой 1 кг получает ускорение 1 м/с2. В тех случаях, когда единице измерения присвоено имя собственное, его сокращение принято писать с большой буквы, и не только как таковое, но и в составных сокращениях. Вот примеры: 1 ньютон = 1 Н, 1 милливольт = 1 мВ, 1 мегаджоуль = 1 МДж и т. д. Кроме системы единиц измерения СИ в науке и технике используются иногда и другие системы единиц. В научной практике часто применяется так называемая СГС-система. Основными единицами в этой системе явля- являются сантиметр, грамм и секунда. Единица силы в СГС-системе называется диной (дин). Одна дина равна силе, под действием которой тело с массой 1 г получает ускорение 1 см/с2. Между ньютоном и диной имеется следующее соотношение: 1 Н = 1 кг • 1 м/с2 = 103 г • 102 см/с2 = 105 дин. Нетрудно видеть, что изменение основных единиц влечет за собой измене- изменение производных единиц. Для того чтобы охарактеризовать эту связь про- производных и основных единиц измерения в физике вводится понятие размер- размерности физической величины, которая показывает, как изменяется значение единицы измерения этой величины при изменении основных единиц. Для
3.3. ЕДИНИЦЫ ИЗМЕРЕНИЯ И РАЗМЕРНОСТИ ФИЗИЧЕСКИХ ВЕЛИЧИН 43 обозначения размерности произвольной величины используется ее буквен- буквенное обозначение, взятое в квадратные скобки. Так, например, символ [v] означает размерность скорости. Размерность основных величин обозначает- обозначается специальным образом: размерность длины — L, времени — Т, массы — М. Таким образом, обозначив длину буквой /, время буквой t, массу бук- буквой т, можно написать: И = L; [т] = М; [t] = Т. Какова, например, размерность скорости? Модуль скорости определяется соотношением v = As/At (для сколь угодно малых At). Так как физиче- физические определения и законы не могут зависеть от выбора единиц измерения фигурирующих в них величин, размерности обеих частей уравнений, выра- выражающих эти законы, должны быть одинаковы. Размерность As равна L, размерность At равна Т. Следовательно, размерность скорости равна Последняя запись означает, что при увеличении единицы длины в п\ раз единица измерения скорости увеличится в п\ раз, а соответствующее чи- число, которым выражается скорость в этих единицах, уменьшится в п\ раз. А при увеличении единицы времени в П2 раза единица измерения скорости уменьшится в П2 раза, а выражающее скорость число увеличится в П2 раза. Например, пусть задано значение скорости v = 10 м/с, а мы хотим пред- представить ее в единицах (км/час). В этом случае п\ = 1000, а П2 = 3 600. В результате в новых единицах измерения значение скорости станет равным v = Ю • C 600/1 000) км/час = 36 км/час. Аналогично скорости можно установить размерность ускорения: а = [Av]/[At] = LT~l/T = LT~2. Размерность силы — см. C.6) — [F] = [т][а] =MLT~2. Аналогичным образом устанавливаются размерности всех прочих вели- величин. В каждом конкретном случае «инструментом» для введения новой еди- единицы служит физический закон, в котором впервые появляется соответству- соответствующая величина. Обратим внимание еще раз на методологическую проблему, которую в традиционном изложении порождает формула C.2). Отметим, что контроль размерности физических формул является мощ- мощным инструментом проверки правильности проведенных вычислений. Бо- Более того, в современной физике (а прежде всего — как раз в механике) на этой идее основаны некоторые теоретические методы получения новой ин- информации (точнее, они базируются на законах подобия или скэйлинге — родственных понятиях более высокого уровня). По этой причине в физиче- физических формулах обычно не принято доводить сокращение до максимально тривиального вида с точки зрения алгебры, вместо этого, предпочтитель- предпочтительно формировать сомножители с наиболее выразительной размерностью или безразмерные отношения.
44 ГЛ. 3. ЗАКОНЫ НЬЮТОНА 3.4. Понятие импульса. Третий закон Ньютона Закон C.4) описывает не только одномерное, но сколь угодно сложное дви- движение материальной точки со всеми особенностями траектории, обсуждав- обсуждавшимися в предыдущей главе. Он, конечно же, информативнее «школьной» формулы C.2), потому что прямо дает в наши руки дифференциальное урав- уравнение, решая которое при надлежащих начальных или граничных условиях, мы можем в принципе определить траекторию r(t). Но оказывается, что с физической точки зрения предпочтительна не ма- математически совершенная форма второго закона Ньютона C.4), а несколько иная: dp/dt = F, где р = rav. C.7) Величина р называется импульсом материальной точки (старое назва- название, до сих пор употребительное в теоретической механике — «количество движения»). Если записать C.7) в приближенной форме конечных малых приращений, Ар ~ FAt, то величина, стоящая в правой части, именуется импульсом силы за время At. В настоящее время этот термин употребляется редко. Представим теперь любое макроскопическое тело (неважно — твердое, жидкое, сыпучее) как совокупность материальных точек — мы присвоим каждой из них индекс суммирования, обозначив его в общем случае г. Тогда для тела в целом из C.7) следует: dp/dt = ^ Fj, где р = ^ га^. C.8) Опыт (включая прецизионные эксперименты) показывает, что соотноше- соотношения C.7), C.8) справедливы не только тогда, когда они тривиальным обра- образом следуют из C.4), но и в тех случаях, когда приходится иметь дело с телами переменной массы. Более того, C.7), C.8) могут быть перенесены в релятивистскую механику, где закон C.4) уже не имеет места. А в квантовой механике, где в принципе отсутствует понятие скорости, понятие импульса сохраняется и играет роль одного из самых фундаментальных. Наряду с энергией, которую мы введем в гл. 4, импульс принадлежит универсаль- универсальному языку физики, который может быть использован безотносительно к приближению, в котором мы работаем. Именно на этом языке формулиру- формулируется обобщение третьего закона Ньютона C.3) на случай любой, а не только ньютоновской, механики. Вводя понятие инерциальной системы отсчета, мы опирались на идеали- идеализированную модель уединенного физического тела. Мы предполагали при этом, что означенное тело можно либо смоделировать материальной точ- точкой, либо представить в виде жестко связанной совокупности таковых. Это, конечно, модель достаточно грубая — по крайней мере, атомы, из которых состоит любое макроскопическое тело, отнюдь не являются статическими системами, так как движение электронов в атоме или нуклонов в ядре — свойства неустранимые. Рассмотрим систему более свободную. Пусть мате- материальные точки не будут, вообще говоря, жестко связаны друг с другом. Они в общем случае все взаимодействуют друг с другом, но иногда этим
3.4. ПОНЯТИЕ ИМПУЛЬСА. ТРЕТИЙ ЗАКОН НЬЮТОНА 45 взаимодействием можно с заданной точностью пренебречь, а иногда, напро- напротив, образуют какие-то связанные ансамбли — систему макроскопических тел. Таким образом мы переходим от идеи абсолютно изолированного тела к идее замкнутой системы физических тел или, что то же, изолированной системы материальных точек. Фундаментальным законом природы является закон сохранения импуль- импульса: векторная сумма импульсов всех тел замкнутой системы в инерциаль- ной системе отсчета не изменяется со временем, хотя каждый из импуль- импульсов по отдельности может с течением времени испытывать существенные изменения. Если замкнутая система состоит из N тел, то закон сохранения импульса можно сформулировать в виде соотношения N 5^Рг(*) = mivi(t) +m2v2(t) + ... + mNvN(t) = const. C.9) г=1 Значение входящей в закон сохранения C.9) константы (инварианта) мо- может быть различным, и оно определяется начальными условиями, то есть значениями импульсов всех тел в момент образования замкнутой системы тел. Покажем теперь, что закон сохранения импульса, во-первых, дает возмож- возможность измерить массу любого тела путем сравнения ее с массой выбранного эталонного тела, и, во-вторых, позволяет выяснить физический смысл мас- массы, как особого свойства всех частиц нашего мира. Для этого рассмотрим простейший случай, когда замкнутая система состоит всего из двух взаимо- взаимодействующих тел. Тогда закон сохранения импульса C.9) принимает вид ™>ivi(t) + ТП2 v2(t) = const. C.10) Характер взаимодействия между телами не играет роли — это может быть звезда, вокруг которой вращается единственная планета, или два различных сталкивающихся резиновых мячика, воздействием на которые со стороны других тел можно по каким-то причинам пренебречь. Интересно отметить, что векторное равенство C.10) может быть изображено в виде треугольника (см. рис. 1.3 б), т. е. в любой системе отсчета векторы скоростей частиц в любой момент времени лежат в одной плоскости. Рассмотрим два момента времени: один — непосредственно перед столкно- столкновением, а другой — сразу после столкновения. Так как суммарный импульс при столкновении сохраняется, то мы получаем из C.10) mi vi (до) + 77^2 v2 (до) = mivi (после) + 7772V2 (после), где слева стоят значения скоростей до столкновения, а справа — непосред- непосредственно после столкновения. Последнее равенство удобнее представить как -mi [vi (после) - vi (до)] = 7772 [v2 (после) - v2(ao)], или в более компактной форме: — 777iAvi = 7772AV2. C.11) В последнем соотношении Avi и Av2 означают изменения скоростей соот- соответствующих тел в результате их столкновения. Эти изменения скоростей являются, как и сами скорости, векторными величинами, и направлены,
46 ГЛ. 3. ЗАКОНЫ НЬЮТОНА как следует из C.11), по одной прямой в противоположные стороны. Для модулей этих изменений скоростей Av± и Дг>2 получаем из C.11) равенство miAvi = ттт^Д^- C.12) Важно отметить, что величины A^i и Дг>2 могут быть измерены опытным путем. А теперь представим себе, что массу одного из сталкивающихся тел (на- (например, 77^2) мы условились считать эталоном массы (?772 = тпэ). Проводя то- тогда наблюдения за столкновением произвольного тела с эталонным телом, мы всегда сможем выразить с помощью соотношения C.12) его неизвестную до этого массу тх через эталонную массу тэ и через измеренные на опыте изменения скоростей: 777Ж = 777Э Av3/'Avx. На практике массу тела чаще измеряют, используя другие соотношения. Важная роль закона сохранения импульса для определения массы тела со- состоит в том, что при этом определении не требуется вводить никаких других величин, которые были бы нам до этого неизвестны. Необходимо лишь усло- условится об эталонной единице массы. Обсудим еще раз вопрос о том, какое физическое свойство тел характери- характеризует их масса — свойство, которое бы находило отражение в наших повсе- повседневных контактах с различными предметами. Из соотношения C.12) сле- следует, что чем больше масса тела, тем меньше оно изменяет свою скорость в процессе взаимодействия. Хорошо всем знакомое свойство тел оказывать со- сопротивление при попытках привести его в движение или изменить величину или направление его скорости назывется «инертностью». И мы видим, что чем больше масса тела, тем сильнее оно «сопротивляется» изменению его скорости. Таким образом, масса характеризует «инерционную способность» тела, и можно, следовательно, сказать, что масса тела является мерой его инертности, и в принципе может быть измерена на основе закона сохра- сохранения импульса. Во всяком случае, это единственный способ «взвешивания» элементарных частиц. Последним по порядку, но не по значению будет вывод из закона сохра- сохранения импульса классической формы третьего закона C.3). Рассмотрим за- замкнутую систему двух тел 1 и 2. Продифференцируем по времени условие постоянства их полного импульса Pi(t) + P2(t) = const. Получаем Pl(*)+P2(*)=0, а далее, учитывая для каждого из них закон C.7), приходим к окончатель- окончательному результату: Fi2 = — F21, где Fi2 — сила, действующая на тело 1 со стороны тела 2, и наоборот. Мы смогли указать точный «адрес» каждой силы, поскольку тел в нашей системе всего два. Поэтому то, что нами получено, еще не полностью экви- эквивалентно C.3). Доказательство в случае произвольного числа тел не столь математически очевидно; его проще оказывается провести «в обратную сто- сторону»: Z)Z) Z) ZJ F ° если
ВОПРОСЫ 47 (Условие второго суммирования j ф г подразумевает, что тело само себя ни тянуть, ни толкать в инерциальной системе отсчета не может, т. е. F^ = 0). Хотя закон сохранения импульса, как мы уже отметили, более универса- универсален с точки зрения современной физики, традиционный третий закон Ньюто- Ньютона C.3) в классической механике также занимает достойное место, особенно в статике — науке о равновесии физических тел и систем тел. Вопросы 1. Сформулируйте закон сохранения импульса. 2. Что такое масса и что такое сила? 3. Какой тип фундаментальных взаимодействий лежит в основе сил трения? 4. Что такое вес тела? 5. Какова размерность импульса? 6. Можно ли вывести закон инерции C.1) из второго закона Ньютона C.2)? 7. Является ли масса скалярной величиной? 8. Что общего между абсолютно свободным телом и замкнутой системой тел?
ГЛАВА 4 ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА 4.1. Исследование закона движения материальной точки Исследование закона движения означает получение временной зависимо- зависимости всех координат, определяющих положение тела в пространстве. В част- частности, для материальной точки это три координаты, определяющих зависи- зависимость r(t). Как мы уже знаем, второй закон Ньютона в формулировке C.4) представляет собой уравнение, содержащее не сам радиус-вектор, а его вто- вторую производную по времени. И если зависимость силы от положения мате- материальной точки известна, то есть известна зависимость F от г, то соотноше- соотношение C.4) предсталяет собой дифференциальное уравнение, где подлежащая определению функция r(t) входит под знаком производной. Если нам извест- известна зависимость действующей на тело силы от его положения в пространстве и если мы знаем положение тела и его скорость в какой-то один момент вре- времени, то мы можем с помощью уравнения C.4) вычислить его положение и скорость в любой из последующих моментов времени. Следовательно, вто- второй закон Ньютона дает возможность предсказать всю траекторию движе- движения материальной точки в зависимости от времени, если известны началь- начальные условия: начальное значение радиуса-вектора г@) и начальное значение скорости v@). Заметим, что бросая камень или мяч в цель, человек интуитивно исполь- использует приобретенную из опыта информацию о связи начального положения руки и ее начальной скорости с последующей траекотрией полета брошенно- брошенного предмета. Это приобретенное на опыте знание человечество использовало с первых шагов своей эволюции, но только после формулировки второго за- закона Ньютоном в XVII столетии у человека появилась возможность перейти от интуитивного предсказания характера движения тел к точному расчету, и это послужило одной из причин резкого ускорения технического прогресса на нашей планете. А теперь покажем, как второй закон «работает» в качестве инструмен- инструмента для вычисления траекторий движения. Пусть перед нами стоит зада- задача вычислить в зависимости от времени в некоторой инерциальной систе- системе траекторию движения тела массы т, которое можно рассматривать как материальную точку (рис. 4.1). Величина и направление силы, действующ- щей на тело в каждой точке пространства, предполагаются известными, то есть известна F(r) — зависимость этой силы от радиуса-вектора тела. Та- Такая ситуация встречается очень часто. Один из самых простых примеров — движение вблизи поверхности Земли под действием силы тяжести, которая везде равна по величине тд и направлена к поверхности. Начальные условия для движения рассматриваемого тела заключаются в том, что в некоторый начальный момент времени to нам, во-первых, известно
4.1. ИССЛЕДОВАНИЕ ЗАКОНА ДВИЖЕНИЯ МАТЕРИАЛЬНОЙ ТОЧКИ 49 положение тела в пространстве (то есть его начальный радиус-вектор го) и, во-вторых, известна его начальная скорость vq. Эта начальная ситуация изо- изображена на рис. 4.1 а, где также представлена шкала времени, которое мы разбили на малые интервалы At, разделяющие следующие друг за другом моменты ti, ?2, ^з? • • • и так далее. Будем подразумевать, что интервал At будет в конечном итоге выбираться сколь угодно малым, то есть устремлен к нулю. Это позволит нам использовать физические величины (скорость, ускорение), выраженные через производные по времени от соответствую- соответствующих фунукций. Но для наглядности будем пока представлять At просто как очень малый временной интервал. At At At Рис. 4.1 Теперь покажем сначала, что, зная го, vq и значение действующей на тело в точке го силы Fq, мы можем с помощью второго закона Ньютона опреде- определить Г]_ и vi — повое положение тела и его новую скорость через интервал времени At. Учитывая, что мы подразумеваем под At сколь угодно малый
50 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА интервал, перепишем определение скорости в виде v = dr/dt = Ar/At. D.1) Если применить это соотношение в точке го, то из него мы сразу получаем Аго — изменение начального радиуса-вектора тела за интервал At, то есть Аг0 = v0At. А зная это изменение начального положения тела, мы можем найти его новое положение, то есть новое значение радиуса-вектора в момент t\ (см. рис. 4.1 б): Г1 = г0 + Аг0 = г0 + v0 At. D.2) Найдем теперь с помощью второго закона новое значение скорости vi в мо- момент t\. Используем соотношения m(dv/dt) = F, v = dr/dt D.3) в точке го в момент to и определим из них приращение скорости: Av0 = (F0/m)At. D.4) Зная Avq, получаем для нового значения скорости в точке ri в момент t\: vi = v0 + Av0 = v0 + (F0/m) At. D.5) Итак, мы сумели, стартуя с начального положения тела, найти его новое положение на траектории ri и новую скорость vi в момент t\. Но теперь мы пришли к ситуации, полностью аналогичной начальной (см. рис. 4.1 в). И так как значение силы в новой точке ri нам известно, то, продолжая вы- вычисления точно тем же способом, мы шаг за шагом найдем положение и скорость тела во все последующие моменты времени ?2, ?з? • • • и так далее. Последнее и означает, что, зная начальное положение и начальную ско- скорость материальной точки, можно с помощью второго закона Ньютона вы- вычислить, то есть предсказать, всю последующую траекторию ее движения. На практике вычисление траектории осуществляют одним из двух спосо- способов. Во-первых, можно использовать компьютер, «поручив» ему проделы- проделывать всю ту процедуру последовательного нахождения точек траектории, о которой мы говорили выше. Для этого компьютеру надо только задать величину «временного шага» At и ввести в компьютер программу вычисле- вычислений, определяемых соотношениями D.1-4.5). Во многих случаях, однако, можно обойтись без компьютера. Мы говорили уже, что второй закон Нью- Ньютона является дифференциальным уравнением, конкретный вид которого зависит от физических условий задачи (фактически, от характера зависи- зависимости действующей на тело силы от его положения в пространстве — F(r)). Решение такого уравнения часто удается найти, используя хорошо извест- известные правила интегрирования и дифференцирования, а в некоторых случа- случаях (составляющих большую часть задач в студенчесих задачниках) даже с помщью элементарной алгебры. Некоторые примеры таких решений мы рассмотрим в последующих разделах. 4.2. Движение материальной точки под действием постоянной силы Перейдем сейчас от обсуждения общих свойств второго закона Ньютона как средства для вычисления траекторий к рассмотрению конкретных задач
4.2. ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ ПОД ДЕЙСТВИЕМ ПОСТОЯННОЙ СИЛЫ 51 и конкретных движений, которые можно детально исследовать с помощью этого основного уравнения механики. Как и при изучении любого явления, разумно начать с рассмотрения таких движений, которые, с одной стороны, допускали бы относительно простое математическое решение задачи, а, с другой, имели бы достаточно большое практическое значение. Закон движения тела, то есть зависимость его радиуса-вектора г от ?, определяется характером действующей на него силы и является, согласно второму закону Ньютона, решением уравнения D.3). В случае, когда на тело никакие силы не действуют, то есть F = 0, реше- решением уравнения D.3) является движение с постоянной скоростью v = const. Это простейший тип движения — свободное движение. Следующий по слож- сложности тип движения — это такое движение, при котором действующая на тело сила хотя и не равна нулю, но не меняется по величине и направлению при перемещении тела. Это означает, что правая часть первого из урав- уравнений D.3) является константой. Любое уравнение решается проще, когда входящие в него коэффициенты остаются постоянными, не зависящими от времени и координат, так что этот тип движения наверняка окажется наи- наименее сложным с точки зрения его математического исследования. С другой стороны, движение под действием постоянной силы является очень важным с практической точки зрения и часто встречается в повседневной жизни. Прежде всего к такому типу движения относится при определенных усло- условиях движение под действием силы тяжести. Сила тяжести, как и любая сила, является векторной величиной. Примем упрощающее предположение, что ее модуль постоянен и равен тд. Но так как эта сила направлена к центру Земли, то ее направление в разных точках земной поверхности раз- различно. Однако при исследовании движений тел, перемещающихся на рас- расстояния, которые намного меньше радиуса Земли (R ~ 6 000 км), можно пренебречь кривизной земной поверхности и с хорошей точностью считать, что сила тяжести не меняет своего направления, оставаясь перпендикуляр- перпендикулярной этой поверхности. В этих условиях сила тяжести может рассматриваться постоянной как по модулю, так и по направлению. Помимо силы тяжести, с постоянными силами приходится часто сталкиваться при рассмотрении работы различных технических устройств, когда их различные детали ис- испытывают действие постоянных сил со стороны других деталей. Мы подробно разберем случай движения тела под действием постоян- постоянной силы на конкретном примере определения закона движения брошенного камня или снаряда, вылетевшего из ствола орудия. Какой вид имеет тра- траектория камня? От чего зависит дальность полета? Аристотель утверждал, например, что на начальном участке траектория брошенного под углом к вертикали тела является прямой линией, и это, вроде бы, подтверждается непосредственными наблюдениями. Потребовалось почти два тысячелетия, чтобы понять, что траектория на самом деле является криволинейной на всех участках полета. Изучение движения брошенного тела включает в себя несколько этапов, характерных для решения большинства задач механики. Первый этап — определение типа движения. В нашем случае это означа- означает выяснение вопроса о том, можем ли мы пренебречь влиянием размеров те- тела при решении задачи, то есть, можно ли рассматривать его движение, как движение материальной точки, и, следовательно, применять второй закон
52 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА Ньютона D.3). В общем случае на брошенное тело помимо силы тяжести действует сила, порожденная обтеканием воздуха, которое зависит от раз- размеров и формы тела. Эта зависимость может сильно усложнить решение за- задачи и на практике может приводить к весьма замысловатым траекториям полета тела. Вспомним хотя бы о движении изобретенного австралийскими аборигенами бумеранга, который после броска возвращается к руке охотни- охотника. Однако во многих случаях эффектами обтекания можно с достаточной точностью пренебречь. Именно такой случай мы и будем расматривать, то есть мы воспользуемся для решения основным уравнением движения мате- материальной точки D.3). Второй этап — физическая формулировка задачи: выбор системы отсче- отсчета, определение действующих сил и начальных условий. Рассмотрим слу- случай, когда тело начинает движение в некоторой точке на поверхности Земли. В качестве системы координат выберем декартову систему, начало которой естественно поместить в эту точку. Оси Ох, Оу и Oz расположим так, чтобы ось Oz, была перпендикулярна поверхности, а век- вектор начальной скорости vq лежал, как на рис. 4.2 а, в плоскости zOx. Начальный модуль скорости vq и ее начальное направление, то есть угол а между vq и осью Ох, определяютя теми условиями и причинами, которые приводят камень или снаряд в движение. Это, например, расположение и скорость движения руки при бросании камня или наклон орудия и мощ- мощность порохового заряда. Система отсчета, связанная с поверхностью Земли, не является, строго говоря, инерциальной, так как z У га ^ \mg 0 x любая точка поверхности движется с ускорением, об- рис 4.2 условленным вращением Земли вокруг своей оси и вокруг Солнца. Но для многих практических задач этот эффект «неинерциальности» является несущественным, и мы будем полагать, что и в нашей задаче этим эффектом можно пренебречь и считать выбранную систему отсчета инерциальной. В инерциальной системе отсчета справедлив второй закон Ньютона D.3), где теперь под F подразумевается постоянная сила тяжести. Мы изобразили эту силу на рис. 4.2 а для неко- некоторого произвольного момента времени после начала движения, поместив тело массы т в некоторой произвольной точке над поверхностью. Истин- Истинное положение тела в различные моменты времени, то есть траекторию его движения, мы сможем определить только после окончательного решения задачи. Третий этап — математическая формулировка задачи: запись уравне- уравнений, соответствующих физической формулировке. Уравнение D.3) содер- содержит в качестве неизвестных векторные величины г(?) и v(t). Поэтому оно фактически представляет собой совокупность трех уравнений для трех про- проекций вышеупомянутых величин. Для проекций радиуса-вектора тела вве- введем обозначения: гх = х, гу = у, rz = z. Взяв проекции на оси координат от левой и правой частей уравнения D.3), мы получаем три уравнения: т (dvx/di) = О, vx = dx/dt; x@) = 0, vx@) = vo cos a, D.6) т (dvy/dt) = 0, vy = dy/dt; y@) = 0, vy@) = 0, D.7)
4.2. ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ ПОД ДЕЙСТВИЕМ ПОСТОЯННОЙ СИЛЫ 53 т (dvz/dt) = — тд, vz = dz/dt; z@) = 0, vz@) = vq sin a. D.8) Справа от каждого из уравнений записаны начальные условия, являющиеся неотъемлемыми элементами физической и математической формулировки задачи. Знак «минус» перед тд в последнем уравнении отражает тот факт, что сила тяжести направлена в отрицательном направлении оси Oz. Четвертый этап — математическое решение задачи. Теперь предстоит чисто «техническая» работа — решение сформулированных ранее уравне- уравнений с помощью известных в математике приемов и методов. В произвольном случае уравнения могут оказаться столь сложными, что их решение невоз- невозможно без привлечения компьютерной техники. В нашем же, относитель- относительно простом случае, решение уравнений D.3), удовлетворяющее начальным условиям, может быть найдено на основе элементарных знаний о правилах вычисления производных от простейших функций. Рассмотрим, например, уравнение D.8). Составляющая скорости vz имеет вид: vz = const — gt. Константу определяем из условия vz@) = vq sin а. Инте- Интегрируем еще раз: z(t) = const + ^otsina — gt2/2. Новую константу определяем из условия z@) = 0. Аналогично находятся решения уравнений D.6), D.7), так что окончательно решение выглядит следующим образом: x(t) =v0tcosa, y(*) = 0, z(t) =vot sin a-(gt2/2). D.9) Найденные выражения определяют зависимость от времени всех трех про- проекций радиуса-вектора г(?) тела, движущегося под действием силы тяжести. Тем самым задача о нахождении траектории движения решена. Для того чтобы ответить на вопрос, к какому типу геометрических кривых (гипербо- (гипербола, парабола и т. п.) относится найденная траектория, достаточно выразить t через х в первом из равенств D.9) и подставить результат в выражение для z(t). Это дает следующее уравнение траектории в плоскости zOx: '- DЛ0) Из геометрии известно, что это соотношение представляет собой уравнение параболической кривой, и следовательно, ни на одном из участков полета тела его траектория не является прямой линией (см. рис. 4.2 б). Из соотношения D.10) можно определить, например, дальность полета те- тела хи. При падении на поверхность z = 0, и из этого условия находим с помощью D.10) D.11) Пятый этап — проверка полученного решения. Этот, последний, этап является неотъемлемым и очень важным элементом решения всякой фи- физической задачи. Самым очевидным способом проверки является поэтапное повторение всего процесса решения. Но помимо этого существуют специаль- специальные приемы, позволяющие быстро проверить полученный ответ на наличие в нем грубых ошибок. Наиболее известны два таких приема. Прием первый — проверка ответа по размерности. Речь здесь идет о том, что полученный результат должен удовлетворять правилам размерности, о которой мы говорили в предыдущей главе. Если результатом вычисления является, например, скорость, то и ответ должен иметь размерность скорос- скорости. Если вычислялась сила, то ответ должен иметь размерность силы и т. п.
54 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА В нашем случае размерность полученного ответа правильна: Прием второй — проверка ответа по заранее очевидным результатам. Часто бывает так, что при некоторых значениях входящих в задачу фи- физических величин ответ можно «предсказать» заранее, так как он являет- является очевидным. Как правило, результат очевиден для предельных значений каких-либо величин, например, при нулевых или бесконечных значениях времени или расстояния, при нулевой или бесконечной массе и так далее. Проверим этим способом тот же результат D.11) для дальности полета тела. Очевидно, например, что при нулевой начальной скорости vq тело останется в исходном положении и дальность полета хи должна равняться нулю. Мы видим, что найденное нами решение удовлетворяет этому условию. Очевид- Очевидно также, что дальность должна равняться нулю, если начальная скорость направлена строго вертикально, и мы видим в D.11), что действительно, хи = 0 при а = тг/2. Наконец, очевидно, что в отсутствие силы тяжести (то есть при g = 0) дальность полета должна быть бесконечной, и мы видим, что наш ответ удовлетворяет и этому условию. Как и в случае с размер- размерностью, проведенная выше проверка не дает стопроцентной гарантии отсут- отсутствия ошибки (хотя бы, например, в численных коэффициентах). Но она, во всяком случае, страхует от совершения грубых ошибок. 4.3. Реактивное движение Во многих случаях траекторию и временные характеристики движения материальной точки можно установить, вообще не обращаясь ко второму закону Ньютона. Примером такой ситуации может быть реактивное дви- движение, которое осуществляется за счет выброса части общей массы тела в каком-либо направлении. Именно так движутся, например, космические корабли и обычные осветительные ракеты. Рассмотрим задачу о реактивном движении для наиболее простого слу- случая, когда ракета движется в дальнем космосе, так что воздействием на нее Земли и других планет можно пребречь. Решение всякой задачи о движении начинается, как мы уже знаем, с выбора системы отсчета. В качестве тако- таковой мы выберем некоторую инерциальную систему, конкретная привязка которой для данной задачи несущественна — это может быть система, связанная, например, с Солнцем или с какой-либо другой звездой. На > t+At п( ' v( ' рис. 4.3 а схематически изображена летящая ракета в некоторый момент времени ?, когда ее полная масса (масса корпуса и масса находя- находящегося в ней топлива) равна га(?), а скорость ^газ т+т равна v(t) и направлена вдоль положительно- отн го направления оси х декартовой системы ко- ординат. Предполагается, что топливо (в виде ис' ' раскаленных газов) выбрасывается из задней части ракеты таким образом, что ракета и выброшенное топливо движутся по одной прямой, совпадающей с осью х. Скорость выброса топлива относительно корпуса ракеты v0TU считается известной — она определяется конструктивными особенностями и зависит от типа топлива, формы сопла, температуры сгорания топлива в сопле и т. д.
4.3. РЕАКТИВНОЕ ДВИЖЕНИЕ 55 Будем далее предполагать, что эта скорость г>0Тн остается во время полета постоянной. Наша цель состоит в том, чтобы определить, по какому вре- временному закону будет перемещаться ракета и как будут меняться со време- временем ее скорость и полная масса. После выбора системы отсчета и задания физических условий задачи необходимо выяснить, можем ли мы рассматри- рассматривать движение ракеты как движение материальной точки, то есть считать его не зависящим от размеров ракеты. Только в этом случае мы сможем использовать, например, закон сохранения импульса. В нашем случае это приближение будет справедливо при условии, что ракета или реактивный снаряд не будет «кувыркаться» в полете. Не останавливаясь на формальном описании этого свойства (обусловленного динамикой твердого тела конеч- конечных размеров), ограничимся ссылкой на то обстоятельство, что аппарат, сконструированный должным образом, в полете устойчив. Чтобы понять, какие именно законы движения нам следует использовать, остановимся коротко на принципе реактивного движения. Этот принцип очень прост. Ракета воздействует определенным образом на выбрасывае- выбрасываемое из сопла вещество (газы). Выбрасываемое вещество, в свою очередь, воздействует на ракету и увеличивает ее скорость в противоположном на- направлении. Если воздействием всех других тел можно, как в нашем случае, пренебречь, то ракета вместе с выброшенным веществом является замкну- замкнутой системой. Суммарный импульс такой системы не меняется во времени, и именно закон сохранения импульса лежит в основе решения нашей задачи. Предположим, что за малый промежуток времени At масса и скорость ракеты получат приращения Am и Av (величина Am отрицательна). На рис. 4.3 б изображена ситуация к моменту времени t + At: ракета имеет к этому моменту полную массу т + Am и скорость v + Дг>, в то время, как выброшенная за время At масса газа Дгагаз летит относительно выбранной системы отсчета со скоростью vT3i3 = v — v0TU. Такая величина получается по правилу сложения скоростей, если учесть, что скорость ракеты направлена в положительном направлении оси ж, а скорость выброшенного топлива — в отрицательном. Из закона сохранения импульса следует, что суммарный импульс ракеты и топлива имеет одно и тоже значение в моменты t и t + At, то есть mV = (m + Am)(v + Av) + Am^^aa • D-12) Если устремить промежуток времени At, а с ним и приращения Am и Av к нулю, то в D.12) можно отбросить произведение Am • Дг>, как величину малую по сравнению со слагаемыми, содержащими малые приращения в первой степени (как бесконечно малую высшего порядка). Ввиду сохранения массы, Am + Amr3i3 = 0. Пользуясь этим, получаем из D.12) dm dv = -^отн , D-13) m где мы при переходе к бесконечно малым пределам заменили, как принято в математике, конечные приращения на дифференциалы соответствующих величин. Равенство D.13) — это соотношение между бесконечно малыми величина- величинами. Для того, чтобы получить соотношение между конечными, доступными
56 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА измерению, значениями скорости ракеты и ее массы, следует просуммиро- просуммировать левую и правую части равенства D.13). Такое суммирование бесконеч- бесконечно малых выражается, как известно, операцией интегрирования: Г [dm J J ГП где мы вынесли постоянное значение скорости газов г>0Тн за знак интеграла. Воспользовавшись известными правилами интегрирования, получаем v = —v0TU In m + С. Значение постоянной интегрирования С определяется начальными услови- условиями. Допустим, что в начальный момент времени скорость ракеты равна нулю, а ее масса равна то- Тогда предыдущее уравнение дает О = —v0TU In mo + С, откуда С = г>Отн In то- Следовательно, ^ = ^отн ln(mo/m), или mo/m = exp (v/v0TU) . D-14) Соотношение D.14) называется формулой Циолковского. Формула Циолковского позволяет рассчитать запас топлива, необходимый для сообщения ракете определенной скорости v. Допустим, например, что ракете надо сообщить «первую космическую скорость», то есть такую ско- скорость, чтобы она начала двигаться вокруг Земли по окружности. Эта ско- скорость приблизительно равна v = 8 км/с (в дальнейшем мы покажем, почему первая космическая скорость равна именно такой величине). В современных ракетах скорость газовой струи достигает нескольких километров в секунду. Если считать скорость газовой струи равной г>0Тн — 2 км/с, то из формулы Циолковского получается, что для достижения v = 8 км/с необходимо, что- чтобы отношение конечной массы ракеты к ее начальной массе было равно mo/m = 54,6. Это означает, что почти 98% массы ракеты приходится на топливо. Не представляет особых трудностей обобщение проведенного рассмотре- рассмотрения на случай переменной во времени скорости истечения газов. Для этого уравнение D.13) надо просто разделить на dt. Учтем также, что все импуль- импульсы и их приращения, входящие в D.12), суть истинные векторы, и придадим окончательному уравнению векторную форму: m(dv/dt) = u(dm/dt), D.15) где и — скорость истечения газа из сопла (в векторной форме нет нужды приписывать ей знак «—», как мы это делали с v0TH). Формула D.15) богаче по содержанию, чем D.13) или D.14). Она включает случай непараллельных v и и, что необходимо обеспечить при повороте ракеты. Более того, посколь- поскольку D.15) есть не что иное как модифицированный второй закон Ньютона, в него можно добавить любую внешнюю силу, и например, описывать таким образом подъем ракеты в поле тяжести Земли: m(dv/dt) = u(dm/dt) + F. D.16) Как мы видим, прямое использование второго закона Ньютона предоста- предоставляет большие возможности, нежели законы сохранения, но и решение при этом оказывается более трудным. Отметим в заключение этого параграфа,
4.4. КОЛЕБАТЕЛЬНОЕ ДВИЖЕНИЕ: ГАРМОНИЧЕСКИЕ КОЛЕБАНИЯ, РЕЗОНАНС 57 что уравнения вида D.16) в физике принято называть динамическими урав- уравнениями, а решения этих уравнений (типа соотношения D.14)) — интегра- интегралами уравнений. Кроме того, во всякой механической системе существуют функции, кото- которые остаются постоянными при движении. Эти функции называются ин- интегралами движения. Таковыми являются, например, энергия и импульс замкнутой системы. 4.4. Колебательное движение: гармонические колебания, резонанс Рассмотрим еще один пример того, как второй закон Ньютона позволяет исследовать особенности движения, широко распространенного в природе и технике. Речь идет о колебаниях, когда тело в той или иной мере повторяет траекторию своего движения. Часто такое движение возникает под действи- действием упругих сил — как, например, колебания пружин и элементов строи- строительных конструкций. Колебания могут возникать и в результате действия силы тяжести — таковы колебания всевозможных маятников. Изучение колебаний важно еще потому, что колебательные процессы встречаются не только среди механических движений, но они свойственны самым разнообразным явлениям природы. Так, например, на колебательных процессах основана вся радиотехника. Атомы в твердых телах непрерывно совершают колебательные движения, и характер этого движения опреде- определяет важнейшие свойства окружающих нас тел, таких как прочность или способность проводить тепло. Колебательное движение может иметь очень сложный вид. Мы рассмо- рассмотрим простейший тип — гармонические колебания, то есть такие колеба- колебания, при которых колеблющаяся величина (например, отклонение маят- маятника) изменяется со временем по закону синуса или косинуса. Этот вид колебаний, несмотря на свою простоту, осо- особенно важен по двум причинам: во-первых, многие колебания в природе и технике очень близки к гармоническим, и, во-вторых, пери- периодические процессы с любой другой зависи- зависимостью от времени могут быть представлены, как наложение (суперпозиция) истинно гар- гармонических колебаний. Основные особенности гармонических ко- колебаний мы рассмотрим на примере колеба- колебаний соединенного с пружиной тела массы т, находящегося на горизонтальной поверхнос- поверхности, трением о которую можно пренебречь (рис. 4.4 а). Наша цель — определить траекторию движения тела, и решение этой задачи, как и в предыдущем параграфе, можно разбить на несколько уже известных нам этапов. Первый этап — определение того, с каким типом движения мы имеем дело. Мы рассмотрим случай, когда тело можно рассматривать, как материаль- материальную точку, и использовать для нахождения его траектории второй закон Ньютона. Как и в предыдущем параграфе, постановку вопроса об адекват- адекватности такого приближения и возможных отклонениях от него нам придется отложить до знакомства с динамикой твердого тела конечных размеров. N Рис. 4.4
58 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА Следующий этап — выбор системы координат, определение действующих на тело сил и начальных условий. В нашей задаче естественно выбрать де- картову систему координат, у которой, например, ось Ох направлена вдоль пружины, а начало координат соответствует «равновесному» положению те- тела, когда пружина не растянута и не сжата. Мы должны также определиться с упругими свойствами пружины: это не может быть гибкая пружина, работающая только на растяжение, но прови- провисающая при сжатии. Мы предположим, что пружина симметричным образом реагирует на нагрузку любого знака: F= kx(t), где к — коэффициент жесткости пружины. При x(t) > 0 пружина растянута и упругая сила направлена в сторону, противоположную положительному направлению оси Ох (как на рис. 4.4 б). При x(t) < 0 пружина сжата, и упругая сила будет направлена в положительном направлении. Кроме упругой силы, на тело со стороны Земли действует сила тяжести Р и со стороны поверхности — упругая сила N (реакция опоры). Эти силы направлены по вертикали, вдоль оси Oz. Так как в этом направлении те- тело при горизонтальных колебаниях не испытывает ускорения, то эти силы должны быть по модулю равны. Теперь остается выбрать начальные условия, если они не заданы заранее условиями задачи. Мы рассмотрим случай, когда в начальный момент вре- времени пружина была растянута на некоторую величину жо, а скорость тела в этот момент времени была равна нулю. Взяв проекцию на ось Ох от левой и правой части второго закона Ньютона C.4), получаем окончательно следу- следующую математическую формулировку задачи о движении колеблющегося тела: тх = -кх; х@) = ж0, х@) = 0, D.17) где мы, как это часто принято, с помощью одной или двух точек над х обо- обозначили первую и вторую производную по времени. Знак «минус» в правой части уравнения отражает тот факт, что при положительных х (пружина растянута) упругая сила направлена в отрицательном направлении оси Ох, а при отрицательных х (пружина сжата) эта сила направлена в положитель- положительном направлении оси Ох. Теперь можно перейти к следующему этапу — нахождению решения урав- уравнения D.17), удовлетворяющего начальным условиям. Эта задача немного сложней той, которую мы решали, определяя траекторию движения тела под действием силы тяжести. Теперь сила зависит от координаты, причем эта зависимость описывается линейным законом: сила пропорциональна ко- координате. Чтобы найти функцию x(t), удовлетворяющую уравнению D.17), мы сначала перепишем это уравнение в более компактном виде х = —uJqX, с^о = у/к/т. D-18) В математике существуют специальные правила решения уравнений типа D.18). Но мы поступим проще. Уравнение D.13) означает, что искомая ве- величина x(t) удовлетворяет условию: вторая производная от нее по времени равна ей же самой со знаком «минус», умноженной на постоянную величину c^q. Вспомним теперь, что производная по времени от sinuiot равна с
4.4. КОЛЕБАТЕЛЬНОЕ ДВИЖЕНИЕ: ГАРМОНИЧЕСКИЕ КОЛЕБАНИЯ, РЕЗОНАНС 59 а производная от ujq cos uo^t равна —c^q sinct^- Другими словами, взяв вто- вторую производную от sinc^o^ мы получим — uJq sinc^o^ то есть функция sinc<;o? является решением нашего уравнения. Легко теперь убедиться, что решением нашего уравнения будет и более общая зависимость х от t по закону синуса: x(t) = D.19) где А и (р две произвольных пока константы, для определения которых как раз будет достаточно двух начальных условий нашей задачи. Из начальных условий D.17) с учетом D.19) имеем два соотношения: х@) = xq = A sin <р, х@) = 0 = cos (p. Из второго из этих соотношений следует ср = тг/2, а тогда из первого соот- соотношения имеем А = xq. Таким образом, удовлетворяющее начальным усло- условиям решение нашей задачи имеет вид x(t) = Xq Sin (ujQt + 7г/2) . j X D.20) Итак, отклонение тела х от положения равновесия меняется со временем по синусоидальному закону, то есть тело совершает гармонические колеба- колебания. На рис. 4.5 а графически представлена зависимость ж от t D.19) в слу- случае произвольных значений А и ср, а на рис. 4.5 б графически представлено наше решение D.20) в случае выбора конкрет- конкретных начальных условий. Так как синус ме- меняется в пределах от —1 до +1, то кон- константа А определяет максимальное откло- отклонение тела в обе стороны от равновесного положения х = 0. Это максимальное от- отклонение от положения равновесия в про- процессе гармонических колебаний называет- называется амплитудой колебаний. Амплитуда А — постоянная положительная величина. В нашей задаче амплитуда равна xq — на- начальному отклонению тела от равновесно- равновесного положения. Аргумент синуса (u)$t + Ф) называется фазой колебания, а значение фазы при t = 0, то есть константа ср, называется начальной фазой колебания. В нашей задаче начальная фаза равна тг/2. Поскольку синус — периодическая функция с периодом 2тг, различные по- положения тела, совершающего гармонические колебания, повторяются через такой промежуток времени Т, за который фаза колебаний получает прира- приращение 2тг (см. рис. 4.5 а). Этот промежуток времени Т называется периодом колебаний. Его можно определить из условия Рис. 4.5 2тг, откуда Т = 27T/W D.21) Число колебаний в единицу времени называется'частотой колебаний v. Чтобы найти связь между v и продолжительностью одного колебания Т,
60 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА следует, очевидно, поделить единицу времени на Т: и = 1/Т. D.22) За единицу частоты принимается частота таких колебаний, период которых равен одной секунде (одно колебание в секунду). Эту единицу называют герцем (Гц). Частота в тысячу герц называется килогерцем (кГц), в миллион герц — мегагерцем (МГц). Из D.21) следует, что си0 = 2тг/Т . D.23) Таким образом, uq равно числу колебаний за 2тг секунд. Величину uq на- называют круговой или циклической частотой. Она связана с обычной частотой v соотношением cjq = 2тпл D.24) Для нашей конкретной задачи о колебаниях тела на пружине по глад- гладкой поверхности значение ujq дается соотношением D.18), то есть оно опре- определяется массой тела и коэффициентом жесткости пружины. Для других возможных случаев гармонических колебаний их частота, как мы увидим позже, определяется другими физическими величинами. Это может быть, например, масса и размеры маятника, ускорение свободного падения. Для колебаний электрического тока в радиотехнических устройствах цикличе- циклическая частота зависит от электрических характеристик, таких как индуктив- индуктивность и емкость. Колебательное движение обладает одним интересным и практически очень важным свойством, заключающимся в его особой «чувствительности» к до- дополнительному воздействию на колеблющееся тело со стороны внешней силы, которая сама меняется со временем по =Fq sin со/ гармоническому закону. Чтобы понять основ- основные особенности этого явления, мы рассмот- х рим то же самое тело на пружине, движение ~" *~ которого мы только что изучали, но только рис< 4.6 теперь на тело вдоль пружины действует еще внешняя, как принято говорить, «вынуждаю- «вынуждающая» сила FB(t) (см. рис. 4.6). Пусть ее горизонтальная проекция изменяется со временем по закону: F?(t) = Fosmu;t. D.25) Как изменится движение нашего тела в этом случае? Уравнение движения с учетом дополнительной силы примет, очевидно, вид m(d2x/dt2) = -kx + Fo smut. D.26) Поделим обе части этого уравнения на т, после чего с учетом D.18) по- получаем d2x/dt2 = -ш%х + (Fo/m) smut. D.27) Даже без привлечения специальной математики представляется естествен- естественным ожидать, что по прошествии определенного времени движение нашего тела будет в определенной степени следовать за изменением вынуждающей силы, как это, например, происходит при раскачивании качелей. Самое про- простое предположение — это то, что через определенный промежуток времени
4.4. КОЛЕБАТЕЛЬНОЕ ДВИЖЕНИЕ: ГАРМОНИЧЕСКИЕ КОЛЕБАНИЯ, РЕЗОНАНС 61 тело будет совершать колебания с той же частотой, с какой колеблется вы- вынуждающая сила, то есть решение уравнения движения D.27) примет вид x{t) = Asmujt. D.28) Подставив это выражение в D.27), легко убедиться, что мы нашли правиль- правильное решение, если амплитуда А удовлетворяет соотношению —и2 А = — ojqA + Fq/гп. Определив отсюда А, получаем окончательно искомое решение уравнения движения D.27): Итак, под действием вынуждающей силы тело совершает гармонические ко- колебания с той же частотой о;, с которой меняется сама эта сила. И чем ближе оказывается частота вынуждающей силы и к частоте свободных колебаний тела с^о {собственной частоте), тем больше амплитуда результирующих колебаний тела, а при ио = с^о амплитуда вообще формально становится бесконечной. Для реальных систем амплитуда, разумеется, всегда остается конечной; в нашем случае бесконечность при ш = ujq обусловлена тем, что мы ограничились линейным приближением ж ос —ж и не учли влияния силы трения. При учете трения амплитуда, хотя и резко возрастает, но остается конечной величиной. Явление резкого увеличения амплитуды колебательной системы при со- совпадении частоты действующей на нее внешней переменной силы с соб- собственной частотой этой системы {частотой свободных колебаний) на- называется резонансом. Оно играет исключительно важную роль в науке и технике. Заметим, прежде всего, что детали многих машин и механизмов изготавливаются из упругих материалов и, следовательно, могут совершать гармонические колебания с определенными собственными частотами. Эти детали связаны с другими элементами конструкции или машины, которые могут оказывать на них меняющееся периодически со временем воздействие, играющее роль вынуждающей силы. И если частота этого воздействия ста- станет близкой к собственной частоте, то из-за резонанса могут возникнуть ко- колебательные движения с большой амплитудой, которые отрицательно ска- скажутся на работе механизма или даже приведут к его разрушению. Но, пожалуй, с полезными следствиями резонансных явлений в технике и науке приходится сталкиваться чаще. Например, в радиотехнике широко ис- используется тот факт, что амплитуда колебаний электрического тока в элек- электрических цепях может резко возрастать, когда частота подводимого к цепи внешнего электромагнитного поля (играющего роль вынуждающей силы) со- совпадает с собственной частотой колебаний тока в цепи. Настраивая свой ра- радиоприемник на определенную волну, мы как раз и добиваемся совпадения собственной частоты колебаний тока в приемнике с одной из частот прихо- приходящих издалека слабых электромагнитных волн. В научных исследоваеиях явление резонанса широко используется как основа так называемого спек- спектрального метода. Он состоит в экспериментальном определении возможных собственных частот исследуемого объекта (спектра собственных частот) пу- путем воздействия на него переменной вынуждающей силой и измерения тех ее
62 ГЛ. 4. ПРИМЕРЫ ПРИЛОЖЕНИЙ ЗАКОНОВ НЬЮТОНА частот, при которых наблюдается резонанс. С другой стороны, собственные частоты определенным образом связаны с внутренними свойствами объекта исследования. Поэтому, измеряя спектр собственных частот объекта, можно получить информацию о многих его важных внутренних свойствах, которые другими способами получить трудно или вообще невозможно. Вопросы и задачи 1. Какие начальные условия должны быть известны, чтобы можно было однозначно рассчитать траекторию движения материальной точки под действием заданной силы? 2. Что такое гармонические колебания? 3. Что такое фаза гармонического колебания? 4. Что такое резонанс? 5. Под каким углом к поверхности следует бросить камень, чтобы он улетел на макси- максимальное расстояние? Сопротивление воздуха не учитывать. Ответ: тг/4. 6. Лодка под парусом развила скорость vq. Найти зависимость скорости лодки после спуска паруса от пройденного лодкой расстояния х по стоячей воде, если силу сопроти- сопротивления воды движению лодки можно считать пропорциональной скорости? Ответ: v = vo — ах/т, где т — масса лодки, а — коэффициент сопротивления воды. 7. Чему равно Fr/F3 — отношение силы гравитационного взаимодействия электрона и протона в атоме водорода к силе их электрического (кулоновского) взаимодействия? Ответ: Fr/F3 ~ 1(Г40 (!). 8. Ракета стартует без начальной скорости в пространстве, свободном от силовых полей. Масса ракеты меняется по закону т = то ехр(—At), где постоянная А = 10~2с~1; скорость истечения газов из сопла и = 1 000 м/с. Какое расстояние LT пройдет ракета к моменту времени Т, когда ее масса уменьшится в п = 100 раз? Решение. Подставляя т и, соответственно, dm = —Хто ехр(—Xt) dt в закон сохранения импульса — и dm + mdv = 0, получаем dv = uXdt. С учетом начальных условий имеем v = dL/dt = uXdt, откуда L = uXt2/2. Из условия гпо/п = moexp(—AT) следует, что Т = 1п(п/А). Отсюда окончательно получаем LT = гбAппJ/2А ~ 1 000 км.
ГЛАВА 5 РАБОТА И ЭНЕРГИЯ. ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ ПРИ ДВИЖЕНИИ МАТЕРИАЛЬНОЙ ТОЧКИ ВО ВНЕШНЕМ СИЛОВОМ ПОЛЕ 5.1. Работа и кинетическая энергия В повседневной жизни из понятий механики нам приходится чаще всего сталкиваться с понятием работы. Каждый человек непрерывно работает с первых шагов своей жизни, перемещая с места на место различные предметы (в том числе, и свое тело), изучая науки в школе и институте и совершая по- потом определенные действия на рабочем месте. Вокруг нас работают тысячи машин и механизмов. Столь же часто, как понятие «работа», встречается нам и понятие «энер- «энергия»; это объясняется тем, что энергия, как мы увидим далее, отражает способность отдельных тел или сложных систем совершать работу. Поиск источников энергии всегда являлся одной из самых главных задач челове- человеческого общества. Важнейшим из них для нас является Солнце, электромаг- электромагнитное излучение которого приносит на Землю энергию, без которой само существование жизни было бы невозможным. Перейдем теперь к строгому определению этих понятий. В повседневной жизни понятие работы чаще всего связано с определеными усилиями, ко- которые приходится прилагать, чтобы переместить какое-либо тело из одного положения в другое. А посему строгое определе- определение работы объединяет величину перемещения те- F(r) ла с силой, которая действовала на тело в каждой точке этого перемещения. Пусть тело перемещает- перемещается из точки 1 в точку 2 под действием некоторой силы F(r), направление и модуль которой могут меняться вдоль траектории произвольным образом (рис. 5.1). Разобьем весь путь из 1 в 2 на столь ма- малые отрезки, что движение на этих отрезках можно х заменить на прямолинейное, а действующую на те- тело силу можно считать постоянной. Другими ело- ™ис< ^-l вами, представим всю траекторию как совокупность малых векторов пере- перемещений Аг. Проекцию силы F на каждый из из этих векторов перемещений обозначим F\\. Тогда по определению величина АА = F\\Ar = FArcosa E.1) называется работой, совершаемой силой F на пути Аг (Аг — модуль век- вектора перемещения Аг). Здесь угол а это угол между векторами F и Аг.
64 ГЛ. 5. РАБОТА И ЭНЕРГИЯ Определение работы E.1) можно записать более компактно, как скалярное произведение векторов F и Дг, а именно: АА = FAr. E.2) Полная работа, совершенная силой F на пути из 1 в 2, определяется, как сумма всех работ АА: ДО 2 до 2 а = y^ аа = YlFAr- E-3) от 1 от 1 В частном случае, когда траектория является прямой линией и сила F постоянна по модулю и направлена вдоль перемещения тела из точки 1 в точку 2 (cosa = 1), для полной работы из E.3) получаем: ДО 2 до 2 А = ^ FAr = F^2Ar = FR, E.4) от 1 от 1 где R — расстояние между точками 1 и 2. Работа может быть как положи- положительной, так и отрицательной — все зависит от угла между силой и пере- перемещением. Если в этом же примере сила была бы направлена не вдоль, а против перемещения тела (cos а = —1), то работа оказалась бы отрицатель- отрицательной (А = —FR). В этом случае говорят «над телом совершена работа». Чтобы вычислить работу для произвольной траектории и произвольной силы, следует в определении E.3) перейти к пределу Аг —>> 0. Переход к пределу избавляет от произвола в выборе малых перемещений Аг точно так же, как это было при определении скорости неравномерного движения через производную пути по времени. В нашем случае предельное значение Аг обозначается, как dr. При таком предельном переходе сумма в E.4) пре- преобразуется в интеграл, так что определение работы E.4) вдоль траектории от точки 1 до точки 2 окончательно можно записать в виде = ^Fdr. E.5) Величина работы, как видно из ее определения, не зависит от того, как долго продолжалось движение, но лишь от пройденного пути и действующей силы. Во многих случаях, однако, особенно в технике, оказывается важным и то, с какой скоростью совершается работа. Поэтому в механике вводится понятие мощности. Мощность — это работа, совершаемая в единицу време- времени, и ее строгое определение имеет вид W = SA/dt. E.6) Единицы работы и мощности. В системе СИ единицей работы являет- является дэюоуль (Дж), который равен работе, совершаемой силой в 1 Н на пути в 1 м. Единицей мощности в СИ является ватт (Вт). Ватт — это такая мощность, при которой за одну секунду совершается работа в один джоуль (Дж/с).Часто используют кратные единицы: киловатт A кВт = 103 Вт), ме- мегаватт A МВт = 106 Вт) и другие. Иногда (сейчас все реже и реже) можно встретиться с единицей мощности, которая называется лошадиной силой (л. с). Соотношение между ваттом и лошадиной силой: 1 л. с. = 736 Вт.
5.1. РАБОТА И КИНЕТИЧЕСКАЯ ЭНЕРГИЯ 65 На заре цивилизации полезную работу получали, используя мускульные усилия человека или домашних животных. Затем человек стал осваивать природные источники для совершения работы — такими были, например, водяные мельницы, где полезная работа совершалась за счет движения вод- водных потоков. И наконец, на рубеже XVII и XVIII веков была изобретена паровая машина, и это изобретение ознаменовало начало первой промы- промышленной революции, кардинально изменившей условия человеческого су- существования. Вслед за этим и родилось понятие об «энергии», как о некой субстанции, содержащейся в горячем паре, которая может превращаться в работу. С тех пор поиск все новых и новых источников энергии стал одной из основных научно-технических задач человеческого общества. Заметим сразу, что используемое в механике понятие энергии не содержит в себе каких-либо новых свойств пространства, времени и движения по срав- нениею с теми, которые нашли свое отражение, скажем, во втором законе Ньютона. Как мы сейчас увидим, эта физическая величина довольно про- просто выражается через известные уже нам механические величины, такие как масса, скорость и т. п. Важная роль энергии в механике определяется дву- двумя обстоятельствами. Во-первых, величина энергии тела или системы тел определяет возможность совершать работу. Во-вторых, мы покажем, исходя из второго закона Ньютона, что энергия замкнутой системы тел сохраня- сохраняется, и этот закон сохранения, как и закон сохранения импульса, является полезным инструментом при решении многих механических задач. Рассмотрим сначала простейший случай движения одного тела, которое можно рассматривать, как материальную точку. Его движение подчиняется второму закону Ньютона: ra(dv/d?) = F, где F — сила, действующая на тело. В механике вводятся два понятия: кинетическая энергия и потенциаль- потенциальная энергия. Мы начнем с обсуждения кинетической энергии. Кинетической энергией материальной точки Т называется величина Т = mv2/2. E.7) Сначала покажем формально, что кинетическая энергия тела характери- характеризует его способность совершать работу, а потом проиллюстрируем указанное свойство на конкретном примере. Начнем с того, что представим второй за- закон Ньютона в несколько иной форме. Для этого умножим скалярно левую и правую части уравнения C.4) на вектор dr — вектор бесконечно малого перемещения тела вдоль траектории. В результате получаем m(dv/dt)dr = Fdr. E.8) Перегруппировав бесконечно малые множители, запишем левую часть E.8) в виде m (dv/dt) dr = 777, dv (dr/dt) = mv dv. Скалярное произведение векторов по определению равно произведению их модулей на косинус угла между ними, то есть vdv = v \dv\ cos /3 = \v\ d\v\, где v и |ckj| — модули вектора скорости v и вектора бесконечно малого приращения скорости dv, f3 — угол между v и dv. В последнем соотношении
66 ГЛ. 5. РАБОТА И ЭНЕРГИЯ мы учли, что |dv|cos/3 есть составляющая бесконечно малого приращения скорости, которая направлена вдоль вектора скорости v и поэтому равна приращению длины (модуля) этого вектора dv (рис. 5.2). Это означает, что мы можем записать левую часть соотношения E.8) в виде га (dv/dt) dr = га d(v2/2). С учетом этого соотношения получаем вместо E.8) d (mv2/2) = F dr, или dT = 5A. E.9) Тем самым доказано, что изменение кинетической энергии материальной точки при при ее перемещении на бесконечно малое расстояние dr равно ра- работе, совершенной на этом расстоянии действующей на материальную точку силой. Обозначение малого приращения ра- т w_ v w vr^\ боты <L4, вместо дифференциала, является общепринятым. Так обозначаются в физи- физике приращения величин, не являющихся в пространстве функциями точки. Особенно важно будет отличать такие приращения от так называемых полных дифференциалов в термодинамике. О рис ^ 2 Если тело совершает конечное перемеще- перемещение вдоль некоторой траектории из точки 1 в точку 2 под действием силы F(r) (см. рис. 5.1), то всю эту траекто- траекторию можно разбить на элементарные бесконечно малые перемещения dr, по соотношению E.9) на каждом из этих перемещений определить изменение кинетической энергии, а затем просуммировать все эти изменения. Сумма бесконечно малых величин вычисляется с помощью интегрирования, так что для перемещения тела из точки 1 в точку 2 справедливо равенство '(r)dr= / 5А E.10) J J J 11 1 или, что то же, T2-Ti =AA ->2). E.11) Как мы уже неоднократно подчеркивали, сила есть истинный вектор, поэто- поэтому правая часть C.4) в общем случае представляет собой векторную сумму всех действующих на тело сил, как говорят, результирующую силу. Итак, приращение кинетической энергии материальной точки на любом отрезке траектории равно работе на этом отрезке результирующей всех действу- действующих на нее сил. Отметим, что приращение кинетической энергии может быть положительным или отрицательным в зависимости от знака суммар- суммарной совершенной силой работы (сила может либо ускорять, либо тормозить движение тела). Еще раз обратим внимание на то, что в правой части E.11) стоит величина, зависящая от формы траектории 1 —>> 2, что и выражается обозначением 5А. Из E.11) следует, что энергия имеет такую же размерность, как и работа, и, следовательно, измеряется в тех же единицах.
5.2. ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ. ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 67 mv\ Рис. 5.3 Полученное соотношение между работой и кинетической энергией указы- указывает на способ получения полезной работы путем использования кинети- кинетической энергии каких-либо тел. Это можно показать на следующем приме- примере. Представим себе горизонтальный цилиндр с поршнем (рис. 5.3). Пусть на поршень слева налетает какая-либо частица. В процессе столкновения с поршнем частица будет действовать на поршень с некоторой упругой силой, так что за время столк- столкновения поршень приобретет некоторую начальную скорость и, следовательно, некоторую начальную ки- кинетическую энергию Tq, из-за чего скорость частицы по модулю уменьшится, а, следовательно, уменьшит- уменьшится и ее кинетическая энергия на некоторую величину AT. Конкретные значения Tq и AT зависят от дета- деталей столкновения, и для наших рассуждений они сейчас не играют роли. Важно, что приобретенную поршнем кинетическую энергию можно теперь превратить в полезную работу. Если на поршень действует только сила тре- трения, то эта энергия будет «истрачена» на преодоление этой силы, то есть на перемещение поршня, как полезного груза, на определенное расстояние L. Если, например, сила трения FTp при перемещении остается постоянной, то величину L можно вычислить по формуле E.11), то есть из соотношения Tq = FTpL. Несмотря на несколько абстрактный характер нашего примера, рассмотренный способ превращения «чужой» кинетической энергии в полез- полезную работу послужил в свое время основой для создания первых паровых машин. 5.2. Потенциальная энергия материальной точки во внешнем силовом поле. Закон сохранения энергии Наряду с кинетической энергией важную роль в механике играет понятие потенциальной энергии, которое также тесно связано с понятием работы. Но если кинетическая энергия материальной точки оп- определяется, наряду с массой, модулем ее скорости, то потенциальная энергия, как мы увидим, зависит от по- положения тела в пространстве. Как и при обсуждении свойств кинетической энергии, мы будем пока рассматривать движение одной матери- материальной точки под действием заданной силы. Если за- задана векторная функция точки пространства F(r), то ее называют силовым полем. Функция F(r), во-первых, не должна зависеть от скорости тела (ни от величины, ни от направления), во-вторых, она должна быть по- постоянна во времени, и в-третьих, работа в данном силовом поле по любому замкнутому пути долэюна обращаться в нуль (см. рис. 5.4), что матемети- чески записывается следующим образом: Рис. 5.4 / с F(r) dr = 0. E.12) Такие силы (силовые поля) называют консервативными; для них и только для них может быть введено понятие потенциальной энергии.
68 ГЛ. 5. РАБОТА И ЭНЕРГИЯ Примем условно какое-либо произвольное положение материальной точ- точки за начальное (радиус-вектор этого положения в выбранной системе ко- координат обозначим го). Тогда потенциальной энергией U(r) материальной точки, положение которой по отношению к выбранной системе коорди- координат определяется радиусом-вектором г, называется работа, совершаемая действующей на эту материальную точку результирующей силой, при пе- перемещении материальной точки из положения г в начальное положение: U(г) = А(г -»¦ г0). E.13) Корректность такого определения следует из условия консервативности 1 О E.12). В самом деле (см. рис. 5.4), если § F(r) dr=0, то /F(r) dr= — /F(r) dr с о l при следовании в одном и том же направлении вдоль контура С. Заменим направление следования (т. е. движения) в любом из этих направлений на противоположное. Как следствие, получаем, что работа при перемещении между точками 0 и 1 не зависит от выбора пути, по которому оно происходит: и / F(r) dr = inv. Но это как раз и означает, что потенциальная энергия E.13) определена однозначным образом как функция координат. Проиллюстрируем наше определение важным примером. Опыт показы- показывает, что силы взаимодействия двух изолированных материальных точек зачастую направлены вдоль соединяющей их прямой и по модулю зависят только от расстояния между ними. Такие силы называются централь- центральными. Примером может служить си- сила гравитационного взаимодействия Солнца с планетой, если их рассма- рассматривать как точечные массы, или сила электростатического взаимо- взаимодействия двух точечных зарядов. Рассмотрим движение материальной точки под действием центральной силы, направленной, например, от одного и того же центра О и по мо- дулю зависящей только от расстоя- ния до него (рис. 5.5). Покажем, что работа при перемещении материаль- материальной точки из положения 1 в положение 2 по двум произвольным путям а и б одинакова, то есть от формы пути не зависит. Для доказательства проведем из центра О концентрические сферические поверхности, радиусы которых отличаются на бесконечно малую величи- величину dR. Эти поверхности рассекут обе наши траектории а и б' на бесконечно малые отрезки пути. Бесконечно малые отрезки криволинейной траектории можно заменить на бесконечно малые прямолинейные векторы перемеще- перемещений: на рисунке эти векторы перемещений между сферой с радиусом R и р хк
5.2. ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ. ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 69 сферой с радиусом R-\-dR по траекториям а и б'обозначены через dra и соответственно. Докажем сначала, что работа 6Аа вдоль перемещения dra равна работе 8А$ вдоль перемещения dr#. В соответствии с определением E.2) получаем для 5Аа: SAa = F(R) dracosa = F(R) dR. E.14) Аналогично получаем для dA$: SA6 = F(R) dr^cos /3 = F(R) dR. E.15) В написанных выше формулах угол а обозначает, как показано на рисунке, угол между силой F(r) и перемещением dra, а угол /3 — угол между F(r) и dr#. Кроме того, мы использовали равенства dra cos a = dr^cos C = dR. Сравнивая E.14) и E.15), мы видим, что действительно 6Аа = 6А^. По- Повторяя вышеприведенные рассуждения для всех отрезков пути а и пути б между соседними сферическими поверхностями, мы получим, что элемен- элементарные работы SA на всех этих отрезках равны, а, следовательно, равны и суммарные работы на путях а ж б. Так как пути а ж б были выбраны произвольно, то это означает, что работа, совершаемая при перемещении материальной точки центральной силой, не зависит от формы пути, а зависит только от начального и конечного положения этой материаль- материальной точки. Представим себе теперь, что на заданную материальную точку действуют силы со стороны N других материальных точек, причем все эти силы Fi, F2, ... F^ являются центральными. Результирующая сила, действующая на заданную материальную точку уже не является центральной — в разных точках пространства она mi «ч не будет направлена к какому либо одному и тому же центру (для наглядности на рис. 5.6 изобра- изображен случай, когда на материальную точку массы т действуют две центральные силы гравитацион- гравитационного притяжения со стороны двух материальных точек с массами mi и Ш2). Для дальнейших рассуждений воспользуемся рис ^ ^ тем фактом, что результирующая сила ?р равна векторной сумме составляющих ее сил Fi, F2, ... F^. Это заранее не оче- очевидное свойство сил, получило название принципа суперпозиции сил . Сле- Следовательно справедливо соотношение: N Fp = ^Fz, E.16) г=1 ж тогда элементарная работа при перемещении материальной точки на ве- величину dr при действии результирующей силы F^ может быть записана согласно определению E.2) в виде N N 5Ар = ?р dr = ^2 Fi dr = ^2 ^' E-17) г=1 г=1
70 ГЛ. 5. РАБОТА И ЭНЕРГИЯ где 6Ai — элементарная работа, совершаемая центральной силой Fj. Отсюда для полной работы Ар результирующей силы при перемещении из некоторой точки 1 в точку 2 получаем: \ N 2 N Ар= dAp = V / dAi = V Ai = Ах + А2 + ... + AN. E.18) \ г=1^ г=1 Каждая из работ Ai, A2, ... А^ совершается центральной силой и поэтому не зависит от пути. Следовательно и работа Ар не зависит от пути. Вернемся к определению потенциальной энергии E.13): U(r) = А(г —>> го). Так как работа не зависит от пути, то после выбора какого-либо нулевого положения го потенциальная энергия однозначно зависит только от поло- положения материальной точки в пространстве. Что касается выбора нулевого положения, то этот выбор определяется соображениями удобства решения конкретной механической задачи. Произвол в выборе нулевого положения приводит к тому, что потенци- потенциальная энергия определена с точностью до произвольной константы. В са- самом деле, вычтем из потенциальной энергии при одном выборе начального положения U (г) = А (г —>• го) потенциальную энергию при другом выборе начального положения U'(r) = А (г —>> г'о): U(r) - [/'(г) = А(т -> г0) - А(т -> г'о). E.19) Так как работа не зависит от пути, то справедливо соотношение А(г->го) = Л(г->г[,)+А(г[,->го). Подставляя это равенство в E.19), получаем U (г) = U1(г) + A(rfQ —>• го), то есть изменение нулевого положения действительно приводит к измене- изменению потенциальной энергии на величину А(т^ —>• го), не зависящую от г — положения материальной точки в пространстве. Сумма кинетической и потенциальной энергий называется полной энер- энергией материальной точки и обозначается обычно буквой Е: E(r) =T(r) + U(r). E.20) Покажем, что при движении материальной точки в поле консервативных сил или, что то же, в потенциальном поле ее полная энергия не меняется. Для этого воспользуемся соотношением, связывающим бесконечно малое изменение кинетической энергии с работой: dT = Fdr = 6A. E.21) Это равенство справедливо для движения под действием любой силы, а не только потенциальной. Но лишь в этом последнем случае его правую часть можно выразить через изменение потенциальной энергии: dU = U(r + dr) - U(r) = A(r + dr -> r0) - A(r -> r0). E.22) Так как работа в случае потенциальной силы не зависит от пути, то А(г ->> г0) = А(т ->> г + dr) + А(т + dr ->> г0).
5.2. ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ. ЗАКОН СОХРАНЕНИЯ ЭНЕРГИИ 71 С учетом этого равенства соотношение E.22) можно записать в виде &U = -А(т -> г + dr) = -6 А. Подставляя полученный результат в E.21), приходим к равенству dT = -dU, d(T + U)=0, dE = 0. Дифференциал (бесконечно малое приращение) любой функуции равен ну- нулю, если эта функция является константой, то есть мы получили Е(г) = Т(г) + f/(r) = const. E.23) Это соотношение выражает закон сохранения энергии. Укажем еще одно весьма полезное формальное следствие равенства E.22). Предположим вначале ради упрощения выкладок, что либо потенциальная энергия зависит только от одной координаты, либо движение происходит лишь вдоль одной координаты. В обоих этих случаях можем положить U = = U(x). Соответственно, в элементе работы 5А существенна лишь компо- компонента силы Fx (с учетом ее знака). Положив SА = Fx dx, получаем Fx = -dU/dx. E.24) В качестве примера приведем выражение для потенциальной энергии де- деформированной пружины. При малых деформациях связь между силой и смещением, как известно, линейна: F = — кх, что соответствует квадратич- квадратичной зависимости для потенциальной энергии: U = —кх1/2. В принципе ту же операцию мы можем провести и в общем трехмерном случае. Рассматривая малые перемещения вдоль осей Ож, Оу, Oz, мы полу- получим три дополняющих друг друга соотношения: dx ¦ х F --^- d У у, z = const dy z,x = const dz x,y = const Входящие в них производные по одной координате при фиксированных ос- остальных называются в математике частными производными и обозначают- обозначаются д/дх и т. д. Таким образом, вектор силы F в компонентах может быть представлен следующим образом: Fx = -(dU/дх), Fy = -(dU/ду), Fz = -(OU/dz). E.25) Эти соотношения имеют более общий характер, нежели сама ньютонова механика. В практическом отношении они удобны для вычисления силы, если известна потенциальная энергия как функция координат. Соотношения E.25) можно представить в компактной форме, введя фор- формально вектор V = е^д/дх) + е2(д/ду) + es(d/dz), который в математике называется градиентом. Мы еще неоднократно встре- встретимся с такими операторами в разделе «Электричество и магнетизм». Такой формализм позволяет переписать E.25) в предельно коротком виде: F = - W.
72 ГЛ. 5. РАБОТА И ЭНЕРГИЯ 5.3. О законе сохранения энергии и непотенциальных силах В элементарных курсах физики закон сохранения энергии E.23) зачастую толкуется упрощенно. Мы попытаемся в данном параграфе дать о нем более адекватное представление. Прежде всего заметим, что, сколь бы ни естественным казалось предполо- предположение о центральном характере сил взаимодействия между двумя матери- материальными точками, оно отнюдь не универсально. Например, взаимодействие между двумя электронами, движущимися с непараллельными скоростями, к потенциальным силам не сводится. Поэтому и примеры наши с централь- центральными силами (а они всегда потенциальны) — это именно примеры, но не доказательство. Эксперимент — основа любой естественной науки — показывает, что все многообразие силовых полей в рамках механики подразделяется на три класса. Помимо консервативных сил, нам придется рассмотреть еще гиро- гироскопические и диссипативные. Гироскопическими называются силы, работа которых всегда в точности равна нулю. Очевидно, F dr = О при F ф 0, если F _L dr, а поскольку dr = = v dt, то это означает Fl v. Примеров таких сил можно привести немного, наиболее очевидным является случай силы Лоренца, которая действует на частицу с зарядом q в магнитном поле В: F = q • [v В] => F _L v. Эти силы, как следует из самого определения, ни к потенциальной энергии, ни к закону сохранения энергии отношения не имеют. Диссипативными называются силы, работа которых понижает энергию Е = Т + U (диссипация — затухание, рассеяние энергии). Это силы трения, знакомые нам из школьного курса; к диссипативным относятся также силы вязкого сопротивления жидкости или газа (они-то и не дают парашюти- парашютисту падать с ускорением д), сила радиационного торможения при ускорении заряженных частиц и многие другие. Этим классом сил обусловлено то об- обстоятельство, что закон сохранения энергии E.23) в рамках одной только механики оказывается верным лишь приблизительно, с большей или мень- меньшей точностью. В принципе, полная энергия Е механической системы может даже расти во времени. Это просто означает, что наша система не достаточно хорошо изолирована от других тел, и над ней совершается работа извне. По этой причине точность закона E.23) не может быть выше той точности, с которой мы можем считать законы движения не зависящими от внешнего мира. Но как бы тщательно мы не изолировали механическую систему, сколь бы скрупулезно не учитывали количественно влияние внешней среды, мы никогда не сможем выполнить условие E.23) с любой наперед заданной точ- точностью, причем изменение полной энергии будет происходить именно в сто- сторону потерь. Это означает, что вступила в игру диссипация, и предельная точность закона E.23) определяется именно уровнем диссипации. Обычно при этом говорят: «Энергия сохраняется, но переходит в другие виды», но что такое эти «другие виды», нам еще предстоит разбираться на протяжении всего нашего курса. Мы рассмотрим пример сил трения между твердыми телами как наибо- наиболее хрестоматийный. Популярный образ зацепляющихся неровностей на по-
5.3. О ЗАКОНЕ СОХРАНЕНИЯ ЭНЕРГИИ И НЕПОТЕНЦИАЛЬНЫХ СИЛАХ 73 верхности соприкасающихся тел не дает правильного понимания природы явления, ибо сам механизм зацепления остается как бы «за скобками». В действительности в основе сил трения лежит электромагнитное взаимодей- взаимодействие электронных оболочек атомов и молекул. Феноменологические законы (т. е. законы, обобщающие напрямую опытные данные) представляют собой усредненные и огрубленные количественные соотношения. Сформулируем их для случая сухого трения скольэюения. Этим термином называют тре- трение между поверхностями двух твердых тел, скользящих друг по другу при отсутствии между ними какой-либо прослойки, например смазки. В слу- случае сухого трения сила трения возникает не только при скольжении одной поверхности по другой, но и при попытках вызвать такое скольжение у по- покоящегося вначале тела. В последнем случае она называется силой трения покоя. Рассмотрим два соприкасающихся тела 1 и 2, причем тело 2 закре- закреплено неподвижно (рис. 5.7). Пусть тело 1 прижимается к телу 2 с силой Fn, направленной по нормали к поверхности соприкоснове- соприкосновения тел. Она называется силой нормального давления. Она может быть обусловлена притяжением первого те- тела к Земле (силой тяжести) или другими причинами. Если тело 1 (вместе с телом 2) в инерциальной системе тр отсчета не перемещается в вертикальном направлении и его ускорение в этом направлении равно нулю, то это N означает согласно второму закону Ньютона, что на него рис ^ у со стороны второго тела действует уравновешивающая сила, равная по модулю Fn и направленная вверх. Ее называют силой ре- реакции опоры и обычно обозначают через N. По своему происхождению она аналогична упругой силе и также обусловлена электромагнитным взаимо- взаимодействием молекул в поверхностныхобластях тела 1 и тела 2. Если попытаться переместить первое тело, подействовав на него внеш- внешней горизонтальной силой F, то обнаружится, что для каждой конкретной пары тел и каждого значения силы нормального давления имеется опре- определенное минимальное по модулю значение Fq силы F, при котором тело 1 удается сдвинуть с места. При значениях внешней силы, заключенных в пределах 0 < F < Fq, тело остается в покое. По второму закону Ньютона это возможно только в том случае, когда сила F уравновешивается равной ей и противоположно направленной силой, которая и есть сила трения по- покоя FTp (см. рис. 5.7). Эта сила, действующая на тело 1 со стороны тела 2, по модулю равна величине внешней силы F до тех пор, пока последняя не превосходит наибольшего значения силы трения покоя Fq. Из опыта следу- следует, что во многих практически интересных ситуациях сила Fq оказывается пропорциональна нормальному давлению Fn: Fq = aoFn. Когда внешняя сила F превзойдет по модулю Fq, тело начнет скользить, причем до некоторого значения скорости проскальзывания движение будет равномерным. При этом, как следует из второго закона Ньютона, сила тре- трения должна быть равна по модулю составляющей приложенной силы, па- параллельной соприкасающимся поверхностям, и полностью ее уравновеши- уравновешивать. Отсутствие у тела ускорения означает, что скорость проскальзывания зависит от приложенной силы, и притом нередко весьма сложным образом. Увеличивая приложенную силу F', мы в конце концов превзойдем предель- предельную силу трения скольжения, и далее движение будет происходить уже с
74 ГЛ. 5. РАБОТА И ЭНЕРГИЯ ускорением ma = F + FTp; FTp = Fmax = aFni E.26) причем при специальной обработке соприкасающихся поверхностей сила трения скольжения может оказаться практически не зависящей от скоро- скорости движения тела и, что особенно интересно — от площади соприкоснове- соприкосновения трущихся тел. Разумеется, эти свойства не являются ни вполне точны- точными, ни вполне универсальными, но все же правильно описывают большой массив экспериментальных данных. Безразмерный коэффициент пропорци- пропорциональности называется коэффициентом трения (соответственно покоя «о или скольжения а). Он зависит от природы и состояния трущихся поверх- поверхностей, в частности от их шероховатости. Коэффициенты трения покоя и скольжения практически никогда не совпадают друг с другом. Попробуем проанализировать эту ситуацию с точки зрения закона сохра- сохранения энергии. Из E.26) легко усмотреть, что работа силы F уже не равна приращению кинетической энергии тела mv2/2. Часть ее, равная работе си- силы трения f FTp cLr, как бы «исчезает» — это и есть диссипация. Еще выра- выразительнее проявляются диссипативные эффекты при FTp < .Fmax — работа совершается, но кинетическая энергия не изменяется. Энергия, соответствующая работе сил трения, переходит к атомам поверх- поверхности — увеличивается их кинетическая энергия. Это увеличение кинети- кинетической энергии атомов находит свое отражение в повышении температуры трущихся поверхностей. (Подробнее о связи хаотического движения атомов вещества с его тепловыми свойствами будет рассказано в одном из последую- последующих разделов курса — термодинамике). Поэтому говорят, что «потерянная» из-за трения кинетическая энергия переходит в тепло. Она может перехо- переходить также в акустические возбуждения, электромагнитные волны и даже радиоактивные излучения, но сути дела это не меняет. Получим формальное соотношение, определяющее изменение полной энер- энергии материальной точки из-за действия на нее неконсервативных сил. Для этого воспользуемся соотношением E.9), связывающим бесконечно малое изменение кинетической энергии с работой: dT = F dr = (FK + FH) dr = 6AK + dAH, где FK обозначает результирующую всех консервативных сил, a FH — ре- результирующую всех неконсервативных сил. Пусть тело совершает конечное перемещение по некоторой траектории из точки 1 в точку 2. Тогда бесконеч- бесконечно малые изменения в полученных соотношениях следует просуммировать вдоль этого участка траектории: 2 2 [ dE= f 5AU, или E2-Ei= AHA -+ 2). 1 1 Итак: при действии на материальную точку неконсервативных сил измене- изменение ее полной энергии на любом участке траектории равно работе на этом участке результирующей неконсервативных сил. В частности, работа сил трения скольжения всегда отрицательна, так как они всегда направлены против перемещения тела, поэтому силы трения всегда приводят к умень- уменьшению полной механической энергии движущегося тела.
5.4. ПРОСТЫЕ ПРИМЕРЫ 75 Таким образом, когда мы говорим, что в изолированной системе энергия сохраняется, это означает, что энергия может переходить из одной формы в другую, но ее количество остается постоянным, оно не зависит от времени. Закон сохранения энергии является строгим законом природы, справедли- справедливым для всех известных взаимодействий. 5.4. Простые примеры Закон сохранения энергии — не только фундаментальный закон приро- природы, но и эффективный метод решения задач. В этом отношении полезны любые законы сохранения (как принято называть их в механике — инте- интегралы движения), и принцип их использования совершенно универсален — не решая уравнений движения (например, не вычисляя траекторию матери- материальной точки), сразу же связать начальное и конечное состояния системы. Именно по такому принципу мы выводили формулу Циолковского из закона сохранения импульса. Начнем с движения материальной точки под действием силы тяжести. Чтобы использовать закон сохранения энергии для исследования движе- движения, необходимо сначала определить конкретное выражение для потенци- потенциальной энергии, то есть найти ее зависимость от положения тела в про- пространстве. Для этого необходимо выбрать в пространстве некоторую произ- произвольную точку с радиусом-вектором го и вычислить работу, совершаемую силой тяжести при перемещении материальной точки с массой т из заданного положения г в положение tq. Чтобы сделать изложенную выше процедуру более наглядной, воспользуемся рис. 5.8. На этом рисунке положение материальной точки с массой т определяется ее радиусом-вектором г в декартовой системе координат xyz, у кото- которой плоскость хОу совпадает с поверхностью Земли. Для определения потенциальной энер- энергии выберем точку с радиусом-вектором го в лю- любом месте на поверхности Земли. Работу силы тяжести при перемещении из точки г в точку го, которая, как мы знаем, не зависит от пути, вычислим вдоль пути, со- состоящего из двух отрезков: вдоль вертикали до поверхности и далее вдоль произвольной траектории по поверхности до точки с радиусом-вектором tq. На первом участке работа равна произведению модуля силы тяжести тд на величину пути до поверхности Земли, т. е. на координату z нашей ма- материальной точки. А на втором участке работа равна нулю, так как здесь сила всюду перпендикулярна перемещению. Таким образом, работа силы тяжести при перемещении материальной точки из положения с радиусом- вектором г в положение с радиусом-вектором го, то есть потенциальная энергия, U(r) = mgz. Следовательно, закон сохранения энергии при движении материальной точки под действием только силы тяжести имеет вид следующего соотно- соотношения, справедливого для любой точки траектории: = mgz рис Е = mv2(r)/2 + mgz = const. E.27)
76 ГЛ. 5. РАБОТА И ЭНЕРГИЯ Если, например, тело начинает падать с некоторой высоты zq с нулевой на- начальной скоростью, то из закона сохранения энергии E.27) легко получить закон нарастания скорости по мере приближения тела к поверхности: = mgz + mv2(z)/2 => v(z) = \/2g(zQ — z). Определим выражение для потенциальной энергии и для второго простей- простейшего типа движения материальной точки, рассмотренного в предыдущей главе, — для гармонических колебаний груза по поверхности под действием упругой силы со стороны пружины (см. рис. 4.5, 4.6). В качестве произволь- произвольного начального положения с радиусом-вектором го в определении потенци- потенциальной энергии используем равновесное положение груза при х = 0. Тогда потенциальная энергия в положении х равна работе упругой силы Fy = —кх при перемещении материальной точки из положения с координатой х в по- положение с координатой х = 0: U(x) = kx2/2. Таким образом, закон сохра- сохранения полной энергии при гармонических колебаниях материальной точки по поверхности записывается в виде mv2(x)/2 + кх2/2 = const. E.28) С помощью этого соотношения можно решать многие задачи о гармониче- гармонических колебаниях, не прибегая к интегрированию уравнений движения. Так например, если нам задана начальная скорость груза vq в положении равно- равновесия х = 0, то из E.28) легко найти амплитуду xq возникающих после этого гармонических колебаний. При максимальном отклонении скорость груза, а следовательно и его кинетическая энергия равны нулю. Применяя E.28) к начальному моменту времени и к моменту, когда достигается максимальное отклонение, получаем ?т>о/2 = fc#o/2, хо = vo^m/k. Особо подчеркнем, что закон сохранения энергии при движении во внеш- внешнем силовом поле справедлив только при движении материальной точки под действием сил, постоянных во времени. (В противном случае условие E.12) не было бы инвариантно по отношению к выбору траектории г(?)). О таком движении говорят ино- иногда, как о движении в постоянном силовом поле, понимая под словом «поле» пространство, каждой точке которого соответствует вектор действующей в пространстве силы. (На рис. 5.9 в качестве при- примера изображено постоянное силовое поле силы тяжести). Если условие постоянства силового по- поля не выполняется, полная энергия материальной точки, вообще говоря, не сохраняется. С одним из таких примеров мы имели дело в предыдущей гла- главе, когда рассматривали явление резонанса, возни- возникающего при колебаниях тела, на которое помимо упругой силы действует еще внешняя вынуждающая сила. Полная энергия в этом случае растет с ростом амплитуды вынужденных колебаний. Полезно рассмотреть также пример, когда для решения задачи исполь- используется не сохранение энергии, а ее полная диссипация. Это также нередко дает возможность получить простой ответ, не решая уравнений движения.
5.5. РАВНОВЕСИЕ И УСТОЙЧИВОСТЬ 77 Уменьшение энергии, обусловленное действием сил трения, можно опре- определить с помощью соотношения между изменением кинетической энергии и работой E.11), которое часто оказывается полезным при решении задач. В качестве наглядного примера рассмотрим такую v задачу (рис. 5.10). На горизонтальной поверхности лежит тело массы т, которому в начальный мо- 777Tt мент сообщают скорость поступательного движе- движения vq. Из-за трения о поверхность тело остана- останавливается на некотором расстоянии / от исходного Рис- 5.10 положения. Чему равно это расстояние, если коэффициент трения равен al Ответ можно, конечно, найти путем решения соответствующего уравнения движения (второго закона Ньютона). Но решение можно проще и короче получить с помощью соотношения E.11), из которого сразу получаем 2 = FTpl = amgl, I = Конечно, результат этот приблизителен, а иногда может быть и просто неверен, поскольку мы воспользовались приближением постоянной силы трения. Но принцип решения подобных задач наш пример демонстрирует должным образом. 5.5. Равновесие и устойчивость Механика — наука о движении, но состояние покоя есть частный случай движения. Наиболее «рафинированное» состояние покоя (или движения с постоянной скоростью) присуще уединенному телу, но этот случай предста- представляет собой идеализированную модель и никогда не реализуется. Наблюда- Наблюдаемое в принципе состояние покоя в системе отсчета, которую мы с необхо- необходимой точностью можем считать инерциальной, всегда сводится к одному из двух частных случаев. 1. Силы, действующие на тело, столь малы, и/или характерное время задачи столь коротко, что в пределах точности эксперимента либо точно- точности решения теоретической задачи мы вправе пренебречь ускорением. Если Ах — характерный пространственный масштаб, a At — временной, F — масштаб действующей силы, а М — массы, то мы можем рассматривать тело как покоящееся при условии Аж> (F/M)(AtJ. 2. Другой возможный случай, в меньшей степени обусловленный малы- малыми характерными временами, — случай равновесия. Как было определено в гл. 3, сила есть вектор, а второй закон Ньютона C.4) — закон векторный. Мы уже отмечали, что это обстоятельство — обобщение огромного масси- массива экспериментальной информации, и что вектор — величина, не просто определяющаяся модулем и направлением, но и обладающая некоторыми специальными свойствами, в частности, она подчиняется принципу супер- суперпозиции. Как следствие, если к телу приложены две, три и т. д. силы, то ускорение определяется их векторной суммой: т
78 ГЛ. 5. РАБОТА И ЭНЕРГИЯ Равновесие материальной точки означает, что векторная сумма сил, к ней приложенных, равна нулю: \ = 0. E.29) Если же речь идет о равновесии макроскопического тела, одного усло- условия E.29) недостаточно. К особенностям движения и равновесия тела ко- конечных размеров мы обратимся в гл. 7, здесь же ограничимся бесспорным обобщением формулы E.29): тело пребывает в равновесии, если для любой из материальных точек («физически бесконечно малых объемов»), каковые из этого тела можно выделить, выполнено условие E.29), включающее как внешние силы, приложенные непосредственно к данному элементу, так и силы взаимодействия с другими элементами данного тела. Разумеется, ни для макроскопического тела, ни даже для такого, которое можно предста- представить как материальную точку, равенство E.29) никогда не выполняется с совершенной точностью, однако условие малости, позволяющее пренебречь ускорением, налагается уже не на каждую из действующих сил, но лишь на их векторную сумму. Условия равновесия тел рассматриваются обычно в разделе теоретической механики, именуемом статикой. Мы не будем в нашем курсе изучать ее детально, но остановимся на одном из важнейших вопросов как в механике, так и вообще в физике — проблеме устойчивости равновесия. Помимо точности, с которой выполнено само условие равновесия E.29), существует еще одна причина, способная выводить из равновесия тело или систему тел. Она заключается в хаотических внешних воздействиях, кото- которые невозможно учесть в рамках E.29). Они могут иметь, например, тепло- тепловую природу (поскольку тепловые эффекты обусловлены движением на мо- молекулярном уровне), динамикой Вселенной («свет далекой звезды» вполне может нарушить равновесие идеальной системы), но даже и «заморожен- «замороженная» в мысленном эксперименте Вселенная не будет свободна от квантовых флуктуации (это предмет следующего тома нашего курса). Таким образом, равновесие лишь постольку реализуемо, поскольку меха- механическая система устойчива по отношению хотя бы к достаточно малым внешним воздействиям. Наука об устойчивости сложна и обширна, но мы введем некоторые основные понятия на примере одномерной устойчивости равновесия материальной точки — см. рис. 5.11. Щх) i Щх)/\ Щх) а Рис. 5.11 1. Если при малом нарушении равновесия возникает отклик в виде возвра- возвращающей силы, материальная точка не может уйти из точки равновесия xq слишком далеко (рис. 5.11 а). Само воздействие может заключаться либо в перемещении точечной массы в некоторую точку х ^ xq, либо в придании ей
ВОПРОСЫ И ЗАДАЧИ 79 некоторой начальной скорости. Она, однако, останется в некоторой окрест- окрестности точки жо, если выполнено условие dU/dx > 0 при х > 0; dU/dx < 0 при х < 0, что сразу следует из E.24). Иными словами, устойчивому равновесию от- отвечает минимум потенциальной энергии, что в одномерной задаче эквива- эквивалентно условиям: dU/dx\x=Xo = 0, d2U/dx2\x=xo > 0. E.30) Как мы уже знаем из гл. 4, эффект возвращающей силы сводится к неко- некоторым колебаниям вблизи положения равновесия. Если функцию dll(x)/dx можно при малых отклонениях линеаризовать, то это будут просто гармони- гармонические колебания — например, D.18). При учете трения либо иных механиз- механизмов диссипации (вязкость, излучение акустических или электромагнитных волн, химические реакции и пр.) колебания должны быть затухающими, и частица со временем — по крайней мере, асимптотически — возвращается в положение равновесия. 2. Предположим, что функция U(x) не имеет минимума в точке равнове- равновесия (рис. 5.11 б, в). Тогда нет и устойчивости. В случае максимума U(x) — рис. 5.11 б— смещение частицы в любую сторону приводит к тому, что и ускорение оказывается направлено в сторону смещения, так что вернуться в точку xq частица не может. В ситуации, изображенной на рис. 5.11 в, частица может вернуться в жо, если либо смещение, либо начальная скорость были отрицательны — но вернется она только один раз, а далее воспроизводится сценарий, соответствующий рис. 5.11 б. Иногда выделяют особо случай без- безразличного равновесия, когда F(x) = 0, т. е. U(x) = const. Но он отличается от вариантов рис. 5.11 б в лишь функционально, возвращения частицы в по- положение равновесия не происходит. Истинное устойчивое равновесие может быть обусловлено лишь минимумом потенциальной энергии E.30). В современной механике и физике различают линейную и нелинейную устойчивость. Проблема иллюстрируется рис. 5.11 г. При малых отклонени- отклонениях от равновесия частица в него возвращается. Но если она выходит за гра- границу |ж — жо| > А или ей сообщают кинетическую энергию, превышающую [/о, частица в равновесие уже не вернется. Величины Uq и А определяют порог нелинейной неустойчивости. Легко сообразить, что при достаточной амплитуде воздействия любая система оказывается нелинейно неустойчи- неустойчивой — хотя бы на уровне разрушения. Но это уже вовсе не обязательно связано со случайными самопроизвольными отклонениями от равновесия. Все примеры данного параграфа достаточно естественным образом пере- переносятся и на неодномерный случай, и на случай макроскопических тел, а равно и сложных систем, когда, быть может, не все параметры систе- системы ?j, определяющие устойчивость, сводятся к пространственным координа- координатам. Правильный язык для такого «перевода» — формализм потенциальной энергии, а главная проблема — отыскание функции ?/(?]_, ?2, • • • )• Вопросы и задачи 1. Что такое потенциальная энергия материальной точки? 2. Что такое принцип суперпозиции сил? 3. Может ли потенциальная энергия быть отрицательной?
80 ГЛ. 5. РАБОТА И ЭНЕРГИЯ 4. Почему затухают колебания пружины? 5. Почему нагреваются трущиеся поверхности? 6. Имеет ли значение знак потенциальной энергии для устойчивости равновесия? 7. Тело, размерами которого можно пренебречь, начинает скользить с нулевой началь- начальной скоростью по гладкой поверхности, образованной четвертью сферической поверхности радиуса R из ее верхней точки. Достигнув нижней точки, тело продолжает двигаться по шероховатой поверхности, где коэффициент трения скольжения равен а. Чему равно рас- расстояние /, которое тело пройдет по шероховатой поверхности до остановки? Переход от криволинейной поверхности к плоской горизонтали считать сглаженным так, что удара в этой точке не происходит. Ответ: / = R/a. 8. Какова минимальная работа, которую надо затратить, чтобы втащить волоком тело массы т на горку длины L и высоты Н? Коэффициент трения равен а. Ответ: Ат-1П = тд(Н + aL). 9. Математический маятник (груз малых размеров на легком подвесе длины I) находит- находится в положении равновесия. Определите, какую скорость v надо сообщить грузу, чтобы он мог совершить полный оборот, для двух случаев: груз подвешен а) на жестком стержне и б) на нити. Ответ: a) v2 ^ 4gl; б) v2 ^ Ъд1. Указание. Во втором случае скорость в верхней точке должна быть достаточно велика, чтобы сила тяжести не превышала необходимой центростремительной силы. 10. На столе лежит доска массы М = 1 кг, а на доске — груз массы т = 2 кг. Какую силу F надо приложить к доске, чтобы она выскользнула из-под груза? Коэффициент трения между грузом и доской равен а\ = 0,25, а между доской и столом — «2 = 0,5. Указание. Сумма сил, действующих на доску, равна F\ = F — [ai(M + m)g + a2mg], на груз — i*2 = ot2mg. Чтобы доска могла выскользнуть из- под груза, ее ускорение должно быть больше ускорения груза, т. е. F\/M ^ F2/m. Отсюда получаем F ^ (а\ + аг) х х(М + т)#~ 22,5 Н. i 11. Тело массы т колеблется без трения, двигаясь по Рис 5 12 ДНУ к0Р°бки массы М, лежащей на горизонтальной поверх- поверхности стола, под действием двух пружин жесткости к\ и &2 (см. рис. 5.12). Коэффициент трения коробки о стол равен а. При какой амплитуде коле- колебаний тела А коробка начнет двигаться по поверхности стола? Ответ: Amin = [а(М + т)д]/(к1 + к2). м к ч ШШ
ГЛАВА 6 ЗАМКНУТАЯ СИСТЕМА ТЕЛ. ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ И ВНУТРЕННЯЯ ЭНЕРГИЯ 6.1. Особенности движения замкнутой системы из двух взаимодействующих материальных точек. Приведенная масса Руководствуясь правилом «от простого — к сложному», мы до сих пор из- изучали наиболее простые движения, при которых размеры тела не играют ро- роли, т. е. использовали приближение (модель) материальной точки. При этом мы рассматривали лишь случай, когда сила, действующая на материальную точку, известна (движение в поле тяжести, гармонические колебания, закон сохранения энергии при движении в постоянном силовом поле). Теперь мы сделаем следующий шаг — рассмотрим особенности движения нескольких взаимодействующих материальных точек. В этом случае дей- действующую на каждую из них силу со стороны остальных тел нельзя уже считать заданной величиной, так как она зависит от меняющегося положения этих остальных тел, траектории движения которых заранее не извест- известны. Так, например, в одном узле сложного меха- механизма часто оказываютсясоединенными несколько деталей, оказывающих воздействие друг на друга рис g i и совершающих друг относительно друга сложные движения. Один из простейших примеров такого взаимодействия изображен на рис. 6.1: две материальные точки с массами mi и т2 соединены пружи- пружиной и совершают по горизонтальной плоскости колебания друг относитель- относительно друга. Ситуация здесь отличается от той, которая рассаматривалась в гл. 4, где мы изучали гармонические колебания од- одного тела, соединенного пружиной со стенкой. Изучение движения нескольких взаимодействую- взаимодействующих тел мы начнем с простейшего случая — движе- движения всего двух материальных точек, при движении которых можно пренебречь всеми действующими на них силами, кроме сил, с которыми они действуют друг на друга. Другими словами, эти две материаль- материальные точки образуют замкнутую систему тел. Массы о этих тел обозначим mi и тп2 (рис. 6.2). Силу, дей- рис g ^ ствующую на тело 1 со стороны тела 2, обозначим Fi2. Она, в соответствии с третьим законом Ньютона, равна по величине и противоположна по направлению силе F21, действующей на тело 2 со сто- стороны тела 1. Положение наших тел в некоторой произвольно выбранной инерциальной системе отсчета определяется в момент времени t соответ- соответствующими радиусами-векторами этих тел Ti(t) и Г2(?).
82 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Перейдем к изучению особенностей движения этих двух тел с помощью второго закона Ньютона. Записав этот закон для каждой из материальных точек, получим следующую систему уравнений относительно интересующих нас радиусов-векторов ri и г2: m1(d2r1/dt2)=F12(|r2-r1|), m2(d2r2/dt2)=F21(|r2-r1|). {ЬЛ> Прежде всего мы рассмотрим задачу об относительном движении двух тел. На языке математики относительное движение определяется зависи- зависимостью от времени радиуса-вектора r(?) = r2 — ri, соединяющего две рас- рассматриваемые материальные точки. Уравнение для г(?) легко получить из нашей системы двух уравнений F.1) следующим способом. Поделим обе ча- части первого из уравнений на mi, а обе части второго уравнения поделим на т2. После этого вычтем из левой и правой частей второго уравнения левую и правую части первого, соответственно. В результате получаем L2 = ( — + — ) F2i(|r2 - ri|), где мы учли, что Fi2 = —F2i. Последнее уравнение можно окончательно записать в виде где буквой \i мы обозначили величину, которая называется приведенной мас- массой и которая равна \i = mim2/(mi + m2). F.3) Уравнение F.2) отражает замечательное свойство задачи о движении двух взаимодействующих материальных точек: задача об относительном движе- движении двух материальных точек в замкнутой системе сводится к задаче о движении одной материальной точки с приведенной массой под влиянием той же самой силы взаимодействия. Одним из примеров замкнутой системы двух тел являетя система «Солн- «Солнце-Земля», если пренебречь влиянием других тел солнечной системы, что в действительности можно сделать с хорошей точностью. Для вычисления траектории движения Земли относительно Солнца нет необходимости ре- решать систему из двух уравнений F.1), т. е. находить сначала ri(t) и г2(?) (траектории Солнца и Земли в некоторой инерциальной системе координат) и только после этого уже определять r(?) = r2(?) — ri(t) (траекторию отно- относительного движения). Вместо этого можно сразу найти траекторию отно- относительного движения, решая всего одно уравнение F.2), что и сделал в свое время Ньютон, блестяще подтвердив расчетами знаменитые опытные зако- законы Кеплера. Правда в этом случае в уравнение относительного движения войдет приведенная масса, которая для системы «Солнце-Земля» равна (л = MCMJ(MC+M3) = MJA + MJMC). Масса Солнца примерно в двести тысяч раз больше массы Земли. Поэтому во многих практически важных задачах отношением масс в знаменателе по- последней формулы можно с хорошей точностью пренебречь, и считать, что приведенная масса для системы «Солнце-Земля» совпадает с массой Земли.
6.2. ЦЕНТР МАСС СИСТЕМЫ МАТЕРИАЛЬНЫХ ТОЧЕК 83 Что касается задачи об относительном движении двух тел, соединенных невесомой пружиной (рис. 6.1), то в этом случае на тела помимо упругой силы, играющей здесь роль силы Fi2, действуют еще сила тяжести и реак- реакция опоры. Эти силы, однако, уравновешивают друг друга и не оказывают влияния на движение тел. Поэтому в отсутствие сил трения движение тел по горизонтальной поверхности подчиняется законам движения замкнутой системы, и, следовательно, задача об их относительном движении сводится к рассмотренной в гл. 4 задаче о движении одного тела, но с приведенной массой. Например, для случая колебаний двух тел с одинаковой массой га их приведенная масса /i, в соответствии с F.3), равна га/2. Тогда для вычи- вычисления, скажем, частоты относительных колебаний таких двух тел можно воспользоваться уже известной нам формулой D.18) для частоты колебаний одного тела, соединенного пружиной со стенкой, а именно, lo = у/к/ II = л/2/с/га, т. е. частота колебаний в рассматриваемом случае в у2 раз больше, чем в случае колебаний одного тела. 6.2. Центр масс системы материальных точек Если бы мы не вычитали, а складывали уравнения F.1), у нас получился бы просто закон сохранения импульса (d/d?)(raivi + 7772 v2) = 0. Его можно переписать чисто формально как закон постоянства во времени некоторой скорости Vc: Vc = (raiVi + 7772V2)/G77i + 7772) = COnst. F.4) Перейдем в систему отсчета, движущуюся со скоростью F.4). Скорости частиц 1 и 2 при этом преобразуются следующим образом: , лг vi - v2 , v2 - vi Vi = Vi — \c = 7772 5 V2 = V2 — \ c = 777i , E.5) т. е. в новой системе отсчета они выражаются через скорость относительного движения. Свяжем скорость Vc с радиусом-вектором некоторой точки тс: d miri+: dt 7771 + ГП2 Отметим, что определение F.6) совпадает с известным из школьного курса физики понятием центра тяжести. Для доказательства перенесем начало координат в точку гс. Тогда, совершенно аналогично F.5), получим ri = rl — rc = Ш2 5 r2 = Г2 — rc = ml ' Таким образом, rair^ = — ra2i*2 (центр тяжести определяется равенством произведений массы на «плечо»). Но определения F.4) и F.6) более коррект- корректны и более универсальны, поскольку без каких-либо проблем обобщаются на любое число материальных точек, а следовательно, и на макроскопиче- макроскопические тела. Точку С в механике — и вообще в физике — принято называть центром масс или центром инерции системы материальных точек.
84 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Пусть в некоторой инерциальной системе координат положения взаимо- взаимодействующих материальных точек с массами mi, Ш2, ... mN задаются в ка- каждый момент времени t посредством радиусов-векторов т\(ъ), Г2(?), ... ?N{t) (см. рис. 6.3 а). Тогда центром масс рассматриваемой системы матери- материальных точек называется такая точка, радиус-вектор которой Hc(t) вы- выражается через радиусы-векторы Т\, Г2, ... г^ материальных точек по Rc(i) = mi + mi + + m. F.7) Подчеркнем, что в общем случае положение центра масс не совпадает с положением какой-либо из материальных точек системы (см. рис. 6.3 б), хотя иногда такое может и случиться. тхт+2т4хт Зга М=2т Ах Рис. 6.3 Продифференцируем по времени левую и правую части равенства F.7). Производная радиуса-вектора по времени есть по определению скорость, так что в результате мы получаем m2v2(t) F.8) где Vc — скорость центра масс, vi, V2,... v^ — скорости материальных то- точек. Величина mivi в F.8) — импульс первой материальной точки, 7772V2 — импульс второй точки и т. д. Таким образом, в фигурных скобках выраже- выражения F.8) стоит сумма импульсов рассматриваемой системы материальных точек, т. е. импульс Р всей системы. Следовательно, равенство F.8) можно переписать в виде Р = {mi + 7772 + • • • + mN}Vc. F.9) В системе отсчета, где центр масс покоится, Р = 0. Если нас не интересует относительное движение материальных точек, а интересует движение системы как целого, то тогда всю систему можно рас- рассматривать как одну материальную точку, движущуюся со скоростью Vc и обладающую импульсом Р. Вспомним, что масса материальной точки есть, по определению, коэффициент пропорциональности между импульсом и скоростью. Поэтому стоящий в равенстве F.9) коэффициент пропорцио- пропорциональности, заключенный в фигурные скобки, есть масса М рассматрваемой системы: М = mi + га2 + • • • + mN, F.10) т. е. масса системы материальных точек равняется сумме масс этих то- точек. Соотношение F.10), согласно которому масса сложного тела равна сум- сумме масс его частей, кажется нам привычным и очевидным. Однако, как мы
6.2. ЦЕНТР МАСС СИСТЕМЫ МАТЕРИАЛЬНЫХ ТОЧЕК 85 еще убедимся, в релятивистской механике (т. е. в более общем случае) си- ситуация будет совершенно иной. В предельном случае ньютоновой механики равенство F.10) представляет собой частный случай определенного физиче- физического закона — закона сохранения массы. В отсутствие внешних сил, т. е. для замкнутой системы, сумма импуль- импульсов всех тел системы не зависит от времени; тогда из F.9) следует важное свойство движения центра масс замкнутой системы материальных точек: Vc = const, т. е. центр масс замкнутой системы материальных точек неподвижен или движется равномерно и прямолинейно, хотя каждая из материальных то- точек может совершать сложное движение. Приведенное выше утверждение называют иногда теоремой о движении центра масс. Мы сейчас докажем следующее важное свойство кинетической энергии: кинетическая энергия Т системы материальных точек равна сумме ки- кинетической энергии всей массы системы, мысленно сосредоточенной в ее центре масс и движущейся вместе с ним, и кинетической энергии Т' той же системы в ее относительном движении по отношению к системе от- отсчета, движущейся вместе с центром масс: N F.П) г=1 где М = mi + т2 + • • • + mN •> Vc — скорость центра масс в исходной системе отсчета, v^ — скорость i-ой материальной точки относительно системы от- отсчета, движущейся вместе с точкой С. Такую систему обычно называют «си- «системой центра масс», «системой центра инерции» ^ или просто «ц-системой». (Систему отсчета, в кото- которой поставлена задача, если эта система не совпа- совпадает с ц-системой, принято называть лабораторной системой отсчета или л-системой). Для доказательства получим вначале более общее соотношение, связывающее кинетическую энергию в двух системах отсчета (см. рис. 6.4). Для координат и скоростей точек в старой системе R^, V^ и в новой системе r^, v^ запишем преобразования Галилея: R, = гг + R; V, Рис. 6.4 где R — радиус-вектор перехода из старой системы в новую, а V — соот- соответственно, скорость движения новой системы относительно старой. Тогда кинетическую энергию в старой системе отсчета можно представить в виде =Е ^ - Е ?(
86 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Правую часть F.12) можно представить в виде трех сумм: где Р — полный импульс системы материальных точек в новой системе отсчета. Соотношение F.13) принято называть теоремой Кенига . Если же новая система совпадает с ц-системой, то суммарный импульс в ней равен нулю, V = Vc, а значит, имеет место соотношение F.11). В заключение этого параграфа отметим два важных свойства, вытекаю- вытекающих из определения центра масс. Во-первых, частицы в F.7) можно объеди- объединять в какие угодно группы, например: (i + 2) mi + m2 H + mN [ mi + m2 --- +mNrN Г miri + m2r2 ^^ = (mi + ra2) [ m3r3 +m2r4 1 / + (ra3 + 7714) 1 / (mi + ra2 H \- mN). mi + m4 J / Отсюда, как легко сообразить, следует, что центр масс любой системы ма- макроскопических тел может быть найден как центр масс системы материаль- материальных точек, в предположении, что масса каждого тела сосредоточена в его собственном центре масс. И во-вторых, от суммирования в F.7) нетрудно перейти к интегрированию, если мы вычисляем положение центра масс тела с непрерывным распреде- распределением плотности вещества р(т): \ /(г p(r) dv 6.3. Потенциальная энергия взаимодействия. Закон сохранения энергии для замкнутой системы материальных точек В предыдущей главе мы познакомились с понятиями кинетической и по- потенциальной энергии для специального и относительно простого типа дви- движения — движения одной материальной точки под действием заданной силы (движение в постоянном силовом поле). Теперь мы познакомимся с тем, как формулируется закон сохранения энергии для более сложного типа движе- движения — движения многих взаимодействующих тел, образующих замкнутую систему. Начнем с рассмотрения простейшей системы тел — системы, состоящей всего из двух материальных точек, а силу взаимодействия между ними бу- будем полагать потенциальной и зависящей лишь от г = ri — г2. Эта оговорка весьма существенна. Например, сила взаимодействия между заряженными частицами, вообще говоря, непотенциальна и зависит от их скоростей, си- сила взаимодействия между двумя диполями, даже будучи потенциальной, зависит от ориентации частиц в пространстве и т. д. Запишем уравнения движения рассматриваемых материальных точек в некоторой инерциальной
6.3. ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ. 87 системе координат: mi(dvi/dt) = F12(|r2 - n|) + Pi(n), ( , m2(dv2/d?) = F21(|r2 - n|) + F2(r2), [ } где по-прежнему ri и r2 — радиусы-векторы рассматриваемых материаль- материальных точек, vi,v2 — их скорости, mi и т2 — их массы, a Fi2, F2i — силы, с которыми они действуют друг на друга. Мы предполагаем теперь, что наряду с силами Fi2 и F2i на тела действуют еще внешние, как говорят, сторонние, силы Fi и F2 (т. е., рассматриваемая система тел не является замкнутой). Умножим обе части первого из уравнений F.14) на бесконечно малое пе- перемещение первого тела dri, умножим обе части второго уравнения на dr2 и затем сложим левые и правые части полученных таким образом соотно- соотношений. С учетом того, что Fi2 = —F2i, получаем: mi(dvi/dt) dri + ra2(dv2/d?) dr2 = F2i(r) dr + Fx dri + F2 dr2, где dr = dr2 — dri, и, поскольку dri/dt = vi, dr2/dt = v2, отсюда следует d (mii;i/2) + d (m2vl/2) = F2i(r) dr + Fx dri + F2 dr2. F.15) Определим понятие потенциальной энергии взаимодействия: потенциаль- потенциальной энергией взаимодействия и\2(г) между материальными точками 1 и 2, находящимися на расстоянии г друг от друга, называется работа, совер- совершаемая силой взаимодействия при удалении одной из них от другой с рас- расстояния г в бесконечность, т. е. U12(r)=AB3(r^Oo). F.16) Определение конкретного выражения для и\2(г) сводится, как мы видим, к вычислению Авз(г —>> оо) для конкретной силы взаимодействия F2i, и в следующем параграфе мы покажем в качестве примера, как находится потенциальная энергия гравитационного взаимодействия. Бесконечность в F.16) принято вводить для определенности; разумеется, при вычислении сил либо работы на конечном участке пути потенциальная энергия, как и в постоянном силовом поле (гл. 5), определена с точностью до константы. Если силы взаимодействия между материальными точками являются по- потенциальными, то работа не зависит от пути. Это, в частности, справедливо для важного частного случая центральных сил: Яи = F12(r)-; г = п-г2. F.17) Г Здесь г /г — единичный вектор, так называемый орт направления. Закон взаимодействия F.17) никогда не бывает справедлив в точности, но очень во многих случаях используется как достаточно хорошее приближение к реальности. Подчеркнем одно отличие потенциальной энергии взаимодействия между двумя материальными точками uyi от потенциальной энергии одной мате- материальной точки в постоянном силовом поле f7(r), о которой шла речь в гл. 5. Потенциальная энергия взаимодействия двух материальных точек за- зависит только от расстояния между ними г — если, конечно, не вступают в игру ориентационные координаты, скажем, направление дипольных момен- моментов частиц (о чем мы будем говорить в следующем разделе курса). Чтобы
ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ подчеркнуть это различие, потенциальную энергию взаимодействия двух материальных точек называют обычно просто энергией взаимодействия, и мы так и будем ее называть в дальнейшем. Из соотношения F.15) следует связь между работой и приращением кине- кинетической энергии при бесконечно малых перемещениях: dT = 6AB3 + 6ABH. F.18) Здесь Т обозначает суммарную кинетическую энергию рассматриваемых ма- материальных точек — Т = miv2(г\)/2-\-m2V2(г2)/2, 8АВЗ = F21 dr обозначает бесконечно малую работу силы F21, a 5ABU = Fi dri + F2 dr2 — бесконечно малую работу внешних сил. Из определения энергии взаимодействия F.16) получаем duu = uu(r + dr) - uu(r) = AB3(r + dr ->> 00) - AB3(r -> 00). F.19) Ввиду нашего предположения о потенциальности сил взаимодействия, ра- работа их от пути не зависит. Поэтому работу Авз(г —>• оо) при удалении тела с расстояния г на бесконечность можно совершить, удалив сначала тело по произвольным траекториям на расстояние r + dr, а затем удалив его из этого положения на бесконечность, т. е. Авз(г —>> оо) = Авз(г —>> г + dr) + AB3(r + dr —>> 00). Подставляя полученный результат в F.19), получаем du12 = -Авз(г -> г + dr) = -6АВЗ, F.20) как следствие, соотношение F.18) принимает вид dT = - После перегруппировки слагаемых последнее равенство можно представить как d(T + uu) = 6ABH. F.21) Если внешние силы отсутствуют, то и 6Ави = 0. В этом случае из F.21) следует, что для замкнутой системы где Е обозначает полную энергию замкнутой системы из двух материаль- материальных точек. В этом случае из F.21) следует, что полная энергия замкнутой системы двух тел остается при их движении постоянной: Е = (mivl/2) + (m2^/2) + и12 = const. F.22) Следует отметить, что утверждение, выраженное формулой F.22), имеет характер намного более общий, нежели наш вывод, представляющий по су- сути частный пример. Значение константы (инварианта, интеграла движения) в F.22) может быть различным, и оно определяется значениями кинетиче- кинетической энергии и энергии взаимодействия в некоторый (например, начальный) момент времени. Сформулируем теперь закон сохранения энергии для общего случая, ко- когда замкнутая система состоит не из двух, а из произвольного числа N вза- взаимодействующих материальных точек. Фомулировка является обобщением
6.3. ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ ВЗАИМОДЕЙСТВИЯ. формулы F.22), а именно: при движении N материальных точек в замкну- замкнутой системе сохраняется ее полная энергия, равная сумме кинетических энергий всех материальных точек и всех попарных потенциальных энергий взаимодействия между ними: 2 = const, F.23) I l>m где суммирование по индексам / и т проводится от 1 до iV, и во второй сумме при этом содержатся только слагаемые с / > га, чтобы не учитывать дважды вклады от энергии взаимодействия каждой из пар материальных точек. Кроме того, для того чтобы сделать запись формулы более компакт- компактной, мы ввели обозначения: v(ri) = v\ и u(\v\ — rm|) = = щт. Так для замкнутой системы из трех матери- материальных точек (например, тройная звезда) закон со- хранения F.16) запишется в виде (рис. 6.5): гаг;? mvn mv\ + + ^ + + + n А А А Сколь ни естественно выглядит формула F.23) в качестве обобщения закона F.22), применимость ее р в ^ ограничена важным дополнительным условием. Мы предположили, что имеет место принцип суперпозиции сил. В случае их потенциальности это означает аддитивность потенциальной энергии: Ft = Yl Fik =*> U = Y, ulm- Нарушения этих условий не столь уж и редки (например, взаимодействие нуклонов в ядре не есть сумма их попарных взаимодействий друг с дру- другом). Но в классической механике, пока и поскольку мы не обращаемся к космическим масштабам либо нелинейным свойствам сплошной среды, за- закон сохранения энергии в форме F.23) имеет достаточно широкую область применимости. Напомним, что мы показали на примере системы из двух материальных точек, что бесконечно малое изменение их полной энергии dE равно бесконечно малой работе внешних сил 5Ави. Обобщая это на слу- случай произвольного числа материальных точек, мы имеем, следовательно, равенство SA Применительно к конечным изменениям энергии оно означает, что измене- изменение полной энергии системы материальных точек равно работе внешних сил. При этом всю потенциальную энергию частиц, составляющих нашу си- систему, вместе с кинетической энергией в ц-системе, зачастую удобно ин- интерпретировать как внутреннюю энергию, тем самым представляя систему частиц в качестве одного макроскопического тела. С учетом теоремы Кенига F.13) энергию Е системы N материальных то- точек в любой инерциальной системе координат можно записать в виде
90 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ где внутренняя энергия U равна N о г=1 Так как v^ — скорости относительно центра масс, то внутренняя энер- энергия системы не зависит от скорости ее движения как целого и определяется только ее собственными, внутреннеми свойствами — внутренними степе- степенями свободы. Мы рассмотрим данный вопрос на должном уровне в разделе, посвященном термодинамике. Если система как целое покоится (Vc = 0), то Е = U — вся энергия системы равна ее внутренней энергии, соответственно, dU = SABU. 6.4. Закон всемирного тяготения Из астрономических наблюдений известно, по крайней мере, со времен Коперника, что Земля и прочие планеты солнечной системы обращаются по замкнутым криволинейным орбитам вокруг Солнца. Следовательно, тела эти не свободны, на них постоянно действуют какие-то силы. Идентичность формы орбит дает основание считать, что взаимодействие с Солнцем доми- доминирует. Из третьего закона Ньютона следует, что Земля действует на Солнце с той же силой, с которой Солнце притягивает Землю. Но при рассмотрении законов движения можно работать в системе отсчета, связанной с Солнцем, поскольку при Мс ^> М3 приведенная масса F.3) с хорошей точностью со- совпадает с массой планеты, а центр масс системы — см. F.6) — практически совпадает с центром Солнца. Представим себе, что мы задались целью определить, как зависит от расстояния сила, заставляющая Землю вращаться вокруг Солнца. Для этого можно определить, р ^ ^ например, центростремительные ускорения в точке наи- наибольшего удаления Земли от Солнца (в апогее) и в точке наименьшего удаления (в перигее). Во времена Ньютона данные об орби- орбитах планет были уже хорошо известны, т. е. были известны расстояние от Солнца до Земли в апогее га и расстояние в перигее гп, а также значение скорости Земли в различныхточках ее траектории. Это позволило Ньюто- Ньютону вычислить ускорение Земли в апогее аа и в перигее ап (в этих точках ускорение Земли, а, следовательно, и сила направлены вдоль одной прямой (вдоль большой полуоси), как показано на рис. 6.6). В результате оказалось, что отношение сил, действующих на Землю в этих точках, равно отношению квадратов соответствующих расстояний: FjFn = r2jrl F.24) Естественно предположить, что сила притяжения Земли к Солнцу, воз- возможно, и при любых их взаимных расположениях зависит от расстояния таким же образом. Такое предположение оказалось в хорошем соответствии с законами Кеплера, которые будут рассмотрены в следующей главе. Имея в виду эти соображения, Ньютон, в конечном счете, высказал гениальную до- догадку, что не только между Солнцем и Землей, а между любыми телами, раз- размерами которых можно пренебречь по сравнению с расстоянием между ни- ними, действует сила взаимного притяжения, подчиняющаяся закону: сила, с
6.4. ЗАКОН ВСЕМИРНОГО ТЯГОТЕНИЯ 91 которой две материальные точки притягивают друг друга, пропорциональ- пропорциональна массам этих точек и обратно пропорциональна квадрату расстояния между ними: F = ^(т1т2/г2). F.25) Здесь 7 — коэффициент пропорциональности, называемый постоянной все- всемирного тяготения или гравитационной постоянной, численное значение ко- которой зависит от выбранных единиц измерения. В общепринятой сейчас си- системе СИ 7 имеет значение 7 = 6,67-КГ11 м3/(кг-с2). Сформулированный выше закон носит название закона всемирного тяго- тяготения, а взаимодействие, о котором идет речь в этом законе, называется гравитационным взаимодействием. В отличие, скажем, от сил электростатического взаимодействия, гравита- гравитационная сила F.25) всегда есть сила притяжения. В векторной форме она может быть представлена следующим образом: mim2 Г12 (а _, Fi2 = -7—§ • 6-26 Выражения F.25), F.26) записаны для взаимодействия двух материальных точек, т. е. для тел, размерами которых можно пренебречь из-за того, на- например, что их размеры намного меньше расстояния между ними (такая, в частности, ситуация имеет место в случае Солнца и Земли). Из них следует, что силу притяжения, действующую со стороны Земли на всякое тело вбли- вблизи ее поверхности, можно с хорошей точностью считать постоянной, не зави- зависящей от удаления тела от земной поверхности. Допустим, что тело массы т находится от поверхности Земли на высоте /г, намного меньшей радиуса Земли i?3, h <С R3 (напомним, R3 ~ 6 000 км). Тогда сила, действующая на тело и направленная к центру Земли, равна тМ3 М3 F = 7"m'7 где М3 — масса Земли, а величина g = jM3/R^ и есть ускорение свободного падения, т. к. она равна тому постоянному (с точностью до h/R3) ускоре- ускорению, с которым движутся к поверхности Земли все тела под действием ее притяжения. Учитывая, что М3 = 5,98 • 1024 кг, R3 = 6,38 • 106 м, получа- получаем для ускорения свободного падения хорошо известное из школы значение g = 9,8 м/с2, которое с высокой точностью подтверждается на опыте. Силу Fm = mg, с которой любое тело притягивается к Земле вблизи ее поверхно- поверхности, называют силой тяэюести. Осталось внести ясность в понятие «вес тела». Чаще всего процесс взве- взвешивания состоит в том, что тело помещают на поверхность определенного устройства — весов, и на шкале этого устройства появляется значение веса, выраженное в единицах измерения силы (например, в килограммах). Таким образом, вес тела — это сила, с которой взвешиваемое тело действует на весы. На рис. 6.7 схематически изображены весы в виде твердого тела, у которо- которого изменение уровня верхней поверхности может быть измерено с помощью
92 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ стрелки и соответствующей шкалы, и когда на весах ничего нет, стрелка показывает на нуль (рис. 6.7 а). Когда на весах находится тело массы т, то из-за возникающих на поверхности соприкосновения упругих сил эта масса действует на весы с некоторй силой Р, которая по определению и есть вес тела. Допустим сначала, что весы вместе с телом покоятся относительно Зе- Земли, поверхность которой будем рассматривать, как инерциальную систему отсчета. Для вертикальных составляющих всех сил, действующих в системе «весы плюс взвешиваемое тело», можно согласно второму закону Ньютона записать следую- следующие два равенства: N -Мд-Р = 0; N - (т + М)д = 0, где N — сила реакции опоры, на которой М М JN Рис. 6.7 расположены весы. Отсюда получаем: Р = mg, т. е. когда весы покоятся, вес тела равен действующей на него силе тяжести. Теперь рассмотрим случай, когда весы с телом движутся вертикально вверх или вниз с ускорением, равным по модулю а: N - Мд- Р = ±Ма; N - (га + М)д = ±(га + М)а, где знак «плюс» справа соответствует движению вверх, а знак «минус» — вниз. Отсюда получаем, что вес тела в этом случае равен: Р = т(д ± а), т. е. при движении весов с телом с ускорением вверх вес тела увеличивает- увеличивается, а при движении вниз — уменьшается. В последнем случае, если а = д (свободное падение), вес тела становится равным нулю. О такой ситуации говорят, как о состоянии невесомости. Функциональная зависимость F.25), F.26) позволяет с очевидностью от- отнести гравитационную силу к консервативным. Вычислим потенциальную энергию взаимодействия двух материальных точек с массами rai и га,2, на- находящихся на расстоянии г друг от друга. В соответствии с определением F.16), получаем из F.26) CXJ CXJ CXJ и12(г) = Авз(г -+ оо) = / 6АВЗ = / Fi2(r) dr = - / 7 ¦ rdr r2 F.27) Для удобства вычислений будем удалять тело 2 от тела 1 вдоль соеди- соединяющей их прямой линии (рис. 6.8). При этом способе разведения матери- материальных точек вектор бесконечно малого перемещения тела 2 dr направлен вдоль вектора г, который направлен от тела 1 к телу 2. Это означает, что rdr = rdr. Подставляя это соотношение в F.27), получаем )= — J ГП1ГП2 Г dr J rz = -7. ГП1ГП2 Итак, окончательно, потенциальная энергия гравитационного взаимодей- взаимодействия двух материальных точек с массами rai и га2, расположенных на рас- расстоянии г и друг от друга, равна О I г1 п 1 г1 / runnrt л пгул Г)|/Т*-1О IliVrSl
6.4. ЗАКОН ВСЕМИРНОГО ТЯГОТЕНИЯ 93 Рассмотрим вопрос о том, какие начальные скорости необходимо сообщить спутнику, чтобы он оставался на замкнутой орбите вблизи Земли, а также — какие скорости необходимо сообщить телу на Земле, чтобы оно преодолело силу земного при- тяжения и покинуло окрестность Земли, или пре- преодолело притяжение Солнца и покинуло солнеч- солнечную систему. Эти скорости получили название «космических скоростей» (их называют, соответ- соответственно, первой, второй и третьей космической скоростью). Рис б 8 Определим сначала первую космическую ско- скорость V\. Вблизи поверхности Земли, на высотах h <С R3, действующая на те- тело массы т сила притяжения с хорошей точностью равна силе тяжести тд. Для простоты рассмотрим движение спутника по круговой орбите. В этом случае уравнение движения (второй закон Ньютона) имеет вид m Пренебрегая h по сравнению с i?3 — 6,4 • 106 м, получаем отсюда Vi = \/дЩ ~ 8 • 103 м/с = 8 км/с. F.29) Это и есть выражение для первой космической скорости. Именно такую скорость необходимо сообщить телу, чтобы оно стало спутником Земли. Вторую космическую скорость можно найти из закона сохранения энер- энергии F.28). Землю и космический корабль будем рассматривать, как замкну- замкнутую систему двух тел, так как влиянием Солнца и других планет можно с хорошей точностью пренебречь. Задача о движении двух взаимодействую- взаимодействующих тел сводится к задаче о движении одного тела под действием той же силы, но с приведенной массой /j,: /л = М3т/(М3 + га), где М3 — масса Земли, га — масса корабля. Поскольку масса Земли на- намного больше, можно положить \i = га. Это означает, что влиянием корабля на движение Земли можно пренебречь, т. е. считать Землю неподвижной и рассматривать движение спутника, как движение в постоянном гравитаци- гравитационном силовом поле Земли. «Освободить» тело от земного притяжения означает дать ему возможность «уйти на бесконечность», где и^2 — 0. Минимальная кинетическая энергия на поверхности Земли, которую ему для этого надо сообщить, отвечает ну- нулевой кинетической энергии в бесконечно удаленной точке: raF22/2 - (jmM3)/R3 = Т^ = 0, F.30) откуда следует V2 = ^B7mM3)/i?3 = уЭД,. F-31) Таково выражение для второй космической скорости. Из сравнения с F.29) видно, что вторая космическая скорость в у/2 раз больше первой: Т^«11 км/с. Для того, чтобы навсегда покинуть Солнечную систему, тело должно пре- преодолеть, помимо земного притяжения, также и силы притяжения к Солнцу.
94 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ то Необходимая для этого скорость V3 существенно зависит от направления за- запуска, поскольку скорость Земли на орбите сравнима с искомой величиной: Vs — 30 км/с. При запуске в направлении орбитального движения Земли эта скорость минимальна и составляет около 17 км/с. Она называется третьей космической скоростью. Применяя к различным ситуациям закон всемирного тяготения F.25), мы оставили открытым вопрос, до какой степени мы вправе это делать, если в реальной задаче фигурируют далеко не точечные массы. Ни в форму- формуле F.29), ни в левой части формулы F.30) Земля отнюдь не может быть представлена как материальная точка. В действительности мы молчаливо подразумевали, что сферически симметричное распределение массы может рассматриваться («глядя извне») как материальная точка. Покажем, что это действительно так. Итак, нашей задачей является определение модуля и направления силы гравитационного притяжения, действующей между Землей (с массой М) и материальной точкой (с массой га), которая находится на расстоянии г от центра Земли (рис. 6.9 а). Сделаем два упрощающих предположения. Во- первых, будем считать Землю строго сферическим телом, хотя она слегка сплющена вдоль своей оси вращения. Во-вторых, будем предполагать, что плотность вещества Земли всюду постоянна. Оба эти предположения выполняются с хоро- хорошей точностью — достаточно сказать, что силы тяжести измеренные на полюсе и на экваторе отличаются на доли процента. Это означает, что наша задача сводится к опреде- определению силы гравитационного притяжения ме- между материальной точкой и однородным шаром (рис. 6.9 б). Представим нашу Землю в виде совокупности материальных точек — бесконечно малых объ- объемов с массой dM, притом каждый из них взаимодействует с материальной точкой га с известной силой тяготения dF, величина и направление которой определяются их взаимным расположением (рис. 6.9 б). Результирующая си- сила притяжения со стороны шара определится затем векторной суммой всех этих элементарных сил dF. При вычислении результирующей силы мы используем симметрию задачи. А именно, представим сплошной шар как совокупность тонких шаровых слоев, вложенных друг в дру- друга (рис. 6.10 а), и вычислим сначала силу при- притяжения между исходной материальной точ- точкой и одним из шаровых слоев, радиус кото- которого обозначим через /, толщину — через d/, a массу — через dMCJI (рис. 6.10 б). Для нахождения силы взаимодействия ме- между слоем и материальной точкой выделим сначала из слоя кольцо, края которого отвечают значениям угла в и в + d# (рис. 6.11 а). На рис. 6.11 б кольцо обозначено пунктиром. Каждый бесконечно малый элемент кольца с массой dMfr находится на одном и том же расстоянии а от массы га и по- Рис. 6.9 то то Рис. 6.10
6.4. ЗАКОН ВСЕМИРНОГО ТЯГОТЕНИЯ 95 этому действует на эту массу с силой всемирного тяготения dF^, которая по модулю одинакова для всех малых элементов кольца и равна dF/c=7 т—- F.32) Из симметрии задачи ясно, что при вычислении суммарной силы со стороны всего кольца следует учесть только вклад от dF\ | = dFk cos (p — составля- составляющей силы dF& вдоль прямой, соединяющей массу т с центром шарово- шарового слоя. Вклады от перпендикулярных к этому направлению составляю- составляющих dF± взаимно уничтожатся при их суммировании от всех элементов кольца dMfc. Итак, сила i7^, действующая на массу т со стороны одного кольца, напра- направлена к центру шарового слоя и по модулю равна с учетом F.32) cos if = jm cos if dMk = F.33) по кольцу по кольцу где Mk — масса кольца. Выражение для Мк мы найдем, если учтем, что радиус кольца равен /sin#, а ширина — Id6 (рис. 6.11 б). Следовательно, площадь кольца определяется выражени- выражением 27r/2sin#d#. Если толщина шарового слоя d/, а плотность /э, то масса кольца, равная произведению его объема на плот- плотность, составляет Мк = 2тг12 sin в d6 • dl • р = 2тгpi2 dl sin в d6. Подставляя это выражение в F.33), по- получаем sin в cos if d6 dFK0JI = 2dl- F.34) б Весь рассматриваемый нами шаровой слой можно представить, как совокуп- совокупность колец, положение которых однозна- однозначно задается углом в (при заданных г и / величины а и ср однозначно зависят от в). Поэтому суммарная сила dFCJI со стороны с< всего слоя определяется суммой вкладов F.34) от всех колец: dFCJI = 1 т dFкoл = 2 2 Г si / F.35) ел — / J ^х± кол по всем кольцам В F.35) удобно перейти от интегрирования по в к интегрированию по всем возможным расстояниям а. Для этого воспользуемся известной из тригоно- тригонометрии теоремой косинусов (см. рис. 6.11 б): а2 = 12 + г2 - 21т cos 6>, I2 = а2 + г2 - 2ат cos (p. F.36) Продифференцировав первое из этих соотношений (при постоянных г и /), получаем 2а da = 2/rsin#d6>. F.37)
96 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Определив sin#d# из F.37) и cosip из F.36), получим после подстановки результатов в F.35) г+1 dFCJI = IH^L / +Г da, F.38) rz J az r-l где мы учли, что а может изменяться в пределах от а = г — /до а = г + I. Интеграл в F.38) разбивается на сумму двух интегралов г+1 г+1 r—l г—I Нетрудно убедиться, что после интегрирования для обоих слагаемых по- получается одинаковый результат, а именно, 21. Поэтому получаем из F.38) dFCJI = Gmp47r/2d/)/r2. Выражение 4тг/2 d/ дает объем слоя, а /э4тг/2 d/ — его массу dMCJI. Таким образом, находим окончательно, что шаровой слой с массой dMCJI действует на находящуюся вне слоя материальную точку с массой т с силой, напра- направленной к центру слоя и равной по модулю: dFCJI = 7(mdilWr2), F.39) где г — расстояние от точечной массы т до центра слоя. Любопытно от- отметить, что если точечная масса находится внутри шарового слоя, то дей- действующая на нее результирующая сила со стороны всего слоя равна нулю. В этом легко убедиться, изменив в F.38) пределы интегрирования по а от значения а = I — г до а = I + г, которые соответствуют нахождению массы т внутри слоя. Просуммировав выражение F.39) по всем слоям, получим силу, с которой шар притягивает массу т, Таким образом, действие шара на материальную точку эквивалентно действию помещенной в центре шара материальной точки с массой, рав- равной массе шара. 6.5. Упругие и неупругие соударения Обратимся к изучению круга явлений, которые, в зависимости от обла- области физики, именуются столкновениями, соударениями, рассеянием. Пре- Преимущественно процессы такого рода важны в физике микромира (едва ли не главная задача в физике элементарных частиц — задача о рассеянии). Столкновения составляют один из важнейших предметов рассмотрения в физической кинетике, т. е. в молекулярной физике, физике плазмы, раство- растворов и т. д. Но и в небесной механике, коль скоро речь идет не о регулярных планетных или звездных системах, но об астероидах, кометах, фрагментах, образовавшихся как следствие взрывных процессов, данная проблема зани- занимает достойное место.
6.5. УПРУГИЕ И НЕУПРУГИЕ СОУДАРЕНИЯ 97 Главная особенность взаимодействий, которые могут быть квалифициро- квалифицированы как столкновения, состоит в следующем. Участвующие в них частицы (тела) как бы «приходят из бесконечности» и в конечном состоянии «уходят на бесконечность», где взаимодействием можно пренебречь. Сразу ясно, на- например, что взаимодействие Земли и Солнца не может быть отнесено к этой категории. А вот соударение биллиардных шаров — в принципе, может, хотя о бесконечностях в пределах биллиардного стола говорить и не принято. Но при достаточной и вполне разумной степени идеализации задачи (пренебре- (пренебрежение трением о сукно, тем более — обменом импульса через возмущение воздуха или гравитационным взаимодействием шаров) можно утверждать, что шары взаимодействуют в процессе удара, но не взаимодействуют до или после него. Значительно сложнее представить таким образом столкновение заряженных частиц, взаимодействующих по закону Кулона, поскольку си- сила и потенциальная энергия их взаимодействия не обращаются в нуль ни на каком конечном расстоянии. Отсюда и возникает бесконечность в коррект- корректном определении процесса столкновения, а в реальной ситуации мы всегда имеем дело с некоторым приближением к таковому. Мы в рамках курса механики ограничимся достаточно простыми приме- примерами, по преимуществу такими, когда при соударении тела приходят в непо- непосредственный контакт друг с другом. Термин «соударение» как раз и отно- относят обычно к классической механике макроскопических тел. В этом случае определение траекторий тел после соударения путем решения уравнений движения оказывается часто очень сложной, а иногда вообще невыполни- невыполнимой задачей. Вот тут-то особенно полезными оказываются законы сохране- сохранения энергии и импульса, прменение которых к задачам о соударениях мы сейчас рассмотрим. При соударении макроскопические тела деформируются. При этом неко- некоторая часть кинетической энергии, которой обладали тела перед ударом, пе- переходит в потенциальную энергию упругой деформации, а некоторая часть кинетической энергии переходит во внутреннюю энергию образующих тела атомов и молекул. В зависимости от того, насколько меняется внутренняя энергия тел, при решении задач используют нередко одно из двух прибли- приближений: абсолютно упругий и абсолютно неупругий удар. Абсолютно упругим ударом называют такое соударение тел, при котором переходом части их энергии во внутреннюю энергию тел можно пренебречь. Можно считать, что при таком ударе кинетическая энергия переходит пол- полностью или частично в потенциальную энергию упругой деформации. Затем тела восстанавливают свою форму, отталкивая друг друга. В результате потенциальная энергия упругой деформации переходит обратно в кинети- кинетическую энергию, и тела разлетаются со скоростями, величина и направле- направление которых определяется двумя условиями — законом сохранения полной энергии и законом сохранения полного импульса сталкивающихся тел. При абсолютно неупругом ударе тела «слипаются», т. е. после удара они дви- движутся с одинаковой скоростью либо покоятся. Кинетическая энергия тел полностью или частично превращается в их внутреннюю энергию. Кинети- Кинетическая энергия тел до и после соударения имеет различное значение, и вы- выполняется лишь закон сохранения импульса. Пример абсолютно неупругого удара показан на рис. 6.12.
98 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Рассмотрим также пример абсолютно упругого удара, причем ограничим- ограничимся случаем центрального удара двух однородных шаров, один из которых первоначально покоится. (Удар называется центральным, если шары до уда- удара движутся вдоль прямой, проходящей через их центры.) Пусть вращение шаров отсутствует. Пусть справедливо при- приближение, в котором два тела образуют как бы замкнутую систему, или, что то же, внеш- внешние силы, приложенные к шарам, уравно- v = mlvl/(ml+m2) вешивают друг друга (как, например, при Рис. 6.12 скольжении шаров без трения по горизон- горизонтальной поверхности). Обозначим массы ша- шаров 7771 и 7772- Пусть второй шар до удара неподвижен, а первый до удара двигался в положительном направлении оси х со ско- скоростью г>1о (рис. 6.13). Скорости шаров после т _т 2т ( ) ?>i= m|+m22 ?>io V2= mi+m2 ую удара обозначим ^и^. Эти неизвестные по- пока величины являются проекциями на ось х Рис. 6.13 соответствующих векторов vi и V2, и, следо- следовательно, их знак, полученный в результате решения, определит, в каком направлении оси х шары будут двигаться после удара. Запишем условия сохранения энергии и импульса: ^ = rnivl/2 + m2v\j2, F.40) TTliVi + m2V2. F.41) Решение системы уравнений F.40), F.41) — задача элементарная. Искомые значения для v\ ж v2\ mi -7772 27771 Vi = ; Vio, V2 = ; Vio, F.42) 7771 +ГП2 7771 + ТП2 Отметим некоторые особенности движения шаров при их упругом цен- центральном ударе, вытекающие из полученного решения F.42). Если массы шаров равны, то из F.42) следует, что v\ = 0, v2 = v\q. Это означает, что в таком случае первый шар после удара останавливается, а второй движется с той скоростью, которая была у первого шара до удара. Именно по этой при- причине наилучшей защитой от быстрых нейтронов оказываются вещества, со- содержащие как можно больше водорода. При столкновении нейтрона с ядром атома водорода — протоном — последний перехватывает практически всю кинетическую энергию (поскольку Мр — Мп), а нейтрон останавливается. Рассмотрим случай упругого столкновения тела со стенкой, т. е. с телом, массу которого можно считать бесконечно большой. Для этого случая из F.42) получаем v\ = — г^о, v2 = 0, т. е. в результате упругого столкнове- столкновения со стенкой первый шар меняет свою скорость на противоположную, от- отскакивая от стенки с той же по модулю скоростью, с которой он к стенке подлетал. Если же столкновение происходит с движущейся стенкой (кото- (которая в принципе моделирует любое массивное тело), то весь этот сценарий просто переносится в систему отсчета движущейся стенки. Возвращаясь в лабораторную систему, получаем v2 = v2q = const; vi = —г>ю + 2г>2(ь F.43)
6.5. УПРУГИЕ И НЕУПРУГИЕ СОУДАРЕНИЯ 99 в предположении, что г>ю, г^о считаются однонаправленными (направления «вперед-назад» учитываются посредством знака =Ь). Подчеркнем, что со- соударение, упругое в системе отсчета стенки, безусловно остается таковым и в л-системе: при корректном подсчете кинетической энергии уже нельзя пренебрегать поправками к di, ^ порядка m\jm2 в формуле F.43). Пусть теперь рассматривается упругое столкновение двух частиц, кото- которое уже не может быть описано в рамках одномерной модели. Припишем индекс г начальным значениям всех физических величин, а индекс / — ко- конечным. Закон сохранения импульса в произвольной системе отсчета будет существенно трехмерным: Р1г + Р2г = Pi/ + Р2/ = Р, F.44) где р — сохраняющийся суммарный импульс системы сталкивающихся ча- частиц. В ц-системе р = 0, и размерность уравнения F.44) понижается. Дей- Действительно, векторы ри = —Р2г определяют некоторую прямую, векторы Pif = — Р2/ — еще одну прямую, а две пересекающиеся прямые задают некоторую плоскость (исключая тот вырожденный случай, когда рц || Pi/, так что задача оказывается одномерной). Следовательно, в ц-системе про- процесс рассеяния всегда происходит в некоторой плоскости, поэтому в общем случае вместо двух переменных vi, V2 в уравнениях F.40), F.41), мы будем иметь дело с четырьмя. Процесс рассеяния, ввиду его фактической двумер- двумерности, удобно представить графически, как это показано на рис. 6.14. В ц-системе \рц\ = |р2г| — Рс-> ТОГДа кинетическая энергия в ц-системе (которая при упругом столкновении сохраняется) равна plfl I \ P2cf ( 1 Т = const = ^l — + — )=2Ll 2 \mi гп2/ Отсюда следует, что и после соударения |pi/| = |P2/| = Рс- Таким образом, концы векторов ри, ..., Р2/ в ц-системе можно представить лежащими на окружности, как это показано на рис. 6.14 а: в результате рассеяния векто- векторы pi52 поворачиваются, как показано на рисунке, не изменяя своей длины (моду- (модуля). Похожая картинка получилась бы и для скоростей частиц, только концы век- векторов vx 2C располагались бы на концен- концентрических окружностях с радиусами, со- соответственно равными pc/mi, pc/rri2. На рис. 6.14 б показано, как можно постро- построить векторы скорости частиц в л-системе, складывая vx 2C с вектором скорости центра масс. Такое построение можно провести и для начальных, и для конечных скоростей. Если бы столкновение было неупругим, но мы бы знали, какая именно доля кинетической энергии в ц-системе утрачена, можно было бы прове- провести аналогичное построение, но радиус соответствующих окружностей был бы разным для начального и конечного состояний. Эта проблема — учет неупругости с известными потерями — чрезвычайно важна в контексте мо- молекулярной, атомной и ядерной физики, ибо моделирует реакции — от хи- химических до ядерных.
100 ГЛ. 6. ЗАМКНУТАЯ СИСТЕМА ТЕЛ Вопросы и задачи 1. Что такое приведенная масса? 2. Что такое энергия взаимодействия трех материальных точек? 3. Напишите выражение для энергии гравитационного взаимодействия двух материаль- материальных точек с массами тщ и m2. 4. Как связана сила взаимодействия между двумя материальными точками с их энер- энергией взаимодействия? 5. Что такое центр масс? 6. Чем отличаются упругие соударения от неупругих? 7. Что такое первая, вторая и третья космические скорости? 8. Определить долю энергии д, теряемую частицей массы тщ при упругом центральном столкновении с неподвижной частицей массы m2. При каком соотношении масс mi/rri2 по- потеря энергии максимальна? Используя полученный результат, объяснить, почему в ядер- ядерных реакторах для замедления нейтронов используется рассеяние их на ядрах атомов легких (дейтерий, углерод), а не тяжелых элементов. Ответ: 6 = 4mim2/(mi + ГП2J. Отсюда видно, что при mi = rri2 теряется вся энергия E = 1). 9. Лодка длиной L и массы М с находящимся на ее корме человеком массы т не- неподвижно стоит на спокойной воде носом у причала перпендикулярно ему. На сколько отодвинется лодка от причала, когда человек пройдет по лодке с кормы на нос? Ответ: х = mL/(m + М). 10. На дне маленькой запаянной пробирки, подвешенной над столом на нити, сидит муха, масса которой равна массе пробирки. Расстояние от дна пробирки до стола равно длине пробирки /. Нить пережигают, и за время падения муха перелетает со дна в верхний конец пробирки. Определите время падения пробирки. Ответ: t = л/TJg. 11. Два маятника в виде шариков разных масс тщ и rri2 подвешены на нитях разной длины h и /2 так, что шарики соприкасаются. Первый шарик отводят в плоскости нитей на небольшой угол /3 и отпускают. На какие углы отклонятся маятники после упругого удара? Ответ: 01 = 0(ггц - т2)/(т1 + т2), 02 = 20mi(h/l2)/(mi + ш2). 12. Тело, движущееся со скоростью г>, догоняет стенку, движущуюся в том же напра- направлении со скоростью V. Найдите скорость тела и после упругого соударения. Ответ: и = -{у -2V). 13. Шайба массы т, скользя по льду, сталкивается с неподвижной шайбой массы Зт. Считая удар центральным и упругим, определите, на каком расстоянии S друг от дру- друга остановятся шайбы, если скорость первой шайбы непосредственно перед ударом была равна v, а коэффициент трения между шайбами и льдом равен а. Ответ: S = v2/4ag.
ГЛАВА 7 УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА 7.1. Момент импульса и момент силы Введем два понятия, чрезвычайно важных для описания движения (и как частный случай — равновесия) макроскопического твердого тела. Но вво- вводить их целесособразно на основе закона движения материальной точки: dp/d? = F. G.1) В векторной форме уравнение G.1) имеет универсальный вид во всех инер- циальных системах отсчета и не зависит от выбора начала координат. Пред- Предположим, что мы выбрали в качестве такового некоторую точку О. Пусть г — радиус-вектор нашей материальной точки в системе координат с на- началом в О. Проведем некоторую тождественную операцию — умножим все уравнение G.1) слева векторно на г: [r(dp/d<)] = [rF]. Учтем, далее, что для материальной точки dr/dt = v, v || p. Отсюда следует, в частности, [r(dp/dt)] = d/dt [rp] - [(dr/dt)p] = d/dt [rp], так что в целом второй закон Ньютона G.1) приводится к эквивалентному виду dL/dt = М, G.2) где векторная величина М = [rF] именуется моментом силы F относи- относительно точки О, a L = [гр], соответственно, моментом импульса матери- материальной точки относительно точки О — см. t рис. 7.1. В плоскости, заданной векторами г и р, модуль вектора L может быть представлен, в соответствии с рис. 7.1, как L = rps'ma = mvh. Пусть, например, материальная точка массы т движется по окружности радиуса R (рис. 7.2). Мо- Момент импульса этой материальной точки относи- относительно центра окружности О равен по модулю L = = mvR. Вектор L в этом случае перпендикулярен рис у ^ к плоскости окружности, причем направление дви- движения частицы и вектор L образуют, как принято говорить, правовинто- вую систему. При постоянном радиусе траектории момент импульса может изменяться только за счет изменения модуля скорости. При равномерном движении материальной точки по окружности ее момент импульса остается постоянным и по модулю и по направлению.
102 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА Пока наши новые определения еще не наполнены должным содержани- содержанием — мы всего лишь переписали в новой форме второй закон Ньютона. Си- Ситуация меняется, когда от единственной материальной точки мы переходим к системе материальных точек и, в качестве предельного случая — к макроскопическому телу. При движении друг относительно друга нескольких материальных точек момент импульса каждой материальной точки не будет оставаться постояннным. Но если эти тела образуют замкнутую систе- систему, то оказывается, что будет оставаться неизменным их сум- суммарный момент импульса относительно произвольного центра Для наглядности мы приведем доказательство для систе- системы, состоящей всего из двух материальных точек, связанных центральной силой, т. е. Fi2 || (r2 — ri), и рассмотрим случай, когда помимо сил взаимо- взаимодействия на материальные точки действуют также внешние силы (рис. 7.3). Запишем уравнения для моментов импуль- импульсов обеих материальных точек относитель- относительно некоторого центра О. Согласно G.2), имеем Рис. 7.3 i dL2/dt = [r2F2i] - где Fi2, F21 — силы взаимодействия тел друг с другом, Fi, F2 — некоторые резуль- результирующие внешние силы, действующие со стороны каких-то других тел на тела 1 и 2, соответственно. Сложив левые и правые части этих уравнений, получаем с учетом того, что Fi2 = — F21 d(Li + L2)/dt = [(n - r2)F12] + MlBH + M2BH, G.3) где MiBH = [riFi] и М2вн = [r2F2] — моменты внешних сил относитель- относительно центра О. Векторы (ri — г2) и Fi2 параллельны, поэтому их векторное произведение равно нулю. Следовательно, уравнение G.3) для суммарного момента импульса L = Li +L2 системы двух материальных точек имеет вид dL/dt = MiBH + М2вн = МБ G.4) Здесь Мвн естественно трактовать как полный момент внешних сил, при- приложенных к системе материальных точек. В случае замкнутой системы ма- материальных точек внешний момент равен нулю, так что оказывается, что момент импульса замкнутой системы материальных точек относитель- относительно произвольного центра остается постоянным. Таким образом, мы сфор- сформулировали закон сохранения момента импульса. В силу принятого предположения о центральном характере сил взаимо- взаимодействия между материальными точками этот закон все еще остается след- следствием второго закона Ньютона G.1) и подобием закона сохранения импуль- импульса. Сделаем следующий шаг: откажемся от каких-либо предположений о характере взаимодействия внутри замкнутой системы. Тем самым теряет доказательную силу и наш вывод, но сам закон сохранения момента им- импульса остается уже как экспериментальный и дополнительный к законам
7.2. ЗАКОНЫ КЕПЛЕРА 103 движения материальной точки, сформулированным в гл. 3. (В аналитиче- аналитической механике, изучающей самые общие законы движения, закон сохранения энергии связан с однородностью времени, т. е. с инвариантностью физиче- физических законов относительно изменения начала отсчета времени, закон сохра- сохранения импульса замкнутой системы связывается с однородностью простран- пространства, т. е. инвариантностью относительно пространственных сдвигов, тогда как закон сохранения момента импульса — с изотропностью пространства (инвариантностью относительного вращений пространства).) Равным образом и уравнение G.4) в общем случае не есть следствие G.1), но представляет собой дополнительное уравнение движения. Соответству- Соответствующий закон гласит, что скорость изме- изменения со временем полного момента импульса замкнутой системы определя- определяется только моментами внешних сил, а именно: ^Е Е G-5) О h = rsina Рис. 7.4 * к а Уравнение G.5) принято называть урав- уравнением моментов. Операции суммирова- суммирования в левой и правой части G.5) не эквивалентны: моменты импульса сум- суммируются по всем частицам (или материальным точкам, или физически бесконечно малым объемам), а в правой части суммирование происходит по всем моментам внешних сил. Подчеркнем еще раз, что момент силы в данном параграфе понимается именно по отношению к некоторой точке О, из которой проводится ради- радиус-вектор г в точку приложения силы. В действительности, как легко усмо- усмотреть из рис. 7.4 а, с точки зрения уравнения моментов G.5), имеет значение не точка, а линия приложения силы: перенося последнюю вдоль линии А А1', мы сохраняем плечо h = r sin а, а следовательно, не меняется и момент си- силы. Отметим также, что сумма моментов сил, приложенных к телу, именно вследствие этого свойства не равна моменту суммы сил. Наиболее вырази- выразительный пример — т. н. пара сил — представлен на рис. 7.4 б. Здесь сумма сил, приложенных к телу, равна нулю (тем самым равно нулю и ускорение центра масс), но полный момент М = h-F ф 0. И кстати, полезно в качестве упражнения убедиться, что ни величина, ни направление момента пары сил не зависят от выбора точки О. 7.2. Законы Кеплера Еще задолго до рождения Ньютона Кеплер на основании обобщения астро- астрономических наблюдений Тихо Браге установил три закона движения планет. 1. Каждая планета движется по эллипсу, в одном из фокусов которого находится Солнце. 2. Радиус-вектор планеты, проведенный из Солнца как начала координат, описывает в равные промежутки времени равные площади. 3. Квадраты периодов обращения планет по эллипсам относятся как ку- кубы больших полуосей. Разумеется, эти законы сформулированы с точностью до отношения ради- радиусов Солнца и планет к характерным расстояниям между ними, но точность
104 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА эта, как и математическая содержательность законов Кеплера, для начала XVII века просто поразительны. Поскольку законы Кеплера оказались в свое время главным тестом для механики Ньютона, и поскольку они принципиально важны для описания динамики планет, мы посвятим настоящий параграф их последовательному выводу. Напомним, что для частного случая центральных сил уравнение мо- моментов не является дополнительным ко второму закону Ньютона, но прямо из него следует. В соответствии с законом всемирного тяготения F.26) сила тяготения, связывающая Солнце и любую из планет, есть центральная сила, причем вектор ri2 в F.26) — это просто радиус-вектор планеты в системе отсчета Солнца. Мы будем пренебрегать взаимодействием планет друг с дру- другом, так как массы их много меньше массы Солнца, хотя главной поправкой к нашим, т. е. кеплеровским, результатам будет как раз влияние планет- гигантов, особенно Юпитера. В силу того же обстоятельства приведенную массу в F.2) можно просто приравнять массе планеты и пренебречь смеще- смещением Солнца относительно общего центра масс на фоне движения планет. В приближении замкнутой системы «Солнце-плане- «Солнце-планета» момент импульса с точностью до отношения масс равен L = m[rv] = const, G.6) где 771, г, v — соответственно, масса, радиус-вектор и скорость планеты. Из того, что вектор L перпендику- перпендикулярен г, v, в частности, следует, что движение плане- планеты — плоское, т. е. ее траектория лежит в некоторой рис ^ 5 плоскости, что с необходимостью предполагается за- законами Кеплера. Далее, обратим внимание на то, что по определению векторного произве- произведения (см. рис. 7.5), | [г v] dt = rv sin if • dt = 2 d*S, где dS — малый элемент площади (площадь малого треугольника, ограни- ограниченного векторами г и v dt). Как следствие, из сохранения момента импульса G.6) вытекает постоянство секториальной скорости: dS/dt = const, G.7) а это не что иное, как второй закон Кеплера. В дальнейшем, помимо сохранения момента импульса, мы будем исполь- использовать закон сохранения энергии: Е = const = mv2/2 - 7 Mm/r, G.8) где М — масса Солнца. Рассмотрение удобно проводить в полярных координатах в плоскости тра- траектории планеты (рис. 7.6 а), соответственно разложив скорость v на ради- радиальную иг=ги касательную vT = гф составляющие. Тогда L = mvTr = тг2ф, и G.8) можно переписать в виде Е = (m/2) v2 + V(r); где V(r) = -^Мт/г + L2/Bmr2). G.9) График V(r) представлен на рис. 7.6 б. Случай L = 0 (пунктирная кри- кривая) отвечает лобовому столкновению тела со звездой и никак не может
7.2. ЗАКОНЫ КЕПЛЕРА 105 соответствовать закону движения планеты. При L / 0 сразу можно вы- выделить два принципиально разных сценария. Если Е ^ 0, тело, взаимодей- взаимодействующее со звездой, может уйти на бесконечность, так что и этот случай не имеет отношения к закону движения планет. Если же Е < 0, то движение, как говорят, финитно, т. е. происходит в ограниченной области простран- пространства. При этом радиальная скорость vr обязательно должна быть знакопе- знакопеременной — в противном случае планета либо столкнулась бы со звездой, либо ушла бы на бесконечность, впрочем, смена знака vr прямо следует из зависимости G.9). При условии vr = 0 уравнение G.9) имеет два корня ri, Г2 — см. рис. 7.6 б — их называют точками поворота. Как показано на том же рисунке, в случае Е ^ 0 траектория также имеет точку поворота г[ — но лишь одну, так что финитное движение невозможно. (Дело в том, что по самому смыслу полярных координат — рис. 7.6 а — физически значимый ответ для г может быть только положительным). Уравнение G.9) описы- описывает кривую второго порядка, но единственная кривая второго порядка, не уходящая на бесконечность, есть эллипс: х2/а2 + у2/Ь2 = 1. Для полноты картины упомянем, что траектория пролетающего тела в поле тяготения звезды при Е > 0 представляет собой гиперболу, а в вырож- вырожденном случае Е = 0, соответствующем второй космической скорости, — па- параболу. Рассмотрим подробнее эллиптическую траекторию (рис. 7.7). У\\ЬФО Рис. 7.6 Рис. 7.7 При vr = 0 соотношение G.9) вырождается в квадратное уравнение: г2 + 7 Мтг/Е - L2/BmE) = 0. Его корни, сумма которых, как видно из рисунка, равна длине большой оси эллипса, удовлетворяют соотношению: 2а = п + г2 = -^Мт/Е => Е = -jMm/Ba). G.10) Постоянную секториальную скорость 5 = L/2m удобно привязать к точке i?, где скорость v ортогональна малой оси эллипса: S = b-v/2. Принимая во внимание свойство фокуса эллипса О В = а, приходим к соотношению о ТП1) —— = E-U = Е + jMm/a = jMm/Ba). в Таким образом, v\B ос 1/у/а, а значит, Ъ = 2S/v ос 5д/а. Как известно, пло- площадь эллипса равна S = тгаб, с другой стороны, ее можно выразить через
106 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА секториальную скорость: S = S • Т, где Т — период обращения. Оконча- Окончательно, aSy/a ос S • Т => Т2 ос а3. G.11) Итак, все три закона Кеплера в рамках ньютоновой механики оказывают- оказываются прямым следствием закона всемирного тяготения и уравнения моментов. 7.3. Вращение абсолютно твердого тела вокруг неподвижной оси Переходя к рассмотрению движения макроскопических тел, определим сначала наиболее простой тип движения, зависящего от геометрии тела. И первый шаг на этом пути — исключение из рассмотрения движения дефор- деформируемых тел, так как заранее очевидно, что движения многих частей тела друг относительно друга (и, соответственно, их математическое описание) могут быть достаточно сложны. Это означает, что мы начнем с изучения дви- движения абсолютно твердых тел. Но и среди всевозможных движений абсо- абсолютно твердого тела мы выберем, по-возможности, наиболее простое. Дело в том, что для однозначного определения положения абсолютно твердого те- тела в пространстве необходимо задать шесть независимых величин — шесть степеней свободы. Мы же на данный момент ограничимся простейшим но практически важным случаем, когда существенна лишь одна степень свобо- свободы, — вращением абсолютно твердого тела вокруг неподвижной оси. При этом изменение положения тела в пространстве одно- однозначно определяется единственной координатой ср — углом поворота тела вокруг оси. Вывод основного уравнения для вращения тела во- вокруг неподвижной оси мы для наглядности проведем на примере вращения тонкого однородного диска во- вокруг вертикальной оси, перпендикулярной его поверх- поверхности и проходящей через его центр (рис. 7.8). Слово «тонкий» означает, что толщина диска намного мень- меньше его радиуса и что всеми эффектами, зависящими от толщины диска, можно пренебречь. Чтобы осуще- ствить такое вращение, диск жестко соединен с твер- ис' ' дым стержнем, направленным вдоль оси Oz и заклю- заключенным в подшипники. Опирающиеся на подшипники фланцы Фл, предот- предотвращают перемещение диска в вертикальном направлении. Будем полагать, что масса и радиус стержня пренебрежимо малы по сравнению соответствен- соответственно с массой и радиусом диска. Допустим также, что в некоторой точке на расстоянии h от оси к диску приложена внешняя сила F, модуль и напра- направление которой могут, вообще говоря, меняться со временем. Масса диска равна М, радиус диска — R. Нашей целью является вывод уравнения движения диска, то есть уравне- уравнения, с помощью которого можно было бы находить функцию у?(?), которая играет в данной задаче ту же роль, что и функция г(?) в задачах о движении материальной точки. При выводе мы воспользуемся основным приемом, который применяется в механике для изучения движения тел конечных размеров. Все тело мы- мысленно разбивается на совокупность малых частичек, которые можно рас- рассматривать как материальные точки, взаимодействующие друг с другом и
7.3. ВРАЩЕНИЕ АБСОЛЮТНО ТВЕРДОГО ТЕЛА ВОКРУГ НЕПОДВИЖНОЙ ОСИ 107 с другими телами. В результате задача сводится к задаче о движении си- системы материальных точек, для которых справедливы все законы движе- движения, рассмотренные в предыдущих разделах. Такой выделенный элемент макроскопического тела нередко называют физически бесконечно малым объемом, полагая, что все физические параметры внутри каждого из этих объемов совершенно однородны, а взаимодействие существенно лишь с внеш- внешним окружением. (Математически эта идея выражается удержанием лишь первого члена ряда Тэйлора во всех функциональных зависимостях.) Итак, разобъем мысленно наш диск на совокупность материальных точек с массами rrii (^2mi = М). Мы уже отмечали, что при изучении враща- вращательных движений целесообразно пользоваться не вторым законом Ньюто- Ньютона, но уравнением моментов. Для системы материальных точек уравнение для суммарного момента импульса L имеет вид dL/dt = где L = ^L^, aL^ — момент импульса i-той материальной точки системы относительно одного и того же центра О. Выберем центр О в точке пересечения оси вращения с плоскостью диска. Все образующие диск материальные точки будут при его вращении двигать- двигаться по окружностям с радиусами г^, где п — модуль радиуса-вектора, соеди- соединяющего соответствующую i-ую материальную точку с центром О. Момент импульса отдельной материальной точки определяется векторным произве- произведением: Li = [гда] = rrii\riVj\, где pi — импульс, a v^ — скорость i-той материальной точки. Отсюда сле- следуют две важные особенности нашей задачи. Во-первых, поскольку вектор- векторное произведение направлено перпендикулярно плоскости, в которой лежат образующие его векторы, то все моменты импульса L^ направлены вдоль оси Oz, так как плоскость векторов г^ и v^ перпендикулярна этой оси. Это озна- означает, что у суммарного момента импульса диска L отлична от нуля только одна компонента Lz = ^Liz. Во-вторых, при вращении диска все образу- образующие его материальные точки движутся по окружностям, поэтому г^ и v^ всегда перпендикулярны друг другу, синус угла между ними равен единице, и для Liz •> в соответствии с определением векторного произведения получаем IZ ' ' "I' I Ul 11 Oil i LU. у . J Мы учли, что Vi = TiUJ, где ш = d(p/dt — угловая скорость вращения, одина- одинаковая для всех точек диска. Знак Liz зависит от того, куда направлено век- векторное произведение [г v] — вдоль выбранного положительного направления оси Oz или против него. Мы выбрали для определенности знак «плюс». Вернемся теперь к уравнению моментов. Левая часть этого уравнения для отличной от нуля компоненты Lz с учетом G.12) принимает вид dLx dt dt Величина IOz, равная сумме произведений элементарных масс на квадрат их расстояний от некоторой оси Oz называется моментом инерции тела
108 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА относительно данной оси: Y*rl GЛ4) где суммирование производится по всем элементарным массам т^, на ко- которые мысленно разбито тело. Используя G.12) и G.14), выражение для ^-компоненты суммарного момента импульса диска можно записать в виде iz = IOtu. G.15) Таким образом, левая часть уравнения моментов может быть записана как dLz/dt = IOz(du/dt), откуда, подставляя и; = dcp/dt, окончательно получаем m. G.16) к Сделаем одно замечание, касающееся принятой в механике терминологии. Проекция вектора момента силы М на некоторую ось Oz, проходящую через центр О, относительно которого определен М, назывется моментом силы относительно оси Oz, который мы будем обозначать Моси. С учетом этого замечания уравнение G.16) можно также представить в виде IOz(du/dt) = Y,M0C*. G.17) Хотя мы вывели уравнение G.17) для частного случая (тонкого диска), этот вывод посредством интегрирования по слоям обобщается на случай враще- вращения вокруг неподвижной оси тел любой формы. Итак, основное уравнение для вращения абсолютно твердого тела вокруг неподвижной оси Oz можно записать в виде Как и второй закон Ньютона, оно является дифференциальным уравнением. Нахождение из этого уравнения функции (p(t) — зависимости угла поворо- поворота тела от времени, решает одну из основных задач механики: предсказать положение движущегося тела в различные моменты времени при задании двух начальных условий: начального положения и скорости. В нашем слу- случае начальные условия — это значение угла поворота в начальный момент времени, <р@) = щ, и начальной угловой скорости ш@) = с^о- Значения щ и ujq определяютя условиями конкретной задачи. Таким образом, задание начальных условий является одним из важнейших элементов строгой мате- математической постановки конкретной задачи о вращении твердого тела. Характерной отличительной особенностью задачи о вращении тела вокруг оси по сравнению с задачей о движении материальной точки является то, что теперь в основное уравнение входит не масса т, а момент инерции /Ог, и не сила F, а момент силы относительно оси М0СИ. Подчеркнем, что момент инерции тела относительно некоторой оси суще- существует безотносительно к тому, вращается тело вокруг этой оси или покоит- покоится. Если же тело вращается вокруг некоторой оси под действием внешних сил, то момент инерции служит мерой инертности тела при вращении. В самом деле, при одном и том же моменте внешних сил относительно оси
7.3. ВРАЩЕНИЕ АБСОЛЮТНО ТВЕРДОГО ТЕЛА ВОКРУГ НЕПОДВИЖНОЙ ОСИ 109 вращения угловое ускорение будет меньше у того тела, у которого больше момент инерции. Таким образом, момент инерции тела при вращательном движении играет ту же роль меры инертности, что его масса при поступа- поступательном движении. Как видно из определения G.14), задание полной массы тела т еще ниче- ничего не говорит о величине его момента инерции IOz, который зависит от того, как расположены различные части тела (различные элементы его полной массы) относительно той или иной оси Oz, конкретное положение которой определяется условиями задачи. Поэтому при решении каждой конкретной задачи о вращении вопрос о величине IOz требует отдельного рассмотрения. Покажем на примере нашей исходной задачи о вращении тонкого диска, как определяется момент инерции. Здесь нам необходимо найти момент инерции однородного диска относительно оси, перпендикулярной к плоскости диска и проходящей через его центр (рис. 7.8). Каждый из элементарных объемов с массой т^, на которые мы мысленно разбили весь диск, можно предста- представить как произведение плотности тела р на соответствующий элементарный объем AVf. Следовательно, выражение G.14) для момента инерции IOz можно предста- представить в виде где мы учли, что для однородного диска плотность постоянна, и поэтому вынесли р за знак суммирования. При переходе к бесконечно малым значе- значениям AVi суммирование сводится к интегрированию: = Jp(r)r2dV. G.18) Ради большей общности результата мы вернули р(т) под знак интеграла. Симметрия задачи подсказывает наиболее простой путь вычисления IOz в случае однородного тела вращения. Разобьем наш диск на кольцевые слои толщиной dr. Объем такого слоя равен dV = b • 2тгг dr, где b — толщина диска. Подставляя это выражение в G.18), получаем R r3dr = 2тгЬр—. о Последний результат можно выразить через полную массу диска т, равную произведению плотности р на объем диска b • тгВ2. Окончательно получаем Ioz =mR2/2. G.19) Нахождение момента инерции в рассмотренном примере сильно упроща- упрощалось тем, что тело было однородным и симметричным, а момент инерции мы вычисляли относительно оси симметрии. Если бы мы захотели найти момент инерции диска относительно, например, оси, перпендикулярной к диску и проходящей через его край, то вычисления оказались бы более сложными. В подобных случаях нахождение момента инерции значительно облегчается,
110 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА если воспользоваться следующей теоремой: «момент инерции / относитель- относительно произвольной оси равен сумме момента инерции 1С относительно оси, параллельной данной и проходящей через центр масс тела, и произведения массы тела т на квадрат расстояния а между осями», т. е. 1 = 1с+та2. G.20) Что касается центра масс твердого тела, то он определяется по уже из- известному правилу Jrp(r)dV V Для доказательства соотношения G.20) предположим, что «старая» и «но- «новая» оси связаны вектором параллельного переноса R (рис. 7.9): Ti = Г^о + R, где г^ и г^о — старый и новый радиусы-векторы i-той точки в плоскости ее вращения. Тогда моменты инерции связаны следующим образом: RJ = r + 2R ^2 mirio + ^2 m*r*2o = mR2 + 2R ^ q i i Если «старая» ось проходила через центр инерции, то Rc = 0, a Iq = Ic. Теорема доказана. Ее обычно называют теоремой Штейнера или Гюйген- са-Штейнера. Отметим, что в ней отнюдь не предполагается какая-либо осо- особая симметрия тела. В соответствии с названной теоремой, момент инерции диска относительно оси, перпендикулярной поверхности диска и проходящей через его край, равен найденному нами моменту инерции G.19) относитель- относительно оси, проходящей через центр диска, плюс тВ? (расстояние между осями равно радиусу диска R): Io>z> = mR2/2 + mR2 = C/2)mi?2. В отличие от второго закона Ньютона, в правую часть уравнения вращательного движения входит не сила, а момент силы относительно оси. При этом он играет роль, аналогичную той, которую играет сила для поступательного движения. В реальных задачах непосредственно сам момент си- силы обычно не задан, а заданы модули и направления внешних сил и точки приложения этих сил к телу, как, например, было в нашей задаче о вращении тонкого диска (см. рис. 7.8). Поэтому для опре- определения Моси в конкретных задачах необходимо воспользваться тем, что Моси является, по определению, проекцией момента силы М относительно некоторого центра на ось вращения. Если ось вращения направлена вдоль координатной оси Oz, то Моси = Мг = [r?]z.
7.4. СЛЕДСТВИЯ УРАВНЕНИЯ МОМЕНТОВ 111 Покажем, как выражается M0Cli через условия задачи о вращении тонкого диска (рис. 7.10). Будем полагать, что центр О, относительно которого опре- определен момент силы F, расположен в произвольной точке на оси вращения. Разложим вектор силы F на три взаимно перпендикулярные составляющие, две из которых, Fn и F/^, параллельная и перпендикулярная оси вращения, лежат в плоскости, проходящей через ось вращения и точку приложения внешней силы, а третья F^ — перпендикулярна к этой плоскости (эта составляющая обозначена на рисунке кружком с крестиком). Если в плоскости диска пред- представить себе окружность радиуса h с центром на оси Oz, то составляющая F^ будет направлена по каса- касательной к этой окружности. Момент силы F относи- относительно центра О равен сумме моментов составляющих: М = Мц + Mh + M^, где М|| = [ГРц] , Мл = [гРл], М± = [гР J . Рис. 7.10 Векторное произведение направлено перпендикулярно плоскости, в кото- которой лежат образующие его векторы. Поэтому векторы Мц и М/^ перпен- перпендикулярны оси Oz, и следовательно, их проекции на эту ось равны нулю. Момент М^ имеет модуль, равный rF_\_. Если составляющая F^ на рис. 7.10 направлена «от нас», то ее момент М^ по правилу винта направлен так, как изображено на рисунке, т. е. образует с осью Oz угол а, косинус которого равен h/r. Следовательно, в этом случае проекция на ось Oz вектора М^ положительна и имеет величину М± cos a = hF±. Если вектор F^ направлен на рисунке «на нас», то М^ следут направить на рисунке в противополож- противоположную сторону, и тогда проекция этого вектора на ось будет иметь величину М± cos (тг + а) = —hF±. Другие компоненты М (Мц и M/J проекций на ось Oz, как уже отмечалось, не имеют. Следовательно, Mz = M±iZ = ±hF_\_. Таким образом, получаем для момента силы относительно оси вращения: M=MZ = ±hF±. G.21) Подчеркнем еще раз, что по правилу винта знак «плюс» соответствует слу- случаю, когда внешняя сила приводит к вращению вокруг направления оси Oz против часовой стрелки, а знак «минус» соответствует вращению тела в противоположном направлении. 7.4. Следствия уравнения моментов Рассмотрим несколько характерных задач, представляющих движение ли- либо равновесие тела с закрепленной осью. Первый пример — вращение однородного цилиндра вокруг неподвижной оси, совпадающей с его геометрической осью симметрии Oz, в случае, когда по касательной к его поверхности и перпендикулярно к оси вращения на цилиндр действует постоянная сила Fq (рис. 7.11 а). Пусть масса цилиндра т, радиус — i?, длина — /. Такая задача является примером вращения вала какого-либо механизма. В реальной ситуации между осью и валом всегда еще действуют силы трения. Мы будем полагать, что они достаточно малы, чтобы ими можно было пренебречь. Тогда единственный момент силы, не равный нулю, есть Моси = F0R.
112 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА Момент инерции цилиндра относительно оси симметрии легко найти, если мысленно представить цилиндр как совокупность тонких дисков с массами rrii, «нанизанных» на ось Oz (рис. 7.11 б), откуда сразу следует, что искомая величина дается все той же формулой G.19): IOz = (l/2)mR2. Разумеется, теперь в ответ входит полная масса цилиндра т. Таким обра- образом, уравнение моментов приобретает вид d2ip/dt2 = 2F0/(mR). G.22) Чтобы решение было однозначно определено, необходимо, как мы уже знаем, задать начальные условия: начальные значения угла поворота (р и угловой скорости и; = dcp/dt. Выберем, например, начальные условия в виде: ср(О) = О, о;@) = 0. Уравнение G.22) с математической точ- точки зрения полностью аналогично уравне- уравнению, определяющему движение тела, па- падающего под действием силы тяжести, и его решение также находится без труда на основе элементарных правил вычисления 1 производных от простейших функций. ч^_^ Удовлетворяющее начальным условиям ^ То решение уравнения G.22) имеет вид Рис. 7.11 cp(t) =F0/(mR)t2. Мы уже отмечали, что одной из особенностей вращательного движения те- тела вокруг неподвижной оси, отличающей его от поступательного движения, является зависимость вращения не непосредственно от величины приложен- приложенной к телу силы, а от момента этой силы относительно оси вращения. Так в рассмотренном выше примере движение диска определяется не величиной силы Fq, а ее моментом относительно оси вращения, то есть произведением силы на плечо (в нашем случае — Fq- R). И даже при очень малом значении модуля силы это произведение может иметь большую величину, если плечо силы достаточно велико. Эта особенность вращательного движения вокруг неподвижной оси лежит в основе работы рычага — одного из древнейших орудий труда человека. Схематически любой рычаг можно представить, как тонкий стержень, кото- который может вращаться вокруг неподвижной оси, перпендикулярной стержню и проходящей не через его центр. На рис. 7.12 а изображен такой стержень, который может вращаться вокруг горизонтальной оси, перпендикулярной стержню (в нашем случае — перпендикулярно плоскости рисунка). Точка О стержня, через которую проходит ось вращения, делит стержень на нерав- неравные отрезки длиной hi и /12- Допустим стержень расположен горизонтально, и к концам стержня, перпендикулярно ему и оси вращения, приложены две силы — Fi и F2. Будем считать стержень достаточно легким, так что дей- действием силы тяжести по сравнению с силами Fi и F2 можно пренебречь. Из уравнения моментов G.5) можно найти условие равновесия стерж- стержня, то есть условие, при котором стержень будет оставаться неподвижным или вращаться с постоянной угловой скоростью. В нашем случае уравнение
7.4. СЛЕДСТВИЯ УРАВНЕНИЯ МОМЕНТОВ 113 О моментов имеет вид I0(du/dt) = F2h2 - Fxhi, G.23) где Iq — момент инерции стержня относительно оси вращения. Моменты сил Fi и F2 относительно оси вращения входят в уравнение с разными знаками в соответствии с «правилом винта»: в одном случае сила стремится повернуть стержень по часовой стрелке, а в другом — против. Приравнивая левую часть уравнения G.23) нулю, получаем условие равновесия в виде F\hi = F2h2. Из него следует, что как бы ни была велика, например, сила Fi, ее всегда можно уравновесить малой силой F2, если выбрать плечо h2 достаточно большим по сравне- сравнению с h\. Приспособления, использующие рассмотренное выше свойство вращательного движения вокруг неподвижной оси, получили название рычагов. В качестве примера рис. 7.12 б иллюстрирует, как свойство рычага исполь- используется при работе лопаты. «Правило рычага» было из- известно уже в глубокой древности, и впервые оно было, по-видимому, четко сформулировано в третьем веке до нашей эры знаменитым древнегреческим ученым и изо- изобретателем Архимедом. Выведем теперь выражение для кинетической энер- энергии тела, вращающегося вокруг неподвижной оси, ко- которое может оказаться полезным при изучении некото- некоторых особенностей вращательного движения на основе законов сохранения. Пусть тело вращается вокруг оси Oz (рис. 7.13). Разобьем мысленно тело на элементар- элементарные массы гп{. Линейная скорость элементарной массы р ч Л*\ гп{ равна V{ = uiri, где Т{ — расстояние массы гп{ от оси Oz. Следовательно, для кинетической энергии i-ой элементарной массы получается выражение Т{ = ra^f/2 = A/2) тгио2г2. Кинетическая энергия тела слагается из кинетических энергий его частей: Рис. 7.12 О Сумма в правой части этого соотношения представляет собой момент инер- инерции тела IOz относительно оси вращения. Таким образом, кинетическая энергия тела, вращающегося вокруг неподвижной оси, равна T = (l/2)IOzu2 = L2/BIOz). G.24) Сравнивая соотношения G.17) и G.24), соответственно, со вторым зако- законом Ньютона и выражением для кинетической энергии материальной точки, можно убедиться в существовании между ними глубокой аналогии. Поэтому в случае, когда движение тела есть изменение во времени не линейных, но угловых (ориентационных) координат, говорят, что L есть обобщенный им- импульс, М — обобщенная сила, a IOz — обобщенная масса, соответствующие
114 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА обобщенной координате (р. (Эта терминология построена отнюдь не ради данного частного случая — на таком языке формулируется механика в са- самом общем виде, который называется аналитической механикой.) 7.5. Трехмерное движение твердого тела. Гироскопы Замечание, сделанное в конце предыдущего параграфа, побуждает нас представить уравнения G.17) и G.24) в векторной форме, для чего целе- целесообразно включить в рассмотрение понятие вектора угловой скорости и следующие из этого понятия формулы B.13): dr/dt = [wr]; dv/dt = [wv]. G.25) С учетом G.25) формула G.12) должна быть переписана в виде Li = т{г}и, а G.15) — соответственно, L = 1Огы, G.26) наконец, уравнение моментов G.17) принимает следующую форму: . G.27) Ъ Сколь ни велик соблазн отнести уравнения G.26), G.27) к произвольному неодномерному движению, делать это надлежит с большой осторожностью, поскольку выводились они для частного случая тела с закрепленной осью, когда вектор о; удерживается неизменным по направлению, а достигается это в общем случае несимметричного вращающегося тела посредством мо- момента реакции М7 в опорах оси, дополнительного к правой части G.17), учитывающей только вращающие моменты. В общем случае трехмерного движения твердого тела произвольной фор- формы (точнее — произвольной геометрии массы) ревизии подвергается прежде всего формула G.26). Векторы шиЬ оказываются, вообще говоря, не парал- параллельны. Соответственно, уравнение моментов G.15) лишь в случае осевой симметрии сводится к G.27). Оказывается, однако, что в каждом твердом теле имеются три взаимно перпендикулярные, проходящие через центр масс, оси, такие, что при враще- вращении твердого тела вокруг них зависимость возникающего момента импульса от угловой скорости вращения имеет простой вид: L = /о;, где / — момент инерции тела относительно оси вращения. Эти оси называются главными осями инерции твердого тела. Мы не будем останавливаться на доказа- доказательстве этого утверждения, а рассмотрим основные следствия из него. Представим себе, что мы сообщили телу вращение с угловой скоростью о; вокруг одной из его главных осей. Возникающий у тела момент импуль- импульса L равен, согласно вышесказанному, L = lev. Если при этом на тело не действуют внешние силы или суммарный момент внешних сил равен нулю, то, согласно G.27), L = lev = const, и, следовательно, cv = const. Другими словами, в случае, когда момент действующих на тело внешних сил равен нулю, угловая скорость вращения тела вокруг любой из его главных осей инерции сохраняется по величине и направлению. Определение фактического положения главных осей в твердом теле облег- облегчается правилом, которое гласит: все оси симметрии твердого тела являются
7.5. ТРЕХМЕРНОЕ ДВИЖЕНИЕ ТВЕРДОГО ТЕЛА. ГИРОСКОПЫ 115 его главными осями инерции. (В частном случае тела вращения происходит, как принято говорить, вырождение: любая ось, перпендикулярная оси сим- симметрии, является главной осью, так что в этом случае их будет не три, а бес- бесконечно много.) Поэтому поведение твердых тел, вращающихся вокруг своих осей симметрии, обладает рядом специфических особенностей, широко ис- используемых в технике. Массивные симметричные тела, быстро вращающие- вращающиеся вокруг оси симметрии, которая, в свою очередь, свободно ориентируется в пространстве, получили название гироскопов. Способность оси гироскопа сохранять при определенных условиях свое направление в пространстве ле- лежит в основе их использования в качестве навигационных приборов. Само же это свойство обусловлено сохранением момента импульса вкупе с тем обстоятельством, что угловая координата, характеризующая вращение, ме- меняется быстрее, нежели любая другая: и > О, G.28) где О — угловая скорость поворота оси волчка в пространстве. Именно в этом смысле вращение гироскопа должно быть быстрым. Рассмотрим гироскоп, имеющий вид массивного колеса, подвешенного не- несимметричным образом, как показано на рис. 7.14. (Для демонстрации удоб- удобно использовать велосипедное колесо, раскрученное электромоторчиком). Угловая скорость о; и момент импульса L на- направлены по оси. На гироскоп действует сила тяжести и натяжение нити Т. Вычисляя момент сил относительно центра инерции гироскопа, мы должны учесть вклад в него лишь от силы на- ' " "' 1 тяжения, так как момент силы тяжести относи- относительно точки С равен нулю. Момент силы на- натяжения равен М' = Т • h и направлен так, как показано на рис. 7.14. Из уравнения моментов G.5) следует, что приращение вектора L будет "ис< '*14 происходить в направлении момента М7, то есть ось вращения должна пово- поворачиваться в горизонтальной плоскости — на рис. 7.14 это показано двойной стрелкой. Ответ лишь на первый взгляд кажется парадоксальным. В наших рассу- рассуждениях мы молчаливо считали выполненным условие G.28), в котором под О следует понимать именно скорость поворота вектора L. Таким образом, для демонстрации нетривиального поведения гироскопа он должен быть как следует раскручен. В этом случае он не может опрокинуться, хотя и подве- подвешен несимметричным образом. В самом деле, при опрокидывании вектор L должен был бы повернуться в вертикальной плоскости. Но момент внешней силы для такого поворота должен быть направлен по вертикали, а значит, сама сила должна быть горизонтальна и направлена по нормали к оси. Но при подвешивании гироскопа на нити такая сила отсутствует. Вот если бы посредством жесткой гироскоп был лишен степени свободы, позволяющей его оси поворачиваться в горизонтальной плоскости, то реакция опоры бы- была бы ориентирована именно так, и колесо бы опрокинулось. Мы не случайно упомянули именно велосипедное колесо. Большая устой- устойчивость быстро движущегося велосипеда в сравнении с неподвижно стоя- стоящим, не в последнюю очередь обусловлена именно гироскопическим эффек- эффектом вращающихся колес.
116 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА --_. dL Рассмотрим задачу о так называемой регулярной прецессии волчка — см. рис. 7.15. Как известно, быстро вращающийся волчок, будучи слегка выведен из вертикального положения, не падает, но приобретает дополни- дополнительное вращение в наклонном положении, угловая скорость которого О удовлетворяет неравенству G.28). Когда же указанное неравенство, по мере замедления вра- вращения волчка, еще даже не нарушается, но пере- перестает быть сильным (> вместо 3>), на вращение накладываются сложные нерегулярные движе- движения (их называют нутациями). Эту стадию дина- динамики волчка мы рассматривать не будем, ввиду математической сложности, но объяснить регу- регулярную прецессию для нас труда не составит. Обратимся к рис. 7.15. Пусть С — центр инер- инерции волчка, О — точка опоры, причем \СО\ = а. Поскольку в точке О, помимо реакции опоры N, приложена еще и сила трения FTp, нам, вообще говоря, не известная, момент сил проще вычи- вычислять относительно точки О. Он, очевидно, ра- Рис. 7.15 вен тда sin в и направлен от нас перпендикулярно плоскости рисунка. При условии G.28) мы вправе связать момент импульса гироскопа L исключи- исключительно с угловой скоростью и и считать его направленным строго по оси. Из уравнения моментов G.15) следует, что за малое время dt момент импульса L получает приращение dL = Mdt, причем, как и сам вектор М, это малое приращение перпендикулярно L. Таким образом, эволюция вектора L свелась к повороту, который в гори- горизонтальной плоскости можно характеризовать углом dip = dL/(L sin6) = (тда sin6)/(L sin6)d? = (mga/L)dt. Получается, что ось волчка и в самом деле должна прецессировать, причем угловая скорость прецессии не зависит от угла Э: О = dcp/dt = mga/I^LO, G.29) где Iq — момент инерции волчка относительно оси симметрии. Условие G.28) можно в данном случае представить в эквивалентном виде тда <С Iouj2- Уравнение моментов можно переписать в векторной форме M = dL/dt= [OL], а результат G.29), соответственно, примет вид ft = -mga/(Iow). G.30) 7.6. Плоское движение твердого тела По самому определению, плоское движение отвечает изменению во време- времени лишь трех координат твердого тела, например, двух декартовых ж, у и одной ориентационной ср. Последняя может и выпадать, если движение — чисто поступательное. С другой стороны, к плоскому сведется и существен- существенно трехмерное движение, если оно является поступательным по одной из декартовых координат.
7.6. ПЛОСКОЕ ДВИЖЕНИЕ ТВЕРДОГО ТЕЛА 117 Рис. 7.16 При плоском движении, как легко усмотреть из рис. 7.16, любое переме- перемещение можно представить как поворот вокруг некоторой точки О (точнее — оси, проходящей через О и ортогональной плоскости перемещения). Особый случай — поступательное движение, при котором точка О как бы премещается в бесконечность. Как следствие, малое перемещение представля- представляется как поворот вокруг некоторой оси О на малый угол dc^. Если этот поворот происходит за время dt, то величина uj(t) = dcp/dt называется мгновен- мгновенным значением угловой скорости, а сама ось, про- проходящая через точку О — мгновенной осью враще- вращения. Если, например, мы можем установить, что в данный момент времени какая-то точка тела име- имеет нулевую скорость, то именно через нее проходит мгновенная ось вращения; если же мы наблюдаем две таких точки, v = 0 для всего нашего тела. Из рис. 7.16 можно понять также и то, что плоское перемещение можно представить не только в виде поворота, но и в виде комбинации любого поступательного перемещения и поворота. Просто, перенеся тело, которому принадлежит отрезок АВ, в любую заданную точку, мы проведем затем построение, эквивалентное тому, которое показано на рис. 7.16. Если мы вновь обратимся к малым перемещениям, то сдвинув любую точку тела на некоторый вектор dr = {dx,dy}, мы затем осуществим поворот на угол dcp. Соответственно, деля на dt, получаем представление движения скоростью v(t) и угловой скоростью u(t). Фи- Физический смысл v(t) — скорость системы отсчета, в ко- которой рассматривается вращение. Обратимся еще раз к рис. 7.16. Какова бы ни была упомянутая комбинация поступательного и вращатель- вращательного перемещений, угол между отрезками АВ и А1 В1 остается инвариантом. Иными словами, как бы мы ни сместили мгновенную ось, тело придется повернуть на Рис. 7.17 один и тот же угол. Еще раз возвращаясь к малым перемещениям, прихо- приходим к важному выводу: угловая скорость u(t) при плоском движении не зависит от системы отсчета. Уравнения движения, в зависимости от постановки задачи, обычно пишут- пишутся либо для центра масс тела — G.31) т (dvc/dt) = либо для мгновенной оси вращения — = ^ Мв fOBH, G.32) с соответствующим пересчетом момента инерции и момента сил относитель- относительно этой оси. Рассмотрим в качестве иллюстрации задачу о скатывании однородного сплошного цилиндра массы т и радиуса R с наклонной плоскости, образу- образующей с горизонтом угол 7 (рис. 7.17). Предполагаем, что цилиндр скатывает- скатывается без проскальзывания, тогда скорость в точке О равна нулю. Мгновенная ось вращения совпадает с линией зацепления, проходящей через точку О,
118 ГЛ. 7. УРАВНЕНИЕ МОМЕНТОВ. ДИНАМИКА ТВЕРДОГО ТЕЛА в которой к телу приложена сила трения. Второй закон Ньютона, с учетом направления движения, целесообразно записать в проекции на наклонную плоскость: m(dvc/dt) = mr(dw/dt) = rag sin 7 — ^тр, G.33) а уравнение моментов запишем относительно мгновенной оси: dou A о 2\ dou I -— = l-mr +mr —=mgrsin7, G.34) at \Z J at (мы использовали теорему Штейнера для вычисления момента инерции от- относительно мгновенной оси вращения). Ни сила трения, ни реакция опоры не дают вклада в уравнение G.34), поскольку обе они проходят через точку О, а значит, их моменты относительно мгновенной оси равны нулю. Из G.34) находим угловое ускорение dou/dt = B/3) (g/r) sin 7, следовательно, линейное ускорение равно ац = r(du/dt) = B/3)#sni7. Далее, подставляя это выражение в G.33), получаем FTp = A/3) тд sin j. G.35) Таким образом, сила трения в данной задаче принимает вполне определен- определенное значение. Но как мы знаем (гл. 5), оно не может превосходить предела aN±, где а — коэффициент трения, a N_\_ — сила реакции опоры, в нашем случае N± = mg cos 7. Таким образом, G.35) можно выполнить лишь при условии tg7<3<x G.36) По физическому смыслу G.36) представляет собой условие непроскальзыва- непроскальзывания скатывающегося цилиндра. Если цилиндр скатывается с высоты /г, то его конечная скорость равна , / \1/2 . ^кон = ^2ац/ =[2- B/3) ?sin7 • (h/s'mj)) = y/(A/3)gh. Убедимся, что такое значение скорости удовлетворяет закону сохранения механической энергии. Согласно теореме Кенига, Tf = (l/2)mv2c + A/2)Iccj2 = (l/2)mv2 + A/2) (mr2/2) (v/rJ = mgh. Элементарные вычисления дают то же самое значение г>КОн- Возникает вопрос: как может сохраняться чисто механическая энергия при наличии заведомо ненулевой силы трения? Но дело в том, что сила трения приложена в точке О, где скорость равна нулю, а потому и работы не совершает. Таким образом, плоский характер движения столь существенно упрощает задачу о динамике тела конечных размеров, что она в принципе оказывается не намного сложнее задачи о динамике материальной точки.
ВОПРОСЫ И ЗАДАЧИ 119 Вопросы и задачи 1. Что такое момент импульса и момент силы? 2. Сохраняется ли при движении спутника по орбите его энергия, импульс, момент импульса? 3. Сохраняется ли суммарная энергия, суммарные импульс и момент импульса всех тел Солнечной системы? 4. Сколько степеней свободы у абсолютно твердого тела? 5. Что такое момент инерции твердого тела? 6. Что такое момент силы относительно оси? 7. Что такое главные оси инерции твердого тела? 8. Чему равен момент инерции тонкого однородного кольца массы т и радиуса R от- относительно оси, касательной к нему и перпендикулярной его плоскости? Ответ: I = 2mR2. 9. Однородный цилиндр массы mi и радиуса R вращается без тре- трения вокруг горизонтальной оси под действием груза массы т2, при- прикрепленного к легкой нерастяжимой нити, намотанной на цилиндр (рис. 7.18). Найти угол поворота цилиндра (р в зависимости от вре- времени, если при t = 0 (р = 0, dcp/dt = 0. Решение. Уравнения движения для цилиндра и для груза имеют вид I(d2ip/dt2) = ВТ, m2(d2z/dt2) = т2д - Т, рис< 7 18 где Т — натяжение нити, / = miR2/2 — момент инерции цилиндра. Перемещение груза и угол поворота цилиндра связаны соотношением z = R(p. Учитывая это соотношение и исключая из уравнений натяжение нити Т, получаем: (/ + m2R2)(d2ip/dt2) = m2gR. Решение этого уравнения, удовлетворяющее начальным условиям, имеет вид Проверьте решение по размерности и по очевидным результатам в предельных случаях (д = 0, т2 = 0 и т. п.). 10. Вертикальный столб высотой / подпиливается у основания и падает на землю, пово- поворачиваясь вокруг нижнего основания. Определить линейную скорость его верхнего конца в момент удара о землю. Ответ: v = л/Зд/. Указание: Воспользоваться законом сохранения энергии. 11. Однородный тонкий тяжелый стержень длины / висит на горизонтальной оси, про- проходящей через один из его концов. Какую начальную угловую скорость и надо сообщить стержню, чтобы он повернулся на 90°? Ответ: и = л/Зд/1. 12. Небесное тело 1991ДА движется по вытянутой орбите, так что минимальное рассто- расстояние от него до Солнца равно радиусу орбиты Марса, а максимальное — радиусу орбиты Урана. Определите период обращения 1991 ДА вокруг Солнца Т, если известны периоды обращения Марса Т\ = 1,88 года и Урана Т2 = 84 года. Ответ: Т = 2/2 (if3 + Т?3)^. 13. В 1978 году у планеты Плутон обнаружен спутник — Харон. Плутон и Харон обра- обращаются вокруг общего центра масс по круговым орбитам, причем расстояние между их центрами R = 19 640 км, а период обращения Т = 6,4 суток. Определите, какую часть массы Земли составляет суммарная масса системы Плутон-Харон. Считать известными радиус Земли R = 6 400 км и ускорение силы тяжести на поверхности Земли. Ответ: (МПл + Мх)/М3 = 47v2Rs/T2gR3 = 0,024.
ГЛАВА 8 ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД 8.1. Упругие деформации. Закон Гука До сих пор мы изучали условия равновесия или характер динамики либо отдельной материальной точки, либо их совокупности. Абсолютно твердое тело рассматривалось как важный частный случай такой совокупности. Те- Теперь мы обращаемся к сплошной среде. Такое понятие используется при решении задач, которые затруднительно свести к механике материальной точки. Различие относится, конечно же, не к предмету, но к методу рассмо- рассмотрения. Когда мы говорим об абсолютно твердом теле, мы просто пренебрегаем его деформациями, полагая, что их учет приведет лишь к некоторым ма- малым поправкам в ответе динамической задачи. То же можно сказать и о любой материальной точке, хотя в этом приближении влияние деформаций и не столь очевидно. Но избежать деформаций невозможно в принципе, и это оказывается следствием самых фундаментальных физических законов. В самом деле, представим себе абсолютно твердый стержень. Приложим к одному его концу некоторую силу, которая приведет его в движение в продольном направлении. Поскольку стержень не может деформироваться, оба его конца должны начать двигаться одновременно, но это значит, что мы транслировали воздействие (сигнал) от одного конца к другому с беско- бесконечной скоростью. Это решительно противоречит теории относительности, поскольку по современным понятиям эта скорость должна быть конечной и не может превышать скорости света (см. гл. 10). Описанный мысленный эксперимент лишь показывает, что никакое те- тело нельзя считать абсолютно твердым в абсолютном смысле, т. е. безотно- безотносительно к постановке задачи. Корректный учет деформаций и механиче- механических напряжений в целом составляет предмет обширной и довольно сложной области механики, во многих отношениях смыкающейся с физикой твердого тела. Механика деформируемых тел имеет массу технических приложений, весьма важных в практическом отношении. В нашем же курсе мы вынужде- вынуждены ограничиться наиболее простыми и фундаментальными положениями этой науки. Во-первых, мы ограничимся рассмотрением упругих, или, что то же, обра- обратимых, деформаций. Тем самым мы оставляем за рамками нашего курса эффекты пластичности и механического разрушения. Упругие деформации, по определению, исчезают после снятия вызывающих их напряжений, то есть не сопровождаются ни диссипацией, ни перестройкой структуры веще- вещества. Строго говоря, абсолютно упругих деформаций не бывает, но в массе практически интересных случаев мы с очень хорошей точностью можем ис- использовать такое приближение.
8.1. УПРУГИЕ ДЕФОРМАЦИИ. ЗАКОН ГУКА 121 Во-вторых, мы определим твердое тело так, как принято определять его в физике, а именно — как кристаллическое состояние. В бытовом понимании (и даже в механике, пока и поскольку мы не касаемся проблемы дефор- деформаций) твердыми телами можно считать также переохлажденные жидкости (стекла). Но их свойства с точки зрения материаловедения весьма нетри- нетривиальны, например, под нагрузкой они могут течь, только очень медлен- медленно. Еще большее своеобразие обнаруживает высокополимерная фаза. Но мы ограничимся рассмотрением упругих свойств кристаллов. В-третьих, мы не будем касаться монокристаллов, но займемся исключи- исключительно поликристаллическими телами — к таковым относятся, например, все обычные изделия из различных металлов. Они не демонстрируют упоря- упорядоченности структуры, характерной для монокристаллов, но в кажущемся хаосе расположения элементарных монокристалликов сохраняются некото- некоторые присущие им свойства. По отношению к деформациям монокристалл и поликристалл могут быть весьма различны. Например, предел упругости монокристалла А1 составля- составляет примерно 40 Н/см , а у технического алюминия тот же параметр равен 104 Н/см2. Если же говорить об упругих свойствах, то для монокристалла их можно характеризовать как минимум тремя константами — в случае ку- кубической решетки, — а для более сложных кристаллов это число достигает 21. Упругие свойства поликристалла описываются всего двумя независимы- независимыми константами. Простейшим и важнейшим законом, которому подчиняются упругие де- деформации, является закон Гука. В изначальном виде он формулировался предельно просто: при растяжении или сжатии твердого стержня малое из- изменение его длины оказыается пропорционально приложенной силе: А/ = F/k. (8.1) При этом величина силы F должна быть много меньше некоторого преде- предела упругости Fq, за которым начинаются необратимые деформации. Суще- Существенно, что коэффициент к — один и тот же при растяжении и сжатии стержня. Однако за- и *| \* *\ кон Гука в виде (8.1) выглядит слишком неуни- ^-| 5 | 1 5 Ь^ версальным; получается, что коэффициент к должен определяться особо для каждого отдель- отдельного тела, и даже для воздействия на одно и то же тело в разных направлениях. Привести его к более конструктивной форме нам поможет рис. 8.1. Возьмем два одинаковых стержня дли- длины / с поперечным сечением S и растянем их рис< gi силой F', сцепив последовательно, как показано на рис. 8.1 а. Каждый стержень растягивается силой i7", каждый удлиняет- удлиняется на А/, а вместе они удлиняются на 2 А/. Отсюда ясно, что А/ ос /, и (8.1) можно переписать следующим образом: Если теперь сцепить стержни параллельно (рис. 8.1 б) и приложить силу 2F, каждый стержень снова растягивается силой F и удлиняется на А/. Представим систему, изображенную на рис. 8.1 б, как стержень длины / с поперечным сечением 2S. Отсюда следует, что растяжение задается не силой
122 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД как таковой, но отношением силы к площади сечения: о = F/S. (8.2) Величина а в механике деформируемых тел называется напряжением и измеряется в Н/м2 (в технике часто пользуются внесистемной единицей кгс/см2). В телах сложной формы и при сложных нагрузках естественно использовать определение а = dF/dS. При этом величина а в общем случае характеризуется двумя векторами: ориентацией площадки dS и вектором силы dF. С учетом изложенных выше соображений закон Гука приобретает окон- окончательный вид е = Al/l = а/Е, (8.3) где е называется деформацией, а величина Е теперь уже просто константа вещества, которую называют модулем Юнга. Линейность закона (8.3) отражает всего лишь тот факт, что в разложении функции общего вида первый член при упругих деформациях доминирует, и таким образом, су- существенной оказывается только одна константа вещества. Но как следствие продольной деформации, может измениться и поперечный размер тела. Опыт показывает, что и этот закон для поликристаллических веществ в пре- пределах упругих деформаций оказывается линейным, причем знак поперечной деформации противоположен знаку продольной: е± = Al±/l± = -/i(A///) + ... ~ -lie. (8.4) Константа вещества \i называется коэффициентом Пуассона. Важно отме- отметить, что поперечная деформация вызвана продольным напряжением и сама дополнительных напряжений не вызывает. Работа, совершенная при растяжении или сжатии образца, зависит исклю- исключительно от продольной деформации, в силу соотношения Совершенная работа запасается в виде энергии упругой деформации, кото- которая освобождается при снятии нагрузки, А/ а U = AA = О О Эта энергия распределена по всему объему деформированного тела, что дает основание ввести плотность энергии упругой деформации w = A/2)(а2/Е) = A/2)ае = A/2)Ее2. (8.5) Оказывается, две константы — Ви/i — в линейном случае, характерном для упругих деформаций поликристаллов, исчерпывающим образом описы- описывают упругие свойства вещества, то есть линейный отклик на любое воз- воздействие, может быть выражен через эти две постоянные. Нам предстоит
V Рис 8 ) yS у^ .2 8.2. СДВИГ И КРУЧЕНИЕ 123 убедиться в этом на ряде хрестоматийных примеров. Первый пример — все- всестороннее сжатие твердого тела. Введем понятие давления — нагрузки, дей- действующей по нормали к поверхности тела — V = dFjdS. Как известно, эта величина измеряется в паскалях: 1 Па = 1 Н/м2. Для об- облегчения последующих вычислений рассмотрим тело, имеющее форму параллелепипеда (рис. 8.2). Для одной продольной и двух поперечных деформаций, обусловленных продольным на- напряжением вдоль каждой из его осей, получаем по оси х ех = -V/E; ey(x), ez^x) = по оси у ?у = -V/E; ez{y), ех{у) = по оси z ez = -V/E; ex^z)l sy{z) = fiV/E. Таким образом, ex = ey = ez = {-V/E) A - 2/i). (8.6) Соответственно, ^- = S ]nV = S(lnlx + lnL + In/,) = ex + ey + ez = ^A - 2/i). (8.7) V hi При всестороннем сжатии обязательно должно быть SV < 0, в противном случае тело было бы неустойчиво по отношению к неограниченной самоде- самодеформации. Действительно, пусть а = dV/dp > 0 и в результате случайной температурной флуктуации объем тела увеличился, это эквивалентно тому, что мы подвергли тело сжатию. Но увеличение объема приводит к еще боль- большему увеличению давления, т. к. Ар = A/2)AF > 0 и т. д. Отсюда следует универсальное ограничение О < /i < 1/2. (8.8) Опыт показывает, что /i —>> 1/2 у некоторых полимеров, /i —>> 0 для пори- пористых тел, а у поликристаллов 1/4 < \i < 1/2. 8.2. Сдвиг и кручение В отличие от растяжения и сжатия, деформация сдвига вызывается ка- касательными напряжениями (рис. 8.3 а). Пусть т = dF^/dS — касательное напряжение (i*j| — сила, параллельная поверхности пробного кубика). След- Следствием деформации будет угол перекоса 7- При условии его малости связь между воздействием и откликом должна быть линейной — 7 = От, (8.9) где коэффициент G именуется модулем сдвига, а все соотношение (8.9), как и (8.3), — законом Гука. Для равновесия деформированного кубика к нему одновременно с каса- касательным напряжением т должно быть приложено еще одно, равное и проти- противоположно направленное (показано на рис. 8.3 а штрихованной стрелкой), а
124 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД также дополнительная пара сил, уравновешивающая момент этих сил, по- показанная на рис. 8.3 точечными стрелками. Два верхних напряжения обес- обеспечиваются непосредственно воздействием, нижние — реакцией опоры. Рас- Рассмотрим равновесие уголка ABC (рис. 8.3 б). Из построения равновесия сил, действующих на уголок (т dS вдоль граней В А и ВС, т dSy/2 — по бис- биссектрисе угла ABC), следует, что на поверхности В А возникает такое же напряжение т, но уже не касательное, а нормальное. Как следствие, внутри деформируемого кубика можно выделить кубик abed (рис. 8.3 в), который подвергается растяжению по оси т\ и сжатию по оси ?. Далее каждому спосо- способу рассмотрения упругой деформации будет удобно поставить в соответствие свою плотность энергии. Во-первых, в соответствии с рис. 8.3 а, dll = -F • dl = -г dx dy • dz^( => w = С другой стороны (см. рис. 8.3 в), -?? = ?п =-Ъ + »-Ъ => dU = 2'rdr]dC dU_ dV Е rE 2Т'7 2<Г w = Таким образом, = г G = Е 9Г~- F — --1+,,- (8Л0) zu hi I + /i Итак, модуль сдвига удается выразить через две ранее введенные упругие константы. тс15 г| dsV2 Рассмотрим деформацию кручения (рис. 8.4). Пусть к цилиндру радиу- радиуса R с закрепленным основанием приложен крутящий момент М. Если при этом свободный конец прокручивается на угол (р, то линейный закон, ана- аналогичный (8.3), имеет вид M = ftp, (8.11) где / именуется модулем кручения. Рассмотрев деформацию трубочки ради- радиуса г и толщины дг <^ г, нетрудно убедиться, что для нее кручение эквива- эквивалентно деформации сдвига, причем угол сдвига тривиальным образом свя- связан С if, где h — длина образца. Вклад в полный момент от нашей трубочки равен SM = т • 2тгг5г • г где т = Gj = G<p(r/h).
4 J8M= J2-f-<Pr*dr=v^- = f.v. (8.12) 8.3. ТЕЧЕНИЕ ИДЕАЛЬНОЙ ЖИДКОСТИ. УРАВНЕНИЕ НЕПРЕРЫВНОСТИ 125 Соответственно, для сплошного цилиндра R = J8M= О Таким образом, модуль кручения однородного стержня равен 7rGi?4/B/i), а для тонкой трубочки — 2тгг3#г • G/h. Мы вновь убедились в том, что ли- линейный отклик на внешнее воздействие может быть выражен исключительно через модуль Юнга и коэффициент Пуассона. Интересным след- „„„„„ ствием закона (8.11) оказывается соотношение для так называе- называемых крутильных колебаний. Пусть массивное симметричное тело радиуса R с моментом инерции / подвешено на проволоке длины / и радиуса г с модулем кручения / (рис. 8.5). Уравнение момен- тов G.13) для этого случая приводится к виду 1ф = -M(ip) = -f<p, а это уравнение типа D.18), решение которого хорошо известно: ср = сро cos(ut + Ф), где и = /// = 7rGr4/(m/i?2). Рис. 8.5 8.3. Течение идеальной жидкости. Уравнение непрерывности В отличие от твердых тел, жидкости и газы, с точки зрения механики, являются веществами текучими. Но если в твердых телах пластичность не- неотделима от диссипации, то в случае текучей среды диссипацией при рас- рассмотрении многих важных процессов и явлений можно пренебречь. Такой подход называется приближением идеальной жидкости (заметим, что во многих случаях приближение идеальной жидкости описывает и динамику течения газа). Далее, очень многие практически важные задачи допуска- допускают представление несжимаемой жидкости. Это понятие вошло в обиход и нередко используется в технических приложениях, но надо отдавать себе от- отчет в том, что сжимаемость жидкости, если понимать ее в контексте гл. 8.1, заметно превышает таковую у твердого тела. Но как твердое тело — вполне реальное и подверженное деформациям — можно во многих динамических задачах с хорошей точностью считать абсолютно твердым, так и жидкость в задаче о ее течении нередко с достаточной точностью представима как несжимаемая. Обычно такое представление оправдано, если перепады ско- скоростей в жидкости гораздо меньше скорости звука, и в этом смысле даже воздух при атмосферном давлении может рассматриваться как несжимае- несжимаемая жидкость, если скорость его течения меньше 300 м/с. Хотя, казалось бы, течение жидкости и движение тела конечных размеров весьма различаются, общий «камертон» в системе основных понятий все же существует. Если мы выделим объем жидкости столь малый, что можно пре- пренебречь его размерами и формой, и этот объем не перемешивается на харак- характерном масштабе задачи (или за характерное время задачи) с другим веще- веществом, то такой жидкий элемент можно рассматривать как материальную точку. Это позволяет определить скорость и ускорение элемента и вывести на этой основе уравнения течения (или, в частности, равновесия) жидкости. Траектория такого жидкого элемента называется линией тока (рис. 8.6 а). Совокупность линий тока, близлежащих в пределах, заданных характерным
126 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД С Рис. 8.6 временем и масштабом задачи, называется трубкой тока. Предполагается, что трубка тока охватывается некоторым односвязным контуром (С —>• С1 на рис. 8.6 б). Корректность понятий жидкого элемента и линии тока обусло- обусловлена лишь малостью элементарного объема. Понятие трубки тока подра- подразумевает, что на интересующем нас простран- пространственном масштабе линии тока достаточно мало расходятся и, в частности, не образуют вихрей. При таком рассмотрении локальные харак- характеристики — плотность вещества р и скорость v — принято относить не к движущемуся жидкому элементу, а к потоку в целом и рассматривать как функции точки p(r), v(r). Если протекание вещества не сопровождается никакими реакциями, то масса вещества в потоке сохраняется. Рассмотрим некоторую трубку тока (рис. 8.7 а). Пусть течение стацио- нарно. Выделим объем, ограниченный стенками трубки тока и двумя ее се- сечениями, нормальными к скорости жидкости. Сокражение массы в выде- выделенном объемме выражается равенст- равенством массы жидкости, втекающей в се- сечение 1 и вытекающей из сечения 2 за S плотность жидкости, 5 Рис. 8.7 время dt: piS\V\ dt = P2S2V2 dt. Здесь 5 ^ ^ площадь нормального сечения трубки тока и скорость жидкости в точках 1 и 2. Тем самым закон сохранения массы принимает вид уравнения нераз- неразрывности струи pS±v = const (8.13) или для несжимаемой жидкости (р = const) S±v = const. (8.14) Если поток нестационарен, уравнения (8.13, 8.14) должны быть модифи- модифицированы. Представим себе одномерную трубку тока (рис. 8.7 б). Закон со- сохранения массы вещества означает, что масса жидкости, втекающая в не- некоторый объем, pv(x) dtS, равна массе жидкости, накапливающейся в этом объеме, pdtS dx, плюс массе вытекающей жидкости pv(x + dx) dtS. Имея в виду, что все характерные параметры зависят, вообще говоря, от двух пере- переменных х и ?, введем понятие частной производной df(x, t)/dt = (df/dt)^const, df(x,t)/dx = (df/dx)t = consi. Закон сохранения массы принимает вид pv(x)S = pSdx + pv(x + dx) dtS =^ др/dt = —d(pv(x))/dx. Традиционная форма записи этого закона называется уравнением непрерыв- непрерывности: d(pv)/dx = O. (8.15)
8.4. АРХИМЕДОВА СИЛА. УРАВНЕНИЕ БЕРНУЛЛИ 127 В случае неодномерного течения обобщение уравнения (8.15) достигается посредством введения оператора дивергенции. По определению, для любой векторной функции j(r) = j(x, у, z) дивергенция j есть divj = djx/dx + djy/ду + djz/dz. В общем случае трехмерного течения уравнение (8.15) принимает вид др/dt + div (pv) =0. (8.16) Если же справедливо приближение несжимаемой жидкости, то изменением плотности как в пространстве, так и во времени можно пренебречь: divv = 0. (8.17) Уравнения (8.16), (8.17) выглядят, конечно, сложнее, чем, соответственно, (8.13), (8.14), но обладают и заметным преимуществом — они локальны, т. е. не привязаны ни к какой трубке тока, и их решение, в принципе, просто некоторая функция точки в пространстве г и времени t. 8.4. Архимедова сила. Уравнение Бернулли В отличие от твердого тела, жидкость — среда бесструктурная, ее ми- микроскопическое устройство не содержит такой «несущей конструкции», как кристаллическая решетка. Соответственно, вопрос об ориентации поверхно- поверхности, к которой приложено напряжение, здесь не возникает — все ориентации равноправны. Кроме того, в жидкости несравненно меньшую роль играют касательные напряжения. Если в твердом теле они ответственны за сдви- сдвиговые деформации и вполне проявляют себя в статике, то в жидкости ка- касательные напряжения возникают исключительно в динамической задаче и лишь при учете диссипативного эффекта — вязкости. Опыт показывает, что в гидростатике — науке о равновесии жидких тел — а равно и в консервативной (бездиссипативной) гидродинамике существен всего один вид напряжения — давление, обладающее свойством изотропно- изотропности. Это и составляет содержание закона Паскаля: давление жидкости и газа передается одинаково во всех направлениях. Иными словами, давление — скалярная функция: V= V(r). (8.18) Одно из важнейших следствий изотропии давления было известно задолго до Паскаля — это закон Архимеда: тело, погру- погруженное в жидкость, выталкивается с силой, рав- равной весу вытесненной жидкости. Рассмотрим тело А, плавающее в сосуде с жидкостью (рис. 8.8 а), и отдельно — сосуд, заполненный той же жидкостью до того же уровня, но без погруженного в него тела (рис. 8.8 б). Если жидкость, заполняющая полость а А' на рис. 8.8 б', пребывает в равновесии, то зна- Рис. 8.8 чит силы, действующие на полость А7, как раз и удерживают ее собственный вес. Ввиду скалярности давления (8.18) и от- отсутствия касательных напряжений, неважно, чем заполнена полость А7, так что и на тело А будут действовать так же распределенные силы, имеющие ту же равнодействующую.
128 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД V(x) Хотя приведенные выше рассуждения и дают нам аргументы в пользу закона Архимеда, они не могут считаться доказательством. В дополнение к ним хотелось бы дать современную трактовку архимедовой силы, пригод- пригодную для решения динамических задач. Мы сдела- сделаем это, опираясь на закон Паскаля. Пусть давле- ниие в жидкости или газе зависит от координаты: V = V(x) (рис. 8.9). Выделим мысленно в жидкости некоторый параллелепипед со сторонами dx, dy, dz, ориентированными по координатным осям. Тогда в напралении оси х на него будет действовать сила V(x) • dy dz, а навстречу ей — V(x + dx) • dy dz, сум- суммарная же сила будет равна их разности, которая, в силу малости dx, может быть линеаризована: Fx = V(x) - dydz — V(x + dx) • dy dz ~ — (dT^/dx) • dxdydz. Рис. 8.9 Удобно ввести понятие объемной плотности силы: U = dFx/dV = -dP/dx. (8.19) Это и есть сила Архимеда. В случае зависимости давления от трех коор- координат, вместо обычной производной в (8.19), следует использовать операцию градиента — см. E.25). Представим себе, например, несжимаемую жидкость в поле тяжести. При р(х) = const объемная плотность силы тяжести есть просто рд. Пусть ось х направлена вглубь жидкости. Запишем условие равновесия любого малого элемента объема dV: pg-dV - (dP/dx) • dV = 0. Сокращая dV и интегрируя, получаем хрестоматийный результат: Г = Го + рдх, (8.20) где Vo — давление на поверхности жидкости. Из (8.20) можно получить ре- решение упомянутых выше статических задач. Рассмотрим в качестве примера два открытых сосуда, соединенных посредством сифона (рис. 8.10). Давление жидкости в точке А, с точностью до отношения ширины трубки к вы- высоте ее над уровнем жидкости в сосудах /г, равно Vo + рдхА =Vo- pgh, безоносительно к точке свободной поверхности, от которой мы отсчитываем хА. Тем самым подтвер- подтверждается, что в сосудах, соединенных так, как по- показано на рис. 8.10, жидкость в равновесии оказы- оказывается на одном уровне, а при нарушении этого условия должно возникнуть течение, перекачивающее жидкость в сосуд с более низким уровнем через трубку. На этом и основан принцип сифона. Рассмотрим эффекты, обусловленные работой давления. Прежде всего представим себе жидкость или газ, занимающие в состоянии равновесия не- некий цилиндр с площадью основания S (рис. 8.11 а). Давление в пределах данного цилиндрического объема будем считать постоянным и равным V. Пусть одно из оснований смещается на малое расстояние dx, но при этом Рис. 8.10
8.4. АРХИМЕДОВА СИЛА. УРАВНЕНИЕ БЕРНУЛЛИ 129 количество текучего вещества внутри цилиндра сохраняется, т. е. жидкость (газ) не течет через движущуюся границу. Сила давления вещества, запол- заполняющего цилиндр, на границу равна V • 5, соответственно, работа, соверша- совершаемая веществом при расширении, есть SA = V - S - dx = V dV, (8.21) где dV — изменение объема жидкости или газа. Если в процессе расширения как-то изменится и давление, V —>• V + d'P, то это даст поправку в (8.21) всего лишь второго порядка. Пусть теперь слегка меняет объем жидкое или газообразное тело произвольной формы — на рис. 8.11 б начальное и конечное состояние показаны соответственно сплошной и пунктирной линиями. В силу закона Паскаля, давление на любой участок границы действует в направле- направлении нормали. Поэтому на любой малой площадочке, принад- принадлежащей границе, мы можем построить цилиндрик с образу- образующей, параллельной направлению нормали ? (рис. 8.11 б). Дальнейшие рассуждения аналогичны выводу (8.21), а затем можно вклад всех цилиндриков просуммировать (с учетом знака!) и получить тот же ответ: "^^ Рис. 8.11 где под dV подразумевается полное изменение объема жидкого элемента. Рассмотрим стационарное течение жидкости или газа без диссипации. Вы- Выделим некоторую трубку тока (рис. 8.12). Пусть Si и S2 — два произвольных сечения, нормальных к потоку, pi, vi и р2, V2 — соответственно, плотность и скорость в сечениях Si и S2. За время dt через сечение Si протек объем SiVi dt, при этом втекающий газ совершил работу ViSiVi dt. За то же вре- время из сечения S2 вытек объем S2V2 dt, совершив при этом работу V2S2V2 dt над всем вытекающим газом. При стационарном течении массы P2S2V2 dt и piSiVi&b, очевидно, равны. Введем плотность энергии текучей среды: dE/dV = ps + pv2/2, где е включает отнесенную к единице массы внутреннюю энергию плюс энергию во внешних полях, т. е. всю энергию, кроме кинетической, плот- плотность которой равна pv2/2. Поскольку мы положили диссипативные эффек- эффекты несущественными, используем закон сохранения энергии: S^dt ( Р2?2+Р2-г- I —S\V\ dt ' 1 rr^-~ ¦ ( 1 х V1 ViLL_ Pi Рис. —¦— 8. 12 P'2 v2 y J = ViS1v1 dt - V2S2v2 dt. (8.22) Разделим это уравнение почленно на величину dm протекающей через се- сечение за время dt массы. Удобно первый член левой части и второй член правой части (8.22) разделить на dm = P2S2V2 dt, а второй член левой части и первый член правой части (8.22) разделить на dm = piSiVi dt. В резуль- результате получаем уравнение Бернулли + ?1 + v\/2 = V2/P2 + ?2 + г>!/2, или, что то же, = const. (8.23)
130 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД Важный частный случай уравнения Бернулли — течение в поле силы тя- тяжести при неизменной массовой плотности внутренней энергии (для иде- идеального газа это обусловлено постоянством температуры). Тогда dE/dV = = pgh + pv2/2, где h — высота по отношению к некоторому заранее опреде- определенному нулевому уровню. Как следствие, получаем V/p + gh + v2/2 = const. (8.24) Если к тому же, жидкость несжимаема, то (8.24) можно использовать в виде V + pgh + pv2/2 = const. (8.25) Именно эту форму записи чаще всего связывают с именем Бернулли; под- подчеркнем, однако, что уравнение (8.23) гораздо более универсально. Уравнение (8.25) позволяет легко получить формулу Торричелли для ско- скорости вытекания несжимаемой жидкости из сосуда через малое отверстие (она, правда, была выведена за сто лет до уравнения Бер- Бернулли). Постановка задачи ясна из рис. 8.13. Пусть высота уровня воды в сосуде равна /ii, а высота, на которой рас- положено отвестие — /i2, так что h\ — /12 — h. Отверстие должно быть достаточно малым, чтобы выполнялось усло- вие h <С v. Из уравнения непрерывности (8.14) легко усмо- б б ур рр () у Рис 8 13 треть, что для этого необходимо, чтобы сечение отверстия было много меньше сечения сосуда. Таким образом обес- обеспечивается с необходимой точностью, во-первых, стационарность течения и тем самым применимость уравнения Бернулли. Во-вторых, при медленном вытекании мы можем избежать вихревых течений, что позволяет рассматри- рассматривать наше течение как одну-единственную трубку тока (обозначена пункти- пунктиром на рис. 8.13). Это очень важный аспект данной задачи; напомним, что уравнения (8.23)-(8.25) задают инвариант только в пределах трубки тока, который не всегда можно распространить на поток как целое. Итак, p{h\) = ^(/12), на уровне h\ v ~ 0, а на уровне /i2, как следует из (8.24), v = y/2gh, (8.26) т. е. скорость вытекания несжимаемой жидкости из малого отверстия совпа- совпадает со скоростью тела, свободно упавшего с высоты h. Это и есть формула Торричелли. Отметим в заключение, что величина pv2/2 иногда называется динамиче- динамическим давлением, а формула (8.25) трактуется как инвариантность суммы статического и динамического давлений. В стационарном потоке несжимае- несжимаемой жидкости давление V должно быть меньше там, где больше скорость. Так объясняют принцип работы пульверизатора, эффект «присасывания» кораблей при близком прохождении параллельными курсами и т. д. 8.5. Вязкость. Течение Пуазейля До сих пор мы ничего не говорили о касательных напряжениях в жидко- жидкости или газе, ограничиваясь только изотропным давлением в рамках закона Паскаля. Оказывается, однако, что закон Паскаля является исчерпываю- исчерпывающим лишь в гидростатике, а в случае неоднородных в пространстве течений
8.5. ВЯЗКОСТЬ. ТЕЧЕНИЕ ПУАЗЕЙЛЯ 131 вступает в игру диссипативный эффект — вязкость, вследствие которого как раз и возникают касательные напряжения. Пусть в некоторой области потока жидкости два бесконечно близких ее слоя, движущихся в направлении оси ж, соприкасаются друг с другом на го- горизонтальной поверхности с площадью S (рис. 8.14). Опыт показывает, что возникающая на этой площадке сила трения F между слоями тем больше, чем больше площадь S и чем быстрее изменяется в этом месте скорость по- потока v в направлении, перпендикулярном к площадке 5, то есть, в направле- направлении оси у. Быстрота изменения скорости v как функции у характеризуется производной dv/dy. Окончательно, полученный из опыта результат можно записать в виде: F = rjS dv/dy. (8.27) Здесь F — сила, действующая со стороны вышеле- вышележащего слоя на нижележащий, г\ — коэффициент пропорциональности, получивший название коэф- Рис. 8.14 фициентпа вязкости жидкости (сокращенно его называют просто вязкостью жидкости). Размерность его вытекает из формулы (8.27) [г/] = [га]/[/?]; едини- единицу измерения принято выражать как 1 Па • с. Направление силы F (вправо или влево на рис. 8.14) зависит от того, быстрее или медленнее движется вы- вышележащий слой относительно нижележащего. Из (8.27) следует выражение для касательных напряжений: г = г/ dv/dy. (8.28) Коэффициент вязкости т\ имеет разные значения для различных жидко- жидкостей, и для определенной жидкости зависит от внешних условий, в первую очередь, от температуры. По своей природе силы трения в жидкости являют- являются силами межмолекулярного взаимодействия, то есть электромагнитными силами, как и силы трения между твер- твердыми телами. Перейдем к рассмотрению задачи о вы- вычислении расхода несжимаемой жидко- жидкости, текущей в горизонтальной круглой прямолинейной трубе с постоянной пло- площадью поперечного сечения при задан- заданном перепаде давлений. Расходом назы- называется масса жидкости, протекающая в единицу времени через сечение трубы. Эта задача имеет чрезвычайно большое R v(r) R Рис. 8.15 практическое значение: организация работы нефтепроводов и даже обыч- обычного водопровода безусловно требует ее решения. Будем полагать, что нам заданы длина трубы /, ее радиус i?, давления на концах трубы V\ и Т>2 (Vi > V2), а также плотность жидкости р и ее вязкость т\ (рис. 8.15). Наличие сил трения приводит к тому, что на разных расстояниях от цен- центра трубы жидкость течет с разной скоростью. В частности, непосредствен- непосредственно у стенки жидкость должна быть неподвижна, иначе из (8.28) следовали бы бесконечные касательные напряжения. Для вычисления массы жидко- жидкости, протекающей ежесекундно через все поперечное сечение трубы мы ра- зобъем это поперечное сечение на бесконечно малые кольцевые площадки с
132 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД внутренним радиусом г и внешним г + dr и вычислим сначала расход жид- жидкости через каждое из этих бесконечно малых сечений, в которых скорость жидкости можно считать одинаковой. Просуммировав потом по всем беско- бесконечно малым сечениям, мы определим полный расход жидкости. Масса жидкости dm, протекающая ежесекундно через бесконечно малое поперечное сечение 2nrdr со скоростью v(r), равна dm/dt = 2тгг drpv(r). (8.29) Полный расход жидкости Q мы получим, проинтегрировав выражение (8.29) по г от 0 до R: R Q = dm/dt = 2тгр / rv(r) dr, (8.30) о где мы вынесли за знак интегрирования постоянную величину 2тгр. Чтобы вычислить интеграл в (8.30), необходимо знать зависимость скорости жид- жидкости от радиуса, то есть конкретный вид функции v(r). Для определения v(r) мы воспользуемся уже известными нам законами механики. Рассмотрим в некоторый момент времени цилиндрический объем жидкости некоторого произвольного радиуса г и длины / (рис. 8.15). Заполняющую этот объем жидкость можно рассматривать как совокупность бесконечно малых жидких частиц, образующих систему взаимодействующих материальных точек. При стационарном течении жидкости в трубе все эти материальные точки дви- движутся с независящими от времени скоростями. Следовательно, центр масс всей этой системы также движется с постоянной скоростью. Уравнение для движения центра масс системы материальных точек имеет вид (см. гл. 6) BH, (8.31) где М — полная масса системы, V4M — скорость центра масс, Х^ сумма внешних сил, приложенных в выбранный момент времени к рассма- рассматриваемой системе. Так как в нашем случае V4M = const, то из (8.31) полу- получаем Внешние силы — это силы давления ^давл? действующие на основания вы- выбранного цилиндрического объема, и силы трения -Ртр, действующие на боко- боковую поверхность цилиндра со стороны окружающей жидкости — см. (8.27): ^давл = 7ГГ2(Г! ~ Р2), ^тр = 2тгг/г/ (dv/dr). Как мы показали, сумма этих сил равна нулю, то есть 2nrlr](dv/dr) + nr2(Vi - V2) = 0. Это соотношение после простых преобразований можно записать в виде d?; = -[(Vi - V2)l2r]l\rdr. Интегрируя обе части написанного выше равенства, получим v = -[(Vi - V2)l^r]l\r2 + const.
8.6. ТУРБУЛЕНТНОСТЬ 133 Постоянная интегрирования определится из условия, что при г = R ско- скорость v должна обращаться в нуль. Это дает v = [{Vi - Т2)/Щ(В2 - г2). (8.32) Как мы видим, скорость жидкости максимальна на оси трубы и при удале- удалении от оси меняется по параболическому закону (см. рис. 8.15). Подставив (8.32) в (8.30), находим искомый расход жидкости R или Q = Пр l~ 2 i?4. (8.33) Это выражение для расхода жидкости называется формулой Пуазейля. От- Отличительной чертой соотношения (8.33) является сильная зависимость рас- расхода от радиуса трубы: расход пропорционален четвертой степени радиуса. (Сам Пуазейль формулу для расхода не выводил, а исследовал проблему только экспериментально, изучая движение жидкости в капиллярах). На формуле Пуазейля основан один из экспериментальных методов определе- определения коэффициентов вязкости жидкостей. 8.6. Турбулентность Формула Пуазейля применима только для ламинарных течений жидко- жидкости. Ламинарным называется такое течение, когда жидкие частицы дви- движутся вдоль устойчивых траекторий. При достаточно больших скоростях ламинарное течение становится неустойчивым, хаотичным и переходит в так называемое турбулентное течение. При этом основные уравнения ги- гидродинамики остаются в силе, но большинство результатов настоящей гла- главы должно быть подвергнуто ревизии. Характер турбулентных движений может быть весьма различным в за- зависимости от внешних условий. Из повседневного опыта нам более всего знакомо явление гидродинамической турбулентности несжимаемой жид- жидкости — представление о таком режиме дает турбулентная струя, вытека- вытекающая из крана. Реализуется данное состояние жидкости в случае перепада скоростей течения, много меньшего скорости звука. Для него характерно образование множественных вихрей (М. В. Ломоносов подразделял течения жидкости на «покойные» и «коловратные»). На рис. 8.16 а схематически изо- изображено образование вихрей при обтекании несжимаемой жидкостью шара, а на рис. 8.16 б— при течении в прямой трубе. Следует особо обратить внимание на то, что во всех оценках, относящихся к турбулентному состоянию, фигурирует не скорость течения как таковая, но именно перепад скоростей |Av|. Действительно, если некоторое течение происходит с постоянной всюду скоростью v, мы можем, переходя в движу- движущуюся систему отсчета, сделать эту скорость как угодно малой или боль- большой, так что подлинная «индивидуальность» течения может быть отражена лишь величиной |Av|.
134 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД Хотя детальное рассмотрение физики турбулентных состояний далеко вы- выходит за рамки нашего курса, мы все же можем кое-что сказать о переходе от ламинарного («покойного») к турбулентному («коловратному») течению. Принципиальным моментом здесь будет использование методов подобия и размерности. Дело в том, что размерность физических величин — не только один из важных методов контроля правильности ответов, но и метод полу- получения новых результатов в физике вообще и, в частности, в механике, хотя возможности его ограничены и предсказательная сила не абсолютна (чему последующее рассмотрение будет хорошим примером). Рис. 8.16 Попробуем проанализировать физические предпосылки перехода к турбу- турбулентному течению, представленному на рис. 8.16. Пока и поскольку течение остается ламинарным, у него сохраняется характерный пространственный масштаб а (радиус шара на рис. 8.16 а) либо диаметр трубы на рис. 8.16 б. Турбулизация течения приводит к измельчению масштаба, а значит, и к росту пространственных производных от скорости, чему, как можно усмо- усмотреть из формул (8.27), (8.28), противодействуют эффекты, обусловленные вязкостью. Таким образом, чем больше вязкость жидкости, тем более за- затруднен переход в турбулентное состояние. Еще более очевидным предста- представляется следующее утверждение: чем больше перепад скоростей, тем легче переход из ламинарного реэюима в турбулентный — скажем, в предельном случае пространственно-однородного течения турбулентности просто не мо- может быть, поскольку оно эквивалентно состоянию покоя. Как уже указывалось выше, размерность коэффициента вызкости соста- составляет Составим безразмерную комбинацию Re = m/ltr]. Подставляя в это выражение значения характерных параметров т = ра , / = a, t = а/г>, получим величину Re = pvl/r], (8.34)
ВОПРОСЫ И ЗАДАЧИ 135 которую принято называть числом Рейнольдса. Число Рейнольдса можно переписать в виде Re = (pv2l3)/(Vvl2), откуда следует, что оно характеризует отношение кинетической энергии дви- движущейся жидкости Т ~ /эг>2/3/2 к потере этой энергии, равной работе сил вязкости на характерной длине I, A ~ r]vl2. Помимо г/, жидкость характе- характеризуется еще и плотностью /э, а течение как таковое — пространственным масштабом а и характерным перепадом скоростей v. (Применительно к си- ситуации рис. 8.16 это просто скорость по порядку величины, так как вблизи неподвижных стенок скорость должна обращаться в нуль). Изложенные вы- выше рассуждения позволяют заключить, что чем больше величина Re, тем благоприятнее ситуация для турбулентного течения, и напротив, для те- течений с малыми числами Рейнольдса должен, по-видимому, реализоваться ламинарный режим. Данные эксперимента находятся с этими соображениями в полном согла- согласии. Оказывается, действительно существует критическое число Рейнольд- Рейнольдса^ при превышении которого происходит переход из ламинарного режима в турбулентный. Но сама величина ReKp, как показывает опыт, не универ- универсальна — она зависит от геометрии системы. Например, в случае течения по трубе (рис. 8.16 б) ReKp ~ 2 • 103, тогда как при вращении цилиндра в газе переход в турбулентный режим происходит при ReKp ~ 50. В этом и состоит некоторая слабость чисто размерностной оценки. Но у нее есть и очень сильная сторона. Сами по себе величины р, г>, а, г\ могут меняться в очень широком диапазоне; скажем труба может быть капилляром, а может быть аэродинамической трубой диаметром в десятки метров — ответ, тем не менее, будет универсальным и опираться он будет всего лишь на одну безразмерную комбинацию — число Рейнольдса. Такие зависимости называются в физике законами подобия, а переход на их осно- основании от одних экспериментальных ситуаций к другим принято именовать скэйлингом. Таким образом, если для некоторого физического явления изве- известен закон подобия, мы можем ставить эксперименты в малом масштабе, так чтобы они были более дешевыми или, например, более безопасными, а затем проводить скэйлинг для получения ответа в интересующем нас масштабе. Поэтому методы подобия и размерности занимают достаточно почетное ме- место в арсенале современной физики. Вопросы и задачи 1. Каким числом констант описываются упругие свойства изотропного вещества? 2. Можно ли ввести модуль сдвига для стекла? 3. Из каких свойств жидкостей и газов следует закон Паскаля? 4. Что такое коэффициент вязкости? 5. Допустимо ли использовать уравнение Бернулли для вязкой жидкости? 6. Оценить давление в центре Земли, полагая плотность вещества постоянной и равной р ~ 5,5 • 103 г/см3. Радиус Земли Я ~ 6 400 км. Решение. Поскольку объемная плотность силы тяжести, в отличие от простых «на- «настольных» задач, зависит от расстояния до центра Земли, уравнение равновесия, с уче- учетом (8.19), следует в данном случае использовать в виде: -(dV/dr) - pg(r) = 0, где g(r) = jM(r)/r\ M(r) = D/3)ттг3р.
136 ГЛ. 8. ЭЛЕМЕНТЫ МЕХАНИКИ СПЛОШНЫХ СРЕД Мы учли то обстоятельство, что в случае сферической симметрии все величины зависят только от г; что сила тяжести направлена к центру Земли, т. е. против г — отсюда и знак «—»; наконец, что внешние слои Земли с радиусами, большими г, вклада в силу притяжения не дают (см. гл. 6). Окончательно, — = ——>ур г =* V = const - у7Р г ~ у7Р (# - г ), если учесть, что на поверхности Земли, т. е. при r=R, V—0. Подставляя р=5,5 • 103 кг/м3, Я = 6,4 • 106 м, получаем Ртах = 7^=0 — 2,6 • 1011 Па ~ 2,6 • 106 атм. Большая точность в оценках бессмысленна, хотя бы по той причине, что плотность вещества не может быть инвариантной при таком перепаде давлений. 7. Определите отношение энергий деформации стального и пластмассового цилиндров одинаковых размеров для двух случаев: 1) цилиндры поставлены рядом друг с другом и сжаты параллельными плоскостями; 2) цилиндры поставлены друг на друга и также сжаты плоскостями. Модуль Юнга для стали равен Е\ = 2-105 Н/мм2, для пластмассы — Е2 = Ю2 Н/мм2. Ответ: 1) Ui/U2 = Е^Еъ = 2 • 103; 2) Ui/U2 = Е^Ех = 5 • 1(Г4. 8. В вертикально стоящий цилиндрический сосуд налита идеальная жидкость до уров- уровня Н (относительно дна сосуда). Площадь дна сосуда равна 5. Определить время Т, за которое вся жидкость выльется из сосуда, если в дне сосуда сделано малое отверстие площади а. Считать режим течения несжимаемым. Решение. Движение не стационарно — скорость истечения меняется и движется верхняя граница жидкости. Уравнением Бернулли, полученным для стационарного течения, мож- можно пользоваться, если эти изменения происходят медленно, как в случае а <С S. Обозна- Обозначим высоту поверхности жидкости относительно дна сосуда в момент t через /г, скорость жидкости на этой поверхности (скорость движения частиц, находящихся на границе) — через vi = —dh/dt, скорость жидкости в отверстии — через v2. Учитывая, что давление на верхней поверхности жидкости и на поверхности вытекающей струи примерно одинако- одинаково (равно атмосферному) и что в силу несжимаемости жидкости v\S =¦ V2O", получаем из уравнения Бернулли, рассматривая всю жидкость как единую трубку тока, v2 — V\ = 2gh. Учитывая, что а ^С S, находим -dh/Vh = (ay/2g/s) dt. После интегрирования отсюда получаем t = E/(т) лД/д (у/Н - Полагая здесь h = 0, определяем T=(S/a)y/2H/g. 9. Из неплотно закрытого крана вытекает в единицу времени количество воды q=l см3/с. Вода попадает в сосуд и затем вытекает из него по горизонтальной трубке длины / = 20 см. Оказалось, что со временем в сосуде установился уровень воды на h = 5 см выше уровня трубки. Определите диаметр трубки. Вязкость воды г\ = 10~ Па • с. Ответ: d = 2 • [(8/ir)(r]l/pgh)q]1/4 ~ 2 мм.
ГЛАВА 9 ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА 9.1. Принцип относительности Галилея Как меняются законы движения при переходе из одной системы отсчета в другую? Другими словами, меняется ли при этом (и как) основной закон механики — второй закон Ньютона — ma = F. Этот вопрос имеет очень важное значение, так как наблюдать за движе- движением тел и использовать законы механики на практике приходится не в одной какой-то, раз и навсегда выбранной системе отсчета, а в различных системах, по-разному движущихся друг относительно друга. Особое значе- значение придает данной проблеме то обстоятельство, что инерциальная система отсчета, в которой мы до настоящего времени формулировали законы меха- механики, есть физическая идеализация, тогда как в природе мы всегда имеем- дело с неинерциальными системами. Рассмотрим случай, когда обе системы отсчета — исходная и движущаяся относительно нее — являются инерциальными системами. Допустим, что си- система отсчета К инерциальна, а система К' движется относительно первой поступательно с постоянной скоростью V (рис. 9.1). Для простоты можно принять, что координатные оси xf,yf,zf соответ- соответственно параллельны осям ж, у, z и что в началь- началь7 У У х, х р , у, ный момент времени t = 0 начало О7 совмещается с началом 0. Будем также считать, что скорость V параллельна оси х. При этих условиях ось х1 все время будет совпадать с осью х. Такие упро- упрощения в постановке задачи не лишают ее общ- ности, так как переход к общим формулам мо- жет быть совершен дополнительным поворотом р g -< координатных осей и переносом начала коорди- координат. Радиус-вектор некоторой материальной точки т в исходной системе отсчета в момент времени t обозначим г, а радиус-вектор той же матери- материальной точки в тот же момент времени в движущейся системе обозначим г7. Тогда координаты и время в системах К и К' будут связаны друг с другом соотношениями r = r/ + Vt/, ? = ?', (9.1) или в проекциях на оси х = х + Vt', У = у', z = z, t = t'. Мы уже обсуждали эти соотношения в гл. 2. Напомним, что они называют- называются преобразованиями Галилея. Мы добавили к формулам преобразования
138 ГЛ. 9. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА координат дополнительную формулу t = ?7, выражающую предположение Ньютона о том, что время является абсолютным, то есть текущим одинако- одинаково в любых системах отсчета. С точки зрения нашего повседневного житейского опыта, преобразования Галилея кажутся очевидными. В самом деле, они фактически основаны на двух предположениях. Во-первых, предполагается, что в разных системах отсчета остаются неизменными длины одних и тех же твердых стержней, которые используются для измерения пространственных размеров и коор- координат различных тел. Кроме того, преобразования Галилея предполагают также, что, например, показания часов у двух человек не станут различать- различаться только из-за того, что один из них начнет идти быстрее другого, и это тоже, казалось бы, не вызывает сомнения. Но всегда ли здравый смысл до- достаточен для доказательства истины? Об этом пойдет речь в следующей гла- главе, а сейчас поговорим о том, что означают преобразования Галилея с точки зрения формулировки законов механики в разных инерциальных системах. Различаются ли законы движения для наблюдателей в разных системах? Дифференцируя соотношение (9.1) по времени ?, получим dr/dt = (dr'/dt') + V, или v = v' + V, (9.2) где v — скорость материальной точки в системе К, a v' — в системе К'. Эта формула выражает известное уже нам правило сложения скоростей в механике Ньютона. Дифференцируя второй раз , получим (с учетом постоянства V) dv/dt = dv'/dt = dv'/dt', или а = а7. (9.3) Таким образом, ускорение инвариантно относительно преобразований Га- Галилея. С правилом сложения скоростей и с равенством (9.3) мы познакомились впервые в гл. 2. Поставим теперь вопрос: а как меняется сила при переходе из одной инерциальной системы в другую? Сила зависит от разности коорди- координат взаимодействующих материальных точек (для электромагнитных сил — еще и от разности их скоростей). Поэтому, в соответствии с (9.1) и (9.2), сила не меняется при переходе от одной системы отсчета к другой: F = F7. Такие соображения, сколь бы они не казались естественными, ни в коей мере не являются доказательством — они, например, должны быть пересмотрены в рамках релятивистской механики. Иначе говоря, сила инвариантна лишь относительно преобразований Галилея. Это утверждение должно рассма- рассматриваться как опытный факт. Так как и ускорение инвариантно, а масса материальной точки предполагается величиной постоянной, не зависящей от ее положения и скорости, то второй закон Ньютона в «штрихованной» системе принимает вид ma7 = F'. Это уравнение в «штрихованной» системе отсчета К' имеет точно такой же вид, что и в «нештрихованной» системе К. Таким образом, уравнения ме-
9.2. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА 139 ханики Ньютона инвариантны относительно преобразований Галилея. Это утверждение составляет содержание принципа относительности Галилея. Принцип относительности Галилея провозглашает полное равноправие всех инерциальных систем отсчета и его можно сформулировать также в виде следующего утверждения: никакими механическими опытами, прове- проведенными в пределах только данной системы отсчета, нельзя установить, находится ли она в состоянии покоя или в состоянии равномерного прямо- прямолинейного движения. Находясь, например, в вагоне поезда, движущегося без толчков прямолинейно и равномерно, мы, не выглянув в окно, не сможем определить, движется вагон или покоится. Свободное падение тел, движе- движение брошенных нами предметов и все другие механические процессы будут в этом случае происходить так же, как и в случае, если бы вагон был непо- неподвижен. 9.2. Законы механики в неинерциальных системах отсчета. Силы инерции Рассмотрим теперь вопрос о том, как формулируются законы механики в неинерциальных системах отсчета. Вопрос этот имеет важное практиче- практическое значение: система отсчета, связанная с поверхностью Земли, не явля- является инерциальной — например, в системе отсчета, связанной с Солнцем, точки на поверхности Земли испытывают центростремительное ускорение, обусловленное вращением Земли вокруг собственной оси и вокруг Солнца. При определенных условиях этой неинерциальностью можно пренебречь, но при решении многих практических задач (например, запуск космического корабля) без учета этой неинерциальности не обойтись. К тому же, многие машины и механизмы реально работают в неинерциальных системах отсче- отсчета — в движущихся с ускорением вагонах, самолетах, космических кораблях и так далее. Итак, посмотрим, как преобразуется основной закон механики — второй закон Ньютона — при переходе от инерциальной системы отсчета к не- инерциальной. Остановимся отдельно на двух случаях: рассмотрим сначала простейший случай поступательного движения неинерциальной системы, а затем обсудим, как видоизменяются законы механики во вращаю- вращающейся системе отсчета. Поступательное движение неинерциальной системы отсчета. В повседневной жизни каж- каждому из нас чуть ли не ежедневно приходится испытывать неприятные ощущения, когда при резком торможении автобуса или вагона метро какая-то сила бросает нас вперед. Чтобы понять происхождение этой силы, рассмотрим две системы отсчета: инерциальную систему К и систему К1', которая совершает поступательное движение отно- относительно системы К с ускорением А, зависящем в общем случае от времени (рис. 9.2). Пусть гиг7 — радиусы-векторы материальной точки с массой т в инерциальной и неинерциальной системах, соответственно, a R() радиус-вектор начала отсчета системы К' относительно системы К. К X, X О' Рис. 9.2
140 ГЛ. 9. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА Уравнение движения материальной точки в инерциальной системе отсчета К — второй закон Ньютона: ma = F, где F — результирующая сила, действующая на рассматриваемую матери- материальную точку со стороны других тел, а = d2r/dt2 — ускорение материаль- материальной точки в инерциальной системе. Координаты и скорости материальной точки в системах К и К' связаны друг с другом соотношениями (9.1), (9.2). Если тело неподвижно относительно К1', то движение этой системы приво- приводит к переносу тела относительно К. Скорость V называется переносной скоростью. Скорость относительно системы К1', т. е. v7 так и называется — относительная скорость. Наконец, скорость v в инерциальной системе К носит название абсолютной скорости. Надо понимать условность послед- последнего названия: это, конечно, просто скорость относительно системы К. Но К — система инерциальная, в некоторой степени «привилегированная», и только в этом условном смысле скорость может быть названа абсолютной. Продифференцировав еще раз по времени обе части равенства (9.2), полу- получаем соотношение между ускорениями а = А + а7. (9.4) Здесь, соответственно, а — абсолютное ускорение, А — переносное и а7 — относительное. Подставив полученное выражение для а во второй закон Ньютона, перепишем его в виде msi = F - mA. (9.5) Как мы видим, уравнение движения в неинерциальной системе отсче- отсчета (9.5) отличается от второго закона Ньютона в инерциальной системе C.2) тем, что в правой части уравнения наряду с силой F появляется еще доба- добавочное слагаемое —mA. Если ввести обозначение -mA = FHH, (9.6) то уравнение движения в неинерциальной системе примет такой же привыч- привычный вид, как и второй закон Ньютона, ma' = F + FHH, (9.7) где определенное равенством (9.6) добавочное слагаемое FHH называют силой инерции, конкретно — поступательной силой инерции. Далее мы познако- познакомимся и с другими силами инерции. В данном случае сила инерции является пространственно-однородной, т. е. сила инерции при поступательном движении неинерциальной систе- системы отсчета имеет одно и тоже значение для всех точек этой системы. Это следует из (9.6): сила инерции зависит только от ускорения, с которым на- начало неинерциальной системы К' движется относительно инерциальной си- системы К. Итак, движение относительно рассматриваемой неинерциальной системы можно исследовать двумя способами. Можно определить закон движения материальной точки г(?) в некоторой инерциальной системе, используя второй закон Ньютона в его стандартном виде, а затем пересчитать его относительно неинерциальной системы, т. е. получить y' (t) из закона пре- преобразования координат (9.1) (при условии, конечно, что закон движения
9.2. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА 141 неинерциальной системы R(t) известен). Но можно сразу решать задачу в неинерциальной системе отсчета с помощью видоизмененного второго зако- закона Ньютона (9.7), в котором в правой части к реальной силе F, определяемой взаимодействием рассматриваемого тела с другими телами, добавлена сила инерции FHH, определяемая соотношением (9.6). Появление этой добавочной силы при рассмотрении движения относительно неинерциальной системы отсчета — формальное следствие преобразования координат (8.7) и не от- отражает появления какого-либо нового воздействия на материальную точку со стороны других тел. В этом смысле силу инерции можно назвать фик- фиктивной силой, хотя для наблюдателя в неинерциальной системе она будет приводить к таким же последствиям, как и реальная сила той же величины. Мы уже упоминали об ощущениях наблюдателя в неинерциальной си- системе (в автобусе, например), связанных с ее торможением или ускоре- ускорением. Поясним еще действие рассмотренной силы инерции на следующем примере. Рассмотрим тележку с укрепленным на ней кронштейном, к которому подвешен на ни- нити шарик (рис. 9.3). Пока тележка покоится или движется без ускорения, нить расположена вер- вертикально и сила тяжести Р уравновешивается натяжением нити FH. Приведем теперь тележку в (у поступательное движение с ускорением А. Нить С°) отклонится от вертикали на такой угол, чтобы результирующая сил Р и FH сообщала шарику ускорение, равное А, т. е. в инерциальной системе отсчета угол отклонения нити определяется условием, которое, как и должно быть, является след- следствием второго закона Ньютона. В неинерциальной системе отсчета, связан- связанной с тележкой, шарик покоится, несмотря на то, что результирующая сил РиГн отлична от нуля. Отсутствие ускорения шарика по отношению к этой системе отсчета можно формально объяснить тем, что кроме сил Р и FH, равных в сумме тА, на шарик дей- действует еще и сила инерции FHH = —тА. \ у Силы инерции во вращающейся системе отсчета. Рас- Рассмотрим теперь случай вращающейся неинерциальной \ со г' ( F5^T А /f ж Рис. 9.3 Рис. 9.4 системы и для определенности рассмотрим ситуацию, когда неинерциальная система К' вращается с угловой скоростью о; вокруг оси у7, совпадающей с осью у инер- инерциальной системы К. Будем полагать также, что начала отсчета этих систем совпадают (рис. 9.4). Наша цель — записать уравнение движения материальной точки в неинерциальной системе К' в виде второго закона Ньютона (9.7). В инерциальной системе К уравнение движения имеет обычный вид ma = F, где а — ускорение рассматриваемой материальной точки в системе К. Вы- Вычитая его из уравнения (9.7) (из левой части одного — левую часть другого, из правой части — правую), получим FHH = -m(a-a/). (9.8) Это выражение для силы инерции является обобщением выражения (9.6) для FHH в случае прямолинейного движения неинерциальной системы
142 ГЛ. 9. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА отсчета. Для поступательного движения неинерциальной системы а—а7 = А. Итак, в общем случае сила инерции равна произведению массы тела на взятую с обратным знаком разность его ускорений по отношению к инер- циальной и неинерциальной системам отсчета. При поступательном движе- движении неинерциальной системы К' относительно инерциальной системы К эта разность равна переносному ускорению А, т. е. ускорению начала отсчета системы К1. Рассмотрим в качестве примера относительно простой случай. Пусть материальная точка во вращающейся системе К' движется в плос- плоскости х'z' по окружности радиуса R с постоянным модулем скорости v' (рис. 9.5). В неинерциальной системе К' ускорение ма- материальной точки а7 — это центростремительное уско- ускорение, направленное к центру вращения и равное по модулю а1 = v1 JR. В инерциальной системе К материальная точка дви- движется по той же самой окружности, но модуль ее ско- скорости в этой системе определяется суммой vf + г>, где _ v = loR — скорость движения по окружности в инерци- р g r альной системе той точки вращающейся системы К1', в которой находится рассматриваемая материальная точка (мы рассматриваем случай, когда v и v7 направлены в одну сторону). Следовательно, в инерциальной системе К ускорение материальной точки а — это также центростремительное ускорение, направленное к центру вра- вращения и по модулю равное a = (v' + loRJ/R = v'2/R + 2v'u + uj2R. (9.9) Воспользуемся теперь определением (9.8) и найдем следующее выражение для модуля силы инерции в рассматриваемом случае: FHH = т(а - а1) = muo2R + 2mv'uo. (9.10) В соответствии с (9.8) направление найденной силы инерции противопо- противоположно направлению разности векторов а — а7, направленных в сторону оси вращения. Поскольку, согласно (9.9), модуль а больше модуля а7, то раз- разность центростремительных ускорений а — а7 направлена к оси вращения, а следовательно, FHH направлена от оси вращения. Окончательно, силу инер- инерции (9.10) можно представить как сумму двух сил, имеющих специальные названия: FHH = F46 + FK. (9.11) Здесь F46 — центробежная сила инерции ?ц6 = тш2К. (9.12) В данном случае R — радиус-вектор, проведенный к материальной точке из начала координат, потому что точка движется в плоскости х'О'zf. В общем случае это вектор, проведенный от оси вращения к точке в плоскости траек- траектории и его модуль R дает расстояние материальной точки от оси вращения. Центробежная сила инерции (9.12) действует на тело во вращающейся системе отсчета независимо от того, покоится тело в этой системе или дви- движется относительно нее. Величина и направление этой силы определяются движением системы отсчета, т. е. переносным ускорением. В этом отношении
9.2. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА 143 она подобна силе инерции при поступательном движении системы. Однако, центробежная сила зависит еще и от положения тела во вращающейся систе- системе; она не обладает пространственной однородностью. Центробежную силу инерции необходимо учитывать при точном решении задач о движении тел относительно земной поверхности — ее учет приводит, в частности, к неболь- небольшим поправкам к силе тяжести (эти поправки составляют доли процента). Сила FK в формуле (9.11) называется силой Кориолиса, или кориолисовой силой инерции. Для рассмотренного нами частного случая, когда направле- направление скорости движения материальной точки перпендикулярно оси враще- вращения, ее модуль равен 2mv'uo и она направлена вдоль R. В общем случае выражение для силы Кориолиса имеет вид FK = 2m[v'o;], (9.13) где uj — вектор угловой скорости. Отличительной особенностью силы Кори- Кориолиса (9.13) является то, что она действует только на движущиеся относи- относительно вращающейся системы отсчета тела. Она пропорциональна вектор- векторному произведению v' и а;, то есть перпендикулярна обоим этим векторам, и ее направление определяется по правилу винта. Влияние силы Кориолиса следует учитывать, в частности, при истолкова- истолковании некоторых явлений, связанных с движением тел относительно земной поверхности. Например, летящий снаряд испытывает отклонения, обусло- обусловленные кориолисовыми силами инерции. В северном полушарии при гори- горизонтальном полете, независимо от направления, снаряд будет отклоняться вправо, а в южном полушарии — влево. По этой же причине в нашем полу- полушарии у рек подмывается преимущественно правый берег, в южном полу- полушарии — левый. Итак, в инерциальной системе отсчета ускорение тела определяется «ре- «реальными» силами, действующими со стороны других тел (и полей). В не- инерциальной системе для определения относительного ускорения, т. е. от- относительно этой системы, надо добавить силы инерции. В общем случае система отсчета может двигаться относительно инерци- инерциальной (которую мы условно можем считать неподвижной, «абсолютной») поступательно и одновременно вращаться. Связь между радиусами-векто- радиусами-векторами частицы в двух системах по-прежнему определяется соотношением Скорость в абсолютной системе теперь слагается из трех составляющих. Изменение вектора г' определяет движение относительно системы К' — это относительная скорость. Свой вклад в абсолютную скорость дает движе- движение системы К' относительно системы К — это скорость начала координат системы К1. Но если даже тело неподвижно в системе К1 и начало коор- координат этой системы неподвижно в системе К, тело все же будет двигаться относительно К по окружности радиуса г7. Как мы знаем, скорость в этом случае равна величине [ctJr7]. Таким образом, переносная скорость слага- слагается из двух составляющих, связанных соответственно с поступательным движением системы К' и с ее вращением. В результате получаем v = r = R + r' = vnep + v0TH = V + v0TH + [ш г']. (9.14)
144 ГЛ. 9. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА Для нахождения связи ускорений нам надо продифференцировать по вре- времени выражение (9.14). Получаем а = v = V + v0TH + [ш г7] + [а; г7]. (9.15) В этом случае также надо учесть наличие двух причин изменения вектора в системе К. Это надо иметь в виду при вычислении второго и третьего членов в формуле (9.14). Не забудем, что г7 = vOTH + [u; r']. Нетрудно видеть, что мы должны получить такое выражение: а = А + аотн + [w v отн] + [w v0TH] + [w [w r7]] + [w г7]. Учитывая, что вклад в векторное произведение дает только перпендикуляр- перпендикулярная одному из векторов составляющая второго вектора, из правил преобра- преобразования двойного векторного произведения [a[be]] = b(ac)- c(ab) получаем [а; [а; г7]] = [с*> [с*> rj_]] =u;(u;rj_)— тг±(и:и:). Скалярное произведение двух взаимно перпендикулярных векторов равно нулю, и от последнего выражения остается одно слагаемое —г'±(и;и;) = — г'ш2. Окончательно имеем а = аотн + А - г'и? + 2[u; v0TH] + [ш г7]. В соответствии с определением (9.8) получаем выражение для суммарной силы инерции в общем случае FHH = -га(А - г'ш2 + 2[ш v0TH] + [d;r7]). (9.16) Напомним еще раз, что первый член в этой фор- формуле определяет поступательную силу инерции, второй — центробежную, четвертый — силу инерции, возникающую при неравномерном вра- вращении неинерциальной системы (этот член ред- редко представляет интерес). Все эти силы инерции связаны с переносным ускорением. Особняком стоит третий член — кориолисова сила инерции, связанная и с движением (вращением) неинер- неинерциальной системы, и с движением тела в этой системе. Одним из любопытных проявлений сил инер- инерции является состояние невесомости. Предста- Представим себе, что кто-то стоит на весах в кабине покоящегося лифта (рис. 9.6 а). Вес — это сила, с которой тело действует на опору, по модулю равная (в соответствии с третьим законом Ньютона) силе, с которой опора действует на тело. Обозначим ее N. Когда лифт покоится, сила N уравновешивает силу тяжести, то есть N = rag. Теперь представим, что лифт свободно па- падает, то есть движется вниз с ускорением д (рис. 9.6 б). Для наблюдателя
ВОПРОСЫ И ЗАДАЧИ 145 в лифте (в неинерциальной системе отсчета) это означает появление «до- «дополнительной» силы инерции FHH = — mg. Эта сила направлена вверх и в точности уравновешивает силу тяжести, так что никакого взаимодействия человека с опорой весов не будет, что и означает обращение его веса в нуль. Таким образом, возникающее в рассмот- рассмотренных условиях состояние невесомости связано с тем, что силы инерции компен- Земля F сиру ют силу тяжести. (^\ jl Аналогичная компенсация гравитаци- — онного притяжения к Земле силой инер- инерции происходит и при рассмотрении явле- рис д ^ ний относительно космического корабля, вращающегося вокруг Земли. В этом случае притяжение к Земле компен- компенсируется центробежной силой инерции (рис. 9.7). В самом деле, центробеж- центробежная сила инерции, действующая на обитателя космического корабля, равна (см. (9.12)) FHH = mo;2R, (9.17) где т — масса космонавта, и — угловая скорость его вращения вместе с кораблем вокруг Земли и R — его радиус-вектор относительно центра Зе- Земли. Предположим, что корабль летит по круговой орбите. Это означает, что летящий вместе с кораблем космонавт испытывает в системе, связанной с Землей, центростремительное ускорение lo2R, направленное к центру Зе- Земли и связанное с силой притяжения к Земле F^ вторым законом Ньютона (если считать Землю инерциальной системой) mu;2R = Fg. Сравнивая это равенство с (9.17), мы видим, что сила инерции равна по величине и противоположна по направлению силе притяжения космонавта к Земле. То есть в этом случае, как и в примере с лифтом, возникает состоя- состояние невесомости. Спутник свободно падает на Землю, но благодаря большой начальной скорости «никак не может на нее упасть» и в результате движет- движется по окружности. Вопросы и задачи 1. Из каких предположений о свойствах пространства и времени следует принцип от- относительности Галилея? 2. Что такое силы инерции и какие типы сил инерции вы знаете? 3. Почему в южном полушарии левые берега рек подмыты сильнее правых? 4. Что такое состояние невесомости? 5. При спуске на 1-й этаж лифт тормозит, причем модуль его ускорения а = 3 м/с2. Определите вес находящегося в лифте человека, если его масса равна т = 70 кг. Ответ: Р = т(д + а) ~ 900 Н. 6. Кабины на колесе обозрения движутся в вертикальной плоскости по кругу радиуса R = 20 м, делая один оборот за время Т = 5 мин с постоянной угловой скоростью. Опреде- Определите величину и направление силы инерции, действующей на человека массы m = 70 кг, находящегося в кабине. Ответ: Сила инерции FHH = тBтг/ТJД ~ 0,6 Н направлена от центра окружности, по которой движется кабина. Говоря строже, в каждой точке кабины сила направлена к
146 ГЛ. 9. ЗАКОНЫ МЕХАНИКИ В НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА центру именно той окружности, по которой движется данная точка (см. рис. 9.8). Отметим, что поле сил в пределах каждой кабины в каждый данный момент строго однородно: кабина движется поступательно. 7. Оцените, насколько вес тела в Москве (на широте if = 56°) меньше силы гравитаци- гравитационного притяжения к Земле. со Рис. 9.8 Рис. 9.9 Решение. На неподвижное относительно Земли тело действуют две силы — сила гра- гравитации .Ргр, в основном определяющая вес тела, и относительно малая центробежная сила ^рцб = muj2R cos if, где uj — угловая скорость вращения Земли, a R ~ 6 400 км — ее радиус). Основной вклад в изменение веса тела вносит (см. рис. 9.9) составляющая F\ = F46 cos if = mou2Rcos2 if. Относительное изменение веса, связанное с вращением Земли, равно Fi/Frp = muj2Rcos2 ip/mg ~ 10~3. Сила Кориолиса F2 приводит к отклонению отвеса от направления к центру Земли, почти не меняя веса тела. 8.Человек намеревается пройти от центра карусели до ее края по радиусу с постоянной скоростью v = 3 м/с. Карусель радиуса R = 10 м делает п = 3 оборота в минуту. При каком значении коэффициента трения а человек сможет осуществить свое намерение? Ответ: а ^ ^ {и2 RJ + {2vuJ / g ~ 0,22 [ш = 2тгп/60 с). 9. Тело падает с высоты h = 100 м без начальной скорости. В какую сторону и на какое расстояние оно сместится под действием силы Кориолиса на широте Москвы? Решение. Скорость падения по вертикали растет по закону v = gt. Соответственно ко- риолисово ускорение равно а = 2vu cos if = 2gtu cos if. Дважды интегрируя по времени кориолисово ускорение, получаем величину сноса s = gu cos<^(T3/3). Полное время паде- падения Т = B/i/gI/2. В результате получаем снос к востоку: з = Bh/g)s/2guj cosip/3 ~ 0,012 м.
ГЛАВА 10 ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ 10.1. Постоянство скорости света для всех систем отсчета. Принцип относительности Эйнштейна и преобразования Лоренца Одной из важнейших физических постоянных является скорость света в вакууме с, то есть скорость распространения электромагнитных волн в сво- свободном от вещества пространстве. Эта скорость не зависит от частоты элек- электромагнитных волн, и принятое сейчас ее значение равно с = 299 792 458 м/с. В громадном большинстве случаев эту величину с достаточной точностью можно принять равной с = 3 • 108 м/с — погрешность при этом менее 0,001. И именно «триста тысяч километров в секунду» для скорости света запоми- запоминается большинством из нас на всю жизнь. Напомним, что 300 000 км — это, по порядку величины, расстояние от Земли до Луны (точнее, 380 000 км). Таким образом, радиосигнал с Земли достигает Луны через время немного большее, чем одна секунда. Предположение о том, что свет распространяется не с бесконечной, а с ко- конечной скоростью, высказывались за много столетий до того, как люди смо- смогли доказать это экспериментально. Впервые это было сделано в XVII веке, когда астрономические наблюдения странных «нерегулярностей» в движе- движении спутника Юпитера Ио удалось объяснить только на основе предположе- предположения о конечной скорости распространения света (кстати, эта первая попытка определить скорость света дала заниженный результат с ~ 214 300 км/с). Вплоть до конца XIX столетия скорость света интересовала исследовате- исследователей, главным образом, с точки зрения понимания природы электромагнит- электромагнитного излучения — физикам тогда было не ясно, могут ли электромагнитные волны распространяться в вакууме, или они распространяются в особой за- заполняющей пространство субстанции — эфире. Однако итогом исследова- исследования этой проблемы явилось открытие, перевернувшее все существовавшие до тех пор представления о пространстве и времени. В 1881 г. в результа- результате знаменитых опытов американского ученого Альберта Майкельсона был установлен удивительный факт — величина скорости света не зависит от того, относительно какой системы отсчета она определяется! Этот опытный факт противоречит закону сложения скоростей Галилея, который мы рассматривали в предыдущей главе и который кажется оче- очевидным и подтверждается нашими повседневными наблюдениями. Но свет не подчиняется этому естественному, казалось бы, правилу сложения ско- скоростей — относительно всех наблюдателей, как бы они ни двигались, свет распространяется с одной и той же скоростью с = 299 793 км/с. И то, что рас- распространение света — это движение электромагнитного поля, а не частиц,
148 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ состоящих из атомов, не играет здесь роли. При выводе закона сложения скоростей (9.2) не имела значения природа движущегося объекта. И хотя невозможно отыскать что-либо подобное в накопленных нами ра- ранее опыте и знаниях, тем не менее, мы должны признать этот опытный факт, помня, что именно опыт является решающим критерием истины. Вспомним, что мы сталкивались с подобной ситуацией в самом начале курса, когда об- обсуждали свойства пространства. Тогда мы отмечали, что представить себе кривизну трехмерного пространства нам — трехмерным существам — невоз- невозможно. Но мы поняли, что факт «наличия или отсутствия» кривизны можно установить опытным путем: измеряя, например, сумму углов треугольника. Какие же изменения необходимо внести в наше понимание свойств про- пространства и времени? И как в свете этих фактов относиться к преобразова- преобразованиям Галилея? Можно ли их изменить так, чтобы они по-прежнему не про- противоречили здравому смыслу при их применении к привычным движениям окружающих нас тел и в то же время не противоречили факту постоянства скорости света во всех системах отсчета? Принципиальное решение этих вопросов принадлежит Альберту Эйнштей- Эйнштейну, создавшему в начале XX в. специальную теорию относительности (СТО), связавшую необычный характер распространения света с фундамен- фундаментальными свойствами пространства и времени, проявляющимися при дви- движениях со скоростями, сравнимыми со скоростью света. В современной фи- физической литературе ее чаще называют просто релятивистской механикой. Впоследствии Эйнштейн построил общую теорию относительности (ОТО), где исследуется связь свойств пространства и времени с гравитационными взаимодействиями. Основу СТО составляют два постулата, которые носят название принципа относительности Эйнштейна и принципа постоянства скорости света. Принцип относительности Эйнштейна является обобщением принципа от- относительности Галилея, рассмотренного в предыдущей главе, на все без исключения (а не только механические) явления природы. Согласно это- этому принципу, все законы природы одинаковы во всех инерциальных систе- системах отсчета. Принцип относительности Эйнштейна можно сформулировать следующим образом: все уравнения, выражающие законы природы, инва- инвариантны по отношению к преобразованиям координат и времени от одной инерциальной системы отсчета к другой. (Напомним, что инвариантностью уравнений называется неизменность их вида при замене в них координат и времени одной системы отсчета координатами и временем другой). Понятно, что в соответствии с эйнштейновым принципом относительности никакими вообще опытами нельзя установить, движется «наша» система отсчета с по- постоянной скоростью или она неподвижна, точнее говоря, между этими состо- состояниями нет никакого различия. Галилей эту невозможность постулировал в принципе только для механических опытов. Принцип постоянства (точнее, инвариантности) скорости света утвержда- утверждает, что скорость света в пустоте одинакова для всех инерциальных систем отсчета. Как мы вскоре убедимся, из этого следует, что с — максимальная из всех возможных физических скоростей. Оба постулата являются отражением опытных фактов: скорость света не зависит от движения источника или приемника; она не зависит также от движения системы отсчета, в которой производятся эксперименты по ее измерению. В принципе относительности это отражено в признании того
10.1. ПРИНЦИП ОТНОСИТЕЛЬНОСТИ. ПРЕОБРАЗОВАНИЯ ЛОРЕНЦА 149 факта, что не только механические, но и электромагнитные (распростране- (распространение света) явления, подчиняются во всех инерциальных системах отсчета одним и тем же законам. Из сформулированных выше положений вытекает ряд важных выводов, касающихся свойств пространства и времени. Прежде всего, из них следуют новые правила перехода от одной инерциальной системы отсчета к другой, в рамках которых «очевидные» преобразова- преобразования Галилея являются лишь некоторым частным случаем, реализуемым только при движениях со скоростями, много меньшими с. Для определения этих новых правил рас- рассмотрим свет, распространяющийся от точеч- точечного источника, расположенного в начале не- неподвижной системы отсчета К (рис. 10.1 а). Распространение света можно представить как распространение светового фронта, име- имеющего форму сферической поверхности в си- системе отсчета, относительно которой источ- источник света неподвижен. Но согласно принципу относительности Эйнштейна световой фронт должен быть сферическим также и тогда, ко- когда он наблюдается в системе отсчета, на- находящейся в равномерном и прямолинейном Рис. 10.1 движении относительно источника. Из этого условия мы и определим сей- сейчас, каковы должны быть правила преобразования координат и времени при переходе от одной инерциальной системы к другой. Если источник света находится в начале координат системы отсчета К, то для света, испускаемого в момент t = 0, уравнение сферического светового фронта имеет вид + у2 + z2 = A0.1) Это уравнение описывает сферическую поверхность, радиус которой R = ct увеличивается во времени со скоростью с. Координаты и время, измеряемые наблюдателем в движущейся системе отсчета К1', обозначим буквами со штрихами: ж7, у7, z1', ?7. Положим, что начало отсчета времени tf совпадает с началом отсчета t и что в этот совпа- совпадающий нулевой момент времени начало координат системы К1 совпадает с положением источника света в системе К. Пусть, для определенности, систе- система К' движется в направлении +х с постоянной скоростью V относительно системы К (рис. 10.1 б). Как мы уже говорили, согласно второму постулату Эйнштейна, для на- наблюдателя в «штрихованной» системе световой фронт должен быть также сферическим, то есть уравнение светового фронта в движущейся системе должно иметь вид у '2 2 = сН'\ A0.2) причем величина скорости света с здесь та же, что и в системе отсчета К. Та- Таким образом, преобразования координат и времени от одной нашей системы отсчета к другой обязаны обладать таким свойством, что, например, после
150 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ замены с помощью этих преобразований в A0.2) «штрихованных» величин на «не штрихованные» мы должны вновь получить уравнение сферического фронта A0.1). Легко убедиться, что преобразования Галилея (9.3) не удовлетворяют это- этому требованию. Напомним, что эти преобразования связывают координаты и время в двух разных системах отсчета следующими соотношениями: х' = х - Vt, у = у, z = z, t' = t. A0.3) Если мы подставим A0.3) в A0.2), то получим х2 - 2xVt + V2t2 + у2 + z2 = c2t2, A0.4) что, конечно, не согласуется с уравнением A0.1). Какими же должны быть новые преобразования? Во-первых, так как все системы равноправны, пере- переход из некоторой системы в любую другую должен описываться одними и теми же формулами (со своим значением F), а двукратное применение пре- преобразований с заменой на втором шаге +У на -У должно возвращать нас в исходную систему. Таким свойством могут обладать только линейные по х и t преобразования. Бесполезно испытывать для этого соотношения типа х1 = xl'2t1'2, х1 = sin ж или им подобные. Во-вторых, при V/с —>• 0 эти преобразования должны переходить в пре- преобразования Галилея, справедливость которых для малых скоростей не мо- может быть подвергнута сомнению. Из уравнения A0.4) ясно видно, что мы не можем оставить без изменения преобразование t' = ?, если хотим уничтожить в этом уравнении нежелатель- нежелательные слагаемые —2xVt + V2t2, потому что для их уничтожения необходимо обязательно что-то прибавить к t. Попробуем сначала преобразование вида: x' = x-Vt, yf = y, zf = z, tf = t + bx, A0.5) где b — постоянная, значение которой надо определить. Тогда уравне- уравнение A0.2) принимает вид х2 - 2Vxt + V2t2 +y2 + z2 = c2t2 + 2c2bxt + c2b2x2. A0.6) Заметим, что члены в левой и правой частях равенства, содержащие произ- произведение xt, взаимно уничтожаются, если принять b= -V/c2, или tf = t-Vx/c2. A0.7) При этом значении b уравнение A0.6) можно переписать следующим об- образом: ж2 h _ V2/с2) + у2 + z2 = c2t2 (l — V2/с2) . A0.8) Это уже ближе к уравнению A0.1), но еще остается нежелательный множи- множитель 1 — {V2/с2), на который умножаются х2 и t2. Мы можем исключить и этот множитель, если окончательно запишем пре- преобразование координат и времени в следующем виде: т — Vt t
10.2. СОКРАЩЕНИЕ ДЛИНЫ И ЗАМЕДЛЕНИЕ ВРЕМЕНИ 151 Это и есть знаменитые преобразования Лоренца, названные по имени гол- голландского физика-теоретика Хендрика Лоренца, который в 1904 году вывел формулы A0.9) и тем самым подготовил переход к теории относительности. Нетрудно проверить, что при подстановке A0.9) в уравнение A0.2) пре- преобразования Лоренца, как и должно быть, преобразуют это уравнение в уравнение сферической поверхности A0.1) в неподвижной системе коорди- координат. Также легко убедиться, что при V/с —>• 0 преобразования Лоренца пе- переходят в преобразования Галилея (9.2). 10.2. Следствия из преобразований Лоренца. Сокращение длины и замедление времени Из преобразований Лоренца вытекает ряд необычных с точки зрения нью- ньютоновой механики следствий. Длина тел в разных системах отсчета. Рас- Рассмотрим стержень, расположенный вдоль оси х /( /(' и покоящийся относительно системы отсчета К' (рис. 10.2). Длина его в этой системе равна /о = %2 — xii гДе xi и Х2 — не изменяющиеся со хх х2 х,х' временем t' координаты концов стержня. Отно- рис -^q 2 сительно системы К стержень движется вместе со штрихованной системой со скоростью v. Для определения его длины в этой системе нужно отметить координаты концов стержня х\ и Х2 в один и тот же момент времени t\ = ?2 = /• Разность этих координат / = Х2 — х\ даст длину стержня, измеренную в системе К. Чтобы найти соотношение между /о и /, следует взять ту из формул преобразований Лоренца, которая содержит ж7, х и ?, то есть первую из формул A0.9). Согласно этой формуле, х\ = (Х1 - vf)/y/l-v2/<?, 4 = (х2 - vf)/y/l-v2/<?, откуда получаем х'2 — х[ = (Х2 — Xi)/a/1 — V2 /с2 или окончательно l = lov/l-v2/c2. A0.10) Таким образом, длина стержня /, измеренная в системе, относительно ко- которой он движется, оказывается меньше «собственной» длины Iq, измерен- измеренной в системе, относительно которой стержень покоится. Поперечные раз- размеры стержня в обеих системах одинаковы. Итак, для неподвижного наблю- наблюдателя размеры движущихся тел в направлении их движения сокращаются, и тем больше, чем больше скорость движения. Длительность процессов в разных системах отсчета. Пусть в некото- некоторой точке, неподвижной относительно движущейся системы К1', происходит какой-то процесс, длящийся время Ato = t^ — t^. Это может быть работа ка- какого-либо прибора или механизма, колебание маятника часов, какое-нибудь изменение в свойствах тела и так далее. Началу процесса соответствует в этой системе координата х[ = а и момент времени t[, концу — та же самая координата х'2 = х\ = а и момент времени ??>• Относительно системы К точ- точка, в которой происходит процесс, перемещается. Согласно формулам A0.9),
152 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ началу и концу процесса в системе К соответствуют моменты времени _ t[ + (v/c2)a _ t'2 + (v/c2)a 1 " у/1 - v2/c2 ' 2~ V1- v2/c2 ' откуда получаем Введя обозначения t2 — ti = At, получим окончательно: At = Ato/y/l-v2/c2. A0.11) В этой формуле Ato — длительность процесса, измеренная по часам в движущейся системе отсчета, где тело, с которым происходит процесс, по- покоится. Промежуток At измерен по часам системы, относительно которой тело движется со скоростью v. Иначе можно сказать, что At определено по часам, которые движутся относительно тела со скоростью v. Как следует из A0.11), промежуток времени Ato, измеренный по часам, неподвижным относительно тела, оказывается меньше, чем промежуток времени At, из- измеренный по часам, движущимся относительно тела. Заметим, что для релятивистских множителей (Лоренц-факторов) дви- движущейся со скоростью V системы отсчета и/или движущейся со скоро- скоростью v частицы приняты обозначения Г = 1/л/1 — V2/с2 и соответственно 7 = 1/л/1 — v2/с2. Если это не приводит к путанице, для обеих величин употребляется обозначение 7- Рассматривая протекание процесса из системы X, можно определить At как его длительность, измеренную по неподвижным часам, a Ato — как длительность, измеренную по часам, движущимся со скоростью v. Соглас- Согласно A0.11), Ato < A^j поэтому можно сказать, что движущиеся часы идут медленнее, чем покоящиеся часы (имеется, конечно, в виду, что во всем, кроме скорости движения, часы совершенно идентичны). Время Ato, отсчитанное по часам, движущимся вместе с телом, называется «собственным временем» этого тела. Как видно из A0.11), собственное время всегда меньше, чем время, отсчитанное по часам, движущимся относительно тела. Эффект замедления времени симметричен по отношению к обоим рассма- рассматриваемым часам: для обоих наблюдателей из разных систем отсчета часы движущегося относительно него наблюдателя будут идти медленнее. Замед- Замедление времени является объективным следствием преобразований Лоренца, которые, в свою очередь, являются следствием постоянства скорости света во всех системах отсчета. Необходимо подчеркнуть то обстоятельство, что релятивистские эффекты отнюдь не умозрительны. На сегодняшний день СТО с очень хорошей точностью подтверждена экспериментально. Разуме- Разумеется, при V/c —>> 0 формулы A0.10), A0.11) преобразуются к тривиальному нерелятивистскому пределу. Для наблюдения нетривиальных эффектов не- необходимо исследовать объекты с V ~ с. Примерами могут служить явления, наблюдаемые при изучении элемен- элементарных частиц. Одним из наиболее наглядных опытов, подтверждающих со- соотношение A0.11), является наблюдение в составе космических лучей од- одного из видов элементарных частиц, именуемых мюонами. Эти частицы
10.2. СОКРАЩЕНИЕ ДЛИНЫ И ЗАМЕДЛЕНИЕ ВРЕМЕНИ 153 нестабильны — они самопроизвольно распадаются на другие элементарные частицы. Время жизни мюонов, измеренное в условиях, когда они неподвиж- неподвижны (или движутся с малой скоростью), равно примерно 2 • 10~6 с. Казалось бы, даже двигаясь почти со скоростью света, мюоны могут пройти от мо- момента своего рождения до момента распада лишь путь, равный примерно C • 108 м/с) B • 10~6 с) = 600 м. Однако наблюдения показывают, что мюо- мюоны, образуясь в космических лучах в верхних слоях атмосферы на высоте 20-30 км, успевают, тем не менее, в большом количестве достигнуть земной поверхности. Это объясняется тем, что 2-10~6 с — собственное время жизни мюона, то есть время, измеренное по часам, которые бы «двигались вместе с ним». Время, отсчитанное по часам экспериментатора, связанного с поверх- поверхностью Земли, оказывается гораздо большим из-за того, что скорость мюо- нов близка к скорости света. Поэтому не удивительно, что экспериментатор наблюдает пробег мюона, значительно превышающий 600 м. Интересно рас- рассмотреть этот эффект с точки зрения наблюдателя, «движущегося вместе с мюоном». Для него расстояние, пролетаемое до поверхности Земли, сокра- сокращается до 600 м в соответствии с формулой A0.10), так что мюон успевает пролететь его за 2 • 10~6 с, т. е. за «собственное время жизни». Наиболее впечатляющее следствие преобразований Лоренца — относи- относительность одновременности разнесенных в пространстве событий. Если два события А ж В произошли одновременно в одной точке пространства, то в любой системе координат tA=tB. Конкретные значения, например, tA и t'A могут быть различными, но в каждой системе останется справедливым ра- равенство t'A = t'B. Если же при tA = tB окажется, что хА ф хв, то в любой другой системе, как это с очевидностью следует из преобразований Лоренца, tA^tB. Почему это обстоятельство до Эйнштейна оставалось незамеченным? До Эйнштейна явно или неявно сохранялось представление о существовании абсолютного пространства и абсолютного времени. Но если нет абсолютной системы отсчета, нет и абсолютной одновременности. Исчезает не только аб- абсолютное пространство, исчезает и абсолютное время, которое, по Ньютону, течет «всегда одинаково, безотносительно к чему-либо внешнему». Время СТО зависит от системы отсчета. Зависит от системы отсчета и промежуток времени между двумя событиями, и расстояние между двумя точками. В механике Галилея-Ньютона координаты точек зависят от системы отсчета, но расстояние между точками А ж В (хА - xBf + (уА - увJ + (zA - zBf = I2 от системы не зависит. В механике СТО эта величина перестает быть ин- инвариантом. Независимым от системы отсчета становится интервал между событиями, определяемый соотношением - (хА-хвJ - (уА-увJ - {zA-z Bf. Время становится в один ряд с пространственными координатами или, как сказал Г. Минковский, «пространство само по себе и время само по себе погружаются в реку забвения, а остается жить лишь своеобразный их со- союз». Это проявляется особенно наглядно, если, следуя Минковскому, в каче- качестве четвертой координаты выбрать не ?, как таковое, a ict. Тогда интервал
154 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ запишется в симметричной форме: г=1 где х\ = ж, Х2 = у, жз = 2, ^4 = ict. He следует, однако, воспринимать четы- четырехмерное пространство Минковского как простой аналог нашего трехмер- трехмерного мира. Все же четвертая координата сохраняет важнейшее отличие от трех остальных — однонаправленность, которой, в частности, обусловлены причинно-следственные связи. Путешествие вспять во времени как было, так и остается невозможным. Ввиду того, что по Лоренцу, в отличие от Галилея, преобразуется, кроме координат, и время, заметно меняется закон сложения скоростей. Если в системе К тело движется со скоростью г>, имеющей составляющие по осям координат vXl vyi vZl а система К1 движется со скоростью V вдоль оси ж, для составляющих скорости тела в системе К' получаем , dx' T(dx - Vdt) vx-V x dt' T[dt - (V/cJ dx] l-Vvx/c2' { ' dt' ~ T[dt - (V/cJdx] ~ 1 - Vvx/c2 '' ^10Л3^ dz' dz г Vz dt' T[dt - (V/cJ dx] 1 - Vvx/c2 ' [ ' Хотя координаты у' и z' равны соответственно уи2;, составляющие скорости по этим осям в разных системах различны, так как различаются темпы течения времени. Не представляется неожиданным факт, что если vx по модулю равна ско- скорости света — с, то эта величина не изменится при переходе в любую другую систему отсчета. Ведь именно инвариантность скорости света является кри- критерием справедливости преобразований Лоренца. 10.3. Импульс и энергия в релятивистской механике Закон сохранения импульса — один из основных законов природы; он от- отражает однородность пространства. В мире Минковского однородность про- пространства сохраняется. Видимо, должен быть по-прежнему справедлив за- закон сохранения импульса в замкнутой системе. Однако это требует опреде- определенной корректировки выражения для импульса тела. Рассмотрим частный случай. Два одинаковых тела (масса каждого рав- равна га) движутся навстречу друг другу, имея, с точки зрения некоторой систе- системы отсчета К, равные скорости. Следовательно, vxA = —vxB, и vyA = —vyB. Пусть при столкновении тела объединяются в единое целое («слипаются»). В соответствии с законом сохранения импульса образовавшееся тело долж- должно покоиться. В частности, его координата у теперь должна быть неизмен- неизменной. В любой другой системе К1\ события в которой связаны с событиями в системе К преобразованиями A0.9), координата у' тоже должна стать по- постоянной.
10.3. ИМПУЛЬС И ЭНЕРГИЯ В РЕЛЯТИВИСТСКОЙ МЕХАНИКЕ 155 Рассмотрим ситуацию до столкновения в системе К1. Согласно формулам преобразования скоростей A0.13), получаем , V l-VvxA/<? l + VvxB/c2 ' Модули у-составляющих скоростей теперь оказываются различными, и если сохранить классическое выражение для импульса, в частности, ру = = mvy, суммарная у-составляющая импульса двух частиц не равна нулю. Тогда после «слипания» образовавшееся тело должно иметь отличную от нуля составляющую скорости по оси у. Видимо, надо изменять выражение для импульса тела. Для того, чтобы догадаться, как именно надо менять это выражение, рас- рассмотрим следующую процедуру. Установим на каждом из тел часы. Они будут показывать собственное время данного тела. Теперь будем фикси- фиксировать координату тела у в различных системах и отмечать собственное время to, которое соответствует этому значению у. Запишем «гибридную» скорость v* = dy/dto. Так как координата у не преобразуется при переходе от системы к системе, а время мы фиксируем по собственным часам тела, во всех системах мы должны получить одно и то же значение v*. Мы знаем, что промежутки времени по часам системы, в которой тело движется (dt), и промежутки, отсчитанные по собственным часам (dto), связаны соотноше- соотношением A0.11). Применительно к нашему случаю — dto = dt/j. Следовательно, во всех системах величина j dy/dt = dy/dto будет иметь одно и то же значение. Ясно, что равенство не нарушится, если обе его части умножить на одну и ту же величину т. Применительно к нашей задаче (о «слипании» двух тел) это означает, что комбинации jmv у двух частиц будут равными по модулю в любой системе отсчета. Естественно именно эту величину принять за у-составляющую импульса. Обобщая, определим релятивистский импульс выражением р = jmv = mv/y I — v2/с2, A0.15) где v — скорость тела в системе, в которой мы вычисляем импульс. Опыт показывает, что определенный таким образом импульс обладает основными свойствами, присущими величине mv в механике Ньютона: он сохраняется в замкнутых системах тел, а скорость его изменения равна си- силе, действующей на тело. Силу при этом следует определять в соответствии с E.25): F = —U. При v/c <С 1 выражение A0.15) переходит в обычное нерелятивистское определение импульса. Тем самым соблюдается принцип соответствия, за выполнением которого следует внимательно следить при любом расширении физических понятий. (Мы уже касались этого вопроса в связи с законом сохранения энергии). Для работы силы, то есть для изменения кинетической энергии тела, со- сохраняется выражение 6A = dT = F-6r = Fvdt, где F = р. Ограничиваясь случаем действия силы вдоль направления скорости, с уче- учетом A0.15) получаем dT = 777,7 Зуа ' dt = 7777 3v dv.
156 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ Тогда для кинетической энергии имеем Т = } md{vJ ,/2 = ;тс2 - тс2 = G - 1)тс2. A0.16) У 2 A - г;2/с2K/2 л/1 - ?;2/с2 Выражение A0.16) трактуется так: энергия тела Е = jmc слагается из кинетической энергии и энергии покоя Eq = me2. Закон сохранения энергии справедлив именно для величины Е. Это верно как в случае упругих, так и неупругих взаимодействий, когда потери кинети- кинетической энергии компенсируются ростом энергии покоя взаимодействующих частиц или энергией частиц, излучаемых при взаимодействии, например, фотонов. В более общем случае, при рождении в процессе взаимодействия массивных частиц, необходимо, конечно, учитывать и кинетическую энер- энергию и энергию покоя всех частиц как до взаимодействия, так и после него. Такие понятия, как потенциальная энергия или энергия связи, в реляти- релятивистском представлении включаются в энергию покоя. Для энергии с помощью формулы A0.15) можно получить соотношение Е2 = (рсJ + (me2J . A0.17) Связь импульса с энергией принимает вид р = Елг/с2. A0.18) Введя обозначения М = тс2, Р = рс, C = v/c, мы можем записать соотно- соотношения между массой, импульсом и энергией в несколько более компактной форме: М2 + Р2 = Е2; Р = ЕC; Р = mjc2f3 = MjC. Фактически эта форма соответствует неявному введению системы единиц, в которой с = 1, а масса, импульс и энергия измеряются в одинаковых едини- единицах; например, в ядерной физике в качестве такой универсальной единицы измерения массы, импульса и энергии обычно используется электронвольт: 1 эВ = 1,6 • Ю-19 Дж = 1,6 • Ю-12 эрг. Комбинация Е — Р2 = М2 очевидным образом является инвариантом, т. е. не зависит от системы отсчета для отдельно взятой частицы. Менее очевидно, что такая комбинация — инвариант и для совокупности частиц. Доказательство этого утверждения не представляет особых трудностей, но достаточно громоздко. Между тем, обратим внимание на тот факт, что «те- «тела» состоят из движущихся друг относительно друга (хотя бы в процессе колебаний) атомов, атомы — из ядра и электронов, и даже протоны или пи- пионы — из кварков и антикварков. А в отношении этих, строго говоря, систем или совокупностей частиц мы без малейшего сомнения уверены в инвари- инвариантности величины Е2 — Р2. Использование этого обстоятельства помогает упростить решение многих задач. Поскольку определение A0.15) и соотношения A0.16)—A0.18) оказывают- оказываются в хорошем согласии с экспериментом, мы можем сделать еще один важ- важный вывод: из вещественности физических величин р л Е следует, что ско- скорость любого физического тела не может превышать скорости света. Если же частица (фотон, нейтрино) движется именно со скоростью с, из A0.15), A0.16) вытекает, что масса такой частицы (более строго, энергия
ВОПРОСЫ И ЗАДАЧИ 157 покоя) должна быть равна нулю, а двигаться она может исключительно со скоростью света. Релятивистская динамика по мере развития дает допол- дополнительные аргументы в пользу таких заключений, но уже сейчас можно сказать, что все они подтверждены прямыми экспериментами. Вопросы и задачи 1. Что такое принцип относительности Эйнштейна, и какие опытные факты лежат в его основе? 2. Что такое «замедление времени», и из каких законов природы вытекает этот эффект? 3. Чему равна масса фотона? 4. Два космических корабля движутся по одной прямой со скоростью v = 0,6 с друг относительно друга. На каждом корабле наблюдают прямое телевизионное изображение часов другого корабля. Как связаны показания собственных часов и показания изображе- изображения «чужих» часов? Решение. Допустим, наблюдатель А в некоторый момент времени поставил на своих часах то же показание, которое он видел на телеэкране, например, to. Отметим, что пере- передатчик В послал изображение своих часов, на которых было это показание — to, с неко- некоторого расстояния Lo, и мы на часах А установили время to через промежуток времени Lo/c после того, как это время показали часы В. Пока по часам В пройдет некоторое время то, по «неподвижным»часам системы А прой- пройдет уже время т = jto. Однако надо учесть, что корабль В движется, и его сигналы при- приходят из разных точек системы А. Если корабли сближаются, путь сигнала во втором случае меньше на величину г>т, т. е. L = Lo — vr. Через время L/c = Lo/c — vr/c после того, как часы В показали to + то, сигнал об этом дойдет до наблюдателя А. Итак, наблюдатель А увидит на телевизионном экране показание to + то тогда, когда его часы покажут время to + т — vt/c = to + jtoA — v/c) = to + тод/A — v/c)(l + v/c) = to + 0,5 ro. На телеэкране прошла минута, а по часам А — только полминуты. Часы на телевизоре идут быстрее, чем часы в кабине корабля (!). Точно такие же рассуждения применимы, конечно, и к космонавту В: у него тоже часы на экране, изображающем корабль А, будут идти вдвое быстрее собственных. После того, как космонавты разминулись, часы на экране пойдут медленнее часов в кабине. Нетрудно понять, что теперь промежутки времени будут связаны соотношением В нашем случае часы на экране пойдут вдвое медленнее собственных. Отметим, что это отношениене равно 7 и в случае удаления кораблей друг от друга. 5. Стержень пролетает с большой скоростью мимо метки, расположенной в лабора- лабораторной системе отсчета К. Известно, что время прохождения стержня мимо метки равно t = 3 не по часам системы К и t = 5 не по часам системы К', связанной со стержнем. Определить собственную длину стержня (т. е. его длину в системе К ). Решение. Рассмотрим два события — совмещение с меткой переднего и заднего кон- концов стержня — в двух системах координат. В системе К эти события происходят в одной точке, и интервал между ними определяется равенством s2 = (ctJ. В системе К' рас- расстояние между точками, в которых происходят эти события, как раз и есть собственная длина стержня, т. е. (VJ = {ct'J — Lq. В силу инвариантности интервала s2 = (VJ. И окончательно получаем Lo\/(ct'J — (ctJ = 1,2 м.
158 ГЛ. 10. ВВЕДЕНИЕ В РЕЛЯТИВИСТСКУЮ МЕХАНИКУ 6. Стержень, собственная длина которого равна Lq = 240 см, пролетает с большой ско- скоростью мимо метки, расположенной в лабораторной системе отсчета К. Время прохожде- прохождения по лабораторным часам равно t = 6 не. Какое время прохождения метки зафиксиро- зафиксировано по часам, расположенным на стержне? Ответ: t0 = y/t2 + (L0/cJ = 10 не. 7. При соударении достаточно энергичных протонов может идти реакция рождения протон-антипротонной пары р + р^-р + р + р + р. На этом примере определите выигрыш от использования реакции на встречных пучках. Решение. Если осуществляется реакция на встречных пучках, когда лабораторная си- система является системой центра инерции, т. е. системой, в которой суммарный импульс частиц равен нулю, вся кинетическая энергия протонов может перейти в энергию покоя пары, т. е. протоны должны быть разогнаны до энергии То = М. Если же разогнанный на ускорителе протон сталкивается с неподвижным, требуется значительно большая кинетическая энергия. Наиболее выгоден случай, когда продукты реакции движутся вместе, что очевидно, если мысленно пересесть в ц-систему (т. е. вер- вернуться к варианту на встречных пучках). В ц-системе инвариант Е2 — Р2 равен 16М2 (МЕ = 4М, Ре = 0). Значит, он должен иметь это же значение и в лабораторной системе. Но таким же он должен быть и до соударения, когда один из протонов покоился, а второй имел энергию Т и импульс Р={Е2- М2I/2 = [(Г + МJ - М2]1/2 = [ТBМ + Т)]1/2. Получаем 16М2 = BМ + ГJ - Р2, откуда Т = 6М = 6Г0.
ЧАСТЬ II ЭЛЕКТРИЧЕСТВО И МАГНЕТИЗМ ВВЕДЕНИЕ По традиции раздел общей физики, в котором рассматриваются электро- электромагнитные явления, называется «Электричество и магнетизм»; профессио- профессионалы предпочитают именовать данную науку электродинамикой. В нашем рассмотрении мы будем исходить из того, что школьный курс физики чи- читателю уже известен. Это не должно отражаться на порядке изложения, поскольку наша цель — представить единый курс, а не избранные главы. Но мы достаточно широко будем пользоваться примерами и аналогиями, вы- выходящими за пределы собственно электродинамики. Тем самым мы в какой- то степени погрешим против исторической последовательности в развитии электродинамики — впрочем, это неизбежное свойство любого учебного кур- курса. Даже законы Ньютона отнюдь не первичны, но представляют собой об- обобщение большого числа известных ранее экспериментальных фактов. В этой связи подчеркнем, что электродинамика, как и вся физика, — нау- наука естественная, а следовательно — экспериментальная. Будучи самой фун- фундаментальной из естественных наук, физика, как следствие, и более других формализована, но надо понимать, что аксиом и теорем в строгом смысле в ней нет. Все основные факты берутся из эксперимента, все предположения и выводы экспериментом в конечном счете и проверяются. Это утверждение, конечно, не следует трактовать слишком прямолинейно. Теория и опыт в физике не на каждом шагу контролируют друг друга, но лишь в некоторых принципиальных «узловых» точках, оставляя достаточно места и формаль- формальной логике, и математическому моделированию физической реальности. Не следует только путать модель и самое реальность. В отличие от механики, которая (включая релятивистскую и квантовую механику) представляет движение или равновесие как результат заданно- заданного взаимодействия, в электродинамике мы впервые изучаем взаимодействие как таковое. Фундаментальных взаимодействий в физике всего четыре: силь- сильное, слабое, гравитационное и электромагнитное. Первые два в этом списке — предмет ядерной физики, и, по крайней мере, явно не проявляются в том круге явлений, который мы будем изучать. Гравитационное взаимодей- взаимодействие обычно широко используется для иллюстрации законов ньютоновской механики. Из всех перечисленных оно оказывается самым слабым, но для макроскопических (особенно космических) масштабов остается единственно эффективным. Однако в тех случаях, когда вступает в игру электромагнит- электромагнитное взаимодействие, гравитацию, как правило, можно исключить из рассмо- рассмотрения. Мы постоянно сталкиваемся с электромагнитным взаимодействием, не всегда отдавая себе в этом отчет. Вся информация о внешнем мире: как
160 ВВЕДЕНИЕ пассивная (зрение, слух, обоняние, осязание), так и полученная через по- посредство любых приборов — обеспечена исключительно электромагнитным взаимодействием. Само наше существование, включая процесс мышления, базируется на химии, а последняя, в свою очередь, на электромагнитных явлениях. Было бы, конечно, недопустимым упрощенчеством пытаться «све- «свести» весь окружающий нас мир к элементарным явлениям электродинами- электродинамической природы, но они, во всяком случае, играют роль тех кирпичиков, из которых этот мир построен. Каждой естественной науке, в частности каждой области физики, присущ свой собственный формальный язык. Можно представить себе курс механи- механики, в котором нет ни производных, ни интегралов. Читатель не затруднит- затруднится с примером — это, скажем, школьный курс. Но имея опыт с разделом «Механика» нашего курса, читатель согласится, по-видимому, и с тем, что из-за такой формальной уступки уровню аудитории школьный курс меха- механики много теряет по существу. Равным образом, например, естественный язык термодинамики — язык частных производных и криволинейных инте- интегралов. Тут уже школьный курс оказывается в совсем тяжелом положении, и студенты ощущают в этой связи особую трудность термодинамики. У электродинамики есть свой «родной язык» — это язык векторного ана- анализа. Некоторые учебники без него обходятся, а затем он неожиданно воз- возникает в самый последний момент (при формулировке локальной формы уравнений Максвелла) либо отодвигается до лучших времен — куда-нибудь в курс теоретической физики. По самому принципу построения нашей книги мы не должны отсылать читателя к каким-либо последующим курсам, поскольку у студента техни- технического вуза этот учебник физики может оказаться и последним в жизни. В то же время мы не предполагаем у читателя предварительного знакомства с операциями векторного дифференцирования и будем вводить таковые по ходу изложения. Разумеется, ни объем, ни задача настоящей книги не по- позволяют сопроводить этот математический материал какими-либо доказа- доказательствами; заинтересованному читателю мы порекомендуем обратиться к учебникам математического анализа. Принципиально важным для любого курса электродинамики оказывается вопрос о системе единиц, которая используется при его построении. Следуя опять программе обучения инженерных вузов, мы представляем настоящий курс в системе СИ, хотя физики ею обычно не пользуются. В механике систе- системы СИ и СГС равноправны, и соответствующие единицы отличаются только масштабом, а все формулы выглядят в обеих системах единиц одинаково. В электродинамике дело обстоит иначе, поскольку в системе СИ, кроме метра, килограмма и секунды, эталонируется еще одна физическая единица — это ампер, единица силы тока. Принято это делать исключительно из сообра- соображений удобного масштаба практически важных физических величин, но в результате одни и те же законы выглядят в разных системах единиц немно- немного по-разному, отличаясь размерными коэффициентами. И если в системе СГС «лишних» коэффициентов нет, то в СИ возникают понятия с точки зре- зрения физики парадоксальные, как, например, диэлектрическая и магнитная проницаемости вакуума. Полезно, однако, убедиться в том, что и любимая физиками система СГС оказывается «не без греха». Для начала отметим, что корректным образом
ВВЕДЕНИЕ 161 любая новая размерность в физике вводится исходя из соотношения, свя- связывающего новую физическую величину с уже известными, скажем, работу с силой и расстоянием. Но в традиционном курсе физики особняком стоит второй закон Ньютона, поскольку в него входят сразу две новые величи- величины — сила и масса. Мало того, основное утверждение — пропорциональ- пропорциональность ускорения приложенной силе — по существу бессодержательно, по- поскольку сила как физическая величина здесь же и определяется. Ничто, казалось бы, не мешает определить ее иначе, например, считать пропорци- пропорциональной корню квадратному из ускорения. В действительности, однако, все парадоксы без труда снимаются, если одновременно со вторым законом Ньютона рассматривать ему же принадле- принадлежащий закон всемирного тяготения. Тогда вдруг окажется, что три фунда- фундаментальных физических единицы нам не нужны — достаточно двух. Из двух зависимостей: F ос та и F\2 ос miTT^/r2 следует, что при гравитационном взаимодействии двух одинаковых тел а ос т/г2. Естественным оказывается определение единицы массы из величины ускорения, скажем, 1 см/с2 при расстоянии 1 см между взаимодействующими телами. Далее столь же есте- естественным образом из закона тяготения выделяется понятие силы, и второй закон Ньютона будет содержать, как и следует, лишь одну новую физиче- физическую величину. Это, быть может, было бы несколько сложно для школьного курса, но и в учебниках для студентов такой схемой не пользуются. Дело в том, что в этом случае закон всемирного тяготения следовало бы вводить без коэффи- коэффициента: F\2 = m\rri2/г2. Определенная отсюда единица массы оказалась бы равной примерно 15 000 кг, а единица силы, даже для базовых единиц сан- сантиметр и секунда, была бы равна примерно 150 Н. Совершенно очевидно, что и далее определенные физические величины оказались бы по масштабу совершенно неприемлемы. Поэтому единица массы все-таки используется в качестве базовой, а платить за это приходится некоторой путаницей в основ- основных законах механики и размерным коэффициентом в законе всемирного тя- тяготения — гравитационной постоянной. Совершенно аналогичная ситуация возникает при использовании системы СИ в электродинамике. Если бы мы пользовались системой СГС, то единица силы тока оказалась бы равной примерно 3,3 • 10~10 А, а, к примеру, единица сопротивления — 9 • 1011 Ом. Поэтому для практических надобностей система СГС была бы совершенно непригодна. Правда, основные физические законы в ней выгля- выглядят более простыми и естественными, но уравнения колебательного контура, электрических цепей, многие формулы электроники оказываются проще и удобнее в системе СИ. Не следует, однако, забывать, что ее породило ис- исключительно удобство единиц измерения и практически важных формул, поэтому встречающиеся иногда рассуждения о физическом смысле величин ?о и /io заведомо абсурдны. Любой учебный курс общей физики должен включать, помимо основного текста, семинарские занятия и лабораторные работы, а также лекционные демонстрации. Всего перечисленного наш учебник никоим образом заменить не может, но некоторое количество задач, как и в предыдущем разделе, будет представлено и в курсе электродинамики.
ГЛАВА 1 ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ 1.1. Электрический заряд Как уже было замечено во введении, новая физическая величина есте- естественно возникает из нового закона, количественно представляющего неко- некоторое физическое явление. Понятие о заряде возникает на основании извест- известного из опыта явления электризации. Исследуя его (поначалу на достаточно примитивном уровне), можно установить, что идентичным образом получен- полученные электризованные тела отталкиваются друг от друга, и далее, что все так или иначе электризованные тела делятся на две группы — и отсюда происходит понятие знака заряда. За формулировкой «одноименные заря- заряды отталкиваются, а разноименные притягиваются» стоит огромный массив информации, накопленный опытным путем и порождающий в общем очень сильные утверждения: что заряды бывают всего двух знаков и что мир наш в целом электрически нейтрален. Уже в конце XIX столетия было ясно, что нейтрален каждый атом в отдельности и что электрический заряд поро- порождается всегда с «нулевой суммой» и притом дискретным образом: любой некомпенсированный заряд кратен некоторому элементарному — заряду электрона е = 1,60217733 • 109 Кл, где 1 Кл = 1 А • с — 1 кулон — единица заряда. В определение и, соответ- соответственно, в размерность кулона входит 1 А — единица тока, которая в системе СИ входит в число базовых и должна эталонироваться. (Вообще, как будет ясно из дальнейшего, электродинамические единицы в системе СИ опреде- определяются нередко достаточно причудливым образом, что обусловлено исто- историческими причинами). То обстоятельство, что именно электрон оказался в конечном счете отрицательно заряженной частицей, а протон — положи- положительно заряженной, является абсолютно случайным, точнее, оно следует из произвольной первоначальной идентификации двух упомянутых выше групп заряженных тел. Но, один раз договорившись, мы должны, во избе- избежание путаницы, безоговорочно соблюдать эту договоренность. В данной и последующей главах мы будем заниматься исключительно статическими задачами; соответствующий раздел электродинамики приня- принято называть электростатикой (во избежание терминологической путаницы заметим, что так называемая магнитостатика — не совсем статика, ибо маг- магнитное поле порождается движением зарядов). Важнейший закон электростатики — закон Кулона — зачастую тракту- трактуется в узком смысле, только как закон взаимодействия заряженных тел. На самом деле он гораздо более фундаментален, поскольку вводит само количественное понятие электрического заряда. Первоначальный термин «количество электричества» правильно отражал историю вопроса. Было
1.2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ 163 установлено, что сила взаимодействия между двумя заряженными тела- телами (неважно, были они одно- или разноименно заряжены) пропорциональна заряду каждого из них, определенному в произвольных единицах просто как сумма одинаковых заряженных тел, сложенных вместе. Далее Кулон, и независимо — Кавендиш, установили, что сила взаимодействия, безотно- безотносительно к знаку заряда, обратно пропорциональна квадрату расстояния между взаимодействующими телами: *12 ОС ГГ22. A.1) Исходя из этих экспериментальных фактов и вводится количественная ме- мера электрического заряда. Для этого A.1) объединяется с эмпирическим понятием количества электричества: *12 = Я1Я2/г2и. A.2) Именно так выглядит закон Кулона в системе СГС. Приравняв силу от- отталкивания двух одинаковых зарядов на расстоянии 1 см одной дине, мы получили бы единицу заряда в системе СГС. Но тут и оказывается, что для практических задач эта величина неудобна; например, таким будет заряд на обкладках конденсатора емкости 1 мкФ при напряжении ~ 3 • 10~4 В. В системе СИ, которой мы в дальнейшем будем пользоваться, уравнение A.2) приобретает численный коэффициент; его принято записывать в виде Fu = qiq2/D7rs0r212), A.3) где сила F измерена в ньютонах, q — в кулонах, г — в метрах, a ?q = = 8,85 • 10~12 СИ (у единицы измерения ?q есть свое название — Ф/м, но, коль скоро не имеет физического смысла сама величина, нет особой нужды и определять специально единицы ее измерения). С очень хорошей точно- точностью эту константу можно принять равной 10~9/C6тг) Ф/м. Если мы хотим, как обычно принято в статике, придать закону взаимодействия векторную форму, то нам нужно доопределить направление силы. Пусть вектор т\2 и, соответственно, орт Г12/г±2 направлены от заряда 1 к заряду 2. Тогда в век- векторной форме закон Кулона приобретает окончательный вид F12 = -T^Vr12. A.4) Формула A.4) правильно учитывает знак заряда — из нее как раз следует притяжение разноименных и отталкивание одноименных зарядов. Во всех формах закона Кулона мы молчаливо подразумевали, что размеры заря- заряженных тел много меньше расстояния между ними, а распределение заря- зарядов по объему или по поверхности тел достаточно однородно, чтобы не при- придавать взаимодействию каких-либо анизотропных свойств. Такое прибли- приближение называется приближением точечных зарядов; во многом оно близко приближению точечной массы в механике. 1.2. Электрическое поле Выражения A.3), A.4) можно переписать в эквивалентных формах: F12 = qiE(q2) =q2E(qi); Р12 = 9iE(g2); F2i = g2E(gi); F12 = -F21, A.5)
164 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ где векторная величина Е называется напряженностью электрического по- поля или — в особенности, в современной литературе — просто электрическим полем. Возьмем точечный электрический заряд q и поместим начало коор- координат в центре этого заряда. Сравнивая формулы A.3), A.4) с A.5), для поля этого заряда получаем Пока это всего лишь тождественная запись, преобразование, которое в прин- принципе может когда-либо оказаться удобным. Но, как будет следовать из все- всего нашего последующего курса, именно здесь мы вышли на одно из самых фундаментальных понятий. Поле, подобно веществу, оказывается видом ма- материи. Пространство между электрическими зарядами отнюдь не пусто — оказывается, там, где Е отлично от нуля, в пространстве как-то распреде- распределена энергия, а следовательно, и масса. Уравнениями A.3), A.4) предста- представлено как бы мгновенное дальнодействие, а на самом деле, именно поле оказывается промежуточным агентом, и когда мы от статической перейдем к временной задаче, предельная скорость взаимодействия окажется равной скорости света. Единица напряженности поля — 1 вольт на метр (В/м); из A.5) следует 1 В/м = A Н)/A Кл). Полезно в этой связи отметить, что логика наимено- наименования и связей между единицами в системе СИ не адекватна логике общего курса физики, поэтому нам придется не раз употреблять обозначения, вы- выраженные через единицы, которых мы еще не вводили. Правда, для вычи- вычисления полей в повседневной инженерной практике именно вольты на метры и приходится чаще всего делить. В качестве принципиально важного обобщения опытных фактов высту- выступает принцип суперпозиции полей, в наиболее явной форме выражающий векторную природу и векторные свойства электрического поля. Пусть в про- пространстве как-то размещены любым способом, дискретным или непрерыв- непрерывным, заряды (/1, б/2, Чч-, • • • 5 Qn- Тогда их действие на любой (т. н. пробный) заряд выражается формулой типа A.5), где электрическое поле равно про- просто векторной сумме полей всех зарядов: Ех; = Ei + Е2 + Е3 + ... + Еп. В отличие от механики, где имеет место принцип суперпозиции сил, здесь ситуация даже проще, поскольку силу в механике характеризует, помимо ве- величины и направления, линия приложения, тогда как электрическое поле является просто функцией точки пространства. Это позволяет, в частности, «оторвать» поля от порождающих их зарядов и не только складывать их в любой точке, но и престав л ять в виде любой векторной суммы, удобной для решения той или иной задачи. В качестве пробного заряда может, в частно- частности, выступать любой из зарядов системы q\ • • • qn, скажем, qm. Но в этом случае из векторной суммы должно быть исключено его собственное поле, поскольку самовоздействия по принципу Мюнхгаузена физика не допускает: гфтп Еще одно важное замечание касается среды, в которой мы можем пользо- пользоваться принципом суперпозиции. Он абсолютно точен в вакууме, но лишь в
1.3. ТЕОРЕМА ГАУССА 165 качестве некоторого приближения — в сплошных средах, которые, в част- частности, будут предметом рассмотрения в следующей главе. Если принцип суперпозиции работает с хорошей точностью, среда называется линейной, если же реакция среды на внешнее поле такова, что линейность отклика нарушается, то не имеет смысла говорить и о принципе суперпозиции по- полей. Таковы, например, сегнетоэлектрики, а в случае магнитных полей — ферромагнетики. Из школьного курса физики известно, что графически поле удобно пред- представлять силовыми линиями — кривыми, к которым вектор электрического поля в каждой точке является касательной. Густота силовых линий (ее мож- можно определить как число линий, пересекающих площадку единичной площа- площади, нормальную к линиям), по определению, считается пропорциональной напряженности поля в данной точке. Силовые линии начинаются на поло- положительных зарядах и кончаются на отрицательных, либо могут уходить на бесконечность. При этом на положительно заряженном теле начинается, а на отрицательно заряженном заканчивается число силовых линий, пропор- пропорциональное заряду. Определяют его, например, так: на точечном заряде в 1 Кл начинается (или на нем заканчивается) 1/бо силовых линий. Это, на первый взгляд, искусственное определение, как и все перечислен- перечисленные свойства, неявным образом отражает чрезвычайно важный эквивалент закона Кулона — теорему Гаусса. Теоремой она является постольку, по- поскольку математически строго следует из закона Кулона, по смыслу же обладает большей общностью и входит в число основных законов электро- электродинамики. 1.3. Теорема Гаусса Обратимся к рис. 1.1. Пусть некоторый заряд q окружен гладкой замкну- замкнутой поверхностью S. Выделим на ней малый элемент dS. Пусть п — еди- единичный вектор нормали к d*S, а ср — угол между векторами Е и п. При вычислении некоторых поверхностных интегралов оказывается удобным представить дифференциал поверхности в векторной форме. По определе- определению, вектором элемента площади dS называется dS • п, соответственно, (EdS) = (En)dS' = ?;cos^dS'. Также по определению, потоком вектора Е через поверх- поверхность S называется поверхностный интеграл = f(En)dS= Г EcosipdS. A.7) s s При этом в случае замкнутой поверхности (рис. 1.1) поток в A.7) будем определять по отношению к внешней нормали (в противном случае поток имел бы ту же величину, но противоположный знак). Для последующих выкладок нам полезно вспомнить еще определение телесного угла. Линей- Линейный угол, как известно, определяется отношением элемента дуги к радиусу. Телесный же угол О, по аналогии (см. рис. 1.1) определяется отношением площади, нормальной к радиусу-вектору, к квадрату этого радиуса. Удобно
166 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ определить его через малый элемент: = dS±/r2 = (dS и)/г2 = dS cos ip/г2 (U Полный линейный угол равен отношению длины окружности к радиусу, т. е. 2тг, аналогично, полный телесный угол равен отношению площади поверх- поверхности сферы к квадрату радиуса, т. е. 4тг. Теперь подставим первое — скалярное — равенство A.6) в A.7) и восполь- воспользуемся соотношением A.8): EdS = 4тг?0 Г J 4тг?0 Таким образом, поток вектора Е через поверхность, окружающую заряд, равен, с точностью до коэффициента б^1, величине этого заряда. Два об- обстоятельства стоят того, чтобы их отметить. Во-первых, ни симметрия по- поверхности, ни точка расположения заряда абсолютно не существенны. Во- вторых, источником поля может быть и не один точечный заряд, но любая система зарядов. В этом случае следует руководствоваться принципом су- суперпозиции. Поток поля любого заряда, расположенного вне замкнутой по- поверхности, будет равен нулю (удобно иллюстрировать это на языке силовых линий, пронизывающих поверхность), а каждый из потоков от внутренних зарядов будет соответствовать формуле A.9). Итак, поле может быть произ- произвольной природы, но поток его через замкнутую поверхность задается лишь заключенным в ней суммарным зарядом (разумеется, с учетом знака): A.10) Это и есть теорема Гаусса. Она, как уже отмечалось, принадлежит к числу основных законов электродинамики; вместе с тем, это хороший инструмент для решения задач электростатики, особенно в случае достаточ- достаточно высокой симметрии зарядовой систе- системы. Рассмотрим в качестве примера по- поле одномерного и двумерного «точечного заряда» — соответственно, равномерно заряженной плоскости и однородно за- заряженной нити (рис. 1.2 а, б). Из симме- симметрии задачи следует, что в первом случае вектор Е направлен по нормали к плос- плоскости (причем его направление по отно- отношению к ней одинаково в обоих полупро- по радиусу (при том, что 00' — ось симметрии). Рис. 1.2 странствах), а во втором руу (р , р) Пусть заряд распределен по плоскости с плотностью а = dQ/dS (рис. 1.2 а). Возьмем цилиндрическую поверхность, образующая которой совпадает с нормалью к плоскости, основание имеет произвольную форму площади S, причем заряженая плоскость пересекается с боковой поверхностью между двумя основаниями цилиндра. Заметим, что поскольку Е перпендикулярно плоскости, то и «густота» силовых линий, т. е. напряженность поля посто- постоянна в каждом полупространстве, а в двух полупространствах, разграни- разграниченных заряженной плоскостью, отличается знаком. Поэтому интегральное
1.3. ТЕОРЕМА ГАУССА 167 соотношение A.10) вырождается в алгебраическое: (S Ei) - (S Е2) = Е - 2S = е^а • 5, откуда следует ответ: Е = а/Bе0). A.11) Обратимся к геометрии рис. 1.2 б. Пусть q* = dQ/dl — линейная плотность заряда нити. Окружим последнюю цилиндрической поверхностью длины / и радиуса R. Теперь A.10) преобразуется к виду Е • 2nRl = ?o~V/, что дает: E = q*/B7TS0R). A.12) Выражения A.11), A.12) могут быть получены и непосредственно из за- закона Кулона, но вычисления будут достаточно громоздкими. Для полноты описания представим теорему Гаусса еще и в локальной форме, опираясь не на интегральные соотношения, а на параметры поля в данной точке про- пространства. Для этого удобно использовать дифференциальный оператор — дивергенцию вектора, — который был введен в гл. 8 курса механики: divE = дЕх/дх + дЕу/ду + dEz/dz. Его часто записывают как скалярное произведение оператора векторного дифференцирования V («набла») — V = ехд/дх + еуд/ду + ezd/dz — на векторную функцию: divE = V-E. Здесь ex,y,z — орты соответствующих осей. В математическом анализе известна теорема Гаусса-Остроградского: по- поток вектора через замкнутую поверхность равен интегралу от его диверген- дивергенции по объему, ограниченному этой поверхностью, — = Г divEdF. A.13) S V Дополним выражение A.10) понятием пространственной плотности заряда р = &Q/&V. Тогда, очевидно, V Поскольку поверхность интегрирования (или заключенный в ней объем) вы- выбраны произвольно, из A.10), A.13) следует равенство подынтегральных вы- выражений: divE = p/sq. A-14) Математически уравнение A.14) эквивалентно A.10); использование тео- теоремы Гаусса в локальной или интегральной форме зависит от характера задачи.
168 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ 1.4. Потенциал. Понятие электрической емкости Чтобы ввести корректно понятие электрического потенциала, мы должны прежде освоить логический прием, связанный с использованием пробного заряда. Предположим, что нам дана некоторая система точечных зарядов (/1, б/2, • • • 5 Чпч расположенных соответственно в точках Ri, R2, ..., Rn. В качестве мысленного эксперимента будем перемещать в поле этих зарядов некий точечный заряд д, малый настолько, что с заранее заданной точно- точностью можно будет пренебречь вызванным им механическим возмущением нашей зарядовой системы. (Иногда говорят об относительной малости его поля. Это некорректное условие, потому что на достаточно малом от заря- заряда расстоянии, в силу закона Кулона, поле его будет как угодно велико, однако на его движении это никак не скажется). Вычислим работу по пе- перемещению пробного заряда из некоторой точки 1 в некоторую точку 2 в предположении, что ни одна точка траектории не совпадет с точками R&. 2 2 п 2 А12 = - fFdl = -q fEdl = -q^2 f Ег dl. 1 1 i=1 1 Мы воспользовались принципом суперпозиции полей. А теперь рассмотрим один из членов этой суммы и учтем, что, согласно A.4), Е^ || г^, где г^ — радиус-вектор пробного заряда в системе с началом координат в точке R^. Поэтому E^dl = EidlcosZ(Ei, dl) = Eidri. Теперь воспользуемся законом Кулона в форме A.3), откуда следует 2 г2 ^ [% = tpa -№, A.15) 4тг?0 J г2 1 п где мы ввели величину (fi — потенциал г-ro заряда: ^ A.16) Используя A.15), A.16), мы можем определить работу следующим об- образом: i(r), A.17) т. е. из принципа суперпозиции полей следует аддитивность потенциалов. Величина q • ср имеет смысл потенциальной энергии. Как мы уже зна- знаем из курса механики, потенциальная энергия определена с точностью до произвольной аддитивной константы; точно так же определен и потенци- потенциал (р. Физический смысл имеет только разность потенциалов ((р2 — ^1), но в принципе, исключительно из соображений удобства, можно доопределить потенциал так, чтобы, скажем, он был равен нулю на бесконечности, как это фактически сделано в формуле A.16). Тогда для данной точки он будет равен отношению работы по перемещению пробного заряда из этой точки на бесконечность к величине этого заряда.
1.4. ПОТЕНЦИАЛ. ПОНЯТИЕ ЭЛЕКТРИЧЕСКОЙ ЕМКОСТИ 169 Иногда, в модельных задачах, такое определение оказывается не вполне удобным. Рассмотрим еще раз примеры, представленные на рис. 1.2. Проце- Процедура интегрирования, аналогичная той, что привела нас к определе- определению A.16), дает: — для одномерного случая (заряженная плоскость) (р = ах/Bео) (х = О соответствует плоскости заряда); — для двумерного случая (р = q* 1п(г/2тг?о)- Появление в последнем случае размерной функции под знаком логариф- логарифма нас смущать не должно, так как разность потенциалов оказывается при этом правильной размерности: (ср2 — <fi) ос In(r2/Vi). Можно учесть упомя- упомянутую выше произвольную константу в виде ln(r/i?o)- Общее свойство обоих результатов состоит в том, что потенциал даже в принципе не может быть задан равным нулю на бесконечности. Но дело в том, что одно- и двумерные системы всегда представляют собой некоторую идеализацию, приближение. Удалившись от них на достаточное расстояние, мы вернемся к существенно трехмерной картине и, соответственно, к общим формулам A.16), A.17). Единица измерения потенциала или разности потенциалов, которая назы- называется напряжением, — 1 вольт: 1 В = 1 Дж/1 Кл. В задачах электростатики мы имеем дело исключительно с покоящимися зарядами, находящимися в равновесии. Из курса механики нам известно, что такое состояние обусловлено либо минимумом потенциальной энергии, ли- либо условием U = const. Представим себе проводник в электрическом поле. Поскольку заряды по нему могут течь свободно (это и есть главное свой- свойство проводящего тела), а должны находиться в равновесии, статическая ситуация отвечает условию (р = const, т. е. проводник должен быть экви- эквипотенциален. Это позволяет ввести специфичное для проводников понятие емкости. Представим себе уединенный полый металлический шар, обстреливаемый пучком заряженных частиц. Если энергия частиц Т, то они могут преодолеть разность потенциалов не превышающую Т/е, а значит, оседать на шаре ча- частицы будут лишь до тех пор, пока на нем не соберется заряд Q = AttsqRT/'е, где R — радиус шара. Зависимость Q ос R- (рт^ дает основание говорить о радиусе как мере электрической емкости шара. То же примерно можно ска- сказать и об уединенном проводящем теле произвольной геометрии: величина С = Q/tp есть инвариант относительно величины заряда либо потенциала и характеризует тело как таковое. Ее называют емкостью. Проводником тело должно быть для того, чтобы мы вообще могли приписать ему опре- определенный потенциал и пренебречь перепадом потенциала от точки к точке. Единица емкости называется фарадой; 1 Ф = 1 Кл/1 В. Такой емкостью обладает, например, проводящий шар радиуса 9 • 106 км. Для практических нужд используются микрофарады A0~6 Ф) и пикофарады A0~12 Ф.) Можно ввести в рассмотрение и взаимную емкость двух проводников (та- (такую систему обычно называют конденсатором, а проводники — его обклад- обкладками). Она измеряется в тех же единицах, а определяется следующим обра- образом: если система в целом нейтральна, а заряды обкладок равны =р Q-> и ПРИ этом потенциалы обкладок равны cpi и <^2, то емкость конденсатора Си = \Q\/\<pi - ч>2\- В отличие от емкости уединенного проводника, это величина не универсаль- универсальная, она, вообще говоря, зависит от формы, расположения и зарядов всех
170 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ окружающих тел. Но в двух случаях эта характеристика однозначна: а) один проводник заключен внутри другого, и задача обладает достаточно высокой симметрией; б) размеры обкладок велики в сравнении с расстоянием между ними и малы в сравнении с расстояниями до всех прочих тел. Пример 1. Сферический конденсатор с радиусами обкладок R\ и i?2- Из теоремы Гаусса и симметрии задачи следует, что поле внутри меньшего шара и вне большего равно нулю, а в зазоре эквивалентно полю точечного заряда Q; таким образом, откуда следует Пример 2. Плоский конденсатор, площадь обкладок S, зазор d. Этот пример по существу уже рассмотрен (см. рис. 1.2 а). А(р = ad/so; Q = aS, откуда С = ?oS/d. (Следует иметь в виду, что поля двух заряженных плос- плоскостей дадут в сумме нуль вне конденсатора и удвоят перепад потенциала, в сравнении с одной заряженной плоскостью, внутри него). 1.5. Уравнения Лапласа и Пуассона Из определений A.15)—A.17) следует, что при малом перемещении точки наблюдения в пространстве dip = — Е • dl, т. е. электрическое поле можно трактовать как вектор, ориентированный в направлении наиболее быстрого спада потенциала и равный dcp/dl в этом направлении. Для такой связи ме- между векторной и скалярной функцией существует специальная операция — градиент (мы уже ввели это понятие в гл. 5 курса механики). Градиент есть результат прямого применения уже известного нам векторного оператора «набла» к скалярной функции: Vip = ехд(р/дх + еуд(р/ду + ezd(p/dz. Вектор \7(р показывает направление максимального роста скалярной функ- функции. Электрическое поле направлено в обратную сторону: Е = -V<p. A.18) Подставим A.18) в дифференциальную форму теоремы Гаусса A.14). Лю- Любопытно отметить, что с операторами векторного дифференцирования при этом можно обходиться, как с обычными векторами: v • \/ср = d2ip/dx2 + d2ip/dy2 + d2ip/dz2 = v V Оператор V2 называется оператором Лапласа. Итак, мы видим, что урав- уравнение A.14) может быть представлено в скалярном виде, правда, порядок его при этом повышается до второго: VV = -р/ео. A.19) Оно называется уравнением Пуассона. В принципе, его можно точно решить при любом заданном распределении р(т). Если же мы ищем поле в свободном
1.6. ЭЛЕКТРИЧЕСКИЙ ДИПОЛЬ 171 пространстве, то его следует описывать уравнением VV = 0. A.20) Это уравнение Лапласа, относящееся к числу основных уравнений матема- математической физики. Конечно, помимо самих уравнений, принципиально важны также и граничные условия — зачастую в них-то и заключена физическая постановка задачи. Наиболее очевидным оказывается граничное условие на поверхности про- проводника. В статической задаче ток в проводнике течь не может, значит весь проводник должен находиться при одном и том же потенциале. То же можно сказать и о его поверхности — на ней (р = const. Такие поверхности в общей картине поля называются эквипотенциальными. Гра- Градиент потенциала, как направление самого быстрого изменения функции, должен быть к ним ортогонален. Следовательно, электрическое поле в статической за- задаче должно быть перпендикулярно к поверхности про- проводника, а внутри него — равно нулю. Действительно, V const = 0. Легко сообразить, что, нарушив любое из этих условий, мы тем самым спровоцировали бы ток в проводнике. Выведем в рамках электростатики граничное условие на произвольной границе раздела (пока это будет относиться исключительно к полю в ваку- вакууме). Из механики нам известно, что в случае консервативных сил, когда можно ввести потенциальную энергию, работа по перемещению тела по лю- любому замкнутому контуру равна нулю. Мы, по существу, доказали, что из закона Кулона и принципа суперпозиции полей следует потенциальность статического электрического поля, в частности, E-dl = 0. A.21) Пусть дана некоторая поверхность 5, разграничивающая области прост- пространства А и Б (рис. 1.3). Построим контур L, как это показано на рисунке, а затем начнем стягивать с двух сторон, устремляя к нулю сторону, пер- перпендикулярную поверхности S. Как следствие, формула A.21) перейдет в условие непрерывности на границе тангенциальной компоненты поля: АЕТ = (ЕТ)Б - (ЕТ)А = 0. A.22) 1.6. Электрический диполь Самое простое определение электрического диполя — пара зарядов +q и —(/, на расстоянии / друг от друга (рис. 1.4 а); при этом величина р = q • 1 называется вектором дипольного момента. Мы не ограничимся таким опре- определением — как будет ясно из дальнейшего, физический смысл электриче- электрического диполя и дипольного момента оказывается более понятен, если мы несколько обобщим наше определение. Пусть дана некоторая система зарядов gi, (/2? • • • Чт расположенных в точ- точках Г]_, Г2, ... гп. Достаточно очевидно, что на расстояниях, больших в срав- сравнении с характерным расстоянием между зарядами, ее можно рассматривать
172 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ как точечный заряд: Е ~ (Q/r3)r; Что же определяет поле системы зарядов, если ^2Яг = О? Или, для ненуле- ъ вого полного заряда, как ввести поправки, учитывающие конечный размер системы? Следующим приближением по отношению характерной величины \vi — Tj\ к расстоянию до точки наблю- 3 / дения и будет так называемое дипольное 2* •* / приближение. Определим дипольный q *J^^t .л р / момент произвольной системы зарядов <~^ / / следующим образом: А //* -1 Ь ! гр* 1 Если зарядов всего два, и притом рав- Ч_/' ных по величине и отличных по знаку, рис -^ ^ старое определение остается в силе — просто как следствие A.23). Но опреде- определение A.23) является существенно более общим, поскольку вводится для произвольной системы зарядов. Важно отметить, что формула A.23) инва- инвариантна относительно переноса начала координат, если полный заряд систе- системы равен нулю. Это нетрудно показать с помощью рис. 1.4 б. Можно видеть, что при переносе начала отсчета из точки О в точку О' имеем г[ = r^ + R, откуда следует г При нулевой сумме зарядов дипольный момент и в самом деле оказыва- оказывается инвариантом. И если мы хотим определить поле нейтральной в целом системы заряженных частиц (например, поле заряженного плоского конден- конденсатора) , то именно дипольный момент системы оказывается принципиально важным. Вычислим поле системы зарядов в точке А, удаленной в сравнении с ха- характерным пространственным масштабом системы (рис. 1.4 в). Начнем с потенциала, ограничившись первым членом разложения в ряд Тэйлора: /(R + SB) ~ /(R) + ёх ¦ df/dx + ёу ¦ df/dy + ... = /(R) + SB ¦ V/. Воспользовавшись тем, что Т{ ^С R (см. рис. 1.4 в), получаем Таким образом, у нейтральной системы с ненулевым дипольным моментом ос R~2. Теперь можно вычислить и поле: 1 / (pR) R p\ 3(pR)R-i?2p I3 ~^- • R ~ R =
ЗАДАЧИ 173 т. е. при нулевом полном заряде Е ос i?~3. При этом, в отличие от точечного заряда, поле зависит от угла. На примере A.24), A.25) можно убедиться, что зачастую полезно потратить время на подготовку корректных определений и затем использовать адекватный математический аппарат, если это позво- позволяет избежать громоздких вычислений. Любая из этих формул, выведенная «в лоб», потребовала бы много больше работы. Далее, если мы будем говорить о точечном диполе, понимать это надо как нейтральную зарядовую систему, поле которой рассматривается на столь больших расстояниях, что справедливы соотношения A.24), A.25). И если для представлений об элементарном магнитном диполе современная физика дает некоторые основания, то в данном случае таковые отсутствуют: на се- сегодняшний день у элементарных частиц электрические дипольные моменты не обнаружены. Вычислим в дипольном приближении энергию системы зарядов во внеш- внешнем поле: U = Y^qMK + т{) = ?>(R) ^ft + Z)*r* * V^ = Q ' ?>(R) - (P E)« A-26) Из A.26) следует, что сила, действующая на точечный диполь в электриче- электрическом поле, может быть представлена в виде Р = V(pE). A.27) Можно также показать (предоставляем это читателю в качестве упраж- упражнения), что момент, действующий на дипольную систему во внешнем поле, равен М = [рЕ]. A.28) Задачи 1. В пространстве между пластинами плоского конденсатора имеется свободный по- поток электронов, который создает равномерный объемный заряд. Расстояние между пла- пластинами равно с/, потенциал одной из пластин равен ipo. При каком значении объемной плотности заряда р потенциал и напряженность поля у другой пластины равны нулю? Решение. Введем ось Ох, как показано на рис. 1.5, и воспользуемся теоремой Гаусса в форме A.14). В нашей одномерной задаче Е || Ох, следователь- следовательно, divE = дЕ/дх. Таким образом, дЕ/дх = р/ео, откуда Е = const + рх/ео. Поскольку E(d) = 0, const = —pd/so, т. е. Е = р{х — d)/so. Далее, } d2 (p(x) = (fo- Edx; ip(d) = (fo + 7— = 0; J ??0 ¦2 P = — о Фо d2 ' 0 ^Г=о Фо-г- 2. Определить силу взаимодействия между точечным зарядом | q и заземленным металлическим шаром. Радиус шара R, рассто- ~ ~ яние между зарядом q и центром шара равно d. .тис. 1.0 Эту задачу удобно решать методом изобраэюений. Если в электрическом поле заменить любую эквипотенциальную поверхность проводником той же формы и создать на нем по- потенциал, равный потенциалу той же поверхности, поле не изменится. Можно действовать и наоборот. Оба приема базируются на теореме однозначности: поле системы проводников
174 ГЛ. 1. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВАКУУМЕ и/или распределение зарядов на их поверхности полностью определены, если: а) известен потенциал каждого проводника либо б) задан общий заряд каждого проводника. Решение. Предположим, что мы можем реализовать нужную конфигурацию полей вне шара, заменив последний точечным зарядом Q, расположенным на линии «заряд q — центр шара» (учитывается осевая симметрия задачи) и сдвинутым на некоторое расстояние а от центра (рис. 1.6 а). Если такая модель адекватна, то ср = 0 на поверхности сферы, в частности, в точках ее, ближай- ближайшей и удаленнейшей относительно заряда q: ip(d — R) = = (p(d + R) = 0, или, подробнее, q/(d-R) + Q/(R-a) = 0; R ах Рис. 1.6 откуда следует а = R2 /d, Q = —qR/d. Докажем, что при такой замене потенциал на всей сфере обратится в нуль. Воспользуемся осевой симме- симметрией (рис. 1.6 б) и получим уравнение геометрическо- го места точек в произвольном сечении, для которых Подставим сюда уже вычисленные Qua: R2/d2 1 (x-R2/dJ+y2 (d-xJ + y2' откуда в два действия следует х2 + у2 = R2. Наше утверждение доказано, так что и окончательный ответ для силы получить нетрудно: F = q\Q\ q2Rd 47vso(d-a) -R2J' 3. Найти силу взаимодействия двух точечных диполей, если их ди- польные моменты pi и р2 направлены вдоль соединяющей их прямой, а расстояние между диполями равно d. Ответ: Fi2 = — F21 = 3pi • р2/Bтг?о^4)- Сонаправленные диполи при- Рис. 1.7 тягиваются, антипараллельные — отталкиваются. 4. Найти электрическое поле Е в шаровой полости однородно заря- заряженного шара (рис. 1.7). Объемная плотность заряда равна р. Расстояние между центром полости и центром шара равно /. Ответ: поле в полости однородно; Е = (Зео)~1р1.
ГЛАВА 2 ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ 2.1. Проводники в электрическом поле Мы уже касались вопроса о проводящем теле в постоянном электрическом поле в гл. 1; а именно, было установлено, что внутри проводника электриче- электрическое поле должно быть равно нулю, соответственно, на границе равна нулю его тангенциальная компонента — условие A.22). Тогда, окружив некото- некоторый участок границы цилиндрической поверхностью, подобно тому, как это сделано на рис. 1.2 а, и устремляя высоту цилиндра к нулю, мы придем к выводу, что на поверхности должен быть сосредоточен некоторый электри- электрический заряд. Теорема Гаусса A.10) дает нам непосредственно поверхност- поверхностную плотность этого заряда: а = dq/dS = Еп • е0, где Еп — нормальная к границе проводника компонента поля. Можно по- посмотреть на ту же ситуацию и по-другому. Пусть в некоторой области про- пространства внешними источниками задано ненулевое поле. Внесем туда элек- электрически нейтральное проводящее тело. Теперь поле внутри него обраща- обращается в нуль. В силу принципа суперпозиции, это означает, что собственное поле, созданное зарядами на поверхности проводника, везде должно быть равно по величине и противоположно по направлению внешнему полю. То, что заряды перераспределяются исключительно по поверхности, следует из уравнения A.14). Действительно, если Е = 0, то и р = 0. Поскольку тело остается нейтральным как целое, поле поверхностных зарядов имеет харак- характер дипольного (или даже включает следующие по порядку величины по- поправки, которых мы в нашем курсе не касались). Подчеркнем еще раз, что, вследствие равенства нулю поля внутри проводника, последний в рамках электростатики остается эквипотенциальным (что, в частности, использу- используется в упомянутом выше методе изображений). Поскольку читателю уже известно даже из школьного курса, что элек- электрический заряд любого тела есть не что иное, как несбалансированность концентрации электронов и ионов в веществе, представляется естествен- естественным следующий вопрос. В реальном теле, в отличие от его математической идеализации, возмущение заряда не может представлять собой поверхность нулевой толщины; как же в таком случае обеспечить нулевое поле всюду внутри проводника? Дело в том, что в наших аргументах мы молчаливо апеллировали к закону Ома — в его качественной форме: ненулевое по- поле в проводящей среде порождает ток. Но такой простой подход годится лишь в случае нейтральной среды, а как раз в поверхностном слое, где нейтральность существенно нарушена, движение заряженных частиц под- подчиняется более сложным зависимостям, нежели закон Ома. И конечно, в действительности электрическое поле меняется в некотором тонком слое у
176 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ поверхности от нуля до некоторого пограничного значения. Детальное рас- рассмотрение проблемы выходит за рамки настоящей книги, так что мы в этом случае лишь отметим нетривиальность данного вопроса. Если проводник не нейтрален, т. е. несет на себе некоторый заряд, то, опираясь по-прежнему на принцип суперпозиции, можно представить себе, что в этом случае на поле внешних источников накладываются поле по- поляризации проводника и поле его собственного заряда. Поляризационный и собственный заряды распределены по поверхности таким образом, чтобы внутри проводника поле оставалось нулевым. Условие Е = 0 внутри про- проводника и соображения о его эквипотенциальности остаются в силе. И последнее — по порядку, но не по значению. Во всех рассуждениях отно- относительно поля в проводящей среде, включая уравнение A.22) и условие ну- нулевого поля и заряда внутри проводника, мы неявно имели в виду некоторое усреднение по пространству и/или по времени. В самом деле, внутри атома электрические поля составляющих его частиц при заряде порядка заряда электрона и пространственном масштабе порядка 10~ м равны по порядку величины 10 В/м. В межатомном пространстве поля слабее, ибо атомы в целом нейтральны, но, скажем, в твердом теле порядок величины сохраня- сохраняется; в металлах или ионных кристаллах сделанная выше оценка вполне корректна. Поэтому, говоря о среде как непрерывной субстанции или о поле в среде, которое должно фигурировать в уравнениях электростатики, мы тем самым подразумеваем усредненную картину, в которой структура вещества остается за рамками нашего расссмотрения. В отношении поля в диэлектри- диэлектриках это приближение будет использовано с большей определенностью. 2.2. Поляризация диэлектриков. Понятие электрической индукции Из опыта хорошо известно, что любое вещество, если его внести в электри- электрическое поле, проявляет ответную реакцию на такое воздействие. Даже в тех случаях, когда в стандартных задачах этим взаимодействием традиционно пренебрегают — например, когда в поле находится воздух в нормальных условиях, — речь идет лишь о чисто количественной малости взаимодей- взаимодействия, но не об его отсуствии. Равным образом можно утверждать, что не существует веществ, абсолютно не проводящих. Выделение диэлектриков в отдельный класс (а тем более — выделение в этом классе подкласса полу- полупроводников) базируется на опыте и подкрепляется определенными количе- количественными аргументами. Например, обыкновенная вода Н2О в зависимости от параметров задачи, отнюдь не меняя физико-химических свойств, может вести себя как проводящая среда или использоваться в качестве диэлек- диэлектрика. Микроскопическое рассмотрение (см. гл. 5 нашего учебника) внесет в эту классификацию большую определенность. Нам же сейчас, имея дело с диэлектриками в электростатике, важно будет лишь следующее условие: рассматривается простейший случай взаимодействия с полем веществ, про- проводимостью которых мы можем пренебречь и тем самым считать поле в среде ненулевым. Элементарный школьный рецепт хорошо известен: при данном распреде- распределении свободных зарядов разделить силы, поля, потенциалы и т. д. на по- постоянную величину ?, характеризующую данное вещество. Как мы скоро убедимся, рецепт этот не случаен, более того, во многих случаях, важных
2.2. ПОЛЯРИЗАЦИЯ ДИЭЛЕКТРИКОВ. ПОНЯТИЕ ЭЛЕКТРИЧЕСКОЙ ИНДУКЦИИ 177 с точки зрения технических приложений, например в конденсаторах и вол- волноводах, он работает достаточно хорошо. Но с точки зрения физики, та- такой метод, как правило, некорректен. Попробуем разобраться в простейшей электродинамике диэлектриков, исходя из фундаментальных принципов. Для последующих обобщений уравнений электрического поля в вакууме полезно будет ввести новую физическую величину. Определим вектор элек- электрической индукции в вакууме, отличающийся от поля лишь коэффици- коэффициентом: D = 60-E, B.1) так что, например, теорема Гаусса, вместо выражений A.10), A.14), может быть представлена в виде: ^ , B.2) B.3) Пока и поскольку мы рассматриваем поле в вакууме, физический смысл величин Е и D остается тождественным. Пусть теперь предметом рассмотрения будет электрическое поле в диэлек- диэлектрической среде. Представим себе реакцию среды. Если даже ее проводи- проводимость пренебрежимо мала, это не означает запрета на смещение во внешнем поле заряженных частиц относительно их равновесного положения в ней- нейтральном атоме либо кристалле. Результатом смещения окажется некоторое ослабление внешнего поля, как говорят, экранирование. Сама же реакция среды — поляризация — может быть представлена распределенным в среде электрическим дипольным моментом. При не слишком больших напряжен- ностях поля в веществе естественно ожидать, что дипольный момент и поле будут связаны линейной зависимостью (да и более сложную функциональ- функциональную связь можно в слабых полях приближенно представить первым членом ряда Тэйлора). Поскольку обе величины являются векторными, естественно ожидать, что эти векторы будут параллельны. Итак, предлагается следую- следующее соотношение между полем Е и плотностью дипольного момента Р: Р = dp/dF = C • ?0Е. B.4) Величина ?q выделена в коэффициенте особо для удобства последующих вычислений; под Е понимается действующее поле в среде — только его и могут воспринимать заряженные частицы. Сделаем два важных замечания. Во-первых, сколь ни естественны наши предположения при введении зависимости B.4), нельзя исключить и обрат- обратных предположений — скажем, в сильных полях связь может оказаться существенно нелинейной. Поэтому физик следом за любыми умозритель- умозрительными предположениями обязан обращаться к опыту, чтобы подтвердить их либо отвергнуть. В нашем случае совокупность экспериментальных данных говорит о том, что, хотя соотношение B.4) и не универсально, оно очень хо- хорошо работает в широком диапазоне параметров. Поэтому для того, чтобы разобраться в физике дела, мы вполне можем пользоваться такой моделью. Можно в принципе обобщить ее на случай анизотропного кристалла — тогда скалярную линейную связь придется заменить тензорной — но лучше все- таки для понимания принципиальных моментов в физике не перегружать модель необязательными обобщениями.
178 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ Во-вторых, опрерируя понятием поля в веществе, мы абстрагируемся от очень сильных, но короткодействующих микроскопических полей в атоме или кристаллической решетке. Подразумевается усреднение в пространстве и/или во времени с таким пространственным и временным масштабом, что микроскопические эффекты из нашего поля зрения исчезают и остается лишь умеренной напряженности электрическое поле, которое может быть измерено на макромасштабе и макроскопическим регистрирующим прибором. При этом диэлектрик + а рассматривается просто как сплошная среда. Рассмотрим две модельных задачи, геометрия ко- которых представлена на рис. 2.1 а; б. Прежде всего, пусть имеется малый параллелепипед, мысленно выделенный в объеме однородно поляризованного диэлектрика, так что вектор плотности дипольно- го момента Р (его называют также вектором по- x-dx х x + dx ляризации) параллелен оси х. Пусть стороны па- рис 2 1 раллелепипеда соответственно равны Дж, Ду, Az. Тогда полный его дипольный момент равен рх = = Рх AxAyAz. С другой стороны, нетрудно сообразить, что при однород- однородной поляризации — смещении всех отрицательных зарядов относительно всех положительных — плотность заряда в объеме тела остается невозму- невозмущенной и лишь на торцевых гранях появляются поверхностные заряды =рах. Из определения дипольного момента A.23) следует б Рх(х) Px(x X Сравнивая оба результата, получаем Рх = <тж, или в общем случае границы поляризованного диэлектрика — скачок поляризации А(Р)п = <т, B.5) где индекс п означает компоненту, нормальную к поверхности разрыва. В случае неоднородной поляризации в объеме может возникнуть и не- ненулевое возмущение заряда. Такой заряд принято называть связанным, в отличие от свободных зарядов, с которыми мы до сих пор имели дело. Свя- Связанный заряд не может быть ни создан внешним источником, ни снят с тела, поскольку это лишь определенное состояние среды, обусловленное воздей- воздействием электрического поля и оставляющее тело электрически нейтраль- нейтральным. Смоделируем неоднородную поляризацию среды, соединив торцами два малых параллелепипеда, как показано на рис. 2.1 б. В соответствии с B.5) на первом стыке возникает заряд dq = dydz • Аах ~ — dxdy dz(dPx/dx). Относя эту величину к объему элементарного параллелепипеда, получаем ответ уже в достаточно универсальном виде плотности заряда: Рсвяз = -{дРх/дх). Аналогичные ответы последуют при неоднородности поляризации в напра- направлениях у и z. В общем же случае мы должны будем взять их сумму: Рсвяз = - [(дРх/дх) + (дРу/ду) + (dPz/dz)] = -divP. B.6)
2.2. ПОЛЯРИЗАЦИЯ ДИЭЛЕКТРИКОВ. ПОНЯТИЕ ЭЛЕКТРИЧЕСКОЙ ИНДУКЦИИ 179 Этот результат позволит нам получить достаточно общее уравнение для поля в диэлектрике. Обратимся к уравнению A.14) и подставим в правую часть его плотность всех зарядов, как свободных, так и связанных: ?0 divE = рсво6 + рсвяз = р - divP. B.7) Мы сохранили обозначение р за плотностью свободных зарядов. Введем по- понятие индукции электрического поля в случае диэлектрической среды, по отношению к которому данное выше определение B.1) окажется естествен- естественным для вакуумного поля частным случаем: D = ?0E + P. B.8) Сравнивая B.7) и B.8), нетрудно убедиться, что электрическая индукция D по-прежнему удовлетворяет уравнениям B.2), B.3). Зависимость, связыва- связывающая D и Е, не столь универсальна; более того, она зависит еще и от того приближения, в котором мы описываем диэлектрическую среду. В случае простой модели B.4) получаем B.9) Величина /3 называется поляризуемостью среды, а е = 1 + /3 — диэлек- диэлектрической проницаемостью. Таким образом, если среда однородна, то, дей- действительно, поле в сравнении с вакуумной ситуацией просто ослабляется в е раз. В частности, закон Кулона может быть переписан в виде F = Рассмотрим конденсатор, емкость которого в отсутствие диэлектрического заполнения — Cq. Заполним пространство между обкладками диэлектриком с постоянной е. Если при этом конденсатор был отключен от источника, должны сохра- сохраниться заряды на обкладках =fQ. Тем самым при заданном распределении свободных зарядов сохраняется величина индукции; поле же падает в е раз. Исходя из соотношений U = Щ/е = Q/C, получаем С = е • Cq. Если конденсатор был подключен к источнику, то инвариантным остает- остается напряжение на обкладках, а значит и электрическое поле в конденсато- конденсаторе. Следовательно, индукция обязана возрасти в е раз, а с ней, в согласии с B.2), B.3), и заряды на обкладках. В итоге снова приходим к тому же ответу — он вообще оказывается универсальным: С = ?-Со. B.10) Базируясь на подобных тривиальных примерах, авторы некоторых публи- публикаций позволяют себе смелые заявления: «Электрическая индукция — с точностью до коэффициента — есть поле свободных зарядов, без учета поляризации среды». «Индукция и поле связаны между собой коэффициентом диэлектрической проницаемости вещества». Оба эти утверждения в общем случае неверны. И дело не только в том, что связь между Р и Е может не быть линейной. Переход от поля свободных, т. е. заданных извне зарядов к истинному полю не есть результат простого
180 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ суммирования внешнего воздействия и отклика, но еще и переход от точно- точного к некоторому усредненному описанию. Как мы увидим далее на примере сегнетоэлектриков, пространственное распределение D и Е может быть во- вообще существенно различным и притом в отсутствие свободных зарядов. Бо- Более того, эти два вектора могут оказаться противоположны по направлению. Формально это получается из того, что совпадение уравнений индукции и поля в пустоте еще не означает совпадения решений, ибо решать их следует при разных граничных условиях. 2.3. Граничные условия в электростатике Располагая в качестве рабочего инструмента теоремой Гаусса в диффе- дифференциальной форме или уравнением Пуассона, мы, казалось бы, можем в приближении сплошной среды решить любую электростатическую задачу, т. е. задать заряды или потенциалы системы физических тел и найти поле во всем пространстве. Первое препятствие к тому — проблема состояния вещества в электрическом поле. Мы ее предельно упростили, полагая веще- вещество либо идеально проводящим, либо идеальным диэлектриком, свойства которого сведены к одной-единственной константе. Но остается еще пробле- проблема границы вещества с вакуумом или двух веществ. Нам придется считать такие границы идеально гладкими и вдобавок предположить, что свойства среды, такие, как проводимость и диэлектрическая проницаемость, меняют- меняются на границе скачком. (Иногда адекватность таких приближений предста- представляет собой проблему более сложную, нежели собственно решение задачи). Для статического электрического поля всегда остается в силе условие потенциальности & Edl = 0. B.11) Рис. 2.2 пределу dz Именно это условие позволяет представить электри- электрическое поле в виде градиента скалярной функции. Оно выполняется для поля любого неподвижного электри- электрического заряда. Конструируя поле, взаимодействующее с веществом, т. е. учитывая поляризационные эффекты, мы ничего в этом смысле не меняем. Сколько и какие бы мы ни взяли заряды, суммарное поле обязано удо- удовлетворять уравнению B.11). Обратимся к рис. 2.2 а. Пусть А — идеальная граница двух сред. Построим на двух касательных и двух нор- нормалях к этой границе некоторый малый контур, как по- показано на рисунке, а затем перейдем для его высоты к 0, оставляя при этом длину d/ малой, но ненулевой, и следя за тем, чтобы верхняя и нижняя стороны контура оставались в разных средах. В результате B.11) вырождается в соотношение Е// dl - Е/ dl = 0, т. е. в условие сохранения проекции поля Е на направление касательной. Последнее выбиралось произвольно; повторив это дважды для двух орто-
2.3. ГРАНИЧНЫЕ УСЛОВИЯ В ЭЛЕКТРОСТАТИКЕ 181 тональных направлений в касательной плоскости, приходим к выводу о со- сохранении проекции поля Е на касательную плоскость: Е/т = Е//т. B.12) Еще одно граничное условие последует из уравнения B.2). Построим на границе сред I и II малый цилиндр с образующей, параллельной нормали, и основаниями d*S, параллельными касательной плоскости и располагаю- располагающимися в разных средах, как показано на рис. 2.2 б. Устремим высоту ци- цилиндра dz к нулю, сохраняя площадь оснований малой, но ненулевой. Если на поверхности А нет поверхностного заряда, B.2) вырождается в условие непрерывности на границе нормальной компоненты вектора индукции: D/n = D//n. B.13) Вообще говоря, даже элементарных сведений о строении вещества и элек- электронной природе электрического заряда достаточно, чтобы утверждать, что в строгом смысле поверхностного заряда не бывает. Невозможно конечный заряд поместить на листок нулевой толщины. Но в строгом смысле не быва- бывает и идеального скачка на границе, так что мы должны различать реальную физику и ее математическую модель. Например, корректно описать провод- проводник в электрическом поле можно лишь привлекая понятие поверхностного заряда или входя в такие детали физики пограничного слоя, которые не- неоправданно усложняют задачу. Иногда, к тому же, необходимая нам точ- точность решения допускает такое упрощение, как «стягивание» заряженного слоя конечной толщины в бесконечно тонкий листок. Итак, пусть на по- поверхности А располагается некоторый заряд с поверхностной плотностью а. Тогда B.2) можно переписать в виде T>IIndS-T>IndS = adS, и окончательно, вместо B.13), получаем D/n-D//n = <7. B.14) Таким образом, действительно, в отличие от тривиального вакуумного случая, граничные условия для поля и индукции не совпадают, так что утверждение, будто индукция — это просто вакуумное поле свободных за- зарядов, некорректно. Условия B.12), B.13) подсказывают и способы измерения поля в веще- веществе. Представим себе, что мы вырезали в образце вещества очень тонкую щель достаточно большого сечения, перпендикулярную силовым линиям, и вводим туда зонд, способный измерить в ней электрическое поле. Тогда, в силу B.13), индукция в такой щели будет равна индукции в веществе, но внутри щели она с точностью до коэффициента ?q как раз и равна изме- измеренному полю. Если бы мы вырезали щель не перпендикулярно, а парал- параллельно силовым линиям, то, согласно B.12), измеренное в ней поле было бы равно полю в веществе. Не столь нагляден ответ в случае, например, анизотропного кристалла, когда направления Е и D, вообще говоря, не со- совпадают. Забегая вперед, отметим, что область применимости полученных гранич- граничных условий не ограничивается электростатикой, более того, они оказыва- оказываются совершенно универсальными.
182 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ 2.4. Диэлектрики с квазиупругими и жесткими диполями Говоря о поляризации среды, мы до настоящего времени ограничивались моделью самого общего вида, полагая наиболее естественной реакцией ди- диэлектрика на внешнее электрическое поле переход в состояние с ненулевым дипольным моментом — см. формулы B.4), B.8). Детально разобраться в механизме явления мы могли бы лишь на микроскопическом уровне, но не- некоторое разъяснение, по крайней мере для изотропных (жидких или газо- газообразных) диэлектриков, можно дать и в рамках настоящего курса. Поляризация изотропного диэлектрика может быть обусловлена одним из двух возможных механизмов (или двумя одновременно). Это, во-первых, приобретение дипольного момента нейтральной «квазиупругой» молекулой во внешнем поле и, во-вторых, ориентация во внешнем поле молекул с не- ненулевыми собственными дипольными моментами. Нейтральная молекула называется квазиупругой, если в достаточно сла- слабом поле ее дипольный момент рМол пропорционален приложенному полю: Р = прМол = п(Змол • Е. B.15) Здесь п — концентрация молекул, (Змол — коэффициент поляризуемости молекулы. Эта зависимость и в самом деле выглядит так, как если бы по- положительный и отрицательный заряды были связаны пружинкой, которая растягивалась бы пропорционально приложенной силе. Здесь полезно будет следующее замечание. Существует теорема (ее называют теоремой Ирншоу), которая утверждает: механическая система не может находиться в равно- равновесии под действием одних только электростатических сил. Она исключает как возможность существования статического атома, так и подобную «пру- «пружинку» чисто электростатической природы. На самом деле атом — отнюдь не статическая, но динамическая система, поведение которой описывается законами квантовой механики, но для многих веществ с достаточно симме- симметричными неполярными молекулами — N2, H2, СО2, СЕЦ, ССЦ — прибли- приближение B.15) оказывается вполне адекватным. Пусть к — упругость моле- молекулярной «пружинки»: к6\ = еЕ^ рмол = (е2/А:)Е, (мы предположили, что сила, растягивающая «пружинку», действует на элементарный электрический заряд). Окончательно, /Змол = е2А; /3 = пе2/ке0. B.16) Отсюда сразу следует, в частности, известное соотношение для диэлек- диэлектрической проницаемости воздуха в зависимости от давления: где кв — постоянная Больцмана, V = пквТ. Однако далеко не для всех диэлектриков применимо представление о ква- квазиупругих диполях. Многие из них, например Н2О, NH3, H2S, SO2, состоят из молекул, имеющих и в отсутствие поля отличный от нуля дипольный момент, причем заметно превосходящий поправки, связанные с упругими свойствами молекул. Разумеется, в нулевом поле эти «жесткие» диполи ориентированы хаотически вследствие теплового движения молекул. При наложении внешнего поля диполи стремятся «выстроиться», а тепловое дви- движение этому препятствует. Можно ожидать, что чем выше температура, тем
2.5. ПЬЕЗОЭЛЕКТРИКИ И СЕГНЕТОЭЛЕКТРИКИ 183 ниже будет поляризуемость среды. И действительно, для таких полярных диэлектриков в умеренных полях поляризуемость с хорошей точностью удо- удовлетворяет следующей зависимости от температуры: /?(х^ол/Г, B.17) где рмол — собственный дипольный момент молекулы. Эта зависимость мо- может быть с достаточной строгостью получена теоретически для жидких и газообразных диэлектриков методами молекулярной физики. Особого вни- внимания заслуживает сделанная выше оговорка относительно умеренных по- полей. Этот критерий не универсален; поле можно считать умеренным, если потенциальная энергия диполя, помещенного в такое поле, мала в сравнении с тепловой энергией молекулы. Привлекая для сравнения формулу A.26), получаем условие «умеренности» электрического поля для данного поляр- полярного диэлектрика: рмол-Е^квТ. B.18) Если же Е ^ квТ/рмол, результат окажется даже более очевиден, нежели формула B.17). В этом предельном случае молекулы просто выстроятся по полю, и полный дипольный момент единицы объема можно будет оценить следующим образом: Р-п-рмол; /Зое Я. B.19) В подобных случаях принято говорить об эффекте насыщения. Конечно, и в сильных полях — пока и поскольку не вступает в игру диссоциация моле- молекул — остается эффект квазиупругих диполей, но у полярных диэлектриков он относительно слаб. Для сравнения: е у различных масел (неполярных ди- диэлектриков) варьируется в пределах от 2 до 5, тогда как у воды — полярного диэлектрика — е = 81. 2.5. Пьезоэлектрики и сегнетоэлектрики Простые модели, описанные в предыдущем параграфе, по преимуществу применяются для описания диэлектрических свойств изотропных бесструк- бесструктурных веществ, т. е. жидкостей, газов, аморфных твердых тел (стекол). Гораздо сложнее обстоит дело с монокристаллами, хотя идея квазиупругого отклика на внешнее электрическое поле и здесь может быть работоспособна. Но, как и сам монокристалл, этот отклик является в принципе анизотроп- анизотропным, так что вместо константы вещества ?, приходится иметь дело с тензо- тензором диэлектрической проницаемости е^\ А = ?о Y1 ?^Ек, г = я, у, z. B.20) В случае поликристалла анизотропия естественным образом усредняется, и свойства вещества можно снова представить единственной константой. Мы, однако, в текущем параграфе будем говорить о других свойствах кристал- кристаллов, связанных не с откликом на внешнее электрическое поле, но с собствен- собственным дипольным моментом.
184 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ Остановимся вначале на пьезоэлектрическом эффекте, открытом фран- французским физиком Пьером Кюри. Классическим примером пьезоэлектри- пьезоэлектрического кристалла является кварц SiO2 в некоторых кристаллических мод ифик ациях. Суть эффекта заключается в том, что при деформации кристалла послед- последний приобретает электрический дипольный момент, который может быть зарегистрирован посредством электродов, прижатых к поверхности кристал- кристалла. Представляется достаточно очевидным, что пьезоэлектрический эффект должен быть свойством практически любого вещества с достаточно нетриви- нетривиальной кристаллической структурой. Под действием механического напря- напряжения происходит смещение ионов в кристалле и деформация электронных орбит, так что, вообще говоря, естественно ожидать ненулевого дипольного момента: Главным должен быть вопрос не о существовании эффекта как такового, но о его величине, о возможности его зарегистрировать при неразрушаю- щих напряжениях. Именно по этому принципу и определяются вещества, называемые пьезоэлектриками. Различают продольный эффект (самый простой), поперечный (вызванный пуассоновским поперечным откликом на продольную деформацию), изгиб- ный. Возможен и обратный пьезоэлектрический эффект — изменение фор- формы кристалла под действием внешнего электрического поля. Как прямой, так и обратный эффекты активно используются в технике, например, в зву- звукозаписывающих и звуковоспроизводящих устройствах. Сегнетоэлектрические вещества, в отличие от пьезоэлектриков, карди- кардинально отличаются от простейших моделей — квазиупругой и ориентаци- онной. Свое название они получили от сегнетовой соли ТЧаКСЦЩОб • 4Н2О, которая в интервале температур от —15 до +22,5 °С как раз и проявляет физические свойства, характерные для этого класса веществ. Эти основные свойства были с исчерпывающей полнотой исследованы советскими физика- физиками Курчатовым и Кобеко. Они в общем весьма напоминают постоянные маг- магниты, известные каждому из нас с детства (поэтому другое их название — ферроэлектрики). Но поле, обусловленное сегнетоэлектриком, — не магнит- магнитное, а электрическое поле.1) Диэлектрическая проницаемость сегнетоэлек- триков е очень велика — достигает значений в несколько тысяч (сегнетова соль — до 10 000, метатитанат бария — до 7000 и т. д.). Она не является константой вещества, но зависит от его предыстории, что выражается в так называемом эффекте гистерезиса (см. рис. 2.3). При увеличении поля Е от нуля индукция в первоначально неполяризованном диэлектрике возра- возрастает от нуля до некоторого состояния насыщения, в котором, как обычно, dD/dE c± ?q? (на рисунке масштаб ради наглядности искажен). При умень- уменьшении, а затем перемене знака электрического поля кривая D(E) отнюдь не следует по пути 1, но, минуя нулевую точку, образует замкнутую петлю ^ Существенно также и то обстоятельство, что ферроэлектрические свойства веществ обусловлены нетривиальной кристаллической структурой, тогда как ферромагнетизм — сугубо квантовый эффект выстраивания электронов. Но это различие на феноменологи- феноменологическом уровне, т. е. на языке усредненных полей, никак не проявляется.
D A/ / в 2.6. ЭНЕРГИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ В ВАКУУМЕ И В ВЕЩЕСТВЕ 185 между двумя состояниями насыщения (путь 2-3). Это и есть кривая гисте- гистерезиса. При нулевом внешнем поле индукция, вообще говоря, не нулевая. Поэтому, подобно постоянному магниту, образец из сегнетоэлектрика может проявлять свойства диполя и в отсутствие внешнего поля. Строго говоря, это свойство присуще более широкому классу веществ, именуемых пироэлектриками; сегнетоэлектрики выде- выделены среди них тем, что их дипольным моментом можно управлять посредством внешнего электрического поля. Рассмотрим образец простейшей формы — палочку из сегнетоэлектрика. В принципе, даже лучше подхо- подходят на роль постоянных диполей электреты — некото- некоторые органические смолы, которые, застывая в сильном р электрическом поле, сохраняют «замороженной» поля- и ризацию молекул. Такому состоянию соответствуют отличные от нуля как поле, так и индукция. Состояние вещества при этом не следует смешивать с откликом на внешнее поле; точки А и В на рис. 2.3 не отвечают случаю постоянного диполя. Обратимся к рис. 2.4. В пустоте силовые линии Е и D идентичны, поскольку сами эти величины отличаются всего лишь коэффициентом ?q. Но внутри образца пове- поведение их различно. Нормальная составляющая вектора D на торцах непрерывна, так что образуются замкнутые петли. В то же время поле Е должно удовлетворять усло- условию <f Е dl = 0 при интегрировании по любому замкну- замкнутому контуру; из этого соотношения и рис. 2.4 следует, гис. 2А что внутри образца векторы D и Е направлены противоположным образом. Если мы имеем дело с сегнетоэлектриком, постоянный электродиполь дол- должен попадать на рис. 2.3 в четные квадранты на кривой гистерезиса. Из этого примера можно видеть, сколь поверхностным является популяр- популярное утверждение, что индукция — поле свободных зарядов. В нашем слу- случае таковые вообще отсутствуют, но индукция нулю не равна. Связь ее с электрическим полем, как можно усмотреть из того же примера, вовсе не обязательно сводится к константе. Здесь, например, даже § D dl ф 0. С реальными палочками из сегнетоэлектрика либо электрета возникает проблема экранировки. В возухе или, скажем, в воде всегда есть свободные ионы, которые, оседая на полюсах образца, нейтрализуют торцевые заря- заряды диполя, и перед каким-либо использованием последнего его приходится специальным образом очищать. Мы лишены возможности в рамках курса электродинамики останавли- останавливаться более подробно на физике пьезо- либо сегнетоэлектриков, но как мы видим, они стоят упоминания даже в самом общем контексте, поскольку де- демонстрируют нетривиальность проблемы электрического поля в веществе. 2.6. Энергия электрического поля в вакууме и в веществе Понятие энергии поля в начальных курсах физики по традиции дается на излишне примитивном уровне, а в результате закон сохранения энер- энергии превращается в символ веры, что естественным наукам противопоказа- противопоказано. В действительности каждая новая область физики, каждый новый круг явлений в ходе исследования ставит этот вопрос заново. Мы ввели в курсе
186 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ механики потенциальную и кинетическую энергию и установили, что в иде- идеальной замкнутой механической системе сумма их есть инвариант или, как принято говорить, интеграл движения. Тогда же мы оговорили возможность перехода энергии в другие виды — это соответствует наиболее общему слу- случаю диссипативных систем. И, строго говоря, пока мы не расширяем самого понятия энергии, у нас не может быть оснований постулировать какой-то универсальный закон сохранения. Но такое расширение возможно произ- производить лишь шаг за шагом, по мере накопления новой экспериментальной информации. А значит, и закон сохранения энергии, если рассматривать его именно как физический закон, а не философский принцип, должен с разви- развитием физики постоянно проверяться и дополняться. До настоящего времени этот процесс проходил вполне успешно. Таким образом, корректная постановка вопроса об энергии электрическо- электрического поля должна быть такова: можно ли ввести такую физическую величину, которая в сумме с механической энергией была бы инвариантна, а в отсут- отсутствие электромагнитных проявлений исчезала бы, оставляя справедливым известный нам закон сохранения механической энергии? Реализацию этого принципа начнем с общеизвестного примера. Поставим мысленный эксперимент с плоским конденсатором, «раздвигая» его пласти- пластины от почти нулевого зазора до некоторой величины S. Пусть заряд каждой пластины =fQ, тогда поверхностная плотность заряда а = Q/S, а поле ка- каждой из пластин равно Е = a/Bso) = Q/BSsq). Движение пластин будем считать адиабатически медленным, чтобы можно было пренебречь их ки- кинетической энергией. Тогда работа, совершенная в ходе такого мысленного эксперимента, может трактоваться как энергия заряженного конденсатора: W = F • 6 = QE6 = Q26/BSe0) = Q2/BC). B.21) Ту же самую величину можно представить как CU2/2 или QU/2. Все эти формы эквивалентны. Обратим внимание на то, что в наших вычислениях мы умножали заряд пластины не на полное поле в зазоре, но лишь на по- поле другой пластины, ибо собственное поле каждой из них действует на ее разрыв, но никак не на смещение. Результат B.21) можно получить и по- другому. Представим себе конденсатор, изначально не заряженный, и на- начнем мысленно заряжать его, перенося заряд с одной пластины на другую малыми порциями dQ: 5A = dQ-U = Q dQ/C; => W = A = Q2/BC). Следующий шаг будет связан с попыткой переосмысления формулы B.21). Вводя объем конденсатора V = S • ?, ее можно переписать в виде W = С (Е6J/2 = A/2)е0Е2 • V. B.22) В этой форме энергия заряженного конденсатора представляется как энер- энергия электрического поля, заполняющего объем конденсатора. Можно попы- попытаться ввести плотность энергии электрического поля w = ?0Е2/2. B.23) Как мы вскоре убедимся, именно эта форма представления электрической энергии оказывается наиболее глубокой и содержательной. Вернемся к первичному представлению о точечных зарядах. Возьмем в качестве примера систему из двух точечных зарядов, пометив их индексами
2.6. ЭНЕРГИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ В ВАКУУМЕ И В ВЕЩЕСТВЕ 187 1 и 2. По смыслу введенного нами понятия потенциала мы можем рассма- рассматривать энергию взаимодействия как энергию заряда 1 в поле заряда 2 или, напротив, энергию заряда 2 в поле заряда 1: Запишем энергию взаимодействия в симметричной форме: W = (l/2)(qi<p{21)+q2<p{12)). B.24) Исходя из этого простого примера и принимая во внимание определение A.16), мы можем немедленно обобщить B.24) на произвольную систему то- точечных зарядов: w = - гфк Можно предложить и другое обобщение. Пусть электрический заряд рас- распределен в пространстве с некоторой плотностью р(т). Тогда, вместо B.24) и B.25), можем написать W = - / p(r)(p(r)dV. B.26) v Обратимся к уравнению Пуассона, записав его в виде Проинтегрируем по всему пространству любое из слагаемых левой части методом интегрирования по частям — и с учетом того, что на бесконечности потенциал и поле любой системы зарядов обращаются в нуль / (рф'х dx dy dz = / dy dzip -^- dx = — / ((p'xJ dx dy dz = — / E2X dV и т. д. Отсюда следует W = ! У р(гМг) dV=?^J{E2x + Щ + El) dF, B.27) V а это совершенный эквивалент формулы B.23), но получен он уже не в качестве догадки. Теперь мы можем считать задачу решенной. Мы пришли к выводу о том, что электрическая энергия есть энергия электрического поля, распределенная в пространстве с плотностью ?qE2/2. Отсюда, в частности, следуют три важных качественных следствия. 1. В соответствии со знаменитой эйнштейновской формулой W = тс2 электрическое поле имеет массу. 2. Энергия поля всегда положительна, безотносительно к знаку поля или создающих его зарядов. Второе утверждение требует небольшого комментария. Стандартная школь- школьная формула W = ^1^2/Dтг?о^12) учитывает лишь взаимодействие зарядов друг с другом, но не частей каждого из них между собой. Полное поле Е = Ei + Е2, соответственно, Е2 = Е\ + Е\ + 2(Ei • Е2). Таким образом полная энергия поля равна W = Wi + W2 + ?о /"(Ei ' Е2) dV.
188 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ Энергия взаимодействия представлена третьим членом этой суммы, знак которого и в самом деле не предопределен. 3. Энергия поля неаддитивна, иными словами, энергия суммы полей не равна сумме энергий. Таким образом, для электрической энергии не суще- существует принципа суперпозиции. Обращаясь к случаю поля в веществе, можно прежде всего сразу же на- написать ответ для простейшего случая линейной связи между полем и ин- индукцией. Опираясь на приведенные выше примеры с полем в конденсаторе, нетрудно убедиться в том, что результат B.21) остается в силе. Соответ- Соответственно, формула B.22) нуждается в минимальной модификации: W=?—^E2. B.28) В очень многих практически интересных случаях этой модификации, т. е. коэффициента ?, оказывается вполне достаточно. Соотношение B.28) мож- можно переписать также, используя в качестве параметра индукцию, которую в случае линейной связи как раз можно трактовать как поле свободных зарядов: D2 w = Но, как мы видели хотя бы на примере сегнетоэлектриков, физика поля в веществе случаем линейной связи отнюдь не исчерпывается. Более того, в общем случае и расширение понятия энергии, о котором говорилось в начале текущего параграфа, — задача не простая. В лучшем случае энергию можно представить в следующей форме: т. е. в виде суммы энергии вещества, энергии поля и энергии взаимодействия поля с веществом. Но даже и такое представление не всегда корректно, по- поэтому надо понимать, что наши простые и легко обозримые ответы все же представляют собой некоторые простые предельные случаи; в частности, подразумевается, что поле не слишком велико. Это вовсе не означает, что данный вопрос вообще не поддается исследованию. Просто в общем случае мы имели бы дело с серьезной физической задачей, включающей физику строения вещества на должном уровне. Попытаемся дать хотя бы минимальное обобщение формулы B.28). Умно- Умножим правую и левую части формулы B.3), понимаемой как уравнение для поля в веществе, на ср: р • if = if divD. Далее, воспользуемся следующей цепочкой тождественных преобразований: д д д + ^- + е3 — oy oz div {ip D) = ( ei — + e2 — + e3 — ) (<p Dxer + cp Dye2 + ip Dze3) = откуда следует (см. B.3)): p • <p = div (<pD) -DV(^ = div((^D) + (DE).
ЗАДАЧИ 189 Воспользуемся еще раз формулой B.26): W = ]- f pipdV = ]- f div((pT>)dV + ^- /"(DE)dV. Здесь первый интеграл можно преобразовать по теореме Гаусса в поток век- вектора ipT> через некоторую удаленную поверхность. Площадь этой поверх- поверхности ос i?2, тогда как подынтегральное выражение даже в случае неском- пенсированного заряда ос i?~3, так что при интегрировании по всему про- пространству мы можем пренебречь этим интегралом, а из второго интеграла немедленно следует искомое обобщение выражения для плотности энергии электрического поля i B.29) Задачи 1. Как изменится энергия заряженного конденсатора с вакуумным зазором, если запол- заполнить последний диэлектрической жидкостью с постоянной е? Решение. Ответ зависит от режима процесса заполнения. Емкость конденсатора увели- увеличится в е раз. Если конденсатор был предварительно заряжен, а при заполнении от ис- источника отключен, то мы должны считать инвариантом заряды на обкладках =fQ. Тогда энергия Q2/2C уменьшится в е раз. Напротив, если при заполнении конденсатор остается подключенным к источнику напряжения, то инвариантной останется разность потенциа- потенциалов между обкладками, соответственно, энергия CU /2 увеличится в е раз. Тот же резуль- результат можно получить, сравнивая плотность энергии в пустом конденсаторе и заполненном с помощью формулы B.29), но в первом случае D = inv, Е ос е, а во втором — Е = inv, Doce. Полный энергетический баланс подводится следующим образом. В первом случае поле конденсатора втягивает диэлектрик, совершая над ним работу; если потенциальная энер- энергия диэлектрика в поле тяжести не изменяется, работа переходит в кинетическую энергию и в конечном счете в тепло. Во втором случае та же работа совершается источником на- напряжения (течет ток, изменяя заряды обкладок), одновременно источник увеличивает и энергию поля. 2. По сфере радиуса R распределен равномерно заряд Q. Определить давление на по- поверхность сферы, обусловленное взаимодействием зарядов. Решение. Пожалуй, наиболее поучительно решение этой задачи, следующее из энерге- энергетических соображений. Энергия заряженной сферы W = Qtp/2 = Q2 /(8ttsoR). Мысленно дадим радиусу сферы малое приращение: R —»¦ R + SR. Приращение энергии свяжем с работой искомого давления: W + 5А ~ W - V • 4тгЯ2(Ш = ^г—г— ~ W - Q2SR 8irs0R2' Отсюда получаем V = Q2/BDтгJ?0Я4). Интересно отметить, что, просто умножив поверхностную плотность заряда на сфере на величину поля вне сферы, мы бы получили ответ в два раза больший. Причина доста- достаточно очевидна: внутри сферы поле равно нулю, а в тонком заряженном слое менятся от
190 ГЛ. 2. ЭЛЕКТРИЧЕСКОЕ ПОЛЕ В ВЕЩЕСТВЕ нуля до Q2/(AttsoR2). Поэтому сила, действующая на элемент площади сферы, в действи- действительности определяется некоторым интегралом от величины EpdV, взятым в радиальном направлении. Тем не менее, ответ для тонкого слоя оказывается универсальным. 3. Пластина пьезоэлектрика толщины 2d вследствие неоднородной деформации поляри- поляризована так, что поляризация ее в центре равна Р<э, направлена вдоль оси Ох и изменяется по закону Р = РоA — х2 /d2), где х отсчитывается от плоскости симметрии пластины. Определить напряженность электрического поля внутри и вне пластины, а также разность потенциалов U между ее поверхностями. d/2 Ответ: Е(х) = — PqSq1 (l — ж2/с/2), U = J Edx = 4Poc//Cso), вне пластинки поле -d/2 равно нулю. 4. Определить электрическую энергию ядра урана 2g|U при равномерном распределе- распределении заряда Z = 92 по объему сферы радиуса R = 1,3-10~15 А1/3 м, где А = 235 — массовое число. Ответ: W = 3Z2e2/20тге0Я ~ 1,5 • 1(Г10 Дж.
ГЛАВА 3 ПОСТОЯННЫЙ ТОК 3.1. Ток как движение зарядов Понятие постоянного тока столь же существенно в начальном курсе физи- физики, как и понятие статического электричества. Исторически оба эти раздела электродинамики строились параллельно и в какой-то мере независимо; в единую науку их удалось объединить лишь в XIX в. По своим экспериментальным проявлениям электрический ток существен- существенно отличается от электростатики — как известно, для токонесущих систем (сред) характерены тепловой эффект, электрохимический эффект, магнит- магнитное поле тока. Как мы увидим, даже электрическая цепь с постоянным то- током не является полностью стационарной системой. Просто в системе, прин- принципиально открытой, возможно не только статическое, но и так называемое динамическое равновесие. Грубо говоря, его можно охарактеризовать форму- формулой «приход равен расходу», а на языке математики это означает, что посто- постоянство некоторой физической величины (например тока), или, что то же, ее нулевая временная производная, обеспечивается балансом положительной и отрицательной производных, обусловленных разными физическими про- процессами. Применительно к случаю постоянного тока можно привести такой пример: электроны в проводнике движутся с постоянной скоростью, если их ускорение в электрическом поле компенсируется трением (сопротивлением). Вводя понятие электрического тока, мы будем исходить из известного факта, базирующегося на огромном массиве экспериментальной информа- информации: электрический ток есть направленное движение электрических заря- зарядов. (При хаотическом их движении, типа броуновского, ток в среднем мо- может отсутствовать). В общем случае электромагнитные свойства токонесу- токонесущей системы, конечно, включают в себя всю электростатику и полностью в нее переходят в пределе, когда заряды можно считать неподвижными. Упо- Упомянутое выше существенное различие эффектов обусловлено еще и тем, что типичные токовые системы, наиболее интересные в практическом отноше- отношении, обладают свойством квазинейтральности. Начнем с примера, известного каждому школьнику. Линейные проводни- проводники, по которым текут параллельные токи, притягиваются. (Почему — об этом мы еще будем говорить в следующей главе). А вот два параллельных электронных пучка всегда отталкиваются друг от друга. Но это как раз и не удивительно, поскольку прямо следует из электростатики. Отсюда можно заключить, что известное нам электростатическое (кулоновское) взаимодей- взаимодействие сильнее того взаимодействия между параллельными токами, которое еще предстоит изучить. Это верно и для металлического токонесущего про- проводника, но сам этот проводник, если представить себе его микроскопическое строение, является системой, как говорят, квазинейтральной. Это означает,
192 ГЛ. 3. ПОСТОЯННЫЙ ТОК что истинной нейтральности в веществе проводника нет (без движения заря- заряженных частиц не могло бы быть и тока), но при усреднении даже по очень малому объему вещества эффективный заряд оказывается нулевым из-за очень высокой концентрации заряженных частиц — ~ 1028-1029 частиц/м3. Таким образом, электростатическое взаимодействие между проводниками оказывается пренебрежимо малым (говорят об электрическом поле очень высокой мультипольности). Как следствие, эффекты, связанные с протека- протеканием электрического тока, не маскируются электростатическими проявле- проявлениями. Еще одно чрезвычайно важное упрощение при подходе к эксперименталь- экспериментальному изучению и теоретическому описанию проводников с током следует из того, что для технических приложений особенно интересны линейные, или, как говорят, квазиодномерные, токонесущие системы — электрические цепи. (Еще один термин для обозначения этого класса объектов — токонесущие системы с сосредоточенными параметрами). Для них типично рассмотрение эффектов или вообще интегральных, или зависящих лишь от одной коорди- координаты — вдоль провода, а распределение параметров по сечению проводника не имеет значения. Определив таким образом характерные приближения в задачах о протека- протекании электрического тока, мы все же постараемся ввести основные понятия и законы по возможности в общем виде, не связывая себя приближениями. Пока и поскольку мы имели дело с током в линейном проводнике, мож- можно было определить силу тока (сейчас общепринятое название этой вели- величины — просто «ток») как заряд, протекающий в единицу времени через сечение проводника: i = % C.1) Единица тока 1 А = 1 Кл/с относится к числу основных единиц системы СИ. Чтобы избежать затруднений с определением тока (понятие перено- переноса заряда в квазинейтральном проводнике требует некоторого напряжения фантазии), дадим более конкретную иллюстрацию. Пусть, например, пере- перемещаться в проводнике могут только электроны — так это и происходит в металлах — и пусть в единицу времени через поперечное сечение провода проходит N электронов. Тогда ток равен / = Ne. Направление тока по тра- традиции определялось «от плюса к минусу», т. е. в нашем примере оно как раз противоположно движению электронов. Если же мы имеем дело сразу с не- несколькими сортами носителей заряда — как, например, в полупроводниках или электролитах, — то мы можем эту формулу обобщить: QZQe, C.2) где а — сорт носителя, Z — его зарядовое число, е — заряд электрона (за- (заметим, что для самого электрона Z = —1). При этом за направление тока в соответствии с традицией принимается направление движения положитель- положительных носителей заряда. Если нас интересует более детальная картина, мы вводим еще и плот- плотность тока — величину, характеризующую распределение тока по сечению
3.2. ЗАКОН СОХРАНЕНИЯ ЗАРЯДА. ПОСТОЯННЫЙ ТОК 193 проводника: Очевидно, единица плотности тока — 1 А/м . Попробуем и для этой вели- величины получить аналог формулы C.2). Если концентрация данного сорта но- носителей па, а скорость их в направлении, принятом за направление тока, уа, то в единицу времени единицу площади сечения проводника пересекут na-va частиц данного сорта (все частицы, заполняющие цилиндр с единичной пло- площадью основания и высотой va). Таким образом, приходим, сравнивая C.2) и C.3), к следующей формуле: ^2aZavae. C.4) Представляется естественным следующий шаг. Откажемся от условия ква- квазиодномерности проводника. Пусть движение зарядов происходит в произ- произвольной трехмерной проводящей среде. В этом случае выражение для плот- плотности тока принимает вид aZavae. C.5) а Теперь это векторная величина. Если единственный род носителей — элек- электроны, то j = —nev, где все величины в правой части относятся к электронам проводимости. 3.2. Закон сохранения заряда. Постоянный ток В первой главе мы уже говорили об одном из самых фундаментальных за- законов природы — законе дискретности заряда: любой заряд в любых про- проявлениях всегда кратен заряду электрона. Столь же фундаментален и закон сохранения заряда. Он ниоткуда не может быть выведен и не может быть установлен ни в единичном эксперименте, ни даже в конечной серии каких- либо экспериментов. Он следует из всего накопленного на сегодняшний день опыта экспериментальной физики. Электрический заряд есть строго сохраняющаяся величина. Любые изме- изменения зарядов любых физических тел происходят как следствие разделения зарядов, но не их возникновения либо уничтожения. В ядерных превращениях возможно и рождение заряженных частиц, но лишь — парами, при сохранении полного нулевого заряда. В атомной, мо- молекулярной и макроскопической физике сохранение заряда сводится к сохра- сохранению числа частиц любого сорта, а значит — и их суммарного заряда. К этому следует добавить еще один очень важный экспериментальный факт — нейтральность Вселенной, и более того, высокую степень нейтраль- нейтральности всех макроскопических тел. Заряды макротел, с которыми мы реально имеем дело в природе или в технике, всегда суть малые возмущения на фо- фоне очень высокой степени нейтральности тела. Уединенный металлический шарик радиуса 1 см, потерявший сотую долю электронов, оказался бы за- заряжен до потенциала ~ 1015 В, а его энергозапас представлял бы величину - 1019 Дж!
194 ГЛ. 3. ПОСТОЯННЫЙ ТОК Как известно, закон Кулона и закон всемирного тяготения функциональ- функционально тождественны, но электростатическое взаимодействие гораздо сильнее, поэтому, к примеру, при взаимодействии двух электронов гравитационная составляющая силы ничтожно мала в сравнении с куло- новской. Но, вследствие нейтральности, макроскопическая динамика Вселенной определяется все-таки исключитель- исключительно гравитационным взаимодействием. Попробуем придать закону сохранения заряда динамиче- скую форму. Представим себе некоторый элемент объема проводящей среды, ограниченный произвольной замкну- замкнутой поверхностью S (рис. 3.1). Изменение полного заря- заряда, заключенного внутри поверхности, может быть следу- следующим образом связано с зарядом, протекающим в единицу времени через границу (током): Ш = - [j±dS = -(fjdS = - /divjdF C.6) ОЪ J J J (мы преобразовали правую часть по теореме Гаусса). Но и левая часть мо- может быть представлена в виде объемного интеграла, поскольку Q= f p dV. Элемент объема может быть выбран совершенно произвольно, поэтому ра- равенство интегралов влечет за собой равенство подынтегральных выражений. Как следствие, получаем локальную (или дифференциальную) форму урав- уравнения C.6): (dp/dt)+ divj = 0. C.7) Уравнения C.6), C.7) и выражают в электродинамике закон сохранения заряда. В математическом отношении они эквивалентны гидродинамическо- гидродинамическому уравнению непрерывности, что вполне естественно с точки зрения фи- физики дела: в гидродинамике сохраняется масса вещества, а в электроди- электродинамике — заряд. Изменение любой из этих величин представимо в форме некоторого течения. Теперь мы можем на новом уровне вернуться к приближению постоянного тока. В общем случае трехмерного течения зарядов мы должны потребовать выполнения условий j(t) = const, др/dt = 0. Из последнего, в частности, следует divj = 0. C.8) Условие C.8) часто отождествляют с условием постоянства тока. Но, как следует из нашего рассмотрения, оно является необходимым, но не доста- достаточным. Например, оно выполняется с высокой точностью для переменных, но квазистационарных токов (см. гл. 8, 10), если в цепи нет конденсатора. Особо следует отметить, что условие постоянства тока подразумевает ра- равенство нулю временной производной плотности заряда, но не самой плот- плотности заряда. В неоднородных электрических цепях, а тем более при трех- трехмерном протекании тока в среде, она вполне может быть отлична от нуля в отдельных точках или даже во всей проводящей среде. Устанавливает- Устанавливается такое возмущение нейтральности на нестационарной стадии, следующей непосредственно за включением тока.
3.3. ЗАКОН ОМА. ЗАКОН ДЖОУЛЯ-ЛЕНЦА 195 В случае системы с сосредоточенными параметрами — электрической це- цепи, составленной из проводов однородного сечения, — формулу C.8) можно заметно упростить. Считая радиус кривизны провода много большим его по- поперечных размеров, будем рассматривать проводник как квазиодномерный. Тогда в C.8) из всех производных остается только одна — по координате вдоль провода: То же самое условие можно получить напрямую из постоянства полного тока в сечении: = const = fj\\dS, откуда j|| = const. Если же проводник по длине неоднороден, из постоян- постоянства тока следует неинвариантность плотности тока — она должна меняться обратно пропорционально сечению провода. 3.3. Закон Ома. Закон Джоуля—Ленца По-видимому, самый популярный закон электродинамики, известный да- даже людям, от физики и электротехники весьма далеким, — это закон линей- линейной связи между током в одномерном проводнике и напряжением (разностью потенциалов) на его концах, установленный в 1826 г. немецким физиком Ге- Георгом Омом: / = U/R. C.9) Величина R в этом соотношении называется сопротивлением проводника и измеряется в системе СИ в омах: 1 Ом= 1 В/1 А. В отличие от электростати- электростатики, единицы СГС для данного круга задач чрезвычайно неудобны; скажем, 1 Ом ~ 1,1 • ю-12 сгс. Для нашего курса формулировка C.9) все же слишком примитивна. Мы заменим ее локальным эквивалентом, который в случае однородного рас- распределения плотности тока по сечению линейного проводника тривиальным образом сводится к C.9): j = АЕ = Е/р. C.10) Величина А — иногда ее обозначают буквой а — называется проводимо- проводимостью вещества, а обратная ей величина р — удельным сопротивлением. Интегрируя выражение C.10) по сечению проводника (тем самым мы от j переходим к/), а затем — по длине его (переходим от Е к [/), мы и в са- самом деле возвращаемся к C.9); при этом, в соответствии с курсом физики средней школы, 1 В отличие от C.9), формула C.10) устанавливает причинно-следственную связь между электрическим полем и током, который оно порождает, в точке (точнее — в физически бесконечно малом объеме). В принципе, мы могли бы попытаться обосновать ее с помощью следующих рассуждений. Какова бы ни была функциональная зависимость между j и ?, в преде- пределе достаточно слабых полей ее можно разложить в ряд Тэйлора, и тогда первый неисчезающий член такого разложения как раз и дает j ос Е. Ра- Разумеется, параллельность векторов j и Е отсюда не следует; она последует
196 ГЛ. 3. ПОСТОЯННЫЙ ТОК из изотропности проводящей среды — просто, помимо направления поля, в задаче нет больше никакого другого выделенного направления. В более общем случае, например для анизотропного кристалла, связь должна быть тензорной — ji = ^2 \kEk — но по-прежнему линейной. к Однако доказательность этих рассуждений иллюзорна. Во-первых, не ка- каждую функцию можно разложить в ряд Тэйлора, во-вторых, параметр раз- разложения заранее не ясен, например, первый неисчезающий член при Е —>> О может оказаться пропорциональным Е1/2 или, скажем, все члены разложе- разложения обратятся в нуль вплоть до Е^. В-третьих, в любом случае остается вопрос: сколь малыми должны быть поля и токи, чтобы зависимости C.9), C.10) оставались линейными? Представит ли этот предел хоть какой-то ин- интерес? Эксперимент отвечает на эти вопросы следующим образом: для твердых проводников формулы C.9), C.10) справедливы в достаточно широком диапазоне практически интересных напряжений и токов. Несколько уже область их применимости для электролитов, еще уже — для газов и плаз- плазмы, но и в этих средах закон Ома остается в числе самых фундаментальных. Как и все основные законы природы, закон Ома следует не из рассуждений, но из опыта; экспериментом же определяется и область его применения. Формулу C.10) можно попытаться вывести из законов механики для за- заряженной частицы в проводящей среде. Это достаточно просто сделать для жидкой или газообразной среды, моделируя трение электрона в среде по- посредством постоянной эффективной частоты столкновений иэф. Столкнове- Столкновения могут происходить с ионами в электролите, с дефектами решетки в твердом теле и т. д. Для определенности отнормируем иэф так, как если бы электрон при каждом эффективном столкновении полностью терял свой импульс. Уравнение движения электрона (d/dt) mv = —еЕ — Щфгпу в пределе стационарного течения электронов d(mv)/d? = 0 имеет простое ре- решение v = — eE/z/эфт. Подставляя его в соотношение j = —nev и сравнивая с C.10), получаем: А = пе2 /тпщф. C.11) Аналогия между формулами C.11) и C.10) позволяет сделать ряд замеча- замечаний достаточно общего характера о применимости закона Ома. 1. В классическом виде закон Ома справедлив постольку, поскольку мож- можно пренебречь магнитным полем в уравнении движения электрона (что мы и сделали). Если же магнитное поле тока существенно, то закон, как мини- минимум, нуждается в модификации. 2. В общем случае произвольной природы сил трения величина иэф долж- должна, в принципе, зависеть от скорости электрона в среде. Мы же посчита- посчитали ее постоянной, а это значит, что токовая скорость предполагается мно- много меньше тепловой скорости электронов (при комнатной температуре — 60-70 км/с). 3. Формула C.11) — и пока только она — подразумевает стационарность электронного течения (постоянный ток). Но ее, вместе с C.9), C.10), можно попытаться перенести и на более широкий класс явлений. Так, мы можем
3.3. ЗАКОН ОМА. ЗАКОН ДЖОУЛЯ-ЛЕНЦА 197 считать ток «безынерционным» и пользоваться законом Ома, если все вели- величины медленно меняются во времени: d(mv)/d? <С 1УэфГплг. Это не единствен- единственное условие и не самое жесткое, но сама эта возможность очень важна. 4. Течение «газа» электронов проводимости возможно не только вслед- вследствие действия на них электрического поля, но и вследствие перепада да- давления — как в гидродинамике. И напротив, при одновременном действии поля и градиента температуры тока может и не быть. Закон Ома подразуме- подразумевает, что все подобные (термоэлектрические) эффекты малы в сравнении с ускорением электронов в электрическом поле. Мы видим, что поле должно быть ограничено не только сверху, но и снизу. Более или менее корректное количественное сравнение нам придется отложить до раздела, посвященного строению вещества. Опираясь на вывод C.11) и на всю эту простую модель электрического сопротивления, мы можем рассмотреть также эффект джоулева тепловы- тепловыделения, известный в школьной физике в форме закона Джоуля-Ленца. В соответствии с механикой, работу в единицу времени при перемещении од- одной частицы можно оценить следующим образом: dA/dt = -(FTpv) = гтыуэфУ2. Как правило, работа силы трения переходит в тепло (возможны и дру- другие каналы потерь, но мы здесь не будем на этом останавливаться). Для проводящей среды получаем следующее выражение для тепловыделения в единице объема: dw/dt = птиэфУ2 = (nevJ(mv3<$/ne2) = j2 /A = pj2. C.12) Этот тепловой эффект принято называть дэюоулевым теплом. В однород- однородном проводнике длины / с поперечным сечением S± справедливо следующее выражение для тепловыделения: dQ/dt = S±l • pj2 = I2(pl/S±) = i?/2, C.13) а это не что иное, как закон Дэюоу ля-Ленца. Пока и поскольку речь идет о постоянном токе, тепловыделение с помощью закона Ома можно предста- представить в различной форме: dQ/dt = Ш2 = U2/R = IV, но, если мы выходим за пределы этого приближения, остаются в силе толь- только формулы C.12), C.13). Это дает основание для введения понятия ак- активного сопротивления, очень важного для описания переменных токов и связанного именно с процессом диссипативной природы — джоулевым те- тепловыделением . В заключение настоящего параграфа рассмотрим еще один важный во- вопрос, касающийся взаимосвязи электростатики и законов протекания тока. Мы будем базироваться на явлении, которое принято называть максвеллов- ской релаксацией. Предположим, что в некоторой проводящей среде имеет место закон Ома C.10); при этом мы не предполагаем стационарности протекания тока и тол- толкуем данный закон расширенно — т. е. полагая все временные зависимо- зависимости достаточно медленными. Пусть наша среда характеризуется постоянной проводимостью А и диэлектрической проницаемостью е = 1. Перепишем C.7)
198 ГЛ. 3. ПОСТОЯННЫЙ ТОК в виде др/dt + div AE = 0. Вынося А за знак всех производных и подставляя div E = р/бо? получаем dp/dt + (\/?O)p = O. C.14) Решение уравнения C.14) хорошо известно: p = po-e-At/?o. C.15) В простейших случаях соотношение C.15) правильно описывает процесс релаксации заряда за счет протекания тока. Но из него следует, что в стаци- стационарном состоянии (включая случай постоянного тока) р = 0. Можно рассу- рассуждать и по-другому: из др/dt = 0 вытекает divj = 0. Поскольку А = const, то и divE = 0 => р = 0. Между тем, это, строго говоря, не совсем так. Представим себе, в качестве простейшего примера, источник постоянного тока, нагруженный на резистор, с которым он соединен двумя проводника- проводниками, сопротивление которых пренебрежимо мало. Тогда между этими про- проводниками возникает разность потенциалов, равная падению напряжения в резисторе. И какова бы ни была их геометрия (параллельные провода, ко- аксиал и пр.), из теоремы Гаусса с неизбежностью следует, что проводники эти заряжены. Мы можем пользоваться законом Ома j = АЕ при условии, что заряд этот настолько мал (или проводимость так велика), что можно в первом приближении считать divE = 0 — и закон Ома будет справедлив с точностью, отвечающей такому приближению. Таким образом, популярный в быту и инженерной практике термин «статическое электричество», оказывается, не лишенным смысла, если под электростатическими полями понимать поля, для которых div E/0, а под омическими — обратный случай, который описывается уравнениями C.8), C.10). 3.4. Электродвижущая сила. Правила Кирхгофа Обратимся к системам с сосредоточенными параметрами. Рассмотрим простейшую электрическую цепь, изображенную на рис. 3.2 а. Закон Ома в первоначальной формулировке C.9) включает такое понятие, как напря- напряжение или разность потенциалов на концах проводника. Если имеется в виду истинно постоянный ток, а значит и постоянное поле в проводнике, понятие потенциала представляется вполне корректным. И работа, совершаемая над зарядом на участке цепи, 5А = е- Д<р, тоже согласуется с таким пониманием. В состоянии динамического равновесия она должна быть равна диссипиру- емой энергии. Просуммируем обе величины по зарядам, прошедшим через данный участок цепи за время At: что является очевидным тождеством. Но есть одно обстоятельство, которое не позволяет рассматривать поле в данной задаче как чисто потенциальное. Дело в том, что важнейшее свойство потенциальных полей, * Edl = 0,
3.4. ЭЛЕКТРОДВИЖУЩАЯ СИЛА. ПРАВИЛА КИРХГОФА 199 нарушается при интегрировании по контуру цепи: * Edl = A • jdl ф О, потому что в отсутствие накопления заряда линии тока должны быть за- замкнуты (иначе как раз в точке разрыва получилось бы dq/dt ф 0). В ситу- ситуации, изображенной на рис. 3.2 а, вся непотенциальность поля обусловлена источником тока (в данном случае — гальваническим элементом). Часто его невозможно столь же очевидным образом локализовать — например, в случае термоэлектричества. Но всегда источник тока характеризуется не- непотенциальностью, которую он вносит в электрическую цепь: ?= э. д. с. = Ф Edl. j C.16) Эта характеристика называется электродвижущей силой. Оставаясь ис- исключительно в рамках нашего курса, мы смогли бы вполне разобраться в работе лишь одного источника э. д. с. — динамомашины, тогда как в приме- примерах и задачах на постоянный ток более популярны как раз гальванические В R Рис. 3.2 элементы. По необходимости оставляя их устройство и принцип работы вне рассмотрения, мы все же коснемся одного распространенного заблуждения. Имеет хождение следующая формулировка: «источник э. д. с. обусловлен силами неэлектрической природы». Но так можно сказать только о гра- гравитационных либо ядерных взаимодействиях. Химическое взаимодействие, фотоэффект, термо-э. д. с. и тем более эффект динамо — все это явления вполне электрической природы. Общее их свойство, необходимое для любого источника тока, заключается в ином — нестационарности. Эта нестационар- нестационарность может маскироваться длительным временем разрядки аккумулятора или динамическим равновесием в последнем звене энергетического произ- производства — динамомашине, но она всегда имеет место. В противном случае, оставаясь в кругу чисто электромагнитных явлений, мы должны были бы стационарности электрического поля однозначно поставить в соответствие его потенциальность. К тому же выводу приводит и другого рода соображе- соображение: ввиду неизбежной, хотя бы и сколь угодно слабой, диссипации, источник тока должен совершать работу. Таким образом, постоянный ток не может рассматриваться иначе, как удобное приближение, адекватность которого обеспечивается сильным не- неравенством At <С т, где At — характерный временной масштаб задачи, а г — характерное время релаксации источника.
200 ГЛ. 3. ПОСТОЯННЫЙ ТОК Для решения электротехнических задач, связанных с рассмотрением ква- квазиодномерных цепей, подобных изображенной на рис. 3.2 а, Кирхгофом бы- были предложены специальные приемы, базирующиеся на фундаментальных физических законах. Собственно цепь на рис. 3.2 а ни в каких иных реце- рецептах, кроме закона Ома, не нуждается. Необходимость в дополнительных формальных правилах возникает при рассмотрении разветвленных цепей. Первое правило Кирхгофа относится именно к точкам разветвления или уз- узлам — см. рис. 3.2 б. Из стационарности задачи следует, в частности, что в узловой точке не должен накапливаться заряд. Это значит, что заряд, поступающий в единицу времени в эту точку, должен быть равен заряду, уносимому из нее в единицу времени. Конкретно, для случая рис. 3.2 б долж- должно быть 1\ = /2 + /з- Общий рецепт строится по тому же принципу. Будем считать, ради удобства, ток, втекающий в узел, положительным, а ток, из него вытекающий — отрицательным. Тогда для любого узла сложной схемы должно иметь место соотношение = 0. C.17) Это и есть первое правило Кирхгофа. Для иллюстрации второго правила Кирхгофа обратимся к рис. 3.2 в. Лю- Любой замкнутый контур, который мы произвольным образом выделили бы из этой разветвленной схемы, должен был бы удовлетворить условию C.16). Интеграл от потенциального поля по замкнутому контуру дал бы нуль, а фактически эта операция даст алгебраическую сумму всех э. д. с, включен- включенных в контур. Но в случае системы с соредоточенными параметрами C.16) можно существенно упростить, заменив интеграл просто суммой по элемен- элементам контура: где как токи /&, так и э. д. с. ?^ выбираются с учетом знака — по соотно- соотношению направления тока и направления обхода контура. В этом состоит второе правило Кирхгофа. Направления (знаки) с самого начала можно вы- выбрать произвольно, при последующих вычислениях они будут исправлены автоматически. Например, для схемы рис. 3.2 в, полагая все токи и э. д. с. направленными по часовой стрелке, можем написать AB RAB +1 ВС RBC ' ' ' — всего 6 уравнений для всех возможных контуров и еще 3 уравнения для всех узлов схемы: h + IAB - /БС = 0 и т. д. Обычным свойством оказывается переопределенность системы уравнений, не ведущая, однако, ни к каким парадоксам. Так в нашем примере уравне- уравнений получается девять, а неизвестных токов, как следует из рис. 3.2 в, всего пять. При последующей работе с полученными уравнениями из них как раз и получится пять линейно независимых. При расчетах сложных схем пра- правила Кирхгофа дают такие преимущества, что с этой переопределенностью приходится мириться.
ЗАДАЧИ 201 Задачи 1. Пространство между пластинами плоского конденсатора заполнено многослойным диэлектриком (рис. 3.3), обладающим слабой электропроводностью. Диэлектрическая проницаемость и удельная проводимость изменяются от si, Ai у одной пластины до S2, A2 у другой пластины. Конденса- Конденсатор включен в цепь постоянной э. д. с. Определить величину и знак суммарного свободного заряда д, сосредоточенного в объеме диэлектрика, когда в цепи установится постоянный электрический ток 7, текущий через диэлектрик по напра- направлению от пластины 1 к пластине 2. Решение. Полезно обратить внимание на то, что никаких предположений касательно функций в(ж), Х(х) в задаче не сделано. Условие постоянства тока: I/S = j = \{х)Е{х) = const. Рис. 3.3 Отсюда Е(х) = I/SX(x), тем самым D(x) = sq(I / S)(e(x) / Х(х)). Соответственно, р = divD = —-so — -r^T- дх S Х(х) Искомая величина получается интегрированием плотности заряда по объему: 2 > / p dx = sol I — - — 1 . J \X2 Ai/ 2. Заземление концов телеграфной линии осуществлено посредством металлических шаров радиуса п и гг, соотвественно (рис. 3.4). Удельная проводимость грунта вблизи них равна Ai и А2. Найти сопротивление R земли между шарами. Считать почву в окрестности каждого из них однородной на расстояниях, больших по срав- сравнению с радиусами шаров. Решение. Для получения сопротивления заземления в ком- компактной форме полезно пренебречь также асимметрией, свя- связанной с подводящими проводами. Таким образом, для каждого (почти уединенного) шара задача о течении заряда оказывает- оказывается с точностью до малых поправок сферически симметричной. Отсюда сразу следует: I = const = 47rr2j(r) =* E(r) = j/X = 7/4тгг2А. ИС' 3' При вычислении падения напряжения следует учесть, что интеграл J E dr быстро схо- сходится, поэтому зависимостью А(г) можно пренебречь вдали от электродов, и, кроме того, падения напряжения на двух электродах войдут аддитивно: = IR ~ 7 Idr I [ - J 47rAir2 ^ J Idr 4тгА2г2' откуда и следует R 1 + ¦ 1 = -(- 4тг \Airi А2Г2 В силу сделанных выше предположений, результат представляет собой лишь оценку (впро- (впрочем, довольно точную). Но и на оценочном уровне универсальность сопротивления зазе- заземления — факт нетривиальный.
202 ГЛ. 3. ПОСТОЯННЫЙ ТОК 3. Определить сопротивление RAB цепочки, изображенной на рис. 3.5 а. Ответ: RAB = G/5) г. R Рис. 3.5 4. Два гальванических элемента, э. д. с. и внутренние сопротивления которых равны соответственно Si, r\ и Si, гч, соединены параллельно и нагружены на сопротивление R — рис. 3.5 б. Определить падение напряжения на сопротивлении R. Ответ: Ur = (Sir2 + S2r1)/(r1r2 + riR + r2R) R.
ГЛАВА 4 МАГНИТНОЕ ПОЛЕ ТОКА 4.1. Взаимодействие проводников с током. Понятие о магнитном поле Говоря о магнитном поле тока, мы подразумеваем, если не оговорено про- противное, постоянный ток. В действительности, как будет ясно из последу- последующих глав нашего курса, при не слишком жестких ограничениях все ре- результаты настоящей главы могут быть перенесены и на случай переменного тока. Но и те ситуации, когда такой перенос затруднителен, достаточно ти- типичны — это, например, длинные линии или электромагнитные волны в вакууме. Мы уже упоминали в гл. 3 эффект взаимодействия квазинейтральных токонесущих проводников. В зависимости от величины тока, это взаимо- взаимодействие может из чисто демонстрационного превратиться в очень сильное, например, результатом его может быть весьма эффектный и небезопасный взрыв соленоида. Цилиндрический проводник с продольным током — лай- лайнер — может при уровне тока в несколько мегаампер создавать при схло- пывании на ось давление порядка нескольких тысяч атмосфер. Задолго до того, как был построен первый гальванический элемент, и да- даже, пожалуй, раньше, чем были осознаны какие-либо электрические явле- явления, человечество познакомилось с постоянными магнитами природного про- происхождения и, соответственно, с магнитными явлениями. Современная ци- цивилизация сделала подобное знакомство неизбежным для любого ребенка. Исследование свойств токонесущих проводников привело еще в начале XIX века к пониманию того, что они взаимодействуют не только между со- собой, но и с постоянными магнитами и взаимодействия эти — одной природы. Так складывалось представление о магнитном поле тока. Именно токовое магнитное поле, а не поле намагниченных образцов оказалось в конечном счете тем первичным понятием, исходя из которого, мы представляем се- себе сегодня весь круг магнитных явлений, объединяющихся в современной электродинамике в единое целое с электрическими. Реальная история физики развивалась таким образом, что первоначаль- первоначальное понимание сути магнетизма оказалось не вполне адекватным. Сначала, была построена, по аналогии с электростатикой, магнитостатика, в кото- которой роль положительных и отрицательных зарядов исполняли северные и южные магнитные массы (названия были даны исходя из свойств стрелки компаса). Были введены понятия напряженности и индукции магнитного поля. Всю эту иерархию пришлось решительно пересмотреть на основании позднейших данных, и прежде всего — о магнитном поле тока. Во-первых, оказалось, что магнитных зарядов в принципе нет. Вместо те- теоремы Гаусса A.10) или A.14), магнитное поле, точнее магнитная индук-
204 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА ция В, подчиняется более простому закону Г divB = 0, или ф В dS = 0. D.1) s Таким образом, поток магнитного поля любой природы через любую замкну- замкнутую поверхность равен нулю. Традиционная геометрическая интерпретация этого факта такова: силовые линии магнитного поля либо идут из бесконеч- бесконечности в бесконечность, либо замкнуты. (Обращаем особое внимание читате- читателя на неполноту такой классификации — есть еще третья возможность, о которой большинство учебников просто забывает, — см. ниже.) Во-вторых, как следует из возможности замкнутых силовых линий, маг- магнитное поле и в стационарной задаче не является потенциальным. Можно посмотреть на это свойство и с другой стороны: поскольку теорема Гаус- Гаусса D.1) для магнитного поля вырождается, его источники должны фигури- фигурировать в каком-то другом уравнении — это будет так называемая теорема о циркуляции. В 1.6 мы рассмотрели дипольное приближение в электростатике. В част- частности, мы пользовались и понятием точечного диполя, но лишь как удобным приближением. Элементарным объектом при этом по умолчанию оставался электрический заряд. Именно заряд оказывается фундаментальным свой- свойством элементарных частиц, тогда как элементарные «точечные» диполь- ные моменты у них не обнаружены. С точки зрения магнитных свойств эле- элементарным объектом оказывается как раз диполь. У элементарных частиц нет магнитных зарядов, но многие из них обладают собственным магнитным дипольным моментом. (Так называемый магнитный монополь Дирака, вхо- входящий в некоторые теоретические построения как гипотетическая частица, в данном контексте рассматриваться не должен. Даже если он и существует реально, свойства его слишком далеко выходят за пределы классической, т. е. неквантовой физики.) Исторически понятие магнитного диполя, как и многие другие, было вве- введено по полной аналогии с электростатикой. В дальнейшем, когда была признана неадекватность этой аналогии, пришлось изменить и самоё ме- методологию построения данного раздела физики, опираясь на взаимодей- взаимодействие проводников с током. Но некоторые «следы» старинной магнитоста- магнитостатики сохранились и в современной электродинамике. Главный из них — так называемая перекрестная аналогия между характеристиками электри- электрических и магнитных полей. Суть ее в том, что магнитной индукцией В называется векторная сило- силовая характеристика магнитного поля, отражающая взаимодействие поля с током или магнитоактивным веществом (аналог Е). Напряженностью магнитного поля Н называется величина, определяе- определяемая из конфигурации токов проводимости (или свободных токов) без учета отклика магнитоактивного вещества, или, что то же, микроскопических мо- молекулярных токов (аналог D). Второе определение с неизбежностью несовершенно — такая же ситуация, как в сегнетоэлектриках, здесь еще более типична. По-настоящему коррект- корректное определение напряженности поля можно будет дать лишь на основа- основании уравнений поля и граничных условий (как и для вектора D в электро- электростатике) .
4.1. ВЗАИМОДЕЙСТВИЕ ПРОВОДНИКОВ С ТОКОМ 205 Очевидно, в вакууме величины В и Н физически тождественны. Но в системе СИ их принято измерять в разных единицах. Коэффициент между единицей Н — 1 А/м и единицей В — 1 Тл (Тесла) называется магнитной проницаемостью вакуума и обозначается /ig = 4тг • 10~7 СИ. Единица ее измерения по традиции именуется генри на метр (Г/м). Полезно заранее иметь в виду следующее равенство: где с = 3 • 108 м/с — скорость света. Строгий вывод этой формулы будет дан в главе «Электромагнитные волны». Таким образом, в вакууме или в веществе, откликом которого на магнит- магнитное поле можно пренебречь, имеет место соотношение В = /i0H. D.2) Соотношение D.2) открывает цепочку самосогласованных формул, обобща- обобщающих опытные данные и корректно вводящих понятие магнитного поля. Для двух последующих законов нам еще понадобится определение элемента то- тока. Под таковым понимается малый участок квазиодномерного проводника, по которому течет ток /. В последующие формулы он войдет в виде /dl, где dl — вектор элемента длины провода, поперечные масштабы которого пренебрежимо малы. Итак, если электрическое поле действует на заряды как таковые и по- порождается зарядами, то магнитное поле действует на токи и токами поро- порождается. Именно с вклада элемента тока в создание магнитного поля мы и начнем — это так называемый закон Био и Савара: dH = A/4тгг3) [/dl, г]. D.3) Для вычисления полного поля Н(г) формулу D.3) следует проинтегри- проинтегрировать по dl. При этом векторное произведение автоматически согласует направление поля с «правилом буравчика». Взаимодействие элемента тока с внешним магнитным полем описывается законом Ампера (иногда, быть может, более правильно его называют зако- законом Лапласа): dF = [/dl, В]. D.4) Полную силу и момент, действующие на проводник, и в этом случае мож- можно получить, интегрируя по dl. Формулы D.3) и D.4) вместе с соотноше- соотношением D.2) дают полное описание взаимодействия двух токонесущих про- проводников через посредство магнитного поля. Поучительна попытка Ампера объединить две основных формулы в одну: dF12 = /i[dlbB2] = ^^[dl![dl2, r12]]. D.5) 47Г Г12 Раскрывая двойное векторное произведение по известной формуле [a[bc]] =b(ac)- c(ab), получаем dl2(dlb ri2) - ri2(dli, dl2).
206 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА Попробуем в этой формуле поменять местами индексы 1 и 2. Лишь вто- второй член остается без изменений (с точностью, разумеется, до знака), но не первый. Таким образом, dFi2 ф -dF2i. Означает ли это, что неверен третий закон Ньютона или какая-нибудь из наших формул? Вовсе нет. Дело в том, что соотношения D.3), D.4) опериру- оперируют лишь с малыми элементами токонесущих проводов и дают в ответе лишь дифференциал вклада в силу. Говорить о третьем законе Ньютона можно только после интегрирования по сЩ, dl2, т. е. по длине обоих контуров. При этом, как можно показать прямым вычислением, Fi2 = — F21. Сама же формула D.5) оказывается достаточно бессмысленной. Это не ме- мешает ей, однако, также носить имя Ампера и притом именоваться законом взаимодействия токов. Закон Ампера во многих случаях удобно переписать в локальной форме, к которой выражение D.4) без труда можно свести. Введем элемент поперечно- поперечного сечения проводника dS и представим элемент тока в виде /dl = dl f j dS. Далее, принимая во внимание, что направления j и dl для тонкого провод- проводника совпадают, получаем элемент тока в следующей форме: /dl = j dV. Поделив D.4) на dF, получим плотность силы Ампера в проводящей среде: f = dF/dF = [jB]. D.6) И, наконец, отнесем силу Ампера к одной заряженной частице. Для этого формулу D.6) нужно просто разделить на концентрацию носителей тока п. Вспоминая соотношение C.5) и ограничиваясь одним сортом носителей, получаем F = e[vB], D.7) где е — заряд частицы с учетом знака. Эта зависимость называется силой Лоренца и представляет собой самостоятельную ценность. Можно было бы начать прямо с нее и отсюда выводить закон Ампера. Она играет принципи- принципиально важную роль в механике заряженных частиц — как при движении в заданном внешнем поле, так и при изучении самосогласованной динамики. Как можно видеть из D.7), сила Лоренца относится к т. н. гироскопиче- гироскопическим силам — при движении заряженной частицы в заданном однородном поле работа не совершается. Из нее, в частности, следует эффект цикло- циклотронного вращения. Пусть частица с зарядом е и массой т совершает нере- нерелятивистское движение в однородном внешнем поле В. Уравнение движения ra(dv/d?) = e[vB] расщепляется на два. Проекция уравнения на направление В описывает равномерное движение, тогда как в плоскости, перпендикулярной В, траек- траекторией будет окружность, по которой частица будет двигаться равномерно с угловой скоростью и;в = еВ/т. D.8) Ее принято называть циклотронной частотой или гирочастотой.
4.2. МАГНИТНЫЕ ПОЛЯ ПРОСТЕЙШИХ ТОКОВЫХ КОНФИГУРАЦИЙ 207 4.2. Магнитные поля простейших токовых конфигураций. Векторные свойства магнитного поля Самая простая задача на вычисление магнитного поля — поле в центре тонкого кольца радиуса R с током /. Формула D.3) при этом существенно упрощается; последующее интегрирование по dl сводится к умножению на длину окружности, в то же время любой элемент dl дает вклад в вектор В, направленный по оси. Как следствие, полное поле также оказывается параллельно оси, связано с направлением то- тока в кольце правилом буравчика и равно Я = (I/AttR3) • 2ttR • R = I/BR). Соответственно, В = /io//Bi?). Несколько сложнее будет вычислить поле прямого провода, но именно эта задача оказывается очень важной для последующих построений. Обратимся к рис. 4.1 а. Пусть по бесконечному прямо- прямому проводу течет ток /. Из осевой симметрии задачи сле- следует, что силовые линии магнитного поля — замкнутые Рис. 4.1 концентрические окружности. (Другой вариант — ради- радиальные лучи — не годится, потому что условие D.1) оказалось бы нару- нарушено.) Тот же самый ответ следует и из других соображений, а именно из геометрических свойств формулы D.3) и из равнозначности двух полубес- полубесконечных лучей, образующих ось системы. Таким образом, Н = H(R), где R — расстояние до оси. Легко видеть, что [dl, г] = dx • R — см. рис. 4.1 б. Далее, г = R/ cos a; dx = R d(tg а) = (R da)/ cos2 a, и окончательно — оо тг/2 Г I Rdx Г I cos a da I ] 4^Т^= ] 4тгД = 2^R' ( } -оо -тг/2 Результат D.9) можно чисто формально переписать и таким образом: Ф Hdl = /, D.10) поскольку интегрирование по контуру в данном случае сведется к триви- тривиальному умножению на 2nR. На этом простом примере мы познакомились с той формой закона Био и Савара, которая чаще всего употребляется в современной физике и называется теоремой о циркуляции. Название это достаточно условно; для вакуумного поля эквивалентность формул D.10) и D.3) может быть строго доказана методами векторного анализа, но в маг- нитоактивной среде обе эти формулы по сути постулируются в качестве определения напряженности магнитного поля. Не следует также забывать, что обе они подразумевают стационарную постановку задачи — в случае же переменных во времени полей их либо придется модифицировать, либо обеспечить их применимость какими-то сильными неравенствами.
208 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА При всех этих оговорках мы, тем не менее, будем придерживаться для D.10) общепринятого названия: теорема о циркуляции. Но, имея в виду по- последующие ее применения, мы перепишем D.10) в локальной (дифференци- (дифференциальной) форме, в которой она и фигурирует в числе основных уравнений теоретической электродинамики — уравнений Максвелла. Для этого нам придется, помимо операций дивергенции и градиента, познакомиться с новой операцией векторного дифференцирования, которая называется «ротор»: fdHz дНЛ [дНх дНЛ Операция может применяться к любому вектору А (г); мы используем век- вектор Н просто для удобства. Символическое представление операции rot в виде векторного произведения очень удобно для вывода некоторых важных соотношений. В частности, используя известные правила векторной алге- алгебры, нетрудно получить rot(V^) = [V, \7ф] = 0, rot rot A = [V[V, A]] = V(V, A) - (V, V)A = VdivA - V2A — для любых функций ф(т) и А (г). Эта же операция позволяет придать весьма изящную форму одной из главных теорем векторного анализа — теореме Стокса. Пусть дан некоторый произвольный контур L и векторная функция Н(г). Пусть, далее, S — гладкая поверхность, натянутая на наш контур, т. е. по- построенная так, что он является для нее линией границы. Тогда при произ- произвольной ее форме имеет место соотношение ^Hdl= /rotHdS, D.11) j j L — циркуляция вектора Н по замкнутой границе поверхности равна пото- потоку через эту поверхность его ротора. В этом и состоит содержание тео- теоремы Стокса. Сравним формулы D.11) и D.10), представляя в последней / = JjdS. Правые части обеих формул должны быть равны для произ- произвольных L и S. Это значит, что равны подынтегральные выражения: rotH=j. D.12) Это и есть теорема о циркуляции в локальной форме, входящая наряду с B.3) и D.1) в систему уравнений Максвелла. Она еще будет в последующих главах дополнена током смещения; в настоящем виде этот закон является точным, по крайней мере, в случае токов и полей, не зависящих от времени. Используя теорему Стокса для вывода теоремы о циркуляции в форме D.12), мы, между прочим, доказали еще одно важное ее свойство: несуще- несущественно, каким именно образом линии тока пересекают контур — они могут пересекать его под любым углом, быть может, «вперед-назад», образуя то- токовые петли и т. д. Все это учитывается интегралом JjdS и никак не ска- сказывается на формуле D.10). В нее входит только заряд, в единицу времени пересекающий любую поверхность, натянутую на контур, а как это проис- происходит — не имеет значения. Поскольку уравнения D.3), D.10), D.12) линейны, для вектора напряжен- напряженности магнитного поля справедлив принцип суперпозиции — поле суммы
4.2. МАГНИТНЫЕ ПОЛЯ ПРОСТЕЙШИХ ТОКОВЫХ КОНФИГУРАЦИЙ 209 токов равно сумме полей каждого из них. Это справедливо и для действу- действующего поля В, но лишь в вакууме или в линейной среде. Например, в фер- ферромагнетиках принцип суперпозиции не работает — и не только для В, но и для Н, ввиду нетривиальности граничных условий. В качестве примера вычисления магнитного поля с помощью теоремы о циркуляции рассмотрим длинный цилиндрический соленоид, по обмотке ко- которого протекает ток /, — рис. 4.2. В отличие от тонкого кольца с током, поле внутри соленоида оказывается практически одномерным и параллель- параллельным его оси. Это следует из симметрии задачи, но может быть прямо выве- выведено из закона Био и Савара при следующих условиях: а) диаметр катушки должен быть много меньше ее длины; б) шаг намотки должен быть много меньше диаметра соленоида; с< в) намотка должна быть плотной, т. е. диаметр провода должен быть равен шагу намотки, в противном случае мы правильно определяем поле только для расстояний от стенок соленоида, много больших зазора между витками. Иногда об этих условиях забывают. Другим примером «забывчивости» является популярное, но неправильное утверждение о том, что поле вне такого соленоида равно нулю. На самом деле оно такое же, как и у прямого провода: /() где R — расстояние от оси (превышающее радиус катушки). Это следует из аксиальной симметрии задачи и теоремы о циркуляции. В самом деле, как уже говорилось выше, току безразлично, каким образом пересекать натяну- натянутую на контур интегрирования поверхность, важно лишь, что он пересекает ее один раз. Для дальнейшего существенно, что силовые линии лежат в плоскости, перпендикулярной оси системы. Определим поле внутри соленоида. Проведем любую плоскость через его ось и построим в этой плоскости прямоугольный контур А, как показано на рисунке. Одна из длинных сторон прямоугольника А/ расположена вне катушки; поле к ней перпендикулярно, и вклад ее в циркуляцию § Н dl ра- равен нулю. Две боковых стороны Ах мы с самого начала выбираем малы- малыми и в дальнейшем устремляем к нулю, поэтому их вкладом также можно пренебречь. Остается длинная сторона внутри катушки. Пусть плотность намотки (число витков на единицу длины соленоида) равна п. Если N — полное число витков, а / — длина соленоида, то п = N/I. Ток / пересекает контур А столько раз, сколько витков он захватывает, т. е. пА1. Теорема о циркуляции D.10) принимает вид простого соотношения Я • А/ = пА1 • /, откуда окончательно следует H = nl= (N/1) I- В = fionl. D.13) Сколь бы ни были подробны наши рассуждения (которые при известном опыте попросту опускаются), довольно очевидно, что вывод этой хрестома- хрестоматийной формулы оказался намного проще, чем если бы мы пользовались напрямую законом Био и Савара.
210 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА Рассмотрим еще один пример, ответ в котором будет чисто качественным, но принципиально важным для всей физики магнитных полей. Рассмотрим стационарную токовую конфигурацию, изображенную на рис. 4.3 — коль- кольцевой ток, охватывающий прямой ток. (Она не является чисто умозритель- умозрительной — используя сверхпроводящую технику, ее, в принципе, можно реально осуществить.) Как будут выглядеть магнитные силовые линии? Для прямого тока ответ известен — это бу- будут концентрические окружности, центры ко- которых лежат на оси. Силовые линии витка с током лежат, как известно, в плоскости, про- проходящей через ось. Это замкнутые линии не- неправильной формы, охватывающие виток, — картина, хорошо известная из школьного кур- ис' ' са физики. (Лишь одна из них незамкнута и совпадает с осью; для нас она в данном случае неинтересна.) При попыт- попытке сложить эти два поля, следуя принципу суперпозиции, окажется, что результирующая силовая линия навивается на некоторую тороидальную поверхность и целиком на ней расположена. Первое впечатление — это замкнутая на себя спираль. Заметим, однако, что для замкнутости спирали необходима соизмеримость длины обхода тора и ее шага, т. е. сделав некоторое целое число обходов, си- силовая линия должна замкнуться сама на себя. Меняя радиус тора, мы полу- получим семейство вложенных тороидальных поверхностей, причем замкнутые силовые линии будут соответствовать счетному подмножеству, а незамкну- незамкнутые — континууму. Это и есть «третий вариант» поведения магнитной силовой линии — маг- магнитная поверхность. То есть силовая линия может не только идти из бес- бесконечности в бесконечность или быть замкнутой, но и занимать некоторую поверхность, плотно ее заштриховывая, и не иметь при этом ни начала, ни конца. Как показано в нашем примере, поверхность эта может быть вложена в конечный объем. Такое поведение силовых линий — вовсе не экзотика; оно, например, используется в прикладных задачах для удержания заряженных частиц. Ничего подобного нет в электростатике. Это лишнее свидетельство наив- наивности первоначальных попыток построить магнитостатику по образу элек- электростатики. На самом деле электрические и магнитные поля обладают раз- разными геометрическими свойствами, что формально отражено в различных базовых уравнениях: divD = p и rotH = j. В заключение данного параграфа дадим определение магнитного потока. Для любой гладкой поверхности S магнитный поток определяется следу- следующим образом: Ф= / BdS. Это понятие оказывается очень удобным и широко используется в электро- электродинамике. Если поверхность замкнута, то в силу D.1) Ф = 0 — вне зависимо- зависимости от того, расположены источники магнитного поля снаружи или внутри
4.3. ВЕКТОР-ПОТЕНЦИАЛ 211 нее. Единица магнитного потока имеет специальное название — вебер: 1 Вб = 1 А • с • Ом. Такая размерность последует из закона электромагнитной индукции, с ко- которым нам еще предстоит познакомиться. 4.3. Вектор-потенциал Материал, изложенный в нижеследующем параграфе, обычно не принято помещать в курс общей физики. Нам, однако, представляется, что экономия в объеме и сложности ряда последующих вычислительных процедур оказы- оказывается столь значительной, что оправдывает такое начинание. (То же самое можно сказать и об операциях векторного дифференцирования. Они позво- позволяют представить уравнения поля в чрезвычайно компактной и наглядной форме, существенно упрощают многие доказательства и выводы, и потому, на наш взгляд, стоит как можно раньше преодолеть некоторые трудности, связанные с освоением этого аппарата.) Мы уже могли оценить, сколь конструктивным оказалось в электростати- электростатике понятие электрического потенциала. Определение его было дано в фор- формулах A.16), A.17), а основное уравнение, которому потенциал подчиняется как функция точки, — A.19). Правда, определение давалось для системы дискретных точечных зарядов, а уравнение соответствует описанию заря- зарядового распределения непрерывной функцией р(г). Но все проблемы снима- снимаются простым обобщением определения A.16), A.17): V = —[^dV. D.14) 4тг?0 J г Теперь попробуем подобным же образом ввести функцию, порождающую магнитное поле. Только, в отличие от электростатики, источником будет не скаляр р, а вектор j. Рассмотрим некоторую проводящую среду с распреде- распределением плотности тока j (г). Введем вектор А с компонентами ЬЫ®-М D.15) r Сравнивая D.14), D.15) и A.19), нетрудно убедиться, что компоненты век- вектора А должны удовлетворять уравнению Пуассона: / о9 о9 о9 \ 2 Л — ( \ А \ ox1 oyz ozz J (где к = х, у, z), что обычно принято записывать в виде V2A = -j. D.16) Векторная величина А и называется вектор-потенциалом. Но это название имеет смысл лишь в том случае, если эта функция и в самом деле порождает вектор магнитного поля. Чтобы в этом убедиться, вычислим прежде всего дивергенцию вектор-потенциала: divA = — /"div (^ ) dV = — / f ^ ) dS. 4тгУ Vr/ 4nJs\rJ
212 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА Мы преобразовали последний интеграл по теореме Гаусса. Поскольку объ- объемное интегрирование предполагается по всей проводящей среде, где j ф О, постольку поверхностный интеграл должен браться по поверхности всех про- проводников, где, однако, j± = 0, а потому равен нулю и весь интеграл. Таким образом, divA = 0. Но тогда имеет место следующее соотношение (см. предыдущий параграф): rot rot A = VdivA - V2 А = - V2 А, так что мы можем заменить левую часть в уравнении Пуассона D.16) для вектор-потенциала: rot (rot A) = j. Сравнивая этот результат с дифференциальной формой теоремы о цирку- циркуляции D.12), получаем окончательный ответ: Н = rotA. D.17) Мы имеем возможность еще раз убедиться в различной векторной природе электрического и магнитного полей. Если статическое электрическое поле представимо как градиент некоторой скалярной функции (такие поля назы- называют потенциальными), то магнитное поле в вакууме есть ротор некоторой векторной функции. Поля такого рода принято называть соленоидальными. Скалярный электрический потенциал определен, как и потенциальная энергия, с точностью до константы. Произвол в определении вектор-потен- вектор-потенциала больше: поскольку ротор градиента любой скалярной функции то- тождественно равен нулю, то и величина А определена с точностью до V^, где ф(т) — произвольная скалярная функция. Наблюдаемой же (измеряе- (измеряемой) величиной остается поле Н, т. е. ротор вектор-потенциала. Мы не бу- будем, однако, углубляться в этот вопрос, потому что данное выше определе- определение D.15)—D.17) вполне корректно и для целей нашего курса достаточно. 4.4. Магнитный диполь. Понятие о магнитном моменте На первый взгляд, из закона Био и Савара D.3) следует спадание магнит- магнитного поля на бесконечности, аналогичное закону Кулона (ос г~2). Для неко- некоторых вырожденных ситуаций мы и в самом деле можем в случае электро- и магнитостатики получить ответы, функционально тождественные. Так, электрическое поле однородно заряженного длинного провода и магнитное поле длинного провода с током, хотя и различаются геометрией, зависят от радиуса по одному закону (ос 1/г). Но в общем случае между ними существу- существует принципиальное различие. Если уединенный заряд любого знака имеет право на существование, то элемент тока не может существовать сам по себе, ибо любой стационарный ток должен быть замкнут. Потому и мультиполь- ность магнитного поля не может быть ниже дипольного приближения: Н ^ const • г при г —>• оо. (Конечно, на достаточно больших, например галактических, масштабах этим качеством обладает и электрическое поле, но это уже следствие нейтраль- нейтральности Вселенной, а не собственно электродинамики.)
4.4. МАГНИТНЫЙ ДИПОЛЬ. ПОНЯТИЕ О МАГНИТНОМ МОМЕНТЕ 213 Таким образом, элементарным объектом в физике магнитных полей ока- оказывается диполь, и именно дипольным по геометрии и функциональной за- зависимости будет поле произвольной системы токов на больших расстояниях. По природе и по геометрии силовых линий электрический и магнитный диполи различаются — см. рис. 4.4 а. Поэтому перенос результатов гл. 1 на этот случай невозможен и вывод основных соотношений должен быть проведен заново. И уже здесь весьма полезным для нас окажется материал предыдущего параграфа, т. е. описание магнит- магнитного поля посредством вектор-потенциала. Рас- Рассмотрим квази-стационарную токовую систему. Можно в принципе смотреть на нее как на ква- квазинейтральную систему зарядов, совершающих замкнутое финитное движение (поскольку квази- квазистационарные токи должны быть замкнуты). Об- Обратимся к формуле D.15) и проведем следующую цепочку замен в подынтегральном выражении: j dV = new dV = dq{v)t- Мы выбрали элемент dV столь малым, чтобы в него попали заряды только одного сорта и чтобы усреднения по объему не требовалось. В то же время усреднение по времени необходимо, ввиду дискретности носителей заряда (в сущности, само поня- понятие постоянного либо квазистационарного тока неявно подразумевает такое усреднение). Следуя логике этой замены, мы можем интегрирование в D.15) заменить суммированием по дискретным зарядам, что в данном случае бу- будет удобнее, ^ л л Рис. 4.4 а затем, в соответствии с рис. 4.4 б', представим Иа в виде векторной суммы Иа = R — га, где все ra <С R. Тогда 4тг qa{Vg) |R-r0 1 1 E Первый член этой разности есть не что иное, как усредненная по времени временная производная полного дипольного момента системы, Неважно, чему он равен и по какому закону меняется. Важно, что систе- система совершает финитное движение и любая величина, характеризующая ее состояние, изменяется в конечных пределах, а поэтому при усреднении по достаточно большому промежутку времени At ее производная стремится к нулю. Пусть F — такая величина, а т — характерное время эволюции си- системы. Тогда (cLF/dt) ^ (г/At) (cLF/d?) 0 при At > т.
214 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА Нам еще не один раз придется воспользоваться этим результатом. Обратим- Обратимся ко второму члену разности, принимая во внимание, что VI/R = —R/i?3: А - а в котором сделаем тождественное преобразование (va(raR)} = <(d/d<){ra(ra R)} - ra(va Первый член в правой части — снова полная производная, дающая нуль при усреднении, поэтому, говоря о средних по времени значениях, можно прирав- приравнять левую часть второму члену в правой. Сделаем это в выражении D.19), введя, соответственно, коэффициент 1/2: А 5>((R) (R)) Если определить вектор магнитного момента системы как а то вектор-потенциал магнитного поля системы на больших, в сравнении с ее размерами, расстояниях, имеет вид А = [mR]/D7ri?3). D.22) Эквивалентная форма: А = -A/4тг) [m, V(l/R)}. D.23) Итак, мы видим, что в теории магнитных полей дипольное приближение базируется на понятии вектор-потенциала — полезно сравнить выражения A.24) и D.22). Мы ввели понятие магнитного диполя и теперь можем для удобства считать его «точечным». В этом случае, т. е. при вычислении поля на расстояниях, существенно больших пространственного масштаба токовой конфигурации, последняя характеризуется единственным векторным пара- параметром т. Для вычисления поля воспользуемся формулой D.23). Предва- Предварительно проведем операцию векторного дифференцирования в общем виде. Пусть а — некоторый постоянный вектор, тогда rot [а, Ь(г)] = [V [а, Ь(г)]] = a(Vb) - (a V)b. В нашем случае b = V(l/i?), поэтому (Vb) = V2(l/i?) = 0, потому что это уравнение Пуассона для потенциала точечного заряда при R ф 0 (впрочем, это можно проверить и прямым вычислением). Таким образом, Используя также цепочку преобразований (mV)R= (тх д/дх + ...)(ехх + ...) = т, получаем окончательный ответ:
4.4. МАГНИТНЫЙ ДИПОЛЬ. ПОНЯТИЕ О МАГНИТНОМ МОМЕНТЕ 215 Этот результат оказался идентичным формуле A.25), в особенности если мы, имея в виду уже отмеченную перекрестную аналогию, перепишем по- последнюю для электрической индукции, т. е. просто умножим на ?q. Для справки отметим, что мы ввели т. н. амперовский магнитный момент; ино- иногда вместо него используют кулоновский магнитный момент, отличающийся коэффициентом /io/4?r. В отличие от электрического диполя, простейший магнитный диполь пред- представляет собой тонкий замкнутый виток с током (рис. 4.4 а). Для вычисле- вычисления его дипольного момента построим цепочку, обратную той, которую мы использовали при выводе формулы D.18): dgv = new dV = j dV = jS± dl = /dl, где S_\_ — поперечное сечение провода, / — ток, протекающий через виток. Теперь сумму в D.21) можно заменить интегралом по длине контура: m = \<f[r,Idl]. Воспользуемся известным свойством векторного произведения: модуль | [a b] | равен удвоенной площади треугольника, построенного на векторах а и b как на сторонах. Таким образом, | [г, dl] | =2 d*S, где S — площадь контура витка, и окончательно: m = ISn. D.25) Здесь п — единичный вектор нормали к плоскости витка, ориентированный согласно правилу буравчика по отношению к направлению тока, или, что то же: с конца его ток в контуре должен выглядеть протекающим против ча- часовой стрелки. Если мы имеем дело с катушкой из N витков, ее магнитный момент равен NIS; подразумевается, что расстояние, на котором опреде- определяется поле катушки, или масштаб изменения внешнего поля существенно превышают любой ее размер. Если же магнитный диполь — иной природы, например, постоянный магнит, то его очень часто удобно представить в ви- виде витка или трубки с азимутальным током. Этот фиктивный ток называют током намагничения. В качестве источника поля он ведет себя так же, как и реальный ток, не следует только подставлять его в теорему о циркуляции, а тем более в закон Джоуля-Ленца. Вернемся к дискретному представлению магнитного момента D.21). Пред- Предположим, что диполь формируется циклическим движением одной частицы, либо ансамблем одинаковых частиц, либо, наконец, ансамблем различных частиц, но имеющих одинаковое отношение заряда к массе, которое мы обо- обозначим как е/т. Опуская, ради простоты записи, индексы и операцию усред- усреднения, имеем 2^У[ J 2m^h J 2m^L PJ Поскольку [гр] есть момент импульса частицы, наша формула связывает магнитный момент и момент импульса системы: m = (e/2m)L. D.26) Величина e/Bm) называется гиромагнитным отношением. Соотноше- Соотношение D.26) оказывается настолько универсальным, что работает даже в кван- квантовой механике — именно этим коэффициентом оказываются связаны
216 ГЛ. 4. МАГНИТНОЕ ПОЛЕ ТОКА механический и магнитный моменты электронных орбит в атоме. И толь- только при переходе к элементарным частицам появляется необходимость в его модификации. Задачи 1. По двум бесконечно длинным прямолинейным проводникам А л В, выполненным из немагнитного материала и ограниченным пересекающимися цилиндрическими поверхно- поверхностями, текут в противоположных направлениях токи одинаковой плотности j (рис. 4.5 а). Найти величину и направление магнитного поля в полости Г. Г Рис. 4.5 Решение. Введем в сечении проводников вектор АВ = d — рис. 4.5 б — и восполь- воспользуемся принципом суперпозиции полей. Поскольку плотности тока равны в каждом из проводников и противоположно направлены, дополним мысленно каждый проводник до цилиндра, так что нулевой ток в полости получится как результат сложения встречных токов. Произвольная точка полости будет характеризоваться радиусами-векторами Ra и Rb; d = Ra — Rs- Внутри цилиндрического проводника, по которому течет однородный ток j — см. рис. 4.5 е, — поле в точке с радиусом R ищется из теоремы о циркуляции: 2ttRH = ttR2j =^ Н = (l/2)Rj. Если же мы хотим определить вектор Н, то, как можно понять из рис. 4.5 е, это соотно- соотношение следует переписать в виде векторного произведения: Н = [j, R]/2. Вычислим это поле в полости, имея в виду, что ]в = —JA- НП = RB]) = - RB] = d]. А А' В В' Таким образом, поле в полости будет однородным и направлено в нашем случае снизу вверх. 2. По двум параллельным проводящим плос- плоскостям текут антипараллельные токи с одно- однородной линейной плотностью dl/dl = i — см. рис. 4.6 а. Определить величину и направ- направление давления на каждую плоскость. Решение. О направлении силы давления мож- можно сказать сразу, что плоскости должны оттал- отталкиваться друг от друга. Вычислим поле, созда- создаваемое токами каждой плоскости (рис. 4.6 б). Ввиду высокой симметрии задачи, силовые ли- линии должны быть просто прямыми, параллельными плоскости. В каждом полупростран- полупространстве поле однородно — иначе мы могли бы построить контур, который не пересекался бы током, но циркуляция поля по этому контуру была бы ненулевой. На рисунке контур ABB А — вид на левую пластину сверху — пронизывается током г • АА , а циркуляция б Рис. 4.6
ЗАДАЧИ 217 поля по нему равна 2 • Н • АЛ1', так что поле в каждом полупространстве равно Но = г/2. В системе параллельных плоскостей (см. рис. 4.6 е) поле вне ее обратится в нуль, а между плоскостями будет равно 2Но, соответственно, индукция В = /ioi. Но не все это поле надо подставлять в закон Ампера, а лишь половину его, потому что ток каждой из плоско- плоскостей выталкивается полем другой плоскости, но сам себя он никуда толкать не может. Формулы D.4) или D.6) дают в случае нашей геометрии простой результат: 00000 3. Определить траекторию движения произвольной за- заряженной частицы в скрещенных полях Е, Н; напряжен- напряженности поля Е и Н известны; EJ_H; EqE2 <С fioH2. Решение. Движение заряженной частицы в магнитном поле определяется силой Лоренца D.7). В направлении оси Oz || Н (рис. 4.7 а) на частицу не действует ни сила Лоренца, ни сила еЕ, так что в этом направлении движение будет равномерным — vz = const. Но оказывается, мы можем в данной задаче выделить не только это сносовое движение, но и усредненное движение в плоскости хОу. Формула D.7) допускает интересную трактовку. Перейдем в систему отсчета, связанную с частицей. В этой системе частица имеет нулевую скорость, а значит, не работает и сила Лоренца. Но сама сила остается, и ее невозможно трактовать иначе, как перенормировку электрического поля в движущейся системе отсчета: E' = E + [vB]. D.27) Теперь попробуем найти такую систему отсчета, в которой Е' = 0. Умножаем D.27) век- торно на В: [ЕВ] = -[[vB]B] = wB2 -B(vB). Поскольку мы уже отделили движение параллельно магнитному полю, второй член спра- справа можно без ограничения общности приравнять нулю. Таким образом, в системе отсчета, движущейся со скоростью /чЛ гтг тз1 / с?2 (л OQ^ \V/ = [-EJ-Dj/i} , D.ZOJ частица не будет вообще чувствовать электрическое поле, и ей останется лишь совершать циклотронное вращение согласно D.8). Только это вращение и зависит от заряда и массы частицы, усредненное же движение описывается формулой D.28) универсальным образом. Полная траектория есть результат сложения усредненного движения с v || Ож_1_Е, Н и циклотронного вращения в плоскости хОу; вид ее в зависимости от начальных условий представлен на рис. 4.7 б. В частности, она может быть и просто прямолинейной — это движение со скоростью D.28) без вращения. Конечно, все это верно только при условии (v) = E/fioH < с = = (/^о^оI^2, откуда и следует ограничение SoE2 <С /ioH2. Описанный /" j^ jf\ эффект называется электрическим дрейфом. ( J 4. Определить силу притяжения, приходящуюся на единицу дли- \^ ны каждого из двух тонких параллельных прямых проводов, если « 2^—S ток в них 1\ = /2 = 1 А, а расстояние между проводами х = 1 м. Ответ: dFjdl = fjbohh/Bтгх) = 2 • 1(Г7 Н/м. ^ИС< 4<й 5. Электрический ток / протекает по проводу, изогнутому так, как показано на рис. 4.8. Найти значение магнитной индукции в центре окружности (радиус окружности R). Ответ: В = fioI/(8irR)(ir + 4).
ГЛАВА 5 МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ 5.1. Микро- и макроскопическое описание поля в веществе Уравнения магнитного поля, полученные в предыдущей главе, будут вер- верны и в том случае, если пространство заполнено магнитоактивной средой, но при этом их следует считать микроскопическими уравнениями поля, по- порождаемого совокупно сторонними токами и откликом среды. Последний можно формализовать в виде некоторого наведенного распределения токов. Еще Ампер предполагал, что вещество магнетика представимо в виде со- совокупности магнитных диполей — элементарных витков с током, которые он называл молекулярными токами. Как показали последующие работы, эта гипотеза, безусловно, содержала элемент физической реальности, толь- только отклик среды едва ли можно свести к молекулярному уровню. Лишь эффект парамагнетизма представим с некоторыми оговорками моделью Ам- Ампера. Диамагнетизм объясняется либо откликом на внешнее поле электрон- электронных оболочек атомов, либо откликом обобществленных электронов прово- проводимости в кристалле. Наиболее сложна природа ферромагнетизма — этот круг явлений обусловлен квантовым эффектом упорядочения спиновых и орбитальных моментов электронов. Вообще адекватное представление маг- магнетиков зачастую с необходимостью требует перехода на язык квантовой механики. Мы займемся этим в разделе, посвященном строению вещества, а здесь ограничимся феноменологическим описанием магнитных явлений, в минимальной степени адресуясь к их микроскопической природе. Проблема состоит в том, что мы не можем реально использовать точные микроскопические уравнения, включающие «поштучно» все частицы маг- магнетика, и должны перейти к какому-то усредненному описанию, в котором отклик частиц должен быть представлен как некоторая реакция сплошной среды. Ситуация подобна таковой в диэлектриках; здесь так же перестают быть тождественными понятия индукции и поля, только индуцируются уже не связанные заряды, а некоторые микроскопические токи. Микроскопич- Микроскопичность в данном случае означает не только малый пространственный мас- масштаб наведенных диполей. Токи эти — атомной природы. Они, например, не испытывают сопротивления и не приводят к джоулеву тепловыделению. Мы их представим некоторым распределением }micro (г), которое затем бу- будем усреднять вместе с уравнениями. Исходная система уравнений, включающая микроскопические токи и по- поля, имеет вид: divb = 0; b = /i0h; rot h = j + jmicro- E.1) Здесь j (r) — распределение обычных макроскопичеких токов; их традици- традиционно именуют токами проводимости.
5.1. МИКРО- И МАКРОСКОПИЧЕСКОЕ ОПИСАНИЕ ПОЛЯ В ВЕЩЕСТВЕ 219 От этого описания мы должны перейти к некоторому усреднению систе- системы E.1): B = (b); divB = 0; rot В = ц0 (j + (jmicro>). E.2) Чтобы представить (jmiCro) какой-либо макроскопической принципиаль- принципиально измеряемой величиной, воспользуемся определением D.15) для вектор- потенциала. После усреднения по физически бесконечно малому объему эта формула принимает вид: Air J R Air J R С другой стороны, мы можем представить ту же самую величину А через наведенный дипольный момент единицы объема J — его называют также намагничением. Полагая dm = JdF, получаем из D.22) альтернативное выражение для поправки к D.15), учитывающей отклик среды: J 4тгД3 J J 4Д3 J 4Д3 Далее строим следующую цепочку формальных математических преобразо- преобразований: rot (J/Д) = [V, J/Д] = (rot 3)/R+ [J, V(l/i?)] = (rot J)/i?- [JR]/i?3, что позволяет переписать нашу поправку в следующей форме: 6А= f^dV-±h J AttR Att Интегрируя по всему пространству, последний интеграл можем положить равным нулю. Действительно, под знаком интеграла стоит операция rot, представляющая собой комбинацию производных, и если мы на достаточно больших расстояниях выходим за пределы магнетика, то в подстановках получаем нуль, потому что вне магнетика J = 0. А теперь приравняем два полученных выражения для SА: J AnR ~ J AttR ' В отсутствие каких-либо специальных математических условий отсюда сле- следует равенство подынтегральных выражений \Jmicro/ = ГОъ J , которое мы и подставим в E.2): rot В = /i0(j + rotJ). E.3) Далее доопределим напряженность поля Н «вакуумным» уравнением, в которое включим только токи проводимости: rotH=j, E.4) как следствие получаем B = /iO(H + J). E.5)
220 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ В действительности E.3) и E.4) связывают поля В и Н с точностью до градиента произвольной скалярной функции, поскольку rot (V/) = 0. Мы знаем, однако, что магнитное поле не может быть потенциальным, а пото- потому исключаем такую неопределенность. Во многих практически интересных случаях, в частности во всех случаях пара- и диамагнетизма, можно с до- достаточной точностью аппроксимировать зависимость намагничения от поля токов простой линейной зависимостью: J = xH. Тогда и связь между полем и индукцией оказывается линейной: В = WoH; Ц = 1 + Х- E-6) Величина х называется магнитной восприимчивостью, a \i — магнитной проницаемостью. В случае линейной связи E.6) это просто константа дан- данного вещества. Не столь проста ситуация в случае ферромагнетиков. Во- первых, зависимость В (Н) становится нелинейной, поэтому в таких веще- веществах не работает принцип суперпозиции полей. Во-вторых, она оказывается еще и неоднозначной: значение индукции зависит не только от величины по- поля, но и от истории магнетика. В-третьих, сама величина Н определяется не только внешними токами, но и геометрией образца. В гл. 2 при описа- описании сегнетоэлектриков мы уже встречались с эффектами такого рода. Хотя уравнение E.4) идентично уравнению поля в вакууме, его, как мы вскоре увидим, приходится решать при других граничных условиях, так что и свой- свойства этой векторной величины будут другими, скажем, возможна ситуация, когда j = 0, но Н ф 0. Соотношение E.5) справедливо всегда при учете ого- оговорок относительно природы вектора Н. Но формула E.6) верна лишь для безграничной сплошной среды. В одном и том же внешнем поле образцы, из одного и того же материала с одной и той же константой /i, но разной формы, будут намагничены по-разному, т. е. разными будут величины J (г) и В (г). Если, как это нередко бывает, образец магнетика представляет собой мо- монокристалл, то, даже в случае линейной связи, одной константы для описа- описания его свойств недостаточно. В общем случае магнитные восприимчивость и проницаемость оказываются величинами тензорной природы: apHp; a, C = х, у, z. E.7) Р Р Геометрические особенности данного магнитоактивного образца, помимо анизотропных зависимостей Ха/3 или №olC-> обусловленных строением веще- вещества магнетика, представляются обычно так называемым фактором размаг- размагничивания Nap. Он как раз и учитывает форму образца и геометрию при- приложенного к нему внешнего поля. При использовании этого фактора можно уже без всяких оговорок рассматривать внешнее поле Н(вн) как вакуумное поле токов проводимости, но действующее поле в веществе оказывается от него отличным: р Из уравнения E.2), а равно и всей процедуры с вектор-потенциалом следует, что для величины В можно пользоваться теоремой о циркуляции или, что
5.2. ДИА- И ПАРАМАГНЕТИЗМ 221 то же, законом Био и Савара, рассматривая (jmiCro) как некий ток, допол- дополнительный к току проводимости. Это и есть ток намагничения. Необходимо только помнить, что сопротивление этому току равно нулю, поэтому он не фигурирует ни в законе Ома, ни в законе Джоуля-Ленца. Не следует также подставлять этот ток в теорему циркуляции для Н. Не всегда просто пере- перевести на этот язык эффект размагничивающего фактора. Но иногда такая модель отклика магнетика на внешнее поле оказывается для решения задач удобнее, чем модель магнитной восприимчивости; очевидно, физически они совершенно эквивалентны. 5.2. Диа- и парамагнетизм Если главное следствие поляризации диэлектрика — ослабление действу- действующего поля Е в сравнении с полем свободных зарядов, то в парамагне- парамагнетике, напротив, действующее поле В больше приложенного внешнего поля. Правда, отличие это невелико: обычно у парамагнетиков величина х не пре- превышает 10~4 для некоторых химических соединений, а у чистых металлов х~ю-7. Мы начали с парамагнетизма, поскольку на уровне модельных соображе- соображений, скажем, молекулярных токов Ампера, эффект этот может быть пред- представлен проще, чем другие. Отличие знака эффекта от случая диэлектриков связано с принципиальным различием электрического и магнитного дипо- диполей — см. рис. АЛ а. Как следствие, выстраивание диполей не ослабляет, а усиливает поле в веществе. В действительности простая модель выстро- выстроенных элементарных магнитиков более или менее адекватна парамагнитно- парамагнитному веществу в газообразном состоянии, а также некоторым жидкостям. В металлах существенную роль играет спиновый парамагнетизм электронов проводимости, в полупроводниках — электронный или «дырочный» пара- парамагнетизм, в сложных химических соединениях он может быть обусловлен ионами того или иного сорта. В парамагнитном состоянии оказываются и ферромагнетики, нагретые выше определенной температуры, т. н. темпера- температуры Кюри. Магнитная восприимчивость большинства парамагнетиков в за- зависимости от температуры подчиняется закону Кюри-Вейсса: Хос1/(Т-в), где в для ферромагнетика при высокой температуре как раз примерно и равна температуре Кюри (обычно порядка нескольких сотен градусов Кель- Кельвина) ; для истинных парамагнетиков эта величина заметно ниже и никакой реальной особенности магнитной восприимчивости ей не соответствует. Казалось бы, парамагнетизмом и должна была бы ограничиться реакция вещества на магнитное поле, коль скоро он допускает настолько простое и естественное объяснение. Но известно, что существует никак не менее широ- широкий класс веществ с диамагнитными свойствами. У них магнитная воспри- восприимчивость обычно того же порядка х ~ 10~7-10~6, но другого знака. Дело в том, что, как уже было замечено, магнитостатика — в принципе не совсем статика, ибо ток есть движение зарядов; соответственно, и реакция на внеш- внешнее магнитное поле носит не только статический, но и динамический харак- характер. Забегая несколько вперед, можно сказать, что эффект диамагнетизма есть не что иное, как электромагнитная индукция на уровне молекулярных
222 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ токов. Поэтому диамагнитные свойства присущи всем веществам без исклю- исключения, и если какое-то вещество все же оказывается парамагнетиком, то это значит, что собственный магнитный момент каждой частицы достаточно ве- велик, чтобы обеспечить результирующий парамагнитный эффект. Поведение электронных оболочек атомов во внешнем магнитном поле В вполне может быть смоделировано в рамках классической физики, т. е. без привлечения квантовых эффектов. Пусть система заряженных частиц с оди- одинаковым для всех частиц отношением заряда к массе е/т совершает в за- заданном поле финитное движение. Средняя по времени сила, действующая на систему, равна нулю, в силу уже известного нам свойства равенства нулю средней производной величины, меняющейся в конечных пределах. Вычислим средний момент силы, действующий на систему: (М) = (±hj = /j>[ri[v,B]]\ = (У/ег^г(ггВ)-(гг^)В)\. E.9) Последний член в правой части при усреднении опять дает нуль, поскольку пропорционален (dr2/dt). Первый член в скобках может быть представлен в виде v» (г» В) = (d/dt){ri (п В)} - п (у< В). Первый член в правой части опять дает нуль при усреднении, поэтому, пока и поскольку мы оперируем с усредненными уравнениями движения, правую часть E.9) можно представить в виде полусуммы двух равных величин: АЛ = ? |{v, (п В) - rt (v, В)} = ? |[[гг v,] В] ее [юВ]. E.10) ' i г Именно здесь мы воспользуемся нашим предположением о том, что все ча- частицы имеют одинаковое отношение заряда к массе. Это значит, что мы пре- пренебрегаем влиянием магнитного поля на движение ядер, что в нашем случае справедливо с точностью до отношения масс, которое даже у водорода по- порядка 2 000. Обращаясь к выражению D.26) для гиромагнитного отношения, перепишем E.10) в виде =-" [1 а это не что иное, как уравнение регулярной прецессии с угловой скоростью —еВ/Bт). Сравнивая эту угловую скорость с угловой скоростью цикло- циклотронного вращения D.8), можно указать на различие в знаке и на дополни- дополнительный коэффициент 1/2. Угловая частота E.11) называется ларморовой частотой, а факт прецессии системы заряженных частиц в магнитном поле составляет содержание теоремы Лармора. Именно ларморова прецессия оказывается ответственной за диамагнит- диамагнитный отклик вещества. Движение системы частиц — электронного облака атома — происходит таким образом, что в результате генерируется добавка к внешнему полю (Ш, антипараллельная В.
5.3. ФЕРРОМАГНЕТИЗМ 223 5.3. Ферромагнетизм С феноменологической точки зрения ферромагнетики характеризуются следующими свойствами: 1. Если у пара- и диамагнетиков |/i — 1| <С 1, то у ферромагнетиков зна- значение магнитной проницаемости достигает величин порядка 104 и более. 2. Если у диа- и парамагнетиков зависимость В (Н) линейна и однозначна, то у ферромагнитных материалов она не только нелинейна, но зависит от истории образца. В частности, они могут существовать в виде постоянных магнитов. 3. В отличие от диа- и парамагнетизма, явление ферромагнетизма не мо- может быть смоделировано в рамках классической физики; природа его — исключительно квантовая. Таким образом, как раз для одного из самых популярных феноменов электродинамики — постоянного магнита — отсут- отсутствует возможность простого популярного объяснения. По этой причине мы вынуждены будем вернуться к этому кругу явлений в заключительном разделе курса, здесь же будет дано лишь краткое феноме- феноменологическое описание. К ферромагнетикам относятся Fe, Co, Ni, редкозе- редкоземельные металлы, а также многочисленные сплавы и интерметаллические соединения. Магнитные свойства их весьма разнообразны; мы, естественно, коснемся лишь некоторых, самых общих. Главная характеристика любого ферромагнит- ного материала — кривая гистерезиса, предста- вляющая собой нелинейную зависимость намаг- ничения от внешнего поля. Она может быть пред- ставлена в форме В (Н) или J(H). На рис. 5.1 показана кривая В(Н). Выходя из точки О, мы / 0/Яс Hs H попадаем в конце концов в точку насыщения А, которой соответствует поле насыщения Bs. Если мы начнем уменьшать поле Д", не доходя до точ- точки А, кривая В (Н) поведет себя сложным обра- образом, формируя малые петли, которые, однако, не Рис. 5.1 будут замкнуты. Если увеличивать поле до значений, превышающих Hs, зависимость В (Н) становится линейной, а на кривой J (Н) наступает на- насыщение. Помимо поля и индукции насыщения, характерными величинами будут также остаточная намагниченность Вг и так называемая коэрцитив- коэрцитивная сила Нс — см. рис. 5.1. Используется также понятие дифференциальной магнитной проницаемости // = n^ldB /dH. Оно удобно как характеристика начальной кривой В (Н) или ее прямолинейного участка. Нередко употре- употребляется энергия потерь 5А = § В dH при прохождении одного цикла кривой гистерезиса. Вещества называются магнитомягкими, если Hs < 103 А/м. Для них ха- характерны высокие значения /imax ~ 104-106; /i^ax ~ Ю4-10 . Коэрцитивная сила обычно невелика, Нс ^ 10-103 А/м, невелики и потери на перемагни- чивание: 5А ^ 1-10 Дж/м3. У магнитотвердых материалов Н ~ 103-105 А/м, для них характерны также высокие значения i?r, Hc, Bs, 8А. Таким обра- образом, для магнитотвердых веществ характерна широкая кривая гистерезиса,
224 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ тогда как поведение магнитомягких материалов зачастую можно аппрокси- аппроксимировать просто нелинейной зависимостью В (Н) — или даже линейной, но с насыщением намагничения при Н ^ Hs. Возможна двоякая трактовка кривой гистерезиса, и это обстоятельство требует особого внимания. Мы в какой-то мере уже касались данного во- вопроса в гл. 2 в связи с проблемой сегнетоэлектриков. Как там мы рассма- рассматривали в качестве примера палочку из электрета, так здесь рассмотрим линейный постоянный магнит. Поскольку линии В всегда замкнуты, они будут вести себя так же, как и у токового диполя — витка или соленои- соленоида, — см. рис. 4.4 а. В пустоте линии Н с ними совпадают, но внутри маг- магнита они обязаны иметь противоположное направление. Действительно, в такой системе отсутствуют токи проводимости, а ток намагничения не вхо- входит в теорему о циркуляции. Поэтому, взяв ^Hdl по любой линии В, мы должны получить нуль. Таким образом, линии Н должны выглядеть так же, как и силовые линии электрического диполя на том же рис. 4.4 а. В принципе это можно даже представить как свободные северный и южный магнитные заряды на торцах магнита. Последнему на кривой гистерезиса должна соответствовать точка в одном из четных квадрантов. Мы пришли к такому выводу, имея дело с постоянным магнитом вполне определенной геометрии. Если бы, например, речь шла о намагниченном то- роиде (В направлено по обходу тора), то в этом случае из той же теоремы о циркуляции следовало бы Н = 0. Разница между этими двумя магнитами — в различных размагничивающих факторах, которые прежде всего и зависят от геометрии тела. Обращаясь к кривой гистерезиса, необходимо отдавать себе отчет в том, что именно отложено по оси абсцисс: поле внешних то- токов или истинное поле в веществе. Вторая трактовка во многих отношениях более привлекательна, поскольку, как мы увидим в следующем параграфе, пара векторных величин В, Н может непосредственно измеряться и предста- представлять состояние вещества в магнитном поле. Но при этом мы уже не вправе считать Н просто полем токов проводимости, потому что уравнение E.4) решается при граничных условиях, несколько отличных от таковых для ва- вакуумного поля. Природа ферромагнетизма обусловлена квантовым эффектом обменного взаимодействия. Этот термин при неосторожном употреблении может вве- ввести читателя в заблуждение. В физике известно четыре типа взаимодей- взаимодействий: гравитационное, сильное, слабое и электромагнитное. Обменное вза- взаимодействие этого списка отнюдь не расширяет. В данном конкретном слу- случае речь идет об известном нам электромагнитном (кулоновском) взаимо- взаимодействии между электронами, которому квантовые эффекты придают неко- некоторые особенности. В частности, в веществах с определенной архитектурой электронных оболочек атомов данный эффект приводит к выстраиванию электронных магнитных моментов строго параллельным образом. Сделаем простую оценку. Собственный магнитный момент электрона (т. е. магнетон Бора) |ше| =цв= еН/(Атгт) ~ 9,3 • 104 Дж/Тл, E.12) где е = 1,6 • 10~19 Кл — заряд электрона, т = 9,1 • 10~31 кг — его мас- масса, h = 6,63 • 10~34 Дж • с — постоянная Планка. (К единицам магнитного
5.3. ФЕРРОМАГНЕТИЗМ 225 Рис. 5.2 момента мы еще вернемся в следующей главе). Далее, постоянная решет- решетки а — характерное расстояние между атомами — большинства металлов есть величина порядка 2-3 • 10~10 м. Предположим, что на каждый атом приходится один такой «выстроенный» электрон и оценим, сколь сильным окажется поле в веществе, в соответствии с формулой E.5) при Н = 0: JB = /iOJ^/io(|me|/a3) -1 Тл. Это довольно сильное поле. Например, чтобы получить его на расстоя- расстоянии 1 см от длинного тонкого прямолинейного проводника, по нему следует пропустить ток порядка 50 к А. В принципе такое спонтанное (самопро- (самопроизвольное) намагничение вещества энергетически невыгодно, а наиболее выгодно как раз нулевое среднее поле, которое получается уже за счет ма- макроскопического «беспорядка». Вещество разбивается на макроскопические (хотя и очень мелкие) области — домены, суммарные магнитные моменты которых ори- ориентированы хаотически, как изображено на рис. 5.2 а. Намагничение ферромагнетика означает постепенное, по мере роста Н, вы- выстраивание этих магнитных моментов, а на- насыщение — полное выстраивание, когда весь образец превращается в единственный до- домен — рис. 5.2 б. Подчеркнем, что процесс намагничения не связан с макроскопическим перемещением вещества — происходит лишь переориентация магнитных моментов электронов. Тем не менее, перемеще- перемещение и последующая ликвидация доменных границ требует энергетических затрат. Отсюда и гистерезис, этим и обусловлена возможность существова- существования постоянных магнитов (которые, как теперь легко сообразить, делаются из магнитотвердых материалов). У парамагнетиков нет такого эффекта выстраивания. Поэтому в них ори- ориентация магнитных диполей происходит только за счет внешнего поля, на фоне теплового движения, и степень ее обычно очень невелика. Это, между прочим, следует из только что сделанной оценки. Дело в том, что магнит- магнитный момент атома, если это не нуль (у диамагнитного вещества) тоже ра- равен магнетону Бора или кратен ему. Поэтому, если ориентация диполей в парамагнетике была бы столь же или почти столь же эффективной, то и намагниченность его была бы на уровне ферромагнетика. Заметим, что в принципе это возможно — и даже насыщение намагничения можно наблю- наблюдать экспериментально, но лишь при условии B>kBT/fiB, где кв — постоянная Больцмана, Т — абсолютная температура. Оценив последнюю как 300 К, получим В > 102 Тл. Такие поля трудно получить даже в импульсном режиме, а тем более — в стационарном. Но при низких температурах эффект вполне наблюдаем. Из рис. 5.1 можно понять, что, изменяя поле в пределах кривой гистерези- гистерезиса, мы не сможем снять намагниченность. Это, однако, можно сделать, по- поместив образец в переменное поле Н, амплитуда которого медленно умень- уменьшается до нуля. При этом зависимость В (Н) многократно обойдет нулевую
226 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ точку, постепенно к ней приближаясь. Другой способ размагничивания свя- связан с существованием у ферромагнетиков точки Кюри Э, выше которой они переходят в парамагнитное состояние и теряют собственный магнитный мо- момент. По порядку величины эта температура обычно не превышает сотен градусов Цельсия, что открывает возможность неразрушающего отжига. Ферромагнетики представляют собой лишь частный случай более широ- широкого класса веществ, называемых ферритами, но это важнейший случай с точки зрения приложений. В рамках общего курса электродинамики мы должны будем им и ограничиться. 5.4. Граничные условия на поверхности раздела Как и в электростатике, граничные условия принципиально важны как для формального описания поля, так и для понимания физики явления. В вакууме уравнения div В = 0 и rot H = j решались совместно; эти величи- величины отличались только коэффициентом /ig- В общем случае они разорваны и их решения связаны соотношением E.5), в котором величина J не универ- универсальна. Необходимые граничные условия последуют из самих же основных урав- уравнений. Рассмотрим границу раздела двух сред и построим малый цилиндрик, основания которого площадью dS расположены в средах / и //, а образующая перпендикулярна соприкасающейся плоскости — см. рис. 5.3 а. Поток магнитной индукции через замкнутую поверхность этого цилиндрика dS I BdS = 0. Затем, переходя для высоты к пределу dz —>> 0 и считая основание dS достаточно малым, получаем после сокра- сокращения на dS II Bjn = E.13) Это условие похоже на B.13), но, в отличие от B.14), здесь Рис 5 3 Уже не может возникнуть никаких поверхностных заря- зарядов — это принципиально невозможно. К тому же, и смысл уравнения E.13) другой: оно написано для действующего поля в произволь- произвольной среде. Далее, согласно рисунку 5.3 б', окружим поверхность раздела малым плос- плоским контуром, две стороны которого имеют длину d/ и расположены парал- параллельно соприкасающейся плоскости, а две другие ей перпендикулярны и имеют длину dz. Согласно теореме о циркуляции, Ф Hdl = i-d/, L где г = d//d/ — линейная плотность поверхностного тока, перпендикуляр- перпендикулярного плоскости контура. Снова полагаем A^ч0и сокращаем на dl:
5.4. ГРАНИЧНЫЕ УСЛОВИЯ НА ПОВЕРХНОСТИ РАЗДЕЛА 227 индексы «||»; «_L» определяют ориентацию относительно плоскости контура на рис. 5.3 б. Повторив ту же операцию для компоненты поля, ориентиро- ориентированной перпендикулярно предыдущей в касательной плоскости, получим Н1т-НПт = ц E.14) при желании это условие можно переписать и в векторной форме: H/r-H//r = [in], E.15) где п — вектор нормали к поверхности раздела. Соотношения E.14), E.15) подразумевают конечный поверхностный ток в бесконечно тонком слое или, точнее, ненулевую толщину поверхностного слоя, на двух сторонах которо- которого измеряются тангенциальные проекции вектора Н. Иногда, например, на поверхности сверхпроводника, только таким образом удается свести зада- задачу к чистой электродинамике; в остальных случаях E.15) принимает более простую форму: Н/т = Н//т. E.16) Полезно еще раз обратить внимание на формальное сходство этой фомулы с B.12), но здесь речь идет не о действующем поле, но лишь о том, которое определяется токами проводимости; кроме того, какие-либо добавки в пра- правой части B.12) отсутствуют в принципе. Не следует сопоставлять E.15) с B.12), а E.13) с B.14), потому что электрическое и магнитное поля — объекты разной векторной природы. Прежде всего рассмотрим граничные условия для магнитного поля на по- поверхности идеального проводника. Пусть поле внутри него равно нулю; в случае сверхпроводника это всегда верно (при переходе в сверхпроводящее состояние происходит выталкивание поля). Если бы мы исходили из условий E.13), E.16), поле на границе провод- проводника в вакууме должно было бы в точности обратиться в нуль. В действи- действительности только условие E.13) не допускает никакой модификации. Таким образом, нормальная компонента поля в вакууме у поверхности такого про- проводника равна нулю. К тангенциальной компоненте это не относится; про- просто из условия E.15) следует некоторое распределение токов на поверхности проводника. В вакууме поле подходит к этой поверхности по касательной. Отсюда, в частности, следует, что и к задачам такого рода применим метод изображений. Но поскольку здесь, в отличие от электростатики, в вакууме Вт ф О, Вп = 0, то в плоской поверхности проводника северный полюс маг- магнита зеркально отразится в северный, а южный — в южный. Прямой про- провод с током отразится в прямой провод, по которому ток будет течь в про- противоположном направлении, и потому будет отталкиваться от проводящей плоскости. Этот эффект используется для пространственной стабилизации импульсных сильноточных разрядов. Окружая область разряда коаксиаль- коаксиальным хорошо проводящим (или даже сверхпроводящим) экраном, его как бы помещают в потенциальную яму и тем самым фиксируют, с точностью до малых отклонений, его положение в пространстве. В случае непроводящего магнетика работают граничные условия E.13), E.16). Они дают нам, в частности, возможность определить корректным образом поле и индукцию в веществе магнетика посредством мысленного эксперимента или даже непосредственно их измерить, если образец допус- допускает реальный эксперимент такого рода.
228 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ Представим себе, что мы вырезали в объеме магнетика малую щель, по- позволяющую ввести измерительный зонд. Щель должна быть столь мала, чтобы не исказить поле в магнетике, и иметь геометрию тонкого плоского листка, ориентированного перпендикулярно силовым линиям. Тогда внутри щели можно, в свою очередь, пренебречь влиянием краев этого листка, а на плоской поверхности справедливо граничное условие E.13). Следовательно, индукция В внутри щели должна быть равна таковой в объеме магнетика. Повторим тот же мысленный эксперимент, но теперь вырежем щель так, чтобы силовые линии лежали в плоскости листка, или, точнее, чтобы плос- плоскость листка совпадала с касательной плоскостью к силовым линиям в дан- данной точке. Тогда, базируясь на граничном условии E.16), нетрудно заклю- заключить: поле, измеренное в тонкой щели, ориентированной таким образом, со- совпадает с полем внутри магнетика. Если эти измерения выполняются в реальности, щели и зонды в нужных местах готовятся заранее. Приходится, однако, признать, что так можно ра- работать только с полями достаточно простой геометрии, когда линии В и Н совпадают (либо когда мы умеем их различить — а это, строго гово- говоря, можно сделать, лишь зная заранее В и Н). Для нас более важно скорее другое. Именно в этом мысленном эксперименте мы окончательно уходим от представления о напряженности магнитного поля как поле свободных токов. Теперь два вектора В и Н выступают как параметры состояния вещества в магнитном поле. На таком понимании строится термодинамика магнети- магнетиков, нам же оно понадобится в следующей главе при обсуждении проблемы энергии поля. 5.5. Магнитные цепи Данный параграф будет посвящен достаточно простому с точки зрения физики вопросу. Он, однако, важен для приложений, но обычно в курсах электротехники физические принципы метода магнитных цепей не особенно акцентируются. Предположим, что нам дан замкнутый сердечник — рис. 5.4 а, выполнен- выполненный из магнитомягкого материала. Соответственно, используем приближе- приближение В = /i/ioH, причем /i ^> 1. Длина сердечника /, сечение 5, ширина зазора S. Считается, что / ^> S4/2 ^> S. Число витков обмотки равно 7V, ток через обмотку /. Задача: найти поле в зазоре. Каждое из приведенных сильных неравенств принципиально важно для всей последующей вычислительной процедуры, об этом не следует забывать: / ^> S1'2 позволяет пренебречь профилем поля по сечению, как следствие, сердечник уподобляется электрической цепи с сосредоточенными параме- параметрами; S1'2 ^> 6 дает нам возможность рассматривать поле в зазоре как одномерное, пренебрегая краевыми эффектами. Особую роль играет усло- условие /i ^> 1. Это значит, что в сердечнике В ^> /jqH. При переходе через боковую границу сохраняется величина Нт ~ Н, но индукция вне сердеч- сердечника оказывается много меньше, чем внутри него: Вви = /jqH <C В. И более того, предполагается, что магнитная проницаемость сердечника настолько больше единицы, что даже магнитный поток Ф = J^BdS c± В • S, захва- захваченный в сердечник, намного превосходит поток Фвн = jBBHdSBH вне его. Последнее предположение не будет слишком жестким в случае конкретной
5.5. МАГНИТНЫЕ ЦЕПИ 229 геометрии рис. 5.4 а, но в общем случае оно является наименее строгим, так как требует не просто сильных неравенств, но специального расчета для каждой частной конфигурации сердечника. В формально поставленных за- задачах это предположение принято заключать в формулировку «рассеяние поля отсутствует». Рис. 5.4 Полезно отметить, что именно условие Ф ^> Фвн есть та цель, ради которой используются в катушках ферромагнитные сердечники. Это будет особенно важно в тех задачах, где существенны эффекты электромагнитной индукции (см. гл. 7) и в таких технических устройствах, как, например, трансформа- трансформаторы. Итак, если нет рассеяния, то Ф есть постоянная величина в любом сечении сердечника. Тогда Я = Ф/(/i/io*S), а в зазоре Я* = Ф/(hqS) — связь между ними следует из сохранения нормальной компоненты индукции при переходе через границу зазора и малой ширины последнего. Используем теорему о циркуляции: Я • / + Я* • 6 = N1. Окончательный результат удобно записать в виде Ф = NI, что абсолютно идентично закону Ома для некоторой замкнутой цепи при условии следующих переобозначений: ф^/; N1^8- ^0=>Л; l/(fj,fjL0S)^R. E.17) Эта аналогия и составляет суть метода магнитных цепей. Строго говоря, все сильные неравенства, выполнения которых мы предварительно потребо- потребовали, не только легко переводятся на язык электрической цепи, но и подра- подразумеваются там выполненными (обычно по умолчанию). Аналогию можно продолжить, поставив условие § В dS = 0 в соответствие закону сохранения заряда ^ /^ = 0 в разветвлении магнитной цепи — рис. 5.4 б'. Это позволяет г перейти к рассмотрению более сложных сердечников. Например, для слу- случая, представленного на рис. 5.4 в, вводим обозначения 1^оНа = /E) ДЙ^) после чего можем записать к E.18)
230 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ Таким образом, в случае сердечников из магнитомягкого материала с боль- большими /i, но при условии линейности отклика В (Н) мы можем использовать для расчетов законы Кирхгофа. 5.6. Эффект Холла Весьма значительная группа явлений в твердом теле и плазме обяза- обязана своей природой эффекту, открытому американским физиком Холлом в 1879 г. — когда еще неизвестны были ни электрон, ни сила Лоренца. Идея опыта представлена на рис. 5.5. Электрический ток пропускается через образец, помещенный во внешнее магнитное поле В таким образом, чтобы направление тока было перпендикулярно В. Эф- Эффект состоял в том, что проводник поляризовался, т. е. между боковыми сторонами появлялась некоторая э. д. с, причем электрическое поле, ей соответствующее, оказы- оказывалось перпендикулярным как В, так и j. Варьируя ма- материал образца, можно было убедиться, что холловская э. д. с. может быть не только различной величины, но и разного знака. Объяснить эффект удалось лишь на базе электронной теории. На любой носитель тока — электрон, ион в элек- Рис 5 5 тролите или плазме, дырку в полупроводнике — действу- действует при движении в магнитном поле сила Лоренца D.7). Если бы речь шла об уединенной частице в магнитном поле, это привело бы лишь к циклотронному вращению — см. формулу D.8). Но в проводнике с высокой концентрацией носителей такое движение нарушило бы квазиней- квазинейтральность. Поэтому в действительности немедленным откликом на боковое смещение, скажем, всех токовых электронов относительно всех ионов решет- решетки будет поляризация образца. Поле в объеме установится как раз таким, чтобы скомпенсировать силу Лоренца: еЕ = e[vB]. Это удобно переписать в следующем виде: Е = Дн0В]; Дн = 1/(пе), E.19) где п — концентрация носителей, е — их заряд с учетом и его знака. Вели- Величину i?H принято называть постоянной Холла — это константа вещества. Тот же самый результат можно получить из других соображений. В маг- магнитном поле заряженные частицы не смогли бы преодолеть промежуток АА! (рис. 5.5), если бы не сформировали электрическое поле, ортогональное при- приложенному магнитному. В такой конфигурации полей направленное движе- движение уже возможно (см. задачу 3 к гл. 4 — формула D.28)). Среднюю скорость направленного движения следует приравнять скорости носителей j/(ne). Направление последней за- зависит от знака заряда носителей, тогда как дрейфовая скорость D.28) от заряда не зависит. Поэтому направление холловского электрического поля определяется знаком заряда доминирующих носителей тока.
ЗАДАЧИ 231 На первый взгляд, постоянная Холла как константа вещества имела смысл лишь до появления электронной теории электропроводности. В действитель- действительности наше объяснение оказывается во многих случаях слишком модель- модельным. Понять это можно, представив себе в одном проводнике два вида но- носителей разного знака (пример — полупроводник) или одноименных, но с разным зарядовым числом Z (электролит). Формула E.19) с очевидностью оказывается неадекватной, но сам эффект Холла остается в силе, а вели- величина RH может быть измерена экспериментально либо вычислена в рамках достаточно полной модели. На сегодняшний день холловскими обычно называют любые явления, в которых существенны и нетривиальны эффекты вида [j В]. Из многочислен- многочисленных приложений отметим, например, возможность прямого и очень точного измерения магнитного поля. Задачи 1. На железный сердечник постоянного сечения длиной / = 1 м с зазором А = 1 мм намотана катушка с числом витков N = 1 600, по которой течет ток 7 = 1 А — рис. 5.6 а. Зависимость В (Н) материала сердечника представлена на рис. 5.6 б. Определить поле в зазоре. Решение. В силу граничного условия для нормальной компоненты В, В в зазоре равно В в сердечнике. Используем теорему о циркуляции (B/fjLo) -A+H-l=NI. E.20) А теперь объединим график рисунка 5.6 б ж линейную зависимость В (if), следующую из уравнения E.20). Результат представлен на рис. 5.6 в. Ответ: В ~ 1,5 Тл. в -1,5 Тл 2,0 1,5 1,0 0,5 n / / / 1600 А/м Н 1250 2500 3750 5000 =^?> Н/п(Л/м) а б в Рис. 5.6 2. Безграничная плоская магнитная пленка толщины h включает одну доменную стен- стенку G, разграничивающую две полуплоскости с противоположной намагниченностью =fJo (рис. 5.7). Вектор Jo ортогонален к пленке. Пленка помещена в однородное электриче- электрическое поле Е || Jo- Над границей раздела на расстоянии L ^> h параллельно ей движется электрон с постоянной скоростью. При какой величине Е такое движение возможно? Решение. Скачок индукции В на плоской доменной границе может быть связан с ли- линейной плотностью тока намагничения г = dl/dl (см. задачу 2 гл. 4): АВ = 2J0; АВ = % =* i = 2J0.
232 ГЛ. 5. МАГНИТНОЕ ПОЛЕ В ВЕЩЕСТВЕ Поскольку электрон находится от пленки на растоянии L ^> /г, для него ток намагничения будет выглядеть как линейный ток / = г/г, создающий в точке, где находится электрон, поле Н = 1/BтгЬ) = Joh/(irL). Согласно результату задачи 3 гл. 4, электрон может двигаться равномерно в скрещенных полях только при условии ?qE <C ответ: . Таким образом, для нашего случая получаем Рис. 5.8 3. Бесконечная плоская пластина изготовлена из однородно намагниченного ферромаг- ферромагнетика. Найти поля В и Н внутри и вне пластины, если вектор J а) параллелен и б) перпедикулярен плоскости пластины. Ответ: а) внутри пластины Н = О, В = //oJ; вне пластины Н = О, В = 0, б) внутри пластины В = О, Н = — J; вне пластины В = О, Н = 0. 4. Длинный однородный цилиндр изготовлен из материала с «замороженной» однород- однородной намагниченностью, вектор которой параллелен его оси. Индукция в точке А оказалась равной В А =0,1 Тл (рис. 5.8). Найти индукцию В вблизи торца короткого цилиндра, из- изготовленного из того же материала, если h = 5 • 10~2D. Ответ: В = 2ВА (h/D) = 10 Тл.
ГЛАВА 6 ЭЛЕКТРОМАГНИТНАЯ ИНДУКЦИЯ 6.1. Индуктивность и взаимная индукция В этом параграфе мы от рассмотрения сплошных сред в очередной раз возвращаемся к системам с сосредоточенными параметрами — электриче- электрическим цепям. В отличие от гл. 3, где в электрической цепи важна была только последовательность элементов и законы формирования контуров (в случае их неодносвязности), теперь для нас первостепенное значение приобретает геометрия контура, поскольку мы рассматриваем магнитное поле токов. И здесь весьма существенный выигрыш в объеме вычислений даст нам введен- введенное в D.3) понятие вектор-потенциала: А = — [Ю-dV. 4тг J r Рассмотрим два замкнутых контура 1 и 2. Пусть в каждом из них течет некоторый постоянный ток: 1\ и /2. Каждый контур создает в простран- пространстве магнитное поле, которое можно представить соответствующим вектор- потенциалом. Будем считать контуры линейными в том смысле, что попе- поперечные размеры проводника и распределение в нем тока несущественны в сравнении с характерными масштабами задачи. Тогда j dV = j dS± dl, и объ- объемные интегралы сводятся к интегралам по контуру: . h f dli h Г dl2 Ai = — Ф —; A2 = — Ф —. 4тг J г 4тг J r 1 2 Вычислим магнитный поток, создаваемый током контура 1 в контуре 2, ис- используя при этом теорему Стокса: Ф12 = / Bi dS2 = но rotAi dS2 = но Ф М dh = -^ Ф Ф ——-• F.1) J J J 4тг / / R12 2 2 2 12 Совершенно аналогично, F.2) 2 1 Коэффициенты при токе в формулах F.1) и F.2), как нетрудно видеть, идентичны: —!-—-. (б.з) ^12
234 ГЛ. 6. ЭЛЕКТРОМАГНИТНАЯ ИНДУКЦИЯ Величины Li2, L21 называются коэффициентами взаимной индукции, а правило их равенства — теоремой взаимности, которая часто использует- используется при решении задач или инженерных расчетах. Легко видеть, что эти ко- коэффициенты зависят только от геометрии контуров, с точностью, впрочем, до знака, который задается направлением обхода в интегралах F.1)—F.3). Его, как правило, выбирают так, чтобы все величины L^ были положитель- положительны, за исключением тех случаев, когда приходится суммировать магнитные потоки разного знака. Теперь представим себе единственный замкнутый контур, по которому протекает ток /. Так же, как и в предыдущем примере, представим маг- магнитный поток через контур, обязанный собственному току / в виде L • I, F.4) 4тг / / R ' где R = |Rdi,di'|- Величина L называется коэффициентом самоиндукции или индуктивностью. Единицу измерения индуктивности или взаимной ин- индукции принято называть генри; ее размерность: 1 Гн = 1 В • с/А. Причина именно такого выбора размерности прояснится ниже (см. закон Фарадея). Другое определение той же единицы: 1 Гн = 1 Вб/А. Как и фарада для изме- измерения емкости, единица эта очень велика, поэтому фактически используют- используются микрогенри или даже наногенри; последняя совпадает с очень хорошей точностью с единицей измерения индуктивности в системе СГС, а потому часто называется сантиметром. Определение самоиндукции F.4) удобно постольку, поскольку следует об- общему алгоритму F.3), демонстрирует явно зависимость только от геометрии контура, но никогда не используется, в отличие от F.3), для фактического расчета индуктивности. Дело в том, что именно при рассмотрении самоин- самоиндукции неадекватно приближение линейности контура. Как следствие, инте- интеграл F.4) оказывается несобственным. Это впрочем, легко понять и на более элементарном уровне: вблизи идеально тонкого про- провода В ос Н ос 1/г, а значит, поток через контур Ф расходится логарифмически. Но формула F.4) удобна для доказательств общего вида, в чем мы еще убедимся в следующей главе; теперь же дадим два простых примера прямого вычисления индук- индуктивности. 1. Индуктивность коаксиала. На рис. 6.1 предста- представлена система двух соосных проводников. Ток те- течет по внутреннему цилиндрическому проводнику радиуса г\ и возвращается по внешнему цилиндри- цилиндрическому проводнику радиуса г2- Во избежание уже упомянутой проблемы расходимости полного пото- потока, внутренний проводник, как и внешний, будем считать полым и тонким в сравнении с масштабами г\, Г2- Тогда магнитное поле можно считать сосре- сосредоточенным в пространстве между цилиндрами. Внутри внутреннего цилин- цилиндра и вне внешнего оно обращается в нуль в силу теоремы о циркуляции и азимутальной симметрии системы. В силу тех же аргументов, между цилин- цилиндрами поле идентично полю прямого провода. Отсюда нетрудно вычислить
6.2. ПРИНЦИП ЛЕНЦА. ЗАКОН ФАРАДЕЯ 235 и поток, взяв элемент сечения контура dS = I dr: 2 = / • / dr = In — =^> —— = — In — J 2тгг 2тг Vri/ d^ 27Г \rij п Величина dL/dl есть по определению индуктивность на единицу длины коаксиала. 2. Индуктивность соленоида. Пусть дан длинный соленоид, без сердеч- сердечника или с магнитомягким сердечником, с плотной намоткой (см., напри- например, рис. 4.2); радиус соленоида i?, длина /, полное число витков 7V, число витков на единицу длины п = N/1, магнитная проницаемость сердечника \i. Согласно выражению D.13), внутри соленоида В = jjjjQnl. Определяя по- поток через контур, следует принять во внимание, что каждая силовая линия охватывается обмоткой соленоида N раз: Ф = ttR NjjjjQnl. Отсюда следует и результат, который может быть представлен в двух эквивалентных формах: dL/dl = 7T/iO/i(ni?J; L = тг/io/i {NRJ/l. F.6) 6.2. Принцип Ленца. Закон Фарадея Из школьного курса химии известен принцип ле Шателье-Брауна, кото- который в простейшей форме выглядит следующим образом: если некая смесь веществ пребывает в динамическом равновесии за счет встречных экзо- и эн- эндотермической реакций, то при нагревании быстрее начинает идти эндотер- эндотермическая реакция, а при охлаждении — экзотермическая. В электродина- электродинамике близкий по идее принцип был сформулирован знаменитым российским ученым-естественником Э. X. Ленцем. Токи, возникающие в проводнике при движении его в магнитном поле, направлены так, что силы, действующие на эти токи, противодействуют движению проводника. С учетом иных возможностей изменения магнитного потока может быть предложена более общая формулировка. Отклик динамической системы на перестройку магнитного поля всегда имеет тенденцию противодействовать этой перестройке. Если уронить медную или серебряную монетку между полюсами мощного электромагнита, то невооруженным глазом можно наблюдать замедление — даже весьма значительное — скорости по сравнению со свободным падени- падением. Это «работают» магнитное давление и натяжение силовых линий (см. гл. 7). Основная причина того, что эти механизмы вступают в игру, может быть связана с принципом Ленца. Равным образом объясняются этим прин- принципом токи Фуко в железном сердечнике трансформатора (из-за которых его обычно набирают из отдельных пластин) и работа динамомашины. Заметим что в первом из этих двух случаев нет ни движения проводника в поле, ни деформации контура, но лишь осцилляция магнитного поля в сердечнике как следствие непостоянства тока. Это и соответствует второй — более об- общей — формулировке принципа Ленца. Приходится, однако, встречаться с очень грубой его трактовкой, типа «реакция противоположна воздействию». Если бы это было правильно, то в природе, например, не существовало бы ни пара-, ни ферромагнетиков, но лишь диамагнетики. Потому и существенна оговорка относительно реакции динамической системы. Ларморова прецес- прецессия и вызванный ею диамагнетизм, и в самом деле, вполне согласуются
236 ГЛ. 6. ЭЛЕКТРОМАГНИТНАЯ ИНДУКЦИЯ с правилом Ленца, но, к примеру, ферромагнитные явления уже не могут быть сведены к такой схеме. Круг явлений, подпадающий под принцип Ленца, принято называть элек- электромагнитной индукцией. Основной количественный закон здесь был уста- установлен английским физиком Фарадеем. Пусть имеется замкнутый контур любой природы (проводящий или непроводящий — даже мысленно очер- очерченный), и пусть по любой причине — движение, деформация, затухание тока в контуре, изменение внешнего магнитного поля — изменяется во вре- времени магнитный поток через означенный контур. Тогда в контуре возникает э. д. с. ?, которая может быть найдена из соотношения: С с1Ф ?= *Edl = - — . F.7) J C16 Знак в F.7) отражает то обстоятельство, что возбуждаемая в контуре э. д. с. индукции по направлению такова, что противодействует изменению магнитного потока. В частности, при идеальной проводимости контура по- поток, который им охватывается, должен быть инвариантом. Это относится как к тому случаю, когда охватывающий контур является сверхпроводя- сверхпроводящим, так и к тому, когда пространственные и временные масштабы задачи позволяют считать его идеальным проводником. (Эти две ситуации не сле- следует путать; мы еще вернемся к этому вопросу в гл. 9.) Из F.7) следует введенная в гл. 4 размерность магнитного потока 1 Вб = = 1 А-с-Ом. По этому поводу следует, впрочем, заметить, что расшифровка единиц в системе СИ в принципе может быть любой, которая не противоре- противоречила бы их определению, но обычно предпочитают пользоваться размерно- размерностью, следующей из наиболее употребительных законов и по возможности не опирающейся на размерность «вакуумных» кон- констант /iQ И ?q- В некоторых простых случаях соотношение F.7) может быть получено как следствие уже известных законов. Поставим следующий мысленный экспери- эксперимент (рис. 6.2): имеется проводящий контур, соста- составленный из двух направляющих, замкнутых с одной р fi ~ стороны неподвижной перемычкой, а с другой — по- подвижной, которая движется вдоль направляющих со скоростью v. Расстояние между направляющими /, контур помещен в маг- магнитное поле В, ортогональное его плоскости. Рассмотрим электрон в по- подвижной перемычке, который движется вместе с ней, а значит, на него дей- действует сила Лоренца F = —e[vB]. Как уже не раз отмечалось, это означает, что в системе отсчета, связанной с перемычкой, возникает электрическое поле Е = [vB]. Отсюда циркуляция J> Edl = vBl. И поскольку vl = d*S/dt, отсюда как раз следует формула F.7). В общем случае, однако, ее не удается вывести, так что этот закон должен рассматриваться как опытный факт. Полезно лишний раз отметить (см. рис. 6.2), что ток, порождаемый ин- индукционным электрическим полем, в свою очередь, порождает магнитное поле, по направлению противоположное внешнему полю В, и тем самым как бы «старается» скомпенсировать увеличение магнитного потока через кон- контур — в согласии с принципом Ленца. При обратном направлении движения рамки генерируется поле того же направления, что и приложенное извне.
6.3. ЗАКОНЫ ЭЛЕКТРОМАГНИТНОЙ ИНДУКЦИИ 237 6.3. Интегральная и локальная форма закона электромагнитной индукции Рассмотренные до настоящего момента законы электродинамики явно рас- распадаются на две группы. В одну из них входят так называемые материаль- материальные соотношения: закон Ома, зависимость Р(Е) или J(B) и т. д. Эти зако- законы задаются физикой строения вещества; результаты, на них основанные, всегда не универсальны, причем это общее свойство их всех, а не только простых линейных моделей. Вторая группа — чисто электродинамические законы, например теорема Гаусса или теорема о циркуляции (которую, правда, нам еще предстоит за- записать в окончательном виде). Эти законы, разумеется, также имеют свою область применимости, но она гораздо шире, чем у материальных соотноше- соотношений, по сути, оставаясь в рамках классической физики, мы за нее заведомо не выходим. Более того, эти фундаментальные законы более совершенны, нежели закон Кулона или закон Био и Савара, их породившие, поскольку не связаны приближениями точечных зарядов или бесконечно тонких элемен- элементов тока. Справедливость их подтверждается как прямыми экспериментами, так и (даже в большей степени) согласованностью и непротиворечивостью всего массива информации, составляющего основу современной электроди- электродинамики. Опыт показывает, что закон электромагнитной индукции F.7) также отно- относится к этой группе фундаментальных законов. Его, конечно, имеет смысл модифицировать применительно к системе с сосредоточенными параметра- параметрами — токовому контуру — г л т ? = ф Edl = -L—, F.8) J at если его параметры не меняются во времени, если же контур является пере- перестраиваемым или, скажем, деформируемым, то соотношение F.8) допускает естественное обобщение: В то же время, как и для всех законов такого рода, желательно получить локальную форму закона Фарадея, которая была бы свободна от понятия какого-либо материального контура. Для этого воспользуемся уже упоми- упоминавшейся в гл. 4 теоремой Стокса: & Edl= / rotEdS — циркуляция вектора по некоторому контуру равна потоку ротора этого вектора через любую гладкую поверхность, натянутую на контур. Объеди- Объединяем теорему Стокса и закон Фарадея: /rotEdS = -^- = -^ /" J at at J Ввиду произвольности контура и натянутой на него поверхности, можно просто приравнять подынтегральные выражения. Только временную про- производную надо будет представить в виде частной производной по времени,
238 ГЛ. 6. ЭЛЕКТРОМАГНИТНАЯ ИНДУКЦИЯ чтобы избежать в локальной форме уравнения эффектов, связанных, напри- например, с движением вещества. Итак, вот локальная форма закона Фарадея: rotE = - —. F.10) Знак «—», который мы до сих пор старательно удерживали как символ на- направленности э. д. с. индукции, приобрел в этой векторной формуле окон- окончательный смысл. В зависимости от конкретной задачи, может быть ис- использована любая форма закона электромагнитной индукции F.7)—F.10), но именно F.10) представляет закон Фарадея в наиболее общем виде. Задачи 1. На один сердечник намотаны две катушки (рис. 6.3). Индуктивности их равны соот- соответственно L\ = 0,5 Гн и L2 = 0,7 Гн. Чему равна их взаимная индуктивность в отсутствие рассеяния магнитного потока? Решение. Поскольку магнитный поток не рассеивается (это означает, помимо надлежа- надлежащей геометрии сердечника, [i ^> 1), то через каждый виток он один и тот же: Ф = const. Пусть, для определенности, ток течет через первую обмотку: _ Ф]_ _ ?i2_ Lil ~ iVi ~ N2 iVi N2 ' Аналогичным образом L21/N1 = L2/N2. По теореме взаимно- взаимности L21 = Li2. Исключая число витков JVi, N2, получаем: Рис. 6.3 Ll2 = (L^I/2 = °'59 Гн- Простая формула (L1L2I/2 представляет собой максимально возможный коэффициент взаимной индукции при заданной индуктивности двух катушек. Реально он всегда меньше, потому что невозможно полностью исключить рассеяние магнитного потока. 2. Внутри длинного соленоида с плотностью намотки п, вдали от его концов, располо- расположен параллельно оси намагниченный стержень с магнитным моментом т^. Найти маг- магнитный поток Ф, пронизывающий соленоид. Решение. Прямое вычисление было бы громоздким, и в нем легко было бы ошибиться. Но мы можем сделать мысленно совершенно эквивалентную замену. Пусть вместо посто- постоянного магнита в соленоид помещен виток с током, так что IS = т^. Далее мы можем воспользоваться теоремой взаимности, пропустив ток / не через виток, а через обмотку соленоида. Тогда В = /lonl = /lom^n/S, и магнитный поток через виток, как раз и рав- равный искомому, составляет Ф = /lom^n. Представляется достаточно нетривиальным факт универсальности ответа; без теоремы взаимности установить его было бы затруднительно. 3. В ускорителе электронов — бетатроне — роль ускоряющего напряжения играет э. д. с. индукции, возбуждаемая изменением магнитного потока, пронизывающего орбиту электрона. Электроны же при этом движутся по орбитам примерно постоянного радиу- радиуса. Определить необходимое для этого соотношение между средним по полощади орбиты магнитным полем (B)(t), пронизывающим орбиту электрона, и магнитным полем Bo(t) непосредственно на орбите. Поле считать нормальным к плоскости орбиты. Решение. Если частица движется по круговой орбите, то, согласно D.8), частота обраще- обращения есть ив = еВо/т. При импульсе частицы р радиус орбиты равен R = v/uB = р/еВо. Условие R = const эквивалентно следующему: р ос Во или, что то же, р/р = Во/Во.
ЗАДАЧИ 239 Ускорение электрона на орбите постоянного радиуса происходит в соответствии с зако- законом р = еЕ, где электрическое поле определяется из закона Фарадея F.7): t ^ Edl = 2ttRE = -— = ttRUB). I dt Таким образом, зависимость Е = R(B)/2 подставляется в соотношение Во _ еЕ ~В~о ~ eRB0' Отсюда следует Bo(t) = (l/2)(B)(t) в любой момент времени, что эквивалентно Bo(t) = 4. Один и тот же ток идет по двум параллельным проводам в противоположные стороны. Провода имеют круглые сечения радиуса г = 2 мм, а расстояние между ними d = 2 см. Найти индуктивность единицы длины такой системы, учитывая по- поле только вне проводов. Ответ: L = ^ In ^—^ ~ 9 • 10 Гн/м. 7Г Г 5. Прямоугольная рамка а х Ъ лежит в одной плоскости с прямым проводником, по которому течет ток / и который расположен па- параллельно стороне 6, на расстоянии d > а от ближайшей стороны (рис. 6.4). Какой заряд Q пройдет через любое сечение провода рамки, если она повер- повернется вокруг ближайшей к проводу стороны Ъ на угол тг и останется в этом положении? Сечение провода рамки S, удельное сопротивление р. Самоиндукцией рамки пренебречь. гл гл Ъ IS л d + a Ответ: Q = -— In . а -\-Ъ 4тгр d — а
ГЛАВА 7 ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ 7.1. Проводники в магнитном поле. Магнитное давление С тем, что такое магнитное давление, мы уже познакомились в задаче 2 гл. 4. Напомним, что поле между проводящими плоскостями было равно Н = г, где г — линейная плотность поверхностного тока, а давление на каждую плоскость составляло ViB Нетрудно сообразить, что такое же точно давление будет действовать на любую плоскую поверхность проводящего тела, если вне тела существует магнитное поле В, параллельное поверхности, а в самом теле В = 0. Дей- Действительно, величина г однозначно следует из теоремы о циркуляции, и все последующие соображения остаются в силе. Нужно только переписать фор- формулу для давления на поверхность проводника, исходя из того, что задано все-таки именно поле в вакууме: |Н GЛ) Существенно, во-первых, то обстоятельство, что магнитное давление об- обусловлено «непроникновением» магнитного поля в проводник. Если послед- последний пребывает в сверхпроводящем состоянии, это всегда верно, но и в обрат- обратном, гораздо более обыденном случае это совершенно реально. Как мы увидим далее (гл. 8), проникновение поля в проводящую среду — процесс не мгновенный, и чем выше проводимость, тем более он затянут во времени. Во-вторых, при выводе формулы G.1) мы использовали упрощенную гео- геометрию: внешнее поле, параллельное плоской поверхности проводника. Это сужает круг явлений, которые мы могли бы обсуждать, либо создает опас- опасность ошибок, проистекающих от расширительного толкования результа- результата G.1). Прежде чем давать формальное описание сил, действующих в магнитном поле на проводящую среду, приведем чрезвычайно удобную форму для ар- архимедовой силы, использующую операцию векторного дифференцирования. Рассмотрим некоторую текучую среду, т. е. жидкость или газ, подчиняющу- подчиняющуюся закону Паскаля, и выделим в ней малый объем — кубик со сторонами dx, ch/, dz (рис. 7.1). Пусть мы можем пренебречь всеми объемными силами (силой тяжести и т. д.); принимаем во внимание только силу, связанную с неоднородностью давления, — а это и есть архимедова сила. Как было по- показано в гл. 9 курса механики, эффекты, обусловленные неоднородностью
7.1. ПРОВОДНИКИ В МАГНИТНОМ ПОЛЕ. МАГНИТНОЕ ДАВЛЕНИЕ 241 давления, удобно выводить из объемной плотности силы f = dF/dl/: U = -^ и т. д. =^ f = -VV. G.2) С силой в форме G.2) удобно работать; скажем, закон Архимеда можно мгновенно получить, уравновесив ею плотность силы тяжести pg. Нам же она понадобится для сравнения именно с плотностью силы Ампера, которую мы предварительно перепишем следующим образом: f = [j в] = -[B[VH]] = (BV)H-«V(BH)». Проводя формальные векторные операции с опера- оператором дифференцирования V, следует заботиться о том, чтобы справа от него оставались лишь те вели- величины, которые подлежат дифференцированию. Это- Этому правилу не удовлетворяет последний член в пра- у вой части; чтобы подчеркнуть это, он заключен в р 7 . кавычки. В стоящем справа от оператора скалярном произведении вектор В дифференцироваться не должен. Если, однако, связь между В и Н линейна — а это во всяком случае верно для всех диа- и пара- парамагнитных проводников,, то мы можем представить формулу для плотности силы Ампера в виде (В Т-П f =-УЦ-^ + (ВУ)Н. G.3) / А dz х У Второй член в правой части G.3) называется «максвелловским натяжени- натяжением силовых линий» (формально он и в самом деле имеет вид упругой силы), что же касается первого, то он оказался абсолютно идентичен архимедовой силе G.2), если в нее подставить давление в виде G.1). Таким образом, фор- формула G.1) оказалась точной, но теперь мы должны сделать два важных замечания относительно границ ее применимости. 1. «Натяжение силовых линий» обусловлено их кривизной. Действитель- Действительно, если силовые линии — прямые, то поле может меняться лишь поперек силовых линий, но не вдоль них, поэтому (В V)H = 0. Следовательно, мы можем свести силу Ампера к магнитному давлению, только когда имеем право пренебречь кривизной силовых линий. Это не значит, что они долж- должны быть непременно прямыми — просто радиус их кривизны должен быть много больше толщины слоя, в котором магнитная индукция В меняется на величину порядка ее самой. Вот пример ситуации, когда натяжением пре- пренебречь нельзя: магнитное поле в проводнике установилось таким образом, что токи в нем не текут. Допустим, вне проводника проходит прямой провод с током, и поле в проводящей среде соответствует формуле D.9). Из G.1), казалось бы, следует, что в проводнике возникает некоторый перепад давле- давлений, а значит, и силы. Но из формулы D.6) следует, что при j = 0 должно быть и f = 0. Действительно, можно показать, что в этом случае два члена в правой части G.3) в точности компенсируют друг друга. 2. Возможная причина недоразумений — независимость формул G.1) и G.3) от проводимости среды. На первый взгляд может показаться, что и на диэлектрик должно действовать точно такое же давление. В этой связи полезно напомнить, что при выводе G.3) мы существенным образом вос- воспользовались двумя предположениями: теоремой о циркуляции rot Н = j
242 ГЛ. 7. ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ и линейной зависимостью В(Н). Как уже было замечено в гл. 4, теорема о циркуляции у нас пока не дописана; в нестационарном случае в правой части появится еще один член (и добавим, забегая вперед, — роль его будет тем важнее, чем ниже проводимость вещества). Таким образом, для насто- настоящего диэлектрика наш вывод справедлив только при условии абсолютной стационарности задачи, и, поскольку тока проводимости в непроводящем веществе просто не может быть, два члена в правой части G.3) обязаны при этом точно друг друга компенсировать. Тем самым определяется класс допустимых магнитных конфигураций в линейном диэлектрике. Положение дел меняется, если мы имеем дело с магнитоактивной средой (линейная зависимость В(Н) представляет не более, чем частный случай). Тогда к силам Ампера, обязанным своей природой токам проводимости, до- добавятся силы, обусловленные намагниченностью образца. Это и будет темой последующего рассмотрения. 7.2. Диполь в магнитном поле Хотя векторная природа электрического и магнитного полей различна и магнитный дипольный момент D.21) определяется иначе, нежели электро- дипольный момент A.23), обращает на себя внимание тождественность вы- выражений для поля D.24) и A.25). Из рис. 4.4 можно усмотреть совершенную идентичность картины поля при переходе к приближению точечных дипо- диполей. (Только условия «точечности» будут различны — в одном случае необ- необходимо с надлежащей точностью обеспечить квазинейтральность divE = О, а в другом — неразрывность токов divj = 0.) Мы воспользуемся этим обстоятельством, чтобы избежать весьма трудо- трудоемкого вывода из определения D.21) формул, аналогичных A.27) и A.28), а вместо этого сразу же воспроизведем их с соответствующими переобозначе- переобозначениями: F = V(mB), G.4) М = [mB]. G.5) Как известно из механики, консервативные силы связаны с потенциальной энергией соотношением Fx = —dW/dx в одномерном случае, а в трехмерном мы должны повторить то же самое для Fy, Fz, так что F = — VW — мы уже использовали это обстоятельство в электростатике. Таким образом, G.4) может быть представлена в эквивалентном виде: энергия магнитного диполя во внешнем поле равна W = -(mB). G.6) Это соотношение является базовым для определения единицы дипольного момента — он измеряется в джоулях на тесла (Дж/Тл). Мы уже использо- использовали эту единицу в гл. 5 для магнетона Бора. Если бы речь шла только о заданном диполе — например постоянном маг- магнитике, формулами G.4) и G.6) можно было бы и ограничиться, но в случае, когда мы имеем дело с наведенным дипольным моментом, в них неявно за- заключена опасность ошибки. Именно, если m ос В или вообще дипольный момент функционально как-то связан с полем, возникает вопрос, следует ли и его дифференцировать в G.4). Правильно будет этого не делать, пото- потому что взаимодействие диполя с полем — характеристика силовая и она не
7.2. ДИПОЛЬ В МАГНИТНОМ ПОЛЕ 243 может зависеть от природы диполя: на диполи с одинаковыми дипольны- ми моментами должна действовать одинаковая сила безотносительно к их происхождению. В таких случаях принято указывать в формуле, на какой именно сомножитель действует оператор V: P = V(mB), но лучше привести G.4) к такому виду, в котором m заведомо не дифферен- дифференцируется. Воспользуемся векторным тождеством [m, rotB] = [т [V В]] = V(m В) - (т V)B, которое позволяет записать силу G.4) в следующем виде: F = V(mB) = (mV)B + [m,rotB]. G.7) В магнитоактивном веществе соотношение G.7) естественно представить в форме объемной плотности силы f = (JV)B + [J,rotB]. G.8) В соответствии с вышесказанным, величина J(r) здесь не дифференциру- дифференцируется. Дальнейшее преобразование формулы G.8) требует явного учета зависи- зависимости J(B). Мы ограничимся простым случаем линейной связи, т. е. диа- или парамагнетиками: Подставим это выражение в G.8) и проведем векторное преобразование, ана- аналогичное тому, что мы сделали при выводе G.3): (В V)B + [В, rotB] = A/2)VB2. В итоге получаем ^2 ^ G.9) Мы снова выразили силу, распределенную в среде, в форме градиента да- давления G.2). Но этот результат еще может быть дополнен плотностью силы Ампера G.3), если магнетик одновременно является проводником. Особенно интересно отметить, что эффективное «давление» -^(ВН) G.10) может быть как положительным при /i < 1, так и отрицательным при /i > 1. Как следствие, диамагнетик выталкивается из области более сильного маг- магнитного поля, а парамагнетик, напротив, втягивается в нее. Этот эффект может быть с успехом продемонстрирован на примере растворов пара- или диамагнитных солей. По существу, мы получили объяснение и того общеиз- общеизвестного факта, что предметы из магнитомягкого железа притягиваются по- постоянным магнитом. Конечно, конкретные формулы G.9), G.10) могут ока- оказаться неадекватными из-за нелинейности зависимости J(B), но качествен- качественно это тот же самый эффект. (Что касается магнитотвердых материалов, то здесь может оказаться существенной их собственная намагниченность.)
244 ГЛ. 7. ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ 7.3. Энергия магнитного поля Понятие энергии магнитного поля можно ввести, следуя программе, из- изложенной в гл. 2: оперируя экспериментальной информацией о свойствах магнитного поля, предложить такой мысленный эксперимент, в котором появился бы интеграл движения, включающий аддитивно механическую энергию и в отсутствие магнитного поля к ней сводящийся. Тогда добавка, обусловленная магнитным полем, и должна трактоваться как магнитная энергия. Невозможно, однако, предложить один мысленный эксперимент на все случаи жизни. Поэтому новое понятие неизбежно проверяется снова и сно- снова по мере накопления экспериментального материала, иногда дополняет- дополняется или модифицируется. В конечном счете все принципиальные моменты в физике оказываются — пусть даже 1 *4 косвенно — экспериментального происхо- происхождения. В данном случае особенно деликатным г*—i H^^^l оказывается вопрос о магнитном поле в веществе, поскольку не всегда просто раз- разделить энергию поля, энергию вещества и энергию взаимодействия поля с веще- веществом. а $ Хотя мы уже обсуждали подобного рода р 7 2 вопросы в гл. 2, это краткое введение пред- представляется все же не лишним. А теперь по- поставим первый мысленный эксперимент. Обратимся к рис. 7.2 а. Представим себе тонкий бесконечно длинный идеально проводящий цилиндр (его обыч- обычно называют лайнером), по которому течет однородный азимутальный ток с постоянной линейной плотностью. Внутри цилиндр пуст; никаких источ- источников энергии либо каналов диссипации в задаче нет. Представим далее, что мы сжимаем лайнер, прикладывая извне давление V. При сжатии от начального радиуса R на dR совершается следующая работа на единицу длины: Пусть смещение происходит очень медленно, практически без ускорения, и пусть мы можем пренебречь всеми механическими напряжениями в веще- веществе лайнера. Заметим, что ввиду высокой степени симметрии, магнитное поле вне лайнера — точный нуль, а внутри него оно совершенно однородно и силовые линии параллельны оси. В этой ситуации совершенно неважно, как именно распределен ток по глубине оболочки — все равно имеет место механическое равновесие: V = (ВН)/2. Последующие вычисления будут базироваться на законе Фарадея в его самой простой формулировке: магнитный поток через любой идеально про- проводящий контур — инвариант. В нашей постановке задачи это значит, что инвариантным является произведение поля на площадь поперечного сече- сечения лайнера, т. е. Б, Н ос R~2. Тем самым V ос i?~4, и мы можем через механическую работу определить энергию поля внутри лайнера. Удобно со- сопоставить работу против сил магнитного давления при сжатии лайнера от
7.3. ЭНЕРГИЯ МАГНИТНОГО ПОЛЯ 245 бесконечного до текущего радиуса с энергией поля на единицу длины лай- лайнера: *- = f -B(r)H(r)-2irrdr = d/ R = ttB(R)H(R) Г (-) dr2 = nR2 • )-B(R)H(R). R Мы получили энергию в форме, уже привычной нам из электростатики. Исходя из этого модельного результата, можно предложить следующее вы- выражение для плотности магнитной энергии: »-^3. G.11) которое и подтверждается всем опытом современной электродинамики. Мы получили его сразу в наиболее универсальном виде, который можно будет переносить непосредственно на поле в веществе. В самом деле, мысленный эксперимент станет еще более фантастичным, но не менее корректным, если мы заполним лайнер некоторой идеально сжимаемой магнитоактивной сре- средой, а в результате получится то же выражение G.11) для плотности энергии магнитного поля — но теперь уже В ф /jq H. В качестве следующего объекта для рассуждений возьмем изображенный на рис. 7.2 ^бесконечно длинный идеально проводящий соленоид с плотной намоткой (число витков на единицу длины п = N/1 ^> Д, где R — радиус соленоида, / — его длина). По обмотке соленоида течет ток /, при этом Н = п/, внутри соленоид заполнен сердечником из однородного магнетика. Считается, что зависимость В(Н) известна; она, в частности, может быть и линейной В = /ло/лН, что несколько упрощает конечные формулы. Энергия магнитного поля на единицу длины соленоида dWM ВН f где Фо — поток магнитной индукции через отдельный виток; рассматривая соленоид как целое, учтем, что полный магнитный поток через его обмотку есть Л^Фо, а полная энергия катушки (контура) с током может быть пред- представлена в виде /. ф w = -2~- G-12) Мы снова отдали предпочтение универсальной форме записи, наименее чув- чувствительной к деталям постановки задачи. Но для очень широкого класса контуров без сердечника или с магнитомягким сердечником формулу G.12) можно заменить более конкретной, предполагающей линейную зависимость В(Н): Ф = Ы; W = —, где L = n^ii(nRJl = тт/ло/л {—^. G.13)
246 ГЛ. 7. ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ Коэффициент L — не что иное, как индуктивность соленоида. Она за- зависит, как нам уже известно, только от геометрии контура и магнитной проницаемости вещества сердечника (если таковой имеется). Проведенное выше вычисление энергии катушки с током и введенное по- понятие индуктивности требуют одной важной оговорки. Мы уже отметили в связи с выводом формулы D.13), что поле вне бесконечного соленоида — отнюдь не нуль, а с хорошей точностью — поле прямого тока Явн = //Bтгг). Сравним энергию поля в соленоиде, например, G.13), с энергией внешнего поля. Мы немедленно сталкиваемся с парадоксом: хотя Нви <С nl, что обес- обеспечено неравенством п ^> i?, энергия внешнего поля оказывается фор- формально бесконечной (интеграл f Н^н2тгг dr расходится логарифмически). В зависимости от геометрии системы, возможны два выхода из этой ситуации. 1. Пусть вся электрическая цепь достаточно симметрична. На рис. 7.3 представлен модельный пример полной аксиальной симметрии. Соленоид радиуса R включен последовательно с источником; цепь замкнута внешним цилиндрическим токопроводом радиуса i?BH, соосным с соленоидом. В этом случае справедливость результатов G.12), G.13) можно обеспечить следую- следующим сильным неравенством: ВН • nR2 > fji0 Г Я^н2тгг dr. R Подставляя Я(/), Явн(/) и опуская, ввиду сильного неравенства, коэффи- коэффициенты порядка единицы, получим /j(nRJ > In —^. К (Читатель может проверить этот результат в качестве упражнения.) 2. Если, напротив, электрическая цепь совер- совершенно не симметрична, то на больших расстояни- расстояниях поле ее будет зависеть от координат примерно как поле диполя Явн ос г~3, так что на самом де- деле интеграл энергии сходится при учете реальной р rj о трехмерности задачи. Но характерный простран- пространственный масштаб спадания поля в общем случае не определен, так что для уверенности в правильности формулы G.13) его следует приравнять максимально возможному — длине соленоида /. Отсюда следует оценка ц(пК) ^> I — т. е. в обоих случаях условие на плотность намотки оказывается несколько более жестким, чем предполагалось вначале. Такого рода соотношения приходится постоянно держать в поле зре- зрения при работе с сильноточными системами. Мы хотим в данном случае обратить внимание на ограниченную применимость хрестоматийных фор- формул G.13), но это никоим образом не ставит под сомнение общий резуль- результат G.11), да и формула G.12) при правильном вычислении потока Ф через полный контур (а не только соленоид) остается в силе.
7.3. ЭНЕРГИЯ МАГНИТНОГО ПОЛЯ 247 Дадим формальный вывод выражения для плотности энергии G.11), ба- базирующийся на аксиоматическом представлении о потенциальной энергии произвольной токовой конфигурации. Известному представлению энергии электрического поля = 2 / WE = - I p(r)<p(r)dV v поставим в соответствие в качестве энергии магнитного поля следующее вы- выражение: WM = ±J&A*)dV = iy (A#,rotH) dV, G.14) v v где интегралы берутся по объему всех входящих в систему проводников. Мы распространим интегрирование на все пространство; это не меняет результа- результата, потому что вне проводников j = 0. При этом потенциальная функция А* должна порождать, в отличие от вектор-потенциала D.15), действующее по- поле в веществе В = (Ь), так что, в соответствии с выводом макроскопических уравнений поля в 5.1, Для дальнейших выкладок нам понадобится следующая цепочка преобра- преобразований: div[H, A*] = V[H, A*] + V[H, А*] = А* • rotH - Н • rotA*, с учетом которых G.14) можно переписать в виде W уу м = ^ /(A*,rotH)dF = ^ ! div[H,A,]dF + ^ f Но теперь мы можем первый из интегралов в правой части преобразо- преобразовать с помощью теоремы Гаусса в поток вектора [Н, А*] через бесконечно удаленную поверхность. Поскольку магнитное поле должно убывать как ди- польное или быстрее, на бесконечности Н ос г~3, А* ос r~2, S ос г2, так что этот интеграл равен нулю. Таким образом, rotA* dV = I {^- dV, G.16) что эквивалентно выражению G.11). Тем самым мы фактически продемон- продемонстрировали, что энергия магнитного поля может быть, помимо прочего, представлена в виде G.14), G.15). Убедившись таким образом в правиль- правильности G.14), попробуем дать вывод соотношений G.12), G.13), базирующий- базирующийся уже не на отдельном частном примере, а на общем законе. Для про- простоты ограничимся случаем контура без сердечника; обобщения принципи- принципиальной трудности не составят, но потребуют более громоздких вычислений. В «вакуумном» случае А* = /jqA. Как и при выводе базовых выражений для индуктивных коэффициентов F.3), F.4), будем считать контур тонким.
248 ГЛ. 7. ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ Тогда в интегралах G.14), G.15) jdV => /dl, что позволяет переписать их в виде Далее ответ зависит от того, что мы понимаем под штрихованными вели- величинами в G.17). Если имеется в виду всего один контур, то мы получаем просто формулу G.13), где коэффициент самоиндукции задается выраже- выражением F.4), а если контуров два, то нам придется составить все комбинации, проистекающие от суммирования во всем пространстве j и j7, А и А7: W = \ {Ьг12г + L2I22 + 2Ll2hh) G.18) (мы учли, что L\2 = 1^21 )• В случае многих контуров, вводя обозначение Ьц = L^, можем привести G.18) к универсальному виду: ^^LikIiIk. G.19) г, к 7.4. Подъемная сила электромагнита Темой данного параграфа будет элементарный расчет подъемной силы электромагнита с сердечником из мягкого железа. Для определенности рас- рассмотрим электромагнит типа простого ярма (рис. 7.4 а). Сечение ярма и якоря S будем считать везде одинаковым и настолько малым, чтобы име- имело смысл пользоваться приближением однородной магнитной цепи. Пусть магнитная проницаемость сердечника и якоря равна /i^>l, длина по обходу (характерная длина силовой линии) /, число витков обмотки 7V, ток через обмотку / (детали геометрии сердечника и обмотки при /1>1и1> S1/2 не имеют значения. Подчеркнем, что наша цель — не инженерный расчет, но установление на простейшем примере общих принципов рассмотрения таких систем. В данном случае мы не можем пользовать- пользоваться на только результатом G.10), но и самой идеей его получения. Причина в том, что электромагнит — система динамическая, и корректное ее рассмотрение должно вклю- включать источник тока. Припишем последнему э. д. с. ?, а обмоткам — сопротивление R. Для рассмотрения таких систем весьма продуктивен принцип виртуальных перемещений, который мы уже исполь- использовали в решении задачи 2 гл. 2. Оторвем якорь от ярма, отодвинув его на расстояние dx (рис. 7.4 б) и подсчитаем, какая при этом должна быть совершена механическая работа. Полный энергетический баланс выглядит следующим образом: -Fdx = 6AE -6AI - dWL, где 5Ag — работа источника э. д. с; 5АТ — приращение джоулева тепла; dWL — приращение магнитной энергии контура.
7.4. ПОДЪЕМНАЯ СИЛА ЭЛЕКТРОМАГНИТА 249 Величины 8А? и 6Aj должны вычисляться за время перемещения на фоне постоянной мощности, потребляемой электромагнитом. Введем в рассмотре- рассмотрение также приращения тока в контуре dl и магнитного потока через сердеч- сердечник d<I> в момент перемещения. Эти два приращения должны быть связаны законом Ома и законом Фарадея: Приращение работы источника равно dt dФ SAe =S(I+ dl)dt - SI dt = S dl dt = -S — — = -ЫФ. Приращение джоулевых потерь относительно таковых в стационарном ре- режиме 5АТ = R(I + dlJ dt - RI2 dt ~ 2RI dl dt = -2Id<!>. И, наконец, приращение энергии магнитного поля, в отличие от диссипа- тивных величин 5АЕ и SAn определяется только начальным и конечным состояниями: Последняя цепочка равенств заслуживает особого внимания. Во-первых, при дифференцировании энергии поля мы положили dl = 0, поскольку она при изменении конфигурации зависит лишь от положения якоря при уста- установившемся токе Iq = Е JR. (Напротив, приращение тепловыделения и до- дополнительная работа источника обусловлены как раз приращением тока в контуре в процессе перемещения.) Во-вторых, величина dWL формально со- совпадает с последующим ответом и потому иногда предлагается в качестве его обоснования. Как рецепт такой прием вполне допустим, но необходимо понимать, что за ним не стоит иного содержания, кроме проделанных выше выкладок. Итак, -Р4Х=1-ЫФ^-Р=1-^ = ^. G.20) 2 2 dx dx v J Далее для вычисления Ф заменим dx малой, но конечной величиной х и воспользуемся магнитной цепью с учетом того обстоятельства, что поток через контур в N раз больше потока через сердечник: NI-N _ N2I " l/ifi^S) + 2x/(fjLS) " М/" 1 2/j,x Максимальной величине F — подъемной силе — соответствует предел х —>• 0: 2 7d? 2&х G.21) В заключение зададимся вопросом общего характера. Если сила Лоренца принциально перпендикулярна скорости любой заряженной частицы, как вообще может совершаться работа при проникновении поля в вещество? Че- Чему соответствует потенциальная энергия магнитоактивной среды?
250 ГЛ. 7. ЭНЕРГИЯ И СИЛЫ В МАГНИТНОМ ПОЛЕ Разрешение этого парадокса состоит в непременном учете эффектов элек- электромагнитной индукции. При любой перестройке поля изменение магнит- магнитной индукции дЪ/dt порождает электрическое поле Е, и работу совершает именно это поле. Но сценарий перестройки не входит в ответ, и конечные результаты оказываются универсальными, что и позволяет в очередной раз расширить формулировку закона сохранения энергии. Задачи 1. Вдоль равновесного цилиндрического электронейтрального плазменного шнура (пин- (пинча) течет ток / (рис. 7.5). Определить температуру на оси пинча, считая температуру на его границе пренебрежимо малой. Плотность тока и концентрация частиц плазмы одно- однородны по сечению, причем известно число частиц на единицу длины dN/dz. Решение. Условие равновесия плазменного шнура — баланс силы Ам- Ампера и архимедовой силы. В плазме, как и в газе, давление можно выра- выразить через концентрацию частиц и абсолютную температуру: V = пквТ, где кв — постоянная Больцмана. Таким образом, плотность архимедо- архимедовой силы в нашей осесимметричной системе можно представить в виде 1ГТ7 fp = —Х^пк^Т => (fp)r = —пк^ —. Плотность силы Ампера также имеет только радиальную компоненту: Рис. 7.5 fB = [jв] => (fB)r = -jzBv = -j ¦ В. Поле В при однородном распределении тока определяется с помощью теоремы о цирку- циркуляции (см. задачу 1 гл. 4): В = (l/2)/ioj • г. Из баланса сил следует dr 2 пкв Интегрируя это уравнение, получаем Т(г) ос (const — г ), причем из условия Т ~ 0 на внешней границе пинча следует const = Я2, где R — радиус плазменного шнура. Вблизи его оси (г = 0) получаем ответ 4 пкв который приобретает окончательный вид после подстановки j = 7/тгЯ2, п = (dN/dz)/7rR2 Формула G.22) в магнитной гидродинамике называется условием Беннета. Интересно отметить, что при попытке решить задачу, приравнивая константе сумму газокинетиче- газокинетического и магнитного давлений, мы получили бы результат, отличающийся от G.22) в два раза — это как раз тот случай, когда в выражении для силы G.3) нельзя пренебречь «натяжением силовых линий». 2. В результате некоторого космического события образовалась система, состоящая из звезды (масса Мо, магнитный момент то) и планеты (масса 7kf<CMo, магнитный момент т). Планета движется по круговой орбите радиуса R. Найти возможный разброс величины периода обращения в зависимости от ориентации магнитных моментов, считая плоскость орбиты перпендикулярной то. Решение. Добавочная сила, действующая между диполями, может быть представлена в форме G.4) В = //оН, где Н — поле диполя, которое дается формулой D.24). В нашем слу- случае вычисления существенно упрощаются, поскольку максимальные поправки к периоду
ЗАДАЧИ 251 обращения с очевидностью соответствуют параллельной и антипараллельной ориентаци- ям диполей. При этом первый член в числителе D.24) обращается в нуль, так что для энергии и силы взаимодействия получаются следующие выражения: ттг llo mom ern 3llo mom Уравнение баланса сил во вращающейся системе отсчета: М0М 3//0 mom 7т где 7 — гравитационная постоянная. Мы пренебрегли ради простоты ответа различием между массой планеты и приведенной массой, полагая, что наша поправка будет относи- относительно больше, чем M/Mq. Далее, представляя частоту обращения в виде о;2 ~ u)q^2u)q8u), где ujq = jMo/Rs, получаем: 26и_ _ 26Т_ _ 3//q mpm ~по~ ~ ~То~ ~ тГ' <yM0MR2' Искомая величина разброса периода обращения AT = 2ST, так что окончательный ответ выглядит следующим образом: _ 3//о mom 2 МGМоM/2Я1/2' 3. Один из способов получения сверхсильных магнитных полей — взрывное сжатие ме- металлического лайнера, подобного изображенному на рис. 7.2 а, внутри которого предвари- предварительно создается магнитное поле с индукцией Во. Определить индукцию поля в цилиндре в момент максимального сжатия, если Во = 5 Тл, начальный внутренний радиус лайне- лайнера Rq = 5 см, радиус в момент максимального сжатия Лтт = 0,5 см. Оболочку считать идеально проводящей. Оценить давление, необходимое для такого сжатия. Ответ: Бтах = 500 Тл, V - 106 атм. 4. Длинный цилиндрический стержень с магнитной проницаемостью ц и площадью се- сечения S расположен вдоль оси соленоида так, что один его конец находится внутри, а другой — вне соленоида. Найти силу F, с которой стержень втягивается в соленоид с собственным полем Н. Ответ: F= |//о(// - l)H2S.
ГЛАВА 8 КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ 8.1. Условие квазистационарности электрической цепи. Релаксационные процессы Основной предмет изучения в данной главе курса — электрические це- цепи переменного тока и, как частный случай — колебательный контур. В гл. 6 мы уже фактически рассматривали объекты такого рода в контексте закона электромагнитной индукции. При этом мы по умолчанию воспользо- воспользовались некоторыми приближениями, которые обеспечили плавный переход от известных нам цепей постоянного тока. Например, мы всюду вычисля- вычисляли магнитное поле или вектор-потенциал таким образом, как если бы они порождались постоянным током в проводнике. В последующих главах мы сможем строго определить границы применимости такого рассмотрения, но представление о них желательно иметь уже сейчас. Физика, как и любая естественная наука, постоянно оперирует с моделями реальности (и лишь на этом уровне может называться «точной»). И мы можем правильно оце- оценивать наши результаты лишь постольку, поскольку нам известна область применимости модели. Как уже было замечено, нам еще предстоит дополнить теорему о циркуля- циркуляции с учетом как раз временной зависимости полей. Именно здесь возникает ограничение, которое принято называть условием квазистационарности, т. е. возможности распространять некоторые законы, установленнные для стаци- стационарных цепей, на нестационарные цепи. («Квази-» означает «как бы ... ».) Это условие можно получить, основываясь на том общеизвестном факте, что электромагнитный сигнал распространяется в вакууме со скоростью света с = 3 • 108 м/с. В прозрачной среде (стекло) или специальной транспорти- транспортирующей системе (волновод) эта скорость может быть меньше с, но остается величиной того же порядка. Соответственно, если пространственный мас- масштаб нашей системы (цепи) есть величина порядка /, то характерное время установления полей или токов в цепи (инерционное время) можно оценить как At ~ 1/с. Естественно предложить следующее неравенство в качестве условия квазистационарности: г > //с, (8.1) где г — характерное время задачи. В частности, если речь идет о гармони- гармонических колебаниях либо переменном токе частоты о;, условие (8.1) эквива- эквивалентно следующему: ш < с/1. (8.2) При обратном соотношении мы заведомо должны рассматривать нашу цепь как систему с распределенными параметрами, т. е. просто решать общую
8.1. УСЛОВИЕ КВАЗИСТАЦИОНАРНОСТИ ЭЛЕКТРИЧЕСКОЙ ЦЕПИ 253 задачу электродинамики. Вообще говоря, при рассмотрении электрических цепей обычно по умолчанию предполагается выполненным условие тонкого провода г <С /, где г — характерный поперечный размер проводника. Тем самым обеспечивается независимость результата от распределения тока по сечению провода, а значит — и от самовоздействия через собственное маг- магнитное поле. Но в одном из типичных элементов цепи — конденсаторе — это условие никогда не выполняется, поэтому приближение системы с со- сосредоточенными параметрами раньше всего отказывает именно в емкостном элементе. Обсуждая условия квазистационарности, мы все время адресуемся к тео- теореме о циркуляции. Полезно отметить также, какие законы, напротив, ни- никак не меняются при переходе от стационарных полей к переменным. Во- первых, остается в силе теорема Гаусса как для электрического поля, так и для магнитного. (Это, правда, справедливо без оговорок лишь для точно- точного — микроскопического — поля. Но мы уже говорили о неуниверсально- неуниверсальности процедуры усреднения и ее результата.) Во-вторых — и это даже более интересно — остается в неприкосновенности закон электромагнитной ин- индукции F.10). Этот факт можно считать экспериментальным. Но тогда из теоремы Стокса следует, что сохраняет силу и интегральная форма закона Фарадея F.7). Последнее обстоятельство выглядит отнюдь не тривиальным. Действительно, контур, быть может, не удовлетво- удовлетворяет условиям квазистационарности (8.1), (8.2), так что поле протекающих в нем токов нельзя рассматри- рассматривать как безынерционное, тем не менее, интегральный закон F.7) сохраняется в качестве одного из фунда- фундаментальных. Пусть условие (8.1) выполнено. В качестве простей- простейших примеров рассмотрим так называемые релакса- релаксационные или переходные процессы в цепях, предста- представленных на рис. 8.1 а; б. Пусть конденсатор С на рис. 8.1 а заряжен при разомкнутом ключе К и отсоединен от источника. В р я i качестве начального условия можно взять, например, заряд на обкладках Qq. Замыкаем ключ К и определяем момент замыка- замыкания как t = 0. Далее падение напряжения на сопротивлении подчиняется закону Ома, в котором напряжение есть просто разность потенциалов на обкладках: U = Q/C = -RL Подставим / = dQ/dt и в результате получаем простое дифференциальное уравнение, описывающее разрядку конденсатора через сопротивление R: dQ/dt + Q/r = 0; г = RC. Его решение при заданном начальном условии имеет вид Q = Qo • exp (-t/r); I = (Qq/RC) exp (-t/r). (8.3) Тот же результат можно получить и другим способом, скажем, составить закон Кирхгофа с] Idt + RI = 0,
254 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ а затем продифференцировать его по времени — и мы придем к тому же соотношению. Величина т = RC называется постоянной времени или вре- временем релаксации RC цепочки. Именно эту величину следует подставлять в неравенство (8.1), оценивая пределы применимости модели. Обратимся к RL цепочке, представленной на рис. 8.1 б. Пусть вначале че- через катушку индуктивности L протекал некоторый ток /q, а затем в момент времени t = 0 одновременно размыкается ключ А и замыкается ключ В — таким образом, в начальный момент задается величина тока Iq в катушке. Уравнение для тока в цепи можно представить, например, в виде закона Ома, в котором роль напряжения выполняет э. д. с. индукции в катушке: ? = - d<5>/dt = -L( dl/dt) = RI. Решение похоже на (8.3): (\ (8.4) так что время релаксации tl = L/R. Сколь бы ни было велико сопротивле- сопротивление, в течение этого времени ток остается по порядку величины близким к начальному. Значит, чем выше сопротивление, тем больше и пик напряже- напряжения, приходящийся на время релаксации. Этим и объясняется «искрение» при быстром обрыве тока в цепи конечной индуктивности: напряжение в максимуме оказывается выше пробойного для воздушного промежутка. Об- Обратный эффект наблюдается при включении тока в цепи: индуктивность затягивает установление стационарного состояния. Пусть в момент t = О была замкнута цепь, состоящая из последовательно включенных источника постоянной э. д. с. ?о, индуктивного элемента L и сопротивления R. Ток как функция времени подчиняется уравнению L(dI/dt)+RI = ?0. Его общее решение состоит, как известно, из суммы любого частного реше- решения и общего решения однородного уравнения L(dl/dt) + RI = 0, содержащего одну произвольную константу; последняя позволяет «привя- «привязать» решение к заданным начальным условиям. В нашем случае в качестве частного решения удобно выбрать просто константу Ig = ?o/R, общее реше- решение однородного уравнения имеет вид (8.4) с произвольной постоянной Iq. Полагая ток в начальный момент времени равным нулю, получаем в итоге следующую зависимость /(?): демонстрирующую асимптотическое стремление к стационарному состоя- состоянию, тем более медленное, чем больше постоянная времени ть. Если бы мы заменили индуктивность конденсатором, то аналогичная зависимость полу- получилась бы для напряжения на конденсаторе либо для заряда обкладок, а ток в цепи экспоненциально стремился бы к нулю. В этом случае постоян- постоянная времени в экспонентах равна RC. Предлагаем читателю самостоятельно в этом убедиться.
8.2. КОЛЕБАТЕЛЬНЫЙ КОНТУР 255 8.2. Колебательный контур Подробное рассмотрение свойств колебательного контура еще предстоит в следующем разделе нашего курса, но и в курсе электродинамики невозмож- невозможно оставить без внимания этот фундаментальный объект. Его электрическая схема представлена на рис. 8.2. При этом подразумевается, что в сопроти- сопротивление R включены не только резистивные элементы схемы (если они вооб- вообще существуют), но и «паразитное» сопротивление катушки индуктивности и соединительных проводов. При последовательном со- соединении элементов контура такое объединение вполне корректно. Равным образом «паразитная» емкость ка- , тушки включена в С. 1 С —— ~~|~~ Вывод уравнения колебательного контура полез- полезно предварить следующим замечанием. Если в схему включен источник э. д. с, то его можно включить в за- ис' ' кон Ома или второй закон Кирхгофа как резистивный элемент, при том, что падение напряжения на нем должно быть равно —?. Поэтому и уравнение контура, изображенного на рис. 8.2, можно предста- представить в виде закона Кирхгофа с нулевой э. д. с. на обходе: L(d2Q/dt2) + R(dQ/dt) + Q/C = 0. (8.6) (Мы учли, что заряд на обкладках и ток в контуре связаны соотношением I = dQ/dt.) Возможна эквивалентная форма: L— + RI+- / /dt = O. (8.7) dt С J Дифференцируя (8.7) по времени, получаем снова уравнение (8.6), но уже для тока, Q => /. Таким образом, динамика контура в любом случае описы- описывается дифференциальным уравнением второго порядка d2x/dt2 + 26(dx/dt) + w%x = 0, (8.8) где х — переменная величина (например, Q, /), S = i?/BL), с^о = 1/y/LC. Уравнение (8.8) представляет собой линейное дифференциальное уравне- уравнение второго порядка. Известны методы получения его решения; последнее в общем случае зависит от двух произвольных констант. В конкретной фи- физической задаче эти константы доопределяются через начальные условия. Ввиду исключительной важности «колебательной» терминологии и поня- понятийной системы для всего курса физики, мы уделим особое внимание свой- свойствам решений уравнения (8.8). Начнем с предельного случая нулевой диссипации i?—)>0 => д—>0. Уравнение (8.8) в этом случае вырождается в простое уравнение гармони- гармонических колебаний, решение которого, включающее произвольные константы А, В или А, <р, может быть представлено одной из следующих эквивалент- эквивалентных форм: х = A coscjQt + В s'mcjQt; х = A cos(u;ot + ф х = А sm(ojot + <p)- x = AeiuJot + Be~iuJot.
256 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ Эквивалентность последнего выражения трем предыдущим обусловлена из- известными соотношениями — формулами Эйлера: cosut = A/2)(е^ + е~ш); smut = l/Bi)(eiut - е~ш); elujt = cos cot + г sinc^t. Такое представление осциллирующих функций экспонентами от мнимого аргумента, как мы вскоре убедимся, есть наиболее конструктивный метод описания волновых и колебательных процессов. Коэффициенты А, В называются амплитудными, а величина <р, «сдвига- «сдвигающая» начало отсчета времени, именуется фазой] фазой называют также и полный аргумент осциллирующих функций uj^t + ср. Решение полного уравнения (8.8) отличается от этих чисто гармонических функций лишь учетом диссипации. В самом общем виде оно содержит две произвольных константы и может быть представлено, например, следующим образом: (8.9) где pi?2 суть корни алгебраического уравнения р2 + 2S-p + ojl = 0. (8.10) В случае достаточно слабой диссипации решения (8.9) не должны сильно от- отличаться от чисто колебательных. Тогда корни pi^ оказываются комплекс- комплексными величинами, так что мы можем, используя формулы Эйлера, записать решение в эквивалентной форме: x = Ae~6t cos(ojt + (p), (8.11) здесь А — амплитуда, ср — фаза колебательного решения, ио = (ujq — S2I/2. Сразу видно, что при 6 < coq решение, действительно, оказывается осцил- осциллирующим во времени. В обратном случае оно представляет собой моно- монотонно затухающую функцию, которую лучше всего представлять именно в виде (8.9). Величина S=R/BL) называется декрементом затухания; по фи- физическому смыслу это обратное время затухания колебаний в е=2,718... раз. Если 5 ^ иоо, колебания можно считать почти периодическими, подобно приведенным выше решениям для уравнения гармонических колебаний. Это неравенство удобно переписать как условие для характерных времен: RC < L/R или просто R < \/L/C. (8.12) При этом uj с± с^о- При условии (8.12) корни уравнения (8.10) оказыва- оказываются непременно комплексными, а с ними и решения (8.9). Надлежащим выбором констант интегрирования они «привязываются» к вещественным начальным условиям; соответственно, решение (8.11) представлено в фор- формально вещественном виде. Но такое представление оказывается не слиш- слишком удобным. Применяя к той или иной осциллирующей функции линейные операции дифференцирования либо интегрирования, мы всегда вынуждены будем превращать sin в cos и наоборот, да еще и с учетом знака; дополни- дополнительно усложняет как процедуру, так и ответ экспонента, модулирующая в (8.11) тригонометрическую функцию. Намного проще та же операция с
8.2. КОЛЕБАТЕЛЬНЫЙ КОНТУР 257 чисто экспоненциальными функциями типа (8.9). Экспонента при диффе- дифференцировании или интегрировании просто умножается на постоянный мно- множитель, каждый раз один и тот же. С другой стороны, как мы уже виде- видели, cos представляет собой функционально вещественную часть экспоненты (a sin — мнимую), поэтому в линейной задаче (пока решения не приходится перемножать, возводить в степень и т. д.) их нетрудно поставить во взаимно однозначное соответствие. Таким образом, решение типового уравнения (8.8) ищется в виде х = А • exp(iujt - St + <р), (8.13) а затем физические величины (/, U) получают, взяв от него только веще- вещественную или только мнимую часть. Чаще всего в этом даже нет необходи- необходимости, поскольку амплитуда и фаза, определенные из начальных условий, полностью описывают колебательный процесс. При дифференцировании решения (8.13) последнее просто умножается на (ico — 8), при интегрировании — делится на ту же величину. Из соотношения следует, что при умножении или делении на мнимую единицу полная фаза меняется на тг/2 — это как раз и соответствует переходу синуса в косинус и наоборот. При необходимости работать с квадратичными величинами (как-то энер- энергия колебаний) представление (8.13) уже не годится, но экспоненциальную форму решения можно сохранить, заменив (8.13) следующим — уже вполне точным — решением: где звездочка — знак комплексного сопряжения. Подобно тому, как у ме- механического маятника сумма потенциальной и кинетической энергий есть величина постоянная (в пренебрежении диссипацией!), а средние их значе- значения по периоду равны, для колебательного контура при 6 ^ coq имеют место следующие соотношения: (L/2)(I2)T = (C/2)(U2)T; LI2/2 + CU2/2 = W = const. (8.14) Читателю предлагается самому убедиться в справедливости (8.14); заме- заметим, что, помимо данного выше рецепта, можно пользоваться и тригономе- тригонометрическим представлением (8.11) вместе с известными свойствами средних: (cos2 u)t)T = — / cos2 cot dt = (sin2 ujt)T = -. 2тг J 2 —-к/и При учете конечной величины затухания получаем 1/Косехр(—26t). Как характеристика малости затухания часто используется величина, именуе- именуемая в теории колебаний добротностью (обозначение — Q, от английского quality). По определению Q = шо/B6) = ujqL/R = A/VRC)^L/R. (8.15) В любой из этих формул подразумевается, что добротность — характери- характеристика колебательного контура. На самом деле это понятие гораздо шире, а
258 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ потому мы приведем его к более универсальному виду. Пусть W — запас энергии в контуре. Оценим потери энергии за период, считая диссипацию слабой: 8 <^ио. ATW = W(l - е~25'т) ~W-25-T = 2ttW/Q. Таким образом, добротность, с точностью до коэффициента — это обратное отношение энергии, запасенной в колебательной системе, к ее потерям за период: Q = 2nW/ATW. (8.16) 8.3. Вынужденные колебания. Переменный ток Из проведенного выше рассмотрения переходных процессов — формулы (8.3)—(8.5) — следует, что емкостные и индуктивные элементы можно вклю- включать в цепь так, как если бы это были сопротивления, но, в отличие от последних, падение напряжения на них в зависимости от тока задается не умножением, а другими линейными операциями: t; UL=L^. (8.17) Поэтому, например, для случая гармонической функции I(t) падение на- напряжения на конденсаторе или катушке индуктивности, помимо амплитуд- амплитудного коэффициента, характеризуется также фазовым сдвигом Аср = ±тг/2. Такие элементы называются реактивными, в отличие от активного эле- элемента — сопротивления. (Строго говоря, любой соленоид, если только он не сверхпроводящий, обладает активным сопротивлением, так что и сдвиг фаз оказывается меньше тг/2.) Главное свойство чисто реактивного элемен- элемента состоит в том, что синусоидальный ток проходит его без энергетических потерь. В самом деле, подсчитаем выделение энергии в среднем за период: tt/uj tt/uj (W) = — / I(t)U(t)dtoc / cos cut sinutdt = 0. —tt/uj —tt/uj В общем случае синусоидальных тока и напряжения, сдвинутых по фазе на ср: I = Iq cosc^t; U = Uq cos(u;t + ф) — среднее энерговыделение равно тг/о; {W) = ^ J I(t)U(t)dt = |/ot/o cos^. (8.18) —-к/и Нетрудно заметить, что знак сдвига фазы не имеет значения. Это впол- вполне физично, поскольку «опережение» или «отставание» по фазе суть по- понятия условные и зависят, например, от принятого в определении (8.13) знака частоты. Так же легко понять, что, пока и поскольку мы не вклю- включаем явно в нашу цепь динамомашину, ограничиваясь пассивными элемен- элементами i?, L, G, сдвиг фазы не может превышать тг/2, точнее, при произволь- произвольном определении момента включения, он обязан принадлежать интервалу
8.3. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ. ПЕРЕМЕННЫЙ ТОК 259 [Bп — 1/2) тг; Bп + 1/2)тг] , где п — любое натуральное число. В противном случае энергия в цепи не рассеивалась бы, а порождалась. В частном случае активного сопротивления (8.18) дает (W) = (l/2)IQUo = R(I2)T = (U2)T/R. Это соотношение принято привязывать к формуле C.13) и таким образом определять эффективное напряжение сети; например, стандартному напря- напряжению 11эф = 220 В соответствует амплитуда синусоидального напряжения Uq = л/2?7^ф ~ 311 В. Так же определяется и эффективное значение тока — как постоянный ток, эквивалентный данному переменному по тепловому эффекту; соответственно, /эф = /о/л/2. Предположим, что мы имеем дело с цепочкой, изображенной на рис. 8.2, но теперь в контур последовательно включен источник синусоидальной э. д. с, так что, в отличие от (8.6), (8.7), динамика тока в цепи определяется урав- уравнением: -j^ f Idt = ?oelQt. (8.19) Как уже говорилось, решение линейного уравнения с правой частью может быть представлено как сумма любого частного решения, удовлетворяющего этому уравнению, и общего решения однородного уравнения (т. е. без пра- правой части); последнее в случае уравнений второго порядка зависит от двух произвольных констант, согласующих его с начальным моментом времени. Действительно, пусть I\{t) и hit) — два решения (8.19), тогда разность I\{t) — I2(t) должна быть, в силу линейности, решением уравнения (8.7). Общее решение однородного уравнения можно взять в форме (8.11); оно с течением времени будет затухать. Характерное время затухания т ~ 1/S. Частное решение будем искать в виде незатухающих колебаний с частотой приложенного напряжения — /(*) = / • ехр(гШ); I = Ioeitp. (8.20) Аналогичная зависимость от времени должна получиться для падения на- напряжения на любом элементе, заряда конденсатора и прочих динамических величин. Ради удобства последующих операций мы полагаем величину / в (8.20) комплексной — помимо собственно амплитуды 7q, в нее входит и сдвиг фаз (р по отношению к внешней э. д. с. Подставляя (8.20) в (8.19), убеждаемся, что оно и в самом деле является решением. Комплексную ам- амплитуду тока можно получить из уравнения Нетрудно усмотреть прямую связь с формулами (8.17) — получился про- просто закон Ома в частном случае синусоидального напряжения и тока. Но теперь мы можем грамотно ответить на вопрос о процессе установления то- тока при включении внешней э. д. с, тем более важный, что фаза ?(t) в момент включения не определена. Итак, включение переменного тока сопровожда- сопровождается «звоном» собственных колебаний контура, затухающим с характерным временем 1/5. Именно эти колебания обеспечивают согласование цепи с фа- фазой источника. Если же мы, как обычно в электротехнике, интересуемся установившимися колебаниями при t ^> 1/E, то можно использовать закон
260 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ Ома, приписав пассивным элементам следующие комплексные сопротивле- сопротивления (такое «сопротивление» принято называть импедансом): С помощью несложных преобразований из выражения для тока (8.22) / Рис. 8.3 следуют ответ для амплитуды /о = и фазы tgip = (ImJ)/(ReJ) = (OL - l/(ftC))/R. (8.23) Полученные нами ответы допускают удобную графическую интерпрета- интерпретацию — и, в принципе, их можно получать именно графически. Это так назы- называемый метод векторных диаграмм. Интересующий нас случай демонстри- демонстрируется на рис. 8.3. Представим каждый ток и каждое напряжение вектором, которому в полярных координатах соответствуют модуль (амплитуда) и полярный угол (фаза). Зада- Зададим произвольно направление вектора /, а длина его задает масштаб. Напряжение UR синфазно току, соот- соответственно, откладываем UR = IR параллельно век- вектору /. Напряжение UL = ftLI откладывается перпен- перпендикулярно / с опережением по фазе (соответственно мнимой единице в коэффициенте), a Uc = I/(ftC) — с отставанием. Сумма всех трех векторов напряжения даст вектор ?, так что из рисунка можно определить и фазу, и — по отношению масштабов длины — модуль импеданса \Z\ = ?о/1о- Для простой схемы графический метод не дает существенных преимуществ в сравнении, например, с формулами (8.22), (8.23), но для сложных много- многосвязных схем такой анализ может быть заметно легче алгебраических вы- вычислений. Предположим, что мы при заданной амплитуде ?о варьируем частоту внешней э. д. с. ft. Из (8.22), а еще нагляднее — из рис. 8.3 — можно усмотреть, что при UL = Uc (по модулю) отклик — амплитуда тока — будет максимален, т. е. имеет место резо- резонанс. При последовательном соединении элементов он называется резонансом напряжений. Резонанс- Резонансная частота оказывается равной как раз собствен- собственной частоте контура без учета диссипации ujq = = 1/y/LC. На этой частоте сопротивление цепи — чисто активное, Z = R. Кривая отклика /(О) показана на рис. 8.4. (Вблизи резонансной частоты она обычно так и называется — резонансной кривой.) Чтобы сравнивать резонансные кривые различных контуров, принято сравнивать их ширину на уровне отклика составляющего 1/v 2 от максимума. Определим, какому сдвигу частоты этот уровень соответствует, полагая 6ft ^C ujq: ^ - л/9 = 1 R ч? Рис. 8.4
8.3. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ. ПЕРЕМЕННЫЙ ТОК 261 Вспоминая определение добротности (8.15), эту формулу можно привести к следующему виду: Окончательный ответ: АО = 2(Ш = uo/Q- (8.24) Отсюда можно понять, почему добротности присвоен столь «значащий» термин. Еще один вид резонанса — его называют резонансом токов — пред- представлен на рис. 8.5 а; б. Для простоты будем считать сопротивление катуш- катушки индуктивности пребрежимо малым. В этом предельном случае результат можно V получить без вычислений, на основе лишь i 1 векторной диаграммы 8.5 б. На параллельно С _|_ соединенных элементах общим должно быть ' ~^~ напряжение, а токи 1С и /L, соответствен- т U но, опережая и отставая по фазе на тг/2, вы- -*"- I - числяются по уже известному нам рецепту. а ' И если 1Т = 1п — это получается при О = ^ l с * Рис. 8.5 / то при отличном от нуля напря- напряжении ток в неразветвленном участке цепи равен нулю. В действительно- действительности при учете активного сопротивления получается просто более или менее острый минимум тока, при этом импеданс цепи опять соответствует чисто активному сопротивлению. Как пример отклика электри- 0__/TyTl ческой цепи на несинусоидаль- ,, ную переменную э. д. с. рассмот- ^ '' . I рим цепочки, изображенные на # рис. 8.6. На входные клеммы по- подается некоторый сигнал ?(t) с характерным временем эволю- -*—г ции т. Можно для оценок пользо- ~Г ваться также характерной часто- в г той в спектре сигнала uj ~ т~1. Рс86 Отклик — напряжение — снима- снимается с выходных клемм, как показано на рисунках; предполагается, что со- сопротивление измерительного прибора столь велико, что он не вносит за- заметного вклада в уравнение цепи. Тогда динамика цепочек рис. 8.6 а, б описывается уравнением а) Если RI < L/, т. е. L/R > т, то / ~ ?(t)/L => / ~ L / ?(t) dt, таким образом, с сопротивления будет снят сигнал UR ос/ос / ?(t)dt.
262 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ б) В обратном случае L/R <С т получаем / с± ?(t)/R. Снимая сигнал с индуктивности, имеем тт т d?^ ULccIcc—. В свою очередь, цепочкам рис. 8.6 в, г отвечает уравнение: RQ + Q/C = ?(t). в) Если RI > Q/C, т. е. RC > т, то 7 ~ ?(i)/R, и с конденсатора можно снять сигнал Uc ocQoc Г S(t)dt. г) При обратном соотношении RC <С т получаем Q ~ C?(t); соответствен- соответственно, сигнал с сопротивления — и.осЦсс. Мы рассмотрели все четыре случая, базируясь на оценках, но те же ре- результаты можно получить и более строго на основе Фурье-разложения сиг- сигнала. Цепочки а, в на рис. 8.6 называют интегрирующими, а б', г — диффе- дифференцирующими. (Разумеется, при этом важна не только схема включения, но и соотношения характерных времен, заданные выше.) Их часто использу- используют в качестве элементов различных измерительных схем. Конечно, точность выполняемых ими операций не слишком высока — как и у всех вообще ана- аналоговых систем — зато они очень просты. 8.4. Скин-эффект В настоящем параграфе мы рассмотрим особый случай квазистационар- квазистационарных процессов — токи высокой частоты, для которых остаются справедли- справедливыми условия (8.1), (8.2), но теряется понятие электрической цепи как со- совокупности элементов с сосредоточенными параметрами. Тем самым будут получены дополнительные к (8.1), (8.2) условия того, что систему провод- проводников можно будет рассматривать как электрическую цепь. Skin — по-английски «кожа», скин-эффект — протекание токов достаточ- достаточно высокой частоты в тонком приповерхностном слое хорошего проводника. При этом в глубине проводящей среды ток может быть сколь угодно малым. Как мы вскоре убедимся, благоприятным условием для проявления скин- эффекта оказывается как можно более высокая проводимость вещества. Это может быть металл, а может и плазма, которая при термоядерных темпе- температурах ~ 107-108 К по проводимости превосходит металлы примерно на порядок. Однако при достаточно высоких частотах скин-эффект характерен даже для человеческого тела — при контакте с источником происходит про- прогрев тонкого слоя кожи, но исключается поражение электрическим током. Сколь высока должна быть частота и сколь хороша проводимость, станет ясно из оценок, которые вскоре будут сделаны, а пока мы примем этот факт как экспериментальный. Трактовать это явление можно по-разному, но в общем, классический скин-эффект вполне объясняется классической электродинамикой, и мы
8.4. СКИН-ЭФФЕКТ 263 этим ограничимся, но не пойдем традиционным формальным путем, а по- построим наше изложение на фундаментальном принципе Ленца и его коли- количественном выражении — законе Фарадея F.7): dt Вакуум Проводник Ради упрощения последующего рассмотрения предположим, что у проводя- проводящей среды \i с± 1, что всегда верно для плазмы и с хорошей точностью — для большинства хорошо проводящих металлов. Напомним экспериментальный факт, уже упомянутый в гл. 7, — заме- замедление падения монеты (строго говоря, любого проводящего тела), если в процессе падения она пересекает силовые линии магнитного поля, например, если мы ее роняем между полюсами мощного электромагнита. Это происхо- происходит, как мы уже выяснили, вследствие возбуждения э. д. с. индукции и, как следствие, генерации индукционных токов. Если бы внешнее поле совсем не проникало в про- проводящую среду, монета вообще бы повисла в возду- воздухе — это случай так называемого магнитного удер- удержания или вмороженности поля. Но она падает, хотя и медленно, значит, поле как-то все же в про- проводник просачивается. Чтобы понять, как это проис- происходит, рассмотрим модельную плоскую задачу. Геоме- Геометрия ее представлена на рис. 8.7. Пусть в начальный момент времени вне проводника существует однород- однородное магнитное поле В, а в толще проводника поле равно нулю; скачок поля на границе поддерживается поверхностным током. Именно так должно случить- В J Рис. 8.7 dt ся, согласно принципу Ленца, при быстром включении внешнего магнитного поля. Связь между поверхностной (линейной) плотностью тока и полем вне проводника была нами установлена на основании теоремы о циркуляции в задаче 2 гл. 4: Нви = г/2. Пусть этот ток распределен в слое толщины 6 вбли- вблизи поверхности проводника, т. е. j ~ г/6. Таким образом, индукция внешнего поля и плотность тока связаны соотношением В = /iOff ~ /i0 — ~ /J.OJS. Чтобы рассмотреть эффект проникновения магнитного поля в среду (или, что то же, расширения токового слоя вглубь), дополним наши оценки зако- законом Ома в локальной форме j = АЕ. Заодно перейдем от общего закона F.7) к конкретной оценке для контура А на рис. 8.7: dt dt (8.25) что дает В ¦ dS/dt ~ j/X ~ В/(Х(мо6). Учитывая, что <5d<5/di = (l/2)(d82/dt), получаем окончательный и притом очень простой ответ 52 ~ (8.26)
264 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ Этот результат абсолютно тождествен закону диффузии (который матема- математики любят называть также «прогулка пьяницы»): (х2) ос D •?, (8.27) где D — коэффициент диффузии. (В нашем курсе процессы переноса, вклю- включая диффузию, будут подробно рассмотрены в заключительном — пятом разделе.) Таким образом, поле (и ток) просачивается в проводящую среду по диф- диффузионному закону. Так и говорят: диффузия магнитного поля. Этот ре- результат получен нами в модельной задаче как следствие простых оценок, но он является совершенно общим, и выражение для коэффициента диффу- диффузии поля оказывается верным вплоть до коэффициента DB = l/(A/io)- И вот теперь на базе этого результата мы немедленно и практически без вычислений сможем понять природу скин-эффекта. Пусть на границе про- проводника создано быстропеременное поле (как следует из теоремы о цирку- циркуляции, по ней при этом протекает быстропеременный ток). Оценим глубину, на которую продиффундирует поле за период, V2 . (8.28) Если этот масштаб много меньше /, где / — характерный размер проводника, то поле и ток окажутся локализованы в более или менее тонком слое у поверхности. Отсюда можно получить и обещанные условия на частоту и проводимость. Существенным оказывается произведение этих двух величин. Если ш\ > —рг, (8.29) то мы будем иметь дело не с однородным распределением тока по сечению проводника, которое до сих пор всегда молчаливо предполагали, но со скин- эффектом. Точные решения системы уравнений электродинамики для плоского про- проводника, а равно и цилиндрического, если толщина скин-слоя много меньше его радиуса, дают В ос Е ос j ос ехр ( -— ) , где 50 = ^Ф V °о/ (тгI/^ что, безусловно, демонстрирует очень хорошее соответствие с нашей простой оценкой. В случае ярко выраженного скин-эффекта существенным образом меня- меняются как сопротивление, так и самоиндукция проводников. Как следствие, цепь стремится превратиться в систему с распределенными параметрами. Если в формуле (8.29) в качестве I фигурирует поперечный размер провод- проводников, то это условие, не посягая на квазистационарность задачи — неравен- неравенства (8.1), (8.2) остаются в силе, в принципе ставит под вопрос само прибли- приближение электрической цепи. Таким образом, при условии (8.29), возможно, придется перейти от сравнительно простой электротехники к полноценной электродинамической задаче.
ЗАДАЧИ 265 Задачи 1. Последовательно соединенные дроссель и омическое сопротивление R присоединены к источнику постоянного напряжения с э. д. с. ? (рис. 8.8 а). Индуктивность дросселя, когда в него вставлен железный сердечник G, равна Li, а без сердечника — L2. Вначале сердечник был вставлен, ток в цепи установился. В момент времени t = 0 сердечник очень быстро вынимают (за время, много меньшее времени релаксации). Определить ток в цепи I(t) при t > 0. Решение. При быстром удалении сердечника изменяется индуктивность дросселя и ток через него, но магнитный поток измениться мгновенно не может: g Ф = Li — = L2/o, К где /о — ток через дроссель в момент t = +0. В последующие моменты времени цепь подчиняется уравнению: Решение этого линейного уравнения с правой частью имеет вид: Его нужно еще связать с начальным условием I (t = 0) = /о- Отсюда следует ответ — см. рис. 8.8 б — n 1 + - exP Л Рис. 8.8 Рис. 8.9 2. Вблизи катушки колебательного контура с параметрами Li, С, R расположена вто- вторая катушка с индуктивностью L2 (рис. 8.9). Взаимная индуктивность катушек равна L\2. Какой будет частота собственных колебаний контура, если выводы второй катушки за- замкнуты накоротко? Считать, что активное сопротивление второй катушки пренебрежимо мало. При каком условии резонанс невозможен? Решение. Собственные колебания контура описываются системой уравнений: d/i d/2 п т dl\ dl2 s-i—i f 12 dt dt ~ ' dt dt * J Исключая dI2/dt, получаем h dt = 0. откуда и можно определить все интересующие нас величины: 1 Тс 2LJ ' R 2L' где L = U- L2
266 ГЛ. 8. КВАЗИСТАЦИОНАРНОЕ ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ Заметим, что L ^ О, потому что L\i > 1/(LC), т. е. если R2C L1L2. Резонанс недостижим, если (R/2LJ > L 3. Длинный соленоид с плотной намоткой размещен на цилиндрическом железном сер- сердечнике с магнитной проницаемостью /и, и проводимостью Л. Соленоид замкнут на конден- конденсатор, в результате чего образован контур с резонансной частотой ш (рис. 8.10). Радиус сердечника го, утечки в конденсаторе несущественны, обмотку и со- соединительные провода можно считать идеально проводящими. Опре- Определить добротность контура. Решение 1. Будем считать, что иХ <С 1/(//оА^о)- При этом условии можно пренебречь скинированием токов Фуко в сердечнике. Тогда магнитное поле внутри сердечника можно считать однородным и записать закон Фарадея в виде: Е • 2тгг = и • тгг Во sin tot 7-1 ^0 Е = —- lot smujt, Рис. 8.10 где Е (г) — вихревое электрическое поле. Подсчитаем мощность энерговыделения на единицу длины сердечника: ^(W) = I E-XEdS =-Xuj2Bq sin2ut r0 I 2тгг dr. Таким образом, потери за период на единицу длины будут равны _Т2о2 4Л_^2(М), А с другой стороны, полная энергия, запасенная в контуре, равна W = WL + Wc = 2(WL)T = (ВН)Т • тгго/. Вспоминая определение добротности (8.16), получаем ответ: Q Q = Решение 2. Рассмотрим ту же задачу в пределе высоких частот, когда токи Фуко заведо- заведомо скинированы, т. е. loX ^> 1 /(fiofirl). Теперь ток и поле в сердечнике будут сосредоточены в тонком слое 6эф <С го, прилегающем к поверхности, где 6эф задается формулой (8.28). Чтобы не смешивать эффекты разной природы, предположим, что магнитная проницае- проницаемость от частоты не зависит. Полагая неравенства достаточно сильными, мы не будем решать точной задачи о рас- распределении полей и энерговыделения, а ограничимся оценочными формулами, а именно: ту Н • 2тгг = • 2тгг = I ~ j • 2тгг6эф. (f), н в \ ~—(ЯВ)т5эф. Отсюда
ЗАДАЧИ 267 4. Железный сердечник несет на себе две обмотки (рис. 8.11). Одна обмотка, из большо- большого числа п витков, присоединена к источнику синусоидальной э. д. с. 8. Другая обмотка состоит из одного однородного кольца, сопротивление которого — R. Точки А, В, С этого кольца отстоят друг от друга на равных расстояниях. Если к двум из этих точек присоединить амперметр переменного тока с сопротивлением г, что он покажет? Рассмотреть два варианта подключения, обозначенных на рис. 8.11. Ответ: а) 1А = n(9r + 2R)' iA = n(9r + 2R)' Рис. 8.11 5. Для схемы, изображенной на рис. 8.12, определить частоты источника э. д. с, соответствующие резонансам токов и напряжений. Построить график сдвига фазы то- тока / относительно э. д. с. источника 8 в зависимости от частоты источника, считая все активные сопротивления пренебрежимо малыми. Ответ: а) резонанс токов Z~x = 0 => ujq = 1/л/ЬС; б) резонансы напряжений Z = 0 => =^> ил = л/2 - л/З/л/LC ~ 0,52/л/ЬС, ии2 = л/2 + лД/л/ЬС ~ 1,93/у/LC. Зависимость сдви- сдвига фазы от частоты представлена на рис. 8.13. 71/2 -71/2 ее>0 |со2 Рис. 8.12 Рис. 8.13
ГЛАВА 9 УРАВНЕНИЯ МАКСВЕЛЛА 9.1. Ток смещения. Обобщение теоремы о циркуляции Данную тему мы начнем с мысленного эксперимента. Представим себе заряженный сферический конденсатор (рис. 9.1), у которого пространство между обкладками заполнено однородным диэлектриком. Пусть заряды об- обкладок равны =LQ. Предположим, что в некоторый момент времени диэлек- диэлектрик практически мгновенно и всюду однородно переводится в проводящее состояние. В случае мысленного эксперимента неважно, как именно это сде- сделано — скажем, импульсом ионизирующего излучения. Итак, в силу абсо- абсолютной симметрии постановки задачи, конденсатор начинает разряжаться также симметричным образом, т. е. вектор плотности тока направлен строго по радиусу: -Q Рис. 9.1 3 = -(r/r)[(dQ/dt)/D7rr2)]. Знак «—» учитывает, что ток разряжает конденсатор, по- понижая Q, а зависимость j ос 1/г отвечает закону сохра- сохранения заряда, который должен выполняться, по крайней мере, в случае достаточно медленного процесса разрядки. Действительно, если при протекании тока нигде в диэлек- диэлектрике не происходит накопления заряда, ток через любую сферическую по- поверхность, концентрическую с обкладками, должен быть одинаков, а значит, плотность тока обратно пропорциональна площади сферы. При попытке применить теорему о циркуляции в форме D.10) мы столк- столкнулись бы с очевидным абсурдом. Единственно разрешенным направлением для Н в случае столь высокой симметрии было бы радиальное направле- направление г/г. Но эта возможность исключена теоремой Гаусса для магнитного поля D.1), поскольку такая конфигурация отвечала ___ J^V^7 бы магнитному заряду в центре симметрии. Таким S^>J образом, единственно разумный ответ в данной за- Н даче — нулевое магнитное поле. С другой стороны, приложив формулу D.10) к любой токовой трубке, мы получили бы § Н dl ф 0. Значит, мы должны так модифицировать теорему D.10), чтобы в данной за- задаче получить строго нуль в правой части. Другую иллюстрацию той же проблемы предста- представляет рис. 9.2. Квазистационарный ток I(t) проте- протекает по цепи, содержащей конденсатор. Вдали от конденсатора магнитное поле у проводов должно определяться формулой D.10). Давайте, однако, натянем на контур X, охватывающий провод, такую поверхность *S, которая Рис. 9.2
9.1. ТОК СМЕЩЕНИЯ. ОБОБЩЕНИЕ ТЕОРЕМЫ О ЦИРКУЛЯЦИИ 269 проходила бы между пластинами конденсатора. Тогда и поток заряда — ток — через нее будет равен нулю, но совершенно очевидно, что значение магнитного поля, а значит и циркуляция его по любому контуру от таких построений не зависит. Таким образом, модификация теоремы D.10) должна «замкнуть» ток через конденсатор. Удобнее все же вносить поправки не в формулу D.10) как таковую, а в соответствующее ей локальное уравнение D.12): rotH = j + ... ? Вернемся к ситуации, изображенной на рис. 9.1. Поправка, обращающая для этого случая в нуль правую часть D.12), должна иметь вид: J~ Airdtr^r- at' v ' Можно убедиться, что и проблему, представленную на рис. 9.2, поправ- поправка (9.1) полностью разрешает. В самом деле, dD_ _ д_Ц_ _ елдЦ_ _ С_<Ю_ _ dQ/dt dt ~?°dtd " d dt " S dt " S ' Интеграл по поверхности S рис. 9.2 даст просто полный ток /. Величина, представленная формулой (9.1), называется плотностью тока смещения, а поток от нее — соответственно, током смещения. К тому же результату можно придти и другим путем, исходя из закона сохранения заряда C.7): (др/Ot) + div j = 0. Если мы возьмем дивергенцию от уравнения D.12), то в правой части по- получим нуль: div (rot H) = V[VH] = 0. Значит, нуль должен получиться и в правой части: что тождественно удовлетворяется как раз добавкой (9.1). Все приведенные рассуждения являются хорошими аргументами в пользу (9.1), но отнюдь не бесспорными доказательствами, и окончательное слово остается, как обыч- обычно в физике, за экспериментом. Логика, которой мы следовали, для физики вообще характерна. Мы стартовали от простых эмпирических законов (Ку- (Кулона, Био и Савара и т. п.), а пришли к соотношениям гораздо более общим и базирующимся на новых понятиях. После этого надлежит от аналитиче- аналитических методов вернуться к эксперименту и убедиться в правильности нашего понимания законов природы. Экспериментальное тестирование этих зако- законов будет продолжаться и далее, но уже на предмет установления границ их применимости. Таким образом, основные уравнения электродинамики — уравнения Максвелла — должны рассматриваться, подобно законам Нью- Ньютона, именно как обобщение огромного массива экспериментальной инфор- информации.
270 ГЛ. 9. УРАВНЕНИЯ МАКСВЕЛЛА 9.2. Уравнения электромагнитного поля Наиболее компактный вид уравнения Маквелла имеют в локальной форме: rotH=j + (<9D/<9?); (9.2) rotE = -dB/dt; (9.3) divD = p; (9.4) divB = 0. (9.5) Особенно простой и согласованной выглядит эта система уравнений для электромагнитного поля в вакууме, когда по физическому смыслу величины ЕиБ, а также В и Н тождественны (в системе СГС они просто равны друг другу). Но и в этом случае система уравнений еще не замкнута, поскольку должны быть еще определены величины j(E,В) и /э(Е,В). Таким образом, уравнения поля, вообще говоря, должны решаться совместно с уравнениями, описывающими вещество. Последние, в частности для случая поля в среде, позволяют установить связь между полем и индукцией: D = е Е; (9.6) В = /Ш. (9.7) Здесь ?(Е, В) и /i (E, В) — самый общий вид операторов, связывающих две величины. В простейшем случае, которым мы пока в основном ограничива- ограничивались, это просто константы вещества. В анизотропных средах, скажем кри- кристаллах, они могут превратиться в тензоры, могут вместо константы быть представлены интегральным оператором, могут быть комплексными и нели- нелинейными по полям. Любое из этих представлений неуниверсально, границы применимости каждого из них существенно уже, чем собственно уравнений поля, и по традиции уравнения (9.6), (9.7) вместе с законом Ома и т. п. вы- выделяют в особую группу и называют материальными уравнениями, тогда как уравнениями Максвелла считаются именно (9.2)-(9.5). Как мы уже могли убедиться, для решения многих, в особенности простых, задач может быть весьма полезна интегральная форма уравнений Максвел- Максвелла — совершенный эквивалент формул (9.2)-(9.5): / Б | / (9.8) -^; (9.9) J ot Ф DdS = gE; (9.10) Ф BdS = 0. (9.11) Любое уравнение можно брать в любой форме, локальной либо инте- интегральной, руководствуясь исключительно соображениями удобства. Систе- Система уравнений Максвелла решается при следующих граничных условиях на
9.2. УРАВНЕНИЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 271 поверхности: [Ет]=0; (9.12) [Вп] = 0; (9.13) [Dn] =0 или а = dq/dS; (9.14) [Нт] =0 или i = dl/dl (9.15) Напомним, что квадратные скобки здесь означают скачок соответствую- соответствующей величины на поверхности. В правой части двух последних уравнений стоит нуль или, соответственно, поверхностная плотность заряда и тока в зависимости от того, рассматриваем ли мы истинную границу или предста- представляем в качестве таковой слой с толщиной много меньшей характерного пространственного масштаба задачи. Было бы заблуждением считать, что граничные условия (9.12)—(9.15) нами уже были выведены. Мы действительно получали каждое из них в главах 2 и 5, но при существенных упрощающих предположениях. Например, усло- условие (9.12) получено для случая потенциального поля, которое тождествен- тождественно обратило бы в нуль левую часть (9.3) или (9.9). В определенном смысле граничные условия следуют из самих уравнений (9.2)-(9.5) и точно так же должны рассматриваться как обобщение экспериментальных данных. Электрическое поле при учете эффекта электромагнитной индукции теря- теряет свойство потенциальности. Но оказывается, добавление в систему уравне- уравнений введенного в гл. 4 вектор-потенциала позволяет в принципе представить два вектора Е и Н как функции двух потенциалов. Не останавливаясь на этом вопросе подробно, ограничимся случаем поля в вакууме: Н = rot А; Е = -Vip - fjL0(dA/dt). (9.16) Взяв ротор от выражения для Е, получим уравнение (9.3), а дивергенция Н оказывается нулевой, как и следует из (9.5) для поля в вакууме. Можно видеть, что, как мы уже заметили в гл. 6, э. д. с, т. е. непотенциальность электрического поля, обязательно связана с нестационарностью. Из уравнений (9.16) вытекает весьма полезное свойство потенциалов, кото- которое принято называть калибровочной инвариантностью. Физически наблю- наблюдаемыми (измеряемыми) величинами являются поля Е и Н, между тем, даже в электростатике потенциал (р определен лишь с точностью до ад- аддитивной постоянной. Обратившись к первому уравнению (9.16), нетрудно заметить, что магнитное поле не изменится, если к величине А мы добавим градиент любой скалярной функции ф, поскольку ротор любого градиента равен нулю (отсюда ранее употреблявшийся термин — «градиентная инва- инвариантность»). Но для того, чтобы из второго уравнения (9.16) получилось то же самое поле Е, следует к скалярному потенциалу добавить величину —/jLodi/j/dt. Таким образом, уравнения Максвелла в общем случае оказыва- оказываются инвариантными относительно следующей замены: (9.17) А' = А + Очевидно, добавление к (р произвольной константы, не зависящей от коор- координат, есть частный случай преобразований (9.17).
272 ГЛ. 9. УРАВНЕНИЯ МАКСВЕЛЛА 9.3. Теорема Пойнтинга В предшествующих главах мы расширили известное из механики поня- понятие энергии, введя корректным образом энергию электрического, а затем и магнитного поля. Теперь, базируясь на уравнениях Максвелла, мы мо- можем проследить, как эволюционирует энергия поля в динамической задаче. Это, в свою очередь, позволяет распространить закон сохранения энергии на такие среды, в которых существенно взаимодействие поля с веществом. Итак, мы исходим из выражений B.29) и G.11). Таким образом, плотность энергии электромагнитного поля (если ее можно выделить из общей энергии системы «поле-вещество») равна Предположим, что мы следим за эволюцией энергии поля в некотором объеме V, ограниченном поверхностью s: dW с V V На данный момент ограничимся случаем линейной среды D ос Е; В ос Н, что позволит нам провести строгое доказательство последующих утвержде- утверждений. Действительно, в этом случае производные квадратичных членов в (9.19) могут быть преобразованы следующим образом: ?/(*§) ¦(*§)"• ?/(*§) V Затем подставим соответствующие частные производные из уравнений Макс- Максвелла (9.2) и (9.3): dW = - /"(jE) dV + /(Е, rot H) - (Н, rot E) dV. (9.21) v v Первый интеграл в (9.21) можно сопоставить с формулой C.12), откуда сра- сразу становится ясной его физическая природа — это джоулево тепловыде- тепловыделение в объеме V. Кстати, полезно заметить, что ток смещения напрямую к тепловому эффекту не ведет — это можно видеть из того же выраже- выражения (9.21). Второй интеграл — чисто «полевой» — может быть преобразован с помощью следующего векторного тождества: div [Е Н] = div [Ё Н] + div [Е Н] = (Н, rot Е) - (Е, rot H). Таким образом, объемный интеграл может быть сведен к поверхностному по теореме Гаусса: /"(Е, rot Н) - (Н, rot Е) dV = - Г div [Е Н] dV = - Г[Е Н] ds, V V s
9.3. ТЕОРЕМА ПОЙНТИНГА 273 а все выражение (9.21) может быть сведено к следующему: JtiB)dV-j Sds. (9.22) dt V s Словами это можно выразить так: изменение со временем электромагнит- электромагнитной энергии в объеме обусловлено, во-первых, джоулевой диссипацией и, во-вторых, «вытеканием» энергии через поверхность, ограничивающую дан- данный объем. Вектор потока электромагнитной энергии S = [EH] (9.23) называется вектором Пойнтинга, а закон эволюции энергии в замкнутом объеме (9.22) — теоремой Пойнтинга. Ее можно представить и в локаль- локальной форме. Для этого последний интеграл в правой части нужно оставить в виде объемного, а левую часть — также в виде объемного интеграла от плотности энергии. Поскольку объем интегрирования может быть совершен- совершенно произвольным, должны быть равны подынтегральные выражения: (dw/dt) + div S = -j • E. (9.24) В таком виде теорема Пойнтинга напоминает закон сохранения заряда C.7), только в данном случае имеет место еще и сток энергии в тепло через джоу- леву диссипацию. При отсутствии таковой мы получили бы точный закон сохранения электромагнитной энергии. А теперь перейдем от линейной среды к общему случаю произвольной зависимости D (Е), В (Н). Пока и поскольку мы могли выделить энергию электромагнитного поля аддитивным образом, эта связь предполагалась ли- линейной. Следовательно, в общем случае мы не сможем отделить друг от друга энергию поля, энергию вещества и энергию взаимодействия поля с веществом. Но поскольку расширение понятий и зависимостей представля- представляется гораздо более естественным, нежели их полная ревизия, имеет смысл распространить и на этот случай действие теоремы Пойнтинга, доопределив все остальные добавки к энергии и потоку энергии как взаимодействие по- поля с веществом. При таком определении мы как бы узаконим проведенную выше операцию: д_ /(ЕР) (ВН)\ _ / <Ю\ / дВ\ Таким образом, работа по изменению электрического и/или магнитного по- поля — каким бы образом она ни совершалась — может быть представлена в виде 8А = (Е, dD) + (H, dB). (9.25) Рассмотрим пример. Предположим, что мы поместили ферромагнитный образец в периодическое внешнее магнитное поле. По прошествии каждого периода он неукоснительно возвращается в исходное состояние. Но этот про- процесс требует энергетических затрат, которые пропорциональны (с точностью
274 ГЛ. 9. УРАВНЕНИЯ МАКСВЕЛЛА до размагничивающего фактора) просто площади, охватываемой кривой ги- гистерезиса: Г AQT~V- ф HdB. В(Н) Далее рассмотрим некоторые простые примеры вычисления вектора Пойн- Пойнтинга. Представим себе цилиндрический проводник, по которому течет ток с равномерно распределенной по сечению плотностью j (рис. 9.3). Элек- Электрическое поле вне провода вблизи его поверхности должно быть, соглас- согласно условию (9.12), таким же, как и внутри, т. е. Е = j/A, магнитное поле Н = //2тгг = j • г/2, соответственно, вектор Пойнтинга нор- нормален к поверхности проводника, направлен внутрь него и равен |S| =EH = j2r/2X. Энергия, «втекающая» в проводник на длине / т^ н B точности соответствует темпу джоулевой диссипации, как и следует тому быть в стационарной задаче. Другой пример представлен на рис. 9.4. Длинная двухпроводная линия со- соединяет источник постоянной э. д. с. и нагрузку — сопротивление R. Пола- Полагая сопротивление подводящих проводов пренебрежимо малым, определим направление вектора Пойнтинга. Мы при этом ограничимся малой окрестно- окрестностью проводов. Направление магнитного поля задается правилом буравчика (см. рис. 9.4). Электрическое поле есть не что иное, как поле двумерного ди- диполя. Дело в том, что при идеальной проводимости соединительных элемен- элементов все падение напряжения приходится на сопротивление, так что каждый из проводов оказывается эквипотенциальным при разности потенциалов между ними IR. Отсюда и по- ле диполя. Определяя направление векторного про- изведения [ЕН] в данной геометрии, нетрудно убе- диться в том, что в любой точке вектор Пойнтинга будет «показывать» на нагрузку, что вполне есте- ственно: в стационарной задаче поток энергии дол- жен быть направлен туда, где происходит диссипа- диссипация, поскольку W = 0. Отметим важное обстоятельство. Из теоремы Гаусса следует, что оба про- провода в данной системе должны быть заряжены, что не всегда правильно понимается при решении задач на протекание тока в твердом проводнике. В отличие от электростатики, здесь не поле задается зарядом, но заряд — полем, которое следует из разности потенциалов IR. Но все закономерно- закономерности, изученные нами ранее, продолжают работать, и забывать об этом не следует. 9.4. Импульс электромагнитного поля Мы достаточно много внимания уделили проблеме энергии электромаг- электромагнитного поля, но поле обладает, вообще говоря, также и импульсом, распре- распределенным, подобно энергии, в пространстве с некоторой плотностью dp/dV. рис
9.4. ИМПУЛЬС ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 275 Ввести его корректным образом было бы на уровне нашего курса непросто, но мы можем сделать это на основании достаточно очевидных аналогий. Как мы уже выяснили, вектор Пойнтинга — это вектор потока энергии, т. е. модуль его есть энергия, переносимая электромагнитным полем в едини- единицу времени через площадку единичной площади, ориентированную перпен- перпендикулярно вектору потока. (А если площадка ориентирована как-то иначе, для вычисления той же величины нужно взять проекцию вектора Пойнтинга на нормаль к площадке.) Это не единственная потоковая величина, с которой мы имели дело. На- Например, вектор плотности тока j можно с равным правом именовать векто- вектором потока заряда, поскольку он представляет собой как раз заряд, про- протекающий в единицу времени через единицу площади поперечного сечения проводника. Как мы уже убедились (см. гл. 3), в случае единственного сорта носителей заряда его можно достаточно просто выразить через концентра- концентрацию заряженных частиц и их локальную скорость: j = new. Теперь представим себе, что вместо заряда, мы подставили в эту формулу массу частиц. Тогда, очевидно, мы получим выражение для потока массы qm = nrav. В случае течения многокомпонентного газа (жидкости, плазмы) это выра- выражение следовало бы просуммировать по сортам частиц, но для наших рассу- рассуждений в этом нет надобности. Нетрудно заметить, что поток массы предста- представляет собой не что иное, как пространственную плотность импульса среды: qm = nrav = dp/dF. (9.26) Соотношение (9.26) остается в силе и в релятивистском случае, если под массой понимать не массу покоя, а так называемую релятивистскую массу гаг, которая как самостоятельная величина в настоящее время употребля- употребляется редко — предпочитают просто выражать ее через полную энергию ча- частицы ? (к сожалению, стандартное обозначение энергии в релятивистской механике пересекается с не менее стандартным обозначением э. д. с): га _ ? rav v ШГ= /^/2=^; P= /^/2 ^' Из этих общеизвестных формул и (9.26) следует dp/dV=(l/c2)qw, где qw = n?v, (9.27) т. е. плотность импульса с точностью до коэффициента 1/с2 есть поток энер- энергии частиц (мы вернулись к букве W для обозначения энергии). И вот этот результат, абсолютно строгий в случае течения вещества, мы и перенесем на электромагнитное поле: = S/c2 = [EH]/c2. (9.28) Из формулы (9.28) можно извлечь несколько поучительных следствий. Во-первых, как нетрудно видеть, чисто электрическое или чисто магнитное поле импульсом не обладают. Во-вторых, если Е || Н, плотность импульса также равна нулю. В-третьих, представим себе одну из названных ситуаций
276 ГЛ. 9. УРАВНЕНИЯ МАКСВЕЛЛА и предположим, что мы перешли в некоторую движущуюся систему отсчета. Поле, как мы теперь понимаем, имеет массу. Следовательно, в новой систе- системе отсчета у него окажется ненулевой плотность импульса, а это значит, в согласии с (9.28), в ней обязательно должны быть представлены оба поля Е, Н, и притом не параллельные друг другу. Справедливо и обратное: можно показать, что мы всегда можем перейти в такую систему отсчета, в которой импульс электромагнитного поля равен нулю, т. е.существует или только Е, или только Н. Мы это уже проделали одна- однажды — в задаче 3 гл. 4. Рассмотрим электрическую цепь, представ- представленную на рис. 9.5. Постоянный ток / проте- протекает по длинному соленоиду радиуса г2 с плот- плотной намоткой N витков/м, далее — через 2- 9-5 сопротивление R и возвращается по соосному с соленоидом прямому проводу радиуса г\. Найдем вектор Пойнтинга внутри катушки вдали от ее торцов, считая пренебрежимо малыми сопротивления как соленоида, так и соединительных проводов. При таком предположении разность потенциалов между обмоткой соленоида и центральным проводом равна А(р = IR. Электрическое поле внутри катушки направлено, в силу симметрии, по радиусу, а значит, Е(г) ос 1/г (полезно еще раз обратить внимание на замечание в конце предыдущего параграфа). Зная разность потенциалов, его можно найти точно: тч/ ч г IR Что касается магнитного поля, то оно имеет две компоненты: одна созда- создается током, текущим по осевому проводу, а другая — током через обмотку соленоида: Н^ = //2тгг; Hz = NI. Соответственно и вектор Пойнтинга имеет две компоненты. Одна из них соответствует направлению на нагрузку: Z7T тА m(r2/ri) Ей отвечает полный поток энергии через сечение катушки / Sz-2nrdr = п Другая компонента вектора Пойнтинга направлена по азимуту: „ „ I2RN г In(r2/ri) Соответствующий поток энергии как будто бы «бесполезен» — он отнюдь не направлен на нагрузку, но просто циркулирует вокруг оси системы. Что это значит, можно понять, обратившись еще раз к соотношению (9.28). Оказыва- Оказывается, электромагнитное поле может иметь не только импульс, но и ненуле- ненулевой момент импульса. Только что рассмотренная система дает тому самый простой пример.
ЗАДАЧИ 277 Задачи 1. Цилиндрический нерелятивистский электронный пучок радиуса г о распространяется в свободном пространстве. Электроны пучка летят параллельно, энергия их w, а концен- концентрация п. Найти величину и направление вектора Пойнтинга в любой точке пространства. Решение. (См. рис. 9.6.) Вектор S всюду будет параллелен оси пучка и направлен туда же, куда и скорость частиц. Электриче- Электрическое поле ищется из теоремы Гаусса, магнитное — из теоремы о циркуляции. Результаты будут различными при г < г о (ин- (индекс in) и г > го (индекс еж). Как всегда в симметричных конфи- конфигурациях, ток вне контура или заряд вне поверхности интегриро- интегрирования на величине поля не сказываются. Плотность тока в пучке j = neBw/mI/2. Далее, Рис. 9.6 Еех = neR 2гог ' нех = _ rj_ 2 2r 2. По проводнику, имеющему форму плоской ленты, течет ток с плотностью j. Но- Носителями тока являются электроны с концентрацией п. Найти величину и направление вектора Пойнтинга в произвольной точке внутри провод- проводника вдали от края ленты. Считать толщину ленты много меньше ее ширины, сопротивление не учитывать; /i ~ 1. Решение. (См. рис. 9.7.) В плоскости симметрии ленты магнитное поле равно нулю, вне ее силовые линии лежат в плоскостях у = const, причем, как следует из теоремы о циркуляции, В (у) = j-y. В отсутствие сопротивления един- р Q 7 ственный источник электрического поля — эффект Холла, но не во внешнем магнитном поле, которого здесь нет, а в собственном поле тока: -neE + [j В] = 0; j_LB =^ ? = (j/io/ne) Н = /i0j2y/(ne). При этом вектор Е направлен извне по направлению к плоскости симметрии проводника. Таким образом, искомый вектор Пойнтинга оказывается антипараллелен вектору j (т. е. сонаправлен со скоростью электронов — носителей тока) и равен S = /iojsy2 /(пе). 3. Плоский воздушный конденсатор, обкладками которого являются два одинаковых диска, заряжен до высокой разности потенциалов, а затем отключен от источника напря- напряжения. В центре конденсатора происходит пробой — по оси проскакивает электрическая искра — как следствие, конденсатор разряжается. Считая разряд квазистационарным и пренебрегая краевыми эффектами, определить полное количество электромагнитной энергии, вытекающее за время разряда из пространства между обкладками. Ответ: искомая величина равна нулю вследствие полной компенсации тока проводимо- проводимости током смещения. 4. Обкладки плоского конденсатора имеют форму дисков радиуса R. Расстояние ме- между дисками d <C R- Пространство между ними заполнено однородным диэлектриком с диэлектрической и магнитной проницаемостями ей//. Конденсатор включен в цепь пе- переменного тока / = /о cos out. Пренебрегая краевыми эффектами, определить отношение максимальной магнитной энергии в конденсаторе к максимальной электрической. Ответ: Wm/We = (l/8)fifiO??O(ujRJ.
ГЛАВА 10 ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ 10.1. Вопросы волновой динамики. Волновое уравнение Мы начнем настоящую главу с достаточно краткой сводки результатов, относящихся к волновым движениям вообще. В какой-то части они будут напоминанием уже известного нам из курса механики или даже школьной физики. Придется, к сожалению, в некоторых вопросах забежать вперед, анонсируя результаты следующего раздела нашего курса. Подобные элемен- элементы неизбежно возникают в любом учебнике физики, ибо природа не знает, что мы разделили ее на главы и параграфы. Одним из важнейших достижений физики XIX века явилось осознание общих свойств и, соответственно, возможности универсального подхода в изучении явлений самой различной природы. Это не относилось, конечно, к экспериментальным методам, но зато весьма способствовало адекватному пониманию и созданию общего для всей линейной физики математического формализма — уравнений математической физики. В XX веке естествен- естественным продолжением этой линии стало взрывное развитие физики колебаний и волн. Пока и поскольку речь идет о линейных волнах, основные коли- количественные закономерности — уравнения, соотношения характерных кон- констант, законы подобия и т. п. — оказываются совершенно универсальными. Итак, волной называется процесс, обладающий определенным свойством инвариантности, таким, что некоторая физическая величина представляет- представляется профилем, перемещающимся с постоянной скоростью: f(x,t)=f(x±ut), A0.1) где и — скорость волны. Если в данной конкретной среде соотношение A0.1) может быть выполнено без всяких оговорок, т. е. для произвольного профи- профиля /(ж, ?), среда называется бездисперсной. Но этот случай не является ти- типичным. Куда более характерна ситуация, в которой A0.1) справедливо для некоторых частных функций /п(ж, t) (их называют собственными функци- функциями задачи), а эволюция произвольной функции лишь постольку опреде- определяется законом A0.1), поскольку эта функция может быть представлена разложением по собственным функциям: /(Ж, t) = В качестве базиса собственных функций во многих физических задачах наиболее адекватным оказывается набор функций, представляющих гармо- гармонические колебания /п(ж, t) = An cos[fcn(s - unt)]. A0.2)
10.1. ВОПРОСЫ ВОЛНОВОЙ ДИНАМИКИ. ВОЛНОВОЕ УРАВНЕНИЕ 279 Заметим, что мы по умолчанию определились со знаком в формуле A0.1). Знак «+» соответствовал бы волне, бегущей в отрицательном направлении оси Ох, мы же предпочли, чтобы волна распространялась вдоль оси Ох в положительном направлении. Противоположное направление распростране- распространения можно учесть выбором знака к или ип. Величину к принято называть волновым числом. Как можно видеть из формулы A0.2), в данный момент времени структура волны полностью вос- воспроизводится при сдвиге на Ах = 2тг/к; величину А = 2тг/к называют дли- длиной волны. (К сожалению, в очередной раз приходится отмечать термино- терминологическую неряшливость физического сообщества: длину волны принято обозначать той же буквой, что и проводимость. В попытке избежать тако- такого пересечения, там, где оно часто происходит, например в физике плазмы и физике твердого тела, проводимость обозначают буквой <т, что, правда, совпадает со стандартным обозначением плотности заряда.) Выбор синусоидальных решений в качестве собственных функций не слу- случаен. Как известно в математическом анализе, произвольная функция (при достаточно мягких ограничениях) действительно может быть по ним разло- разложена — это называется разложением в ряд или интеграл Фурье. Мы рассмо- рассмотрим этот вопрос детально в следующем разделе нашего курса, а в данной и последующей главе ограничимся рассмотрением именно синусоидальных ре- решений. Каждое из них, как нетрудно усмотреть из формулы A0.2), характе- характеризуется, помимо произвольной амплитуды и фазы, двумя параметрами: 1) волновым числом к или длиной волны А = 2тг/к и 2) скоростью распростра- распространения волны и. Впрочем, гораздо более принято характеризовать каждое синусоидальное решение (как говорят, гармонику) не скоростью, а произве- произведением ки, которое, как и в случае гармонических колебаний, называется частотой и обозначается буквой ио. Как можно видеть все из той же фор- формулы A0.2), в данной точке пространства х = const собственная функция в точности восстанавливается через время At = 2тг/с<; — отсюда и термин «ча- «частота». Таким образом, общий вид гармонической функции, описывающей бегущую волну, может быть представлен следующим образом: /(ж, t) = Acos(kx -u)t + ф), A0.3) где А — амплитуда, ср — начальная фаза. Вместо косинуса, может фигури- фигурировать синус, а также, подобно тому, как описано в гл. 8 для гармонических колебаний, экспонента: f(x,t) =Aexp[i(kx-wt + <p)]. A0.4) Аргументы для ее использования, а равно и алгоритм его — те же, что и в гл. 8. Но, в отличие от (8.13), здесь частотное слагаемое в аргументе экспоненты принято брать со знаком «—». Причины этого расхождения, как можно видеть из всего изложенного, достаточно случайны. Иногда — в опти- оптике или радиофизике — строят теорию на базе решений с противоположным знаком частоты, но в целом это нетипично, и мы будем пользоваться пред- представлением A0.4), которое в целом в физике является общепринятым. При этом знак и; всегда считается положительным, если не оговорено противное, а знак к определяет направление распространения волны: по или против оси Ох. Скорость распространения ш/к обычно называется фазовой скоростью,
280 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ поскольку именно с этой скоростью перемещается в пространстве точка по- постоянной фазы: сро = kx(t) — cut = const. Бездисперсная среда определяется условием и = const или ш ос к. Соот- Соответственно, зависимость и(к) либо и (к) называется дисперсионным уравне- уравнением или законом дисперсии. Мы в данном разделе ограничимся бездис- бездисперсными средами или вакуумом, поэтому для нас различие между A0.1) и A0.2) не будет иметь значения, но имея в виду оформление даже пред- предварительных результатов на грамотном языке волновой физики, мы все же отдадим предпочтение решениям A0.4). Настало время определить, реше- решения какого именно уравнения они представляют. Нетрудно сообразить, что это должно быть уравнение в частных производных, потому что все реше- решения A0.1), A0.2), A0.4) суть функции двух переменных. Как мы уже не раз подчеркивали, уравнение будет одним и тем же для самых различных про- процессов: продольных упругих волн (звука), электромагнитных волн (света) — в чем мы скоро убедимся, поперечных колебаний струны или мембраны и т. п. Его так и принято называть — волновое уравнение: d2f/dt2 = и2 d2f/dx2. (ю.5) Читатель может самостоятельно проверить прямой подстановкой, что все функции A0.1)—A0.4) и в самом деле являются его решениями, при этом для A0.3), A0.4) имеет место тривиальный закон дисперсии: ои = ки. A0.6) 10.2. Плоская монохроматическая волна Уже к началу XX столетия было надежно установлено на основании мно- многочисленных взаимодополняющих экспериментов, что радиоволны и свет суть явления одной природы — это электромагнитные волны, и различа- различаются они только частотой — или длиной волны — см. A0.6). Физика XX века дополнила этот ряд рентгеновскими и 7~лУчами? а также заполнила интервал длин волн 1 см-1 мкм, промежуточный между видимым светом и радиоволнами. Как следствие, радиотехническая и оптическая терминоло- терминология в физике электромагнитных волн имеют равное употребление, дополняя друг друга. Электромагнитные волны оптического диапазона формируют — в резуль- результате регистрации их сетчаткой и последующей обработки этого сигнала моз- мозгом — наше восприятие цвета. Установлено, что каждому «чистому» цвету спектра соответствует волна определенной частоты. В повседневной прак- практике цвет принято связывать с длиной волны (скажем, желтый — 550 нм, красный — 660 нм и т. д.), но в действительности это лишь привязка ча- частоты к длине волны в вакууме в соответствии с A0.6). В иных прозрачных средах длина волны при данной частоте будет другой, как мы увидим в сле- следующей главе, но восприятие цвета не меняется при наблюдении предмета через стекло или воду (вернее, меняется лишь постольку, поскольку сре- среда оказывается не вполне прозрачной). Поэтому электромагнитную волну любого диапазона с заданной постоянной частотой принято называть моно- монохроматической .
10.2. ПЛОСКАЯ МОНОХРОМАТИЧЕСКАЯ ВОЛНА 281 Это понятие естественным образом распространилось на волны любой природы. Если рассматривать самый простой пример волнового движения в реальном трехмерном пространстве, то это, несомненно, будет «одномер- «одномерная» волна A0.4). При этом подразумевается, что ось Ох направлена как раз вдоль направления распространения волны. Если же мы имеем дело с произвольной системой координат либо с неким ансамблем таких волн, рас- распространяющихся в разных направлениях, эту формулу придется несколько модифицировать. Введем вектор к, модуль которого равен волновому числу, т. е. 2тг/А, а направление совпадает с направлением распространения волны. Тогда слагаемое кх в фазе волны A0.4) можно представить как скалярное произведение к • г, поскольку кх есть единственная отличная от нуля компо- компонента вектора к. Если теперь представить себе волну, распространяющуюся в произвольном направлении, то зависимость ее фазы от координат можно представить точно таким же образом. Действительно, координата вдоль век- вектора к (назовем ее, например, ?), в силу известных правил аналитической геометрии, может быть представлена в виде ? = xcos(Z k, Ox) + ycos(Z k,0y) + zcos(Z k,0z). Соответственно, получаем трехмерный аналог волны A0.4): /(г, t) = Ао exp[i(kr -ut + if)]. A0.7) Мы, однако, не случайно поставили слово «одномерная» в кавычки. Дело в том, что зависимость A0.6) от координаты и в самом деле одномерная — распространение волны определяется единственным вектором к. Но сама осциллирующая величина может быть не только скалярной, как в A0.6), но и векторной: A(r, t) = Ао exp[i(kr - out + ip)]. A0.8) В любом случае — (Ю.7) или — A0.8) поверхность постоянной фазы есть перпендикулярная вектору к плоскость, уравнение который kr = const. По- Поэтому такая волна и называется плоской. Поверхность постоянной фазы пе- перемещается в направлении к со скоростью ш/k = Az^, где v = ш/2тг — линей- линейная частота. В заданной плоскости, определяемой некоторым постоянным значением кг, физическая величина (А или /) осциллирует с частотой и. В принципе любое возмущение, эволюционирующее в рамках волнового урав- уравнения, можно представить в виде ансамбля плоских волн; к этому вопросу мы вернемся в следующем разделе нашего курса. Прежде, чем обобщать на трехмерную ситуацию само волновое уравне- уравнение, рассмотрим действие на функцию плоской волны операций векторного дифференцирования. Получим градиент функции A0.7) = A0(iexkx + ieyky + iezkz)e^r-^ = «k/(r, t).
282ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ А теперь вычислим дивергенцию функции A0.8) = (kxAQx + куАОу + кгАогУО"-1^ = гк ¦ A(r,t). Предлагаем читателю убедиться самостоятельно в качестве упражнения в справедливости следующих равенств: rotA(r,t)=«[k,A(r,t)]; V2A(r,i)=-A;2A(r,i); V2f(r,t)=-k2f(r,t). Таким образом, все операции дифференцирования для функций плоской волны могут быть сведены к следующим простым правилам: d/dt => -ш; V =»¦ гк. A0.9) Само же волновое уравнение в трехмерном пространстве должно выглядеть следующим образом: d2f/dt2 = u2V2f или d2A/dt2 = u2V2A, A0.10) что и является естественным обобщением A0.5). Закон дисперсии A0.6) при этом остается в силе. Далее последует важное замечание. Для некоторых волн какие-то фи- физические величины и в самом деле можно описать уравнением A0.5) или первым из уравнений A0.10), например возмущение плотности в звуковой волне. Но никогда не удается свести волновое движение к возмущению толь- только скалярной величины. Поэтому именно векторное волновое уравнение и представляет собой истинное обобщение одномерной модели A0.5). Для него типичными оказываются два случая. 1. Возмущение векторной величины А параллельно к. Такие волны на- называются продольными (пример — звук в газе или жидкости). Из формул A0.9) можно видеть, что в этом случае rot А = 0. 2. A_Lk, что соответствует поперечной волне. Для нее div А = 0, что также следует из A0.9). Таков, например, поперечный звук в твердом теле; другой пример — электромагнитные волны, которые мы рассмотрим в следующем параграфе. Для поперечных волн существенна, помимо направления распро- распространения, еще и поляризация, то есть направление вектора А в плоскости, нормальной к вектору к. Таким образом, поперечная плоская волна харак- характеризуется, помимо амплитуды и частоты (длины волны), двумя ортами направления: к/ к и А /А. 10.3. Электромагнитные волны в вакууме. Скорость света Постановка задачи об электромагнитном поле в вакууме для нас отнюдь не нова. И закон Кулона A.3), и магнитное поле прямого тока D.9), и многие другие результаты, представленные в нашем курсе, соответствуют именно полю в вакууме и описываются решениями системы уравнений Максвелла (9.2)—(9.5), в которых, как и должно быть в пустоте, р = 0; j = 0. Но, как мы уже неоднократно отмечали, важны не только уравнения, но и в не меньшей степени граничные условия: где-то вне области решения, но, безусловно, ока- оказывая на него влияние, располагается заряд или проводник с током, отсюда и получается — в наших примерах — Е ос |г — г^|~2 или Н ос 1/г.
10.3. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ВАКУУМЕ. СКОРОСТЬ СВЕТА 283 А теперь мы рассмотрим пространство абсолютно пустое и совершенно однородное, и решение будем искать такое, в котором ни одна точка про- пространства не выделена. Конечно, в дальнейшем мы будем с приемлемой точностью переносить полученные результаты на реальные ситуации, а из базовых решений впоследствии (см. следующий раздел) мы сможем выстро- выстроить любое реальное волновое возмущение и проследить его эволюцию. Во- Вопрос ставится достаточно принципиальный: мы ведь стартовали с законов Кулона и Био-Савара, связывающих поля с порождающими их источника- источниками. Возможно ли существование электромагнитных полей в пространстве при совершенном отсутствии источников? Оказывается, возможно. В пустоте систему уравнений (9.2)-(9.5) нетрудно преобразовать таким образом, чтобы в ней фигурировали только действующие поля Е и В. В отсутствие зарядов теорема Гаусса для электрического и магнитного поля выглядит совершенно одинаково: divE = 0; divB = 0. A0.11) Связь между электрическим и магнитным полем задается парой уравне- уравнений (9.2), (9.3) при р = 0; j = 0: rot В = ?оМ<ЭЕ/<9?); rotE = -(dB/dt). A0.12) Возьмем от первого из них ротор и воспользуемся векторным тождеством, справедливым для любой вектор-функции А (г) rot (rot А) = [V [V А]] = V div A - V2 А, аналогичным известной формуле векторной алгебры b(ac) — c(ab). Таким, образом, первое из уравнений A0.12) преобразуется к виду -V2B = ?0/io(<9rotE/<9?), (мы учли, что div В = 0). Подставляя второе из уравнений A0.12), получаем окончательно d2B/dt2 = c2V2B; с2 = 1/(боЫ - 9 • Ю16 (м/сJ. A0.13) Получилось не что иное, как второе уравнение A0.10), причем величина с имеет смысл скорости распространения электромагнитных волн. Сделаем наоборот: возьмем ротор от второго из уравнений A0.12): rot (rotE) = VdivE - V2E = (<9/<9t)rot В. Учтем, что div E = 0 и подставим первое уравнение. Получаем совершенный аналог A0.13): <92Е/<9?2 = c2V2E. A0.14) Из уравнений A0.13), A0.14) можно сделать вывод, что в отсутствие ис- источников электрическое и магнитное поля неразрывно связаны, подчиня- подчиняются одним и тем же уравнениям и формируют движение типа бегущей волны A0.8). Мы не случайно обозначили скорость распространения через с. Поскольку электромагнитные волны и свет — одно и то же явление, то и скорость распространения электромагнитных волн в вакууме как раз рав- равна максимально возможной в физике скорости распространения взаимодей- взаимодействия — скорости света с = 2,9979 ... • 108 м/с.
284 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Эта фундаментальная мировая константа связана с базовыми константами системы СИ соотношением с = 1/д/со/^о- Решения уравнений A0.13), A0.14) уже готовы — и они действительно, как мы и потребовали выше, однородны во всем пространстве. Это решения типа A0.8): Е(г, t) = Ео exp[i(kr -ut + ф)\, B(r, t) = Во exp[i(kr -ut + ф)]. A0.15) Потребовав для них выполнения условий A0.11) вкупе с правилом A0.9), приходим к выводу, что электромагнитные волны по своей геометрии явля- являются поперечными: Е0±к, В0±к. Поэтому уравнения A0.13), A0.14) в принципе можно представить четырьмя уравнениями типа A0.5), в которых ось Ох параллельна вектору к, а в каче- качестве величины / фигурируют компоненты поля Еу, Ez, By, Bz в плоскости, ортогональной направлению распространения, т. е. к. Поля Е и В в A0.15) не являются независимыми. Полезно, помимо уже известного нам линейного закона дисперсии A0.6), получить связь между Е и В, для чего мы воспользуемся уравнениями A0.11), A0.12) и прави- правилом A0.9). Тогда, пара уравнений A0.12) для решений A0.15) переходит в следующую систему алгебраических уравнений: [кЕ] = о;В; [к В] = -/iO?o^E. A0.16) Из соотношений A0.16) видно прежде всего, что векторы Е(г,?) и В(г,?) колеблются «в фазе», поскольку все мнимые единицы из этих формул выпали, и остались только алгебраические связи. Из них же мож- можно усмотреть, что векторы k, E, В образу- В ^-р*!Ц^_ _/_ Д^ ют правую тройку (подобно координатной системе ж, у, z\ так что координатную за- зависимость вместе с ориентацией полей в данный момент времени можно передать ри- рисунком 10.1. рис iQ i Сократим в A0.16) экспоненциальные ос- осциллирующие множители, тогда это будут уравнения для амплитуд Eq и Bq. Подставим первое уравнение во второе. Результат имеет вид [к [кЕ0]] = к(кЕ0) - к2Е0 = -fioeou>2Bo. A0.17) Первый член разности в A0.17) равен нулю в силу поперечности электро- электромагнитной волны. Оставшиеся члены после сокращения Eq дают в ответе уже известный нам закон дисперсии ш2 = к2с2. Выпадение из ответа амплитуды — в данном случае Eq — вообще харак- характерное свойство т. н. линейной физики. Оно проистекает из самых основ- основных законов, а именно, из того обстоятельства, что уравнения Максвелла (9.2)-(9.5) полностью сохраняют силу при умножении всех полей, токов и зарядов на один и тот же постоянный коэффициент. Поэтому, если токи и
10.4. ЭНЕРГИЯ И ИМПУЛЬС ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ 285 заряды связаны с полями линейной зависимостью или, как в данном слу- случае, вовсе равны нулю, решение A0.15) можно умножать на любые коэф- коэффициенты, более того, любая линейная комбинация решений вида A0.15) с разными амплитудами и волновыми векторами (а тем самым, и частотами) также будет решением исходной системы уравнений. Это и есть «линейная физика». Только для этого предельного случая справедлив принцип супер- суперпозиции полей, от которого приходится отказаться в случае нелинейности функций р(Е В), j(E В) либо операторов ё; Д. Нам уже знакомы такие приме- примеры нелинейных сред, как сегнетоэлектрики и ферромагнетики; в этой связи заметим, что нелинейные проблемы в современной физике представляются скорее правилом, нежели исключением. Даже вакуум в квантовой электро- электродинамике оказывается нелинейной средой. 10.4. Энергия и импульс электромагнитной волны Плотность энергии в электромагнитной волне задается стандартным вы- выражением (9.18) w = A/2)(ED) + (BH). Это выражение квадратично по полю, поэтому подставлять в него непосред- непосредственно формулы A0.15) не следует — нужно воспользоваться их веществен- вещественным эквивалентом Е(г, t) = Ео cos(kr -u)t + <р); B(r, t) = Во cos(kr - ut + ф) A0.18) (обратим еще раз внимание на синфазность электрического и магнитного полей). Плотность энергии волны будет, следовательно, осциллировать в пространстве и во времени. Обычно в таких случаях оперируют средним ее значением по периоду либо по длине волны. Эти величины равны друг другу. Действительно, (cos2(kr -vt + (p))T = (cos2(kr -vt + (p))x = 1/2. Таким образом, из A0.18) можно получить следующее значение плотности энергии в электромагнитной волне: (w) = A/4) (ео^о2 + ^о/мо) ¦ A0.19) Воспользуемся первым из уравнений A0.16). Помимо ориентации основной тройки векторов, оно дает, с учетом поперечности волны, соотношение ме- между амплитудами полей Во = (к/ш)Е0. Подставим его в A0.19). Получаем две эквивалентных формы ответа: „ J ( \ f 4 V ?o/W/ 4/i0 \ к2 В силу закона дисперсии, дополнительное к единице слагаемое в каждой скобке также равно единице. Из этого следует, что средняя по периоду элек- электрическая энергия равна средней магнитной, а поскольку поля синфазны, плотности электрической и магнитной энергии равны друг другу в любой момент времени в любой точке пространства. Окончательный ответ для усредненной плотности энергии мы по-прежнему приводим в двух формах: 2 = (ео/2)Е2о = ВЦ{2^). A0.20)
286 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Первая из них более употребительна, по крайней мере в оптике. Дело в том, что при взаимодействии света с веществом, и в 4acTHOCTnq при его регистра- регистрации, большую роль играет именно электрический вектор. Взаимодействие происходит почти исключительно с электронами. Электрическое поле дей- действует на электрон с известной силой еЕ, а магнитное — с силой Лоренца, которую можно оценить следующим образом: |e[vB]| - (kv/ou)eE = (v/c)eE, так что для нерелятивистского электрона (v <С с) она дает лишь малую поправку. Поэтому принято плотность энергии, поляризацию света, сдвиг фазы и т. д. привязывать именно к электрическому полю. Продолжим исследование энергетических характеристик волны. Вычи- Вычислим вектор Пойнтинга S = [ЕН] = — [Е[кЕ]] = — (кЕ2 - (кЕ)Е). Для поперечной волны последний член в правой части равен нулю, что по- позволяет упростить выражение: S = (к/к)(к/^О?Ои;)?оЕ2 = (k/k)wc. Поток энергии осциллирует во времени и пространстве, но всегда направлен вдоль вектора к. Средний по периоду или длине волны поток энергии в направлении к равен (S) = (k/k)(w)c. A0.21) Теперь не представит труда определить и среднюю плотность импульса поля в электромагнитной волне, исходя из соотношения (9.28): (dp/dF) = S/c2 = (k/k)((w)/c). A0.22) Его можно трактовать следующим образом: «плотность массы» поля (w) /с2 умножается на скорость ее «течения» с. Это соотношение оказалось одним из основополагающих в разработке идеи све- световых квантов. Представим себе, что плоская монохроматическая электромагнитная волна падает нормально на абсо- абсолютно черную плоскую поверхность, где энергия поля полностью поглощается (рис. 10.2). За проме- промежуток времени t поверхности достигнет фронт (по- р ..„ ~ верхность постоянной фазы), первоначально отсто- отстоявший от плоскости на расстоянии ct. За это время поле, заключенное между указанным фронтом и плоскостью, полностью пе- передаст последней свои импульс и энергию. Таким образом, участок черной плоскости единичной площади воспримет за это время импульс dAp/dS= (k/k)((w)/c) -ct. Следовательно, волна, падающая нормально на черную поверхность, оказы- оказывает на нее давление V = d2p±/(dSdt) = (w). A0.23)
10.4. ЭНЕРГИЯ И ИМПУЛЬС ЭЛЕКТРОМАГНИТНОЙ ВОЛНЫ 287 В Эффект светового давления был подтвержден экспериментальлно в 1899 г. выдающимся русским физиком П. Н. Лебедевым. В случае черной облуча- облучаемой поверхности оно равно средней плотности энергии в падающей волне, в случае зеркально отражающей поверхности оно должно быть в два раза больше, поскольку отраженная волна уносит тот же по абсолютной вели- величине импульс, но противоположного знака. Эту ситуацию мы рассмотрим подробнее, не ограничиваясь случаем нормального падения. Идеальное зеркало — это идеально проводящая по- поверхность. Любые зеркала, используемые в обиходе и в технике, действуют именно по принципу отра- отражения электромагнитной волны от проводящей по- поверхности. Мы не будем подробно разбирать всю от- относящуюся к делу электродинамику, ограничившись классической модельной задачей — отражением плос- плоской монохроматической волны при косом падении на идеально проводящую плоскость в случае двух раз- различных поляризаций — см. рис. 10.3 а, б. Угол ср между вектором к и нормалью к плоскости принято называть углом падения. Сам факт появления отраженной волны отнюдь не постулируется, но с необходимостью следует из гра- граничных условий. Внутри идеального проводника должно быть Е = 0. Значит, на границе, т. е. при z = 0, Рис. 10.3 должно быть Ет = 0. Поскольку это заведомо не так в падающей волне (ко- (которой мы присвоим индекс г), приходится ввести еще одну волну — отра- отраженную (индекс г): = Е^о exp[i(kr — Er = exp[i(kir — A0.24) Если бы частота ио\ была отлична от о;, мы не смогли бы выполнить гра- граничное условие нулевого поля в любой момент времени. Поэтому частота отраженной волны, а значит, и волновое число к = и/с должны совпадать с таковыми у падающей волны. Мы опустили в формулах A0.24) начальную фазу, поскольку у одной волны она устраняется выбором начала отсчета времени, а у другой возможный фазовый сдвиг будет учтен знаком ампли- амплитуды. Рассмотрим геометрию задачи, представленную на рис. 10.3 а. При такой поляризации вектор электрического поля параллелен проводящей плоско- плоскости, вектор магнитного поля лежит в плоскости падения. Условие Е = 0 в начале координат г = 0 в терминах формул A0.24) означает просто Ег0 = — Е^о, или, что то же, фазовый сдвиг в тг при равных амплитудах — обычно гово- говорят: «потеря полуволны». Далее будем перемещаться вдоль границы, меняя координату х. Условие Е = 0 должно быть выполнено в любой точке гра- границы, но зависимость от х полей Е^, Ег при одинаковых волновых числах и z = у = 0 будет различной: kr = kxs'mcp; kir = kxs'mip, где ф — угол отражения на рис 10.3 а. Единственная возможность надлежащим образом выполнить граничное условие на проводящей поверхности обеспечивается известным школьным правилом: угол падения равен углу отражения, ср = ф.
288 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Рассмотрим случай другой поляризации, представленный на рис. 10.3 б. Теперь тангенциальные компоненты электрического поля равны Е{т = = EiQ cos ср; Етт = ErQCOSip. Условие сохранения частоты при отражении универсально; обеспечив нулевое касательное поле в одной точке и требуя сохранения этого нуля в любой точке проводящей плоскости, получаем сно- снова ср = ф. Возвращаясь к выражениям для тангенциальных компонент поля, еще раз получаем Его = — Е^о, т. е. и в такой геометрии отражение проис- происходит с потерей полуволны. Резюмируя, можно сказать, что мы построили количественную теорию идеального зеркала. Важное замечание: граничное условие (9.12) — именно для тангенциаль- тангенциальной компоненты Е — выбрано нами не случайно. Анализируя полученные нами условия, читатель может самостоятельно убедиться, что они не могут обеспечить ни непрерывности Нт, ни непрерывности Dn. Но на поверхности проводника полем волны индуцируются поверхностные токи и заряды, ко- которые и балансируют соответствующие скачки — см. условия (9.14), (9.15) в расширенной форме. Условие (9.12) является более жестким — никакая реакция среды не может его подправить. 10.5. Излучение электромагнитных волн Самый популярный излучатель в школьной физике — точечный источ- источник света. Попробуем понять, может ли действительно излучатель электро- электромагнитных волн обладать такими свойствами. При этом необходимо особо подчеркнуть, что дело не только в малости генератора излучения. Одно из важнейших свойств точечного источника — отсутствие какого-либо выде- выделенного направления и, следовательно, абсолютная изотропия излучения. Таким образом, подобный источник может порождать только сфериче- сферическую волну. Но сферической электромагнитной волны просто не может быть. Это нетрудно понять, вернувшись к мысленному эксперименту, представлен- представленному на рис. 9.1. В сферически симметричной конфигурации электрическое поле Е может быть направлено только по радиусу, а магнитное поле долж- должно быть тождественно равно нулю. Это и неудивительно, поскольку любые перемещения в сферически симметричной зарядовой системе, сохраняющие ее симметрию, оставляют поле Е вне ее неизменным, в силу теоремы Гаусса. Следовательно, вне такой системы Е = 0 и j = 0, так что и Н = 0. Но тогда тождественно равен нулю вектор Пойнтинга, так что об электромагнитной волне вообще говорить не приходится. Это не означает, что модель точечного источника в оптике является оши- ошибочной. Просто во многих задачах можно рассматривать поле малого излу- излучателя усредненным во времени. Будучи в каждый момент асимметричным, оно за характерное время регистрации может в среднем оказаться симме- симметричным в достаточной степени, чтобы мы считали излучение изотропным, а излучатель — истинно точечным. При этом, правда, постановка вопроса о направлении электрического и магнитного поля излучения теряет смысл. Что же касается стандартного утверждения типа «линза преобразует пло- плоскую волну в сферическую, сходящуюся в фокусе», то оно верно лишь как некоторое приближение, в котором малым параметром служит телесный угол О, охватывающий сходящийся пучок света. Истинная волна, сформи- сформированная линзой, мало отличается от сферической, пока и поскольку Г2 <С 1. Во всяком случае, из уравнений Максвелла следует, что ни сферической, ни
10.5. ИЗЛУЧЕНИЕ ЭЛЕКТРОМАГНИТНЫХ ВОЛН 289 цилиндрической электромагнитной волны в точном смысле не существует, а значит, не может быть слишком симметричным излучатель. Оказывается, самым простым и фундаментальным типом излучателя яв- является электрический диполь с переменным во времени дипольным момен- моментом. Формальный уровень нашего курса не дает возможности изложить этот вопрос с должной степенью строгости, но мы можем сопроводить это утвер- утверждение достаточно убедительными аргументами. Обратимся к уравнениям A0.10). Заметим, что первое из них в принципе можно рассматривать как часть второго, если под / понимать любую компо- компоненту вектора А. Вернемся к сферически симметричной модели и поищем соответствующее решение уравнений A0.10). Оператор Лапласа примени- применительно к скалярной величине / при условии, что последняя зависит только от радиуса г, но не от полярного или азимутального угла, может быть запи- записан в простой форме, которую читатель может получить в виде упражнения, перейдя от декартовых координат к полярным: V2f = ^? + ^l + ^l = ±д_г2д1 = 2 д? + с^ дх2 ду2 dz2 г2 дг дг г дг дг2' Подставим его в первое уравнение A0.10), после чего умножим обе части уравнения на г. Результат r(d2f/dr2) + 2(df/dr) = (i/u2)(d2(rf)/dt2) можно преобразовать к виду дг2 и2 dt2' 9~r;' Полученное уравнение формально одномерное, подобно A0.5), а следова- следовательно, имеет решение g = rf = g(t-r/u). A0.25) Решение A0.25) представляет, во-первых, пример истинно сферической вол- волны (но она существует лишь для скалярной величины или потенциального вектора) а во-вторых, если рассматривать / еще и как компоненту вектора, моделиру- моделирует так называемые запаздывающие потенциалы. Если, например, речь идет об электромагнитном поле, то потенциалы А и <р, созданные соответственно токами и зарядами некоторой ограниченной в пространстве системы, уста- устанавливаются на далеких от нее расстояниях с задержкой во времени г/с. Представим себе дипольную систему, которую мы на больших расстояниях можем описать просто дипольным моментом р(г,?). Для удобства описания излучения волн Г. Герц ввел специальный вектор (его так и называют — вектор Герца) (,) , г который, как следует из A0.25), является решением волнового уравнения при и = с, т. е. представляет динамику типа электромагнитной волны. Если
290 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ мы заставим диполь осциллировать во времени, р = Ро cos cot, то в доста- достаточно удаленной от диполя области пространства эти осцилляции будут регистрироваться именно как бегущая электромагнитная волна. Далее проведем мысленный эксперимент. Пусть наш диполь движется с постоянной скоростью. Тогда он, очевидно, излучать не будет; поле его будет просто стационарным полем в движущейся системе отсчета. Значит, поле из- излучения определяет не скорость, а, по крайней мере, следующая временная производная, т. е. ускорение, пропорциональное ш2р. Точный расчет под- подтверждает такое заключение, а полная мощность излучения колеблющегося диполя дается выражением ^ = 7^^1Г- A0-26) 12тг?о с6 Это излучение обладает заметной анизотропией. Среднее за период значе- значение вектора Пойнтинга оказывается пропорциональным sin2#, где в — по- полярный угол, который отсчитывается от направления дипольного момента (рис. 10.4). Из всего вышеизложенного следует, в частности, принципиальная трудность резерфордовской плане- планетарной модели атома. Если бы электрон просто вра- вращался по орбите вокруг ядра, атом в принципе суще- существовал бы конечное время — пока вся начальная кинетическая энергия не ушла бы с излучением. Тогда р 1П 4 произошло бы падение электрона на ядро. Существен- Существенно, что в этом случае свойства отдельных атомов не были бы идентичны, а зависели бы от возраста. Это соображение послужи- послужило главным толчком к созданию атомной модели Бора, а далее — и всей квантовой механики. Формула A0.26), а равно и рис. 10.4, подразумевают, что размер диполя / меньше длины волны A: Z <С с/ш. Такой диполь называют элементарным диполем или диполем Герца. Излучение может быть надежно идентифици- идентифицировано в так называемой волновой зоне — при г ^> с/и. В технических целях используются обычно другие излучатели — антенны, у которых характер- характерный размер, с тем или иным коэффициентом порядка единицы, соответству- соответствует как раз длине волны: / ~ 2тгс/и>. Если излучение элементарного диполя может быть вызвано различными причинами, включая ускорение частиц, то в случае антенны это всегда результат подачи на диполь мощного внешнего сигнала. Электродипольное излучение — наиболее типичный механизм генерации электромагнитных волн и в природе, и в технике, но в принципе существуют и другие, связанные с изменением во времени магнитодипольного момента, электрического и магнитного квадрупольных моментов и т. д. Задачи 1. Плоская монохроматическая электромагнитная волна частоты и падает нормально на плоскую гладкую поверхность проводника (рис. 10.2). Проводимость материала Л, маг- магнитная проницаемость // ~ 1. Оценить коэффициент отражения по мощности и амплитуде.
ЗАДАЧИ 291 Решение. Отличие коэффициента отражения от единицы обусловлено джоулевой дис- диссипацией в скин-слое, т. е. на глубине вплоть до ?эф, которая дается формулой (8.28): Удобно вычислять связанные с этим потери, относя их к единице площади поверхности зеркала, а затем получить коэффициент отражения, нормируя эту диссипацию на поток энергии. Итак, dV/(dSdt) - (//А) • дэф = Л • Е2 • BтгI/2/(^А//0I/2. Модуль вектора Пойнтинга, равный потоку энергии на поверхность зеркала, можно представить в виде: Отнеся интенсивность потерь к потоку энергии, получим коэффициент поглощения по энергии; вычитая последний из единицы, получим коэффициент отражения по мощно- мощности R. (К сожалению, это совершенно стандартное обозначение пересекается с принятым в электротехнике символом омического сопротивления). Таким образом, R~l-Ji ' Поскольку отраженная волна представляет собой электромагнитную волну той же ча- частоты, что и падающая, и с тем же соотношением между Е и Н, амплитудный коэффи- коэффициент отражения равен просто квадратному корню из коэффициента отражения по мощ- мощности: г = л/R. Надо заметить, что использованные нами соображения корректны лишь в случае радиоволн достаточно низкой частоты. В оптическом и даже инфракрасном диа- диапазоне частот механизмы отражения и потерь будут несколько иными. Мы еще коснемся этого вопроса в заключительной главе. Точность полученных нами результатов не слишком велика — именно потому, что не слишком точно оцененную величину приходится вычитать из единицы. Гораздо более на- надежна оценка коэффициента поглощения по мощности 1 — R = су 2тг\/1о/ио, которая позволяет правильно оценить порядок величины потерь при отражении. Каче- Качественным ответом задачи будет либо малость этого коэффициента в сравнении с единицей, либо соизмеримость. 2. Электрон совершает циклотронное вращение в однородном магнитном поле В. По- Получить зависимость его энергии от времени и оценить, сколько оборотов он сделает до остановки. Решение. Мы неоднократно подчеркивали гироскопический характер силы Лоренца, в силу которого она не совершает работы над заряженной частицей. Но при движении частицы по круговой орбите (а это движение с ускорением) происходит, в соответствии с A0.26), излучение электромагнитных волн, оно-то и тормозит частицу. Мы сделаем лишь одно упрощающее предположение: пусть энергия, потерянная на излучение за один оборот, будет много меньше кинетической энергии электрона. Необходимое для этого условие последует в конце решения. Дипольный момент единственной частицы равен — см. A.23): р = —ег. Удобно поме- поместить начало координат в центре циклотронной орбиты, тогда ро = ev/uuB, где v — ско- скорость электрона на орбите, а шв = еВ/тп — циклотронная частота. Поскольку диполь в данном случае вращается, а не осциллирует, интенсивность потерь A0.26) нужно удвоить (складывая (л)А{р2х) и ии4(ру)): ^ 1 pWB eVa.2 W e2u;2B 6тГ?о С3 6ТГ?()С3 ЗТГ
292 ГЛ. 10. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ где W — кинетическая энергия. Составляя уравнение dW/dt = — W, находим, что кине- кинетическая энергия электрона должна убывать по экспоненциальному закону f Зтг Как обычно при экспоненциальном затухании, характерное время остановки не зависит от начальной энергии — по смыслу это масштаб времени, по истечении которого энергия становится существенно меньше начальной. Это время можно выразить через характерное число оборотов: _ т2?0с3 N т = 3тг = . Отсюда и получаем ответ Наше предположение о малости потерь за период эквивалентно сильному неравенству N ^> 1, что приводит к следующему условию на поле: В < Зтгт2в0с3е - 1012 Тл — оно с запасом выполнено при всех доступных значениях поля. Соответственно, с боль- большим запасом выполнено условие N ^> 1, так что при рассмотрении не слишком большого числа оборотов частицы в магнитном поле мы вполне можем пользоваться приближением стационарной орбиты (как это до сих пор и делалось). 3. Плоская монохроматическая электромагнитная волна падает нормально на отража- отражающую поверхность, частично поглощается, а частично отражается. В пространстве перед зеркалом образуется суперпозиция падающей и отраженной волн, причем т. н. коэффици- коэффициент стоячей волны — отношение амплитуды в пучности к таковой в узле — равен п = 10. Определить коэффициент отражения по мощности. / 1 \ 2 Ответ: R = ( ^—— ) ~ 0,67.
ГЛАВА 11 ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ 11.1. Распространение волн в сплошной среде. Показатель преломления Предположим, что мы поставили задачу об электромагнитном поле в от- отсутствие источников, но не в вакууме, а в некоторой линейной среде, ко- которую можно охарактеризовать константами ?, \i. Конечно, безграничность такой среды еще более проблематична, нежели безграничность пустого про- пространства в предыдущей главе. Но как всегда в физических задачах, такую идеализацию следует понимать в смысле некоторого сильного неравенства. В данном случае условие применимости следует из ответа: характерный размер образца диэлектрика или характерный масштаб его неоднородности должен многократно превосходить длину волны. Вместо A0.12), получаем систему уравнений rotB = ??0/j/j0(dB/dt); rot E = -(дВ/dt). A1.1) Произошла, как мы видим, совершенно незначительная модификация — всего лишь в одном коэффициенте. Соответственно, и A0.13), A0.14) изме- изменяются лишь в одном коэффициенте: d2B/dt2 = (c2/e/j)V2B; d2E/dt2 = (c2/e/j)V2E. A1.2) Итак, мы опять пришли к волновому уравнению, и его решением снова бу- будет монохроматическая плоская волна A0.15) при том же законе дисперсии A0.6), но скорость распространения волн будет меньше, чем в вакууме: ш/к = с/п, где п = у/ёЦ. A1.3) Величина п называется коэффициентом преломления — как мы вскоре убе- убедимся, она как раз соответствует коэффициенту преломления в оптике. Природа устроила так, что во всех без исключения средах, прозрачных в оптическом диапазоне, величина \i с хорошей точностью равна единице, по- поэтому в оптике обычно без оговорок полагают п = у/е. Не следует, однако, отождествлять диэлектрическую проницаемость, кото- которую мы вводили в электростатике, с константой е в уравнениях A1.1)—A1.3). Это одно и то же по физическому смыслу, но не по величине. Известно, что у чистой воды в статике е = 81. Казалось бы, отсюда следует п = 9, но в действительности показатель преломления воды равен примерно 1,33 в красной области спектра и 1,34 — в фиолетовой. Мы с детства любуемся радугой, существование которой обусловлено именно этой небольшой разницей. Такую же «радугу» можно наблюдать при преломлении света в стеклянных призмах — даже просто на скошен- скошенном краю толстого зеркала. Эти бытовые наблюдения свидетельствуют о
294 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ фундаментальном факте зависимости показателя преломления от частоты. Данное свойство называется дисперсией; мы его уже касались в связи с со- соотношением A0.6). Не следует преувеличивать полноты информации, пред- представленной нашим повседневным опытом. Порядок цветов в радуге любой природы таков, что из него следует рост п с частотой. Но во-первых, как раз при lo = 0 величина л/е оказывается почти в 7 раз больше, чем в оптике, т. е. при ио ~ 1015 с. А во-вторых, для электромагнитных волн существенно бо- более высокой частоты — жестких рентгеновских лучей — коэффициент пре- преломления любого вещества оказывается очень близок к единице. Дисперсия электромагнитных волн — явление сложное, функция п(ш) немонотонна и включает области непрозрачности. Но и тот простой случай, который представляют уравнения A1.1)—A1.3), реализуется во многих ситуациях, представляющих практический интерес, а потому стоит изучения. Приведем некоторые соотношения, демонстриру- демонстрирующие отличие волн в прозрачной среде с постоянным коэффициентом пре- преломления, от волн в вакууме. Как уже было отмечено в гл. 10, восприятие цвета обусловлено частотой. Мы знаем, что в стационарной оптической системе чистый спектральный цвет не меняется при переходе из одной среды в другую. (Это не относится к нестационарным системам, включающим, например, движущиеся зеркала или среды с переменным во времени коэффициентом преломления, а также к нелинейным средам.) Факт сохранения частоты в линейной стационарной системе — по сути, закон сохранения энергии для световых квантов. Не касаясь этой стороны дела, мы его примем в качестве экспериментального. Как следствие, разная фазовая скорость волн в разных средах обусловлена зависимостью от п волнового числа или, что то же, длины волны: к(п) = пко; A(n) = Ao/n, (H-4) где ко = 2тг/Ао = ш/с — характеристики волны данной частоты в вакууме. Из соотношений A1.4) естественно следует определение относительного ко- коэффициента преломления двух сред: И это определение соответствует стандартному, принятому в оптике. По- Получим далее соотношения между величинами электрического и магнитно- магнитного полей в волне, аналогичные A0.16). Подставим решения вида A0.15) в уравнения A1.1) и постараемся записать ответ в форме, как можно более симметричной: В = (п/с)Е = у/ееоМоЕ; Н = у/еео/(№о)Е. A1.6) Отсюда следует, что плотность энергии электромагнитной волны может быть представлена в следующем виде: w = (еео/2)(Е2) + (т/2)<#2) = еео(Е2) = (В2)/(^0). A1.7) Представляется достаточно интересным тот факт, что электрическая и маг- магнитная энергия поперечной волны остаются, как и в вакууме, равны друг другу. Исходя из A1.6), мы можем вычислить и вектор Пойнтинга
11.2. ОТРАЖЕНИЕ И ПРЕЛОМЛЕНИЕ НА ПЛОСКОЙ ГРАНИЦЕ 295 И, наконец, плотность импульса электромагнитной волны в прозрачной сре- среде оказывается равной A1.9) 1, хотя, как уже гово- = S/c2 = Ради общности мы всюду сохранили величину \i рилось, для прозрачных сред магнитная проницаемость, как правило, несу- несущественна. 11.2. Отражение и преломление на плоской границе Рассмотрим задачу о прохождении электромагнитной волны через плос- плоскую границу двух диэлектрических сред I и II (одной из них может, в част- частности, быть и вакуум). Эта ситуация представлена на рис. 11.1 а, б для случая двух различных поляризаций. Направление электрического и маг- магнитного векторов соответствует правилу, согласно которому k, E, В обра- образуют правую тройку. Мы использовали в качестве магнитного вектора Н, поскольку именно для него будем писать соответствующее граничное усло- условие. Заметим, что магнитное поле ориентировано на рис. 11.1 а так же, как электрическое поле на рис. 11.1 б (с точностью до знака), а на рис. 11.1 б — ортогонально плоскости рисунка. Результаты, которые мы получим в дан- данном параграфе, можно переносить и на случай искривленной поверхности раздела. Она лишь должна быть гладкой, а радиус кривизны ее должен многократно превосходить характерный пространственный масштаб элек- электромагнитного поля — длину волны. Таким образом мы опишем действие на электромагнитную волну, в частности, поверхности линзы. Все расчеты линз, тонких и толстых, а также и сложных оптических систем базируются именно на законе преломления. Мы будем пользоваться не понятием лу- луча, принятым в геометрической оптике, а более корректным с точки зрения электродинамики понятием волнового фронта; «лучи» — падающий, отра- отраженный и преломленный — изображенные на рис. 11.1, представляют в на- наших терминах нормали к волновому фронту, направление которых задается вектором к. Пусть показатели преломления сред I и II равны, соответственно, ni, П2 (в вакууме — просто единице). Мы показали на каждом из рисунков 11.1 три волны: падающую (индекс г), отраженную (индекс г), и преломленную (ин- (индекс d). Это экспериментальный факт, известный каждому школьнику, но
296 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ даже и не зная этого заранее, можно было его предсказать, исходя из уравне- уравнений Максвелла. В случае падения электромагнитной волны на проводящую поверхность (см. пункт 10.4) у нас «работало» единственное нетривиальное граничное условие — закон сохранения тангенциальной компоненты элек- электрического поля (9.12), а все остальные выполнялись должным образом за счет зарядов и токов, индуцированных на поверхности проводника. Теперь такой возможности уже нет, поскольку мы имеем дело с диэлектрическими средами, а поэтому всего лишь одной волны, помимо падающей, нам просто не хватит. В каждой из двух ситуаций на рис. 11.1 нам придется выполнить условия непрерывности Ет и Нт. Третье условие — сохранение Вп в случае, изображенном на рис. 11.1 а, и Dn в случае рис. 11.1 б— будет выполнено автоматически как следствие закона преломления. Еще один вопрос, на который целесообразно ответить заранее: правомерно ли разделение постановки задачи имнно на те два случая, которые предста- представлены на рис. 11.1 а, 61 Не могут ли возникнуть отраженные либо прело- преломленные волны с поляризацией, ортогональной таковой в падающей волне? Ответ: не могут, и это прямое следствие уравнений Максвелла и граничных условий. В силу линейности задачи, мы можем расщепить решение урав- уравнений Максвелла на два линейно независимых, соответствующих двум раз- различным поляризациям. Выбирая решение с одной из поляризаций — той же, что и у падающей волны, мы оперируем с полями трех волн, что позволяет выполнить граничные условия (9.12) и (9.15). При попытке выполнить их для другой поляризации нам опять «не хватит» переменных, т. к. в нашем распоряжении будут только две волны, без падающей, так что единствен- единственным возможным решением с такой поляризацией окажется нулевое поле. Разумеется, эти рассуждения находятся в полном соответствии с экспери- экспериментальными данными. Пусть все три волны записаны в виде A0.15). Очевидно, для линейной среды зависимость Н(г,?) или В(г,?) будет иметь точно такой же вид. Вос- Воспользуемся для случая а граничным условием (9.12) ^i = Еп ==> Ei + Er = Ed, а для случая б— (9.15) Hj = Нп => Hi + Нг = Hd (мы учли, что в обоих случаях в соотношение входят параллельные векто- векторы). Поскольку дальнейшие действия для обеих поляризаций совершенно идентичны, мы ограничимся случаем рис. 11.1 а. Пусть в какой-то момент времени граничное условие выполнено. Однако оно сразу же нарушится, если зависимость от времени не будет одинаковой для всех трех полей. Это означает, что частота всех трех волн должна быть одинаковой (и действи- действительно, отражение от прозрачной среды и преломление в ней «сохраняют цвет»). Далее введем в плоскости падения вдоль границы сред координа- координату х. Из поперечности волн и параллельности векторов Е^, Ег, Е^ следует, что все три волновых вектора к^, кг, к^ лежат в одной плоскости — плос- плоскости падения. Вдоль оси Ох произведения кг в формулах типа A0.15) вы- вырождаются в кх- х. Таким образом, граничное условие при равных частотах сводится к следующему: Eioex.p(ikx simp) + ErQ ex.p(ikx sin у/) = Е^о exp(ifc/x simp).
11.3. ФОРМУЛЫ ФРЕНЕЛЯ 297 Мы воспользовались обозначениями углов рис. 11.1 и учли, что из равен- равенства частот для падающей и отраженной волн следует равенство волновых чисел. Для преломленной волны волновое число к' определяется форму- формулой A1.5). Теперь потребуем, чтобы наше граничное условие выполнялось в любой точке оси Ох. Для этого необходимо, чтобы экспоненциальные мно- множители были тождественно равны друг другу, а значит, равны должны быть их аргументы: к simp = к sin у/ = к(пи/п1) 8тф. Мы получили аналитически из законов электродинамики хорошо известные правила вычисления углов отражения и преломления: (p = (pf; simp/ 8тф = п = пи/п1. A1.10) Соотношения A1.10), в частности, подтверждают, что введенный нами ко- коэффициент преломления п = ^/еЦ и в самом деле имеет право так назы- называться. Далее из A1.10) можно извлекать следствия, хорошо известные из школьного курса физики: эффект полного внутреннего отражения, откло- отклонение световой волны призмой, фокусное расстояние тонкой линзы и т. д. Однако решение задачи о прохождении волной границы двух сред не исчер- исчерпывается этим результатом. Те же самые граничные условия (9.12)—(9.15) позволят нам продвинуться существенно дальше — определить коэффици- коэффициенты отражения и прозрачности на границе раздела двух диэлектриков. Впервые это было сделано О. Френелем (более чем за десять лет до ро- рождения Максвелла). 11.3. Формулы Френеля Предметом нашего рассмотрения по-прежнему остаются задачи, предста- представленные на рис. 11.1 а, б. Для упрощения последующих выкладок положим для обеих сред /i = 1; по сути, все сколько-нибудь интересные ситуации укладываются в рамки такого ограничения. Далее, мы проведем вычисле- вычисления для границы диэлектрика с вакуумом: п1 = 1, пи = п, а ответ предста- представим в такой форме, что его можно будет отнести к границе сред с произ- произвольными коэффициентами преломления. В дальнейшем, выписывая граничные условия, мы сразу будем сокращать экспоненциальные осциллирующие множители, поскольку равенство частот и формулы A1.10) гарантируют нам такую возможность. Теперь выполне- выполнение граничных условий потребует лишь определенного соотношения между амплитудами волн. В этой связи заметим, что направление векторов Е на рис. 11.1 а и Н на рис. 11.1 б выбрано нами из соображений как можно боль- большей симметрии получающихся уравнений — в принципе для одной из вто- вторичных волн — отраженной либо преломленной — ответ может включать знак «—», что, конечно, должно получиться совершенно автоматически. Введем амплитудные коэффициенты отражения г и прозрачности t следу- следующим образом: = tEi0. A1.11) Мы ввели их через отношение амплитуд электрического поля в духе сде- сделанного выше замечания о том, что при регистрации электромагнитных
298 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ волн происходит измерение именно электрического поля. Если вычисли- вычислительная процедура приведет к тому, что один из них окажется отрицатель- отрицательным, это будет означать просто фазовый сдвиг на тг. В наших предположе- предположениях Н = n(e$lii$)ll2E, при этом имеет смысл удерживать только фактор п, все прочее можно будет в наших уравнениях сократить. Итак, для кон- конкретной геометрии рис. 11.1 а (электрическое поле ортогонально плоскости падения) граничные условия (9.12), (9.15) преобразуются к виду [Ет] =0^E, + Er = Ed; [Нт] = 0 =^> —Hi cos ip + Hr cos ip = — Н^ cos ф =^> => —Ei cos if + Er cos if = —nEd cos ф. Эту систему уравнений с помощью введенных нами коэффициентов можно свести к следующей: 1 + г = ?; A — г) coscp = t(smcp/8тф) со8ф. A1.12) Как и было обещано, система уравнений переписана в универсальном виде, в ней фигурируют только функции углов падения и преломления. Реше- Решение A1.12) не представляет труда. Мы приводим сразу же ответ: = sin(<p - ф) ш t = 2 sin ф cos (p sin(<p + ф)' sin(<p + ф) Здесь индекс _L означает поляризацию электрического вектора нормально к плоскости падения. Как мы и предвидели, высокая симметрия рис. 11.1 а не соблюдена — отражение происходит с потерей полуволны. Надо заметить, что граничных условий в общей сложности четыре. Но условие (9.14) в данном случае вырождено, поскольку электрический век- вектор не имеет составляющей, нормальной к поверхности раздела. Обратимся к условию (9.13), которое для случая \i = 1 может быть переписано для напряженности поля: [Нп] = 0, или, что то же, (см. рис. 11.1 а) (Hi + Hr) siny? = Н^^тф =^ (Ei + Er) Это условие тождественно удовлетворяется как следствие закона преломле- преломления и граничного условия на тангенциальные компоненты электрического поля. Тем самым мы убедились, что ответ A1.13) вполне корректен. Рассмотрим случай поляризации электрического вектора в плоскости па- падения (рис 11.1 б). Те же самые условия (9.12), (9.15) теперь запишутся в виде [Ет] = 0 =^ Ei cos ip — Er cos ip = Ed cos ф; [HT1 = 0 =^ Hi + Hr = Н^ =^ Ei + Er = ——- Ed- ътф В терминах коэффициентов отражения и прозрачности эта система уравне- уравнений может быть представлена следующим образом: sin ю . ч cos ю, ч sin ю . . t = -т-^- 1 + г ; ^ 1 - г = ^ 1 + г . 11.14 sin^ со8ф 8тф
11.4. ПОЛЯРИЗАЦИОННЫЕ ЭФФЕКТЫ. ПОТОК ЭНЕРГИИ ЧЕРЕЗ ГРАНИЦУ 299 Решение A1.14), как и A1.12), сводится к стандартным тригонометрическим преобразованиям, хотя и несколько более громоздким. Ответ: tgQp-VO , 2 sin У? cos <p Гц = — —; tii = — —. A1.15) 11 tg((p + ^) sin(<p + ф) cos((p — ф) Предоставляем читателю самостоятельно убедиться в том, что граничное условие (9.14) в данном случае выполняется автоматически, а условие (9.13) вырождено. Таким образом, задача решена полностью. Хорошей проверкой наших от- ответов будет сведение их к общему предельному случаю нормального па- падения, которому мы припишем коэффициенты го, to- Из рис. 11.1 следует, что значения коэффициента отражения, полученные предельным переходом из A1.13, 11.15), должны отличаться знаком — на рис. 11.1 а знак «—» учи- учитывает потерю полуволны, которая на рис. 11.1 ^последует автоматически, потому что здесь сама амплитуда Ег — другого знака. С учетом этого об- обстоятельства искомые величины оказываются равны следующим: г0 = (п - 1)/(п + 1); t0 = 2/(n + 1). A1.16) Формулы A1.13), A1.15), A1.16) — именно они и называются формулами Френеля — в достаточной мере универсальны с точки зрения соотношения коэффициентов преломления, т. е. они равным образом могут применяться при падении волны из вакуума на границу с диэлектриком, из диэлектрика в вакуум или на границу между двумя диэлектриками. При этом углы <р, ф и коэффициенты преломления nI5 nn, n связаны законом A1.10). 11.4. Поляризационные эффекты. Поток энергии через границу Сравнивая между собой коэффициенты отражения и прозрачности для различных поляризаций падающей волны — формулы A1.13) и A1.15), мы находим, что они отличаются друг от друга для всех углов падения, кроме нулевого — формула A1.16). Нам еще предстоит иметь дело с эффектом поляризации света в следующем разделе нашего курса, здесь же мы рассмо- рассмотрим некоторые следствия такого рода из формул Френеля. Дело в том, что естественный свет — и равным образом любые электро- электромагнитные волны естественного происхождения — всегда неполяризованы. С точки зрения решений уравнений Максвелла это значит, что свет (излу- (излучение) представляет собой линейную смесь волн самых различных поля- поляризаций. Мы уже обсуждали это свойство в связи с проблемой точечного источника. Разумеется, каждый отдельный квант, излучаемый возбужден- возбужденным атомом, как-то поляризован, но если характерное время регистрации много больше времени замены одного такого кванта другим, с другой поля- поляризацией, то мы этого не увидим. Это свойство присуще также и излучению искусственного происхождения, например, если его источник — тепловой природы: лампа накаливания, газоразрядная трубка (но не лазер!). Теперь представим себе, что такое неполяризованное излучение падает, как это показано на рис. 11.1, на границу двух сред с разными п. Ввиду различия коэффициентов A1.13) и A1.15), как отраженный, так и прело- преломленный свет уже приобретет некоторую степень поляризации. Последнюю
300 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ можно характеризовать, например, отношением средних квадратов электри- электрического поля, соответствующего различным поляризациям. Неполяризован- ный свет (или иное электромагнитное излучение) отвечает условию (El) = (E\). Напомним, что в данном случае усреднение проводится по промежутку вре- времени порядка или большему характерного времени регистрации. Для вто- вторичных волн из A1.13) и A1.15) получаем *|| Дадим для справки формальное определение степени поляризации элек- электромагнитного излучения А: Особый интерес представляет возможность полной поляризации отражен- отраженного света при ср + ф = тг/2 — уже из A1.15) видно, что при этом гц = 0. Это означает, что в отраженном свете вектор Е строго перпендикулярен плоско- плоскости падения. С учетом A1.10) находим соответствующий угол падения срв = arctgn. A1.18) Этот угол называется углом Брюстера, что и отражено индексом. Заме- Заметим, что максимальная поляризация отраженного света не соответствует максимальной поляризации преломленного — это можно увидеть из вто- второй формулы A1.17). Еще отметим следующее обстоятельство. Если диэлек- диэлектрическая пластинка освещается белым светом, то условие A1.18) должно включать зависимость п(ш) или, что то же, п(А), и угол Брюстера будет разным для волн разной частоты. Таким образом, простейший поляроид, доступный каждому, — это про- просто стеклянная пластинка, которую следует располагать так, чтобы свет падал на нее по возможности близко к срв. С помощью такого поляроида нетрудно, например, заметить поляризацию света, отраженного от водной поверхности. Если же набрать пакет из таких пластинок и наблюдать ис- источник света на просвет, то можно получить достаточно высокую степень поляризации, ~ cos^((p — Ф), где N — число параллельных пластинок. (Фак- (Фактор 4, вместо двойки, есть следствие того, что у каждой пластинки — две поверхности раздела сред.) Такой поляроид впервые был предложен рус- русским физиком А. Г. Столетовым и называется стопой Столетова. Если г и f — амплитудные коэффициенты отражения и прозрачности, то г2 и t2 — то же для интенсивности. В этой связи обращает на себя внима- внимание следующее обстоятельство. Вне зависимости от поляризации, из обеих формул A1.13) и A1.15) следует г2 + t2 ф 1. Легче всего это увидеть из формул A1.16) для нормального падения, и в этом же случае легче всего прокомментировать. Никакого парадокса здесь нет, поскольку в задаче тако- такого рода следует подводить баланс не энергии как таковой, а потока энергии. Предположим, что электромагнитная волна падает из вакуума на границу диэлектрика. Падающий на границу поток энергии равен, согласно A1.8),
11.5. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ И ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ 301 отраженный, соответственно, \(S)r\=r20^UM)(Ei), а уходящий с преломленной волной, |(S>d| = 4у/еео/цо{Е?) = nt20\(S)i\. Таким образом, баланс потоков энергии в данной задаче требует следую- следующего равенства: rg + rctg = l, A1.19) которое и в самом деле выполнено для коэффициентов отражения и про- прозрачности A1.16). 11.5. Электромагнитные волны и теория относительности Как можно заключить из самой процедуры вывода волнового уравнения A0.13) или A0.14), электромагнитные волны представляют собой поля Е и В в вакууме и тем самым принципиально отличаются от других извест- известных волновых движений, например, звуковых волн. Общность формального описания — волновые уравнения, их фундаментальные решения и пр. — в течение многих десятилетий побуждала физическое сообщество к поис- поиску более глубокой физической аналогии. Поскольку звуковые волны пред- представляют собой волновые движения в упругой твердой или жидкой среде, высказывались предположения о существовании некоторой гипотетической среды — эфира, колебания которой и описываются уравнениями Максвел- Максвелла. Среда эта должна быть абсолютно упругой (прозрачной) и заполнять все физическое пространство, включая находящееся там вещество. Стро- Строились достаточно убедительные теоретические модели (автором одной из наиболее совершенных был Г. Герц), которые могли объяснить некоторую совокупность экспериментальных фактов, но рано или поздно приходили в противоречие с данными очередного эксперимента. Как особо важные следу- следует отметить прежде всего опыты Майкельсона, экспериментально доказав- доказавшего, что скорость света с не зависит от того, распространяется сигнал по- поили против скорости движения Земли по орбите (~ 30 км/с). Параллельно был поставлен опыт Физо, впоследствии повторенный в усовершенствован- усовершенствованном варианте Майкельсоном, из которого следовало, что закон «сложения скоростей» эфира и световых волн должен принципиально отличаться от такового в механике Ньютона. Вопрос о сложении скоростей вообще оказался совершенно принципиаль- принципиальным. Напомним, что в ньютоновой механике переход между двумя инерци- альными системами отсчета задается преобразованием Галилея r' = r-V?; ?' = ?, A1.20) где V — скорость новой системы отсчета относительно старой. Второе усло- условие, в частности, декларирует, что время течет одинаково во всех инерци- альных системах. В течение почти двух столетий физический эксперимент, выполненный с доступной по тому времени точностью, подтверждал аде- адекватность преобразований A1.20). Механика Ньютона инвариантна по отношению к преобразованию A1.20). Это и выражено по сути первым законом Ньютона, который можно прочи- прочитать следующим образом: покой есть эквивалент равномерного движения,
302 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ и все законы природы одинаковы во всех инерциальных системах отсчета. Но уравнение A0.5), хотя бы оно и следовало из ньютоновой механики, от- отнюдь не инвариантно в смысле A1.20). В этом нет парадокса, потому что любые механические колебания привязаны к колебательной системе, а звук, соответственно, к твердой или текучей среде (под последней мы понимаем жидкость или газ). Разумеется, среди возможных систем отсчета, переходы между которыми описываются формулами A1.20), одна выделена, а имен- именно, та, в которой среда покоится, и следовательно, для волновых движений не существует какого-либо преимущественного направления. Предположим, эфира как такового не существует. Все известные модели его отвергнуты экспериментом. Электромагнитные волны суть поля в ваку- вакууме. Вакуум не имеет скорости, и понятие направления для него не имеет смысла. Значит, уравнения Максвелла (9.2)-(9.5) или (9.8)—(9.11) должны выглядеть одинаково во всех экспериментальных системах. Но уравнения Максвелла не инвариантны относительно преобразований A1.20)! Описанные трудности и явились побудительным мотивом к созданию спе- специальной теории относительности (СТО). В настоящее время ее более при- принято называть релятивистской механикой, и главный экспериментальный материал для ее подтверждения поставляют ядерная физика и физика эле- элементарных частиц. На данный момент эти данные не менее убедительны, чем обоснования ньютоновой механики. Но до появления знаменитой рабо- работы Эйнштейна A905 г.) их практически не было, зато в течение полувека информация к размышлению поставлялась оптическими измерениями. И са- сама работа Эйнштейна называлась «К электродинамике движущихся тел», и главным постулатом в ней — в духе сказанного выше — была независимость скорости света от (инерциальной) системы отсчета. Как известно, последовательное развитие этой идеи вкупе с принципом эквивалентности инерциальных систем потребовало замены преобразований Галлилея более сложными преобразованиями Лоренца. Для удобства запи- записи принято оси Ож, Ох' направлять вдоль относительной скорости V. Тогда, вместо A1.20), получаются следующие формулы перехода: x' = -y(x-Vt); y' = y; z' = z; t' = 7 {t - (V/c2)x) , A1.21) где 7 — так называемый релятивистский фактор: - V2/c2. A1.22) В отличие от преобразований Галлилея, время уже не является общим для всех инерциальных систем и преобразуется вместе с координатами. При V <С с преобразования A1.21), A1.22) переходят в A1.20), и тем самым ре- релятивистская механика возвращается к механике Ньютона. Аналогичный предельный переход совершают выражения для энергии и импульса свобод- свободной частицы ? = jmc2; р = jmv, (га — масса покоя частицы), с тем, правда, отличием, что в выражении для энергии возникает аддитивная добавка гас2. Иногда пользуются понятием релятивистской массы, связанной с массой покоя коэффициентом 7? и тогда выражение ? = гас2 становится универсальным; в последнее время, однако, такого раздвоения понятия массы физики предпочитают избегать.
ЗАДАЧИ 303 Если бы мы просто применили A1.21), A1.22) к уравнениям Максвелла, никак не преобразуя полей, инвариантности все равно не получилось бы. Но еще в задаче 3 гл. 4 мы из физических соображений ввели преобразова- преобразование электрического поля D.27) при переходе к движущейся системе отсчета. Теперь же мы предложим (правда, без вывода) полную систему преобразо- преобразования полей при произвольной относительной скорости. В тех же коорди- координатных осях Е'х, = Ех; Е'у, = 7(Еу - V ¦ Bz); E'z, = 7(EZ + V ¦ Ву); A1.23) Н'Х,=НХ; H^-yiHy + V-Dz); H'z, = 7(#2 - V ¦ Dv); A1.24) Существенно, что заряд оказывается при таких преобразованиях инвари- инвариантным, q' = q. Электромагнитное поле, как можно видеть из A1.23), A1.24), преобразуется по закону более сложному, чем простая вектор-функция, ко- которая подчиняется преобразованию Лоренца. Электрическое и магнитное поля оказываются связанными в этих преобразованиях и в зависимости от системы координат переходят друг в друга. Тем не менее, формулы A1.23), A1.24) имеют вполне определенный «геометрический» смысл: величины, ко- которые мы считали векторными, оказываются компонентами некоторого тен- тензора — четырехмерного, поскольку он определен в пространстве (ж,у, ?,?). Мы лишь для того отмечаем это обстоятельство, чтобы предостеречь читате- читателя: в рамках преобразований Галилея такого преобразования полей, которое обеспечивало бы инвариантность уравнений Максвелла, найти не удастся. Таким образом, единственная среда с п = 1 есть вакуум. (Разумеется, в конкретных физических задачах мы очень часто можем с приемлемой для нас точностью полагать п = 1 и в достаточно разреженном веществе, на- например в атмосферном воздухе.) Идея эфира оказалась несостоятельной, но и простые преобразования перехода между инерциальными системами для электромагнитных явлений неприменимы. Уравнения Максвелла (9.2)-(9.5) или (9.8)—(9.11) оказываются существенно релятивистскими, хотя получая их, мы этих вопросов вообще не касались. В электродинамике принципи- принципиально важную роль играют электромагнитные волны, а это объект в опре- определенном смысле ультрарелятивистский, ибо скорость их в точности равна скорости света. Физика XX в. накопила огромный экспериментальный материал, вполне подтверждающий СТО и, в частности, справедливость соотношений A1.23), A1.24). Задачи 1. Определить степень поляризации преломленного света, если первичный поток не- поляризованного света падает под углом Брюстера из пустоты на поверхность стекла с показателем преломления п = 1,5. Решение. Из условия tgtp = п находим (р = 56° 19'. Искомая величина At может быть выражена через коэффициенты прозрачности: Далее, учитывая, что sin cp = nsin^ = ncos<^, подстановкой в A1.13), A1.15) получаем cos-2(y - ф) - 1 1 - 4п2/A + п2) __ ' cos-2(v3 + V)l 1 + 4п2/A + «2) '
304 ГЛ. 11. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПРОЗРАЧНЫХ СРЕДАХ 2. Переменное электромагнитное поле с характерной частотой и создается на грани- границе слабопроводящей диэлектрической среды с параметрами е, //, А <С бои. Определить характерную глубину проникновения. Решение. Задача тем отличается от задачи о скин-эффекте, что в этой ситуации, со- согласно условию, ток смещения доминирует над током проводимости. Действительно, для полей вида A0.15) это сразу следует из уравнений (9.2), (9.3): [kE] =cjB; (////оа^'ЧМкЕ]] = -(////0o;)ife2E = -гАЕ - cjs0E. A1.25) Поэтому в данном случае мы будем иметь дело не с квазистационарным профилем то- тока, но с проникающей в среду электромагнитной волной. Но, в отличие от A0.15), для нее частота и волновое число не могут быть одновременно вещественными, как нетрудно усмотреть из второго уравнения A1.25). Постановка задачи соответствует пространствен- пространственному затуханию волны, поэтому комплексным нужно выбрать к, причем, в силу малости проводимости, относительно малой будет и мнимая часть: к = ко -\- i>c => E, В ос ехр(—усх)\ ус <С ко, где х — координата по направлению в глубь среды от границы. Во втором уравнении A1.25) сокращаем амплитуду Е: . А//о к ко 2iko>c siisoHo + i = —^ — —^ Л «—• Из главных членов этого равенства следует, как обычно, и /к = с/п; приравнивая члены первого порядка малости, получаем _ Xfioc Таким образом, эффективная глубина проникновения, определенная через показатель экс- экспоненты, оказывается равной -1 2п Эта величина заметно отличается от квазистационарной глубины скин-слоя (8.28). Заме- Заметим, что из условия >с ^С &, которое, в свою очередь, есть следствие малой проводимости, вытекает, что глубина проникновения многократно превосходит длину волны. 3. Электромагнитное излучение заданной интенсивности (Ef) падает по нормали из вакуума на поверхность диэлектрика с диэлектрической проницаемостью е. Определить давление на поверхность раздела сред. П -D 2г2|&1 2 (П~ Ответ: V— \г~- = -? [ —г с2 с2 \n-\-l 4. Естественный свет падает под углом Брюстера на поверхность стекла с показателем преломления п = 1,5. Найти интенсивность (Е%) отраженной волны, полагая величину (Ef) известной. ОТвеТ:
ГЛАВА 12 ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ 12.1. Газовый разряд В каждом разделе общей физики существуют объекты, наилучшим обра- образом демонстрирующие физические законы, которые в данном разделе явля- являются предметом рассмотрения. Так в молекулярной физике традиционным объектом для мысленных экспериментов и частных примеров общих зако- закономерностей является идеальный или слабонеидеальный газ, в квантовой физике — атом водорода, а затем кристалл и т. д. В электродинамике один из самых удобных объектов такого рода — состояние вещества, называемое плазмой, поскольку главные свойства вещества в состоянии плазмы зада- задаются именно электродинамикой. При этом, в отличие, скажем, от ионных кристаллов или электролитов, прочие законы физики оказываются в какой- то мере подчиненными, вторичными, и многие совершенно принципиальные задачи физики плазмы могут рассматриваться в рамках одной только элек- электродинамики. Мы начнем, однако, не с физики плазмы как таковой, но с процесса про- протекания тока в газе — газового разряда. Физику газового разряда нередко смешивают с физикой плазмы. Как мы увидим далее, это не вполне коррект- корректно, но четкой границы между ними и в самом деле нет. Можно сказать, что в типичных условиях газовый разряд выделен исключительной неравновес- неравновесностью: объект существует лишь при определенных условиях протекания через среду электрического тока (а иногда как необходимое условие доба- добавляется внешний источник ионизирующего излучения). Все его свойства и закономерности чрезвычайно чувствительны к режиму, заданному извне. Но поскольку газовый разряд — главный метод получения плазмы в лаборато- лаборатории и наиболее доступный объект плазменной природы (не считая Солнца и звезд), следует, хотя бы кратко, остановиться на физике этого явления. Из чего бы газ ни состоял, в состоянии, близком к равновесному, он все- всегда — плохой проводник. Причина вполне очевидна: в газе молекулы почти никак друг с другом не связаны, каждая из них совершает хаотическое (бро- (броуновское) движение, и нет сколько-нибудь эффективных механизмов пере- переноса заряда. При прохождении мощных импульсов тока через тонкие про- проводники, когда вследствие мощного энерговыделения вещество проводника последовательно проходит все состояния от твердого до плазменного, паро- парогазовой фазе сопутствует так называемая «пауза проводимости». Однако в любом газе, даже если представить его абсолютно изолирован- изолированным от внешней среды, всегда есть хотя бы очень малая доля молекул, на- настолько энергичных, что при межмолекулярных столкновениях происходит отрыв электронов от нейтральных атомов и образование электрон-ионных пар. Таким образом в газе появляются возможные носители тока. Реальное
306 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ же их число всегда значительно выше того, которое формально следует из термодинамического равновесия, поскольку во Вселенной существует опре- определенный фон космического излучения. Оно и поддерживает в любом газе некоторую стационарную степень ионизации, а значит, и проводимости. В гл. 3 мы моделировали механизм сопротивления, связав его с эффек- эффективной частотой столкновений электрона — см. формулу C.11): Л = пе2/(?тшэф). Если для большинства проводников эта формула — всего лишь наглядная модель микроскопической природы закона Ома, то для слабоионизованного газа она работает как очень хорошее приближение к реальности. Не следует, однако, думать, что это выражение есть уже ответ на все вопросы. Физиче- Физическая задача часто в том и состоит, чтобы правильно определить величину z/эф, включая зависимость от полей Е и В, так как закон Ома в газах чаще всего оказывается нелинейным. Кроме электронов, ток могут переносить и ионы. Обычно этот канал менее эффективен, но в некоторых газах, например О2, электроны эффективно адсорбируются нейтральными атомами, и тогда ток переносится двумя сортами ионов. В случае носителей нескольких сор- сортов скорость каждого из них (индекс а) связывается с электрическим полем коэффициентом, который принято называть подвижностью и обозначать /j,a: va = /iQE; /iQ = Zae/(mava); Ze = -1; A2.1) — см. вывод формулы C.11). Здесь Zae — заряд соответствующего иона; электроны для общности тоже включены в их число, A2.1) позволяет обоб- обобщить формулу C.11): ^^. A2.2) Опыт показывает, однако, что простой закон Ома, хотя бы и нелиней- нелинейный, описывает протекание тока в газе лишь при достаточно малых полях. Пример вольтамперной характеристики газового разряда представлен на рис. 12.1. Для наших рассуждений ее удобнее рассма- у тривать в локальной форме j(E). Участок О А соот- / ветствует пределу слабого поля и описывается фор- \ () Д У\ В у ру фр мул ой A2.2). Далее в некотором интервале значений поля (участок АВ) плотность тока — почти констан- та, затем при некотором критическом значении поля ^ ^кР ЕКр происходит пробой, и ток многократно возраста- р ^ 1 ет, чему отвечает участок кривой ВС. Разряд в обла- области ОАВ называется несамостоятельным, а при Е > Екр — самостоятельным. Происхождение такой терминологии будет ясно из дальнейшего. Теория, описывающая столь нетривиальное поведе- поведение тока в зависимости от поля, была впервые построена Таунсендом. Мы воспроизведем ее основные положения и результаты. Главная причина неадекватности закона Ома — в том, что не только усредненная величина ^эф, но и рождение носителей тока существенно для физики разряда. Рассмотрим для простоты чисто электронную динамику. Внешние источники (космические лучи) рождают в единицу времени опре- определенное число электронов. Можно было бы ожидать, что когда плотность
12.1. ГАЗОВЫЙ РАЗРЯД 307 0 К Рис. 12.2 тока достигнет такой величины, что именно столько их и будет приходить на анод, рост тока, соответствующий A2.2), прекратится, и мы как раз вый- выйдем на участок АВ вольтамперной характеристики. Но такое представление оказывается слишком примитивным, тем более, оно не может объяснить эф- эффект пробоя. На самом деле уже в области АВ в игру вступает новое явле- явление — образование электронной лавины. Будем считать, что газ заполняет некоторый диод (на рис. 12.2 он показан плоско-параллельным, К — катод, А — анод). Будучи ускорены в электриче- электрическом поле Е, электроны при соударениях с нейтральными атомами и молекулами про- производят вторичную ионизацию. Главный ис- источник первичных электронов в такой си- системе — катод, так как внешнее излучение эффективнее взаимодействует с конденсиро- конденсированным веществом, нежели с разреженным газовым наполнением. Но электроны, выби- выбитые из анода, тут же втягиваются обратно электрическим полем, тогда как с катода они стартуют в направлении анода. Пусть в еди- единицу времени на катоде рождается число электронов, равное Щ. Ради упрощения вычислений мы в дальнейшем пре- пренебрегаем рождением электронов в газовом объеме. Поскольку длина пробе- пробега от нулевой скорости примерно одинакова в любой области, а практически всю энергию, полученную при ускорении в электрическом поле, электрон каждый раз отдает на вторичную ионизацию, число вторичных электрон- ионных пар на длине пробега, а значит и на единицу длины, примерно оди- одинаково и может характеризоваться некоторым параметром /3: C = dNT/dx, где ось Ох направлена от катода к аноду (рис. 12.2), координата катода х = 0, анода — х = d. Уравнение, описывающее изменение числа электронов с координатой ж, следует из условия dN = N-Cdx. Решение его, как хорошо известно, — экспонента: N ос ехр(/3ж); => N(d) = N@) exp(/3d). A2.3) Этот процесс экспоненциального накопления электронов в катод-анодном промежутке схематически показан на рис. 12.2. Для определенности мы «привязали» вторичные электроны к самому концу свободного пробега. На- Напомним еще раз, что число электронов у нас нормировано на единицу време- времени. Чтобы получить число вторичных электрон-ионных пар, нужно вычесть из A2.3) число электронов, порождаемое в единицу времени внешним источ- источником: NT = N@)[exp(Cd)-l]. В установившемся режиме разряда именно таким будет число ионов, прихо- приходящих в единицу времени на катод. Они не слишком эффективны в процессе объемной ионизации — из-за их малых скоростей, но из массивного катода могут выбивать вторичные электроны — для этого энергии у них доста- достаточно. Пусть каждый из них выбивает в среднем 7 вторичных электронов.
308 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ (Заметим, что коэффициенты /3 и 7 могут быть как больше, так и меньше единицы.) Тогда число электронов, выбитых ионами из катода в единицу времени, равно 7iV@)[exp(/3d)-l], а полное их число, образованное ионами и внешним источником в единицу времени JV(O) = No + 7N@)[exp(Cd) - 1]. Отсюда и следует окончательно: N(Q) No N(d) N0exp(f3d) iV ^ " i _ 7[exp(/3d) - 1]' W ~ 1 - 7[exp(/3d) - 1]' [ > Если знаменатели в формулах A2.4) положительны, мы имеем дело с неса- несамостоятельным разрядом, поскольку / ос iVo, но если мы достигаем крити- критического условия 7[exp(/3d) - 1] = 1, то величина Щ уже несущественна, поскольку полный ток в A2.4) фор- формально обращается в бесконечность. Это и есть пробой, иными словами — переход в режим самостоятельного разряда. Почему это происходит при росте напряженности поля (рис. 12.1)? Экспе- Экспериментально установлено, что «коэффициент размножения» C (на рис. 12.2 он равен 3) есть некоторая монотонная функция отношения поля к давле- давлению газа: /3 = F(E/V). Таким образом, по мере роста поля или снижения давления мы и попадаем в режим самостоятельного разряда: 7[ехр(/3(?кр) • d) - 1] = 1. A2.5) В отличие от несамостоятельного, самостоятельный разряд уже не нужда- нуждается во внешнем ионизаторе; последний, однако, играет важную роль в про- процессе зажигания. Как следствие, для вольтамперных характеристик само- самостоятельных разрядов характерен гистерезис: напряжение гашения всегда ниже напряжения зажигания. Теория Таунсенда дает правильное представление о несамостоятельном разряде (его часто и называют таунсендовским) и о переходе в режим са- самостоятельного разряда, но последующая динамика разряда уже никак не будет универсальной. Прежде всего, в различных режимах (которые зача- зачастую зависят не только от величины поля Е, но и от «сценария» зажигания разряда) весьма различными оказываются режимы поддержания самостоя- самостоятельного разряда. В тлеющем разряде, хорошо нам известном по газоразрядным трубкам, картина явления в наибольшей степени близка той, которую мы только что рассмотрели. Главную роль в поддержании разряда играют ударная иони- ионизация в объеме газа и вторичная эмиссия на катоде; последняя обусловле- обусловлена не только ионной бомбардировкой, но и фотоионизацией за счет элек- электромагнитного излучения самого разряда. Пожалуй, главным отличием от таунсендовского режима оказывается очень серьезная зависимость от про- пространственных координат всех характеристик разряда: поля, потенциала, концентрации частиц, всех основных процессов — да и чисто визуальная.
12.2. ПОНЯТИЕ ПЛАЗМЫ 309 Коронный разряд («огни святого Эльма») образуется обычно на остриях и тонких проволочках. Его отличает еще большая пространственная неод- неоднородность, так что лишь в некоторой области пространства вблизи острия идет самостоятельный разряд, а в остальном пространстве пробоя газа не происходит, и ток через газ просто «навязан» областью пробоя. Для искрового разряда (в частности, и молнии) характерны очень сильные поля и короткие характерные времена. Разряд происходит по треку предва- предварительно образовавшегося канала, т. н. стримера. За его образование отве- отвечают множественные электронные лавины, развитие которых происходит не совсем так, как в тлеющем разряде. Начало лавине дает акт фотоионизации фотоном, испущенным какой-то предыдущей лавиной. Поскольку фотоны, в отличие от электронов, распространяются со скоростью света, развитие стримера идет намного быстрее, чем единичной электронной лавины. Для дугового разряда характерны, напротив, большие токи и сравнитель- сравнительно небольшие значения падения напряжения. Электроны, поддерживающие ток, поставляются термоэлектронной эмиссией с катода (возможна, впро- впрочем, и «холодная» дуга). Здесь важную роль играет материал электродов, испаряющийся и ионизующийся в процессе разряда. Существует немало и других режимов. Сколько-нибудь детальное их рас- рассмотрение едва ли уместно в общем курсе физики. Отметим как общее свой- свойство всех разрядов следующее обстоятельство. В процессе газового разряда вещество превращается в плазму — агрегатное состояние, располагающееся выше, чем газ, на температурной шкале. Для перехода в состояние плазмы по обычному каналу фазовых переходов необходимо нагреть вещество до температуры 5 000-10 000 К, что как раз соответствует характерной темпе- температуре поверхности Солнца и звезд. Газовый разряд, ввиду исключительной его неравновесности, позволяет осуществить этот переход более дешевой це- ценой при гораздо более умеренных температурах и поддерживать вещество в этом состоянии также относительно простым и доступным способом. 12.2. Понятие плазмы Плазму нередко определяют как ионизованный газ. Это верно по сути, но с равным успехом газ можно определить как испаренную жидкость, а послед- последнюю — как расплавленное твердое тело. При достаточно высокой степени ионизации газ, как мы вскоре убедимся, приобретает существенно новые свойства, позволяющие с полным основанием говорить о новом агрегатном состоянии. Правда, поскольку ионизация — процесс непрерывный и может быть проведен адиабатически медленно, здесь нет выраженного фазового перехода. Газовый разряд — сугубо неравновесный канал превращения газа в плаз- плазму. В равновесном состоянии плазма — объект весьма высокотемператур- высокотемпературный. Поэтому температуру ее обычно измеряют в «атомных» энергетических единицах — электронволътах: 1 эВ = е • 1 В = 1,6 • 109 Дж = 11 600 К. Энергия ионизации атома водорода равна примерно 13,6 эВ; температура плазмы в современных лабораторных установках, предназначенных для ис- исследований по управляемому термоядерному синтезу, достигает 103-104 эВ, тогда как температура поверхности Солнца — всего лишь около 0,5 эВ.
310 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ Такую плазму называют холодной. Может возникнуть вопрос: как может ве- вещество в равновесном состоянии полной или почти полной ионизации иметь температуру, на порядок меньшую энергии ионизации? Дело в том, что ио- ионизация поддерживается относительно малой долей высокоэнергичных ча- частиц — «хвостами» функции распределения по скоростям. Для сравнения укажем, что для излучения фотона в красной области спектра энергия воз- возбуждения излучающего атома должна превышать 1,5 эВ, но температура красного каления обычно заметно ниже 0,1 эВ. Ввиду высокой степени равновесной ионизации плазма, в отличие от га- газа при умеренной температуре, оказывается очень хорошим проводником. Даже холодная плазма поверхности Солнца по проводимости приближа- приближается к металлам, а высокотемпературная термоядерная плазма по этому параметру значительно их превосходит. Например, проводимость водород- водородной плазмы при температуре 10 кэВ примерно в 20 раз выше, чем у меди при нормальных условиях. В то же время плазма — среда текучая. Отсю- Отсюда следует первое отличие плазменной фазы от газовой: у нее невозможно разделить механические и электродинамические свойства. Электромагнит- Электромагнитные поля вызывают течение плазмы и управляют им, и напротив, течение плазмы порождает электромагнитное поле. Мы уже рассматривали в гл. 7 силы, действующие на проводник в магнит- магнитном поле, и, в частности, установили, что в случае прямых силовых линий и нулевого поля в проводящей среде на поверхность проводника действует давление — см. G.1) VB = B2/2fi0. A2.6) Мы положили \i = 1, что для плазмы, как и для газа, всегда верно с очень хорошей точностью. Именно для горячей плазмы эффект магнитного давле- давления особенно выразителен. Во-первых, из-за высокой проводимости коэффи- коэффициент диффузии поля DB = l/(A/io) будет очень мал. А во-вторых, малы и характерные времена плазменного эсперимента: от 10~8 до 10~3 с. Как следствие, эффективная глубина проникновения поля в плазму — см. оцен- оценку (8.27) — может быть много меньше характерного размера плазменного облака. Отсюда следует возможность магнитного удержания плазмы. Дело в том, что высокотемпературную плазму нельзя непосредственно заключить в твердый сосуд — ее погубит рекомбинация на стенках; скажем, в случае водородной плазмы Н+ + е => Н. Поэтому плазму обычно удерживают бес- бесконтактным методом — «магнитной стенкой» (соответственно, ее можно толкать «магнитным поршнем»). Создается конфигурация поля, в кото- которой плазменное облако оказывается как бы в яме в некоторой окрестности минимума min(i?2). Такие устройства называются магнитными ловушка- ловушками. Разумеется, одно лишь магнитное давление A2.6) равновесия обеспе- обеспечить не может. Необходимо учесть также газокинетическое давление плазмы V = пквТ, где кв — постоянная Больцмана. Условие равновесия, включая и пограничный слой, где поле проникает в плазму, есть условие постоянного полного давления: пквТ(г) + Б2(г)/BМ) = const. A2.7)
12.2. ПОНЯТИЕ ПЛАЗМЫ 311 Препятствуют равновесию, помимо диффузии поля, еще и многочислен- многочисленные неустойчивости, исследование которых представляет собой довольно заметную часть вообще всей физики плазмы. В большинстве эксперимен- экспериментальных ситуаций макроскопическая динамика плазмы тождественна так называемой магнитной гидродинамике, которая, в частности, описывает рав- равновесие и течение жидких металлов. Таким образом, хотя плазма и распола- располагается по температурной шкале выше газов, по своим электромеханическим свойствам оказывается близка конденсированному веществу и заметно от- отличается от газа. Рассматривая электромагнитные поля в плазме, мы не можем считать р и j заданными извне — они должны определяться самосогласованным образом как функции электрического и магнитного полей. Поскольку плазма, как и газ, — среда бесструктурная, заряды и токи, наведенные полями, пред- представляют собой просто свободные заряды и токи проводимости. Поэтому их можно прямо включить в уравнения Максвелла, и не делая различия по фи- физике между полем и индукцией, т. е. положив е = \i = 1, оставить в базовых уравнениях только действующие поля Е и В: divE = ?^V(EB); A2.8) divB = 0; A2.9) rotE = -(дВ/dt); A2.10) /i^rot В = j(E В) + eo(dB/dt). A2.11) К числу наиболее важных свойств плазмы относится квазинейтральность. Представим себе, что некоторое количество газа переводится тем или иным способом в состояние, полностью или частично ионизованное. При этом полный заряд его остается равным нулю. В принципе, возможно суще- существование и заряженной плазмы (пример — облако пространственного заря- заряда в электронной лампе). Но оказывается, что для систем с выраженными плазменными свойствами как в природе, так и в лабораторных условиях свойство нейтральности в целом гораздо более типично. Более того, плазма достаточно высокой концентрации оказывается нейтральной и в локальном смысле: пе = Zrii, A2.12) где пе^ — концентрации компонентов, a Z — заряд иона (кратность ио- ионизации), который в дальнейшем мы для простоты будем считать равным единице (для водородной или дейтериевой плазмы это вообще единственная возможность). Именно свойство A2.12) и называется квазинейтральностью. Оно определяет многие специфические для плазмы физические эффекты и свойства. Покажем на типичном примере, почему квазинейтральность труд- трудно нарушить в макроскопических масштабах. Возьмем кубик объема V = 1 см3 и предположим, что его заполняет плаз- плазма, достаточно типичная для лабораторных экспериментов: щ = пе = Ю20 м. Пусть мы хотим нарушить равенство концентраций в данном объеме всего на один процент, т. е. создать избыток концентрации любого из компонентов 6п ~ 0,01п = 1018 м.
312 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ Оценим возникающее при этом электрическое поле, используя теорему Гаусса: ?0 ?0 Вычисления дают Е ~ 3 • 107 В/м. Можно той же оценке придать и другой смысл. Пусть кубик нейтрален в целом, но попытаемся нарушить локальное равенство A2.12), например, у одной грани кубика пусть будет щ — пе = —10~2пе^, а у другой +10~2. Получим ту же цифру. В первом случае электростатическое отталкивание эквивалент- эквивалентно огромному добавочному давлению, взрывающему объем, заполненный плазмой, а во втором притяжение разноименных зарядов эффективно вы- выравнивает локальную плотность заряда. И в обоих случаях, чтобы поддер- поддержать нашу систему в неравновесном состоянии, необходимы внешние поля, не меньшие, чем 107 В/м. Если же внешнее поле такого порядка величины не достигает, условие A2.12) в нашем конкретном случае будет выполнено с точностью 5п ^ 0,01п^е. Конечно, само определение локальной концентрации подразумевает неко- некоторое усреднение числа частиц по пространству и по времени. Поэтому и утверждение о квазинейтральности не может быть абсолютным, хотя бы из- за дискретности вещества. Однако, как мы увидим в следующем параграфе, главный фактор нарушения квазинейтральности, а тем самым и масштабы такого усреднения связаны с движением частиц плазмы. 12.3. Ленгмюровские колебания и дебаевское экранирование Попытаемся оценить минимальный масштаб времени, ниже которого квазинейтральность не может быть обеспечена. Рассмотрим плоский слой плазмы и дадим в нем всем электронам смещение от- относительно ионов в перпендикулярном слою направле- направлении (рис. 12.3). Если х — пространственное смещение (х <С /), то заряд на единицу площади в узких при- приграничных слоях оказывается равным а = пех. Поле каждой из двух параллельных заряженных плоскостей равно, согласно A.11), а/2ео^ вне плазменного слоя эти поля компенсируют друг друга, а внутри слоя склады- складываются (все это очень напоминает плоский конденсатор). Таким образом, электрическое поле в слое пех Рис. 12.3 6° Принимая во внимание соотношение масс Mi/me ^> 1 (почти 2 000 даже для водорода), пренебрегаем смещением ионов, и тогда электронное уравнение движения оказывается очень простым: m(d2x/dt2) = -еЕ = -(пе2ж)/б0. A2.13)
12.3. ЛЕНГМЮРОВСКИЕ КОЛЕБАНИЯ И ДЕБАЕВСКОЕ ЭКРАНИРОВАНИЕ 313 Это уравнение гармонических колебаний, частота которых равна ш = шРе = (neVeomI/2. A2.14) Колебания электронов относительно ионов, которые мы таким образом по- получили, называются ленгмюровскими (по имени И. Ленгмюра) или просто плазменными колебаниями. Последнее обстоятельство подчеркивает очень важную роль, которую играют движения такого рода в микроскопической динамике плазмы. Частота A2.14) называется соответственно электронной плазменной или электронной ленгмюровской частотой. Поскольку электроны как целое могут пермещаться относительно ионов, постольку может нарушаться квазинейтральность, но лишь на очень корот- короткое время, порядка периода плазменных колебаний. Следовательно, мас- масштаб усреднения по времени, подразумеваемый в формуле квазинейтраль- квазинейтральности A2.12), может быть оценен как Определение пространственного масштаба усреднения потребовало бы привлечения определенных сведений из термодинамики (гл. 5 нашего кур- курса), да и формальная сторона дела связана с достаточно сложной вычи- вычислительной процедурой. Но сам результат может быть продемонстрирован без особых затруднений на основании одних лишь соображений размерно- размерности. Наиболее характерная величина размерности скорости в микродина- микродинамике любой текучей среды (жидкость, газ, плазма) — тепловая скорость частиц, в данном случае — электронов: vTe = (kBT'/гпI/2. Отношение ее к плазменной частоте как раз и дает величину размерности длины, а в теории плазмы именно эта величина оказывается характерным масштабом разде- разделения зарядов. Ее называют дебаевской длиной или дебаевским радиусом, по имени П. Дебая: е2). A2.15) Масштаб пространственного усреднения в A2.12) должен быть существенно больше rD. Но существует еще один характерный масштаб нарушения ква- квазинейтральности, упомянутый выше, — это просто характерное расстояние между частицами п'3. Соотношение между этими двумя масштабами ока- оказывается принципиально важным для микроскопических свойств плазмы. Дело в том, что если rD ^> п/3, то, в отличие от газа, где взаимодействие частиц сводится к достаточно редким столкновениям, частицы плазмы до- достаточно эффективно взаимодействуют в соответствии с законом Кулона. В обратном случае кулоновское поле экранировано вследствие квазинейтраль- квазинейтральности, и тогда микродинамика плазмы лишь количественно отличается от газовой. Обычно из названных параметров образуют безразмерную комби- комбинацию, которую называют числом частиц в дебаевской сфере или просто дебаевским числом: ND = Dтг/3)пг3 = Dтг/3)(?0А:БТK/2п-1/2е-3. A2.16) Если ND 3> 1, то в сфере действия кулоновского потенциала каждой части- частицы оказывается большое число других частиц. В этом случае коллектив- коллективные эффекты, т. е. согласованные движения ансамблей частиц превалируют
314 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ над столкновениями. Эта ситуация очень далека от газа, и даже от жидкой фазы, но напоминает скорее твердое тело — кристалл. Таким образом, и в макро-, и в микродинамике плазма, будучи более высокотемпературной фазой, нежели газ, обнаруживает свойства, присущие конденсированным средам, что и дает основания говорить о четвертом состоянии вещества. Из A2.16) можно видеть, что условие ND ^> 1 может быть выполнено для плазмы либо достаточно горячей, либо достаточно разреженной. Поэтому удовлетворяют этому условию объекты столь различной природы, как «тер- «термоядерная» плазма в лабораторных условиях и холодная, но очень редкая плазма межзвездной среды. 12.4. Электромагнитные волны в плазме В данном параграфе будет рассмотрена поперечная электромагнитная волна в плазме. Как мы вскоре убедимся, плазма для такой волны — дис- диспергирующая среда, т. е. закон дисперсии и;(к) будет отличен от линейного. Поле волны представим в стандартной форме Е = Ео exp[i(kr - ut)]. В горячей плазме A-10 кэВ или, что то же, 10-100 • 106 К) столкновения частиц настолько редки, что безусловно доминируют коллективные эффек- эффекты. Проще говоря, мы можем рассматривать отклик ансамбля частиц на быстропеременное электромагнитное поле, совершенно не принимая во вни- внимание какой-либо диссипации. Относительно частоты осцилляции мы пред- предположим, что за период ионы существенно сместиться не могут и успевают отреагировать на изменение поля лишь электроны. Напишем уравнение дви- движения электронов в поле волны md2rE/dt2 = -еЕ0ехр[г(кг-о;*)]. A2.17) Здесь под г^ = (хЕ1 уЕ1 zE) подразумевается лишь осцилляция электрона в волне. (Мы пренебрегли в A2.17) членом [vB], поскольку в случае нереля- нерелятивистского движения частицы он дал бы малую поправку к правой части порядка v/с.) Уравнение A2.17) легко интегрируется: г^ = е/(тио2) Ео exp[i(kr - uot)]. A2.18) Далее в соответствии с соотношениями B.8), B.9) запишем общее выражение для диэлектрической проницаемости ?0?E = D = ?0E + P, A2.19) в котором поляризация среды представляется объемной плотностью диполь- ного момента Для его вычисления воспользуемся решением A2.18). Пусть п — число элек- электронов в единице объема, тогда Р = —пегЕ = — пе2 / {тпе^ио2) E,
12.4. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В ПЛАЗМЕ 315 откуда и следует е = 1-со2ре/со2, A2.20) где величина иоре — уже известная нам ленгмюровская или плазменная ча- частота A2.14). Теперь воспользуемся выражением A1.3) для показателя преломления электромагнитной волны в среде: N2 = к2с2/ои2 = ец. A2.21) (Поскольку п — стандартное обозначение концентрации, нам пришлось обо- обозначить показатель преломления буквой N.) Положим опять \i = 1. Полу- Получаем закон дисперсии к2с2/си2 = 1-ои2ре/и;2, A2.22) или, что то же, ш2 = ш2е + к2с2. A2.23) Дисперсия A2.23) представлена на рис. 12.4 а. Видно, что в пределе высоких частот мы приближаемся к «вакуумному» линейному закону и; = А;с, но при к —>> 0 ситуация иная; в частности, распространение в плазме электромаг- электромагнитных волн с ш < шре невозможно. Закон дисперсии A2.23) имеет место не только в плазменном случае, но и, скажем, при распростра- распространении волн в волноводах и, что для нас более су- существенно, он справедлив для любого вещества при достаточно высоких частотах (при этом шре опреде- определяется формально через концентрацию электронов в веществе). Это не так уж и удивительно, поскольку чисто электронный отклик на поле высокой частоты вполне естествен. Даже у водорода отношение масс Mi/mE ~ 1840, а отклик на поле — см. A2.18) — обратно пропорционален массе. Но если для плазмы порядок минимальной частоты такого поля опреде- определяет как раз шре, то в общем случае ответ не универ- б сален, поскольку не ясна заранее роль диссипатив- ных эффектов, которыми мы пренебрегли. ис' Опираясь на соотношение A2.22), мы можем рассмотреть эффект отраже- отражения волны от плазмы критической плотности. Обратимся к рис. 12.4 б. Пусть в плазму с монотонно нарастающей плотностью (или электронной концен- концентрацией) п(х) посылается электромагнитная волна. Следуя в направлении роста концентрации, волна сохраняет частоту с^о, но длина волны или вол- волновое число при этом сохраняться не могут. При п > пкр = e§uj\me~2 эта волна вообще существовать не может. Но она не может и исчезнуть, посколь- поскольку никаких механизмов диссипации мы в рассмотрение не вводили. Обратим внимание на то, что в области критической концентрации пкр, как следует из A2.23), к = 0, а при меньших концентрациях, согласно той же форму- формуле, к определено с точностью до знака. Отсюда и следует, что наша волна должна просто отразиться от области критической концентрации и выйти в обратном направлении.
316 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ Рис. 12.5 Именно на этом эффекте основана дальняя радиосвязь на коротких вол- волнах — точнее, на многократном отражении волны от поверхности Земли и ионосферного плазменного «зеркала» (рис. 12.5). А вот на УКВ, как извест- известно, связь возможна только в пределах прямой видимости. Тем и отличаются ультракороткие волны от коротких, что у них частота выше максимальной плазменной частоты для ионосферы. Мы уже упоминали в гл. 11, что для достаточно жестких (коротковолно- (коротковолновых) рентгеновских лучей коэффици- коэффициент преломления любого вещества оказывается близок к единице. Имел- Имелся в виду закон дисперсии A2.22). За- Заметим еще раз, что соответствующий такой дисперсии коэффициент прело- преломления меньше единицы. Поэтому и полное отражение оказывается не внутренним, как в оптике, а внешним. Это используется для создания «рентгеноводов». В отличие от световода — стеклянной нити — рентгеновод представляет собой полую кварцевую тру- трубочку. Принцип его работы тот же, что и у световода, — многократное пол- полное отражение. И еще один эффект такого рода — металлический блеск. Здесь уже дело касается квантовой плазмы электронов проводимости. (Хо- (Хотя, конечно, следует заметить, что чисто плазменным эффект отражения от металлов оказывается лишь в инфракрасной области — будь это так же и в оптическом диапазоне, все металлы были бы белыми, включая золото и медь). Нарисовав картинку п(х) и следя за распространением волны, мы мол- молчаливо предполагаем, что длина волны 2тг/к существенно меньше харак- характерного масштаба неоднородности. Но это предположение нарушается, по крайней мере, вблизи пкр, где 2тг/к —>> оо. В этой области осциллирующее поле сшивается с экспоненциально затухающим решением при одном и том же характерном масштабе с/шре. Называют его бесстолкновительной спино- спиновой длиной, которая, как нетрудно видеть, зависит только от концентрации электронов, но не от частоты поля или проводимости среды. В заключение заметим, что в плазме могут распространяться не толь- только поперечные, но и продольные электромагнитные волны. Действительно, при отличной от единицы диэлектрической проницаемости уравнение A0.17) можно переписать в виде [k[kE0]] = k(kE0) - А;2Е0 = -/iO^o^2Eo. Предположим, что k || E. Тогда левая часть оказывается в точности равной нулю, и получившееся простое уравнение допускает два решения — триви- тривиальное Е = 0 и содержательное е(шк) =0. A2.24) Уравнение A2.24) представляет общий вид дисперсионного уравнения для продольных волн. В частности, приравнивая нулю диэлектрическую прони- проницаемость A2.20), получаем и; = иоре — это не что иное, как ленгмюров- ские колебания, рассмотренные в предыдущем параграфе на основании бо- более простой модели.
ЗАДАЧИ 317 Задачи 1. Вдоль цилиндрического плазменного шнура течет ток / (рис. 12.6). Считая, что усло- условие механического равновесия плазмы определяется балансом сил Ампера и газокинети- газокинетического давления пквТ, найти температуру на оси шнура, полагая температуру в по- поверхностном слое пренебрежимо малой. Плотность тока и концентрация частиц в плазме однородны по сечению, число частиц на единицу длины шнура равно 7У[частиц/м]. ^-/^ \ Решение. Плотность архимедовой силы (—W)r = — nkBdT/dr, плот- f/ >^ 1 ность силы Ампера [j B]r = —jz • Др, где ось Oz направлена по оси шнура, а (р — азимутальный угол. Из теоремы о циркуляции и усло- условия однородности тока по сечению следует В^ = fiojr/2. Условие рав- равновесия J = dr 2пкв J Г' тгЯтгЯr> ^ о * ь Рис. 12.6 Мы обозначили через R радиус плазменного шнура. Интегрируя это уравнение при граничном условии г = R => Т = 0, находим Т ос (R2 — г2). Ответ задачи получим, полагая г = 0, при этом радиус шнура из окончательного результата выпадает: Т@) = ^. A2.25) Образование таких равновесных плазменных каналов в мощных разрядах называют пинч- эффектом, а формулу A2.25) — условием Беннета (при произвольном распределении кон- концентрации и плотности тока по сечению она остается правильной оценкой). 2. Плоский конденсатор заполнен плазмой со средней концентрацией электронов и ио- ионов по и температурой Т. Расстояние между пластинами а, разность потенциалов U. Пре- Пренебрегая током в плазме и считая eU ^C квТ, определить пространственную зависимость потенциала между обкладками. Решение. Из механики известна барометрическая формула Больцмана / тпдх\ п = поехр -тг^т » где m — масса отдельной молекулы, д — ускорение силы тяжести, ось Ох направлена вер- вертикально вверх. Эта формула — частный случай гораздо более общего закона, который называется статистическим распределением Больцмана. В случае произвольной потенци- потенциальной функции U(r) он имеет вид ( U п = поехр -jr^ Распределение Больцмана для электронов и ионов в нашем случае можно линеаризовать: ( etp \ ( etp \ ( etp \ ( eip п% = поехр (-—j ^no{l-—y, пЕ= поехр ^—j ^ m [l + — а затем подставить в уравнение Пуассона: dV e ( N 2пе2 _ 2 = (Пвп0=г = ^. Уравнение получилось линейным и однородным, поэтому его решение в точности соот- соответствует формуле (8.9), только в данном случае корни характеристического уравнения вещественны: ( \ (^ \^ ( ^ (р(х) = (pi exp х + (f2 exp \ r J \ тт
318 ГЛ. 12. ЭЛЕМЕНТЫ ФИЗИКИ ПЛАЗМЫ Принимая во внимание граничные условия х = О, (f = 0; х = a, ip = U, приходим к следующему ответу: = и sh Таким образом, на этой относительно простой одномерной задаче мы продемонстрировали, что из объединения электростатики с тепловым движением частиц в плазме действительно рождается пространственный масштаб rD — дебаевская длина. 3. Площадь электродов плоского газонаполненного диода S = 10 см2, межэлектродный зазор а = 10 см. В режиме несамостоятельного разряда ток насыщения Is = 10~6 А. Какое количество элементарных зарядов того и другого знака создается ежесекундно внешним ионизатором в 1 см3? Ответ: NT = -^- ~ 6 • 109 см с. еЬа 4. Мощный источник тока создает в тонкой цилиндрической плазменной оболочке ток / = 5 • 106 А, параллельный оси и равномерно распределенный по азимуту. Внутри обо- оболочки предварительно создано магнитное поле Во = 0,1 Тл. Начальный радиус цилиндра Ло = 20 см. В дальнейшем под действием тока оболочка сжимается по радиусу. Считая ее идеально проводящей, оценить, при каком радиусе ускорение оболочки поменяет знак. 2tvBoRo Ответ: R = — ~ 4 мм. /101 5. В плазме находится дипольный излучатель, на который подается переменное напря- напряжение с частотой ш. При какой концентрации электронов плазмы он перестает излучать электромагнитные волны? Ответ: п >
ЧАСТЬ III ФИЗИКА КОЛЕБАНИЙ И ВОЛН. ВОЛНОВАЯ ОПТИКА ВВЕДЕНИЕ Раздел посвящен изучению колебательно-волновых закономерностей, пронизывающих всю современную физику. В механике и акустике, в ра- радиофизике и оптике, в квантовой физике и физике твердого тела — всюду мы сталкиваемся с колебаниями и волнами. Здесь особенно ярко находит отражение современная тенденция сближения и взаимопроникновения раз- различных областей науки. Единый подход к изучению колебаний и волн раз- различной физической природы, основанный на общности уравнений, описыва- описывающих колебательно-волновые закономерности, позволяет выявить глубокие связи между различными, на первый взгляд, явлениями. Он оказался пло- плодотворным по крайней мере в двух отношениях. Во-первых, он позволил обобщить и распространить на различные области физики идеи и методы, возникшие первоначально в какой-либо одной области (например, идею Га- бора электронной голографии вначале на оптическую, а затем на радио- и акустическую голографию). Во-вторых, он позволил выявить плодотвор- плодотворные колебательно-волновые аналогии: идеи и методы решения задач физики колебаний перенести на задачи волновые и наоборот (например, фильтра- фильтрация временных сигналов-колебаний и пространственная фильтрация волн). Знания и интуиция, которые мы приобретаем при изучении колебаний и волн одной физической природы естественным образом используются при изучении явлений казалось бы совершенно иной природы. Например, изучая поведение волн света, мы начинаем глубже понимать, как ведут себя «вол- «волны вероятности», которыми оперирует квантовая физика или волны звука, которые изучаются в акустике. Таким образом, изучая колебания и волны, мы будем обращать внимание не только на то, что «волнуется» и что «ко- «колеблется», а главным образом на то, как и почему происходят колебания и возникают волны.
ГЛАВА 1 КИНЕМАТИКА КОЛЕБАНИЙ 1.1. Гармонические колебания Колебание — более или менее регулярно повторяющийся про- процесс. Таково очень нестрогое, «качественное» определение понятия «ко- «колебание». Можно привести множество примеров колебательных процессов, относящихся к различным областям физики (и не только физики). Коле- Колеблется маятник часов; колеблется груз, подвешенный на пружине; колеблет- колеблется взволнованная поверхность воды и гитарная струна; колеблется заряд на пластинах конденсатора и магнитное поле в катушке индуктивности коле- колебательного контура; более или менее периодически изменяется температура воздуха (зимой холоднее — летом теплее) и количество автомобилей на улицах города (больше в часы пик — меньше поздней ночью); периодически меняется экономическая ситуация в жизни общества: кризисные явления сменяются подъемом экономики. Колеблется давление (или плотность воз- воздуха), вызывая колебания ушной мембраны — и мы слышим голос певца на оперной сцене. Таких примеров можно привести как угодно много. В на- настоящей главе мы не будем выяснять причины возникновения колебаний в той или иной физической системе. Здесь мы лишь познакомимся с наибо- наиболее часто встречающимися простейшими видами колебательных движений, основными характеристиками колебательных процессов, с математическим способом описания колебаний. Оставляя пока в стороне физическую приро- природу колеблющейся величины, будем обозначать ее буквой S, подчеркивая при этом, что любой колебательный процесс развивается во времени S = S(t). (Величиной S может быть и угол отклонения маятника часов, и величина растяжения-сжатия пружины при колебаниях груза, и изменяющийся заряд на пластине конденсатора, и плотность воздуха при распространении звуковой волны. В общем, S — любая колеблюща- колеблющаяся величина.) Наиболее простая функция, описываю- описывающая периодический процесс, имеет вид S(t) = a cos (cot-\-(р), A-1) Рис. 1.1 где a, lo и ср — константы. Функцию A.1) физики называют уравнением гармони- гармонических колебаний, ее график изображен на рис. 1.1. Она хороша, разумеется, не только потому, что имеет довольно простой математический вид. Более существенно то обстоятельство, что реальные колебания во многих физи- физических системах зачастую очень хорошо описываются этой функцией, т. е. близки к гармоническим колебаниям. Имеются и другие веские причины, по
1.2. ВЕКТОРНАЯ ИНТЕРПРЕТАЦИЯ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ 321 которым гармонические колебания играют исключительную роль в совре- современной физике. Об этом мы еще будем говорить. Легко проверить, что функция A.1) является периодической, т. е. для лю- любого момента времени t имеет место равенство S(t) = S(t + Т), где Т назы- называется периодом колебаний: Т = Bтг/и>)п. Обычно периодом колебаний называют минимальное значение Т (п = 1) Т = 2tt/uj. A.2) Величина uj называется круговой частотой. Положительная константа а — амплитуда колебания (это максимальное отклонение величины S от равновесного значения S = 0). Аргумент косинуса в A.1) — угол Ф, выра- выраженный в радианах, называется фазой колебания: Ф = а;? + <р, A.3) а значение Ф при t = 0, т. е. величину ср называют начальной фазой. Соот- Соотношение A.3) — это линейная связь между фазой колебания Ф и круговой частотой cj, из которой следует UJ = Ф. Круговая частота — это производная фазы Ф по времени. Число колебаний в секунду v = 1/Т A.4) называют циклической частотой (иногда просто частотой). Единица цикли- циклической частоты — герц A/с). Например, v = 50 с — колебание с частотой 50 герц (Гц). Очевидно, uj = 2ttz/ A.5) (колебанию 1 герц соответствует изменение фазы — угла поворота, — рав- равное 2тг в секунду). Сделаем еще одно важное замечание, касающееся гармонических колеба- колебаний: очевидно, ни один реальный процесс не может, строго говоря, описы- описываться функцией вида A.1). Ведь синусоида не имеет ни начала, ни конца — и хотя бы поэтому бесконечно длящийся колебательный процесс неосуще- неосуществим. 1.2. Векторная интерпретация и комплексное представление гармонических колебаний. Фазовая плоскость Векторная интерпретация. При решении многих задач, связанных с изучением колебательных процессов, удобно использовать следующую гео- геометрическую интепретацию гармонических колебаний. Гармоническое колебание A.1) будем изображать векто- вектором S, длина которого равна амплитуде колебания a, a угол между вектором и горизонтальной осью х — началь- начальной фазе колебания (р (рис. 1.2). рис ^ 2 При этом частота ш гармонического колебания предпо- предполагается заданной. Смысл такого представления состоит в следующем. Во- Вообразим, что вектор S вращается вокруг точки О с угловой скоростью uj против часовой стрелки, а мы сделали мгновенную фотографию в момент времени t = 0, когда угол наклона вектора Ф(?) = ujt -\- ср равен ср.
322 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ Заметим, что проекция вектора S на ось х при вращении изменяется по закону x(t) = acos(c<;? + ф), т. е. совершает гармонические колебания. При этом проекция вектора на ось у меняется по закону y(t) = asm(ut + ф), т. е. также изменяется по гармоническому закону с фазовым сдвигом тг/2: sin a = cos(a — тг/2). Геометрическое изображение гармонического колебания S(t) в виде векто- вектора S удобно использовать при решении задачи сложения колебаний. Пусть мы имеем две скалярные величины Si и $2, изменяющиеся по гармоническо- гармоническому закону с одинаковой частотой ио\ S\{t) = a\ cos(out + <pi), S^t) = a2 cos(out + y^)- Необходимо найти колебание S(t) (скалярную величину), являющуюся суммой колебаний Si (t) и S2 (t): S(t) = S1(t) + S2(t). A.6) Изобразим колебания Si(t) и S^t) в виде векторов Si и S2 (рис. 1.3). Изо- Изобразим также суммарный вектор S. Векторы Si, S2 и S образуют треуголь- треугольник, причем внешний угол треугольника Аср равен разности фаз колебаний *§2 и Si. Представим себе, что векторы Si и S2 вращаются с одной и той же угловой скоростью против часовой стрелки. Ясно, что угол Аср между векторами Si и S2 остается при таком вращении неизменным, и суммарный вектор S повернется через время t (как и Si и S2) на угол uot — т. е. весь треугольник векторов вращается как целое. (На рис. 1.3 пунктиром показано положе- положение векторов в момент времени t.) Причем очевидно, что проекция суммарного вектора S на ось х в про- произвольный момент времени t равна сумме проекций векторов Si и S2 t + ф) = а\ cos(u;t + cpi) + п2 cos(u;t длина вектора Ь, а (р здесь а его угол наклона Рис. 1.3 Сумма гармонических колебании одинаковой часто- частоты является гармоническим колебанием той же частоты. Амплитуда а сум- суммарного колебания может быть найдена из треугольника векторов (по тео- теореме косинусов): а2 = а\ + + cos Aip A.7) где А(р = (f2 — (fi — разность фаз складываемых колебаний. Заметим, что во многих случаях измеряемой величиной является величи- величина, пропорциональная квадрату амплитуды колебания, которая называется интенсивностью I = а2. Из A.7) следуют важные частные случаи: 1. Амплитуды слагаемых колебаний равны: а\ = п2 = а^. Тогда: а2 = 2al(l + cosA(p). A.8) 2. Разность фаз слагаемых колебаний равна 2тгп. Такие колебания назы- называются синфазными. При Аср=2тгп находим из A.7): а=а\ + о,2- Амплитуда суммарного колебания при этом максимальна и равна сумме амплитуд слагаемых колебаний. (При Аср = 0 на векторной диаграмме мы
1.2. ВЕКТОРНАЯ ИНТЕРПРЕТАЦИЯ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ 323 получим два ко л линеарных вектора Si и S2 и длина суммарного вектора просто равна сумме длин слагаемых векторов.) 3. Разность фаз слагаемых колебаний равна Bп + 1)тг. Такие колебания называют противофазными. При А(р = Bп + 1)тг получаем из A.7) а2 = = (ai -а2J. При равных амплитудах а\ = а2 имеем в этом случае а = 0, т. е. колебания «гасят» друг друга. На векторной диаграмме получаем два противоположно направленных вектора Si и S>2. На рис. 1.4 представлен график зави- зависимости интенсивности / суммарного ко- колебания от разности фаз Аср слагаемых колебаний A.7). Фазовая плоскость. При изучении колебаний полезным оказывается изоб- ражение колебательного процесса на фа- р -. л зовой плоскости. Координаты на фазо- фазовой плоскости — величина S (ось абсцисс) и производная по времени S (ось ординат). В каждый момент времени t с помощью соотношений S = acos(ct;t + ф) S = — аи sm(ut + ф) A.9) можно найти значения 5и5и, следовательно, положение точки М на фазо- фазовой плоскости, изображающей состояние колебательной системы в данный момент времени. С течением времени величины S и S изменяются (в соответ- соответствии с A.9)), изменяется, следовательно, и положение изображающей точ- точки, которая описывает так называемую фазовую траекторию. Уравнение 5 (см) фазовой траектории гармонического колебательного процесса легко найти, исключая из уравнения A.9) время t: S2/a2 + S2/(u;aJ = 1. A.10) Согласно A.10), фазовая траектория гармонического колебания — эллипс с полуосями а жиоа. На рис. 1.5 а изображено семейство фазовых траекторий, отличающихся амплитудой колебания.
324 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ Комплексная форма записи гармонических колебаний. В дальней- дальнейшем при исследовании колебаний мы часто будем использовать комплекс- комплексную форму записи гармонических колебаний. Напомним, что комплексное число z может быть записано в виде z = x + iy, A.11) х = Re?, у = lm z. Величина \z\ = \/х2 + у2 называется модулем комплексного числа, а ср = arctg(y/x) — аргументом комплексного числа z. Комплексные числа принято изображать на т. н. комлексной плоскости: комплексному числу z поставим в соответствие точ- точку М, абсцисса которой равна действительной части комплексного числа ж, а ордината — мнимой части у. Вектор, проведенный из начала координат в точку М, является графическим изображением комплексного числа z. Оче- Очевидно, длина вектора равна модулю комплексного числа, а угол наклона вектора ср определяет аргумент комплексного числа (рис. 1.6). Комплексные числа складываются по правилу сложения векторов: сумма двух комплексных чисел z\ = x\ -\-iyi и Z2 = X2 -\-Щ2 есть комплексное число z = х + гу, где х = х\ + #2, У — У\ + У2 (именно такие проекции имеет вектор, равный сумме векторов Sx (х\, у\) И S2 (^2, У2))- Вспомним теперь о векторном изображении гармониче- гармонического колебания. Мы отмечали ранее, что гармоническое колебание можно представить как проекцию вращающего- р -, ~ ся с угловой скоростью и вектора S на ось абсцисс S(t) = = a cos(u;t + ф). При этом его проекция на ось ординат меня- меняется по закону S\(t) = asin(ct;t + ф). Полагая, что S(t) есть действительная часть комплексного числа z, а Si(t) — его мнимая часть, запишем z = acos(ct;t + ф) + iasm{u)t + ф). A.12) Или, используя формулу Эйлера ега = cos а + г sin a: у — nJ(ut+(p) (л л о\ Последнее выражение и представляет собой комплексную форму записи гармонического колебания, имеющего амплитуду а, частоту и; и начальную фазу ср. Реальный колебательный процесс S(t) связан с комплексной формой записи z(t) очевидным равенством S(t) = Rez(t). A.14) Перепишем выражение A.13), выделив множитель, зависящий от време- времени еш: z _ aei(peiut _ j{eiut Комплексное число А = аег(р называется комплексной амплитудой коле- колебания. Она содержит информацию как об амплитуде колебания, так и о начальной фазе. Напомним в заключение, что числа z\ и ^ называются комплексно-сопря- эюенными, если их действительные части равны, а мнимые отличаются зна- знаком: z\ = х + iy, Z2 = х — гу. Комплексно-сопряженные числа имеют одина- У Im а /^ М Re X
1.3. МОДУЛИРОВАННЫЕ КОЛЕБАНИЯ 325 =aet(p Z2 = e г(р ковые модули и аргументы противоположного знака: zi=ae, Тот факт, что числа z\ и Z2 являются комплексно-сопряженными принято записывать в виде: z\ =z%. 1.3. Модулированные колебания Амплитудная и фазовая модуляции. Любой колебательный процесс, отличный от гармонического, называется модулированным колебанием. При- Примеры таких процессов (их осциллограммы) приведены на рис. 1.7. Будем записывать модулированное колебание в виде S(t) = a(t) cos(oj0t + <p(t)). A.15) В отличие от гармонического колебания, здесь a(t) и cp(t) — меняющиеся во времени величины. Форма записи A.15) особенно целесообразна в том случае, когда a(t) и cp(t) — медленно меняющиеся функции времени. Что означает медленность изменения функций a(t) и tp(t)? Рассмотрим наряду с модулированным колебанием A.15) гармоническое колебание S0(t) = а0 cos(oj0t + (pQ). A.16) Здесь с^о — частота гармонического колебания, та же самая константа, которая входит в выражение A.15). 5@ -A" t S(t) Рис. 1.7 Рассмотрим интервал времени т, существенно превышающий период гар- гармонического колебания So(t): т > 2тт/и;0 A.17) и пусть на этом интервале функции a(t) и (p(t) остаются практически неиз- неизменными. Причем: a(t) « а0 и <p(t) w (fo. A.18) Итак, мы рассматриваем модулированное колебание, в котором на интер- интервалах времени т, больших по сравнению с периодом Tq соответствующего гармонического колебания, величины a(t) и (p(t) остаются практически не- неизменными. В большинстве физически интересных ситуаций достаточно по- полагать, что сильное неравенство A.17) выполнено, если интервал времени т на один-два порядка превышает период колебаний 2тг/с«;о- Такое модулиро- модулированное колебание называется квазигармоническим. В этом случае медленно меняющиеся величины a(t) и (p(t) называют амплитудой и, соответственно, начальной фазой модулированного колебания. Итак, квазигармоническое колебание можно характеризовать двумя параметрами: периодом колебаний Tq = 2тг/с«;о и временем т ^> Tq, характеризующим быстроту изменения ам- амплитуды a(t) и (или) начальной фазы <p(t). Для описания модулированных
326 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ колебаний используется следующая терминология: говорят, что функция a(t) описывает закон амплитудной модуляции, а функция (p(t) — закон фа- фазовой модуляции. Если cp(t) = сро = const, то S(t) = a(t) cos(u;0t + (р0), A.19) где a(t) ^ 0. Такое колебание называют модулированным по амплитуде. Если a(t) = ао = const, то S(t) = а0 cos[u0t + (p(t)]. A.20) Это — колебание, модулированное по фазе. В общем случае имеем как амплитудную, так и фазовую модуляцию, т. е. колебание вида A.15). Так же, как и гармонические колебания, квазигармонические процессы изображают графически в виде векторов. Если гармоническое колебание So(?), описываемое формулой A.17), изображается вектором So, имеющим фиксированную длину ао и направление сро (т. е. мы как бы смотрим на вра- вращающийся с угловой скоростью с^о вектор So из системы координат, которая ^ ^ вращается с той же угловой скоростью — и поэтому видим неподвижный вектор), то мо- дулированное колебание на той же векторной диаграмме естественно изобразить в виде век- вектора, длина которого a(t) и (или) угол накло- наклона (p(t) медленно изменяются (медленно, если р . « речь идет о квазигармоническом колебании). В частности, амплитудно-модулированное ко- колебание A.19) изображается вектором неизменного направления сро, длина которого изменяется (рис. 1.8 а), а колебание A.20), модулированное по фа- фазе — вектором неизменной длины, угол наклона которого cp(t) изменяется: (качания вектора на рис. 1.8 б). Аргумент косинуса в A.20) называют фазой модулированного колебания Ф(*)= причем в отличие от гармонического колебания, скорость изменения фазы Ф (величина, которую можно назвать частотой о;), является функцией времени A.21) Если выполнено условие квазигармоничности A.17), то ф(г) ^С ujq, т. е. меняющаяся во времени частота u;(t) мало отклоняется от частоты ujq гар- гармонического колебания A.16). Отметим также, что если cp(t) меняется по линейному закону cp(t) = Ш, то мы получаем из A.21) о; = о;о + 0, A.22) т. е. просто гармоническое колебание со смещенной частотой, причем О ^С ujq при условии A.18). В системе координат, в которой гармоническое колебание частоты cjq изо- изображается неподвижным вектором, колебание с частотой и; = с^о + О изобра- изображается вектором, медленно вращающимся против часовой стрелки с часто- частотой О, если О > 0 (и по часовой стрелке при О < 0).
1.3. МОДУЛИРОВАННЫЕ КОЛЕБАНИЯ 327 Осциллограммы процессов на рис. 1.7 (а; б) являются примером ампли- тудно-модулированных колебаний, а на рис. 1.7 в — пример колебания, мо- модулированного по фазе. Биения. Рассмотрим модулированное колебание S(t) =a(t) cos cj0*, A.23) где закон модуляции a(t) имеет вид a(t) =a0cosm. A.24) Будем полагать изменения a(t) медленными, т. е. множитель cosujot мно- множество раз изменяет знак (проходит много периодов несущего колебания) прежде, чем значение a(t) заметно изменится. Другими словами, период из- изменения функции a(t) (равный Т = 2тг/О) много больше периода несущего колебания 2тг/шо = Tq: uq > О. A.25) Колебание A.23) с законом модуляции A.24) изображено на рис. 1.9. Такое квазигармоническое колебание (конечно, не очень строго) называют гармо- гармоническим колебанием с медленно меняющейся амплитудой. Рассмотрим физический пример. Пусть ру- рупор громкоговорителя является источником гармонического звукового колебания. Напри- Например, он излучает звуковую волну с частотой щ = 440 герц (с^о = 2тг^о). Это — нота «ля» первой октавы. Мы слышим ровный музыкаль- музыкальный тон — гармоническое колебание So(t) = = clq cos coot. Как получить модулированное ко- колебание A.23)? Будем периодически то открывать, то закрывать перегород- перегородкой излучающий рупор, громкость звука будет периодически изменяться (например, с частотой 1 раз в секунду (О = 2тг рад/с)). Звуковые колебания мы будем воспринимать как чистый звуковой тон с частотой и>о, громкость которого периодически изменяется. А теперь обратим внимание на элементарное тригонометрическое тожде- тождество cosc^it + cosct^ = 2 cos (Ul~^U2t) cos (Ul~^U2t), которое показывает, что то же модулированное колебание A.23) с законом модуляции A.24) можно получить, сложив два гармонических колебания, немного отличающиеся по частоте: ш\ = и>о + О и и>2 = ujq — О; (cji — и>2 = 20). Мы имеем: acos((ct;o + ^)*) + acos((ct;o — ^)*) = 2a cos Шсовс^о*. A.26) Согласно A.26), мы получаем колебание с частотой с^о, амплитуда кото- которого a(t) = 2a cos Ш медленно изменяется, т. е. тот же результат. Этот эф- эффект — возникновение колебания с меняющейся амплитудой при сложении гармонических колебаний с близкими частотами называется биениями. Точнее, амплитудой колебания в этом случае следует назвать величину 2а | cosOt| — ведь амплитуда по смыслу существенно положительная вели- величина, она определяет «размах» колебаний. Но период функции 2a|cosOt| (показанной на рис. 1.9 пунктиром) вдвое меньше периода функции 2a cos Ш,
328 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ поэтому период биений (интервал времени, через который повторяется мак- максимальное значение амплитуды колебаний |а(?)|) равен Т = 2тт/(ио\ — ct^)- Например, при разности частот слагаемых колебаний Аи = 1 Гц период биений равен 1 секунде. Эффект можно получить, следовательно, не только описанным выше спо- способом (периодически перекрывая рупор громкоговорителя), но и располо- расположив рядом два рупора, излучающих гармонические звуковые колебания с близкими частотами (например, с частотами 440 Гц и 441 Гц). В результа- результате суперпозиции звуковых колебаний возникают периодические (с частотой 1 Гц) изменения громкости звука. 1.4. Спектральное разложение Изучая колебания и волны, мы множество раз будем приходить к необхо- необходимости представлять произвольный колебательный процесс в виде суммы гармонических колебаний различных частот S(t) = ^2an cos(u;nt + (pn). A.27) п Рассмотрим вначале лишь несколько простых физически интересных при- примеров. 1. S(t) = acos2ct;o^ Используя известное тригонометрическое тождество, запишем S(t) = A/2) a + A/2) a cos 2u0t. A.28) Первое слагаемое — константу а/2 — можно рассматривать как гармони- гармоническое колебание нулевой частоты ((a/2) cos ut —>> а/2 при и —>> 0 для любого конечного значения ?), поэтому равенство A.28) — это есть представление колебания S(t) в виде суммы двух гармонических колебаний одинаковой амплитуды ао/2 с частотами ш\ = 0 и и>2 = 2uq. 2. Рассмотрим пример амплитудно модулированного колебания S(t) = = a(t) cos (Jot, где a(t) = ao(l + mcosOt). A.29) Константа га ^ 1 называется глубиной модуляции. Мы имеем S(t) = ao(l + га cos О) + (a0ra/2) cos(cc;o + Q)t + (a0ra/2) cos(cc;o - Q)t. A.30) Итак, амплитудно-модулированное колебание с законом модуляции A.29) представляется в виде суммы трех гармонических колебаний (трех гар- гармоник) S\(t) = ao cos (Jot, #2(?) = (aora/2) cos(ct;o + ^)*, Ss(t) = (aora/2) cos(ct;o — ^)* с частотами соответственно с^о, с^о + О и ujq — ft и амплитудами ao, aora/2 и aora/2. Колебание S'i(t) называют несущим колебанием, а ^(t) и йз(?) — бо- ковыми гармониками. Условие квазигармоничности колебания S(t): О ^С с«;о- В этом случае целесообразно рассматривать колебания S2 (t) и 5з (t) как ко- колебания частоты с^о, начальная фаза которых меняется по закону ^(t) = = +Ш и (^з(^) = ~^- Другими словами, на векторной диаграмме, где несу- несущее колебание изображается неподвижным вектором Si, колебания ^(t) и
1.4. СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 329 Ss(t) изображаются соответственно векторами S2 и S3, которые вращаются (против и по часовой стрелке) с угловой скоростью О и периодом Т = 2тг/О. Рис. 1.10 демонстрирует последовательные стадии векторного сложения несущего колебания с боковыми гармониками. / 0 Si a ч t=T/8 \ ь\ Ait 5 б ; s3 Риг. 1.10 /=774 S2 t .1 t=T/2 г s2 В процессе колебаний направление суммарного вектора S = Si + S2 + S3 остается неизменным, изменяется лишь его длина (от максимального значе- значения аоA + га) до минимального аоA — га), что и соответствует амплитудной модуляции. 3. А теперь рассмотрим пример фазовой модуляции S(t) = aocos(c<;o^ + +<р(?)), где <p(i) =mcosm. A.31) Константа га — глубина модуляции фазы — определяет диапазон изме- изменения начальной фазы (от —га до +га) или (если обратиться к векторной диаграмме) «амплитуду качания» вектора S (рис. 1.8 б). Используя известное тригонометрическое тождество cos (a + f3) = cos a x х cos/З — sin a sin /3, запишем 5(?) в виде S(i) = a (cos ouot cos (p(t) — sinouot sin(p(t)). A.32) В общем случае закон модуляции A.31) приводит к довольно сложному спектру (с большим числом слагаемых гармонических колебаний). Мы рас- рассмотрим случай 777, ^С 1 (малая глубина модуляции фазы), когда можно использовать приближенные выражения cos cp(t) ^ 1 и sin cp(t) « cp(t) (мы отбрасываем величины порядка га и выше). Тогда S(t) = a cos ouot — ma sin outf cos Ш или (т. к. 2 sin a cos C = sin(a + C) + sin(a — /3)) = a0 cos wot +^ cos ((ш0 + O)t + |) + ^ cos ((ш0 - Q)t +|) . A.33) Это и есть искомое представление колебания S(t) в виде суммы гармони- гармонических колебаний. Сравним формулы A.30) и A.33). Первая из них — разложение в спектр колебания, модулированного по амплитуде, вторая — колебания, модули- модулированного по фазе. Эти колебания сильно различаются по форме (сравните осциллограммы на рисунках 1.7 б ж 1.7 в), однако их разложения в спектр весьма похожи. И здесь, и там в правой части равенств — три слагаемых, три гармонических колебания, имеющих одинаковые частоты (с<;о и ^о± ±0) и амплитуды (uq — несущие колебания, а^т/2 — боковые гармоники).
330 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ Различие выглядит небольшим: боковые гармоники отличаются фазовым сдвигом тг/2, однако это различие приводит к кардинальному отличию в форме (в осциллограмме S(t)) результирующего сигнала. Векторные диа- диаграммы на рис. 1.11 поясняют этот результат: поворот векторов S2 и S3 относительно вектора Si на тг/2 (см. рис. 1.11 а) приводит к тому, что с те- течением времени (рис. 1.11 б, в, г) суммарный вектор изменяет угол наклона, не изменяя (с точностью до величины порядка т) своей длины, что и соот- соответствует фазовой модуляции. Этот пример подчеркивает, какую огромную роль играют фазовые соотношения при сложении колебаний. t = T/S t = T/A t = T/2 5, ii ¦ Рис. 1.11 Итак, изменив фазу несущего колебания на тг/2, мы можем превратить ра- равенство A.33) в A.30) и, следовательно, колебание, модулированное по фазе, преобразовать в амплитудно-модулированное. Это — известный в радиотех- радиотехнике «прием с изменением фазы несущей». Читатель может самостоятельно проанализировать «прием без несущей»: что представляет собой модулиро- модулированное колебание ?(?), если в A.33) «убрать» первое слагаемое — несущее колебание uq cos uo^tl Рассмотрим теперь произвольный периодичский колебательный процесс S(t). Обратимся к общей задаче спектральных разложений: представлению сигнала S(t) в виде суперпозиции гармонических колебаний различных частот: S(t) = A.34) Равенство утверждает, что можно, «правильно» подобрав частоты иоп сла- слагаемых гармонических колебаний, их амплитуды ап и начальные фазы срп, образовать в сумме сигнал S(t). Специальный раздел математики — Фурье- анализ — занимается математической стороной проблем, связанных с воз- возможностью представления функций S(t) в виде A.34). Почему в качестве элементарных слагаемых во многих физических задачах оказывается це- целесообразно использовать гармонические колебания — об этом мы будем говорить в гл. 2. Здесь же отметим замечательные математические свойства гармонических функций. Во-первых, гармоническое колебание частоты ш не может быть предста- представлено суперпозицией гармонических колебаний ^ancos(ct;nt + срп) любых других частот с^п, какие бы коэффициенты ап и начальные фазы срп мы ни старались подобрать. Математически это свойство называют ортогонально- ортогональностью: функция cos(u)t-\-cp) не имееет «проекции» на любую другую функцию cos(ct/t + if1) при ш ф а/, подобно тому, как вектор, параллельный оси ж, не- невозможно представить в виде суммы векторов, параллельных осям у и z.
1.4. СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 331 Второе важнейшее математическое свойство — единственность предста- представления A.34): существует единственный набор необходимых частот шп и единственный набор отвечающих этим частотам амплитуд ап и фаз срп, обес- обеспечивающих представление функции S(t) в виде суперпозиции гармониче- гармонических функций. Наконец, не вдаваясь в математические детали, отметим еще одно важ- важное обстоятельство: любой физически реализуемый колебательный процесс может быть представлен в виде суммы (быть может в виде непрерывной суммы — интеграла) гармонических колебаний. Рассмотрим теперь общий случай периодического процесса S(t). В этом случае колебание S(t) представляется рядом Фурье S(t) = у ^ ап cos(nuj()t -\- (fn). A.35) п Легко видеть, что колебание S(t\ определенное рядом Фурье A.35), дей- действительно является периодической функцией с периодом Tq = 2тг/сс;о, т. е. S(t) = S(t+To) для любого t. Как доказывается в курсах Фурье-анализа, ам- амплитуды слагаемых гармонических колебаний ап и их начальные фазы <рп, можно найти (если задана функция S(t)) с помощью формул а0 = A/2)a/6q + c/q, an = \/Щ^г~Щ1 при п^О, То/2 где dn = B/Г0) A.36) -То/2 То/2 Ьп = B/Го) / S(t) cos nuot dt. -To/2 В качестве примера рассмотрим задачу разложения в спектр периоди- периодической последовательности прямоугольных импульсов, изображенных на рис. 1.12 а. Период следования импульсов равен Т, длительность импуль- импульсов т. Воспользуемся формулами A.36). Поскольку S(t) — четная функция: S(t) = S(—t), то dn = 0 для всех п, поэтому ап = Ъп и срп = 0. Мы получаем т/2 т 2 [ 2т sin "^f- ао= —, ап=— / cos ncjot dt = — nujJ , n = 1, 2, ... A-37) -*--*- J 1 2 -r/2 Ha рис. 1.12 б' по оси абсцисс отложены частоты lo слагаемых гармони- гармонических колебаний (о;о, 2о;о, Зс^о и т. д.), по оси ординат — соответствующие этим слагаемым (для случая т = Т/6) амплитуды колебаний ai, a2, аз и т. д., найденные с помощью A.37). «Огибающая» пунктирная линия — график функции а(ш) = Y"S1^W2 • Именно на этой кривой находятся значения an. На рис. 1.12 в изображены спектры колебаний, рассмотренных в примерах 2 и 3. Еще раз обратим внимание, что частоты слагаемых гармоник и соот- соответствующие им амплитуды в обоих случаях одинаковы. Отличаются лишь
332 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ начальные фазы боковых гармоник. Объясните, какой смысл имеют отри- отрицательные значения амплитуд колебаний ап, найденные с помощью форму- формулы A.37)? S(t) 1 1 —^- т -*— 2т Т т Т 0 а 'п соо У 1 1 ^/т ^ to 5со0 UJLJ1 а0тп/2 а0тп/2 со co0+Q ее>0 cdo-Q I I I I I ,2^/т -2ю0 -©о 2с Рис. 1.12 Графические изображения на рис. 1.12 б, в показывают, какие гармони- гармонические колебания, складываясь, образуют модулированный колебательный процесс S(t) (каковы их частоты, амплитуды и, в общем случае, начальные фазы). Совокупность значений ап = а(шп) и (рп = (р(шп) образуют спектр колебания S(t). Комплексная форма спектральных разложений. Ранее мы говори- говорили, что гармоническое колебание a cos (ujt+tp) можно записать в комплексной форме z(t) = A.38) Комплексное представление часто используют и в спектральных разложе- разложениях: в качестве элементов разложения (тех элементарных кирпичиков, из которых складывается суммарный колебательный процесс S(t)) используют комплексные функции A.38): A.39) где сп — в общем случае комплексные коэффициенты: сп=\сп\ег(Рп. Каково соотношение между спектральными разложениями A.27) и A.39)? Воспользуемся соотношением: cos a = (еш + е~ш)/2, представив каждое сла- слагаемое в A.27) в виде ап cos(ount + ifn) = (ап/2)ег^ег^ + (ап/2)е"^е-^*. A.40) Мы видим, что разложения A.27) и A.39) будут эквивалентны, если ка- каждому слагаемому в A.27) поставить в соответствие два слагаемых в A.39), т. е. каждой реальной гармонике (гармоническому колебанию с частотой и>п)
1.4. СПЕКТРАЛЬНОЕ РАЗЛОЖЕНИЕ 333 поставить в соответствие два комплексных слагаемых, введя в A.39) сум- суммирование по отрицательным значениям п, согласно правилу Ш-п = — шп причем -п = (^п/2)е п, , _ , (л лл\ При комплексной форме спектрального разложения необходимо, таким образом, ввести отрицательные частоты —с<;п, которые не имеют какого-либо самостоятельного физического смысла. Они возникают лишь «благодаря» соотношению A.40). При этом из A.41) следует, что соответствующие отрицательным часто- частотам —иоп коэффициенты с_п могут быть получены из соответствующих ко- коэффициентов сп для положительных частот: с-п = < A.42) (т. е. сп и С-п — комплексно-сопряженные числа). Если вернуться к рас- рассмотренному ранее примеру и представить в виде A.39) последовательность прямоугольных импульсов (периодический процесс на рис. 1.12 а), то спектр процесса сп будет иметь вид, изображенный на рис. 1.12 г. Обратите внимание, что задание комплексного спектра сп дает исчерпы- исчерпывающую информацию о сигнале S(t), как об амплитудах слагаемых гармо- гармонических колебаний, так и об их начальных фазах. Рассмотрим в заключение задачу разложения в спектр произвольного сиг- сигнала S(t). Оказывается, что произвольный сигнал не может быть предста- представлен в виде A.39) либо A.27), т. е. в виде суммы гармонических колебаний с дискретным набором частот иоп. В общем случае необходим непрерывный набор гармоник, т. е. необходимо суммировать гармонические колебания, ча- частоты которых непрерывно заполняют некоторый (быть может бесконеч- бесконечный) интервал частот. То есть необходимо иметь не только колебания с частотами cji, CJ2, ... с<;п, но также и все частоты в промежутке между ними. При этом ряд A.39) заменяется интегралом Фурье: S(t) ОО = -!- Г C{Lo)eiut&LO. A.43) 2тг J Множитель С (и) = а(ш)ег(р^ показывает, с каким весом (т. е. с какой амплитудой а(ш) и с какой начальной фазой (р(ш) необходимо складывать гармонические колебания разных частот, чтобы при суммировании (интегри- (интегрировании) образовать заданный сигнал S(t). Функция С(ш) называется спек- спектром (или преобразованием Фурье) сигнала S(t). Как найти спектр, если сигнал S(t) известен? Приведем без доказательства (которое можно найти в учебниках по Фурье-анализу) формулу: оо -/ С{ш)= / S(t)e-lwtdt. A.44) — оо Соотношение A.44) математики называют прямым преобразованием Фу- Фурье, а формулу A.43) — обратным преобразованием Фурье.
334 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ В качестве примера рассмотрим задачу разложения в спектр прямоуголь- прямоугольного импульса длительности т (рис. 1.13 а). Используя A.44), получаем S(t) -iuj J x ' our/2 -т/2 -т/2 Функция С{ш) показана на рис. 1.13 б. Полезно сравнить спектр отдель- отдельного импульса со спектром периодической последовательности одинаковых импульсов (рис. 1.12 г): спектр импульса С (и) представляет собой «огибаю- «огибающую» частокола спектральных компонент сп периодической последователь- последовательности импульсов. Модуль функции С{ш) определяет амплитуды гармонических колебаний разных частот, сумма которых образует импульс S(t). Как видно из гра- графика, основной вклад дают гармонические колебания, частоты которых за- заполняют интервал \Auj\ < 2тг/т. Это — полуширина главного максимума функции (sin шт /2) / (шт/2). Диапазон частот Auj можно назвать шириной спектра C(uj), т. к. гармони- гармонические колебания этого диапазона частот дают основной вклад в суммарный сигнал S(t). Мы получили замечательное соотношение, связывающее между собой длительность сиг- сигнала с шириной его спектра г • Aojtt 2тг. A.45) Это соотношение имеет универсальный ха- характер. Оно оказывается справедливым по порядку величины для произвольного сигна- сигнала S(t). Чем больше длительность сигнала (либо больше интервал времени, в течение которого происходит его заметное измене- изменение), тем уже спектр сигнала Аи. И наобо- наоборот, чем короче сигнал, или быстрее происхо- происходят изменения сигнала, тем шире его спектр, т. е. требуется более широкий интервал ча- частот гармонических колебаний, образующих в сумме данный сигнал. В этом состоит смысл замечательного соотношения A.45), которое называется со- соотношением неопределенностей. 1.5. Векторные колебания. Фигуры Лиссажу Обратим внимание на формулу A.6) — правило, по которому мы скла- складываем колебания Si(t) и S^t). Это правило сложения скалярных величин, т. е. в каждый момент времени t мы просто алгебраически складываем две скалярные величины. Мы пользовались графическим изображением колеба- колебаний (в виде векторов) лишь для того, чтобы облегчить себе задачу сложения двух скалярных меняющихся во времени величин Si и $2. Теперь мы будем говорить о другой проблеме. Представим себе, что ко- колеблющейся величиной является вектор, например, колеблется вектор на- напряженности электрического поля в данной точке пространства, или вектор магнитного поля, или какая-либо другая векторная величина. При этом в
1.5. ВЕКТОРНЫЕ КОЛЕБАНИЯ. ФИГУРЫ ЛИССАЖУ 335 процессе колебаний может изменяться не только модуль вектора, но и его направление в пространстве. Начнем с простой задачи. Как сложить два колеблющихся вектора Si и S2: Si = Ai cos(ujt + (pi) и S2 = A2 cos(ct;t + A.46) где Ai и А2 — два взаимно-перпендикулярных постоянных вектора, скажем вектор Ai направлен вдоль оси ж, а вектор А2 — вдоль оси у. То есть в процессе колебаний вектор Si остается параллельным оси ж, а вектор S2 — параллельным оси у. Мы убедимся, что суммарный вектор S = Si + S2 в общем случае изменяет с течением времени свое направление в пространстве. Очевидно, что в любой момент времени проекции суммарного вектора на оси х ж у равны: Sx = A\ cos(u;t Sy = A.47) Меняется, в общем случае, и ориентация суммарного вектора (tga = Sy/Sx, а — угол между направлением вектора и осью ж), и его длина. Ясно, что при этом S остается в плоскости (ж, у) (его ^-проекция равна нулю). Конец вектора S описывает с течением времени некоторую плоскую траекторию, и формулы A.47) можно рассматривать как уравнение этой траектории в параметрической форме. Это — уравнение эллипса, вписанного в прямоугольник со сторонами BAi, 2A2) (рис. 1.14 а). Ориентация главных полуосей эллипса зависит от сдвига фаз ср2 — ц>\. Колебание суммарного вектора называют в этом слу- случае эллиптически-поляризованным. На рис. 1.14 показаны частные случаи эллиптически поляризованных колебаний. Рис. 1.14 При ср2 — ц>1 = 0, 2тг, 4тг, ... эллипс поляризации вырождается в прямую: ориентация суммарного вектора не меняется (рис. 1.5 б). Уравнение прямой в этом случае легко найти из A.47): у = (А2/А1)х. Угол наклона вектора tga = у/х = А2/А1 не меняется со временем. При (f2 — (fi = тг, Зтг, 5тг, ... получаем У = -(А2/А1)х. Этот случай показан на рис. 1.14 г. И в том, и в другом случае вектор S в процессе колебаний не меняет своей ориентации в пространстве. Такие колебания называются линейно- поляризованными.
336 ГЛ. 1. КИНЕМАТИКА КОЛЕБАНИЙ Главные оси эллипса совпадают с осями ж, у, если 1) (р2 — (pi = тг/2 + 2тгп (п = 1, 2, ...), либо 2) ip2-ipi= Зтг/2 + 2тгп (п = 1, 2, ...). В обоих случаях уравнение эллипса имеет вид (рис. 1.14 в): (х2/А\) + (у2/А22) = 1. A.48) Однако движение конца суммарного вектора по эллипсу A.48) в случаях 1 и 2 различны. (Вопрос для читателя: в чем состоит это различие?) Более сложной оказывается траектория движения конца суммарного век- вектора S, если частоты двух взаимно-перпендикулярных колебаний не равны. В частности, траектория оказывается замкнутой, если частоты складывае- складываемых колебаний относятся как целые числа Sx(t) = А\ соб(пшг + <pi), Sy(t) = А2 cos(mu;t + <р2), A.49) т. е. uj\juj2 — ть/т. Действительно, промежуток времени t = 2тг/ш содержит как целое число периодов колебания Sx (t), так и целое число периодов коле- колебания Sy(t), т. е. значения Sx(t) и Sy(t) повторяются через интервал времени Т (Т = пТ\ = гпТъ) — конец вектора S попадает в ту же точку на плоскости (ж, у) через интервал времени Т. m Рис. 1.15 Замкнутая траектория, которую описывает конец суммарного вектора S, называется фигурой Лиссаэюу. На рис. 1.15 приведены примеры фигур Лис- сажу для некоторых значений ио\/ио2 и Аср = ср2 — ц>\. Фигуры Лиссажу можно наблюдать на экране осцил- осциллографа, подавая на горизонтальный вход осциллогра- осциллографа (т. е. на пластины конденсатора, создающего гори- горизонтальное электрическое поле) напряжение, меняюще- меняющееся по закону x(t) = A\ cos(nu;t + cpi), а на пластины кон- конденсатора, создающие вертикальное электрическое поле, напряжение y(t) = A2 cos(mu;t + ^2)- Электроны, пролетающие между обкладками этих кон- яоо Рис. 1.16 денсаторов навстречу читателю (рис. 1.16), отклоняются суммарным элек- электрическим полем S(t) = Si(t) + S2(t), оставляя на экране осциллографа след, представляющий собой фигуру Лиссажу (например, одну из фигур, изображенных на рис. 1.15). Задачи 1. Нарисуйте графики S(t) (осциллограммы) следующих гармонических колебаний: S(t) = 2cos(lOOTrt), S(t) = 5cosE0tt? + тг/3), S(t) = cosA007rt + тг/2).
ЗАДАЧИ 337 2. Для осциллограмм, изображенных на рис. 1.17, найдите циклическую частоту и на- начальную фазу гармонических колебаний. Напишите уравнение S(t) соответствующих гар- гармонических колебаний. 5@ -5@ t(c) Рис. 1.17 3. Найти разность фаз двух колебаний одинаковой частоты и амплитуды, если ампли- амплитуда суммарного колебания равна: а) амплитуде слагаемых колебаний; б) в у/2 раз больше амплитуды слагаемых колебаний. 4. При сложении трех гармонических колебаний одинаковой частоты и амплитуды ока- оказалось, что суммарное колебание синфазно (т. е. совпадает по фазе) с одним из слагаемых, а его амплитуда вдвое больше амплитуд слагаемых колебаний. Найти разность фаз сла- слагаемых колебаний. 5. Используя графическое изображение, найти сумму N гармонических колебаний оди- одинаковой частоты и амплитуды, фазы которых составляют арифметическую прогрессию: А(рп =nS (n = 0, 1, ... N-l). 6. Выразить начальную фазу суммарного колебания, изображенного на рис. 1.3, через амплитуды и фазы слагаемых колебаний. 7. Докажите, что точка М, изображающая состояние системы на фазовой плоскости, движется с течением времени по часовой стрелке (рис. 1.5 а). 8. Докажите, что семейство фазовых траекторий на рис. 1.5 а описывает гармонические колебания одной и той же частоты ш. Определите величину ш. 9. Чем отличаются гармонические колебания, отвечающие фазовым траекториям на рис. 1.5 бив. Найти отношение амплитуд и частот колебаний на этих траекториях. 10. Изображающие точки Mi, М2 и Ms находятся в момент времени t = 0 на прямой О А (рис. 1.5 б ж 1.5 е). Через время At точка Мъ находится на прямой ОВ. Найти положение точек Mi и Мз. 11. Нарисуйте графики (осциллограммы) следующих модулированных колебаний: а) S(t) = a(t) cos(ujot + <^о), где a(t) = ао| cos Ш| при, п <^С шо] б) S(t) = аоA + mcosQt) cosujot при т < 1; в) S(t) = ao cos(uoot + at2). 12. Найдите результат сложения гармонических колебаний с близкими частотами и и (и + Q), амплитуды которых а\ и п2 отличаются. Каково максимальное и минимальное значение квадрата амплитуды (интенсивности) суммарного колебания? 13. При сложении гармонических колебаний с близкими частотами интенсивность сум- суммарного колебания изменяется вдвое. Каково отношение интенсивностей слагаемых коле- колебаний? 14. Разложите в ряд A.39) (в комплексный спектр) модулированные колебания S(t), рассмотренные в примерах 1-3. Нарисуйте графики соответствующих функций а(иоп) и С(си„). Проверьте справедливость соотношения A.45) для этих примеров.
ГЛАВА 2 КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 2.1. Примеры простейших колебательных систем. Общность уравнений, описывающих колебания различной физической природы Начнем с математического маятника — материальной точки массы га, подвешенной на нерастяжимой нити длины /. Выведенный из положе- положения равновесия, маятник начинает качаться, совершать колебательное дви- движение. На рис. 2.1 показаны силы, действующие на материальную точку в момент, когда угол отклонения маятника равен а. Уравнение движения (второй закон Ньютона) имеет вид ma = rag + Т, где Т — сила натяжения нити, rag — сила тяжести. Проектируя это уравнение на направление касательной к траектории движения (дуги окружности), запишем тат = —mg sin a B.1) (сила натяжения нити Т нормальна к траектории, ее проек- ция на касательную равна нулю). Здесь ат — касательная к окружности составляющая ускорения а: ат = d2x/dt2 (х — длина дуги, отсчитываемая от положения равновесия — точки О). Положительному отклонению х > 0 соответствует, согласно рис. 2.1, от- отклонение влево, при этом проекция силы тяжести на касательную направле- направлена вправо — она отрицательна. Это очень существенно: куда бы ни откло- отклонялся маятник от положения равновесия, возникает сила, возвращающая маятник в это положение — сила имеет знак, противоположный смещению. Точка О — устойчивое положение равновесия. Поскольку х = la и аТ = х = /й, то из B.1) получаем а + ujq sin a = 0, где с^о = vo/l- B.2) При малых отклонениях от положения равновесия sin a « а мы приходим к уравнению малых колебаний а + ои%а = О. B.3) Физический маятник (рис. 2.2). Это — реальная колебательная систе- система; момент инерции маятника относительно оси А равен J. Второй закон Ньютона для вращательного движения тела относительно неподвижной оси имеет вид Ja = М, B.4)
2.1. ПРИМЕРЫ ПРОСТЕЙШИХ КОЛЕБАТЕЛЬНЫХ СИСТЕМ 339 где М — суммарный момент внешних сил относительно оси А. В нашем слу- случае (без учета сил трения в оси и сопротивления воздуха) М = — mglsma. Рассматривая малые колебания (sina « а), получим из B.4) а + ш^а = 0, где с^о = B.5) (при J = ml2 — момент инерции материальной точки относи- относительно оси А — имеем прежний результат B.3)). Пружинный маятник. Тело массы т прикреплено пружи- пружиной жесткости к к стенке. Начало координат — точка О — соот- соответствует положению равновесия, в котором пружина не дефор- деформирована — нет сил, смещающих тело влево или вправо. При смещении тела из этого положения возникает упругая сила: F = -кх, где х — величина деформации (растяжения или сжатия) пружины, равная в нашем случае смещению от положения х = 0. Знак силы, согласно B.6), противоположен знаку смещения. При х < 0 (как показано на рис. 2.3) F > 0: сила возвращает те- тело к положению равновесия. Второй закон Нью- Ньютона имеет вид: тх = — кх или х + = 0, где B.7) Рис. 2.3 Обратите внимание на математическую тождественность уравнений B.3), B.5) и B.7)! Колебательный контур. Это — пример колебательной системы совер- совершенно иной физической природы. На рис. 2.4 изображен контур, содержа- содержащий конденсатор емкости С и катушку индуктивности L. Полагаем, что сопротивление R отсутствует (в предыдущих примерах мы по- полагали, что отсутствуют силы трения и сопротивления возду- воздуха при движении). Согласно закону Ома для замкнутой цепи, сумма падений напряжения на всех участках цепи равна сумме э. д. с. Па- Падение напряжения — разность потенциалов между обклад- обкладками конденсатора, равна q/C, а э. д. с. индукции в катушке ?инд = —L(dl/dt), где / — сила тока. Итак: q/C = —L(dl/dt). Но / = dq/dt, следовательно, dl/dt = d2q/dt2 = q; таким образом Lq + q/C = 0, или Рис. 2.4 q + ou^q = 0, где B.8) Снова получаем уравнение того же вида, что и B.3), B.5), B.7). Электрон в атоме Томпсона. Рассмотрим модель атома Томпсона, пре- предложенную в конце XIX века — до Резерфорда: положительно заряженное шарообразное «облако» (его размер i?, согласно Томпсону, определяет раз- размер атома), в котором под действием кулоновской силы двигается отрица- отрицательно заряженный, «точечный» электрон. Атом электрически нейтрален, т. е. положительный заряд облака е равен по абсолютной величине отрица- отрицательному заряду электрона.
340 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ При смещении относительно центра облака на электрон действует сила F', направленная к центру, и возвращающая электрон к положению равновесия (рис. 2.5). Эта сила равна F = — еЕ, где Е — напряженность элек- электрического поля, созданного облаком положительного за- заряда на расстоянии г от его центра. Применим теорему Гаусса к сфере радиуса г: поток вектора Е через поверх- поверхность этой сферы равен (l/eo)q, где q — полный заряд, находящийся внутри сферы. Полагая, что заряд облака е распределен равномерно, получим q= (r/RKe. Теорема Рис. 2.5 Гаусса дает: ЕАтгг2 = l/e^r/Rfe, или ?(г) = [е/Dтг?0Д3)]г. Если г — радиус-вектор, проведенный из центра в точку, где находится электрон, то сила F есть Второй закон Ньютона (уравнение движения электрона) имеет вид ИЛИ г + ш%г = 0, B.10) где с^о = е/л/АтгеотЯ3. И снова получаем уравнение того же математического вида! Гармонический осциллятор. А теперь пора сделать некоторые обоб- обобщения. Мы рассмотрели четыре примера из разных областей физики, но их можно привести десятки. Физическое различие между рассмотренными системами в конечном счете проявляется в том, что параметр с^о, входящий в уравнения B.3), B.5), B.7), B.8) и B.10), определяется различными физическими величинами: ускоре- ускорением силы тяжести д и длиной маятника / в первом примере; жесткостью пружины к и массой тела m — в третьем; индуктивностью L катушки и ем- емкостью С конденсатора — в четвертом; зарядом электрона, его массой и раз- размером атома — в пятом. Однако одно важнейшее обстоятельство объединяет поведение этих физически различных систем. Каждый раз возникает ситуа- ситуация, когда система, будучи выведенной из положения равновесия, отвечает на это возникновением силы, стремящейся вернуть систему к равновесию, причем во всех приведенных примерах величина силы оказывается пропор- пропорциональной величине смещения (т. е. имеет место линейная связь между силой и смещением). Эта линейность, как правило, обеспечивается допол- дополнительным предположением, а именно: малостью отклонения от положения равновесия. Конечно, понятия «смещение» и «сила» не в каждом случае следует по- понимать буквально: скажем, в примере с электрическим контуром состояние покоя — это отсутствие каких-либо токов и напряжений в контуре, т. е. положение равновесия это q = 0, / = 0. Здесь «смещение» из положения равновесия — это отличный от нуля заряд q на пластинах конденсатора. Возникающая при этом разность потенциалов между пластинами приводит
2.2. СВОБОДНЫЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 341 к возникновению электрического поля в проводнике и, следовательно, к возникновению тока в цепи — т. е. к постепенному разряду конденсатора (постепенному, потому что быстрому (мгновенному) разряду препятствует возникающая в катушке э. д. с. индукции). Так что «силой», возвращающей систему к положению равновесия, является по существу сила, действующая на заряд со стороны электрического поля в проводнике. Любая физическая система, поведение которой подчиняется уравнению S + w%S = 0, B.11) называется гармоническим осциллятором, а уравнение B.11) называется уравнением гармонического осциллятора. Итак, согласно B.11), вторая производная от смещения осциллятора из положения равновесия S пропорциональна (и противоположна по знаку) величине смещения S. Какой же должна быть зависимость S(t), удовлетво- удовлетворяющая B.11)? 2.2. Свободные колебания гармонического осциллятора Легко убедиться, что решением уравнения B.11) является гармоническое колебание (поэтому-то система, описываемая этим уравнением, и называет- называется гармоническим осциллятором). Действительно, дифференцируя функцию S(t) =acos(ut + (p) B.12) дважды, находим: S = — aujsin(ujt + <р), S(t) = -аи;2 cos(u;t + ip). B.13) Подставляя B.12) и B.13) в B.11), убеждаемся, что уравнение обращается в тождество, причем значения а и ср могут быть любыми. Другими слова- словами, B.12) — это множество решений, или, как говорят математики, общее решение, содержащее две произвольные постоянные. Итак, любая из описан- описанных нами физических систем, а также множество других систем, подчиня- подчиняющихся уравнению B.11), будучи выведенными из положения равновесия, совершают гармонические колебания. Эти колебания называются свободны- свободными, поскольку достаточно вывести систему из положения равновесия — и колебания далее происходят «сами по себе», без какого-либо внешнего воз- воздействия. Произвольные постоянные а и ср — амплитуда и начальная фаза — опре- определяются начальными условиями, тем, как именно система выводится из положения равновесия. Например, маятник можно отклонить от положения равновесия на некоторый угол «о и затем отпустить. Этот момент (когда ма- маятник отпускают) и есть начальный момент времени t = 0. Мы имеем в этом случае начальные условия: a(t) = «о при t = 0; это условие записывают в виде Ф) |*=о = <*о- B.14) Одного условия B.14) недостаточно для определения двух постоянных а и ср. Второе условие — задание начальной скорости. В нашем примере
342 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ (маятник, отклонив, отпускают) мы имеем a(t) \t=o = 0. B.15) Имея общее решение a(t) = a cos(u;t + ф) B.16) и два начальных условия B.14) и B.15), можно выбрать из множества реше- решений B.16) единственное, удовлетворяющее этим условиям. Легко проверить, что оно имеет вид: a(t) = «о cosut. Аналогичным образом можно определить колебательный процесс, если маятнику, не отклоняя его от положения равновесия, сообщить начальную скорость а$. Тогда начальные условия имеют вид: «(*) |*=о = 0, a(t) |t=o = «о, а соответствующее решение a(t) = — smut. ш В самом общем случае задача сводится к выбору из множества решений B.12) единственного решения, удовлетворяющего начальным условиям S(t) \t=o = So, S(t) \t=0 = So. B.17) Два условия B.17) позволяют найти две произвольные постоянные а и (р. Еще раз обратим внимание на замечательную особенность колебаний, со- совершаемых гармоническим осциллятором: частота колебаний определяется только параметрами самой колебательной системы (/ид — для математи- математического маятника, т и к — для пружинного маятника и т. д. ) и не зависит от амплитуды колебаний, т. е. не зависит от начальных условий (от того, каким образом осциллятор выведен из положения равновесия). Разумеется, все сказанное справедливо при условии, что амплитуда остается достаточно малой, что и обеспечивает линейную связь между возвращающей силой и величиной смещения из положения равновесия. 2.3. Превращения энергии при свободных колебаниях в гармонических осцилляторах Почему все-таки возникают колебания? Одно обстоятельство мы уже отмечали: при смещении осциллятора из положения равновесия возника- возникает сила, стремящаяся вернуть систему в это положение. Но ведь можно представить себе ситуацию, при которой система, вернувшаяся в положение равновесия, в этом положении и останется — никаких колебаний не будет. Значит, важно еще одно обстоятельство: инерционность системы, благодаря которой система «проскакивает» положение равновесия и отклоняется от него в противоположную сторону. Обратимся к рассмотренным выше примерам. Восстанавливающей силой, возвращающей систему в положение равновесия, является: при колебани- колебаниях маятника — проекция силы тяжести; при упругих колебаниях груза на пружине — сила Гука; в колебательном контуре — электрическое поле в проводнике, возникающее при заряде конденсатора. Возвращение электрона
2.3. ПРЕВРАЩЕНИЯ ЭНЕРГИИ ПРИ СВОБОДНЫХ КОЛЕБАНИЯХ 343 к положению равновесия в атоме Томпсона обусловлено электрическим по- полем положительно заряженного «облака». Инерционность же осциллятора, благодаря которой система, не «остана- «останавливаясь», проскакивает положение равновесия, обусловлена тем, что по мере приближения к равновесию осциллятор набирает «скорость»: если ве- величина S(t) при приближении к положению равновесия уменьшается, то «скорость» S(t) при этом увеличивается и система «по инерции» отклоня- отклоняется в противоположную сторону (в колебательном контуре «скорость» — это скорость изменения заряда, т. е. сила тока в проводнике). Ток не исче- исчезает при нулевом заряде — он существует благодаря «инерции» катушки индуктивности. Если бы обкладки конденсатора были соединены через сопротивление R (без индуктивности: L = 0), то по закону Ома мы имели бы q/C + IR = 0, и при q = 0, / = 0, т. е. ток исчезает одновременно с зарядом — никаких колебаний! Инерционность в других примерах связана с наличием массы колеблющегося груза или электрона: остановить тело массы М, набравшее скорость, невозможно мгновенно — вот почему положение равновесия и про- проскакивается! Процесс колебаний осциллятора полезно рассмотреть с энерге- энергетической точки зрения. Вернемся к физическому маятнику, уравнение движения которого (для малых а) имеет вид: Ja = —mgla. Умножив обе части равенства на а, находим т.. . . . d ( Ja2 mgla2\ Jaa = —mglaa или — — 1 — = U. d? \ 2 2 J Мы получили закон сохранения энергии ^ Ja2 mqla2 , „ . Ео = + — = const. B.18) z z Первое слагаемое — кинетическая энергия маятника, второе — потенци- потенциальная энергия (при отклонении на угол а центр масс поднимается на высо- высоту h = /A — cos a) « la2/2). Согласно B.18), в процессе колебаний суммарная энергия остается неизменной. Подставив в B.18) выражения a(t)=ao cos(uj()t-\-(p) и a(t)= — clqujq sm(uj()t + ), легко получить (упражнение для читателя) Ео = (J«o^o)/2 = const- B-19) (Для математического маятника J = ml2 имеем Eq = т12а^шо/2 = const.) Составляющие полной энергии в процессе колебаний, очевидно, изменя- изменяются по закону Якин = (Jagwg/2) sin2(a;ot + ф) = (Е0/2) - (Е0/2) cosBa;ot + 2у>); ЕиОт = (mgla2/2) cos2(a;ot + ф) = (Е0/2) + (Е0/2) cosBa;ot + 2ф). Как следует из B.20), как кинетическая, так и потенциальная энергия колеблются с частотой 2о;о, причем изменяются в противофазе: в моменты, когда максимальна кинетическая энергия, потенциальная энергия обраща- обращается в нуль — это момент прохождения маятником положения равновесия.
344 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ В момент максимального отклонения от положения равновесия равна нулю кинетическая энергия — при этом максимальна его потенциальная энергия. Согласно определению, среднее за время Т значение меняющейся во времени величины E(t) есть т о Из B.20) ясно, что среднее за период колебаний значение кинетической энер- энергии осциллятора равно среднему значению потенциальной энергии и равно половине полной энергии: (ЕК1Ш) = (Еиот) = Eq/2. Аналогичным образом можно рассмотреть энергетические изме- изменения в идеальном (R = 0) колебательном контуре. Умножив уравне- уравнение колебаний q/C + Lq = 0 на g, имеем Мы получаем закон сохранения энергии Ео = q2/BC) + (Lq2)/2 = const. B.21) Первое слагаемое q2/'BG) — энергия конденсатора (т. е. энергия его элек- электрического поля), второе Lq2/2 — энергия катушки индуктивности (т. е. энергия магнитного поля). Изменения заряда q(t) и тока q(t) происходят по закону q = qo cos(uj()t + ф), q(t) = — go^o sin(ct;o^ + ф) — —Io sin(ct;o^ + ф), где Iq = q^cJo — амплитуда колебаний тока. Используя последние выражения, а также ш$ = 1/(LC), можно получить из B.21) Ео = {LqluD/2 = ЫЦ2 = q2JBC). Первое выражение LIq/2 — это максимальное значение магнитной энер- энергии, второе 6/q/BC) — максимальное значение электрической энергии. За- Законы изменения электрической и магнитной энергии имеют вид Еэ = {ql/2C) cos2(oj0t + ф) = (Е0/2) + (Е0/2) cosBoj0t + Ем = {Lq^l/2) sin2(o;ot + tp) = (Е0/2) - (Е0/2) cosBu;0t Таким образом, электрическая и магнитная энергия изменяются с часто- частотой 2о;о, причем изменяются в противофазе: в те моменты времени, когда максимальна электрическая энергия, магнитная энергия обращается в нуль, и наоборот, причем (Еэ) = (Ем) = Eq/2. Проследим за энергетическими превращениями при колебаниях электрона в атоме Томпсона. При равномерном распределении положи- положительного заряда внутри облака легко найти распределение потенциала элек- электрического поля как функции расстояния от центра О. Принимая потенциал центра облака за нуль, найдем
2.4. ЗАТУХАЮЩИЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 345 Потенциальная энергия электрона в этом поле (учитывая, что заряд элек- электрона равен — е) равна hi п = т 8tT?qR3 Кинетическая энергия есть Ек = гаг2/2. Закон сохранения энергии 9 9 «9 2 B.22) можно получить (как и в предыдущих примерах) из уравнения колебаний B.9): после умножения B.9) наг, находим 9 1 е d mrr + 1 7у\гг = ° или 37 dt V 2 Интегрируя последнее равенство, приходим к закону сохранения энергии B.22). В процессе колебаний изменяются как кинетическая энергия элек- электрона, так и его потенциальная энергия. При максимальном смещении элек- электрона от центра г = tq его потенциальная энергия максимальна, при этом кинетическая энергия обращается в нуль, при прохождении положения рав- равновесия г = 0 максимальна кинетическая энергия, при этом его потенциаль- потенциальная энергия равна нулю. 2.4. Затухающие колебания гармонического осциллятора Осциллятор, совершающий гармонические колебания — это иде- идеализация. Мы уже отмечали, что бесконечно длящийся процесс вида S(t) = = acos(c<;? + ф) невозможен. Свободные колебания любого реального осцил- осциллятора рано или поздно затухают и прекращаются. Примем теперь во внимание то, что мы сознательно упускали до сих пор, а именно наличие «сопротивления» движению осциллятора, которого не из- избежать в любой реальной системе. В качающемся маятнике — это трение в оси и сопротивление среды, в которой колеблется маятник. То и другое создает тормозящий момент сил. В пружинном маятнике к сопротивлению среды добавляется сила трения, возникающая при скольжении груза. В ко- колебательном контуре имеется омическое сопротивление, обусловленное, по сути, столкновениями электронов с атомами кристаллической решетки в проводнике. Колеблющийся электрон в атоме Томпсона излучает электро- электромагнитную энергию, уносящую энергию колебаний — это также приводит к затуханию (т. н. радиационное затухание). Рассмотрим влияние «тормозящей силы», зависящей от скорости. Во мно- многих случаях (при малых скоростях) эта зависимость оказывается линейной. Пример 1. Пружинный маятник (рис. 2.3). Уравнение движения (второй закон Ньютона) при наличии вязкого трения, пропорционального скорости (^тр = —/Зх) имеет вид тх = —/еж — /Зж или х + 2Ei + ujqx = 0, B.23) где 6 = /3/Bга), с^о = л/kjm.
346 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ Пример 2. Колебательный контур при наличии омического сопротивле- сопротивления. Закон Ома для замкнутой цепи: IR + q/C = -LdI/dt B.24) (сумма падений напряжения на сопротивлении IR и на конденсаторе q/C равна э. д. с. индукции —Ldl/dt в катушке индуктивности). Так как / = q и dl/dt = g, то последнее уравнение преобразуется к виду q + 26q + u%q = 0, B.25) где 5 = R/BL) иц = 1/y/LC. Уравнения B.23) и B.25) оказались математически тождественными, хотя описывают поведение совершенно различных физических систем. Можно убедиться (упражнение для читателя), что при наличии силы со- сопротивления, пропорциональной скорости, ^сопр = —C1а, уравнение колеба- колебаний физического маятника (рис. 2.2) имеет вид а + 26а + ш%а = 0, B.26) где 6 = C12/BJ), шо = y/mgl/J. Угол отклонения маятника от положения равновесия описывается уравне- уравнением того же вида, что и изменение заряда на конденсаторе в колебательном контуре с сопротивлением. Следует обратить внимание на общность уравне- уравнений B.23)-B.26), описывающих колебания различной физической природы. К аналогичным уравнениям приводит множество различных физических задач (в частности, уравнение колебаний классического электрона в ато- атоме с учетом радиационного затухания имеет тот же вид, что и уравнение, описывающее колебания маятника B.26), учитывающее вязкое трение). Итак, во всех рассмотренных случаях колебания описываются одним и тем же уравнением S + 25S + u%S = 0, B.27) в котором коэффициент 6 называют коэффициентом затухания (или просто затуханием), а величину uq — собственной частотой осциллятора. Это та самая частота, с которой колебался бы осциллятор, если бы вязкое трение отсутствовало. Важно обратить внимание, что параметр S в уравнении B.27) имеет размерность с, т. е. совпадает с размерностью параметра с^о- Общность уравнений, описывающих поведение различных физических си- систем, подсказывает путь изучения этих систем, основанный на аналогиях. Параметры, входящие в уравнения B.24)-B.26) сведены в табл. 2.1. Таблица 2.1 Параметр Колеблющаяся величина S(t) Затухание S Собственная частота ujq Физический маятник Угол отклонения a(t) f3l2/BJ) л/mgljj Пружинный маятник Деформация пружины x(t) /3/Bт) Колебательный контур Заряд конденсатора «(*) R/BL) 1/y/LC Метод подобий позволяет заключить, что если параметры S и cjq в фи- физически различных системах, описываемых уравнением B.27), оказывают- оказываются одинаковыми, то одинаковы и закономерности поведения этих систем —
2.4. ЗАТУХАЮЩИЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 347 одинаков характер изменения величины S(t) (будь то заряд конденсатора, деформация пружины либо угол отклонения маятника). Каков вид функции S(t), удовлетворяющей уравнению B.27)? Мы убедим- убедимся далее, что затухающий процесс S(t) имеет качественно различный харак- характер в двух случаях: 1) 6 < ujq (это случай малого затухания) и 2) 6 > ujq — большое затухание. В случае, если выполняется равенство S = и>о, режим по- поведения осциллятора называется критическим. Итак, рассмотрим подробнее различные ситуации. Осциллятор с малым затуханием E < cjq). Качественно ясно, что процесс S(t) должен иметь вид, изображенный на рис. 2.6: колебания, размах которых («амплитуда» a(t)) постепенно уменьшается. Убедимся, что функция S(t) = Ae~st cos(ut + ф), B.28) где uj = у c^q — E2, является решением уравнения B.26) при произвольных значениях А и ср. Действительно, получаем из B.28): S = -ASe~st cos(u;t + ф) - Аше~6г sm(u;t + ф), S = AS2e~st cos(u;t + ф) +2Acu5e-6t sin(u;t + ф) - Auo2e~3t cos(u;t +ф). Подставляя функцию B.28), а также ее производ- производные B.29) в уравнение B.27), легко убедиться (упра- (упражнение для читателя), что уравнение обращается в тождество, т. е. функция B.28) действительно явля- является решением уравнения B.27). Это решение, за- зависящее от двух произвольных постоянных, являет- является (как доказывается в теории дифференциальных уравнений) общим решением, т. е. любое решение (при 6 < шо) может быть получено из B.28) при со- рис 2.6 ответствующем выборе констант А и ср. Исследуем подробнее структуру решения B.28). Функция S(t) представля- представляет собой произведение двух функций: гармонического колебания, частота которого ' B.30) меньше частоты uq того гармонического колебания, которое имел бы осцил- осциллятор без затухания, при 6 = 0, и функции a(t) = Ae~6t, B.31) которая описывает постепенное экспоненциальное уменьшение амплитуды колебания. Функция a(t) представляет собой закон амплитудной модуляции колебания B.28) (пунктирная кривая на рис. 2.6). Затухающий колебательный процесс не является в строгом смысле пери- периодическим. Действительно, рассмотрим момент времени ?п, когда cos(c<;tn + -\-ср) = 1 и следовательно S(tn) =a(tn) = Ae~5tn. Ясно, что при любом t>tn S(t) < S(tn), т. е. значение функции S(tn) не повторяется ни при каких t>tn. Ясно в то же время, что благодаря гармоническому множителю cos(c<;? + ф)
348 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ функция S(t) обладает определенной повторяемостью: в частности, повто- повторяются через равные промежутки времени как нулевые значения функции S(t), так и ее максимумы и минимумы (докажите это!). Значения амплитуды колебания в два момента времени tn ntn + T связаны соотношением a(tn) = Ae~5t» 6т a(tn + r) Ае-5^п+т) е ' При т = 1/5 имеем Фп) _ a(tn + г) т. е. амплитуда колебаний уменьшается в е раз через промежуток времени т = 1/5. Интервал времени т = 1/5 называют постоянной времени осциллятора. Это оценка времени, в течение которого продолжается процесс свободных колебаний осциллятора, выведенного из положения равновесия. Разумеется, по истечении времени г колебания продолжаются, но амплитуда, спадая по экспоненциальному закону B.31), становится столь малой, что практически можно полагать, что колебания прекратились (скажем, через время т = 5/5 амплитуда падает более чем в 100 раз). Рассмотрим теперь два момента времени tn и tn + Т, разделенных проме- промежутком времени Т = 2тг/сс;, равным периоду колебания (см. рис. 2.6). Тогда получаем: или d = \n(an/an+1) = 6T. B.32) Параметр d (логарифм отношения амплитуд при двух последовательных отклонениях осциллятора от положения равновесия) называется логариф- логарифмическим декрементом затухания. Он показывает, на сколько изменяется амплитуда колебаний за 1 период. Например, при d = 0,01 амплитуда ко- колебаний изменяется за 1 период приблизительно на 1% (убедитесь в этом, используя определение B.32)). Пусть N — число колебаний функции B.28) после которых амплитуда уменьшается в е раз. Тогда г = NT или, исполь- зуя B.32): d = 6T = Т/т = 1/JV, B.33) т. е. логарифмический декремент есть величина, обратная числу колебаний, в течение которых амплитуда уменьшается в е раз. В приведенном выше примере (при d = 0,01) проходит N = 100 колебаний прежде, чем амплитуда уменьшится в е раз. При исследовании осцилляторов интерес представляет как абсолютная скорость затухания свободных затухающих колебаний, характеризуемая по- постоянной времени т = 1/5 и измеряемая в секундах, так и относительная скорость затухания, характеризуемая параметром N = 1/d (и измеряемая числом колебаний, совершаемых осциллятором за время затухания). Введем еще один параметр, которым принято характеризовать затухаю- затухающий гармонический осциллятор. Величина Q, определяемая равенством Q = n/d B.34)
2.4. ЗАТУХАЮЩИЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 349 называется добротностью осциллятора. Используя B.33), получаем: Q = тг /ST = nN. Величина Q, как и с/, является характеристикой относительной скорости за- затухания колебательного процесса: чем больше добротность, тем большее чи- число колебаний совершает свободный осциллятор, прежде чем его колебания заметно затухают (амплитуда уменьшается в «е» раз). Ниже мы выясним энергетический смысл понятия добротности. Рассмотрим энергетические превращения при затухающих коле- колебаниях груза, колеблющегося на пружине. Вновь вернемся к уравне- уравнению колебаний (второй закон Ньютона): тх + кх = —/Зх, B.35) где слагаемое в правой части FTp = —(Зх — сила вязкого трения, пропорци- пропорциональная скорости. Домножив обе части уравнения B.35) на х: mix + кхх = — (Зх2, преобразуем последнее равенство к виду ^ f —j^- + Щ- 1 = — (Зх2 или B.36) Левая часть равенства — изменение полной энергии колебаний, суммы ки- кинетической энергии груза тх2/2 и потенциальной энергии деформированной пружины кх2/2. Правая часть равенства — произведение силы трения FTp = — (Зх на пере- перемещение dx = х dt — представляет собой работу силы трения dATp = FTp dx. Эта работа отрицательна, поскольку направления силы и перемещения dx имеют разные знаки в любой момент времени. Таким образом, равенст- равенство B.36) описывает энергетические превращения при колебаниях пружин- пружинного маятника. Полная энергия колебаний Е уменьшается за счет работы силы трения: dE = -(Зх2 dt. B.37) Проинтегрируем обе части равенства B.37) за период колебания. В ле- левой части в результате интегрирования получаем полное изменение энергии колебаний АЕ (убыль энергии) за период Ъ-\-1 I t+T dE = E(t + Т) - E(t) = -АЕ. B.38) t Интеграл в правой части (работа силы трения за период колебания) dt
350 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ преобразуем следующим образом: ( t+T -2 \ ™" B.39) В скобках в правой части — средняя за период колебаний кинетическая энергия (?^кин)- При малом затухании 8 ^ uq можно считать, что средняя за период кинетическая энергия равна средней потенциальной энергии (Еиот), а полная энергия Eq есть их сумма, т. е. вдвое больше средней кинетической энергии (как и для осциллятора без затухания). Тогда получаем из B.38) и B.39) АЕ = ((ЗТ/т)Е0, или (т. к. C/т = 28, где 8 — коэффициент затухания) Е0/АЕ = т/рТ = 1/B8Т) = Q/Btt). B.40) Итак, отношение средней энергии колебаний к потерям энергии за период равно добротности осциллятора (с множителем 1/2тг). Исследуем энергетические превращения в колебательном конту- контуре. Перепишем уравнение, определяющее процесс колебания в контуре (за- (закон Ома для замкнутой цепи, содержащей индуктивность, емкость и омиче- омическое сопротивление) в виде Lq + q/C = —Rq. Домножив последнее равенство на д, получим Lqq + qq/C = -Rq2 ИЛИ А / Т л2 J\ = -Rq2. B.41) В левой части B.41) — производная по времени от полной энергии кон- контура (суммы магнитной энергии катушки индуктивности и электрической энергии конденсатора). В правой части — мощность джоулевых потерь. Итак: убыль полной энер- энергии контура в единицу времени равна мощности джоулевых потерь — коли- количеству тепла, выделяющемуся на омическом сопротивлении. Интегрирование B.41) за время одного периода (от t до t + T) дает в левой части равенства изменение полной энергии за период АЕ. Интеграл в правой части (джоулевы потери за период) запишем в виде Выражение в скобках — среднее за период значение магнитной энергии (Ем), равной (при малом затухании) половине полной энергии Eq. Поэтому АЕ = (RT/L)E0 = 25ТЕ0. Вновь получаем (как и для пружинного маятника) Ео/АЕ = Q/Btt), B.42) где Q = тг/ST — добротность колебательного контура.
2.4. ЗАТУХАЮЩИЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 351 Мы рассмотрели лишь два примера, но вывод, заключенный в равенстве B.42), является общим для любого осциллятора с затуханием. Добротность осциллятора есть (с точностью до множителя 2тг) отношение полной энер- энергии колебаний к потерям энергии за период. Соотношение B.42) можно счи- считать определением понятия добротности осциллятора. Осциллятор с большим затуханием (S > ujq). Обратите внимание, что функция ?(?), описываемая формулой B.28), не имеет в этом случае ясно- ясного физического смысла: ведь частота ш = л/uJq — б2 становится при 6 > ujq мнимым числом. Итак, прежнее решение, имеющее вид затухающего коле- колебательного процесса, теперь не годится. Напомним, что в теории дифференциальных уравнений предлагается сле- следующий способ решения. Поставим в соответствие уравнению B.27) алге- алгебраическое уравнение: А2 + 26Х + ш$ = 0 (это уравнение называется харак- характеристическим). Его корни ' B.43) действительные (при S > с^о), причем оба корня отрицательны. Общее реше- решение уравнения B.27) имеет вид S(t) = AeXlt + BeX2t. B.44) Непосредственной подстановкой легко убедиться, что функция B.44) дей- действительно является решением уравнения B.27) при произвольных значе- значениях констант А л В. Эти две константы могут быть найдены, если заданы два начальных усло- условия (например, функция S(t) и ее производная S(t) при t = 0). Итак, решение представляется в виде суммы двух монотонно убывающих экспоненциальных функций (поскольку оба показателя экспонент Ai и А2 отрицательны). Ясно, что их сумма не может привести к затухающему ко- колебательному решению (т. е. функция S(t) не может, бесконечное число раз изменяя знак, проходить через положение рав- равновесия). Действительно, пусть, например, |Ai| > > |А2|. Очевидно, что каковы бы ни были началь- начальные условия, при достаточно большом t будет выполнено условие \Bex<2t\ ^> |AeAlt| и решение приближенно (при больших t) будет иметь вид 5@) S(t) ~ Bex<2t, т. е. монотонно убывающее решение. Можно показать, что система стремится к по- рис 2 7 ложению равновесия, совершив не более одного- двух (в зависимости от начальных условий) колебательных движений. Та- Такой процесс называется апериодическим. На рис. 2.7 приведен пример про- процесса S(t), представляющего собой сумму двух затухающих экспонент AeXlt и BeX2t (пунктирные кривые). В критическом случае S = uq получаем два равных корня характеристи- характеристического уравнения л V ~ Ае
352 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ В этом случае общее решение уравнения B.27) имеет вид S(t) = (A + Bt)e~6t B.45) (проверьте непосредственной подстановкой в B.27), что функция B.45) явля- является решением при произвольных А л В). Фазовая плоскость затухающего осциллятора. Напомним, что гар- гармонический колебательный процесс на фазовой плоскости (S — ось абс- абсцисс, S — ось ординат) изображается эллипсом, причем полуоси эллипса определяются амплитудой колебания (см. формулу A.10) и рис. 1.5). Качественно ясно, что траек- траектория, изображающая затухающий колебательный про- процесс B.28), должна иметь вид скручивающейся спирали (рис. 2.8). Действительно, поскольку амплитуда колебания B.28) a(t) = Ae~6t постепенно уменьшается, изображающая точка переходит со временем с одного эллипса (отвечающе- го гармоническому колебанию с определенной амплитудой) на другой эллипс (отвечающий гармоническому колебанию с меньшей ам- амплитудой) . Шаг спирали М Аа = ап- ап+1 = Ae~6t - Ае~6^т^ = Ae~6t (l - е~6т^ . Для осциллятора с малым затуханием ST <С 1, поэтому получим, разлагая экспоненту е~5т в ряд е~5т « 1 — ST: Аа = Ae~5td = a(t)d. Следует обратить внимание, что скручивание спирали (шаг Да) определяется ло- логарифмическим декрементом затухания, причем с ростом вре- времени t изображающая точка перемещается на все более мелкие витки спирали, расстояние между которыми Аа экспоненци- экспоненциально уменьшается. Для осциллятора с большим затуханием S > uq характер фа- _ ^ ^ зовых траекторий оказывается иным. Рис. 2.9 Jjr о п Как видно из рис. z.y, начиная с некоторого момента време- времени (когда изображающая точка находится в положении М) приближение осциллятора к положению равновесия становится монотонным. 2.5. Связанные осцилляторы До сих пор мы рассматривали колебательные системы, состояние которых описывается одной переменной (например, угол отклонения маятника от положения равновесия а(?), заряд конденсатора в LC контуре q(t) и т. д.). Сейчас мы рассмотрим системы с двумя степенями свободы: состояние таких систем описывается двумя переменными. На рис. 2.10 а изображены два осциллятора — два маятника, связанные пружиной жесткости к. На рис. 2.10 б — два пружинных маятника: тело мас- массы mi на пружине жесткости к\ и тело массы т2 на пружине жесткости &2, эти два осциллятора связаны пружиной жесткости к. В этих двух приме- примерах мы имеем в каждом случае два связанных осциллятора. Связь в обоих случаях осуществляется с помощью пружины к. Ее деформация в процес- процессе колебаний приводит к взаимному влиянию друг на друга колеблющихся
2.5. СВЯЗАННЫЕ ОСЦИЛЛЯТОРЫ 353 осцилляторов. На рис. 2.10 в — два связанных осциллятора совершенно иной физической природы: два LC контура, причем взаимное влияние ос- осцилляторов друг на друга осуществляется за счет взаимной индуктивности М катушек L\ и L2- k о га, о га 9 т9 О Рис. 2.10 Во всех приведенных примерах мы имеем системы с двумя степенями сво- свободы: для описания состояния каждой из них необходимо иметь две пере- переменные, например, углы oi\(t) и oi2{t) отклонения маятников на рис. 2.10 а, координаты тел x\(t) и ж2(?) на рис. 2.10 б', заряды конденсаторов qi(t) и #2(?) на рис. 2.10 в. Мы постараемся подметить общие закономерности по- поведения колебательных систем с двумя степенями свобо- свободы, рассмотрев конкретный пример. Пусть два маятника, связаны пружиной (рис. 2.11). Бу- Будем рассматривать малые колебания, так что sinai ~ а\ и sin «2 ~ а2. Пружина жесткости к закреплена на расстоянии h от точек подвеса О маятников, причем при а\ = «2 = 0 пру- рис 2 ц жина не деформирована. Уравнение движения (Ja = М) для первого маятника имеет вид 2 — ha\)h, B.46) где mil\ — момент инерции относительно оси Oi, — mgls'ma « mgla — момент силы тяжести, h{oi2 — oti) — деформация (удлинение) пружины, kh2(a2 — (^i) — момент упругой силы относительно той же оси. Аналогично, для второго маятника a2 — ai). B.47) B.48) где c^oi = y/g/h и <^02 = y/g/fa — собственные частоты каждого маятни- маятника (именно с такой частотой совершал бы гармонические колебания ка- каждый из маятников, если бы не было связи между ними), о\ = kh?/mil\, g\ = kh?/7712/2 — коэффициенты, описывающие взаимодействие маятников, обусловленное пружиной. В общем случае, как мы увидим позднее, колебания маятников a\(t) и а2(?) не являются гармоническими. Однако попробуем подобрать такие на- начальные условия, при которых оба маятника колеблются с одной и той же частотой, совершая гармонические колебания. Рассмотрим для простоты Уравнения B.46) и B.47) преобразуем к виду ai + cl&qi = -a{{pLi - a2) a2 + ^ \[ )
354 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ случай одинаковых осцилляторов c<;oi = ^02 — ^0 и имеем из B.48): — &2 = ст. Тогда мы О О9 4) = — О [OL2 — OL\). Легко сообразить, что если, отклонив одинаковые маятники на один и тот же угол в одну сторону, отпустить их (рис. 2.12), то пружина в процессе колебаний остается недеформированной (как и в положении равновесия), т. е. не оказывает никакого влияния на колеба- колебания маятников. Каждый из них будет колебаться с одной и той же частотой uq и a(t) = a\{t) = a^(?) = aocoscjot (где «о — начальный угол отклонения). То же самое ясно и из системы уравнений B.49): при ot\{t) = = a2(t) = a(t) правые части уравнений B.49) обращаются в нуль и для а\ и «2 имеем тождественные уравнения ^ = О, &2 + <^о^2 = 0. Решение, как мы знаем, — гармоническое колебание частоты uq. a\(t) = a2(t) = Acos(uj()t + ф)- Можно угадать и еще один возможный тип колебаний в системе, приводя- приводящий к простому гармоническому колебанию каждого из маятников с одной и той же частотой. Отклонив маятники на один и ,„}„„?,?>„, wlJl тот же Угол в противоположные стороны, отпустим их (рис. 2.13). Ясно, что одинаковые маятники будут качать- качаться таким образом, что в любой момент времени &\{t) — —OL2(t). Проверим нашу догадку, обратив- обратившись вновь к системе B.49). Подставляя в правую часть первого из уравне- уравнений (X2(t) = —«i(t), ПОЛуЧИМ Рис. 2.13 .. 2 _ 29 Аналогично, в правую часть второго из уравнений B.49) подставим B.50) Мы получаем систему двух независимых уравнений: ах + й2 + + a2)ai = 0 22 = 0. Из системы B.50) следует, что в рассматриваемом случае каждый из двух связанных осцилляторов совершает гармонические колебания с частотой (которая оказалась отличной от собственной частоты колебаний cjq каждого из маятников). Найденные нами типы колебаний связанных осцилляторов называются нормальными колебаниями или нормальными модами, или просто модами.
2.6. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 355 Итак, первый нормальный тип колебаний (или первая мода): оба маятника совершают гармонические колебания с частотой ш\ = ujq, имеют одну и ту же амплитуду и начальную фазу, т. е. (pi) причем В\ = А\. Второй тип колебаний (вторая мода): оба маятника совершают гармониче- гармонические колебания с частотой lo2 — лА^о ~^~ a2•> пРичем отклонения от положения равновесия в любой момент времени противоположны: a22(t) = B2cos(u;2t где В2 = -А2. Итак, каждая мода имеет свою собственную характерную частоту (и)\ = ujq для первой моды и ш2 = л/^о + т2 Для второй моды) и свою характерную форму, т. е. взаимное расположение колеблющихся осцилляторов в процессе колебаний. А каков характер колебаний связанных осцилляторов в самом общем случае? Можно показать, что в общем случае колебание системы представляет собой суперпозицию нормальных типов (мод), а именно ai(t) = Ах cos(cji* + (pi) + А2 cos(u;2t + (р2) a2(t) = B\ cos(ct;it + cp2) + B2cos(u;2t + ср2). Из шести констант (Ai, A2, Si, B2, (pi, cp2) две, как мы знаем, не являются независимыми: В\ = А\ и Б2 = — А2. Прочие же константы — А\, А2, ц>\ и ср2, определяются начальными усло- условиями: начальными углами отклонений маятников и их начальными скоро- скоростями. Напомним, что ц и^ — это найденные нами частоты собственных мод, т. е. частоты гармонических колебаний, которые можно возбудить в системе с помощью определенных начальных условий, о которых говорилось ранее. При произвольных же начальных условиях, как следует из B.53), коле- колебания осцилляторов не являются гармоническими (они представляют собой суперпозицию двух гармонических колебаний разных частот uji и и2). Для проверки справедливости нашего утверждения достаточно подставить функции ai(t) и a2(t) в уравнение B.49) и убедиться в том, что уравнение обращаются в тождество при любых А\, А2, (pi, (p2. 2.6. Вынужденные колебания гармонического осциллятора (гармоническая внешняя сила) Ранее мы изучали свободные колебания системы, выведенной из поло- положения равновесия и предоставленной после этого самой себе. Рассмотрим теперь колебательную систему, на которую действует внешняя сила, меня- меняющаяся во времени по гармоническому закону. Колебания, происходящие под действием внешней силы, называют вынужденными.
356 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ Рассмотрим пружинный маятник (рис. 2.3): на тело массы т кроме упру- упругой силы /уПр — —кх (это — внутренняя сила в колебательной системе) действует внешняя сила /(?) = fо cos ujt. Второй закон Ньютона имеет вид тх = —кх + /о cosc^t, и мы приходим к уравнению х + ouqX = A cos out, B.54) где А = /о/га, с^о = у/к/т. При наличии вязкого трения, пропорционального скорости, вместо B.54) получаем х + 2&с + и%х = A cos wt. B.55) На рис. 2.14 колебательная система другой физической природы: элек- электрический контур, содержащий катушку индуктивности L, конденсатор ем- емкости С и омическое сопротивление R. На этот раз кон- контур подключен к внешней э. д. с, меняющейся по закону ?{t) = ?q cos cot. Закон Ома для замкнутой цепи, изобра- изображенной на рисунке, имеет вид q/C + RI= -L(dl/dt) + ?{t). По сравнению с B.24) в последнем уравнении к э. д. с. индукции —L(d//d?), возникающей в катушке при изме- с. нении в ней тока, добавляется внешняя э. д. с. ?(t). Вновь учитывая, что I = q, приходим к уравнению q + 2Sq + uJ^q = A cos ut, B.56) где А = ?o/L и по-прежнему 6 = R/BL) и ujq = 1/y/LC. Получено уравнение, математически тождественное уравнению B.55). Для идеального контура (пренебрегая омическим сопротивлением) вместо B.56) имеем уравнение, аналогичное B.54): q + u%q = A cos cut. B.57) Как и ранее, независимо от физической природы осциллятора, будем обо- обозначать искомую переменную через S(t). Уравнение, описывающее процесс вынужденных колебаний осциллятора, находящегося под действием гармонической внешней силы, имеет вид S + 2SS + u)lS = A cos cut. B.58) В теории дифференциальных уравнений доказывается, что общее решение уравнения B.58), которое математики называют неоднородным, представля- представляет собой сумму общего решения однородного уравнения B.27) и некоторого «частного» решения неоднородного уравнения B.58): Общее решение однородного уравнения B.27) (т. е. уравнения с нулевой пра- правой частью) уже известно. Это решение есть не что иное, как процесс свобод- свободных колебаний осциллятора. В зависимости от соотношения параметров S и со»о? оно имеет вид либо B.28) при 6 < с^о, либо B.44) при 6 > ujq. Характер ко- колебательного процесса So(t) зависит от двух произвольных постоянных. Эти
2.6. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 357 постоянные определяются начальными условиями, т. е. способом, которым возбуждаются свободные колебания (начальным отклонением осциллятора от положения равновесия и его начальной скоростью). Но в любом случае, при наличии даже как угодно малого затухания (а в реальном осцилляторе затухание всегда имеет место) свободные колебания постепенно затухают и соответствующее решение So(t) стремится к нулю. Рано или поздно практически остается лишь второе слагаемое S(t) ~ Si(t). Именно это частное решение неоднородного уравнения и называют «выну- «вынужденными колебаниями», которые уже не зависят от начальных условий и определяются лишь внешней силой (ее амплитудой и частотой). Перейдем к комплексной записи: наряду с уравнением 51 + 2SSi + ^0^1 = а cos ut B.59) рассмотрим уравнение 52 + 25 S2 +u)lS2 = asino;t, B.60) а также уравнение g + 28g + u>lg = aeiu3t. B.61) Заметим, что правая часть уравнения B.61) является линейной комбина- комбинацией правых частей B.59) и B.60): elujt = cosc^t + isinc^t. Очевидно поэтому, что и решение B.61) — функция g(t) — является ана- аналогичной линейной комбинацией решений Si(t) и S2(?) g(t) = S1(t) + iS2(t). B.62) Это легко проверить, домножив левую и правую части B.60) на мнимую единицу г и сложив после этого левые и правые части B.59) и B.60), учтя при этом, что Si(t) + iS>2(t) = g(t) и Si + iS2 = g(t). Из сказанного ясно, что если будет найдено комплексное решение g(t) уравнения B.61), то искомое действительное решение — реальный процесс вынужденных колебаний Si (t) — есть просто реальная часть комплексной функции g(t) Si(t) =Reg(t). B.63) Решение же g(t) уравнения B.61) легко угадать. Будем искать это решение в виде g(t) = aHeiuj\ B.64) где Н = Ве1^ — некоторое неизвестное пока комплексное число, т. е. мы полагаем, что решение g(t) отличается от внешней силы (записанной в ком- комплексной форме aelujt) множителем Н = Ве1^. Действительно, уравнение B.61) является линейным, т. е. содержит неиз- неизвестную функцию и ее производные только в первой степени. В частности, над функцией g(t) в левой части B.61) выполняется лишь линейная опера- операция дифференцирования, которая оставляет неизменным вид экспоненци- экспоненциального множителя elujt ^ еш = шегш\ ^ еш = -ои2егш\ B.65) at dtz
358 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ Подставляя B.64) в B.61) и учитывая тождества B.65), находим -ш2аНеш + 26(гшаН)еш + ш%аНеш = аеш. Множитель aelujt содержится как в правой части последнего уравнения, так и в его левой части. После сокращения на этот множитель мы приходим к алгебраическому уравнению для определения Н, откуда получаем 1 B.66) Запись H(<jo) подчеркивает, что найденное нами комплексное число Н за- зависит от частоты ио вынуждающей силы. Предоставляем читателю самостоятельно показать, что модуль комплекс- комплексного числа Н{ш) есть |ЯИ| = В(ш) = 1 ^, B.67) j2 а его аргумент ф(ш) определяется формулой ф(ш) = arctg l Ш B.68) Итак, мы нашли комплексное решение уравнения B.61), имеющее вид g(t) = аВ{и>у№+^\ B.69) где В(ш) и ф(ш) определяются выражениями B.67) и B.68). Соответствующий реальный колебательный процесс Si(t) имеет вид: Si(t) = аВ(ш) cos (cut + ф{ш)) . B.70) Подчеркнем еще раз, что речь идет о гармоническом осцилляторе, т. е. о линейной колебательной системе (в которой сила, возвращающая осцилля- осциллятор в положение равновесия, прямо пропорциональна смещению). Мы полу- получили исключительной важности результат. Гармоническая внешняя сила частоты и возбуждает в осцилляторе вы- вынужденные колебания, которые происходят также по гармоническому за- закону и имеют ту же частоту ио. Функция В (и) B.67) определяет амплитуду вынужденных колебаний — ее зависимость от частоты внешней силы, ее называют амплитудной харак- характеристикой осциллятора, а функция ф(ш) B.68) дает сдвиг по фазе между вынужденными колебаниями и колебаниями внешней силы и называется фазовой характеристикой (или амплитудно-фазовой). Комплексную функцию Н(ио) = В(иоI^^ называют частотной характе- характеристикой. Исследуем подробнее полученные нами зависимости амплитуды вынуж- вынужденных колебаний и сдвига фазы от частоты внешней силы. В дальнейшем удобно, введя вместо константы а константу uq = a/c^Q, записать уравнение вынужденных колебаний B.59) в виде S + 2SS + cj^S = си^ао cos cut. B.71)
2.6. ВЫНУЖДЕННЫЕ КОЛЕБАНИЯ ГАРМОНИЧЕСКОГО ОСЦИЛЛЯТОРА 359 Фактически такая замена означает, что мы переходим к изучению колеба- колебаний величины ?, размерность которой совпадает с размерностью «внешней силы» clq cos uot. В частности, если речь идет о колебательном контуре, подключенном к внешней э. д. с. ?(t) = So cos ut, то в уравнении B.71) S(t) есть напряже- напряжение на конденсаторе. Если исследуются вынужденные колебания пружин- пружинного маятника, на который действует внешняя гармоническая сила /(?) = = aocosc<;t, то S(t) в B.71) — это величина kx(t), т. е. изменение упругой силы при колебаниях тела на пружине. (Предоставляем убедиться в этом читателю.) В этом случае вместо B.66) получим = а0- B.72) а зависимость амплитуды вынужденных колебаний от частоты ио внешней силы имеет вид В(ч>) = ^(и2-ш2J + 4д2ш2 B.73) Исследуем зависимость интенсивности колебаний (квадрата амплитуды) от частоты ш внешней силы. Из B.73): 'В\2_ Ц* ч и / V 0 / Разделив числитель и знаменатель на S2uJq и используя соотношение Q = = шо/28 (см. задачу 4), получаем ВА 0 Ti—77Т- () Q=i= Зависимость (B/uq) от частоты ш называ- называется резонансной характеристикой. Семей- Семейство резонансных характеристик для различ- различных значений Q показано на рис. 2.15. Обратим внимание на важную особенность резонансных характеристик. При и; = 0 име- имеем В = а. Это означает, что при постоянной внешней силе упругая сила просто равна ей и система остается в равновесии, а если речь идет о колебательном контуре, то при посто- постоянной внешней э. д. с. напряжение на конденсаторе равно э. д. с. колебаний нет. Напомним, что мы рассматриваем колебательную систему в то время, ко- когда переходный процесс, возникающий при включении внешней силы, уже закончился. При и; = uq (частота внешней силы совпадает с «собственной частотой» с^о колебательной системы) В = Qao, т. е. амплитуда вынужденных коле- колебаний в Q раз больше амплитуды «внешней силы». Совпадение частоты Рис. 2.15 никаких
360 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ внешней силы с собственной частотой ujq колебательной системы называют резонансом. Как видно из приведенных графиков, при этом амплитуда вынужденных колебаний максимальна, если речь идет о колебательной системе с большой добротностью Q ^> 1. Если Q невелико, то максимум амплитуды вынужден- вынужденных колебаний наступает при частоте и < uq. В общем случае, как видно из B.74), максимум отношения B/clq наступает, когда минимален знаменатель дроби. Найдем минимум знаменателя, приравняв нулю его производную по ш2 откуда . / 1 \ B.75) Последнее выражение и определяет частоту внешней силы, при которой амплитуда вынужденных колебаний максимальна. Величина максимальной амплитуды равна В — а,, B 76"! л/1 — 1/ DQ2) (эта величина больше, чем на частоте и; = с^о, когда амплитуда вынужден- вынужденных колебаний равна uqQ). Итак, в общем случае максимум амплитуды приходится на частоту о;, не- несколько меньшую ujq, однако при Q ^> 1 мы имеем из B.75) и B.76) уже от- отмеченный результат: максимальная амплитуда, равная clqQ, наступает при Наконец, рассмотрим вопрос об остроте резонансной кривой колебатель- колебательной системы с большой добротностью. Итак, при каком отклонении частоты от значения и = uq амплитуда вынужденных колебаний заметно уменьша- уменьшается (скажем в V2 раз). Как видно из B.74), это происходит при откуда находим 20V 0 С точностью до членов порядка 1/Q2 (ои\2 1 / 1 — = 1 =Ь —— или uj = cjq 1 =Ь —— \cooj 2Q V 2Q и мы получаем Аш = ш -шо = ±u;q/BQ) = ±5. Полученное нами выражение представляет собой полуширину резонанс- резонансной кривой на уровне 1/у2. Итак, полуширина кривой равна величине затухания S.
2.7. СПЕКТРАЛЬНЫЙ АНАЛИЗ ЛИНЕЙНЫХ КОЛЕБАТЕЛЬНЫХ СИСТЕМ 361 Заметим наконец, что при ш —>• оо амплитуда вынужденных колебаний стремится к нулю. Выражение для фазовой характеристики B.52) можно переписать в виде 1 ф = arctg - Q 1 — B.77) Эта зависимость для разных значений Q показана на рис. 2.16. Следует обратить внимание, что с ростом добротности фаза ф меняется все круче вблизи резонансной часто- частоты, изменяясь от значения ф « 0 при и; < cjq до значе- значения ф « тг при cj > с^о, т. е. если колебательная систе- система имеет высокую добротность, то при частотах и; < uq вынужденные колебания происходят практически син- фазно с колебаниями внешней силы, а при ш > ujq — в противофазе с колебаниями внешней силы. Рис. 2.16 2.7. Спектральный анализ линейных колебательных систем Рассмотрим более общую задачу: колебания гармонического осциллятора возбуждаются внешней силой, меняющейся во времени по произвольному закону /(?). Вместо уравнения B.71) имеем в этом случае Q I О Я Q I , ,2 С / .2 ? (л\ /о '7Q^ D ~г ZOO ~г u>q D — UUQ J [Ъ j . yZi. I ОJ Отличие B.78) от B.71) состоит в том, что в правой части последнего уравнения вместо гармонической внешней силы uq cos uit — произвольное воздействие f(t). Гармонический осциллятор является примером линейной колебательной системы, т. е. системы, колебания в которой подчиняются линейному урав- уравнению (напомним, уравнение линейно, если искомая функция S(t) и ее про- производные входят в уравнение только в первой степени). Другие примеры линейных систем показаны на рис. 2.17. S(t) Рис. 2.17 На рис. 2.17 а изображена RC цепочка, колебания в которой возбуждаются внешней э. д. с. f(t). Искомой функцией является изменение напряжения на конденсаторе S(t). На рис. 2.17 ^показана RL цепочка. Ищется закон изменения напряжения на сопротивлении. На рис. 2.17 в — простой механический пример: движение тела массы т под действием внешней силы, меняющейся во времени по закону /(?), тело движется в среде с вязким трением (сила трения пропорциональна скорости FTp = -fix).
362 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ Упражнение для читателя: покажите, что уравнение, которому подчиня- подчиняется поведение систем, изображенных на рисунке, имеет вид: где т = RC — в первом примере, т = L/R — во втором примере, т = га//? — в третьем примере. Во всех случаях получаются идентичные линейные уравнения. При изучении общих свойств линейных систем (фильтров) обычно не ин- интересуются их конкретным устройством. Систему изображают в виде блок- схемы (рис. 2.18). Внешнее воздействие /(?) называется «входным сигналом» фильтра, а искомая зависимость S(t) — выходным сигна- сигналом (или откликом) фильтра. Квадратик представляет собой некоторое устройство, пре- Рис. 2.18 обаразующее входной сигнал /(?) в выходной сигнал S(t). Тот факт, что S(t) является откликом на внешнее воздей- воздействие /(?), будем записывать в виде операторного равенства S(t) = L [/(?)]. (В результате действия некоторого линейного оператора L на входной сиг- сигнал /(?) получаем сигнал на выходе S(t).) Фундаментальное свойство всех линейных систем (независимо от их кон- конкретного устройства) состоит в следующем: результат нескольких одновре- одновременных воздействий можно найти, суммируя результаты, к которым приво- приводит каждое отдельное воздействие. Убедимся в этом на примере гармонического осциллятора. Пусть внешняя сила описывается функцией /i(t). Возникающий при этом процесс колеба- колебаний — функцией Si (t). Мы имеем уравнение & + 2<5Si + wjfci = to20h(t), B.79) что символически запишем в виде L [fi(t)] = Si(t). Аналогично, при внешнем воздействии f2(t) колебания осциллятора опи- описываются функцией S2 (t), подчиняющейся уравнению S2 + 25 S2 + ulS2 = Ц)/2(<) B.80) или L[f2(t)] = S2(t). Как колеблется осциллятор, если внешняя сила изменяется по закону t), B.81) где ci ИС2 — произвольные постоянные? Искомый процесс вынужденных колебаний S(t) описывается уравнением S + 26S + u%S = loI (ci/i(t) + c2f2(t)). B.82) Домножив левые и правые части B.79) и B.80) соответственно на ci и с2 и сложив их, убеждаемся, что искомая функция S(t) может быть представлена в виде = c1S1(t)+c2S2(t). B.83)
2.7. СПЕКТРАЛЬНЫЙ АНАЛИЗ ЛИНЕЙНЫХ КОЛЕБАТЕЛЬНЫХ СИСТЕМ 363 Обобщая сказанное выше на произвольную линейную систему, приходим к операторному равенству L [ci5i(<) + c2S2(t)} = ClL [h(t)} + c2L [f2(t)}. B.84) Итак, отклик линейной системы на линейную комбинацию внешних воз- воздействий равен линейной комбинации откликов на каждое отдельное воз- воздействие. Можно обобщить B.84), рассматривая произвольную линейную суперпо- суперпозицию сил вида: Тогда вместо B.84) имеем: S(t)=L [/(*)] = Y, c*i [/*(*)]• B-86) Сказанное выше подсказывает путь решения общей задачи изучения ко- колебаний линейной системы под действием произвольной внешней силы / (?). Целесообразно представить эту силу в виде суммы некоторых элементар- элементарных слагаемых — элементарных «кирпичиков»: 71 = 1 (в общем случае сумма может быть бесконечной). Затем найти отклик Sn(t) системы на каждое отдельное слагаемое fn(t) Sn(t) = L[fn(t)}. Наконец, записать искомый процесс вынужденных колебаний в виде ли- линейной суперпозиции откликов Мы описали суть спектрального подхода к исследованию линейных систем. Разумеется, выбор «базиса» — fn(t) — тех элементарных «кирпичиков», из которых мы складываем «здание» заданной внешней силы /(?), неод- неоднозначен. Это — вопрос физической целесообразности, он зависит от того, насколько просто можно найти реакцию системы на каждое отдельное слага- слагаемое. Мы исследуем сейчас поведение линейных стационарных систем (т. е. линейных систем, свойства которых не меняются со временем: например, ко- колебательный контур с постоянными L, С, R или маятник неизменной длины и массы). По отношению к таким системам особую роль играют гармониче- гармонические функции (записанные в комплексной форме) elujt. Рассматривая гармонический осциллятор, мы убедились в том, что гар- гармоническая внешняя сила /(?) = eiujt возбуждает колебания осциллятора, происходящие также по гармоническому закону с той же частотой ш. Символически этот результат можно записать в виде равенства L [еш] = Н(ш)еш B.87) и изобразить в виде блок-схемы (рис. 2.19).
364 ГЛ. 2. КОЛЕБАНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ Напомним: запись B.87) означает, что отклик линейной системы L на входной сигнал elujt есть H(<jo)elujt. Множитель H(<jo) зависит от свойств линейной системы и называется ча- частотной характеристикой системы (мы нашли ее ранее для гармонического ш ш осциллятора — см. формулу B.72)). (Упражнение для — J ^ I Н\®)'е „ читателя: найти частотную характеристику систем, по- р 9 1Q казанных на рис. 2.17.) Используя математическую терминологию, можно сказать, что гармонические функции elut являются собственными функ- функциями оператора L. Этот факт и отражает равенство B.87). Гармониче- Гармоническая функция eiujt преобразуется оператором в гармоническую же функцию H(cj)eiujt (множитель H(lo) математики называют собственным значением, отвечающим собственной функции elujt). Еще раз подчеркнем, что частота и в равенстве B.87) может быть лю- любой, при любых значениях ио равенство B.87) справедливо, — и каждому значению и отвечает число Н{ш) — соответствующее собственное значение. Оказывается, что гармонические функции eiujt (при любом ш) обладают двумя важнейшими математическими свойствами. Во-первых, эти функции ортогональны. Смысл этого понятия состоит в том, что функция elujt при данном, фиксированном значении ио не может быть получена сложением гармонических функций eiuj f любых других частот uJ ф о;, какие бы коэф- коэффициенты а(ио) мы не пытались подобрать. Можно сказать, что функция elujt не имеет «проекции» на какую-либо другую функцию eiuj t с uJ ф ш. Второе важнейшее свойство — полнота: любую функцию /(?) можно представить единственным образом в виде суммы гармонических функций. Об этом мы уже говорили ранее. Все сказанное позволяет утверждать, что в качестве базиса — элементар- элементарных слагаемых, из которых целесообразно складывать произвольное внеш- внешнее воздействие (если речь идет о стационарных линейных системах) — удобно использовать гармонические функции, т. е. использовать разложе- разложения вида A.39) или A.43). Ясен теперь путь решения общей задачи — возбуждение вынужденных колебаний в линейной системе произвольной внешней силой. Первый шаг — представление внешней силы в виде суммы гармонических колебаний (либо в виде дискретной суммы — ряда Фурье, либо в виде интеграла Фурье): № = Y, cketuJkt или f{t) = -^ Второй шаг — нахождение частотной характеристики Н(ш) колебательной системы. Далее, поскольку мы знаем, что отдельные гармоники c^eiut возбуждают в системе колебания Н{ио^)с^егик1', то суммарная внешняя сила /(?) возбу- возбуждает колебание вида B.88)
ЗАДАЧИ 365 Или, в случае непрерывного спектра С (о;), S(t) = f C(uo)H(uo)eiujtduo. B.89) Процесс вынужденных колебаний S(t) (как и любой процесс) можно пред- представить либо в виде суммы гармонических колебаний S{t) = Y,bkeiWk\ B.90) либо в виде непрерывной суммы (интеграла Фурье) S(t) = Г В(ш)ешAш. B.91) Из сравнения B.88) и B.90) следует, что bk = ckH(cvk), B.92) а из сравнения B.89) и B.91): В {и) = С{и))Н{ш). B.93) Равенства B.92) и B.93) позволяют найти спектр вынужденных колеба- колебаний, т. е. либо набор коэффициентов Ъ^ (в дискретном случае), либо не- непрерывный спектр В(ш), если известен спектр внешней силы и частотная характеристика колебательной системы. Задачи 1. Вывести закон сохранения энергии для упругого маятника. Найти зависимость от времени кинетической и потенциальной энергии. 2. Выразить добротность колебательного контура с малым затуханием через его пара- параметры L, С и R. 3. Решить аналогичную задачу для пружинного маятника с параметрами т, /с и а. 4. Покажите, что добротность осциллятора выражается через параметры ujq и 6 с по- помощью равенства Q = иоо/26. 5. Определите добротность колебательной системы, осциллограмма колебания которой показана на рис. 1.7 а. 6. Используя B.77), докажите, что при S > <х>о/л/2 отклонение осциллятора от поло- положения равновесия, вызванное постоянной силой, равной ао, больше, чем амплитуда вы- вынужденных колебаний под действием гармонической силы f(t) = aocoscjt при любом и, при этом амплитуда вынужденных колебаний монотонно уменьшается с ростом частоты вынуждающей силы (что означает отсутствие резонанса). 7. Каков диапазон изменения коэффициента затухания S, при котором собственное дви- движение осциллятора имеет колебательный характер, а вынужденное колебание не имеет резонанса. Ответ: о;о/л/2 < S < ujq.
ГЛАВА 3 ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР. АВТОКОЛЕБАНИЯ 3.1. Параметрические колебания Выше мы рассмотрели вынужденные колебания осциллятора, возбуждае- возбуждаемые меняющейся во времени внешней силой (внешней э. д. с, включенной в контур L, С, i?, либо силой, приложенной к маятнику). Внешнее воздействие на осциллятор может иметь, однако, совершенно иной характер и сводиться к периодическому изменению со временем параметров самой колебательной системы (например, к изменению индуктивности колебательного контура либо длины маятника). Возбужденные таким образом колебания называют- называются параметрическими, а сам механизм возбуждения — параметрическим резонансом. Прежде всего, попытаемся ответить на вопрос: можно ли раскачать уже имеющиеся в системе малые колебания, периодически изменяя определен- определенным образом какой-либо ее параметр. В качестве примера рассмотрим ко- колебательный контур, в котором происходят малые свободные колебания. Изменения тока в его цепи происходят по гармониче- гармоническому закону и показаны на рисунке. Пусть внешнее воздействие сводится к изменению в определенные моменты времени индуктивности контура. Закон, по которому происходит изменение индук- индуктивности, показан на рис. 3.1: в моменты, когда ток в катушке индуктивности принимает максимальное значение /тах (моменты t\ и ?3), индуктивность скач- скачком уменьшается на малую величину AL, а в момен- моменты, когда ток равен нулю, индуктивность скачком восстанавливается до прежнего значения L (момен- (моменты #2 и ?4). Изменения AL будем полагать малыми (A) () Заметим, что при скачкообразном изменении индуктивности (время т, в течение которого происходит изменение L, мало в сравнении с периодом сво- свободных колебаний) магнитный поток в катушке сохраняется. В противном случае, если бы поток Ф изменялся на конечную величину АФ за очень ма- малое время т, в катушке возникала бы э. д. с. индукции ?инд = —АФ/т —>> оо, что приводило бы к бесконечно большим токам в контуре. Учитывая это обстоятельство, легко подсчитать изменение энергии контура AW (энергии катушки индуктивности) при скачкообразных изменениях индуктивности: AW = A {LI2/2) = А (Ф2/2?) = - (Ф2/2?2) AL, где Ф = Ы = const за время т.
3.1. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ 367 Окончательное выражение для AW запишем в виде AW = - (/2/2) AL. C.1) Скачкообразное уменьшение индуктивности (AL < 0) происходит в момен- моменты времени, когда / = 1тгх. При этом в контур вносится энергия (AW > 0), равная А^ = (/Lx/2) |AL|. C.2) Эта энергия черпается из внешнего источника: быстро уменьшить индук- индуктивность можно, например, быстро увеличив длину катушки — растягивая ее, либо быстро извлекая из катушки железный сердечник. В любом случае для этого следует совершить работу: витки катушки притягиваются между собой амперовой силой, железный сердечник втягивается внутрь катушки. Итак, уменьшая индуктивность, мы совершаем работу, которая и идет на увеличение энергии контура, т. е. на раскачку колебаний. Скачкообразное увеличение индуктивности мы производим в моменты времени, когда ток в катушке равен нулю (моменты #2 и ^4 на графике). При этом, согласно C.1), AW = 0; энергия не меняется, поскольку изменение индуктивности в этом случае происходит без совершения работы. Поскольку подкачку энергии мы производим дважды за период, то полное увеличение энергии за период колебания равно AW = il^AL. C.3) С другой стороны, в процессе колебаний энергия расходуется на джоулево тепло. Джоулевы потери за период WT = где Р — среднее значение квадрата тока за период, которое связано с мак- максимальным значением /тах известным соотношением Р = /^ах/2 (последнее справедливо, если контур обладает малым затуханием). Итак WT = ^^Т. C.4) Zl Условие параметрической раскачки колебаний — превышение подводимой энергии над потерями AW^WT. С учетом C.3) и C.4) получаем AL>RT/2. Последнее неравенство можно записать в виде AL/L > (R/2L)T = 6T = тг/Q. C.5) В последнем равенстве Q — добротность колебательной системы. Если под- подкачку энергии осуществлять один раз за период, то для раскачки колебаний нужны вдвое большие относительные изменения индуктивности AL/L. Аналогичным образом можно рассмотреть параметрическую раскачку ко- колебаний маятника. Раскачиваясь на качелях (сгибая и выпрямляя ноги), мы по существу изменяем длину маятника. Подумайте, каковы оптимальные моменты времени, в которые следует изменять длину маятника. Считая добротность маятника заданной, выве- выведите условие параметрической раскачки его колебаний, аналогичное усло- условию C.5). При выполнении неравенства C.5) подводимая к колебательному контуру энергия превышает потери — амплитуда колебаний постепенно нарастает,
368 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР т. е. имеет место параметрическое усиление колебаний. Естественно воз- возникает вопрос: почему амплитуда не нарастает до бесконечности? Дело в том, что рано или поздно нарушается одно из важнейших условий, кото- которые мы приняли при выводе уравнения, описывающего процесс колебаний, а именно, независимость параметров системы от амплитуды колебаний. В частности, омическое сопротивление контура R мы полагали неизменным, не зависящим от величины протекающего тока. При достаточно больших то- токах это условие нарушается: сопротивление R нарастает, поскольку растет температура. Итак, если R становится зависящим от вели- величины протекающего тока / = /(i?), уравнение, описываю- описывающее процесс колебаний, становится нелинейным. Рост сопротивления при больших токах приводит к на- нарушению неравенства C.5). Рано или поздно наступает ста- стационарный режим колебаний, при котором подводимая энергия в точности компенсируется джоулевыми потерями. Фазовая траектория при установившемся, стационарном ре- режиме колебаний показана на рис. 3.2: ток в катушке индук- Рис. 3.2 тивности q дважды за период скачкообразно нарастает в моменты скачкообразного уменьшения индуктивности (по- (поток Ф = Ы сохраняется!). Сделав полный оборот по фазовой траектории, изображающая точка попадает в ту же начальную точку на плоскости (g, q) (т. е. значения q ж q через период колебаний восстанавливаются). Мы рассматривали вопрос параметрической раскачки уже имеющихся ма- малых колебаний. Но почему вообще возникают колебания? Ведь вначале ма- маятник или колебательный контур находятся в покое. Откуда берется эта «начальная затравка»? Здесь принципиальную роль играют флуктуации. В частности, тепловое хаотическое движение зарядов в колебательном конту- контуре приводит к хаотическим малым колебаниям, которые всегда существуют в контуре — это и есть та «затравка», которая далее параметрически рас- раскачивается до наступления стационарного режима. Отметим в заключение, что параметрические методы используются не только в механических или электрических системах. В настоящее время подобные методы используются даже для генерации световых колебаний (параметрические лазеры). 3.2. Ангармонический осциллятор До сих пор мы изучали поведение колебательных систем, совершающих малые колебания; мы рассматривали малые отклонения системы от положе- положения равновесия, когда «силу», возвращающую систему к положению равно- равновесия, можно приближенно считать пропорциональной величине смещения (т. е. линейно связанной со смещением). При этом уравнение, описывающее колебательную систему, является линейным, колебание — гармоническим, а период колебаний не зависит от амплитуды (это свойство гармонического осциллятора называют изохронностью). В случае немалого отклонения от положения равновесия уравнение, опи- описывающее процесс колебаний, оказывается в общем случае нелинейным, колебательный процесс уже не является гармоническим, а система теряет свойство изохронности: период колебаний оказывается зависящим от ампли- амплитуды (т. е. от величины начального отклонения и (или) начальной скорости).
3.2. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР 369 Рассмотрим в качестве примера математический маятник. Если угол от- отклонения маятника от положения равновесия не полагать малым, то урав- уравнение, описывающее процесс колебания, нелинейно (см. § 2.1): а + = 0. C.6) Исследование нелинейных систем (и, в частности, системы, описываемой уравнением C.6)) представляет собой чрезвычайно сложную математиче- математическую проблему, которая далеко выходит за рамки этой книги. Мы рассмо- рассмотрим, не прибегая к сложным математическим методам, лишь одну пробле- проблему: зависимость периода колебаний от амплитуды. При этом мы ограничим- ограничимся приближением sin а « а — а3/6, C.7) учтя лишь первую поправку к выражению sin a ~ а (которое приводит к уравнению гармонического осциллятора и независимости периода колеба- колебаний от амплитуды). Понятно, что учет слагаемого —а3/6 приводит к уменьшению величины возвращающей силы: /(«) =тд(а — а3/6) по сравнению с линейной зависи- зависимостью /(су) = тда\ следовательно к уменьшению ускорения и скорости, а значит — к росту периода колебаний при увеличении ам- амплитуды. Пусть максимальное отклонение маятника от положе- положения равновесия (амплитуда колебаний) равна а$. Из за- закона сохранения энергии ,,2 = тдАН mv (см. рис. 3.3) находим скорость маятника в момент, когда его отклонение равно а: i. v = , где АН = Н0-Н = 21 (sin2(a0/2) - sin2(a/2)) . C.8) Если за время dt угол поворота маятника равен da, а длина пройденного за это время пути dx = / da, то dt = dx/v = / da/v или, используя C.8) 1 // da dt = -a -=====. 2 у 9 v/sm2(a0/2) - sin2(a/2) C.9) Интегрирование этого выражения в пределах от 0 до а дает четверть пе- периода колебаний Т/4, поэтому da sin2(a0/2) -sin2(a/2) При использовании линейного приближения sin a « а мы получили бы 1 = 4W- о
370 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР где у = a/aQ. Нет надобности вычислять этот интеграл: результат изве- известен — ведь линейное приближение приводит к уравнению гармонического осциллятора, период колебаний которого Tq = 2тгу/1/д, поэтому dy 7Г 2' C.10) Не приводя подробных (хотя и очевидных) преобразований, запишем вы- выражение для периода Т, которое получается при использовании приближе- приближения C.7) (т. е. первой нелинейной поправки) Первое слагаемое — это период колебаний гармонического осциллятора (т. е. период малых колебаний маятника). Второе слагаемое — поправка, приводящая к увеличению периода, если амплитуда не слишком мала. Относительная величина поправки AT/Tq равна C.11) Важно подчеркнуть, что поправка пропорциональна квадрату амплитуды колебаний. Мы не будем вычислять интеграл, входящий в оценку C.11). Очевидно, что подынтегральная функция в C.11) ни при каком у не превышает по- подынтегральную функцию в C.10) более чем вдвое (на интервале от нуля до единицы), поэтому и величина интеграла менее чем вдвое отличается от тг/2, т. е. AT/Tq < с^(тг/24). Более точные вычисления приводят к оценке AT/Tq ~ Рис. 3.4 Подобная ситуация возникает и в пру- пружинном маятнике, если жесткость пружи- пружины уменьшается при увеличении деформа- деформации. График на рис. 3.4 а соответствует именно этому случаю: жесткость пружи- пружины к = |d//dx| уменьшается с ростом х (такую характеристику принято называть мягкой). В случае жесткой характеристики (на рис. 3.4 б) k = df/dx ра- растет при увеличении деформации — в этом случае рост амплитуды приводит к уменьшению периода колебаний. Колебательный контур, в катушку индуктивности которого вставлен же- железный сердечник, также представляет собой ангармонический осциллятор: при больших амплитудах (большом токе через катушку) индуктивность L начинает зависеть от величины тока, при этом магнитный поток через ка- катушку Ф = L(I)I уже не является линейной функцией величины тока.
3.3. АВТОКОЛЕБАНИЯ 371 Отклонение от линейности обычно описывается функцией I = L^-L^\ C.12) где константы Lq и L\ определяются параметрами контура. Зависимость то- тока в контуре от величины потока совершенно подобна в этом случае зависи- зависимости возвращающей силы от угла отклонения математического маятника f = тпда — (тпд/6)а^, поэтому период колебаний увеличивается с ростом амплитуды. 3.3. Автоколебания Существуют системы, в которых стационарный колебательный процесс возникает несмотря на то, что нет периодической внешней силы, заставля- заставляющей систему колебаться (с частотой, навязанной внешней силой — вы- вынужденные колебания) и нет периодического изменения параметров систе- системы (параметрические колебания). В такой системе имеется постоянный, не меняющийся во времени источник энергии (например, постоянная э. д. с. в электрической системе, либо постоянное поле тяжести, в котором находит- находится маятник), однако в самой системе имеется механизм, обеспечивающий периодический характер поступления энергии от источника к элементу, со- совершающему колебания. Колебания в таких системах называются автоко- автоколебаниями. Важнейшим признаком автоколебаний является независимость установившегося стационарного режима колебаний (амплитуды) от началь- начальных условий. Это отличает автоколебания от свободных незатухающих ко- колебаний осциллятора. Типичным примером автоколебательной системы являются маятниковые часы с гирей — т. н. «ходики». В этом случае убыль энергии (затухание колебаний маятника из-за трения) компенсируется за счет потенциальной энергии гири в поле тяжести, причем поступление энергии происходит толч- толчками — отдельными порциями АЕ — один раз за каждый период колеба- колебаний. Порция энергии АЕ определяется опусканием гири на одно звено цепи, на которой эта гиря подвешена. Механизм, позволяющий гире опускаться в определенные моменты времени, согласован с колебаниями маятника си- системой шестеренок и т. н. анкерным механизмом. Оказывается, что имен- именно величина АЕ определяет амплитуду установившихся колебаний вне за- зависимости от начального отклонения. Пусть, например, передача энергии маятнику (толчок, возникающий при опускании гири на одно звено) про- происходит в момент наибольших отклонений от положения равновесия. Если непосредственно перед очередным, n-ым толчком, энергия маятника (в дан- данном случае потенциальная энергия отклоненного от положения равновесия маятника) равна Еп , то после толчка его энергия Еп есть Е^ = ?7П(-) + АЕ. Совершив одно полное колебание, маятник потеряет часть энергии из-за трения. Полагая, что сила трения пропорциональна скорости (вязкое тре- трение), получим, что перед очередным, (п + 1)-ым толчком, энергия маятника станет равной
372 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР а после (п + 1)-го толчка получим + АЕ, или с учетом C.13): C.14) Стационарный режим соответствует условию Еп^ = Еп = Е, откуда находим Е = АЕ/A-е~26т). C.15) При малом затухании #, таком, что 25Т <С 1, получим е2 ~ 1 — 25Т и тогда Е = АЕ/B5Т) = A/2тг) QA? или Q = 2тгЕ/АЕ. C.16) Отметим, что полученное значение энергии установившихся колебаний ?7 не зависит от начальной энергии и начального отклонения от положения равновесия. Чтобы наглядно показать, как происходит «забывание» началь- начальных условий, сделаем следующее построение. Выберем прямоугольную си- систему координат, откладывая по оси абсцисс (ось Ох) величину х = ЕП1 а по оси ординат (ось Оу) величину у = Еп+\ (рис. 3.5). В этой системе координат уравнение C.14) есть уравнение прямой а — р ~25Т т + Л Е С\М} Кроме этой прямой, проведем на графике биссектрису, уравнение которой у = х. C.18) Очевидно, точка пересечения этих прямых определяет стационарный ре- режим автоколебаний х = у = АЕ/ (l — e ~25T) 5 что ясно из сравнения послед- последнего равенства с C.15). Пусть начальная энергия маятника, соот- соответствующая начальному отклонению, есть Е\ (отмечено на оси Ож, рис. 3.5). Маятник совершает полное колебание и по- после первого толчка его энергия Е2 найдется с помощью C.14) 771 77' _ —ZiO-L | Д 771 И/2 = Л/\ е -+- ZAxv. Значение Е2 найдем с помощью прямой C.17) на графике. Для нахождения графиче- графиче1 ски следующей точки последовательности АЕ превратим «ординату» Е2 в абсциссу Е2 с помощью биссектрисы у = х. Этой новой абсциссе х = Е2 соответствует ордината у = Е%, которая находится с помощью прямой C.17). Повторяя далее многократно всю процедуру, получаем ломаную кривую, заключенную между прямыми C.17) и C.18), которая неограниченно при- приближается к точке С их пересечения — стационарному режиму. Очевидно, какую бы начальную точку мы ни взяли (например, Е[ на гра- графике) мы неизменно получаем ломаную, приближающуюся к одной и той же точке пересечения С — стационарному режиму, что и означает забывание начальных условий в процессе установления автоколебаний. Построенная нами в соответствии с описанной процедурой ломаная кривая называется лестницей Ламерея.
3.4. АВТОГЕНЕРАТОР ВАН-ДЕР-ПОЛЯ 373 3.4. Автогенератор Ван-дер-Поля Рассмотрим теперь возникновение автоколебаний в генераторе, построен- построенном на основе электронной лампы — триода. Такой генератор называется автогенератором Ван-дер-Поля. Его схема показана на рис. 3.6. Собственно колебательным элементом генератора является колебатель- колебательный контур L, С, i?, находящийся в сеточной цепи триода. Напряжение Uc = q/C на конденсаторе контура, подается на сетку лампы. Измене- Изменение этого напряжения управляет изменениями анодного тока 1а (в анодной цепи лампы) и следовательно, изменением магнитного по- потока в катушке La, находящейся в анодной цепи. Катуш- Катушки La и L (катушка колебательного контура) индуктивно связаны между собой (т. е. магнитный поток катушки La пронизывает катушку L и его изменения создают в послед- последней э. д. с. взаимоиндукции ? = — L\2 (d/a/dt), где L\2 — коэффициент взаимной индукции катушек L и La. С помощью этого осуществляется механизм обратной связи, т. е. обратное влияние анодного тока лампы на про- р о ^ цесс колебаний контура. Рассмотрим качественно процесс раскачки малых колебаний, которые все- всегда имеют место в контуре из-за теплового хаотического движения зарядов. Пусть в данный момент времени ток / в контуре направлен так, как показа- показано на рис. 3.6 (положительное направление обхода по контуру) — при этом растет заряд q на пластинах конденсатора, / = dq/dt > 0, растет, следова- следовательно, напряжение на конденсаторе Uc. Подробнее характеристики лампы мы обсудим позднее, а пока отметим лишь, что при малых напряжениях на сетке Uc рост напряжения С/с, при- приводит к росту анодного тока 1а. Последнее приводит к росту магнитного потока Фа, созданного катушкой La: Фа = LaIa. На рисунке показано на- направление анодного тока, а также направление, в котором этот ток обтекает витки катушки La. Соответствующий магнитный поток Фа направлен вверх (по правилу буравчика). Собственный же магнитный поток Ф катушки L (по тому же правилу) направлен вниз. Нарастающий поток Фа, пронизывая витки катушки L контура, создает в ней э. д. с. Каково ее направление, т. е. в каком направлении возникшая э. д. с. ин- индукции гонит заряды в контуре? Согласно правилу Ленца, возникающий индукционный ток должен со- создать собственный магнитный поток, направление которого должно быть таким, чтобы скомпенсировать изменение потока Фа, (который направлен вверх и нарастает). Ясно поэтому, что собственный магнитный поток тока / в контуре (направленный вниз!) также должен нарастать, а это значит, что ток / в контуре должен увеличиться. Заметим попутно, что э. д. с. индукдии —L i2(dla/dt) оказывается при этом положительной величиной: увеличивая ток /, она гонит заряды в положи- положительном направлении обхода контура, откуда следует (поскольку dla/dt > > 0), что Li2 < 0. Итак, обратная связь (влияние анодного тока на колебательный контур) приводит к росту тока в контуре, к дополнительному росту заряда конден- конденсатора и напряжению С/с, на сетке лампы. Это в свою очередь приведет к росту анодного тока и т. д.
374 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР Таким образом, имеющиеся в контуре малые колебания начинают рас- раскачиваться, их амплитуда постепенно растет. Если изменить намотку ка- катушки La на противоположную (как показано на катушке, изображенной на рисунке слева), то рост Фа приводит к появлению э. д. с. в катушке L, кото- которая приводит не к росту, а к уменьшению тока в контуре и, следовательно, к быстрому подавлению колебаний. Обратная связь, осуществляемая катуш- катушкой La, в первом случае называется положительной (при этом L\2 < 0), а во втором — отрицательной (Li2 > 0). Итак, при положительной обрат- обратной связи возникшие в контуре малые колебания начинают нарастать, т. е. состояние покоя, при котором ток в контуре и заряд конденсатора равны ну- нулю, неустойчиво. В случае отрицательной обратной связи, наоборот, малые колебания подавляются, т. е. состояние покоя устойчиво. Рассмотрим теперь более детально процесс раскачки автоколебаний. Урав- Уравнение, описывающее процесс колебаний в контуре, имеет в нашем случае вид RI + UC = -L(dI/dt)-L12(dIa/dt), C.19) по сравнению с уравнением, описывающим процесс свободных колебаний, в правой части к э. д. с. индукции —L(dl/dt) добавляется э. д. с. —Li2(dla/dt). Подчеркнем, что коэффициент взаимной индукции L\2 может быть как по- положительным, так и отрицательным. При положительной обратной связи L12<0. Перепишем уравнение C.19) в виде (имея в виду, что dl/dt = Cd2Uc/dt2): Uc +25UC = -(Lu/LC)(dIa/dt), C.20) где 6 = R/BL), ац = 1/y/W. По внешней форме последнее уравнение похоже на уравнение вынужден- вынужденных колебаний B.78), в котором правая часть играет роль внешней, выну- вынуждающей силы. Однако принципиальное отличие нашей задачи состоит в том, что эта правая часть зависит в свою очередь от изме- изменений искомой функции С/с, (тогда как в уравнении выну- вынужденных колебаний правая часть — это заданная функция времени, никак не связанная (и не зависящая) от колебаний напряжения на конденсаторе контура. Рассмотрим идеализированную зависимость анодного то- тока лампы 1а от напряжения на сетке Uc, изображенную на рис. 3.7. При отрицательном напряжении на сетке лампы, таком, что Uc < U\ анодный ток равен нулю — лампа за- заперта. При достаточно малых изменениях С/с, таких, что U\ ^ Uc ^ U2 анодный ток растет пропорционально сеточ- сеточному напряжению. На этом участке, как видно из графика, зависимость Ia(Uc) имеет вид /Т I Q ТТ /о О1\ а — ^0 ~г & q(Jc, [o.Zi) где Sq = dla/dllc — тангенс угла наклона прямой на участке U\U2 — константа, называемая крутизной характеристики. Рис. 3.7 Мы полагаем, что на начальной стадии, в процессе раскач- раскачки, амплитуда колебаний настолько мала, что напряжение Uc не выходит за границы, где справедлива линейная зависимость C.21). Наконец, при Uc > U2 имеет место насыщение: анодный ток 1а достигает максимального значения Is и при дальнейшем росте С/с, уже не меняется.
3.4. АВТОГЕНЕРАТОР ВАН-ДЕР-ПОЛЯ 375 Итак, на начальной стадии, пока амплитуда колебаний достаточно мала, мы имеем для правой части уравнения C.20) L i2 dig _ Lyi dig dllc _ LuSp dUc ~T~T ~ ~T^~dF ~ ~LC dT' Перенося последнее выражение в левую часть уравнения (где уже есть слагаемое, содержащее производную dUc/dt), получаем di2 ' Введем обозначение S* = R/BL) +L12S0/BLC), C.23) после чего уравнение C.20) приобретает вид U с + 2S*UC + ^lUc = 0, C.24) который совершенно подобен уравнению, описывающему свободные зату- затухающие колебания гармонического осциллятора, причем роль затухания 6 играет величина E*, определяемая формулой C.23). Решение C.24) хорошо известно: Uc = Ae~ lcos(c<;? + ф), C.25) где и; = л/с^о ~~ ^2-> Алср — произвольные постоянные, зависящие от началь- начальных условий. Еще раз напомним, что коэффициент S = i?/BL), определяю- определяющий изменение амплитуды колебаний при свободных колебаниях осциллято- осциллятора, существенно положительная величина, поэтому показатель экспоненты е всегда отрицателен, он-то и определяет экспоненциальное затухание колебаний. Совершенно иная ситуация в нашем случае. Как следует из C.23), вели- величина E* может быть как положительной, так и отрицательной. При E* < 0 показатель экспоненты в C.25) оказывается положительным и мы получаем экспоненциальный рост амплитуды колебаний a(t) = Ae 1^*1*. Необходимым условием выполнения неравенства E* < 0 является условие Li2<0, C.26) т. е. наличие положительной обратной связи (это мы уже выяснили при ка- качественном обсуждении роли обратной связи). Условия C.26), однако, недо- недостаточно. Как видно из C.23) для достижения отрицательности E* необхо- необходимо также, чтобы выполнялось неравенство R/L < \L12\S0/(LC) или R < \L12\S0/C. C.27) Смысл последнего условия ясен: величина сопротивления контура R опре- определяет джоулевы потери энергии, а величина обратной связи \L\2\ — ту подкачку энергии в контур, которую обеспечивает э. д. с. взаимоиндукции. Для раскачки колебаний необходимо превышение подводимой энергии над потерями. Наконец, при L\2 > 0, как видно из C.23), величина E* всегда положи- положительна, поэтому амплитуда a(t) = Ae~ t всегда затухает.
376 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР Надо, однако, помнить, что все сказанное справедливо лишь до тех пор, пока напряжение на конденсаторе не выходит за границы малой области. Формула C.25) неприменима на более поздних стадиях процесса, когда ам- амплитуда становится достаточно большой. Действительно, если выполнены условия C.26) и C.27) и величина #* ока- оказывается отрицательной, то, согласно C.25), амплитуда колебаний должна неограниченно экспоненциально нарастать; при этом невозможно ответить на вопрос: какова установившаяся амплитуда автоколебаний? Кроме того, из формулы C.25) следует, что при E* = 0 имеют место незатухающие коле- колебания Acos(u;t + <р), амплитуда А и начальная фаза ср которых зависит от начальных условий. Ни то, ни другое в действительности не имеет места. Причина несоответствия состоит в том, что даже при использовании иде- идеализированной характеристики лампы Ia(Uc), изображенной на рис. 3.7 а, крутизна S не является в действительности константой (равной тангенсу угла наклона прямой на линейном участке). Правильная зависимость Ia(Uc) должна описывать, что происходит, когда Uc становится достаточно боль- большой отрицательной величиной (Uc < ?/]_) (и при этом 1а = 0) и что проис- происходит при достаточно больших положительных Uc (Uc > U2) и при этом Ia = Is (насыщение). Итак, с учетом нелинейности характеристики лампы при больших ампли- амплитудах колебаний, правая часть уравнения C.20) — величина — (L12/LC) x x(dla/dt) должна быть записана в виде L12dlg = L12S(UC) у LC dt LC C' где S = S(UC) — крутизна, зависящая от напряжения на конденсаторе — функция показанная на рис. 3.8 Соответственно, в уравнении колебаний C.24) величина s So , ур () становится функцией напряжения на конденсаторе Д Ll2S(Uo) 6 ~2L+ 2LC т. е. уравнение C.24) становится нелинейным. U2 Только учитывая нелинейность, можно исследовать установившийся процесс автоколебаний. Рис. 3.8 Обратите внимание на формулу C.28): условие E* < 0 нарушается, как только величина Uc выходит из области U\ < Uc < [/2; при этом S(UC) = 0 и E* = R/2L становится существенно положительной величиной. Итак, рассмотрим ситуацию, когда амплитуда колебаний стала достаточ- достаточно большой, так что значение Uc при колебаниях выходят за рамки расмо- тренной области (рис. 3.7 б). Начнем с момента времени t\, когда Uc = 0 и начинает расти. Пропорционально, в соответствии с законом C.21), изо- изображенном на рис. 3.7 а растет анодный ток вплоть до момента времени t2, когда наступает насыщение 1а = Is. Далее (см. рис. 3.7 б) значение Uc про- продолжает при колебаниях нарастать, а затем уменьшается, оставаясь, вплоть до момента времени ?3 B области насыщения. При таких изменениях Uc в интервале времени от t2 до ?з анодный ток остается неизменным и равным значению Is. Это горизонтальный участок зависимости Ia(t) на рис. 3.9. Далее, от момента времени ?з и Д° момента
3.4. АВТОГЕНЕРАТОР ВАН-ДЕР-ПОЛЯ 377 к к к к Рис. 3.9 времени ?4 значение Uc уменьшается, оставаясь на этом интервале внутри линейного коридора, поэтому и анодный ток 1а пропорционально падает (па- (падающий участок Ia(t) на рисунке, и к моменту времени t^ когда напряже- напряжение на конденсаторе Uc становится равным запирающему напряжениию U\, анодный ток становится равным нулю. Аналогичным образом с помощью рис. 3.7 и 3.9 можно проследить процесс и далее. Итак, мы видим, к чему приводит нелиней- нелинейность характеристики лампы: при большом размахе колебаний напряжения на конденса- конденсаторе Uc (которые происходят, как показано на рисунке, по гармоническому закону) из- изменение анодного тока со временем имеет су- существенно другую форму: анодный ток пред- представляет собой последовательность почти прямоугольных импульсов с крутыми участ- участками роста и спада (на отрезках времени ? i ?2 и ?3 ?4) и горизонтальным участком постоян- постоянных значений 1а (отрезок времени 12 ^з? 1а — = Is — ток насыщения и отрезок t^ts — ну- нулевое значение 1а). График зависимости — {L\2 / LC){dIa / dt) от t (где Li2, L и С — константы) приведен на рис. 3.10: при Li2 < 0 (положительная обрат- обратная связь, рис. 3.10 а) и при L\2 > 0 (отрица- (отрицательная обратная связь, рис. 3.10 б). Мы видим, что «внешняя э. д. с», раскачи- раскачивающая в контуре колебания, имеет вид ко- коротких толчков разного знака. При положительной обратной связи (Li2 < 0, рис. 3.10 а) толчки, как мы вы- выяснили ранее, действуют в «правильном на- направлении» и раскачивают колебания. При отрицательной обратной связи (L±2 > 0, рис. 3.10 б), наоборот, колебания затухают еще быстрее, чем без обратной связи. Найдем установившуюся амплитуду колебаний тока. Толчки происходят, как видно из графика Uc(t), в моменты, когда напряжение на конденсаторе равно нулю и, следовательно, ток / = CUC максимален, т. е. равен ампли- амплитудному значению /. После толчка, создающего скачок тока А/ получим 1\ = I + А/. За короткое время толчка т = t2 — t\ = t± — t% = ... и т. д. суммарный поток, пронизывающий катушку L, сохраняется Рис. 3.10 откуда |А/| = AIaL 12/L. За время действия толчка анодный ток, как видно из графика Ia(t) на рис. 3.9 изменяется от 0 до максимальной величины /s, т. е. AIa = Is и мы получаем \AI\=L12IS/L, h=I+\Ll2\Is/L. Далее, до очередного толчка, контур свободен от внешнего воздействия и, в силу экспоненциального затухания, амплитуда уменьшается, ее значение
378 ГЛ. 3. ПАРАМЕТРИЧЕСКИЕ КОЛЕБАНИЯ. АНГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР перед очередным толчком равно (т. к. Т/2 время между толчками). Условие стационарности: значение амплитуды перед каждым очередным толчком (а значит и после каждого очередного толчка) не меняется, т. е. откуда находим стационарное, установившееся значение амплитуды автоко- автоколебаний Luls/L st/2 15Т/2е Если контур обладает малым затуханием (добротность велика), то скачки тока А/ оказываются малыми по сравнению с установившимся значением /. Используя е~зт/2 « 1 - 6Т/2 находим / = 2L12IS/(L6T). Заметим в заключение, что все основные свойства автоколебательной си- системы, рассмотренные нами на примере лампового генератора, сохраняются, если использовать вместо лампы полупроводниковый триод.
ГЛАВА 4 КИНЕМАТИКА ВОЛН Понятие волны — одно из важнейших в физике. Современная физика из- изучает и волны на море, и сейсмические волны в Земле, и волны звука в твердых телах, жидкостях и газах, и электромагнитные волны (в том числе свет) и, наконец, волны вероятности, которые используются в квантовой фи- физике для описания поведения электронов, атомов и других микрообъектов. Важно подчеркнуть, что наука о волнах использует единый математиче- математический аппарат для описания волн любой физической природы — в этом и проявляется общность волновых закономерностей. 4.1. Основные понятия и определения. Простейшие типы волн. Волновое уравнение Что такое волна? Очень трудно дать исчерпывающее определение этого понятия, не обращаясь к математическим формулам, ибо любое определение не может охватить всего многообразия процессов, которые принято называть волнами. Для первоначального знакомства с волнами достаточно понимать их как процесс распространения в пространстве колебаний, возникающих в результате некоторого возмущения. Таким возмущением может быть и из- изменение давления в каком-либо месте упругой среды, и изменение электри- электрического или магнитного поля в некоторой точке пространства, и изменение уровня поверхности жидкости в каком-либо месте (например, от брошенно- брошенного на гладкую поверхность воды камня). Во всех этих случаях возмущение начинает с конечной скоростью распространяться в пространстве. Волновой процесс развивается и во времени, и в пространстве, поэтому в отличие от колебательного процесса, который описывается функцией вре- времени S(t), волновой процесс должен описываться функцией координат и времени S(x, у, z, t) (или, коротко, *S(r, ?)). На первом этапе мы не будем интересоваться физической природой волны, т. е. неважно, понимаем ли мы под S изменение давления или плотности среды при распространении в ней звуковой волны, либо S — это напряженность электрического или магнит- магнитного поля при распространении электромагнитной волны, либо это волна какой-либо иной природы. Начнем математическое описание с наиболее простой ситуации — плоских волновых возмущений: будем считать, что волновое возмущение S зависит только от одной координаты (скажем от координаты z). Пусть в какой-то мо- момент времени t мы определили распределение возмущения в пространстве, т. е. определили S как функцию координаты z (рис. 4.1 а). (Мы договори- договорились, что S зависит только от z, т. е. если рассмотреть любую плоскость, перпендикулярную оси z (плоскость z = const), то в любой точке этой плос- плоскости величина S одна и та же, независимо от координат ж, у этой точки).
380 ГЛ. 4. КИНЕМАТИКА ВОЛН Можно сказать, что картинка на рис. 4.1 а — это мгновенная фотография волнового возмущения, сделанная в момент времени t. Будем следить за развитием ситуации в области z > 0. Сделаем мгно- мгновенную фотографию в другой момент времени t + At. Что мы должны на ней увидеть? Интуиция подсказывает нам, что мы должны увидеть картину, изображенную на рис. 4.1 б: возмущение пере- переместилось в пространстве за время At на рас- расстояние Az = vAt, где v — скорость распро- распространения возмущения. Предположим, что про- пространственная форма возмущения не измени- изменилась, т. е. вторая фотография изображает тот же «волновой пакет», только сдвинутый в про- пространстве на расстояние Az: S(z, t) = S{z + Az, t + At). D.1) Равенство D.1) означает, что изменения во рис 4 1 времени возмущения S (колебание величины S) в плоскости z + Az происходят точно так же, как и в плоскости z, лишь запаздывая по времени на At. Какова должна быть зависимость S от координаты z и времени t, чтобы равенство D.1) было справедливо? Легко догадаться, что она должна иметь вид S(z, t) = S(z-vt). D.2) т. е. функция S должна зависеть от комбинации аргументов z и t вида z — vt. Действительно в этом случае равенство D.1) выполняется, поскольку, если z заменить на^ + Az, a t на t + At, то величина z — vt не изменится: z — vt = i<z + Az) - v(t + At) в силу того, что Az — vAt = 0. Итак, зависимость вида D.2) соответствует нашему интуитивному пред- представлению о волне, как о возмущении, которое распространяется в простран- пространстве с конечной скоростью. В нашем случае Az = vAt > 0, т. е. волна бежит вправо, в положительном направлении оси z. Аналогичным образом можно показать, что функция S(z + vt) описывает волну, бегущую справа налево. Обозначая аргумент функции S через ? (? = z ± vt), найдем связь между производными S по координате и времени: OS dS д? dS dS__dS_d^_ dS_ ~dt " d? ~di " V d? ' d2S _ д_( dS_ dz d2S dz = V d_ ~d~z D.3) Сравнивая вторые производные функции S по t и по z D.3), замечаем, что они отличаются множителем г>2, и мы получаем 32S 1 d2S _ dz2 v2 dt2 ~ ' D.4) Соотношение D.4) называется волновым уравнением. В более общем слу- случае, когда возмущение S зависит не только от ^-координаты, но также от х
4.1. ПРОСТЕЙШИЕ ТИПЫ ВОЛН. ВОЛНОВОЕ УРАВНЕНИЕ 381 и у-координат, волновое уравнение выглядит следующим образом: <PS (PS d2S 1 d2S + + Левая часть последнего уравнения коротко записывается с помощью опе- оператора Лапласа V2 = д2 /дх2 + д2 /ду2 + д2 /dz2, волновое уравнение при- приобретает компактный вид: V25-i5 = 0. D.5) vz otz Вообще говоря, уравнение D.5) описывает волновые процессы более об- общего характера, чем только волны вида S(z =Ь vt). Мы можем дать теперь несколько формальное, но более общее определение понятия волны. Любая физическая величина *S(r, ?), подчиняющаяся уравнению D.5), может быть названа волной. Рассмотрим несколько важных случаев простейших типов волн. Плоская монохроматическая волна. Пусть возмущение описывается функцией координат и времени вида S(z, t) = acos(ut-kz), D.6) где и; и к — константы. Смысл константы ио ясен: при фиксированном z (т. е. в любой плоскости, перпендикулярной оси z) мы имеем гармонический колебательный процесс частоты ио и амплитуды а. Можно убедиться непосредственной подстановкой, что функция D.6) удо- удовлетворяет волновому уравнению D.4), т. е. возмущение D.6) представляет собой волну. Действительно, дифференцируя D.6) дважды по t и по z, получаем dz2 (cv/kJ dt^ [ > Из сравнения D.7) и D.4) ясно, что возмущение D.6) действительно удо- удовлетворяет волновому уравнению, если к = w/v. D.8) Константа /с, определяемая последним равенством, называется волновым числом. Константа а в D.6) — амплитуда волны, а аргумент косинуса uot — kz = Ф — фаза вол- волны. Очевидно, в любой фиксированной плоскости z = const (в любой точке Р(х, у) этой плоскости) фаза Ф в любой момент времени одна и та же, т. е. колебания величины S происходят «в такт», синхронно (обычно говорят синфазно). Скажем в точках Р\ и Р2 плоскости z = const (рис. 4.2) ко- колебания происходят по одному и тому же закону р . ~ S(t) = acos(c<;? — ф), где (р = kz, с одной и той же амплитудой и одной и той же начальной фазой (р. Величина S во всех точках данной плоскости z = const одна и та же в любой момент време- времени. Поверхности, на которых колебания возмущения S происходят синфаз- синфазно, называются волновыми поверхностями. В данном случае волновые по- поверхности — плоскости (перпендикулярные оси z). Поэтому-то волна D.6) У У X V ,2)
382 ГЛ. 4. КИНЕМАТИКА ВОЛН называется плоской. Поскольку колебания происходят по гармоническому закону, волна D.6) также называется гармонической (в оптике принят тер- термин монохроматическая, т. е. одноцветная). Пусть некоторый наблюдатель перемещается в направлении оси z со ско- скоростью Уф так, что величина фазы волны Ф = uit — kz в том месте z, где в данный момент находится наблюдатель, не меняется ф = (jot — kz = const. D.9) Дифференцируя D.9) по ?, находим dz/dt = Уф = и/к. Полученная нами величина Уф называется фазовой скоростью (скорость, с которой перемещается поверхность постоянной фазы колебаний — волно- волновая поверхность). Мы видим, что она совпадает с константой г>, входящей в волновое уравнение D.4). Введем еще одно важное понятие — волновой вектор к. Это вектор, совпа- совпадающий по направлению с нормалью к волновой поверхности (и вектором скорости, с которой перемещается волновая поверхность, рис. 4.2), причем модуль вектора к равен волновому числу |к| = k = ш/v. Разность фаз А(р колебаний на двух волновых поверхностях, разделенных расстоянием Az, равна Аср = kAz. Найдем расстояние между волновыми по- поверхностями, колебания на которых происходят с разностью фаз Аср = 2тт (т. е. колебания на этих поверхностях происходят синхронно, в такт). Мы получаем Az = 2п/к. Это расстояние Az называется длиной волны и обозна- обозначается буквой А: А = 2тг/к. D.10) Используя определение D.8) волнового числа /с, находим А = Bn/u;)v = vT, D.11) где Т = 2тг/ио — период колебания. Из D.11) ясно, что длина волны есть расстояние, на которое перемещается волновая поверхность за время, равное одному периоду колебания. (x,y,z) Рассмотрим теперь плоскую монохромати- монохроматическую волну, распространяющуюся в произ- произвольном направлении (например вдоль оси z1', рис. 4.3) S(z', t) = acos(ct;t — kz). Волновой вектор к этой волны совпадает по направлению с осью z'. Мы хотим записать уравнение этой волны в системе координат (ж, у, z). Вектор к (как и направление z') составляет с направлением осей ж, у, z углы а, /3, 7? т- е- его проекции на оси ж, у, z есть кх = к cos a, ку = к cos /3, kz = к cos 7- Соответственно z1 = х cos a + у cos C + z cos 7. Тогда kz = кхх + куу + kzz = k • г, где к • г — скалярное произведение вектора к (/сж, ку, kz) и радиуса-вектора г точки наблюдения Р: г (ж, у, z). Итак, мы получили уравнение плоской
4.1. ПРОСТЕЙШИЕ ТИПЫ ВОЛН. ВОЛНОВОЕ УРАВНЕНИЕ 383 волны, распространяющейся в произвольном направлении ?(r, t) = acos(u;t - к • г - <р). D.12) Направление волны задается направлением вектора к, т. е. углами а, /3, 7? причем cos2 a+cos2 /3+cos2 7 = 1. Для общности в аргумент косинуса введена начальная фаза ср (фаза колебаний в момент t = 0 в начале координат). Разумеется, форма волновых поверхностей не изменилась: в системе ко- координат (ж, у, z) волновые поверхности по прежнему плоские, как и в си- системе (ж7, у7, z1). Действительно, уравнение к • г = const — это уравнение плоскости, нормаль к которой совпадает по направлению с вектором к и, как следует из D.12), во всех точках (ж, у, z), принадлежащих плоскости kr = const, колебания происходят синфазно. Предоставляем читателю убе- убедиться непосредственной подстановкой, что функция D.12) удовлетворяет волновому уравнению D.5), если k2x + k2, + k2z = (uJ/vJ = k2, D.13) причем частота волны может быть любой. Направление распространения волны также произвольно: проекции волнового вектора к можно изменять как угодно, лишь бы сумма их квадратов удовлетворяла равенству D.13). Таким образом, уравнение D.12) описывает целую совокупность, множество решений волнового уравнения — множество плоских волн, отличающихся частотой колебаний и направлением распространения. Плоские монохроматические волны D.12) (или, в частном случае, вол- волны D.6)) называют также бегущими плоскими волнами, подчеркивая таким образом, что волновые поверхности перемещаются в пространстве, и ско- скорость их перемещения — это и есть фазовая скорость. Стоячая волна. Рассмотрим волновой процесс, представляющий собой суперпозицию, сумму волн, одна из которых бежит в направлении оси z: Si(z, t) = acos(ct;t — kz), а вторая (с той же амплитудой и частотой) — во встречном направлении 62B, t) = acos(ct;t + kz). Легко убедиться (упражнение для читателя), что сумма S = S\ + S2 есть решение волнового уравнения D.4). Складывая S\ и S^? находим S(z, t) = A(z) cos ut, D.14) где A(z) = 2a cos kz. Согласно D.14), колебания во всех точках происходят с одной и той же частотой с<;, однако амплитуда колебаний A(z) в разных точках (в разных плоскостях z) различна (рис. 4.4). В частности, в плоскостях, для которых kz = ттп + тг/2 (п=0, =Ы, ±2,...), т. е. г„ = (А/4)Bп + 1), D.15) амплитуда колебаний равна нулю. Точки нулевой амплитуды называются узлами стоячей волны. Как видно из D.15), расстояние между соседними узлами равно А/2. В плоскостях, для которых kz = птг (п = О, =Ы, ±2, ...), т. е. zn = nA/2,
384 ГЛ. 4. КИНЕМАТИКА ВОЛН /=7/2 Рис. 4.4 амплитуда колебаний максимальна и равна 2а (напомним, что а — амплиту- амплитуды встречных бегущих волн). Точки максимальной амплитуды называются пучностями, которые располагаются точно посередине между узлами, т. е. на расстоянии А/4 от ближайших узлов (и А/2 друг от друга). Заметим, что при п нечетном cos(A;^n) = —1, т. е. величина A(zn) отри- отрицательна и равна —2а. В этом случае функцию S(z, t) можно записать в виде /t=T/6 откуда ясно, что отрицательность ампли- амплитуды A(z) означает лишь, что колебания в точках zn = nA/2 при п нечетном проис- происходят в противофазе (со сдвигом фазы на тг) по сравнению с колебаниями в точках zn = п\/2 при п четном. В частности, если при z = 0 величина S максимальна и рав- равна 2а, то в точке z = А/2 величина S (в тот же момент времени) равна —2а (рис. 4.4). Вообще, как видно из D.14), в точках нулевой амплитуды колебаний происходит скачкообразное измене- изменение фазы на величину тг. Например, если при \z\< A/4 колебания происходят по закону S = A(z) cos out, то при А/4<;?<ЗА/4 имеем S(z) = |^4(^)| cos(uit + тг) и т.д. В суммарном волновом процессе D.14), образованном встречными волна- волнами одинаковой частоты и амплитуды, нет перемещающихся волновых по- поверхностей (т. к. нет аргумента вида cot =Ь kz), поэтому волна вида D.14) называется стоячей волной. Сферическая волна. Волна, описываемая уравнением S(r, t) = (a/r) cos(cot - кг), D.16) называется сферической. В уравнении D.16) г — расстояние от начала ко- координат (где расположен источник волны) до точки наблюдения (х, у, z) г = \/х2 + у2 + z2, к = co/v — волновое число. Обратная пропорциональность амплитуды ра- радиусу — свойство сферически симметричного решения уравнения D.5). По- Понятен смысл названия «сферическая волна»: согласно D.16), колебания S происходят синфазно во всех точках пространства, отстоящих от источника на заданном расстоянии г = const, т. е. волновые поверхности — это сферы, центр которых (источник волны) находится в начале координат. Обратим внимание на различие уравнений D.12) и D.16). В уравнении плоской вол- волны аргумент косинуса содержит скалярное произведение векторов к и г. В уравнении сферической волны — произведение волнового числа к на рассто- расстояние г точки наблюдения от источника волны. Дифференцируя равенство cot — кг = const, получаем dr/dt = со/к > 0, т. е. волновые поверхности бегут от источника (dr > 0). Легко видеть, что уравнение S(r, t) = a/r cos(ujt + kr) описывает сферическую волну, в которой волновые поверхности бегут к на- началу координат (dr/dt= — со/к < 0). Это — сходящаяся сферическая волна. Исследуем колебания, созданные сферической волной в плоскости, отсто- отстоящей от источника на большом расстоянии z. При этом часто используют
4.1. ПРОСТЕЙШИЕ ТИПЫ ВОЛН. ВОЛНОВОЕ УРАВНЕНИЕ 385 приближенное выражение, существенно упрощающее многие расчеты. Пусть размер области в плоскости наблюдения, которой мы интересуемся, мал по сравнению с z (эта область заштрихована на рис. 4.5). Тогда амплитуду ко- колебаний ао/г в этой области можно считать кон- константой: ao/r c± ao/^ = a = const во всех точках, 2 / для которых х2 + у2 <С z2. Сложнее обстоит дело с оценкой фазы колеба- колебаний кг. Пользуясь приближенным выражением для г, мы должны быть уверены, что ошибка в вычислении г мала по сравнению с длиной вол- волны А. Действительно, ошибка при вычислении расстояния г, равная А/2, приводит к ошибке в вычислении фазы колебаний, равной тг. Это не- недопустимо, когда речь идет о сложении колебаний: например, вместо син- синфазного сложения волн мы получим противофазное — амплитуда суммар- суммарного колебания будет найдена неверно. Воспользуемся следующим прибли- приближением: , 1/2 г Рис. 4.5 = y/z2 + х2 + у2 = zll ~z х2 + у2 2z (приближенное выражение д/1 + е — 1 + 6/2 справедливо при е < 1). Мы полагаем при этом, что отброшенные члены разложения радикала в сте- степенной ряд дают поправку, малую в сравнении с А. Например, достаточно потребовать выполнения неравенства (х2 + у2J/(б?3) <С А. В этом случае, учитывая все вышесказанное, получаем к S = a cos [cot — (р(х, у)], где <р(ж, у) = kz (х2 + у2) (плоскость наблюдения z = const предполагается фиксированной). Посколь- Поскольку роль играет лишь относительная разность фаз, то можно, приняв фазу колебаний в начале координат плоскости наблюдения нулевой, записать ',У)~7Г У2)- D.17) Используя сделанные приближения, мы, по существу, полагаем, что сфе- сферическую форму волнового фронта можно на малом участке заменить па- параболической, поэтому приближение D.17) называется параболическим. В дальнейшем всюду, где это необходимо, мы будем пользоваться параболи- параболическим приближением без каких-либо оговорок. Цилиндрическая волна. Осесимметричное решение уравнения D.5) на- называется цилиндрической волной. Она описывается уравнением y/R cos (cut - kR), D.18) где R — расстояние от оси. Геометрическое место точек одинаковой фазы колебаний — цилиндрические поверхности R = const, т. е. волна D.17) имеет цилиндрические волновые поверхности. Волновые поверхности удаляются от оси 00' со скоростью v = ио/к. Амплитуда колебаний убывает с ростом расстояния от оси 00' по закону 1/y/R.
386 ГЛ. 4. КИНЕМАТИКА ВОЛН 4.2. Монохроматические волны. Комплексная амплитуда. Уравнение Гельмгольца Выше мы рассмотрели простейшие примеры монохроматических волн. В самом общем случае уравнение монохроматической волны (не обязательно плоской, сферической или цилиндрической) имеет вид: S(r, t) = а(г) cos (ujt - <р(г)), D.19) где г — радиус-вектор точки наблюдения. В любой фиксированной точке наблюдения волна D.19) создает гармо- гармонические колебания частоты uj с амплитудой а(т) и начальной фазой (р(г). Функции а(т) и ср(т) определяют пространственную структуру волны, в том числе и форму волновых поверхностей. При изучении монохроматических волн, так же, как и при изучении гар- гармонических колебаний, удобно использовать комплексную форму записи. Наряду с волной D.19), рассмотрим волновой процесс вида Si (г, t) = а(г) sin (а;* - <р(г)) . D.20) Ясно, что если функция D.19) действительно описывает некоторый волно- волновой процесс (т. е. удовлетворяет волновому уравнению), то функция D.20) также описывает волну: ведь D.20) можно получить из D.19) просто изме- изменением начала отсчета времени: Si(r, t) = — S(r, t + Т/4), где Т = 2тг/uj — период колебания. Ясно также, что линейная комбинация функций D.19) и D.20) вида V(r,t) = S(r,t)-iS1(r,t) D.21) также удовлетворяет волновому уравнению. (Линейная суперпозиция реше- решений волнового уравнения D.5) также является решением.) Используя тождество cos а — г sin a = е~ш, перепишем D.21) в виде У (г, t) =а(г)е-^*-^гИ. D.22) Функцию F(r, t) можно записать в виде произведения двух функций, одна из которых /(г) = а(т)ег^ D.23) зависит только от координат, а вторая e~lut — только от времени, V(r, t) = /(г)е~ш. D.24) Комплексная функция /(г) полностью определяет пространственную структуру волны (т. е. распределение в пространстве амплитуд а (г) и фаз ср(т) колебаний) и называется комплексной амплитудой волны. Итак, комплексная функция V(r, ?), определяемая равенством D.24), дол- должна быть решением волнового уравнения g = o. D.25) Дифференцируя D.24) дважды по координатам, получим
4.3. ВЕКТОРНЫЕ ВОЛНЫ 387 Дифференцируя D.24) дважды по времени, находим d2V/dt2 = /(т)(-шJе-ш. Подставляя выражения V2V и d2V/dt2 в D.25), приходим (после сокра- сокращения на множитель e~lut) к уравнению V2/ + k2f = О, D.26) где к = ш/v — волновое число. Уравнение D.26) для комплексных амплитуд называется уравнением Гелъмголъца. 4.3. Векторные волны До сих пор речь шла о скалярных волнах, т. е. о волновом возмущении *S(r, ?), которое описывется скалярной величиной S. Например, таким обра- образом можно представить звуковые волны, распространяющиеся в воздухе. В этом случае *S(r, t) — изменения плотности или давления — скалярные ве- величины. Теперь мы рассмотрим кинематику простейших векторных волн: речь бу- будет идти об изменяющейся в пространстве и во времени векторной величине S (например, напряженности электрического или магнитного полей в элек- электромагнитной волне). В общем случае вектор S может иметь произвольное направление по от- отношению к направлению распространения (т. е. по отношению к волново- волновому вектору к). Если вектор S параллелен направлению распространения, волна называется продольной. Если вектор S перпендикулярен направле- направлению распространения, волна называется поперечной. Именно особенности структуры поперечных волн мы здесь рассмотрим. Наиболее простой тип поперечной вол- ны — так называемая плоско-поляризо- ванная волна (употребляется также тер- мин линейно-поляризованная волна). В плоско-поляризованной волне колебания вектора S происходят в фиксированной плоскости. Например, на рис. 4.6 а пока- рис. 4.6 зана плоско-поляризованная волна, бе- бегущая вдоль оси z, при этом колебания вектора S происходят в плоскости (ж, z): вектор S не имеет проекции на ось у. На рис. 4.6 б — линейно-по- линейно-поляризованная волна, также бегущая вдоль оси z. В этой волне колебания S происходят в плоскости (у, z) параллельно оси у, т. е. вектор S не имеет ж-компоненты (и, конечно, не имеет проекции на направление распростра- распространения z). В общем случае поперечная волна, бегущая вдоль оси z, может иметь как ж-проекцию *5Ж, так и у-проекцию Sy. Рассмотрим ситуацию, когда каждая из проекций представляет собой плоскую гармоническую волну одной и той же частоты: Sx = a\ cos (out — kz — ai), Sy = a% cos (out — kz — «2), D.27) где а\ и п2 — константы, начальные фазы каждой из волн Sx и Sy. Из D.27) следует (см. § 1.5), что в любой фиксированной плоскости z = const (пер- (перпендикулярной направлению распространения) конец вектора S описывает
388 ГЛ. 4. КИНЕМАТИКА ВОЛН эллипс. Поскольку разность фаз колебаний Sx и Sy не зависит от z (и рав- равна а\ — «2), то и эллипсы во всех плоскостях z = const одинаковы (они описываются одним и тем же уравнением). Таким образом, гармоническая поперечная волна является в общем случае эллиптически-поляризованной. В частности, при «2 — &\ = =Ьтг/2 из D.27) легко получить (упражнение для читателя): (Sx/aiJ + (Sy/a2J = 1, т. е. главные оси эллипсов совпадают с осями координат. Если, кроме того, сц = а? = а, то имеем уравнение окружности S2x + S2y = a2. В этом случае волна называется поляризованной по кругу: в любой плос- плоскости z = const конец вектора S описывает окружность. При «2 — оц — 0 из D.27) получаем уравнение прямой с _^с у " аг х' т. е. в любой момент времени конец вектора S находится на прямой, соста- составляющей угол ср (tgcp = A2/ai) с осью х — колебания S происходят вдоль этой прямой. Мы видим, что в любой фиксированной плоскости z = const колебания S происходят по одному и тому же направлению — вдоль пря- прямой, лежащей в первом и третьем квадрантах (рис. 4.7 а) т. е. мы имеем линейно-поляризованную волну. При «2 — oi\ = ±тг уравнение прямой есть с -_^с by- ^bx — вновь имеем линейно-поляризованную волну (рис. 4.7 б), однако коле- колебания S происходят вдоль прямой, лежащей во втором и четвертом квад- квадрантах. У s S2 Рис. 4.7 В общем случае, как отмечалось, конец вектора S описывает эллипс, со- совершая полный оборот за один период колебаний. Как определить направле- направление вращения вектора? Вернемся к эллиптически-поляризованной волне, в которой а,2 — ol\ = тг/2. Фиксируем плоскость наблюдения z = const и про- проследим за ориентацией вектора S в этой плоскости в различные моменты времени. Полагая kz + а\ = C\ и kz + «2 = /?2, перепишем D.27) в виде Sx = a\ cos (cut — /?i), Sy = CL2 cos (cut — /З2), и поскольку /?2 — /?i = тг/2, то Sx = a\ cos (cj? — /?i), S^ = —a2 sin (a;? — /?i).
ЗАДАЧИ 389 Из последних равенств следует, что в момент времени, когда cot — C\ = О, Sx — аъ Sy = 0, т. е. вектор S направлен вдоль оси х. На рис. 4.7 в его положение в этот момент изображено вектором Si. В последующие момен- моменты времени (когда 0 < cot — C\ < тг/2) 0 < Sx < ai, а Sy < 0, т. е. вектор S, повернувшись по часовой стрелке, занял положение, показанное на ри- рисунке вектором S2- Далее, при cot — /3i = тг/2 имеем Sx = 0, Sy = — п2 — вектор S занял положение, показанное вектором S3. Итак, мы видим, что вектор S вращается по часовой стрелке (с точки зрения читателя, к кото- которому направлен волновой вектор). Это — так называемая правая эллипти- эллиптическая поляризация. Читатель может самостоятельно убедиться в том, что при OL2 — oi\ — —тг/2 направление вращения меняется на противоположное {левая эллиптическая поляризация). Задачи 1. Покажите, что функция D.16) удовлетворяет волновому уравнению D.5). 2. Покажите, что функция 5*(r, t) = cos(ujt — k\v — го|) |r - r0 описывает сферическую волну, источник которой находится в точке го(жо, уо, zq). 3. Напишите выражение для комплексной амплитуды плоской волны, имеющей ампли- амплитуду а и распространяющуюся под углом а = тг/6 к оси z (вектор к лежит в плоскости (я, z)). 4. То же для плоской волны, распространяющейся вдоль оси z. 5. Напишите выражение для комплексной амплитуды сферической волны, источник которой находится в начале координат. 6. Докажите, что комплексные амплитуды плоской и сферической волн удовлетворяют уравнению Гельмгольца.
ГЛАВА 5 УПРУГИЕ ВОЛНЫ Мы погружены в океан волн, создающих особый таинственный и чару- чарующий мир звуков: рокот морского прибоя, звучание скрипичной струны, голоса людей — все это волны, рожденные в упругих средах. В этом разделе мы рассмотрим конкретные физические механизмы, при- приводящие к появлению упругих (акустических) волн в твердых телах, жид- жидкостях и газах. / / / / / / / / / / / / / z+Az 5.1. Продольные упругие волны в твердом теле Рассмотрим механизм распространения продольных упругих взаимодей- взаимодействий в стержне. Пусть ось z направлена вдоль оси стержня и пусть части- частицы, составляющие стержень, могут смещаться лишь вдоль оси z. Рассмотрим частицы, находящиеся в момент времени t в не- некоторой плоскости z = const и пусть в момент времени t' эти частицы сместились, оказавшись в плоскости z' = z + (, т. е. величина ( представляет собой смещение сечения z (рис. 5.1). Разные сече- сечения смещаются, вообще говоря, на разные рассто- расстояния ?, поэтому ? есть функция рассматриваемого сечения ( = ((z). Рассмотрим участок стержня между двумя се- сечениями z и z + Az (длина этого участка равна Az). Пусть в результате распространения упругих взаимодействий в стержне сечение z сместилось в положение zl', а сечение z + Az — в положение z' + Az'. Мы имеем 1 C(z) Az- / / / / ^ / / / z' »H i i -Az'— i / A / S \ У j— f A ' , \& ' \ ' 1 I / / z+ z 1 ] Az) | +Az' Рис. 5.1 = z + z + Az = z + Az + + здесь C,{z + Az) — смещение сечения z + Az. Длина рассматриваемого участка изменилась и стала равной (zf + Az') — —z' = Az1', а изменение его длины (удлинение) равно Az' — Az = ((z + Az) — —?(z). Отношение удлинения к первоначальной длине (относительное удли- удлинение) равно (((z + Az)-((z))/Az. В пределе, при Az —>> 0, эта величина называется продольной деформацией: с = Az az E.1)
а>0 5.1. ПРОДОЛЬНЫЕ УПРУГИЕ ВОЛНЫ В ТВЕРДОМ ТЕЛЕ 391 Если в данном сечении е > 0 (как на рис. 5.1), то произошло удлине- удлинение данного участка; если е < 0, то его сжатие. Итак, согласно определе- определению E.1), деформация e(z) есть производная от смещения ((z), т. е. на гра- графике функции ((z) тангенс угла наклона касательной в каждой точке дает величину e(z). Рассмотрим некоторое сечение стержня z = const (рис. 5.2). Если стержень деформируется (растягивается или сжимается), то левая (заштрихованная) часть стерж- стержня действует на правую часть с некотрой силой. От- Отношение этой силы к площади сечения стержня назы- z ? вается напряжением а. Условимся считать величину рис 5.2 а положительной, если правая часть стержня тянет левую часть вправо, в положительном направлении оси z (как на рис. 5.2). Далее мы будем полагать, что в стержне отсутствуют статические напря- напряжения, обусловленные механическими нагрузками, электрическими, маг- магнитными полями и т. д. Основной закон упругих взаимодействий (закон Гука), справедливый при малых деформациях, гласит: напряжение прямо пропорционально величине деформации: а = Ее, E.2) где Е — константа, называемая модулем Юнга. Покажем теперь, что распространение упругих взаимодействий, т. е. пе- передача деформации е от одного сечения стержня к другому, действительно представляет собой волновой процесс, т. е. величина е, зависящая от време- времени t и координаты z, подчиняется волновому урав- уравнению dz2 v2 dt2 Применим второй закон Ньютона к участку стер- стержня, заключенному между двумя сечениями z и рис ^ з z + Az (рис. 5.3). Масса рассматриваемого участка т = pqSAz (S — площадь сечения, ро — плотность). Пусть ( — смещение центра масс участка стержня, d2?/d?2 — его ускорение. Мы получаем PoSAz(d2(/dt2) = Sa(z + Az) - Sa(z) (в правой части равенства — сумма внешних сил, действующих на участок стержня Az со стороны прилегающих к нему частей стержня справа и сле- слева). Разделив обе части равенства на S-Az и перейдя к пределу при Az —>> О, находим: ро d2(/dt2 = da/dz, или, используя закон Гука: р0 d2(/dt2 = E de/dz. E.3) Согласно E.1), деформация е есть производная от смещения, т. е. de/dz = = d2(/dz2, поэтому окончательно получаем 7ГТ = -W^l^- E-4) dz2 E/po dt2
392 ГЛ. 5. УПРУГИЕ ВОЛНЫ Мы пришли к волновому уравнению, а это означает, что смещение ?B, t) распространяется по стержню в виде волн вида C = ((z±vt), E.5) причем скорость распространения волн (скорость звука в стержне) равна v = \Щр~ъ- E.6) Из E.6) следует, что скорость звука тем больше, чем жестче (больше Е) и легче (меньше ро) среда. Например, в стали (Е = 1,96 • 1010 Н/м2, ро = = 7,7 • 10 кг/м3) v ~ 5 000 м/с, примерно в пять раз больше, чем в свинце. Если смещение ( найдено (т. е. найдено решение E.5) волнового уравне- уравнения), то скорость, с которой движутся различные сечения z стержня, най- найдем, дифференцируя E.5) по t (при фиксированном z): z±vt), E.7) где (' означает производную по аргументу z ± vt. Волну деформации e{z, t) найдем, используя E.1): ф, t) = d(/dz = (f(z ± vt). E.8) Следует подчеркнуть, что волна смещений (как и волна деформаций) рас- распространяется вдоль стержня на сколь угодно большие расстояния (в со- соответствии с E.5) и E.8)). Однако сами частицы стержня, находящиеся в любом сечении, смещаются при этом лишь незначительно, приводя в дви- движение частицы соседних сечений, те в свою очередь передают свой импульс соседним частицам и т. д. — именно так малые смещения частиц стержня приводят к распространению волнового возмущения на большие расстояния. 5.2. Упругие волны в жидкостях и газах Рассмотрим жидкость или газ, заключенный в гладкой цилиндрической трубе. Быстрое (не квазистатическое!) изменение давления в прилегающем к поршню слое нарушают равновесное состояние: давление и плотность в различных сечениях трубы оказываются различными. Является ли процесс распространения возмущений вдоль оси трубы волной? Рассмотрим слой среды между плоскостями z и z-\- Az (рис. 5.1). Его ус- ускорение обусловлено разностью давлений в этих сечениях. Пусть давление в плоскости z равно po + Ap(z), а в плоскости z + Az — ро + Ap(z + Az). Используя второй закон Ньютона, получаем pSAz (d2?/d?2) = S (Ap(z) - Ap(z где ? — смещение центра масс участка среды, d2?/dt2 — его ускорение. Разделив обе части равенства на SAz и переходя к пределу при Az —>• 0, получаем Перепад давлений приводит не только к ускоренному движению участка среды Az, но и к его деформации — сжатию либо расширению, а следова- следовательно, к изменению плотности.
5.2. УПРУГИЕ ВОЛНЫ В ЖИДКОСТЯХ И ГАЗАХ 393 Пусть в невозмущенном состоянии давление в газе (или жидкости) равно Pq. При быстром смещении подвижного поршня, находящегося на левом кон- конце трубы, на расстояние ( (рис. 5.4) давление в тонком прилегающем слое изменится на величину Ар. Будем предполагать, что р ^0 В общем случае давление является функцией плот- ^° ^ ности р и температуры Т. В силу малой теплопровод- теплопроводности газов и жидкостей можно полагать, что процесс сжатия и разряжения данной массы жидкости или га- Р с 5 4 ~~ за (заключенного на участке трубы Az) происходит без обмена теплом с соседними участками, т. е. адиабатически. В этом слу- случае плотность и температура связаны уравнением адиабаты (в частности, для идеального газа Т = Т^(р/роO ? где 7 = cp/cv) и поэтому давление можно считать функцией лишь одного параметра — плотности, т. е. р = р(р). Тогда, при малых изменениях плотности, можно записать Ар= (dp/dp) Ар. E.10) Производная dp/dp берется в точке р = ро, ро = р(ро)- Величина Ар назы- называется акустическим давлением, это отклонение давления от равновесного значения при распространении акустической волны. Свяжем теперь изменение плотности с изменением давления, используя соотношение (ро + Ap)(Vo + AV) = pqVq = т (га — фиксированная масса газа между сечениями z ж z -\- Az). Получаем AV/Vq = е = -Ар/(Р() + Ар) « Ар/р0. Таким образом, формула E.10) приобретает вид Ар = -р0 (dp/dp) e. E.11) Как видно из E.11), роль модуля упругости играет в жидкости и газе вели- величина Е = р (dp/dp), причем Ар = —а (знак «—» указывает, что увеличение давления (Ар > 0) приводит к сжатию (е > 0)). Подставляя E.11) в E.9), приходим к волновому уравнению д2С _ 1 д2( dt2 ~ dp /dp dz2' в котором величина dp/dp представляет собой квадрат скорости распростра- распространения звуковой волны E.12) тзано E.13) где 7 = cp /cv. Формула E.13) имеет ясный физический смысл: передача возмущений в звуковой волне в газе осуществляется за счет теплового движения моле- молекул, поэтому не удивительно, что скорость звука равна по порядку вели- величины скорости теплового движения (равной лЛ;2 = y/3RT//J,). Сжимаемость жидкостей существенно меньше, чем газов, т. е. одинаковый перепад давле- В качестве примера рассмотрим идеальный газ: р = pRT. Как показано Лапласом, скорость звука в таком газе
394 ГЛ. 5. УПРУГИЕ ВОЛНЫ ний dp приводит к меньшему изменению плотности жидкости dp в сравнении с газом. Поэтому, в согласии сформулой E.12) скорость звука в жидкостях больше, чем в газах. Приведем характерные значения скоростей звуковых волн в некоторых средах: воздух v = 331 м/с, кислород v = 316 м/с, водород v = 1 265 м/с, вода v = 1 480 м/с, ртуть v = 1 460 м/с, медь v = 3 680 м/с, сталь г; = 4 980 м/с. Согласно принятой терминологии, акустические колебания с частотами v < 16 Гц называют инфразвуком, а с частотами v > 20 000 Гц и вплоть до у = Ю9 Гц — наиболее высоких полученных в настоящее время частот аку- акустических волн — ультразвуком. Собственно диапазон звуковых колебаний (т. е. слышимых человеком) черезвычайно широк и простирается от 16 Гц до 20 кГц. Наиболее чувствительно ухо человека к диапазону частот от 1 до 5 кГц. Соответствующие длины акустических волн в воздухе от 20 м до 2 см (звук) и от 2 см до 0,5 • 10~4 см (ультразвук). Гармоническое колебание на- называют в акустике чистым тоном, тембр звука определяется результатом суперпозиции колебаний кратных частот: основной частоты v\, определя- определяющей высоту звука и обертонов с частотами 2z^i, 3z^i, ..., амплитуды кото- которых, вообще говоря, меньше амплитуды основного тона. Различие в составе обертонов и отличает различные звуки по тембру. 5.3. Плотность и поток энергии в упругой волне. Вектор Умова Рассмотрим малый участок стержня Az. Его масса т = pSAz (S — пло- площадь поперечного сечения). При распространении в стержне звуковой волны происходит смещение вдоль оси z различных участков стержня ? = ?(z±vt)] рассматриваемый участок имеет скорость и = д^/dt = ±vC,' (напомним, ?' означает дифференцирование по аргументу z =Ь vt). Кинетическая энергия участка стержня есть ти2/2 = (l/2)pSAz-u2. На единицу объема приходит- приходится энергия WK = ри2/2, E.14) называемая объемной плотностью кинетической энергии. Распространение упругой волны сопровождается, как мы видели, деформацией различных участков стержня. Пусть для простоты левая граница участка Az (сечение 1 на рис. 5.5) неподвижна, а правая смещается на расстояние ( = sAz. Работа внешней силы F (упругой силы, действующей на выделенный участок со стороны прилегающего к нему участка справа) при растяжении участка Az на величину С есть 1 2 dC 3 / / / / / / , t — Az — с- ^- F рис< 5.5 Величина деформации е и, соответственно, уп- упругая сила F = EeS меняются в процессе дефор- деформации. При смещении сечения 2 (на рис. 5.5) на величину d? деформация участка стержня меняется на величину de, причем d? = Az de. Упругая сила F при заданной величине деформации, согласно закону Гука, есть F = SEs, а ее работа при смещении сечения 2 на d? равна
5.3. ПЛОТНОСТЬ И ПОТОК ЭНЕРГИИ В УПРУГОЙ ВОЛНЕ. ВЕКТОР УМОВА 395 Полная работа (при смещении правой границы на величину ?, которой соответствует конечная величина деформации б), есть Г Г Ег2 Ег2 А= Fd(= / SAzEe'de' = SAz —- = V—-, о о где V — объем кусочка стержня V = SAz. Работа внешних сил равна запасенной участком стержня потенциальной (упругой) энергии. На единицу объема приходится энергия Wn = Ц-, E.15) которая называется объемной плотностью потенциальной энергии. Общая плотность энергии (кинетическая плюс потенциальная) есть W = -(ри2 + Ее2). E.16) В бегущей волне ((z±vt) плотность энергии в данный момент времени рав- равна нулю там, где максимально смещение ?, так как при этом и = ±v(f = О и е = Е(' = 0 (см. E.7) и E.8)). Плотность энергии максимальна там, где и деформация ?, и скорость и максимальны (причем ежи максимальны в каждый момент времени в одном и том же сечении z, что ясно из тех же со- соотношений E.7) и E.8)). В бегущей гармонической волне ( = a cos (out ± kz) и ?7 = —a sin(c<;? =Ь kz) нулевым значениям смещения ? соответствует макси- максимум С,' и, следовательно, максимумы и и ?, а значит и максимум плотности энергии. Поток энергии. Вектор Умова. Найдем изменение энергии в куске стержня между сечениями 1 и 2 при распространении звуковой волны (рис. 5.3). Слева (в сечении 1) действует сила F\ = — a\S. Напомним, что а положительно, если правая от сечения часть стержня тянет левую вправо, в положительном направлении оси z, при этом часть стержня, находящая- находящаяся левее сечения 1, действует на выделенный участок с силой, направлен- направленной влево, т. е. должна быть отрицательной. Справа (в сечении 2) действует внешняя сила F2 = (J2S (при О2 положительном F2 > 0). Работа сил F\ и F2 за время dt равна F\u\ dt + F2U2 dt = —{g\U\ — G2U2)Sdt. Эта работа равна изменению энергии &W куска стержня за время dt dW/dt = -(alUlS - G2U2S). E.17) Введем плотность потока энергии, q = —аи. Тогда —qS — поток энергии через площадку S и формула E.17) выглядит так: dW/dt=(qi-q2)S. E.18) Равенству E.18) можно дать следующее толкование: увеличение энергии dW в куске стержня равно разности между потоком энергии q\ = —o\U\S, проникшем в кусок стержня через сечение 1 и потоком q2 = G2U2S, вытекшим из куска стержня через сечение 2. Векторная величина q = — сшп, E.19)
396 ГЛ. 5. УПРУГИЕ ВОЛНЫ где п — единичный вектор, направление которого совпадает с направлени- направлением распространения бегущей волны (осью z\ называется вектором потока энергии. Этот вектор впервые введен русским ученым Умовым, и его назы- называют также вектором Умова. Это аналог введенного в предыдущей части вектора Пойтинга — потока электромагнитной энергии. Аналогичным образом, поток энергии в акустической волне в газе или жидкости q = Арии. E.20) Среднюю величину потока энергии, переносимого акустической волной в единицу времени через единичную площадку (в направлении нормали) на- называют интенсивностью или силой звука. Для гармонической волны (С(^5 t) = acos(ct;t — kz\ a — амплитуда смещений частиц) находим и = d(/dt = — аш sin(ujt — kz); e = dQ/dz = ak sm(u)t — kz\ где k = uj/v — волновое число. Соответствующие волны напряжений a(z, t) или акустических давлений Ар можно найти с помощью E.2) и E.11): _ Еаио , . 7 ч . f dp\ аио . / 7 ч о = Ье = smiout — kz): Ар = о \ — — smfc^t — kz). v \dp/ v Для интенсивности (силы звука) в твердых телах получаем Т а2ш2Е . о/ , ГТ 1 2 2 r~F ! 2 2 1 = аи = sm (cut — kz) = - а ш у/pb = - а ш pv. Учитывая, что v = л/dp/dp, интенсивность звука в жидкостях и газах есть -г 1 2 2 /Ф 1 2 2 1 = /\ри = — а ш р\\ — = — а ш pv. Важно обратить внимание, что интенсивность пропорциональна квадрату амплитуды смещений. Из полученных соотношений легко найти связь между амплитудой аку- акустического давления и интенсивностью Ар0 = \j2pvl. E.21) Интересно отметить, что порог слышимости (минимальная слышимая ин- интенсивность звука) Iq c± 10~12 Вт/м2 и близок к предельно возможному: кинетическая энергия барабанной перепонки, колеблющейся под действи- действием теплового движения молекул воздуха примерно того же порядка, что и под действием пороговой акустической волны. Диапазон регистрируемых ухом человека интенсивностей огромен: «болевой порог» составляет при- примерно 1О12/о (такова сила звука на концерте рок-музыки в первых рядах). В силу столь большого диапазона удобно выражать интенсивность звука в децибеллах (обозначается /3): /3 = 10 lg — дб. Величина 1О1О/о составляет /3 = 100 дб, порог слышимости /3q = 0, а боле- )й порог C = 120 дб.
5.4. СТЕРЖЕНЬ, ЗАКРЕПЛЕННЫЙ НА КОНЦАХ 397 Акустические волны большой интенсивности создают в среде большие пе- перепады давлений. Амплитуда акустического давления Аро в волне с / с± 105 Вт/м2 составляет в воде, согласно E.21), Аро с± 6 атм, а большие градиенты акустического давления, возникающие при распространении уль- ультразвуковых волн, могут приводить к разрывам жидкости (т. е. к образова- образованию пустот). Это явление называется кавитацией. В приведенном примере при частоте ультразвука v = 106 Гц (А = 5 • 10~4 м) градиент акустического давления равен 2,40 • 104 атм/м. 5.4. Стержень, закрепленный на концах. Собственные моды колебаний Рассмотрим бесконечно длинный стержень, по которому бегут две встреч- встречные гармонические волны одинаковой частоты и амплитуды (д = a cos (u)t — kz); B = acos(u;t + kz + тг). Мы по прежнему говорим об упругих продольных волнах. Начальная фаза в волне ^2 выбрана так, чтобы в сечении z = 0 колебания встречных волн происходили в противофазе, т. е. так, чтобы смещение С = Ci + C2 частиц стержня в этом сечении в любой момент времени равнялось нулю. Сум- Суммарная стоячая волна ((z, t) = Ci(^ t) + BB, t) имеет вид С(г, t) = 2аsin kzsinut. E.22) Выделим мысленно кусок стержня длины L между сечениями z = 0 и z = Ьл подберем частоту и; встречных волн так, чтобы смещение ( в сечении z = L (также, как в сечении z = 0) было равным нулю в любой момент времени. Как ясно из E.22), для этого необходимо, чтобы sinfcL = 0, т. е. kL = птг (п — целое число). Так как к = 2тг/А, то последнее условие можно записать в виде L = nA/2. E.23) Или, поскольку частота и и длина волны А связаны соотношением и>\ = = 2тгг>, то и;п = nnv/L (n = 1, 2, ...) или vn = nv/BL). E.24) Используя E.6), можно последнее соотношение записать в виде сип = (шг/L) л/Щэ (п = 1, 2, ...). E.25) Итак, имеется дискретный набор частот с^п, при которых сечения z = 0 и z = L остаются неподвижными в любой момент времени (узлы стоячей волны E.22)). Соответствующие частотам и>п стоячие волны имеют вид (по- (поскольку к = 2тг/А = птг/L) (тг \ п — z) sinunt. E.26) Мы выяснили ранее, что поток энергии в стоячей волне равен тождествен- тождественно нулю (в любой момент времени) в тех сечениях z, где смещение равно нулю. Следовательно, выделенный нами кусок стержня длины L не обме- обменивается энергией с внешними частями, расположенными левее (при z < 0) и правее (при z > L). Если теперь в некоторый момент времени закрепить
398 ГЛ. 5. УПРУГИЕ ВОЛНЫ «намертво» сечения 2: = 0 и z = L, то волновое движение, описываемое формулой E.26), не изменится, поскольку и до закрепления эти сечения были неподвижны. Можно теперь обрезать внешние по отношению к это- этому куску участки стержня, убрав их — очевидно, что стоячая волна на оставшемся куске никак не изменится, он будет колебаться в согласии с уравнением E.26), не отдавая и не получая энергии извне. Разумеется, для возбуждения этого колебания никто не берет бесконечно длинный стержень, возбуждая в нем бегущие встречные волны, а затем обрезая в нужном месте кусок длины L. На самом деле поступают наоборот: берут стержень нуж- нужной длины L, закрепленный жестко на концах, а затем возбуждают в нем колебания одной из возможных частот и>п. Функции E.26) определяют возможные типы продольных упругих волн в стержне с закрепленными концами. Соответствующие частоты этих волн шп даются формулами E.24) или E.25). Гармонические стоячие волны Cn(^ t) называются собственными типами или собственными модами (или просто модами). Не отдавая энергию в местах закрепления (поскольку поток энер- энергии в этих местах равен нулю), такие колебания могут самоподдерживаться как свободные колебания гармонического осциллятора без затухания. Мо- Мода, отвечающая индексу п = 1, называется основной. Распределение амплитуды смещений по координате z: An {z) — 2а sin n — z определяет пространственную структуру разных типов колебаний. Эти рас- распределения для п = 1, 2, 3 показаны на рис. 5.6 (ау бу в). Еще раз обратим внимание на важное обстоятельство: если в бесконечном стержне возможно создать стоячую волну любой частоты w, то в стержне конечной длины L с закрепленными концами возможны лишь определенные, дискретные конфигурации стоячих волн с дискретным набором частот с^п, поскольку только такие типы стоячих волн могут удовлетворять граничным условиям (@) = ((L) = 0. Вывод, к которому мы пришли, носит достаточно общий характер: как только мы пытаемся «запереть» волновое движение в конечной области пространства, тут же возни- возникает дискретность возможных частот, дискретность воз- возможных конфигураций волн и дискретность возможных Рис. 5.6 значений энергии колебаний. Возможным типам стоячих волн смещений Cn(zi t) E.26) состветствуют стоячие волны скорости смещений un(z, t) = д(^п/dt и деформаций sn(z, t) = = d(n/dz. Мы получаем: un(z, t) = 2асоп sin (nnz/L) cosu)nt, sn(z, t) = 2(тт/Ь)асо8 (nnz/L) smu;nt. Рассмотрим энергетические превращения при колебаниях стержня. В про- процессе колебаний происходит обмен между кинетической и потенциальной ча- частями полной энергии (последняя, как мы выяснили, остается неизменной). Как видно из формул E.27), дважды за период скорость смещений un(z, t) и деформация стержня ?n(z, t) становятся равными нулю в любом сечении
5.5. ПОВЕДЕНИЕ ЗВУКА НА ГРАНИЦЕ РАЗДЕЛА ДВУХ СРЕД 399 стерэюня. Следовательно, дважды за период становится равной нулю кине- кинетическая энергия (un(z, t) = 0 при t = Т/4 и t = ЗТ/4) — ив эти моменты времени полная энергия колебаний — это потенциальная энергия упругой деформации: L Ie2{z)dz, E.28) где e(z) = ±Bтгп/Ь) a cos (nnz/L) (smu;nt = 1 при t = Т/4 и t = ЗТ/4). Аналогично, дважды за период обращается в нуль потенциальная энергия (en(z, ?)=0 при ? = 0 и ? = Т/2). В эти моменты времени энергия колеба- колебаний — это кинетическая энергия, равная ь WK = ^J pu2ndz, E.29) о где un(z) = ±2ашп sin (nirz/L). Поскольку полная энергия колебаний по- постоянна, то любую из формул E.28) или E.29) можно использовать для подсчета ее конкретного значения. В частности, из E.29) легко получить WK = a2uo2nV, E.30) где V — объем стержня, иоп определяется формулой E.25). Основной тип ко- колебаний имеет наинизшую энергию, поскольку ему соответствует наинизшая частота. Энергия n-го типа пропорциональна п2. Формула E.30) определяет возможные дискретные значения энергии колебаний. 5.5. Поведение звука на границе раздела двух сред Рассмотрим плоскую звуковую волну (д = а\ cos(c<;? — k\z), E.31) распространяющуюся в однородной среде I в области z < 0, рис. 5.7. Вол- Волна распространяется слева направо, в положительном направлении оси z, к\ = ujjv\ — волновое число, v\ — скорость звука в сре- среде I. Плоскость z = 0 является границей раздела двух I сред. Область z > 0 занята средой II, скорость звука в ^ » которой V2 ф v\ (напомним, что скорости v\ и V2 зависят Т, от упругих свойств и плотности сред (см. E.6)). -—*— Что происходит с волной Ci(^5 ?)? падающей на грани- рис ^ у цу раздела? В соответствии с тем, что подсказывает нам опыт, предположим, что возникает волна, прошедшая во вторую среду С2(^5 t) = п2 cos(u;t — k2z\ E.32) где &2 = cj/^2, а в первой среде кроме волны Ci(^ ^)? бегущей слева направо и падающей на границу раздела, возникает отраженная волна Ci(^j t) = a'i cos(c<;t + k\z). E.33) Обратите внимание на знак «+» в аргументе косинуса: отраженная волна бежит справа налево; кроме того, волновое число этой волны то же, что и II 0
400 ГЛ. 5. УПРУГИЕ ВОЛНЫ в падающей волне, так как обе они распространяются в среде I. Суммарная волна в среде I есть Ci(^5 t) + Cita t) = a\ cos(u;t — k\z) + a[ cos(u;t + k\z). E.34) Наша задача: найти амплитуды отраженной волны а[ и волны, прошедшей во вторую среду a2l зная амплитуду падающей волны а\. Воспользуемя условиями на границе z = 0. Во-первых, одно и то же сме- смещение границы (*(?) можно выразить как через волновое возмущение E.34) в первой среде, так и через волновое возмущение E.32) во второй среде; равенство волновых возмущений при z = 0 есть: Ci@,*) + Ci@,*) = C2@,*). E.35) Во-вторых, упругая сила (на единицу площади), действующая со стороны первой среды на вторую, равна по величине силе, действующей со стороны второй среды на первую: ai@, t) + ai@, t) = <72@, t), E.36) где a = E (d(/dz). Подставляя выражения E.33) и E.34) (при t = 0) в гра- граничное условие E.35), получаем (сокращая на общий множитель cosc^t) а\ + а[ = а,2- E.37) Аналогичным образом, дифференцируя функции E.33) и E.34) по z и ис- используя граничное условие E.36), находим (сокращая на sinc^t) Sifci(ai - а[) = Е2к2а2. E.38) Из E.37) и E.38) имеем выражения, которые связывают амплитуды отра- отраженной и прошедшей волны с амплитудой падающей волны 1—7 2 а[ = —— аъ а2 = —¦— аь E.39) 1+7 1+7 Мы использовали обозначение 7 = Е2к2/Е\к\ = yjp2E2jyjр\Е\. Используя выражения для среднего потока энергии q в упругой среде за период колебаний E.49), можно найти величины R = q[/qi (коэффициент отражения) и Т = q2/q[ (коэффициент прозрачности): /1 — \ 2 R = (гт^) ' т = 47/A+7J- E-40) 5.6. Поперечные волны в струне Рассмотрим натянутую струну, ось которой совпадает в равновесии с осью z. Рассмотрим распространение поперечных упругих волн в струне, причем будем рассматривать смещения, происходящие в плоскости (у, z). Пусть струна выведена из положения равновесия; смещение куска стру- струны Az (между точками z ж z -\- Az) в данный момент времени t есть rj(z, t) (рис 5.8). Будем полагать далее, что натяжение струны (равное при равно- равновесии а) столь велико, что при малом смещении из положения равновесия
5.6. ПОПЕРЕЧНЫЕ ВОЛНЫ В СТРУНЕ 401 оно остается практически неизменным и равным по прежнему а в любом сечении: a(z) = a(z + Az) = а. Напомним, что а — сила, действующая на единицу площади выделенного участка струны со стороны участков, прилегаю- прилегающих слева и справа. Уравнение движения (второй закон Ньютона) для куска струны Az, масса которого равна pSAz, имеет (в проекции на ось у) вид: d77 ——^ = aS[sma(z + Az) — У л o(z+Az) a(z+Az) z z z+Az Рис. 5.8 где a{z) — угол между направлением касатель- касательной к струне в точке z и осью z: tg a = drj/dz. Полагая (для малых отклонений), что sin a « tga = drj/dz, получаем pAz(d2r]/dt2) = a ((dr]/dz)z+Az — (dr]/dz)z). Разделив обе части последне- последнего равенства на Az и перейдя к пределу при Az —>> 0, получаем волновое уравнение &vp^l E41) Согласно E.41), скорость распространения упругих волн в струне v = л/^/р. E.42) Возможными решениями уравнения являются волны вида ф, t) = Acos(ut ± kz), E.43) бегущие слева направо (знак «—» в E.43)) и справа налево (знак «+» в E.43)), а также их суперпозиция — стоячая волна rj(z, t) = A cos kz cos out. Понятно, что мы имеем дело с поперечными волнами, поскольку, согласно E.43), волны распространяются вдоль оси z, а смещения частиц струны про- происходит в направлении у, т. е. перпендикулярно направлению распростра- распространения (напомним, что в случае стержня речь шла о продольных волнах). Волновое число к в E.43) есть к = w/v = uj^/pjo. Рассуждения, которые мы провели, исследуя продольные упругие волны в стержне, закрепленном на концах, полностью применимы к натянутой стру- струне. В частности, возможные типы колебаний описываются теми же форму- формулами: возможны лишь такие стоячие волны, для которых на струне укла- укладывается целое число полуволн: L = nA/2. Соответствующие частоты колебаний иоп = nnv/L = птг/L л/сг/р или vn = nv/BL) = n y/a/p/L. Возможные типы стоячих волн определяются формулой r]n(z, t) = AcosnGr/L)z • cosount. E.44)
402 ГЛ. 5. УПРУГИЕ ВОЛНЫ 5.7. Общие выводы Мы рассмотрели несколько физических систем, в которых возбуждаются упругие волны: продольные упругие волны в твердых телах, жидкостях и газах, а также поперечные волны в натянутой струне. Во всех случаях мы пришли к выводу, что возникшее в среде возмущение распространяется в ви- виде волны, т. е. удовлетворяет одному и тому же уравнению D.4), в котором константа г>, имеющая смысл скорости распространения волны, определяет- определяется физическими параметрами невозмущенной системы: модулем упругости Е и плотностью в случае твердого тела, величиной dp/dp в равновесном со- состоянии в случае газов, натяжением при равновесии а и плотностью в случае поперечных колебаний струны. Этот результат обусловлен тем, что при вы- выводе волнового уравнения мы каждый раз делали предположение о малости возмущений: исследуя продольные волны в стержне, мы предполагали, что справедлив закон Гука — линейная связь между напряжением а и величи- величиной деформации е — закон, справедливый лишь при малых деформациях. При изучении волн в газах мы полагали, что имеет место линейная связь между изменением давления и изменением плотности газа, а это справедли- справедливо лишь при малых изменениях давления (малых в сравнении с давлением в газе в стационарных условиях). При выводе волнового уравнения для на- натянутой струны мы также предположили, что струна мало отклоняется от положения равновесия, поэтому неизменным (и равным стационарному зна- значению) остается величина натяжения струны при колебаниях. Именно благодаря предположению о малости возникающих возмущений, мы каждый раз приходили к линейному уравнению, для которого спра- справедлив принцип суперпозиции: если в системе возможны волны Si(z, t) и S^^, ^)? TO возможна и волна вида где а\ и а2 — произвольные постоянные. Другими словами, если S\ и S2 есть решения уравнения D.4), то и функция S(z, ?), являющаяся линейной комбинацией решений Si и S2, также есть решение. В частности, мы выясни- выяснили, что стоячие волны Cn(z, t), описываемые соотношением E.26), являются собственными типами продольных упругих волн (модами) для стержня дли- длины L, закрепленного на концах. Следовательно, в таком стержне возможно и волновое возмущение вида , t) = Y^ an(n(z, t) E.45) при произволных постоянных ап. Ясно, что, во-первых, функция E.45) явля- является решением волнового уравнения E.4) и, во-вторых, подчиняется гранич- граничным условиям на концах ((z, t) = 0 при z = 0 и z = L. Последнее очевидно, поскольку каждое слагаемое в E.45) обращается в нуль на закрепленных концах стержня. Более того, как доказывают математики, любая возможная волна в стерж- стержне с закрепленными концами может быть представлена (при правильном подборе коэффициентов ап) линейной суперпозицией собственных типов волн, т. е. в виде E.45). Конкретный вид волны, т. е. конкретный набор коэф-
5.8. ЭФФЕКТ ДОПЛЕРА 403 фициентов зависит от начальных условий — от способа создания волнового возмущения. Уравнение, описывающее волновой процесс, перестает быть линейным, если возмущение не является малым: изменение давления при распростра- распространении волны в газе не мало по сравнению со стационарным значением ро; деформация твердого тела при распространении упругой волны велика на- настолько, что закон Гука нарушается; отклонение струны при колебаниях столь велико, что натяжение изменяется. При этом нарушается принцип суперпозиции. Физически это связано с тем, что волна большой амплитуды изменяет свойства среды, в которой она распространяется. В конечном счете это приводит к тому, что параметр г>, входящий в волновое уравнение, уже не определяется только характеристиками невозмущенной среды, он начинает зависеть от амплитуды волны, если амплитуда не мала. Ясно, что волно- волновое уравнение D.4), в котором v есть функция возмущения S (v = v(S)), нелинейно, что и приводит к нарушению принципа суперпозиции. Одно из проявлений нелинейности — изменение формы волнового воз- возмущения по мере распространения волны. Дело в том, что при звуковых возмущениях волновые поверхности, соответствующие местам сильных (не- (нелинейных) сжатий упругой среды, бегут с большей скоростью, чем поверх- поверхности, в которых среда разрежена, т. е. горбы деформаций бегут быстрее «впадин», что и приводит к изменению формы волны, к увеличению крутизны волновых фронтов, отвечающих >^ v a) участкам сильных сжатий. "^ \~ ~7* Первоначально синусоидальная упругая волна боль- ^^.^ б) шой амплитуды (рис. 5.9 а) становится по мере распро- s \ /^ странения в среде несинусоидальной (рис. 5.9 б' и в), а \^/ следовательно, немонохроматической: возникают вол- ^^-^ в) ны различных частот из первоначального гармониче- s^ 1 /^\ ского колебания. \у \^~ Примером нарушения линейности является ударная волна, возникающая в упругой среде при взрыве или г не. о.У при движении в ней тела со сверхзвуковой скоростью. Летящий со сверх- сверхзвуковой скоростью самолет приводит в движение слой газа перед собой, который также движется со сверхзвуковой скоростью. Возникший поток газа сжимает впереди лежащие слои и, поскольку это сжатие не успева- успевает столь же быстро передаваться впереди лежащим слоям «естественным» образом (за счет теплового движения) — такая «естественная» передача осуществляется со звуковой скоростью, — то возникает слой с большим пе- перепадом давления, плотности и температуры. Условие Ар <С ро нарушается. Тонкий слой, ширина которого порядка длины свободного пробега молекул, называется скачком уплотнения, а распространяющаяся волна — ударной волной. Наконец, для некоторых нелинейных систем деформации поверхно- поверхности согласуются со скоростью волнового возбуждения таким образом, что возникает уединенная нелинейная волна — солитон. 5.8. Эффект Доплера Пусть в однородной и изотропной упругой среде находится маленький пульсирующий шарик, радиус которого меняется по гармоническому закону с частотой ujq. Такой шарик является источником акустической (упругой)
404 ГЛ. 5. УПРУГИЕ ВОЛНЫ волны. Сферические волновые поверхности (поверхности сжатий и разря- разряжений) бегут от источника со скоростью звука с3. Если источник не пе- перемещается, то центры всех сфер, всех волновых поверхностей, бегущих от источника одна за другой, находятся в одном месте, в точке S, где находится источник. Пусть теперь источник движется вдоль оси z со скоростью v (рис. 5.10). В момент времени t = 0, когда источник находится в точке Si, от источника начинает бежать волновая поверхность, например, поверхность максималь- максимального сжатия, которая достигает приемника, находящего- /''\ ся в точке наблюдения Р, в момент времени т\ = S\P/c3. Следующая волновая поверхность максимального сжатия излучается через время Tq (через период колебания), ко- когда источник уже находится в точке S2, пройдя за это вре- время расстояние Рис. 5.10 Положение приемника определяется углом в — напра- направлением на точку наблюдения, которая, как мы полагаем, находится столь далеко, что прямые SiP и S2P можно считать параллель- параллельными, поэтому SiP — S2P = S1S2 cos в = vTq cos в. Когда очередная поверхность максимального сжатия (излученная из точ- точки S2) достигнет приемника? Очевидно, в момент времени где S2-P/C3 — время распространения возмущения из точки S2 до точки Р. Интервал времени между моментами прихода двух последовательных вол- волновых поверхностей одинаковой фазы колебания — это и есть период коле- колебаний Т, регистирируемых приемником Из последнего равенства получаем окончательное выражение, связываю- связывающее частоту излучения, регистрируемого приемником и; = 2тг/Т, с частотой колебаний источника с^о = 2тг/ТЬ При v/c3 жение 1 — {v/c3)cos в 1 из E.46) следует приближенное выра- выраи; « с^о A + {v/c3) cos в). E.47) Рис. 5.11 Пусть теперь источник неподвижен, а приемник дви- движется в направлении, образующем угол в с прямой, соединяющей источник и приемник. Пусть в момент времени t = 0 приемник находится в точке Р\ на одной из волновых по- поверхностей, бегущих от источника со скоростью с3 (пусть, например, это поверхность максимального сжатия AqAq, рис. 5.11). Через отрезок време- времени t приемник, двигаясь со скоростью v из точки Pi, встретит следующую поверхность максимального сжатия — поверхность В В в точке Р2. (В мо- момент t = 0 поверхность В В находилась в положении BqBq на расстоянии Aq = c3Tq от поверхности AqAq, и за время t переместилась в положение ВВ,
ЗАДАЧИ 405 пройдя расстояние с3Т.) Время t между моментами регистрации приемни- приемником двух последовательных поверхностей максимального сжатия — это и есть период колебаний, регистируемых движущимся приемником. Мы имеем: PiР2 = vT; DPX = с3(Т0-Т) и из AP^D vTcos в = с3(Т0-Т). Окончательно получаем (так как Т=2тг/ш, Tq = 2тг/шо): ш = coo (I + (v/c3) cos в). E.48) Изменение частоты колебаний, регистирируемых неподвижным приемни- приемником при движении источника E.46), либо изменение частоты, регистрируе- регистрируемой движущимся приемником при неподвижном источнике, формула E.48), называется эффектом Доплера. Как следует из сравнения этих формул, не безразлично, что движется относительно среды — источник или приемник, однако при малых скоростях v <С с3 обе формулы дают одинаковый результат. Задачи 1. По заданному графику мгновенного распределения смещений ?(z) по длине стержня (рис. 5.12 а) постройте график скоростей u(z) и деформаций e(z) для волны, бегущей слева направо и справа налево. 2. По заданной осциллограмме смещений ?(?) (в фиксированной плоскости z, рис. 5.12 б) постройте осциллограммы скорости u{t) и деформации (напряжения) в волне, бегущей слева направо. 3. По стержню распространяются две встречные волны одинаковой частоты и ампли- амплитуды. Найдите результирующую волну смещений ?(z, t), скоростей u(z, t) и деформаций e(z, t). Изобразите графики u(z) и e(z) при фиксированном t. с, С Г\ Г\ о\7 \У б Рис. 5.12 Рис. 5.13 4. Изобразите моментальные снимки распределения деформации e(z) и скорости u(z) в волне сжатия, бегущей по стержню, если соответствующий снимок смещений ?(z) имеет вид, показанный на рис. 5.13 а. 5. Решите ту же задачу для волны разряжения (рис. 5.13 б). 6. Найдите изменение скорости звука в воздухе при изменении температуры от —10 °С до+20°С. 7. Вычислите скорость звука в стальном стержне. 8. Выведите формулу E.13) для скорости звука в идеальном газе. 9. Найдите мгновенное распределение потока энергии в бегущей волне ?(z, t) = = acos(out — kz) как функции координаты z\ постройте график зависимости u(z), <j(z) и P(z). Найдите точки максимумов и минимумов потока энергии. 10. Покажите, что средний за период колебания поток энергии в бегущей волне ? = = a cos (ut — kz) одинаков через любое сечение z и равен т ± E.49)
406 ГЛ. 5. УПРУГИЕ ВОЛНЫ 11. Найдите поток энергии, протекающий через единичное сечение за один период колебания. Ответ: qT = тгка2Е. 12. Найдите скорость смещения и и деформацию е как функции z и t в стоячей упру- упругой волне. 13. Найдите поток энергии в стоячей волне как функции координаты z и времени t] найдите расстояние между сечениями z, поток энергии через которые равен нулю в лю- любой момент времени. Найдите полную энергию стоячей волны между двумя ближайшими сечениями, поток энергии через которые равен нулю. Каков закон изменения во време- времени кинетической и потенциальной энергии, заключенной между ближайшими сечениями, поток энергии через которые равен нулю. 14. Постройте графики мгновенных распределений скоростей un(z, t) вдоль оси стержня в моменты времени t = 0, t = Т/4, t = ЗТ/4 для типов колебаний с индексами п = 1, п = 2, п = 3. 15. Постройте графики мгновенных распределений деформаций en(z, t) вдоль оси стержня в моменты времени t = 0, t = Т/4 и t = ЗТ/4 для тех же типов колебаний. 16. Каковы осциллограммы (зависимости от времени) скоростей un(t) и деформаций ?n(t) в фиксированном сечении z = L/4 для типов колебаний п = 1, 2, 3. 17. Постройте осциллограммы скоростей и деформаций в сечениях z = L/4 и z = 3L/4 для типов колебаний п = 1, 2, 3. 18. Показать, что сумма потоков энергии в отраженной и прошедшей волнах равна потоку энергии в падающей волне. 19. Показать, что при р\Е\ = Р2Е2, j = 1 ж R = 0, Т = 1, т. е. вся энергия проходит во вторую среду — отражения нет. 20. Показать, что при 7 = 0 и 7 = сю, R = 1, Т = 0, т. е. нет прошедшей волны — вся энергия возвращается в первую среду. 21. Показать, что коэффициенты отражения и прохождения не зависят от того, с какой стороны волна падает на границу раздела двух сред. 22. Используя E.39), покажите, что п2 всегда имеет тот же знак, что и ai, т. е. колебания в прошедшей волне на границе z = 0 происходят синфазно с колебаниями в падающей волне. 23. Показать, что на границе z = 0 колебания в отраэюенной волне происходят синфаз- синфазно с колебаниями в падающей волне (а[ и а\ имеют одинаковый знак), если 7 < 1- Если же 7 = v\jv2 > 1, то а[ и а\ имею разные знаки, т. е. колебания в отраженной волне происходят в противофазе с колебаниями в падающей волне. 24. Как зависит константа 7 от плотности р и модуля упругости Е первой и второй среды? 25. Рассмотрите предельные случаи 7 = 0 и 7 = оо (когда нет прошедшей во вторую среду волны и а[ = ±ai). Покажите, что при этом в первой среде возникает стоячая волна с пучностью смещений на границе z = 0, если j = 0 и узлом на той же границе, если 7 = сю. Какой из этих случаев реализуется, когда звуковая волна в воздухе падает на границу с металлом?
ГЛАВА 6 ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Мы живем в мире электромагнитных волн. Радиоволны и волны види- видимого диапазона, инфракрасные и ультрафиолетовые волны, рентгеновские и 7-лучи — все это электромагнитные видимый свет волны различного диапазона частот. t—*—* Особое место в этом многообразии за- 4-10, .7,6-10 нимают волны видимого света. Хотя 1011 10~8 \ / 10~4 ^ м на шкале электромагнитных волн они I I j I I J\ I I | I ~ Занимают Не СЛИШКОМ МНОГО Места (СМ. у-лучи рентген УФ И К радиоволны рис. 6.1), именно с помощью света мы рис g ^ получаем подавляющее количество информации об окружающем мире, о многообразии форм, красок, оттенков, воспринимаемой с помощью тончайшего органа зрения, которым наградила нас природа. Что же такое электромагнитные волны, какие законы природы ими упра- управляют? 6.1. Уравнения Максвелла и волновое уравнение Все многообразие электрических и магнитных явлений описывается че- четырьмя универсальными соотношениями — уравнениями Максвелла, кото- которые в электромагнетизме играют столь же фундаментальную роль, как и законы Ньютона в классической механике. Два из этих четырех соотноше- соотношений связывают между собой электрическое и магнитное поля. Во-первых, меняющееся во времени магнитное поле В порождает электри- электрическое поле Е (закон электромагнитной индукции): / Etdl = - f BndS. F.1) (О E) В левой части равенства F.1) — циркуляция вектора Е по произвольному замкнутому контуру /. В правой части — скорость изменения потока вектора В через поверхность *S, натянутую на контур (см. рис. 6.2), В — производная по времени поля В. Во-вторых, переменное электрическое поле D является источником маг- магнитного поля Н: & Нг d/ = Г Dn dS. F.2) (О (s) В левой части последнего равенства — циркуляция магнитного поля Н по произвольному замкнутому контуру, в правой части — скорость изменения
408 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ В поверхность S Рис. 6.2 потока вектора D через поверхность S (D — производная по времени по- поля D). Так и рождаются электромагнитные волны: если в какой-либо точке про- пространства возникло меняющееся электрическое поле (Dn ^ 0), то в соот- соответствии с F.2) возникает магнитное поле, которое, изменяясь во времени, порождает в соответствии с F.1) электрическое поле. Так, взаимно индуцируя друг друга, «зацепляясь» друг за друга, возникают меняющиеся во времени электриче- электрическое и магнитное поля — возникает электромагнитная волна. Почему именно волна? Как это следует из зако- законов F.1) и F.2)? Мы рассмотрим наиболее простую ситуацию: однород- однородную изотропную среду, свойства которой характеризуют- характеризуются двумя параметрами: константами е (диэлектрическая проницаемость среды) и \i (магнитная проницаемость). Как известно, эти величины связывают между собой поля Е и D; В и Н (так называемые материальные уравнения): D = ?0?Е, В = /io/iH. F.3) Напомним, что равенства F.3) не являются универсальными и справедли- справедливы лишь для линейной среды, свойства которой не зависят от того, имеются ли в среде поля или их нет, велики эти поля или малы. В рассматриваемой нами среде нет токов, поэтому в правой части уравнения F.2) отсутствует слагаемое, содержащее токи проводимости. Будем полагать далее, что поля Е и В (а значит, и D и Н) зависят лишь от одной координаты, например, координаты z и, разумеется, от времени: ТТЛ ТТЛ / I \ "|~> "|~> / I \ Это означает, что в любой плоскости z = const величина поля В (как и Е) одна и та же в любой момент времени во всех точках этой плоскости. Используя F.3), перепишем уравнение F.2), введя обо- дггиш 1д4 значение с = 1/^/EqJIq, в виде С У Л D Рис. 6.3 z @ E) константы е и \i вынесены из-под знака интегралов. Применим уравнения F.1) и F.2) к контуру ABCD, в котором АВ = CD = / и AD = ВС = Az. Контур у ABCD лежит в плоскости xz, см. рис. 6.3 (стрелками показано положи- положительное направление обхода). Мы получаем Ex(z + Az)l - Ex(z)l = -ByAzl, Bx(z + Az)l - Bx(z)l = Щ EyAzl. F.5) Вклад в контурный интеграл участков AD и СВ бесконечно мал при Az —)> 0. Разделив левые и правые части равенств F.5) на Az и переходя к пределу при Az —>> 0, находим: 8z дВу dt ЭВХ дЕу dt F.6)
6.1. УРАВНЕНИЯ МАКСВЕЛЛА И ВОЛНОВОЕ УРАВНЕНИЕ 409 Аналогичным образом, применив уравнения F.1) и F.2) к контуру ADMN (этот контур лежит в плоскости (у, z\ AN = DM = /), получаем dz dt ' dz с2 dt ' Выпишем отдельно пару уравнений из F.6) и F.7), содержащих только дЕх _ дВу дВу _ ец дЕх поля Ех и Ву F.8) UZ UL UZ C" UL Другая пара содержит поля Еу и Вх dEy _ dBx dBx _ eji_ dEy dz " dt' dz " c2 dt' [ ' } Мы видим, что пара полей (Ех, Ву) совершенно не связана с другой па- парой (Еу, Де), т. е. изменяющиеся во времени и пространстве поля Ех и Ву могут существовать совершенно независимо от другой пары Еу и Вх. Рас- Рассмотрим одну из этих пар, например Ех и Ву. Продифференцируем первое из уравнений F.8) по z, а второе — по t. Мы получим d2Ex d2By d2By efji d2Ex dz2 =~dtdz' dzdt =~^ dt2 ' Исключая смешанную производную d2By/dtdz = d2 By jdzdt из этой пары уравнений, получаем %TF- F10) Мы пришли к замечательному результату: поле Ex(z, t) подчиняется вол- волновому уравнению, т. е. изменение во времени и пространстве электриче- электрического поля Ех происходит по законам распространения волн, в частности, описывается функцией вида Ex(z, t) = Ex(z±vt). Эта функция, как мы знаем, описывает волну, распространяющуюся вдоль оси z (в положительном, либо в отрицательном направлении оси z), причем скорость волны v, как следует из F.10), есть v = с/у/ёЦ. F.11) Константа с определяет скорость электромагнитной волны в вакууме (е = = /i = 1) и равна с ~ 3 • 108 м/с. Это одна из самых замечательных мировых констант в физике. Мы могли бы, дифференцируя первое из уравнений F.8) по ?, а второе — по z, получить (исключив из системы смешанную производную d Ex/dzdt = = d2Ex/dtdz) волновое уравнение для магнитного поля Ву: d2By _ ец d2By dz2 ~# dt2 '
410 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ т. е. точно такое же волновое уравнение, что и F.10). Этому уравнению под- подчиняется волновой процесс вида By(z, t) = By(z±vt). Волна By бежит вдоль оси z с той же скоростью, что волна Ех. Эта пара волн (Дя, By) представляет собой бегущую вдоль оси z плоскую электромаг- электромагнитную волну, в которой поле Е имеет только ж-компоненту, поле В имеет только у-компоненту, т. е. колебания полей Е и В происходят в плоскости, перпендикулярной направлению распространения — оси z. Итак, плоская электромагнитная волна поперечна (и в этой волне колебания полей Е и В — взаимно перпендикулярны). Рассмотрев таким же образом пару уравнений F.9), мы пришли бы к ана- аналогичному выводу: волны Ey(z ± vt) и Bx(z ± vt) образуют плоскую элек- электромагнитную волну, бегущую вдоль оси z, в которой неразрывно связаны между собой (взаимно индуцируют друг друга) поля Еу и Вх, эта электро- электромагнитная волна также поперечна. Вернемся к электромагнитной волне (Ех, Ву). Пусть изменения Ех в волне описываются некоторой функцией f(z±vt): Ех = f(z±vt), а изменения Ву — функцией g(z =Ь vt): By = g(z =Ь vt). Используя правило дифференцирования сложной функции, найдем: 0Ex/dz = /', dBy/dt = (±v)g', где штрих означает дифференцирование по аргументу (z ± vt). Первое из уравнений F.8) как раз и связывает между собой производные dEx/dz и dBy/dt: Г = (±vW. Интегрируя последнее равенство, получаем / = ±vg + const. Знак «+» в последнем равенстве относится к волне, бегущей слева направо (т. е. к аргументу z — vt), а знак «—» к волне, бегущей справа налево (к аргу- аргументу z+vt). Произвольная постоянная в последнем равенстве представляет собой некоторое статическое поле, которое нас не интересует, поскольку оно не связано с переменными полями, образующими волну. Полагая поэтому const = 0, находим Ех = ±vBy или Ех = F.12) Рис. 6.4 где /л = Итак, в бегущей плоской электромагнит- электромагнитной волне поля Е и В в каждый момент времени в каждой точке пространства пропорциональны друг другу. На рис. 6.4 по- показана «мгновенная фотография» — расп- распределение полей Е и В как функции коор- координаты z в некоторый момент времени t для волны, бегущей слева направо. На рисунке показано, что Ех максимально в данный момент времени в той же точке, что и Ву. Нулевому значению Ех соответствует и нулевое значение Ву, причем при Ех > 0, Ву > 0 (знак «+» в формуле F.12)). Волна, бегущая справа
6.2. ПОЛЯРИЗАЦИЯ ЭЛЕКТРОМАГНИТНЫХ ВОЛН 411 налево показана на рис. 6.5. Отметим, что положительному полю Ех отве- отвечает отрицательное значение Ву. До сих пор мы не конкретизировали вид функций, описывающих электро- электромагнитную волну. Важным конкретным видом плоской электромагнитной волны является монохроматическая волна Ех = Ео cos(u;t - kz), Ву = Во cos(u;t - kz), F.13) причем в согласии с F.12) Eq = ±с/у/ёЦВо, к = (ио/с)у/Щ1 — волновое чи- число. Мгновенная фотография этой волны (бегущей слева направо) показана Рис. 6.5 Рис. 6.6 на рис. 6.6. Можно убедиться (упражнение для читателя), что функции Ех и Ву, описываемые соотношениями F.13), удовлетворяют волновому урав- уравнению. 6.2. Поляризация электромагнитных волн Уравнения F.8) и F.9) показывают, что могут независимо существовать две электромагнитные волны, распространяющиеся в положительном на- направлении оси z. В одной из них вектор Е колеблется в плоскости xz парал- параллельно оси ж, а вектор В — в плоскости уz параллельно оси у. В другой вол- волне, наоборот, колебания поля Е происходят в плоскости yz, а колебания поля В — в плоскости xz. Каждую из этих волн называют плоско-поляризованной (или линейно поляризованной, см. гл. 4.3 — векторные волны), поскольку электрическое и магнитное поля сохраняют неизменной плоскость колеба- колебаний. Назовем первую из этих двух независимых волн ж-волной (по напра- направлению колебаний вектора Е), а вторую — у-волной. Если существуют одновременно обе волны, то суммарный вектор Е может менять свою ориентацию в пространстве, оставаясь, разумеется, в плоско- плоскости, перпендикулярной оси z. В дальнейшем мы будем говорить об элек- электрическом поле волны, поскольку воздействие на регистрирующие приборы связано, в основном, с электрическим полем. Рассмотрим суперпозицию двух плоских монохроматических волн, бегу- бегущих в положительном направлении оси z (ж-волны и у-волны). Колебания в некоторой фиксированной плоскости z = const можно записать в виде Ех = Ey = где ai и a2 — амплитуды волн, (fi и (f2 — начальные фазы: (fi = kz + ai, (f2 = kz + OL2- Задача сложения двух взаимно-перпендикулярных колеба- колебаний одинаковой частоты была рассмотрена в гл. 1.5. Мы выяснили, что в общем случае конец суммарного вектора описывает эллипс, вид которого зависит от амплитуд и разности фаз Аср = ср2 — ц>\ слагаемых колебаний. В частных случаях Аср = 0 и Аср = ±тг результирующая волна оказывается
412 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ линейно-поляризованной — эллипс вырождается в прямую. Плоскость коле- колебаний суммарного вектора Е при А(р = 0 ориентирована так, как показано на рис. 1.14 б', а при Аср = ±тг — как на рис. 1.14 г. При Аср = ±тг/2 оси эллипса совпадают с осями хжу (рис. 1.14 в). Если, кроме того, а\ = п2, то получаем круговую поляризацию — конец суммарного вектора описывает окружность (рис. 1.14 д). В гл. 1.5 мы обсуждали вопрос о направлении вращения сум- суммарного вектора в фиксированной плоскости z = const. Рекомендуем чита- читателю еще раз вернуться к этому обсуждению. Пространственную структуру эллиптически поляризованной волны поясняет рис. 6.7 (на при- примере волны с левой круговой поляризацией). Винтовая линия, изображенная на рисунке, есть р ^ у геометрическое место концов суммарного векто- вектора Е в различных плоскостях в фиксированный момент времени. Шаг винта равен длине волны А. С течением времени изо- изображенная на рисунке винтовая линия перемещается, не деформируясь, в направлении распространения волны, вдоль оси z. В каждой фиксирован- фиксированной плоскости z = const вектор Е вращается против часовой стрелки, если смотреть навстречу волне. 6.3. Энергетические характеристики электромагнитных волн. Вектор Пойнтинга Напомним, что электрическое и магнитное поля обладают энергией. В каждой единице объема, заполненного электрическим и магнитным полями, локализована энергия, равная Первое слагаемое w3 = A/2)ее$Е2 — объемная плотность энергии элек- электрического поля (е — диэлектрическая проницаемость среды). Второе сла- слагаемое wM = l/B/i/io) В2 = A/2) /j/jqH2 — объемная плотность энергии маг- магнитного поля. В электромагнитной волне поля Е и В изменяются во времени, поэтому и объемная плотность энергии w3M также со временем изменяется. Рассмотрим плоскую монохроматическую волну, бегущую вдоль оси z. В этой волне поля Е и В изменяются в данном месте пространства (при фик- фиксированном z) по гармоническому закону. В некоторый момент времени поля Е и В становятся максимальными (одновременно максимальными!). Мак- Максимальна в этот момент времени и объемная плотность энергии в данном месте. Через четверть периода колебаний поля Е и В одновременно обра- обращаются в нуль, при этом и объемная плотность энергии становится равной нулю. Спрашивается, куда она делась? При распространении электромаг- электромагнитная волна переносит энергию из одного объема в другой, подобно те- текущей жидкости, которая из одного объема в другой переносит свою массу. Поясним введенное ранее (часть II) понятие потока энергии электромагнит- электромагнитного поля на примере плоской электромагнитной волны. Итак рассмотрим ж-волну, описываемую системой уравнений F.8). Умножим первое из уравнений на Ну, а второе — на 1/(/1/1о)Ех и сложим левые и правые части уравнений (предварительно заменив Ву на Н)
6.3. ЭНЕРГЕТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ЭЛЕКТРОМАГНИТНЫХ ВОЛН413 Мы получаем Последнему дЕх у dz ' 5 равенству можно придать д A г/ ^ вид 1 F.15) Обратим внимание, что выражение в скобках в правой части равенства есть объемная плотность энергии электромагнитного поля, поэтому имеем вместо F.15): (ЕН) (ЕхНу). Интегрируя последнее равенство по z в пределах от z\ до Z2, найдем ^-w3M = ExHy dt y Ly где w3M — энергия электромагнитного поля, заключенного в столбике еди- единичного сечения между плоскостями z\ и Z2- Введем величину S = ExHy. F.16) Тогда последнее соотношение принимает вид -w3M = Si-S2. F.17) Это — частный случай теоремы Пойнтинга (часть 2 гл. 9): изменение энер- энергии электромагнитного поля в единицу времени обусловлено тем, что через сечение z\ в объем втекает энергия, равная Si, а через сечение ^ из объема вытекает энергия, равная *§2. Таким образом, физический смысл величи- величины S, которую мы определили равенством F.17), — это плотность потока электромагнитной энергии, т. е. энергия, протекающая в единицу времени через единичную площадку, перпендикулярную направлению распростра- распространения волны. Обратим внимание, что для ж-волны, бегущей слева направо, величины Ех и Ву имеют одинаковый знак, поэтому в этой волне в любой момент времени S ^ 0 — энергия течет слева направо. Вектор S, введеный с помощью равенства S = [EH], F.18) определяет величину и направление потока электромагнитной энергии и на- называется вектором плотности потока энергии, или вектором Пойнтинга. Рассмотрим поток энергии в волне, бегущей слева направо вдоль оси z, ко- которая содержит как ж-волну, так и у-волну. Суммарное электрическое поле этой волны есть где i и j — единичные орты в направлении осей х ж у соответственно. Маг- Магнитное поле волны Н = Ну] — Нх i,
414 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ т. к. в у-волне положительному полю Еу соответствует отрицательное поле Нх. Вектор Пойнтинга в сумарной волне есть S = [ЕН] = [{Ех I + Evi), (Нул - Нх i)]. Поскольку [i i] = 0 и [j j] = 0, то получаем из последнего равенства S = ЕХНУ - ЕУНХ = SW + S(y\ где S^ и S^ — потоки энергии, которые существовали бы в отдельно взя- взятых ж-волне и у-волне. В частном случае монохроматических волн, исполь- используя F.13), можно получить (упражнение для читателя): (S) = {l/2)^7J^{El + El). F.19) где (S) — среднее значение потока энергии за период колебания. 6.4. Стоячая электромагнитная волна Рассмотрим суперпозицию двух бегущих навстречу друг другу гармони- гармонических волн одинаковой частоты, амплитуды и поляризации (например, две ж-волны). В волне, бегущей слева направо: Ei = acos(ct;t — kz), B\ = (y/6/I/c)acos(ct;t — kz). В волне, бегущей справа налево Е2 = acos(ct;t + kz), В2 = — {y/sjllс)a cos(ut + kz). Еще раз подчеркнем, что колебания полей Е\ и Е2 происходят вдоль оси ж, а полей В\ и В2 — вдоль оси у. Результирующие поля Е и В есть E = Ei+E2 = 2a cos kz • cos u)t; B = Bi+B2 = 2^—^ a sin kz • sinc^t. F.20) с Соотношения F.20) описывают стоячую электромагнитную волну. Связь между полями йиВв этой волне в корне отличается от F.12) — связи Е и В в бегущей волне. Напомним, что согласно F.12) в любой фиксированной плоскости z колебания полей Ех и Ву происходят синфазно; там, где в дан- данный момент максимально поле Е, там же в этот момент максимально поле В (значит, там же в этот момент максимальна плотность электромагнитной энергии и там же максимален и поток энергии). Это — полная аналогия с тем, что происходит в бегущей упругой волне. В стоячей электромагнит- электромагнитной волне колебания Ех и Ву сдвинуты по фазе на четверть периода: в тот момент времени, когда электрическое поле максимально в данном ме- месте (cosoot =1), магнитное поле обращается в нуль (sinc<;? = 0) и наоборот. Значит, за четверть периода происходит полное превращение электрической энергии в магнитную и наоборот. Кроме того, пучностям электрического по- поля (coskz = 1) соответствуют узлы магнитного поля (sinfez = 0), т. е. пуч- пучности электрического и магнитного полей сдвинуты друг относительно дру- друга на А/4 (разумеется, так же сдвинуты друг относительно друга и узлы). Согласно F.18), поток энергии равен нулю в тех местах, где обращается в ноль либо электрическое поле волны, либо магнитное поле. Следовательно, промежуток пространства, равный А/4 (вдоль оси z) — от узла электриче- электрического поля до ближайшего узла магнитного поля, не обменивается энергией с соседними участками (сравните с продольной упругой стоячей волной в
6.5. ИЗЛУЧЕНИЕ КОЛЕБЛЮЩЕГОСЯ ДИПОЛЯ 415 стержне с закрепленными концами, либо с поперечной волной в натянутой струне). Распределение электрического и магнитного полей в стоячей волне вдоль оси z (мгновенная фотография) показано на рис. 6.8. Стоячие электромагнитные волны возникают в резонаторе Фабри-Перо, образованном двумя иде- идеально проводящими металлическими стенками (рис. 8.34). Поскольку у поверхности идеального проводника тангенциальная компонента электри- электрического поля должна обращаться в нуль, то ситу- ситуация в точности подобна той, которая возникает в стержне с закрепленными концами либо в натя- Рис. 6.8 нутой и закрепленной на концах струне (поскольку аналогичны граничные условия: E@)=E(L)=0, где L — расстояние между проводящими стенками). Возможные частоты колебаний определяется соотношением vn = nc/BL), аналогичным E.25), а возможные типы колебаний Еп (z, t) = 2а sin f n — z) • sin ujnt полностью аналогичны типам упругих стоячих волн в стержне. 6.5. Излучение колеблющегося диполя Колеблющийся диполь является простейшей системой, излучающей элек- электромагнитную волну. Модель колеблющегося диполя используется при ис- исследовании излучения многих реальных излучающих систем, таких, как радиоан- радиоантенна или даже излучения света атомом. Практической реализацией диполя яв- является элементарный осциллятор, изоб- изображенный на рис. 6.9 а: два проводящих шарика, заряды которых ±q меняются по гармоническому закону. Это изменение обеспечивается переменным напряжени- ем ?7(?), которым питается осциллятор. U~ +q рис (), р р Дипольный момент системы есть, по определению, р = gl, где 1 — вектор, направленный от отрицательного заряда к положительному. При гармоническом изменении заряда q = qo cos ut имеем p = Po cosc^t, где po = qol. F.21) Будем полагать, что размеры осциллятора много меньше длины излучае- излучаемой волны Л = 2тгс/сс;, F.22) где с — скорость электромагнитных волн: вибратор находится в вакууме. Кроме того, нас будет интересовать излучение диполя на расстояниях от него, больших по сравнению с длиной волны г > А. При выполнении указанных условий диполь называется точечным. Согласно классическим представлениям, возбужденный электрон в атоме ведет себя как гармонический осциллятор, совершающий колебания относи-
416 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ тельно положения равновесия. При этом частота колебаний ш определяет- определяется массой электрона и «жесткостью связи» (см., например, модель атома Томпсона, гл. 4.1). В результате гармонических колебаний электрона атом приобретает переменный дипольный момент F.21). Приведем без вывода формулы, определяющие электрическое и магнитное поля в электромагнитной волне, излучаемой колеблющимся диполем В(«) = -^ -L [n, p (t - ?)] , E(t) = c[B(t), n]. F.23) Формулы F.23) определяют поля В и Е в точке наблюдения, отстоящей от середины диполя на расстояние г. Единичный вектор п направлен от середины диполя к точке наблюдения (рис. 6.9 б). Обсудим физическое со- содержание формул F.23). 1. Поля В и Е определяются второй производной по времени дипольного момента р (вектором р), т. е. ускорением, с которым меняется заряд диполя q (либо расстояние между зарядами /): волна излучается лишь ускоренно движущимися зарядами. 2. Поля В и Е на расстоянии г от колеблющегося диполя в момент вре- времени t зависят от значения р в более ранний момент времени (t — г/с) — запаздывание зависит от времени распространения волны от осциллятора до точки наблюдения г = г/с. 3. Электромагнитная волна, излучаемая диполем, является плоско-поля- плоско-поляризованной: вектор р параллелен вектору р, т. е. оси диполя, поэтому век- вектор В перпендикулярен плоскости, в которой лежат векторы р и п (плос- (плоскости рис. 6.9 б); вектор Е лежит в плоскости рисунка и перпендикулярен вектору п. Пространственная картина полей Е и В показана на рис. 6.10: линии вектора Е расположены по меридианам, а линии В — по параллелям сферы с центром в точке О (в центре диполя). 4. Поля Е и В убывают при удалении от диполя обрат- обратно пропорционально первой степени расстояния 1/г (в отли- р ^ -. q чие от поля статического диполя, которое убывает по закону 1/г3 — т. е. гораздо быстрее). 5. Излучение диполя обладает определенной анизотропией: амплитуды полей зависят от широтного угла ф: Е и В максимальны в направлении ф = 0 (т. е. на экваторе) и обращаются в нуль на полюсах (ф = ±тг/2). Найдем, используя F.21), p(t — г/с). Имеем p(t) = —uj2po cosut; p(t—r/c) = = — ш ро cos(u;t — kr). Подставляя последнее выражение в F.23), найдем B(t) = ct;2]9o/D7r?oc3r) cos/0cos(ct;t — fcr), E(i) = си2ро/D:7Г?ос2г) cos^cos^t — kr). Важно подчеркнуть, что на больших расстояниях (г ^> А) волновые по- поверхности, излучаемые колеблющимся диполем, имеют сферическую фор- форму, а амплитуда колебаний убывает по закону 1/г — так же, как в сфери- сферической волне, излучаемой точечным источником. Электромагнитная энергия, излучаемая колеблющимся диполем. Используя F.24), вычислим поток энергии в точке г, ф в волне, излучаемой
6.5. ИЗЛУЧЕНИЕ КОЛЕБЛЮЩЕГОСЯ ДИПОЛЯ 417 диполем. Имеем (используя формулы Н = A/fio)B и с2 = 1 и,' = EH = cos ф • cos [u)t — кг). F.25) DтгJ?о c Направление потока совпадает с нормалью п к волновой поверхности. Среднее за период значение S есть S = 32тг2?0с3г2 cos2 ф. F.26) г dip На рис. 6.11 а показана полярная диаграмма направленности излучающего диполя — график зависимости S от ф (при фиксированном г) в полярных координатах. Поток монотонно (по закону cos2 ф) уменьша- уменьшается с ростом угла ф от максимального значе- значения, равного 5тах = oj^pl/ C2тг2?оС5г2) при ф = О до нулевого при ф = тг/2 — в направлении своей оси колеблющийся диполь не излучает! Найдем общую мощность, излучаемую дипо- диполем по всем направлениям. Рассмотрим на вол- волновой поверхности — сфере радиуса г — эле- элементарное колечко, заштрихованное на рис. 6.11 б. Его площадь da = 2тгг cos ф • г dф = 2тгг2 cos ф &ф. F.27) рис g.ll Средний поток энергии через это кольцо dP = *Sd<r, а полная энергия, из- излучаемая в 1 с по всем направлениям Р = J S da. Используя F.26), находим Р = cos 12тг?0с3" F.28) -тг/2 Важное следствие полученного выражения: энергия, излучаемая диполем за 1 с, быстро (пропорционально с<;4) растет с ростом частоты и именно по- поэтому для передачи радиосигналов используютсявысокие частоты (в радио- радиовещании от 105 до 108 Гц, что соответствует длинам волн от 3 км до 3 м). Поскольку колеблющийся диполь излучает энергию, то для поддержа- поддержания незатухающих гармонических колебаний необходим источник, воспол- восполняющий потерю энергии, равную Р. Выражение F.28) можно представить в виде, аналогичном формуле P = i?/2/2, определяющей мощность джоуле- вых потерь в колебательнром контуре с сопротивлением R. Поскольку за- заряд колеблющегося диполя меняется по закону q = qo cos ut, то ток I = q = = — qoujsmoot = —/osinc^t, где Iq = ooqo = шро/l. Используя последнее выра- выражение, получим из F.28): ^^ F.29) 12тг?0с3 Роль сопротивления играет величина Ссг?
418 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ При таком определении формула F.29) принимает вид Р = (Д„зл/о)А Введенная величина Дизл играет для потерь на излучение ту же роль, что и сопротивление контура для потерь на нагревание. Величина Дизл называ- называется сопротивлением излучения. Вернемся к классической модели атома, согласно которой электрон в ато- атоме совершает гармонические колебания (как колеблющийся осциллятор): / = /о cos uot. Энергия, запасенная осциллирующим электроном, равна W = = ml2 /2-\- kl2 /2. Вычисляя ее в момент, когда электрон проходит положение равновесия (/ = 0 и / = с^/о), найдем W = ти21^/2 = m<jo2pl/{2q2). Потери энергии за период колебаний, связанные с излучением, равны AW = РТ = = Р • 2тг/сс7, где Р определяется формулой F.29). Добротность нашей коле- колебательной системы найдем, используя B.42): _ W 3 тс3 Q 2 Для электрона, колеблющегося с частотой ш/2тг = 6 • 1014 Гц (излуче- (излучение зеленого света), используя численные значения m = 9,1 • 10~31 кг, q = = 1,6 • 10~19 Кл, получим Q^l,4-107. Столь высокой добротностью не обладает ни одна «рукотворная» колеба- колебательная система. Время затухания (в течение которого амплитуда осцилля- осцилляции уменьшается в е раз) равно г = 1/6 = 2Qjuj « 7,7 • 10"9 с. Затухание осциллятора, обусловленное излучением электромагнитной волны, называют радиационным затуханием. 6.6. Отражение электромагнитной волны от идеального проводника Напомним основные результаты решения задачи, рассмотренной ранее в гл. 2.5. Пусть плоская электромагнитная волна, бегущая вдоль оси z, падает на плоскую поверхность идеального проводника (поверхность z = 0, рис. 6.12) Ei=Eix(z, t) = acos(wt-kz), B\ =Biy(z, t) = (у/ёЦ/с) acos(u;t — kz). //////////J/qV// ' Волна F.30) линейно-поляризована: вектор Е имеет идеальный только ж-компоненту, а вектор В только у-компоненту проводник |2 (ось у перпендикулярна плоскости рисунка и напра- р fi влена к читателю). Как известно, на поверхности проводника (при z = 0) должно выполняться граничное условие ДДО, t) =0 F.31) (равенство нулю тангенциальной компоненты электрического поля). Это условие окажется выполненным, если мы предположим, что наряду с пада-
6.7. ВОЛНОВОДЫ 419 ющей на поверхность проводника волной F.30) возникает отраженная волна E[x(z, t) = a'cos(ojt + kz), B[y(z, t) = -^-^a'cos(ojt + kz). F.32) Направление отраженной волны противоположно положительному напра- направлению оси z, поэтому аргумент косинуса в F.32) есть ujt + kz. Кроме того, вектора Е7, В7 и к7 должны составлять «правую» тройку (как в любой бегу- бегущей плоской электромагнитной волне), поэтому при изменении направления волны на противоположное изменяется и направление одного из векторов — либо Е, либо В. Граничное условие F.31) принимает вид Ех@, t) = Я1я@, t) + E'lx@, t) = 0. F.33) Подставляя F.30) и F.32) в граничное условие F.33), получаем а= — а7, т. е. амплитуда отраженной волны равна амплитуде падающей волны — коэффициент отражения равен единице, а знак «—» в последнем равенстве означает, что на поверхности проводника (при z = 0) колебания поля Е\ в отраженной волне происходят в противофазе с колебаниями поля Е\ в падающей волне: E[x(z,t) = —acos(ujt + kz), B[y(z,t) = (y/qJ/c) acos(ujt + kz). F.34) Тогда результирующая волна в диэлектрике (расположенном над провод- проводником), т. е. сумма волн F.34) и F.30), есть Ex(z, t) = Eix(z, t) + Eflx(z, t) = 2a sin к z sin cot, By(z, t) = Bly(z, t) +Bfly(z, t) = 2 (у/ёЦ/с) a cos kz cos cot. ^ ' ' Последние формулы описывают стоячую электромагнитную волну, в кото- которой на поверхности проводника (при z = 0) находится узел электрического поля Де@, t) = 0 и пучность магнитного поля ДД0, t) = 2 [у/ёЦ/cj acosojt. Заметим, что разрыв тангенциальных компонент магнитного поля (вну- (внутри идеального проводника В = Ву = 0) обусловлен токами проводимости, которые индуцируются падающей электромагнитной волной. 6.7. Волноводы Пусть плоская электромагнитная волна падает на поверхность идеального проводника, как показано на рис. 6.13: вектор к лежит в плоскости (у, z) — на этот раз мы выбрали оси координат так, что плос- плоскость (у, z) совпадает с плоскостью рисунка, причем ось у перпендикулярна плоской поверхности провод- проводника, а ось z параллельна поверхности т. е. плоская поверхность проводника — плоскость (ж, z). Будем полагать, что падающая волна линейно поля- \у ризована, причем вектор Е перпендикулярен плоско- плоскости рисунка (у, z), т. е. имеет только ж-компоненту и, Рис. 6.13 следовательно, параллелен поверхности проводника. Уравнение падающей волны имеет вид Е\х = acos(ct;t — куу — kzz\ F.36)
420 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ ж-компонента вектора к равна нулю, ку = к sin а и kz = к cos a — соответ- соответственно у и z — компоненты вектора ki, а — угол между вектором ki и осью z. Вновь полагаем, что наряду с волной Е\х возникает отраженная волна Е[х = a cos(u;t — к'уу — k'zz + ф), причем ее амплитуда а[, направление распространения о! и начальная фаза ср должны быть выбраны так, чтобы выполнялось граничное условие — ра- равенство нулю тангенциальной компоненты вектора Е в суммарной волне на поверхности (при у = 0). Легко видеть, что это условие выполняется, если амплитуда отраженной волны равна амплитуде падающей волны (а* = а), угол падения равен углу отражения (а = а'), а колебания Е[х на поверхно- поверхности (при у = 0) противофазны с колебаниями {Е\х{ф = тг)), т. е. Е[х = acos(cc;t + kyy - kzz + тг), F.37) вектор к7 отраженной волны имеет компоненты к' = — ку, k!z = kz поэто- поэтому аргумент косинуса содержит слагаемое +куу вместо слагаемого — куу в падающей волне. Действительно, суммарная волна над проводящей стенкой (сумма волн F.36) и F.37)) имеет вид: Ех(у, z, t) = — 2asm(kyy) sin(ujt — kzz). F.38) На проводящей поверхности (при у = 0) Ех@, z, ?) = 0, т. е. требуемое граничное условие выполняется. Обратим теперь внимание, что если на расстоянии d от проводящий стен- стенки (т. е. при у = d) установить вторую проводящую стенку (параллельно первой), причем выбрать расстояние между стенками d так, чтобы d = у = = птг/ку, т. е. ку = n7r/d (n = 1, 2, 3...), F.39) то волна F.38) в области между стенками 0 < у < d не изменится, поскольку необходимые граничные условия — равенство нулю тангенциальной компо- компоненты поля на проводящих поверхностях (при у = 0 и у = d), автоматически выполняются. При условии F.39) имеем из F.38) , z, t) = 2a sin (птг |) sin(u;t - kzz), F.40) где Итак, между двумя параллельными проводящими стенками, расположен- расположенными на расстоянии d друг от друга (коридор между стенками представля- представляет собой простейший волновод) могут распространяться волны вида F.40): каждому значению п отвечает свой тип волны — своя «мода» волновода, разным модам отвечают различные конфигурации поля — различные рас- распределения амплитуды колебаний в фиксированном сечении z = const Ап(у) = 2аsin (птг^У F.42)
6.7. ВОЛНОВОДЫ 421 На рис. 6.14 показаны распределения амплитуды Ап(у), отвечающие ин- индексам п = 1 и п = 2. Как и должно быть в соответствии с граничными усло- условиями, Ап (у) = 0 при y = 0my = d (ось волновода — ось z — перпендикулярна плоскости рис. 6.14, а вектор Е в волне параллелен оси х). Каждый тип волны, отвечающий фик- фиксированному значению п, можно рассма- m тривать как суперпозицию плоской вол- ХО d ны, падающей на проводящую стенку и Л п=\ волны, отраженной стенкой, т. е. каждый а б тип волны образован суммой двух плос- р ^ ... ких волн, волновые векторы которых к и к7 составляют угол ап с осью волновода, причем разным п отвечают раз- различные углы а: sinan = птг/(Ы) = n A0/Bd), F.43) где Aq = 2тг/к = 2пс/ио — длина волны вакууме. Поверхности одинаковой фазы колебаний, как видно из F.40) — это по- поверхности z = const. Это утверждение в данном случае означает, что в плос- плоскости z = const колебания либо синфазны как, например, в моде п = 1, либо отличаются по фазе на тг как, например, в моде п = 2, где колебания в области 0 < у < d/2 сдвинуты по фазе на тг по отношению к колебаниям в области d/2 < у < d. Волновые поверхности перемещаются вдоль оси волновода — оси z, при- причем фазовая скорость может быть найдена из F.40) и F.41) uot — kzz = const, откуда dz ш ш (* ' Как ясно из F.44), фазовая скорость волн в волноводе больше скорости света в вакууме. Расстояние между волновыми поверхностями, на которых фаза колебаний отличается на 2тг (т. е. колебания синфазны) — это длина волны в волново- волноводе, равная Л = 2n/kz = А0/л/1-п2(А0/2^J > Ао. F.45) Итак, длина волны в волноводе больше длины волны той же частоты в вакууме. Наконец, из F.40) ясно, что если kz — действительное число, то Ех(у, z, t) действительно представляет собой бегущую вдоль оси z волну с перемеща- перемещающимися волновыми поверхностями. Из F.41) следует, что для этого необ- необходимо выполнение неравенства (ш/сJ > n2Gr/dJ. Таким образом, существует критическая частота икр — минимальная частота волны, которая может распространяться (бежать) по волноводу.
422 ГЛ. 6. ЭЛЕКТРОМАГНИТНЫЕ ВОЛНЫ Эта частота отвечает значению п = 1 cjKp = nc/d. F.46) Соответствующая длина волны в вакууме Акр = 2тгс/и;кр = 2d — это максимальное значение длины волны в вакууме, которая может бежать по волноводу. Критическому условию отвечает угол а — направление пары плоских волн, составляющих моду волновода — равный, согласно F.43) sin а = Акр/BоГ) = 1, т. е. а = тг/2. Такая пара волн образует, как мы знаем, стоячую волну между стенками, которая никуда не распространяется. Узлы стоячей волны должны нахо- находиться на проводящих стенках (чтобы выполнялись требуемые граничные условия). Ясно, что при Ао > Акр = 2d половина длины волны (расстояние между узлами) «не умещается» между стенками, и поэтому для таких волн необходимые граничные условия не мо- могут быть выполнены. Разумеется, мы описали здесь лишь простейшие типы волн в волноводе с про- проводящими параллельными стенками, ти- типы, в которых поле Е параллельно стен- стенкам (оси ж), Е = Ех и перпендикулярно оси волновода — оси z (рис. 6.15 а). В таких типах волн магнитное поле В имеет проекцию на ось z — направле- направление распространения, т. е. электромагнитная волна в волноводе не является поперечной (в данном случае поперечно поле Е, и не поперечно, т. е. имеет продольную составляющую, поле В). Рис. 6.15 б'иллюстрирует это обстоя- обстоятельство: силовые линии магнитного поля В (перпендикулярного оси ж, т. е. полю Е) «охватывают» линии поля Е. 6.8. Электромагнитная волна на границе раздела двух диэлектриков Полностью задача падения электромагнитной волны на границу раздела двух диэлектриков решена в гл. 3.2. Здесь мы приведем лишь результаты, относящиеся к нормальному падению (рис. 6.16), чтобы обратить внимание на аналогию с поведением звуковых волн на границе раздела двух сред с различ- различными акустическими свойствами. Для того, чтобы необходимые гранич- граничные условия: Ет1 = Ет2, Нт1 = Нт2 F.47) Рис. 6.15 — непрерывность тангенциальных компо- компонент векторов Е и Н на границе раздела двух диэлектриков — оказались выпол- выполненными, вновь предположим, что в ди- диэлектрике 1 с диэлектрической проницаемостью е\ (расположенном над гра- границей раздела 2: = 0на рис 6.16) наряду с падающей волной Рис. 6.16 , t) = , t) = cos(u;t — k\z) F.48)
6.8. ЭЛЕКТРОМАГНИТНАЯ ВОЛНА НА ГРАНИЦЕ РАЗДЕЛА ДИЭЛЕКТРИКОВ 423 возникает отраженная волна E[(z, t) = а[ cos(u;t + kxz), H[(z, t) = -у/ег/цга[ cos(u;t + kxz), F.49) а в диэлектрике 2 (?2), расположенном под границей z = 0 — прошедшая волна: E2(z, t) = Е2х = а2 cos {u)t - k2z), 1 (o.oUJ H2(z, t) = H2y = y/er/fjLra2 cos(u;t - k2z). Для волн (Ei, Hi) и (Е^Н^) в диэлектрике 1 к\=ш/v\ = (u)/c)n\\ для вол- волны (Е2, Н2) в диэлектрике 2 к2 = с^/^ = (сс?/с) П2, где величины ni = sje\\i\ и П2 = л^?2Ц2 называются показателями преломления. Граничные условия F.47) можно теперь записать в виде Si@, t) + Е[(р, t) = ?72(О, t), Ях@, t) + Я{@, t) = Я2@, t). Используя выражения F.48), F.49) и F.50) при z = 0, после неслож- несложных вычислений получим формулы, связывающие амплитуды отраженной и прошедшей волны с амплитудой падающей волны , п\-п2 2ni ai = ¦ аь а2 = ¦ аь F.51) П1 + П2 П1 + П2 (При п\ < П2; а\ и а27 имеют разные знаки. Это означает, что в отраженной волне колебания вектора Е/ противофазны колебаниям вектора Е]_ в пада- падающей волне при z = 0. При этом колебания магнитных полей, как видно из F.49), оказываются синфазными. Рис. 6.16 соответствует именно этому случаю.) Для коэффициентов отражения и прохождения, равных соответственно отношению средних за период потоков энергии в отраженной и прошедшей волнах к среднему потоку энергии в падающей волне, находим . F.52) Обратите внимание на замечательное сходство полученных выражений с формулами E.41), определяющими коэффициенты отражения и прохожде- прохождения звуковой волны, падающей на границу раздела двух сред с различными значениями \/гЁ~р (Е — модуль упругости, р — плотность). Эта величина для акустических волн играет ту же роль, что и показатель преломления п = у/ёЦ для электромагнитной волны.
ГЛАВА 7 ИНТЕРФЕРЕНЦИЯ ВОЛН 7.1. Принцип суперпозиции волн Пусть некоторый источник создает в среде волновой процесс Ei(r, t) и пусть другой источник создает в среде волновой процесс Е2(г, ?). Соглас- Согласно принципу суперпозиции, если излучают одновременно два источника, то результирующий волновой процесс E(r, t) есть E(r,t)=Ei(r,t) + E2(r,t). G.1) Смысл этого равенства состоит в том, что распространяющиеся одновре- одновременно волны не влияют друг на друга, поэтому результирующее возмущение есть просто сумма неискажающих друг друга возмущений. Другими слова- словами, в равенстве G.1) Ei(r, t) — это волна, которую создавал бы первый источник (если бы второй волны не было), так же как E2(r, t) — это волна, которую создавал бы второй источник при отсутствии первого. Опыт подтверждает справедливость принципа суперпозиции в широких пределах: свету далекой звезды, идущему к нам из космоса, не мешает рас- распространяться свет других звезд или свет горящей поблизости лампочки; радиоволны, заполняющие все окружающее пространство, не влияют друг на друга — вращая ручку настройки приемника, мы ловим передачу опреде- определенной радиостанции, несмотря на то, что приемник буквально погружен в океан радиоволн; звуки голосов многих людей, разговаривающих в комнате, не отскакивают друг от друга, подобно бильярдным шарам — они беспре- беспрепятственно проходят друг сквозь друга, не искажая и не «замечая» друг друга. Итак, для всех линейных волн независимо от их природы, справедлив принцип суперпозиции: можно сказать, что линейность волнового уравне- уравнения является математическим отражением (следствием) принципа супер- суперпозиции: если возможны решения E]_(r, t) и Е2(г, ?), то возможно также и решение G.1). Рассматривая в двух последующих главах явления интерференции и ди- дифракции, мы будем иметь в виду либо скалярные, либо векторные, но оди- одинаково поляризованные волны. Под Е понимается, таким образом, либо ко- колебания плотности среды при распространении в ней звуковой волны, либо колебания проекции электрического поля в электромагнитной волне (пола- (полагаем при этом, что все волны имеют, скажем, только ж-компоненту), либо какую-либо другую величину, изменяющуюся по волновым законам. При этом векторная сумма G.1) заменяется скалярной суммой t). G.2)
7.2. ИНТЕРФЕРЕНЦИЯ МОНОХРОМАТИЧЕСКИХ ВОЛН 425 Каков же результат наложения двух волн? Рассмотрим вначале наиболее простой, и в то же время исключительно важный случай, а именно, моно- монохроматические волны. 7.2. Интерференция монохроматических волн Итак, пусть в пространстве распространяются две монохроматические волны одинаковой частоты ио: Ei(r, t) = ai(r) cos(cc;t - <pi(r)), E2(r, t) = a2(r) cos(cc;? - <p2(r)). Согласно принципу суперпозиции, колебательный процесс в любой точке наблюдения (радиус-вектор г фиксирован) есть сумма гармонических коле- колебаний. Квадрат амплитуды (т. е. интенсивность) результирующего колеба- колебания найдем, используя A.7) (см. гл. 1.2) a2(r) = а?(г) + a2(r) + 2aia2 cos Д<р(г), G.3) где A(p(r) = Lp2 (г) — (^i(r) — разность фаз слагаемых колебаний в точке на- наблюдения. Напомним, что интенсивность I = а2 — это величина, равная (с точностью до константы) плотности потока энергии в монохроматической волне. Равенство G.3) показывает, что плотность потока энергии в резуль- результирующей волне не равна в общем случае сумме плотностей потоков энер- энергии в слагаемых волнах. В пространстве, где налагаются два волновых про- процесса, происходит перераспределение потоков энергий: в некоторых точках пространства результирующая интенсивность оказывается больше суммы интенсивностей 1\ = а\ и /2 = а| слагаемых волн; в других точках, наоборот, результирующая интенсивность меньше суммы интенсивностей. Результат зависит от интерференционного слагаемого 2aia2 cos Д<р(г), т. е. от разности фаз Аср(г) колебаний в данной точке наблюдения. Явление наложения волн, при котором результирующая интенсивность оказывается не равной в общем случае сумме интенсивностей слагаемых волн, называется интерференцией. Соотношение G.3) является основным для описания интерференции двух монохроматических волн. Оно может быть записано в виде /(г) = /х(г) +/2(г) + 2л/Д72со8Д^(г). G.4) Чередование максимумов и минимумов интенсивности, характерное для интерференции, связано с изменением знака cos Аср(г). В тех точках, где Аср = 2тгга, интенсивность максимальна и равна атах = = (а\ +а2J. Геометрическое место точек, удовлетворяющих этому условию, образует максимум (полосу) m-го порядка. Там, где Аср = Bт + 1)тг, возни- возникают минимумы интенсивности (темные интерференционные полосы), для которых a^in = (а\ — а2J. Контраст интерференционной картины принято характеризовать величиной видности V", определяемой равенством V = (/max - Imm) I (/max + /min) = ^1^/ (а? + п\) . G.5) Видность максимальна и равна единице при равных амплитудах а\ = а2 (при этом /min = 0). Видность близка к нулю, когда интенсивность одной из интерферирующих волн существенно больше другой. Принцип суперпозиции справедлив, в силу линейности уравнения Гель- мгольца, и для комплексных амплитуд: комплексная амплитуда результи-
426 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН рующей волны /(г) = а(г)е^г' равна сумме комплексных амплитуд /i(r) = ai(r)e^1(r) и /2(г) = a2(r)ei(p2^ слагаемых волн: /(г) = Д(г)+/2(г). Соответственно, интенсивность результирующей волны /(r)= a2(r) = |/(r)|2 есть J(r) = |/1(r) + /2(r)|2. Последнее равенство можно записать в виде /(г) = |/!(г)|2 + |/2(r)|2 + /i(r)/|(r) +/Г(г)/2(г) G.6) (знак * означает комплексно-сопряженную величину). I\ = |/i(r)|2 и 12 = = |/2(г)| — интенсивности слагаемых волн. Интерференционный эффект определяется двумя последними слагаемы- слагаемыми в G.6): /i/l и /*/2 — это два комплексно-сопряженных слагаемых, по- поэтому Л/* + /*/2 = 2 Re /*/2. Таким образом /(г) = |/!(r)|2 + |/2(r)|2 + 2Re/r/2. G.7) Ясно, что интерференционное слагаемое в G.4) имеет тот же вид, что и в G.7): 2Re/j72 = 2Re(aie-i(pi - a2e+itp2) = 2Re (a1a2eiA(p) = 2ага2со8А(р. Большинство эффектов интерференции и дифракции, которые будут рас- рассматриваться в данной и последующей главах, наилучшим образом иллю- иллюстрируются на примере видимого света, т. е. электромагнитных волн с А ~ ~ 400-700 нм. При этом эффект интерференции проявляется в виде череду- чередующихся светлых и темных полос на экране наблюдения. Рассмотрим несколько характерных случаев интерференции монохрома- монохроматических волн. Интерференция сферических волн. ^ Две сферические волны излу- излучаются точечными источниками Si и S2 (рис. 7.1). Комплексные амплитуды волн в точке наблюдения Р есть fi = (ao/ri)eikri; /2 = («о/Ы eikr*, (мы полагаем, что источники излучают синфазно, с одинаковой амплиту- амплитудой), fi иг2 — расстояния от источников Si и Si до точки наблюдения. Разность фаз колебаний в точке наблюдения Аср = к • А, где А = г2 — ri — разность хода волн, приходящих в точку наблюдения. При А = тА (раз- (разность хода равна целому числу длин волн) разность фаз Аср = к А = 2тгт и следовательно, получаем интерференционный максимум m-го порядка. ' Нелишне напомнить, что поперечные электромагнитные волны в принципе не могут быть сферическими; их элементарный источник — не точка, а колеблющийся диполь. Тем не менее, в оптике нередко пользуются приближением сферической волны (соответ- (соответственно, точечного источника и точечного фокуса). Это означает, что интересующий нас участок волнового фронта имеет сферическую форму с точностью до малых поправок. Если же кривизна фронта существенна лишь в одной плоскости, а в ортогональной плос- плоскости пренебрежимо мала, используется приближение цилиндрической волны.
7.2. ИНТЕРФЕРЕНЦИЯ МОНОХРОМАТИЧЕСКИХ ВОЛН 427 При А = Bт + 1) А/2 получаем интерференционный минимум. Геометрическое место точек, для которых г 2 — г\ = А = const — это гиперболоиды вращения. Таким образом поверхности интерференционных максимумов и минимумов — гиперболоиды, сечение которых плоскостью, в которой лежат источники S\ и $2 (плоскость рисунка) показаны на рис. 7.1. Ясно, что форма полос, наблюдаемых на каком-либо плоском экране, за- зависит от положения этого экрана. Например, если плоскость наблюдения перпендикулярна линии S1S2, соединяющей источники (плоскость П\ на рис. 7.1), то интерференционные полосы имеют вид чередующихся светлых и темных колец. Если экран расположен параллельно линии S1S2 (экран 772), то интер- интерференционные полосы представляют собой семейство гипербол — почти па- параллельных прямых, если ограничиться достаточно малой областью вблизи центра экрана (точка О на рис. 7.2). О \ — - / 1 1 \ к9 -а Рис. 7.1 Рис. 7.2 Рис. 7.3 Целое число т называется порядком интерференции. Нулевой порядок интерференции соответствует разности хода А = 0 (геометрическое место точек нулевой разности хода — плоскость симметрии 00 на рис. 7.1). Если рассматривать небольшую область наблюдения, в которой амплиту- амплитуды колебаний двух слагаемых волн одинаковы а^/г\ — d^lT2 — ft, то полу- получаем: 7 = 270(l + cos(o;/c)A), G.8) где с — скорость волны, 7q — интенсивность каждой из волн в плоскости наблюдения. Формула G.8) имеет универсальный характер, она справедлива при ин- интерференции любых монохроматических волн одинаковой частоты и интен- интенсивности. Интерференция плоских волн. Рассмотрим результат интерференции двух плоских волн, волновые векторы ki и К2 которых составляют углы ±а с осью z и лежат в плоскости рисунка 7.3. Проекции векторов ki и к2 на ось у равны нулю. Комплексные амплитуды волн есть соответственно, Д = aie^klxX+klzZ\ /2 = a2el^k2xXJrk2zZ^ (см. гл. 4.2). Поскольку к\х = к sin а, к2Х — —fcsina, а ^-компоненты векторов к\ и А;2 одинаковы и равны k\z = /^ = к cos а, то имеем h(x, z) = axei(-kxsina+kzcosQ), f2(x, z) = a2ei{~kxsina+kzcosQ). Результирующую картину интенсивности найдем, используя общее соот- соотношение G.4) 1[х) = а\ + а% + 2а\п2 cos Bkx sin a) . G.9)
428 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН Она не зависит от z, т. е. одинакова в любой плоскости наблюдения z = = const и поскольку она не зависит от у, то в любой плоскости z = const картина имеет вид чередующихся светлых и темных полос, параллельных оси у (т. е. перпендикулярных плоскости рисунка). Функция 1(х) показана на рис. 7.4. Расстояние между двумя соседними максимумами интенсивности (интер- (интерференционными полосами) или между двумя соседними минимумами назы- называют шириной интерференционной полосы (расстояние / на рис. 7.4). Пере- Переход от одной светлой полосы к другой соответствует изменению аргумента косинуса в G.9) на 2тг 2ksma • Ах = 2тг, откуда Ах = / = 7r/(A;sina) = A/Bsina). Обозначая через C угол схождения волн {C = 2а), получаем / = A/Bsin(/3/2)) G.10) или, для малых углов схождения: sin(/?/2) — /3/2 I ~ А//?. G.11) В оптике, в силу малости А(~ 5 • 10~5 см), для получения достаточно ши- широких полос (I ~ 0,1-1 см) угол схождения волн f3 приходится выбирать малым (~ 10~4-10~5 радиан), поэтому практически всегда можно пользо- пользоваться приближенным выражением G.11). Для оценки минимально возможной ширины полосы необходимо, разуме- разумеется, использовать точное соотношение G.10). Из него следует, что мини- минимальная ширина интерференционных полос достигается при /3 = тг, т. е. при интерференции встречных волн. Мы имеем при этом sin(/3/2) = 1 и Un = А/2. G.12) Это, как мы знаем, есть расстояние между соседними пучностями (или узлами) в стоячей х волне. "*" Из формулы G.12) можно сделать достаточ- р * ^ но общий вывод: в монохроматическом волно- волновом поле характерный масштаб пространствен- пространственных неоднородностей не может быть существенно меньшим длины волны А. При интерференции плоских волн одинаковой амплитуды а\ = п2 = a имеем из G.9) / = 2/0 A + cosBb; sin a)), G.13) где Iq = a2 — интенсивности слагаемых волн. 7.3. Квазимонохроматические волны Элементарные представления о статистической природе излуче- излучения. В предыдущем разделе мы говорили о волновых процессах, имеющих гармоническую зависимость от времени. Однако ни один реальный источник света не излучает волну, напряженность поля в которой меняется по гар- гармоническому закону. Это подтверждается множеством экспериментальных
7.3. КВАЗИМОНОХРОМАТИЧЕСКИЕ ВОЛНЫ 429 фактов. Рассмотрим один из них: результат суперпозиции волн, излучае- излучаемых двумя независимыми источниками (например двумя электрическими лампочками). Казалось бы, мы должны получить характерное чередование светлых и темных полос. Однако ничего подобного в действительности не происходит: если в комнате, где горит электрическая лампочка, зажечь еще одну точно такую же, то освещенность стен просто удваивается. Другими словами, при наложении света от двух лампочек складываются интенсивности и никаких интерференционных явлений не наблюдается. Для того, чтобы правильно ответить на возникающие вопросы и объяс- объяснить результат рассмотренного эксперимента (а также результаты множе- множества других подобных фактов), необходимо отказаться от принятой ранее синусоидальной (гармонической) идеализации и более тщательно рассмо- рассмотреть структуру оптического излучения. Если бы мы имели столь малоинерционный прибор, что он мог бы сле- следить за изменением напряженности электрического поля в световой волне, испущенной каким-либо источником, то мы получили бы запись случайного процесса, а вовсе не гармонический сигнал. Что мы понимаем под словами случайный процесс? Возьмем большое количество (ансамбль) одинако- а 11ф^111ЩЩ№0Ш1'' * вых источников света: одинаковых электрических б \AMty||/W\^^ * лампочек или одинаковых кювет, наполненных на- IМ гретым газом (одинаковые температура, давление, вообще все макроскопические параметры). Используя различные источники из ансамбля, мы будем получать различные записи колебательного р 7 ~ процесса En(t) (рис. 7.5). Полученная совокупность записей представляет собой ансамбль случайных функций. Случайный ха- характер процесса проявляется в том, что каждый раз мы получаем новую функцию En(t), не повторяющую в точности ни одну из других функций; при этом невозможно предсказать заранее, какую точно из реализаций ан- ансамбля мы получим в данном эксперименте. Любую из записей En(t) можно характеризовать лишь вероятностно (определяя, например, вероятность, с которой то или иное значение принимает функция в любой момент времени). В этом состоит отличие случайного процесса, определяемого вероятностны- вероятностными законами, от процесса детерминированного, в котором каждое значение измеряемой величины абсолютно точно предсказуемо. Статистический характер светового излучения обусловлен фундаменталь- фундаментальными физическими свойствами источника. Всякий реальный источник — это совокупность огромного числа атомов. Каждый из атомов может стать элементарным источником излучения, если благодаря какому-либо меха- механизму (столкновение с другим атомом, электронный удар и т. д.) он бу- будет переведен в возбужденное состояние. Случайный, статистический харак- характер механизма возбуждения определяет статистическую природу излучения. Любой из атомов может начать высвечиваться в произвольный, случай- случайный момент времени t{. Другое важное обстоятельство связано с характе- характером излучения отдельного атома. Возбужденный атом излучает конечное время. С классической точки зрения атом можно рассматривать как коле- колебательную систему (осциллятор) с определенной добротностью. Излучение
430 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН такого осциллятора представляет собой процесс свободных затухающих ко- колебаний. Мы приходим, таким образом, к картине, изображенной на рис. 7.6 (под ei (t) можно понимать изменение напряженности электрического поля в цуге излучения). Нужно отметить, что атомные системы обладают чрезвы- чрезвычайно малым затуханием (высокой добротностью), поэтому длительность цуга то существенно больше периода колебания: то ^> Т (характерные дли- длительности цугов для оптического диапазона излучения то ~ 10~8-10~10 с, что на много порядков превышает период светового колебания Т с± 10~15 с). Возбужденный атом, излучая цуг, постепенно теряет энер- энергию и по прошествии времени порядка то переходит в основ- основное, невозбужденное состояние; говорят, что длительность цуга есть время жизни атома в возбужденном состоя- состоянии. Последовательность цугов, излучаемых атомом како- какого-либо источника света, показана на рис. 7.7. Статисти- Статистический характер механизма возбуждения приводит к тому, что моменты возникновения излучаемых цугов ti, ?2, • • • , tn являются случайными независимыми величинами. Наконец, важно иметь в виду, что в излучении одновременно принимает участие большое число атомов. Обозначая последовательность цугов, излу- излучаемых каким-либо п-м атомом через en(t), запишем суммарное излучение в виде: Рис. 7.6 E(t) = (t), G.14) причем сумма G.14) содержит в каждый момент времени огромное число «живых» (отличных от нуля) слагаемых. Попробуем качественно описать свойства суммарного колебания G.14), ис- исходя из представления о цугах конечной продолжительности то и случайном характере их возникновения. Ясно, что вклад в суммарное колебание в некоторый момент времени t вносят лишь те цуги, начало ко- которых tn лежит в интервале от t — tq до t, поскольку все цуги, начавшиеся до момента — то, успевают затухнуть к моменту t. Для Рис. 7.7 уяснения качественной картины будем полагать, что число «живых» слагае- слагаемых в сумме G.14) (т. е. число излучающих в каждый момент времени t ато- атомов) равно N. Поскольку любой атом с равной вероятностью может начать излучать в любой момент времени t, то среднее число цугов, начало которых приходится на любой малый интервал времени At равно п = N At/то. Таким образом, доля цугов, заканчивающихся за время At и заменяющихся новыми, равна At/то, причем через вре- время At ^ то в сумме G.14) все N излучающих цугов заменя- заменяются новым набором. Все сказанное выше можно пояснить, используя вектор- векторную диаграмму. Вектор, изображающий суммарное коле- колебание G.14), представляется на векторной диаграмме суммой большого чи- числа элементарных векторов, соответствующих излучению отдельных атомов (рис. 7.8). Ориентация каждого элементарного вектора на этой диаграмме Рис. 7.S
7.3. КВАЗИМОНОХРОМАТИЧЕСКИЕ ВОЛНЫ 431 случайна. За время, малое по сравнению с длительностью цуга то, ориента- ориентация суммарного вектора и его длина изменятся несущественно, т. к. лишь небольшая часть элементарных векторов заменится другими. Через время порядка то возникает совершенно новая совокупность элементарных векто- векторов, что приводит к новым значениям длины а и угла наклона ср суммарного вектора, которые не связаны со старыми значениями этих величин. При- Причем качественно ясно, что случайные функции a(t) и (p(t) могут изменяться независимо друг от друга. Действительно, при другой реализации напра- направлений элементарных векторов может образоваться суммарный вектор той же длинны а(?), но имеющий произвольное направление <p(t): угол накло- наклона суммарного вектора никак не связан с его длиной. Можно сказать, что случайные функции a(t) и cp(t) статистически независимы. Как следует из изложенного выше, амплитуда и фаза суммарного колеба- колебания испытывают случайные изменения с характерным временным масшта- масштабом то- Мы приходим, таким образом, к представлению о квазимонохрома- квазимонохроматическом процессе и можем записать колебание G.14) в виде E(t) = a(t) cos (cjot - (p(t)) , G.15) где a(t) и cp(t) — медленно и хаотически меняющиеся функции. Характер- Характерный временной масштаб их изменения то носит название времени корреляции или времени когерентности. Принято говорить, что значения a(t) и a(t-\-r) коррелированы при т < то и некоррелированы при т > то- Это же относится и к значениям фазы cp(t) и (p(t-\-r). Еще раз напомним: мы полагаем, что функ- функции a(t) и cp(t) остаются практически неизменными на интервалах времени At, содержащих большое число периодов светового колебания 2тг/с«;о- Имен- Именно в этом смысле понимается медленность их изменения и именно поэтому процесс G.15) является квазимонохроматическим. Итак, квазимонохроматическое колебание G.15) изображается на вектор- векторной диаграмме в виде вектора с медленно и хаотически изменяющимися длиной и направлением. Этому вектору соответствует комплексная функция f(t) = a(t)e^\ G.16) которая является аналогом комплексной амплитуды гармонического про- процесса и которую можно назвать комплексной амплитудой квазимонохрома- квазимонохроматического процесса G.15). Мы будем пользоваться комплексным представле- представлением квазимонохроматических колебаний, ставя в соответствие реальному процессу G.15) комплексную функцию V(t) = а(*)е-*("*-^ = f(t)e~iut. G.17) Подчеркнем, что в выражении G.17) статистический (случайный) харак- характер имеет первый сомножитель — комплексная амплитуда /(?), второй же сомножитель e~lujt описывает гармоническое колебание с частотой ио. Можно сказать, что f(t) является медленно и хаотически меняющейся оги- огибающей случайного процесса V(t), т. е. функция /(?) описывает закон слу- случайной амплитудно-фазовой модуляции гармонического процесса. Реальное возмущение E(t) связано с V(t) формулой E(t) = ReV(t) = Re (/(t)e"iw*) . G.18)
432 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН Поскольку в дальнейшем мы будем использовать комплексное представле- представление G.17), необходимо установить соотношение между комплексной функ- функцией V(t) и результатами экспериментальных наблюдений. Сделаем несколько замечаний о свойствах фотоприемника, с помощью которого проводится анализ светового излучения. Таким фотоприемником может быть глаз, фотопластинка, фотоэлемент и т. д. Все эти устройства регистрируют поток энергии, усредненный за некоторое, характерное для данного фотоприемника, время AT, которое можно назвать временем ре- регистрации (или постоянной времени фотоприемника). Поскольку световой поток (поток энергии) пропорционален квадрату напряженности поля Е2 (?) в волне, то регистрируется величина t+AT/2 I = t-AT/2 -LAI /Z / E2{t)dt, G.19) называемая интенсивностью света. Постоянные времени разных приемников сильно различаются: у сетчат- сетчатки глаза время экспозиции (регистрации) AT c± 10 с (глаз не успевает замечать мелькания кадров на экране кино и телевизора). Время экспози- экспозиции фотоматериалов обычно AT c± 10~2-10~4 с, хотя может быть и минуты и даже часы. У некоторых типов фотоэлементов время регистрации AT c± ~ 10~6-10~8 с. Результат измерения существенно зависит от соотношения между временем экспозиции и характерным временным масштабом реги- регистрируемых процессов. Квазимонохроматические колебания характеризуются двумя временными масштабами: периодом «несущего колебания» Tq = 2tt/u;q и временем коге- когерентности то- В диапазоне видимого света, как отмечалось выше, 2tt/u;q ~ с± 10~15 с, а время когерентности даже для самых узких спектральных ли- линий не превышает значений то ~ 10~7-10~8 с (излучение когерентных ис- источников света — лазеров — имеет время когерентности на несколько по- порядков больше). Таким образом, в оптике всегда AT ^> Tq — не существует фоторегистрирующих устройств, способных следить за отдельным периодом светового колебания. Однако при сравнении AT и то можно выделить два случая: 1. AT < то- Такой фотоприемник может следить за случайными изме- изменениями светового потока, обусловленными конечной длительностью цугов излучения атомов. 2. AT ^> то- Фотоприемник регистрирует средний световой поток (сред- (среднюю интенсивность). Этот способ регистрации можно назвать инерционным. Именно этот случай реализуется в большинстве оптических экспериментов и именно его мы будем иметь в виду в дальнейшем. Используя G.15), перепишем G.19) в виде t+AT/2 ' = Sf / « t-AT/2
7.4. ФУНКЦИЯ КОГЕРЕНТНОСТИ 433 Выражая квадрат косинуса с помощью равенства cos2 a=(l/2)(l+ cos 2а), получим: t+AT/2 t+AT/2 2t. G.20) t-AT/2 t-AT/2 За время наблюдения AT подынтегральная функция во втором слагаемом в формуле G.20), осциллируя с удвоенной световой частотой, многократно меняет знак, поэтому второй интеграл пренебрежимо мал в сравнении с пер- первым, тогда t+AT/2 t-AT/2 (черта означает усреднение по времени регистрации). С другой стороны, используя G.16), имеем: (t)e-i(PW = a2(?). Таким образом, наблюдаемая интенсивность выражается через комплекс- комплексную амплитуду /(?) равенством /=A/2)/(*)/*(*). Очевидно теперь, что интенсивность можно выразить аналогичным обра- образом и через комплексную функцию V(t) (используя G.17)): I=(l/2)V(t)V*(t). Будем в дальнейшем определять интенсивность, как и раньше, равенством / = а2(?) (без множителя 1/2); тогда I = a2(t) = /(*)/*(*) = V(t)V*(t). G.21) 7.4. Функция когерентности Интенсивность — одна из характеристик светового излучения в фиксиро- фиксированной точке наблюдения — не является исчерпываю- исчерпывающей. Действительно, рассмотрим два случайных процес- _1:1_ са V\{t) и V<2(?), показанных на рис. 7.9. Пусть средняя интенсивность за время регистрации AT у этих двух про- процессов одинакова. Однако качественно ясно различие ме- между ними: первый процесс V\(t) — это «медленный» про- процесс, второй, V<2(?), — «быстрый» процесс: изменения wi^VH^^yjK'iuiyv^ 7 функции V<2(?) происходят существенно быстрее, чем Ц функции V\{i). Итак, кроме величины средней интенсив- интенсивности, определяемой равенством G.21), нужна также и ^ис< ™ характеристика, которая была бы связана с быстротой изменений случай- случайной функции /(?). Такой характеристикой является функция Г(т), опреде- определяемая равенством: Г(т) = V(t)V*(t + т) = /(<)/*(* + г) • ei0JT. G.22)
434 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН В теории случайных процессов эта функция называется функцией корре- корреляции, а в оптике — временной функцией когерентности случайного про- процесса V(t), описывающего хаотический характер световых колебаний (хао- (хаотические изменения амплитуды a(t) и фазы ip(t)). Как мы увидим в дальнейшем, она определяет результат интерференции квазимонохроматических волн и является количественной мерой корреля- корреляции (когерентности), качественные представления о которой были введены при обсуждении статистической природы светового излучения. Используя определение G.22), найдем t+AT/2 г(т) = е"тКт / /(*)/*(*+ r)d*- t-AT/2 Определение Г(т) включает в себя следующую последовательность опера- операций: нужно взять значение /(?) в момент времени t{ и умножить на значение функции /*(?) в момент времени ti + т. Перебираем всевозможные значения U (при фиксированном т) на интервале времени измерения (от t — AT/2 до t + AT/2). Найдя их среднее, получим значение функции Г(т) при заданном фиксированном значении т. Мы полагаем, что от положения интервала усреднения AT на оси времени функция Г не зависит, т. е. световое излучение представляет собой стаци- стационарный случайный процесс. Это означает, что физические (макроскопиче- (макроскопические) параметры, определяющие свойства источника излучения (темпера- (температура, давление и т. д.), а также условия на пути распространения света от источника к точке наблюдения остаются неизменными во времени. Исследуем характер поведения функции Г(т). При г = 0 функция Г(т) равна интенсивности света t+AT/2 t-AT/2 Отметим, что G.24) — это сумма действительных положительных чисел f(U)f*(U)Ati = a2(ti)Ati, т. е. изображающие отдельные колебания векто- вектора на векторной диаграмме выстроены коллинеарно вдоль действительной оси. Ясно, что суммарный вектор Г@) имеет при этом максимально воз- возможную длину. Таким образом, функция Г(т) имеет при т = 0 максимально возможное значение, равное интенсивности света. Как изменяется это зна- значение с ростом т? Ясно, что пока т ^ tq — времени когерентности (но мо- может быть значительно больше Tq = 2тг/сс;), аргумент комплексной функции f(t)f*(t + r) = а(?)а(? + т)е^Ь^+т)) равный А<р = ip(t) - ip(t + т), близок к нулю при любом t на интервале усреднения At, так как (p(t-\-r) хорошо «по- «помнит» значение фазы cp(t) в предшествующий момент времени и повторяет эти изменения почти в точности: суммарное колебание V(t) состоит почти из той же совокупности цугов, что и V(t + г). Итак, (p(t + т) — (p(t) с± 0, аналогичным образом a(t + т) с± а(?), поэтому /(*)/*(* + г) ~ a2(t) = /0 и Г(т) ~ 10е-™т при т « т0.
7.4. ФУНКЦИЯ КОГЕРЕНТНОСТИ 435 Можно заключить, что при т ^ tq функция Г(т) имеет модуль, мало отличающийся от интенсивности и аргумент, близкий к lot . При т ^ то значения фаз cp(t) и cp(t + т) некоррелированы, т. е. при задан- заданном cp(t) фаза cp(t-\-r) может с равной вероятностью принять любое значение от нуля до 2тг, следовательно и разность фаз Аср = cp(t) — cp(t-\-r) может быть любой, принимая с равной вероятностью (за время наблюдения AT ^> то) все возможные значения. Величина е^Л(^ = cos Аср + г sin Acp оказывается близкой к нулю. Таким образом, Г(т) = f(t)f*(t + r) ¦ е"^т ~ 0 при т > т0. Итак, введенная нами функция Г(т) имеет «правильное поведение», ко- которое соответствует нашим качественным представлениям о сильной корре- корреляции при т ^С то (при этом Г(т) с± Iq • e~luJT) и об отсутствии корреляции при т ^ то (при этом Г(т) с± 0). Функция Г(т) и является количественной мерой коррелированности значений случайного процесса V(t) в два момента времени разделенных промежутком т. Подчеркнем, что в результате усреднения мы получаем детерминирован- детерминированную функцию Г(т), которая является одной из важнейших характеристик стационарного случайного процесса f(t). Эта функция определяет закон, по которому постепенно уменьшается когерентность с ростом т. Удобно, наряду с G.22), ввести нормированную функцию 7(Т) = М = Ш?±1)^, (,25) которая изменяется от единицы при т = 0 до нуля при т ^ то- Функцию j(r) называют комплексной степенью когерентности случайного процесса V(t). Понятие временной когерентности, введенное выше для случайного коле- колебательного процесса V(t), можно обобщить, введя функцию взаимной коге- когерентности двух случайных процессов V\(t) и V^(t): которая является количественной мерой когерентности двух процессов, разделенных промежутком времени т. Процессы V\{t) и V2(t + r) называются некогерентными, если Гх2(т) =0 при любом т. Рис' 7'10 Рассмотрим вопрос о когерентности колебаний, созданных в некоторой точке наблюдения Р волнами, приходящими от двух независимых источников S\ и *§2 (рис. 7.10). Каждая из волн образована своей совокупностью цугов: волна V\ образована цугами, излученными атомами источ- источника *Si, а волна Т^ состоит из цугов, излученных атомами источника *§2. Так как атомы S\ излучают независимо от ато- атомов $2, то моменты возникновения цугов, составляющих вол- Рис. 7.11 ну V\, никак не связаны с моментами возникновения цугов в волне V<2. Это означает, что положение каждого элементарного вектора в совокупности, образующей суммарный вектор Vi, не связано с положением каждого элементарного вектора в совокупности V2 (рис. 7.11). Следователь- Следовательно, и положения суммарных векторов V\ и V2 никак не связаны между собой:
436 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН разность фаз (fi — (f2 может быть любой; длины векторов (амплитуды коле- колебаний V\ и V2) также независимы. Выше мы говорили, что корреляция (когерентность) в каждой из волн сохраняется в течение времени порядка то, значит, через время ~ то каждое из колебаний V\ и V2 образуется уже новой совокупностью не связанных между собой цугов, так что через время порядка то разность фаз (fi — (f2 изменяется случайным образом. Таким образом, Vi(t)V?(t + T) = 0 при любом т, т. е. волны, излучаемые двумя независимыми источниками света, некоге- некогерентны. 7.5. Интерференция квазимонохроматических волн Пусть колебание в некоторой точке наблюдения создано суперпозицией двух квазимонохроматических волн Е\ и Е2 вида G.15). Тогда суммарный колебательный процесс в этой точке имеет вид: E(t)=E1(t)+E2(t). Регистрируемая приемником света интенсивность, согласно G.21), есть где a(t) — амплитуда результирующего колебания E(t). Результирующий колебательный процесс представляет собой хаотически модулированное колебание с медленно меняющимися (в масштабе периода a2( ) jt^ _ 2тг/сс;о) амплитудой a(t) и фазой cp(t) E(t) = a(t) cos i Ясно, что, поскольку в слагаемых колебаниях амплиту- амплитуды a\(t) и a2(t), a также фазы (fi(t) и (f2(t) сохраняют- сохраняются неизменными на протяжении большого числа периодов светового колебания, то и амплитуда, и фаза суммарного колебания так- также практически неизменна на протяжении большого числа периодов (их характерное время изменения во всяком случае не меньше времени коге- когерентности). Мы уже познакомились в гл. 1.3 с тем, что квазигармонические колебания можно складывать по правилу сложения векторов так же, как строго гармонические колебания (рис. 7.12). Используя теорему косинусов, получаем a2(t) = a\(t) + a\(t) + 2а\п2 cos A<p(t), G.26) где Aip(t) = p() p() Проводя усреднение последнего равенства в интервале времени регистра- регистрации (которое, напомним, много больше времени когерентности), находим 2ai(t)a2(t) cos Atp(t), G.27) где I\ = (i\(t) ж I2 = tt|(t) — интенсивности слагаемых волн, а / = o?(t) — интенсивность результирующего колебания.
7.5. ИНТЕРФЕРЕНЦИЯ КВАЗИМОНОХРОМАТИЧЕСКИХ ВОЛН 437 Используя комплексные представления G.16) и G.17), легко получить Vi(t)V2*(t) = ai(t)a2(t)e^W. G.28) Третье слагаемое в G.26) можно теперь представить, используя G.28) в виде Итак, 2a1(t)a2(t) cos A(p(t) = 2Re Vi(t)V?(t). t). G.29) Последняя формула представляет собой наиболее общее выражение, спра- справедливое для любой двухлучевой интерференционной схемы. Наибольший интерес представляет интерференционное слагаемое 2 Re yi(t)Vr2*(t). Именно с ними связано отличие суммарной интенсивности / от суммы интенсивно- стей 1\ + /2, т. е. интерференционный эффект. Первый важный вывод, который можно сделать из G.29), состоит в том, что некогерентные волны не могут интерферировать. Действительно, при yi(t)Vr2*(t) = 0 мы имеем / = Д +/2, т. е. при наложении некогерентных волн имеет место закон сложения интенсивностей. В частности, если волны V\ и V~2 испущены независимыми источниками, то они некогерентны и не могут давать интерференционных эффектов. Интерференция может наблюдаться лишь в том случае, если волны по крайней мере частично когерентны. По- Поэтому в интерференционных схемах всегда используют один источник све- света, а две (или несколько) интерферирующих волн получают путем деления (расщепления) одной волны, излучаемой источником. На рис. 7.13 приведе- приведены примеры нескольких интерференционных схем, широко применяемых в -2—| от удаленного источника « D * М з ф >М4 м9 чА/WV д -ЖФ Рис. 7.13 оптике: а — опыт Юнга, б — схема Ллойда, в — бипризма Френеля, г — билинза Бийе, д — интерферометр Майкельсона, е — звездный интерферо- интерферометр Майкельсона; лучи 1 и 2 идут от удаленного источника. Во всех схемах излучение источника S попадает на экран, где наблюдается интерференция,
438 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН по двум различным путям (по двум «плечам» интерференционной схемы), отмеченным на рисунках индексами 1 и 2. Наиболее важными характеристиками любой интерференционной схемы являются: угол схождения волны C в точке наблюдения и угол между лу- лучами, исходящими из источника О, которые каким-либо способом сводятся далее в точку наблюдения. Этот угол О называется апертурой интерфе- интерференции. Пусть V(t) — это колебательный процесс вблизи источника S и пусть V\{t) — это колебательный процесс в точке наблюдения Р, созданный вол- волной, пришедшей от источника по пути 1. Соответственно T^(t) — колебание в точке наблюдения, созданная второй волной (пришедшей по пути 2). Тогда: Vi(t)=a1V(t-T1); V2(t)=a2V(t-T2), G.30) т. е. колебательный процесс V\(t) (созданный волной, пришедшей в точку наблюдения по пути 1) в точности повторяет колебание V(t) вблизи источ- источника, лишь с запаздыванием на время ri, и с уменьшенной амплитудой, то же касается и процесса T^(t), т\ = г\/с и т2 = г2/с — времена распростра- распространения волны от источника до точки наблюдения (г\ — путь, проходимый волной вдоль первого плеча интерференционной схемы, а г2 — путь волны V2 по второму «плечу»). Коэффициенты пропорциональности а\ и «2 учи- учитывают ослабления волн из-за сферической расходимости или поглощения. Используя G.30), получаем Vi{t)V*{t) = Мы полагаем, что условия стационарности выполнены, поэтому интервал усреднения можно сместить т. е. середину интервала [t — AT/2, t + AT/2] — момент t, — сместить в точку t' = t — т\. Тогда Vi(t)y2*(t) = a1a2V(tr)V*(tr + r) = а1а2Т(т), где т = т\ — Т2 — относительное запаздывание, зависящее от разности длин плеч А = г\ — Г2 интерференционной схемы: т = А/с. Таким образом, интер- интерференционный эффект определяется функцией временной когерентности колебательного процесса V(t). Используя G.30), запишем I = I1+I2 + 2axa2 ReГ(т). G.31) Так как 1\ = а\1$ и 12 = с^|/о? где ^о — интенсивность света вблизи источ- источника, то ol\ol2 — VI1I2/I и вместо G.31) получаем G.32) где 7(т) — комплексная степень когерентности — нормированная функция (см. G.25)), которая изменяется от 1 при г = 0 до нуля при т ^ то- При равных интенсивностях обеих волн 1\ = 12 = /о формула G.32) при- принимает вид ). G.33) Комплексную функцию j(r) запишем в виде j(r) = |7(/г)|ег^т+61(т^, где в — аргумент комплексной функции /(т) • /*(? + т), т. е. в = (p(t) — (p(t + т).
7.5. ИНТЕРФЕРЕНЦИЯ КВАЗИМОНОХРОМАТИЧЕСКИХ ВОЛН 439 Тогда: 1(т) = 270 A + Ь(т)\ cos(cot + 0(т))), G.34) причем 6@) = 0: вспомните, что при т = 0 7(т) = 1 — действительное число. Значит /тах = 2/оA + |7(T)I)^ ^min = 2/оA — |7(тI) и Для видностпи находим: F = |7(r)|. Общие выводы, которые можно сделать из G.34), состоят в следующем. 1. Пусть временное запаздывание одной волны относительно другой пре- превышает время когерентности т > то, соответственно разность хода волн А > ctq. В этом случае j(t) ~ 0 и / = Д + /2- Таким образом, при боль- большом временном запаздывании (т > то) или, другими словами, при большой разности хода А > сто волны перестают быть когерентными и не интерфе- интерферируют (хотя эти волны и созданы одним источником света). 2. Пусть т < то- Тогда 7(т) 7^ 0 и I ?" А + ^2: волны частично когерентны, наблюдается интерференция. 3. Если т ^С то, то 7(т) — 1 и вместо G.34) получаем где т = А/с — временное запаздывание, А — разность хода. Точно такое же выражение получается, если рассматривать строго гармонические волны. Мы получили, таким образом, ответ на вопрос о применимости синусоидаль- синусоидальной идеализации: при сложении когерентных волн все происходит так, как если бы волны были строго гармоническими. Общий характер зависимости интенсивности в интерференционной картине от т = А/с (т. е. при изменении положения точки наблюдения), показан на рис. 7.14. С ростом т постепенно уменьшается видность (контраст) полос. Наконец, при т ^ то полосы вовсе исчезают и мы приходим к закону сло- сложения интенсивностей (при равных интенсив- рис. 7.14 ностях / = Iq + Iq = 2/q). Подчеркнем, что поскольку в квазимонохроматической волне т ^> Tq, to быстро меняющийся при изменении т множитель соб(шот + в (г)) (его значе- значение меняется от 1 до 0 при изменении т на То/2) «промодулирован» медленно спадающей функцией |7(т)| (|7(тI спадает от единицы до нуля при измене- изменении т от нуля до то), т. е. мы наблюдаем множество переходов от светлой полосы к темной (т. е. множество интерференционных полос) прежде, чем они окончательно исчезнут. Разумеется, точный ход зависимости /(т) определяется конкретным ви- видом функции j(t), т. е. в конечном счете свойствами источника, от которого зависит форма цугов излучения. Рис. 7.14 дает лишь качественное пред- представление об этой зависимости, достаточное, впрочем, для проведения не- некоторых оценок. Можно заключить, что максимальная разность хода, при которой еще видна интерференция Атах — сто, а максимальный порядок интерференции mmax = Amax/A = сто/А =
440 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН Величину / = ctq принято называть длиной цуга (это пространственная протяженность цуга излучения длительности то). Таким образом, макси- максимально допустимая разность хода ограничена длиной цуга, максимальный порядок интерференции числом периодов колебаний, содержащихся в цуге излучения: mmax ~ то/То. 7.6. Связь функции когерентности и распределения энергии по спектру. Соотношение неопределенностей Изучая распределение интенсивности в интерференционной картине, мож- можно определить функцию когерентности квазимонохроматической волны, из- излучаемой тепловым источником света — таков вывод из выражения G.34). С другой стороны, о свойствах излучения можно судить по спектраль- спектральным измерениям, исследуя с помощью спектрального прибора распределе- распределение энергии по спектру квазимонохроматической волны в фиксированной точке наблюдения. Важно понять, в каком соотношении находятся эти спо- способы измерения, какова связь между функцией когерентности и энергети- энергетическим спектром? I |—^Л^^г/К^ / Распределение энергии по спектру квази- _ ' \\ /rO^/xCcoi) монохроматического колебания Х(ш) можно sl^X / \ 11/гу^ 1 (щ) определить например с помощью призменно- го спектрографа (рис. 7.15). Параллельный пучок квазимонохромати- гис. 7.15 ческого света падает на призму и, благодаря дисперсии — зависимости показателя преломления от частоты, разделяется на множество монохроматических пучков, каждый с определенной частотой lo. Интенсивность каждого из этих пучков Х(с<;), определяющую распределе- распределение энергии по частоте, называют спектральной интенсивностью. Сумма интенсивностей всех монохроматических пучков равна, очевидно, интенсив- интенсивности квазимонохроматического света, попадающего на входную щель спек- спектрографа: /= Гх(ш)дш. G.35) Смысл соотношения G.35) состоит в том, что полная интенсивность света может быть получена путем аддитивного сложения интенсивностей отдель- отдельных монохроматических волн, составляющих суммарную квазимонохрома- квазимонохроматическую волну: другими словами, спектральные гармоники разных частот некогерентны между собой. Следовательно, интерференционная картина, получаемая с помощью источника квазимонохроматического излучения, мо- может быть рассчитана следующим образом: нужно взять отдельную монохро- монохроматическую компоненту частоты ш (и интенсивности 1(ш) doo) и найти ин- интерференционную картину, создаваемую этой компонентой, используя фор- формулу G.8) dl = 2X(w) du (l + cos (-Д)) , G.36) после чего некогерентно сложить вклады: 1 = 2 f Х{ш) (а + cos (-Д)) do;. G.37)
7.6. СВЯЗЬ ФУНКЦИИ КОГЕРЕНТНОСТИ И РАСПРЕДЕЛЕНИЯ ЭНЕРГИИ 441 Очевидно, результаты расчетов, основанные на спектральном подходе (формула G.37)) и временном подходе (формула G.33)) должны быть то- тождественными. Исходя из этого, мы можем связать спектральную интен- интенсивность Т(ио) с функцией временной когерентности Г(т). Наиболее важной является связь между шириной спектра Аи; (интервалом частот, в котором спектральная интенсивность Аи; заметно отличается от нуля) и временем когерентности то (интервал значений т, в котором отлична от нуля функция когерентности Г(т)). Рассмотрим простой пример. Пусть функция Т(ио) имеет вид (рис. 7.16) Iq при \и; — u;q\ < Аи;/2 О при \ш — шо\ > Аи;/2 Тогда, используя G.37), найдем а;о+Аа;/2 / (l + -O))d- = 210 В результате интегрирования получим I = 2I ,i , sin(Aa;/2c)A со0 Рис. 7.16 cos (cjq/c) А G.38) (Acj/2c) A где Iq = Iq - Аи; — интенсивность интерферирующих волн (т. е. суммарная интенсивность всех спектральных компонент). Функция J(A) изображена на рис. 7.17. Здесь быстро изменяющийся множитель cos (cjq/c) А промодулиро- ван медленным изменением множителя sin (Аи/2с) А (Аш/2с) А Т.К. ). Максимально допустимую (для наблюдения интерференционной картины) разность хода Атах мож- можно оценить из условия: АтахАс<;/Bс) = тг, здесь Атах — значение А, при котором функция «огибающей» (выра- (выражение в квадратных скобках) обращается в нуль: Amax - 2ttc/Auj. G.39) Число наблюдаемых полос (максимальный порядок интерференции mmax) есть mmax ~ Amax/A0 = 2nc/(XoAuj). G.40) Сопоставляя выражения для максимально допустимой разности хода, по- полученные при временном (Amax ~ сто) и спектральном (формула G.39)) подходах, находим связь между шириной спектра Auj и временем корреля- корреляции То Aujt0 ~ 2тг. G.41) Сужение спектра Аи; приводит, согласно G.41), к увеличению времени ко- когерентности то, т. е. к увеличению длительности цугов; наоборот, чем короче цуги, тем шире спектр — таков смысл соотношения G.41), называемого со- соотношением неопределенности.
442 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН Выражая ширину спектрального интервала в длинах волн А А, имеем для mmax и Атах следующие соотношения: mmax = Ao/AA; Amax = А§/ДА. G.42) Приведем числовые оценки ттах и Атах для некоторых реальных источ- источников. 1. Дуговой фонарь без фильтра, визуальное наблюдение АА = 2,5-3 • 10~5 см, Ао = 5 • 10~5 см; mmax ~ 2; Атах ~ 10~4 см. 2. То же со стеклянным светофильтром АА ~ 300 А = 3 • 10~6 см, Ао ~ 5 • 10~5 см; mmax ~ 20, Атах ~ 10~3 см. 3. Узкая спектральная линия АА ~ Ю-3 A, mmax - 5 • 106; Атах - 2,5 м. 4. Излучение стабилизированного газового лазера wmax — -LU 7 ^max — О КМ. Знаменитое соотношение неопределенности G.41) получилось не случай- случайно. Оно является следствием общей связи, существующей между функцией когерентности Г(т) и спектральной интенсивностью 1(ш). К нахождению этой связи мы и перейдем. Вернемся к соотношению G.37), представив правую часть равенства в виде: /(А) = 2 f 1{ш) duo + 2 f 1{ш) cos (- A) do;. Интеграл в первом слагаемом представляет собой суммарную интенсив- интенсивность света в каждой из интерферирующих волн :{u))du) = /0, (т. е. первое слагаемое 2/q — это сумма интенсивностей слагаемых волн). Второе слагаемое перепишем в виде 2 11(ш) cos (- A) du; = 2 Re f 1(ш)е^ш^А dcu. Таким образом, вместо G.37) имеем Сравнивая полученное выражение с G.33), найдем = Г(т). Г Итак, функция X{ui) — распределение энергии по спектру — является преобразованием Фурье функции когерентности Г(т) = Г Y{r)e-iuT dr. G.43)
7.7. ПРОСТРАНСТВЕННАЯ КОГЕРЕНТНОСТЬ И ИНТЕРФЕРЕНЦИОННЫЕ ЯВЛЕНИЯ 443 Понятно, что соотношение неопределенности G.41), связывающее ширину спектра Аш со временем когерентности, является следствием общей свя- связи G.43). Замечание. Качественно ясно, почему с ростом ширины спектра излуче- излучения контраст интерференционных полос уменьшается. Это связано с тем, что полосы, отвечающие разным частотам (разным длинам волн), имеют разную ширину (/ с± А//?). Полосы, отвечающие большим длинам волн, бо- более широкие, поэтому с ростом порядка полосы т (т. е. с ростом разности хода А = га А) смещение полос одинакового порядка га, отвечающих разным А, постепенно нарастает. Наконец, наступает ситуация, когда на (га + 1)-ю полосу длины волны А (правый край спектральной полосы Аи) налагается га-я полоса длины волны А + А А, отвечающей левому краю спектральной полосы излучения источника, т. е. Д = (га + 1)А = га(А + АА). При дальнейшем росте А полосы практически исчезают: на минимум ин- интенсивности одной длины волны налагается максимум какой-либо другой длины волны из спектрального диапазона излучения. Суммарная картина интенсивности усредняется. Из последнего равенства получаем уже знако- знакомую нам оценку максимального порядка интерференции гатах = А/АА. 7.7. Пространственная когерентность и интерференционные явления при использовании протяженных источников До сих пор речь шла о том, как на интерференционных явлениях ска- сказывается отличие реальной волны от строго монохроматической. При этом источники света считались точечными (содержащими однако огромное чи- число излучающих атомов). Понятие «точечный источник» — идеализация, ничуть не меньшая, чем понятие «монохроматический источник». Все источники света имеют опре- определенную протяженность, а это приводит к возникновению интерференци- интерференционной картины меньшей контрастности, чем это следует из приведенных ранее расчетов. Как показывает опыт, при увеличении размеров источника видность интерференционной кар- ^ тины постепенно уменьшается и при достаточно боль- больших размерах интерференционные полосы исчезают вовсе. Легко качественно понять характер изменения видности полос при изменении размеров источника, ес- если исходить из представления о том, что протяженный источник света — это совокупность большого количе- рис 7 ig ства независимых источников (рис. 7.18) (действитель- (действительно, каждая малая площадка источника ASi состоит из атомов, излучающих независимо от атомов другой площадки, ASj (г ^ j)), и таким образом вол- волны, излучаемые этими площадками, Vi и Vj некогерентны: Vi(t)V*(t) = 0 при г ф j. Некогерентность излучения разных точек (малых элементов AS) протя- протяженного источника означает, что при расчете интерференционой картины необходимо найти распределение интенсивности, создаваемое каждой точ- точкой, а затем сложить интенсивности.
444 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН Пусть источник S и плоскость наблюдения в опыте Юнга удалены на- настолько, что волны, приходящие от каждого малого элемента источника к отверстиям Si и $2, а также волны, приходящие к плоскости наблюдения от этих отверстий, можно считать плоскими. Тогда, очевидно, интерферен- интерференционная картина, создаваемая крайней точкой В источника (сплошная кри- кривая 1В на рис. 7.19), смещена относительно интерференционной картины от центральной точки А (пунктирная кри- кривая 1А) на расстояние, равное az. Если это смещение меньше ширины интерференцион- интерференционной полосы / с± А//3, (/3 = d/z — угол схожде- схождения инерферирующих волн, d — расстояние между отверстиями Si и S2), то интерферен- интерференционная картина наблюдается. В противном случае (при а > X/d) интерфе- Рис. 7.19 ренция не наблюдается: суммарная интенсив- интенсивность уже не имеет чередующихся максимумов и минимумов. Это связано с тем, что на темную полосу (минимум интенсивности от одной точки источ- источника) накладывается светлая полоса (максимум интенсивности от другой точки), и суммарная интенсивность оказывается константой — получается равномерная освещенность плоскости наблюдения. Итак, имеем оценку для максимально допустимой ширины источника b: Ъ < (X/d) z0 = А/О, G.44) или, при заданной ширине источника, максимально допустимое расстояние между отверстиями d (которое определяет «апертуру интерференции» О ~ ~ d/z0) d < (А/6) z0 или О < А/6. G.45) Мы привели лишь качественные рассуждения, которые не дают количе- количественной оценки видности интерференционной картины. Такая количествен- количественная оценка тесно связана с важным свойством волны, излучаемой протяжен- протяженным источником света, с пространственной когерентностью. Если в опыте Юнга используется точечный источник света 5, находя- находящийся на одинаковом расстоянии от отверстий Si и $2, то волны от этого источника создают на отверстиях одинаковые колебания: амплитуда и фа- фаза колебаний Vi(t) в точке Si в любой момент времени такие же, как и в колебании V^(t) (в точке S2): Отметим, что при этом V1(t)V2*(t) = V(t)V*(t)=I. Таким образом, колебания Vi(t) и V^(t) полностью когерентны. В случае протяженного источника колебания в точках Si и $2 создают- создаются всеми точками источника, причем лишь центральная точка источника создает на отверстиях одинаковые по амплитуде и фазе колебания. Любая другая точка посылает волну, создающую на отверстиях разные по фазе ко- колебания (просто из-за того, что она находится на разных расстояниях от Si и S2). Ясно поэтому, что и суммарное колебание Vi(t) в точке Si отличается
7.7. ПРОСТРАНСТВЕННАЯ КОГЕРЕНТНОСТЬ И ИНТЕРФЕРЕНЦИОННЫЕ ЯВЛЕНИЯ 445 по фазе (и по амплитуде) от колебания V<2(?) в точке S2. Это приводит, как мы увидим, к уменьшению величины Функция Fi2@) называется функцией пространственной когерентности. Пусть V\(t) и V<2(?) — колебания, созданные протяженным квазимонохро- квазимонохроматическим источником S в точках S\ и S2 плоскости П\ (рис. 7.20). Чтобы экспериментально определить, когерентны ли коле- колебания V\(t) и V<2(?) установим в плоскости П\ не- непрозрачный экран, проделав два малых отверстия в точках S\ и а§2. Волны света, проходя через отверстия, идут (из- ' / П Я< за дифракции) в разных направлениях и, перекры- ваясь, создают (или не создают) интерференцион- Рис. 7.20 ную картину в плоскости наблюдения Л2. Эта картина, как мы увидим, даст нам информацию о функции когерентности yi(t)Vr2*(t). Колебание в точке наблюдения Р есть результат наложения волн, при- пришедших в эту точку от S\ и S2. Колебания, созданные волной, пришедшей от отверстия Si, запишем в ви- виде a\V\{t — 7~i), где константа а\ учитывает ослабление волны из-за расхо- расходимости, а т\ = г\/с есть время распространения волны от Si до Р, т. е. колебание в точке Р в момент t такое же, как на отверстии Si в момент t — Ti, лишь уменьшенной амплитуды. Аналогично волна от отверстия S2 создает колебание c^V^t —T2), где Т2 = = г%/с. Результирующее колебание, согласно принципу суперпозиции, есть V(t) = aiVi(t - n) + a2V2(t - r2). Как и ранее, находим I = \V(t)\2 = h + I2 Будем считать, что для всей интересующей нас области наблюдения запаз- запаздывание одной волны относительно другой т мало по сравнению с временем когерентности то (но конечно, может быть много больше периода светового колебания 2тг/uq) г ^ tq. Это означает, что за время т = А/с (А = г\ — г2) амплитуда и фаза колеба- колебания V<2(?) не успевает заметно измениться, т. е. колебание в момент времени t + г состоит из той же совокупности цугов, что и в момент времени t. Тогда f2{t + т) ~ f2{t) и V2(t + т) = f2(t + т Вспомнив определение функции пространственной когерентности, полу- получаем I = Д + 12 + 2Re (Pi2@)e^oT) . G.46) Из G.46) следует, что интенсивность света во всех максимумах интерфе- интерференционной картины одна и та же (независимо от порядка интерференции), т. к. величина Fi2@) не зависит от положения точки наблюдения (не зависит от т при условии что т ^С то), а определяется лишь апертурой интерферен- интерференции (в опыте Юнга — угловым расстоянием между отверстиями Si и S2)
446 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН или, при заданном расстоянии, размерами источника. Таким образом, вид- видность интерференционной картины одинакова во всех точках. Вводя, как и ранее, нормированную функцию 712@) = Г12(О)//Г^2, называемую степенью пространственной когерентности, получим из G.46) 1{т) = Il+I2 + 2/^2 Re G12@)е^°т) . G.47) Или, при равных интенсивностях Д = 1% = /о 1{т) = 2/0 A + Re Gi2@)e^T)) . G.48) Полученные выражения G.47) и G.48), определяющие интерференцион- интерференционную картину при использовании протяженного источника, справедливы для любой двухлучевой интерференционной схемы. Формулу G.48) можно запи- сать в виде 1(т) = 270 A + |7i2@)| + в)), G.49) где в — аргумент комплексной функции 712- Видность V выражается через 712@) равенством Пока мы имеем лишь качественную оценку G.45) влияния размеров источ- источника на видность интерференционной картины. Теперь необходимо найти количественную связь функции 712@) с размером источника. Для этого рассмотрим интерференционную картину, создаваемую про- протяженным источником, как сумму интерференционных картин от отдель- отдельных точек источника. В качестве примера вновь обратимся к опыту Юнга (рис. 7.21). Протяженный источник — светящаяся полоска шириной Ъ — и плоскость наблю- наблюдения П находятся на расстояниях zq и z от экрана с отверстиями Si и $2, рассто- расстояние между отверстиями d. Еще раз подчеркнем, что степень моно- монохроматичности источника достаточно ве- Рис. 7.21 лика (т. е. для всей интересующей нас области наблюдения в плоскости П раз- разность хода волн много меньше длины цуга А <С сто). Поэтому можно при расчете картины интерференции, созданной какой-либо точкой источни- источника, пользоваться приближением строго монохроматических волн (форму- (формула G.8)) заданной частоты. Картина интерференции, созданная в плоскости наблюдения центральной точкой источника «О» (точнее малым элементом источника) имеет вид 1 + cos f -^ x О1 х U d/0 = 2Х0 Здесь Iq d? — интенсивность волны, прошедшей через одно из отверстий (и созданной в плоскости наблюдения малым элементом источника )
7.7. ПРОСТРАНСТВЕННАЯ КОГЕРЕНТНОСТЬ И ИНТЕРФЕРЕНЦИОННЫЕ ЯВЛЕНИЯ 447 / = (X/d) z — ширина интерференционной полосы. Ясно, что нулевая по- полоса (соответствующая разности хода А = 0) находится на оси симметрии, в точке О1. Из рис. 7.21 также ясно, что элемент d? источника, имеющий координату ?, создает картину интерференции, смещенную на расстояние х = \z/zo (в точку х смещается нулевая полоса, соответствующая разности хода А = 0). Мы полагаем, что расстояния zq и z велики по сравнению с размером источ- источника b и расстоянием между отверстиями d, т. е. d/ = 2Х0d? U + cos № (Х-±А\). G.50) Результирующую картину интерференции найдем суммированием кар- картин G.50) по всем точкам источника. Получаем 6/2 = 2Х0 -6/2 1 + cos ( — Производя интегрирование G.51), найдем = 210 G.51) G.52) Сравнивая G.52) и G.49), находим степень пространственной когерентно- когерентности, которая определяет видность интерференционной картины: d т ) G.53) sin Xzo/b "Ро 7Г ¦ Функция I712I изображена на рис. 7.22 (аргументом является расстояние d между точками Si и S2). Как следует из G.53), степень когерентности колебаний в двух точках, разнесенных на рас- расстояние d уменьшается от 1 при d = 0 до нуля при d = ро = 2тгz/(kb) = Xz/b. Таким образом, если расстояние между точ- точками Si и $2 меньше Xz/b, то колебания в этих точках частично когерентны: при этом I712I Ф 0. При d > Xz/b I712I — 0, т. е. колебания в точках Si и а§2 некогерентны. Величину ро = Xz/b называют радиусом пространственной когерентно- когерентности, а площадку с линейным размером Xz/b называют площадкой когерент- когерентности. Вводя угловой размер источника ф = b/zo, можно записать р0 = \/ф. G.54) Итак, колебания в любых двух точках, лежащих внутри площадки раз- размером ро частично когерентны, а в точках, расстояние между которыми больше ро — некогерентны. Возвращаясь к опыту Юнга, можно иначе, чем это сделано выше, сфор- сформулировать условия, при которых можно наблюдать интерференционную Ро Рис. 7.22
448 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН картину. Если расстояние между отверстиями Si и $2 меньше радиуса ко- когерентности, то интерференция наблюдается. Аналогичное условие можно сформулировать для любой интерференционной схемы: апертура интерфе- интерференции должна быть меньше углового размера площадки когерентности. Если зафиксировать расстояние между точками Si и $2 и приближать плоскость (ж, у), в которой они находятся, к источнику, то, как следует из G.53), степень когерентности колебаний в этих точках уменьшается. При стремлении zq к нулю (плоскость ху придвинута вплотную к источнику) колебания в любых двух точках, как угодно близко расположенных, неко- некогерентны (ведь любые две точки источника излучают некогерентно). Наобо- Наоборот, с удалением плоскости (ж, у) колебания в точках Si и $2 становятся все более когерентными и при достаточном удалении когерентность колебаний становится полной. Размер площадок когерентности по мере удаления от источника постепенно (пропорционально z) увеличивается. Мы видим, та- таким образом, что первоначально некогерентное поле излучения в процессе распространения приобретает частичную когерентность. В этом и состоит смысл соотношения G.53). 7.8. Интерферометры и интерферометрия Явление интерференции находит широкое применение при решении самых разнообразных физических и технических проблем. Используемые для этого оптические устройства называются интерферометрами (например, интер- интерферометры Майкельсона на рис. 7.13), а область оптики, исследующую воз- возможности использования интерферометров называют интерферометрией. Мы убедились ранее, что интерференционная картина позволяет получить информацию о временной функции когерентности j(t), а следовательно и о спектральном составе излучения Х{ио). Это, в свою очередь, дает информа- информацию о физических процессах в источнике (энергетических уровнях атомов, процессах их взаимодействия, температуре и т. д.). С другой стороны, измерения видности интерференционной картины, со- созданной каким-либо протяженным источником, дают возможность опреде- определить его угловой размер. Интерференционный метод определения угловых размеров звездных объектов (либо измерения углового расстояния между компонентами двойных звезд) был предложен и реализован Майкельсоном. Видность интерференционной картины в фокальной плоскости объектива «О» в схеме звездного интерферометра Майкельсона (рис. 7.13 е) зависит от степени когерентности колебаний на зеркалах Mi и М^ (эти колебания созданы излучением какой-либо удаленной звезды — протяженного источ- источника света). Расстояние D между зеркалами Mi и М2 называется базой интерфероме- интерферометра и может изменяться. Пока это расстояние мало (меньше радиуса коге- когерентности) степень когерентности колебаний в точках Mi и Мъ достаточно велика и интерференционная картина в фокальной плоскости Э объекти- объектива достаточно четкая. По мере увеличения D видность картины постепенно уменьшается и при D = р$ (ро — радиус когерентности, определяемый фор- формулой G.54)) интерференционная картина полностью исчезает. Определяе- Определяемый угловой размер звезды равен ф = А/ро = X/D. G.55)
7.8. ИНТЕРФЕРОМЕТРЫ И ИНТЕРФЕРОМЕТРИЯ 449 Таким образом Майкельсону удалось определить угловой размер крас- красного гиганта — звезды Бетельгейзе. Измеренный экспериментально радиус когерентности D = р$ оказался равным 6 м, а значение ф, рассчитанное по формуле G.55): ф ~ 0,0047". Для сравнения, угловой размер Солнца ф с± 307 — 10 рад, а соответствующий радиус когерентности ро с± 0,06 мм. Вообще, подавляющее большинство звезд имеет диаметр с/, мало отлича- отличающийся от диаметра Солнца, поэтому их угловой размер ф = d/r (в силу огромности расстояния г) чрезвычайно мал. Поэтому для измерений угло- угловых размеров большинства звезд требуются интерферометры с базой D в несколько десятков метров. Создание оптических устройств с такой базой чрезвычайно сложная техническая проблема: ведь нужно обеспечить вы- высокую стабильность расположения зеркал М\ и М2 в процессе измерения («дрожания» одного зеркала относительно другого порядка длины световой волны (А ~ 5 • 10~7 м) приводят к полному исчезновению картины интерфе- интерференции). Серьезной помехой является также атмосферная турбулентность. Проблему позволяют решить радиоинтерферометры. Роль зеркал М\ и М2 играют в данном случае радиотелескопы (две радиоантенны), принима- принимающие сигнал с измеряемого источника в диапазоне радиоволн (А ~ 10 см). Эти две антенны могут располагаться даже на разных континентах, так что база интерферометра D может быть тысячи и десятки тысяч километров. Сигналы с двух радиотелескопов подают на общий детектор, измеряющий интенсивность суммарного сигнала. При использовании радиоинтерфероме- радиоинтерферометров переход от коротких (оптических) длин волн к длинным (радиовол- (радиоволнам) компенсируется увеличением базы интерферометра, поэтому угловой размер измеряемого объекта ф = X/D может быть чрезвычайно малым (примерно в 100 раз меньше, чем при использовании «оптического» интерферо- интерферометра Майкельсона). Широкое применение находят интерферометры для высокоточных измерений расстояний, углов, показателей преломления сред или их изменений ^ис- ' ^З и т. д. На рис. 7.23 показана схема интерферометра Рэлея, предназначен- предназначенного для измерения показателей преломления жидкостей или газов. Пучки света, прошедшие через щели Si и S2 и кюветы Ki и К2, заполненные иссле- исследуемыми жидкостями или газами, собираются объективом Л^ и образуют в его фокальной плоскости интерференционную картину. От разности хода волн, прошедших через кюветы А = I(ri2 — ni) зависит смещение интерфе- интерференционных полос (I — длина кювет, ni и П2 — показатели преломления в кюветах К2 и К{). Измеряя смещение полос, можно определить разность показателей преломления An. Широко распространенный в настоящее время метод изучения спектраль- спектрального состава излучения основан на использовании интерферометра Май- Майкельсона (рис. 7.13 с?), в котором одно из зеркал перемещается в процессе измерения. При использовании монохроматического источника интенсивность света, регистрируемого фотоприемником Ф (расположенном в фокальной плоско- плоскости объектива Л2), равна / = 2/0 л V I 5, S2 к2 1 '
450 ГЛ. 7. ИНТЕРФЕРЕНЦИЯ ВОЛН (см. формулу G.8)). Пусть одно из зеркал перемещается со скоростью v. Тогда разность хода А интерферирующих волн изменяется: А = 2vt. Тогда /(t) =2/0 (l + cosh-vt)) . Частота изменения тока фотоприемника I(t) равна 0 = 2 (ш/с) v, т. е. опти- оптической частоте излучения и; соответствует измеряемая частота О фототока. Если источник содержит несколько монохроматических компонент раз- различных частот иоп, то ток фотоприемника также будет содержать несколь- несколько соответствующих компонент Оп. Таким образом, с помощью подвижного зеркала в интерферометре Майкельсона спектр, расположенный в области оптических частот, содержащихся в источнике света, трансформируется в фотоприемнике в низкочастотный спектр (в область радиочастот). Напри- Например, при v = 4-1015 герц (и = 2тг^), что соответствует зеленой линии оптиче- оптического спектра и скорости перемещения зеркала v = 1 см/с, частота фототока / с± 2,4 • 10 герц. Изучая спектральный состав фототока, можно судить о спектре излучения источника. Описанный метод исследования оптических спектров называется фурье- спектрометрией, поскольку на последней стадии измерений определяется спектр (преобразование Фурье) фототока. Вопросы и задачи 1. Проанализируйте работу интерференционных схем, показанных на рис. 7.13. Какие параметры схем определяют ширину интереференционной полосы и апертуру интерфе- интерференции? Чем определяется минимальный порядок интерференции в схеме Ллойда и в интерфе- интерферометре Майкельсона? 2. В какой из схем на рис. 7.13 возникают наиболее сильные ограничения на степень монохроматичности и на размеры источника. 3. Радиоизлучение космического источника длины волны Л, имеющего угловой раз- размер ф, принимается антенной, расположенной на отвесном берегу на высоте h над уров- уровнем моря. Как будет меняться интенсивность принимаемого сигнала в зависимости от угла возвышения источника над горизонтом а. При каких значениях ф интенсивность не зависит от Л? Поверхность воды можно рассматривать как плоское зеркало, считать углы а и ф ма- малыми. 4. Три плоские монохромотические волны с амплитудами 1, а и о (а < 1) падают на плоскость z = 0 под углами 0, а и —а так, что колебания в точке х = 0 оказываются синфазными. При смещении плоскости наблюдения в область z > 0 происходят периоди- периодические изменения контраста интерференционной картины. Объясните явление. Найдите положение плоскости наблюдения, в которых контраст картины максимален и минимален. Чему он равен? 5. Излучающая система состоит из ряда равноотстоящих параллельных вибраторов с линейно меняющейся вдоль ряда разностью фаз излучения. Как должен меняться со временем сдвиг фаз между двумя соседними вибраторами, чтобы главный лепесток диа- диаграммы направленности всей системы (т. е. главный дифракционный максимум) совершал круговой обзор местности с постоянной угловой скоростью О, (при отсутствии вращения самой решетки вибраторов).
ВОПРОСЫ И ЗАДАЧИ 451 6. С помощью зрительной трубы, установленной на бесконечность, наблюдают поло- полосы равного наклона в тонкой плоскопараллельной пластинке толщиной h = 0,2 мм с показателем преломления п = 1,41. При этом угол наблюдения в мо- может изменяться от 0 до 90° (рис. 7.24). Найти максимальный и ми- минимальный порядок интерференционных полос. Оценить допустимую степень монохромотичности АЛ, при которой будут четко наблюдаться все интерференционные полосы. Каков допустимый размер источника в этом эксперименте для Л = 500 нм? 7. Каково минимальное угловое разрешение радиоинтерферометра, установленного на Земле, при работе на длине волны Л = 10 м? Рис. 7.24
ГЛАВА 8 ДИФРАКЦИЯ Дифракцией называют совокупность волновых явлений, в которых про- проявляются отклонения от законов геометрической оптики. Пусть, например, непрозрачный экран с круглым отверстием освещается параллельным пуч- пучком света. В плоскости наблюдения Л, расположенной недалеко от экрана, можно наблюдать картину, показанную на рис. 8.1 а: равномерно освещен- освещенное круглое пятно с резкой границей света и тени, в точности повторяющее размеры и форму отверстия, т. е. изображение по- получается геометрическим проецированием отверс- отверстия на плоскость наблюдения. Однако стоит отнести плоскость наблюдения подальше (рис. 8.1 б), и на- наблюдаемая картина существенно изменяется: грани- граница света и тени становится размытой, а внутри пятна возникают чередующиеся светлые и темные кольца. Наконец, если плоскость наблюдения отнести еще дальше и (или) уменьшить размеры отверстия, через которое прошел свет, то размер освещенного пятна в плоскости П становится существенно больше размеров отверстия — мы видим явное нарушение геометрического закона прямолинейного распространения света. Итак, нам нужен рецепт, который позволил бы описывать законы распространения волн, отличные от законов геометрической оптики. В этой главе мы будем рассматривать строго монохроматические волны с заданной частотой ш. Как и при изучении интерференционных явлений, будем описывать волновой процесс скалярной функцией Е(т, t) = а(т) cos (out - <p(r)) , (8.1) в которой а (г) и ^р (г) — функции координат, определяющие пространствен- пространственную структуру волны. Напомним, что монохроматической волне можно по- поставить в соответствие комплексную амплитуду /(г) = a(r)ei(p^r\ которая (при заданной частоте) содержит всю необходимую информацию о волне. Эту функцию координат мы будем называть далее волновым полем (или просто полем). Постановка простейшей дифракционной задачи такова. Пусть непрозрач- непрозрачный экран (маска) с отверстием, расположенный в плоскости z = 0, осве- освещается волной, созданной источниками, расположенными слева от экрана. Требуется определить, каково волновое поле справа от экрана, в области z > 0 (рис. 8.2), в частности, в плоскости наблюдения Л, расположенной на расстоянии z от экрана. Для решения этой задачи необходимо найти ответ на два основных во- вопроса. Первый вопрос — определение граничных условий — ставится сле- следующим образом: известно поле /5(ж, у), созданное в плоскости z = 0 (в
8.1. ГРАНИЧНЫЕ УСЛОВИЯ КИРХГОФА 453 отсутствие маски) какими-либо «сторонними» источниками, расположен- расположенными в области z < 0. Это может быть поле плоской волны, нормально либо косо падающей на плоскость z = 0, или поле точечного источника — сферическая волна. Совершенно не важно, с помощью каких «сторонних» источников и каким образом это поле создано — мы его считаем заданным. Затем в плоскости z = 0 помещается непрозрачный экран с отверстием. Требуется ответить на вопрос, какое поле /о(ж, у) возникает в плоскости, непосред- непосредственно примыкающей к экрану справа от него (эту плоскость далее будем называть плоскостью z = 0+). Это и есть то граничное условие, которое необходимо знать для решения дифракционной задачи. Второй вопрос: каким образом, зная граничное поле р R 9 /о(ж? у)-) определить искомое поле /(ж, у, z) в области ис' z > 0 (т. е. в пространстве справа от экрана)? В част- частности, каково поле в фиксированной плоскости наблюдения z = const > 0? Основными параметрами, существенно определяющими характер дифрак- дифракционных явлений, являются: длина волны А, размер отверстия 6, расстояние до плоскости (или до точки) наблюдения z. Как показывает дальнейший анализ (главы 8.3-8.7), тот или иной характер дифракционных явлений су- существенно зависит от значения волнового параметра X Ы % w ш "Mi Ш is Л" ,' 1 1 1 1 у i i i р = Область значений волнового параметра р< 1 называется областью геоме- геометрической оптики. Область значений р 3> 1 — областью дифракции Фраун- гофера (или дальней волновой зоной). Промежуточная область р ~ 1 — областью дифракции Френеля (или ближней волновой зоной). 8.1. Граничные условия Кирхгофа Определение граничных условий представляет собой исключительно труд- трудную проблему. Действительно, пусть речь идет об электромагнитной волне, падающей на проводящий экран с отверстием. Переменное электрическое поле волны порождает на проводящем экране переменные токи, которые в свою очередь индуцируют «вторичную» электромагнитную волну. Эта вол- волна зависит как от физических свойств экрана, так и от геометрии отверстия. Суммарное волновое поле в плоскости z = 0 представляет собой суперпо- суперпозицию первичной волны (поля сторонних источников) и вторичной волны, индуцированной токами проводимости, причем электрическое и магнитное поля суммарной волны должны удовлетворять известным в электродина- электродинамике граничным условиям. Имеется лишь небольшое число задач, для ко- которых найдено точное решение (например, задача дифракции на идеально проводящем по л у бесконечном экране, или задача дифракции на идеально проводящем шаре). Мы, следуя Кирхгофу, определим приближенные граничные условия сле- следующим образом: в той части плоскости z = 0+, которая затенена непро- непрозрачным экраном, граничное поле полагается равным нулю. На открытой части волнового фронта (т. е. в области отверстия) граничное полое полага- полагается равным полю сторонних источников. Другими словами, в этой области установка экрана с отверстием совершенно не влияет на падающую волну.
454 ГЛ. 8. ДИФРАКЦИЯ Итак, граничное поле определяется следующим равенством: Г fs(x, у) в точках, принадлежащих отверстию, /о(ж, у) = < (8.2) [ 0 в точках, затененных маской. Еще раз подчеркнем, что граничные условия (8.2) являются приближен- приближенными: наличие экрана в действительности приводит к тому, что поле на отверстии отлично от падающего поля /Дж, у), и особенно сильно оно иска- искажено вблизи краев отверстия; да и в затененной области поле отлично от нуля вблизи краев. Однако, как показывает сравнение теоретических вы- выводов, основанных на приближенных граничных условиях Кирхгофа, с экс- экспериментом, согласие оказывается удовлетворительным при условии, что, во-первых, линейные размеры отверстия b велики по сравнению с длиной волны: Ъ> А и, во-вторых, плоскость наблюдения находится на расстоянии, много боль- большем длины волны z ^> А. Отличие точных решений электродинамической за- задачи от приближения Киргофа, которое задается именно граничными усло- условиями (8.2), определяется поправками порядка А/6, X/z. Равенству (8.2) можно придать другую форму, если ввести функцию про- пропускания непрозрачного экрана с отверстием га (ж, у) согласно формуле 1, если точка (ж, у) принадлежит отверстию S, га(ж, у) = л О, если точка (ж, у) лежит вне отверстия S. Тогда можно записать /о(ж, у) = fs(x, у)т(х, у). (8.3) Равенство (8.3) можно обобщить на случай произвольного тонкого экра- экрана. Представим себе достаточно тонкую пластинку-транспарант, пропуска- емость которой меняется от точки к точке по закону а(ж, у), а показатель преломления (или толщина) по закону п(ж, у) (или А (ж, у)). Пусть такая пластинка освещается плоской нормально падающей волной. Что происходит с волной на выходе из пластинки в плоскости z = 0+? Пе- Переменная поглощательная способность транспаранта приводит к тому, что амплитуда колебаний на выходе будет не константой, а некоторой функцией координат а(ж, у). Переменный показатель преломления п или толщина А приводят к различному в разных точках набегу фазы <р(ж, у) = /спА, так что фронт прошедшей волны будет не плоским: распределение фаз колебаний на выходе будет описываться функцией <р(ж, у). Если ввести комплексную пропускаемость транспаранта согласно формуле т(х, у) = а(х, у то комплексная амплитуда волны на выходе из пластинки может быть най- найдена по той же формуле (8.3), которая и определяет граничное поле /о(ж, у) для произвольного тонкого экрана. Принципиально важным оказывается то обстоятельство, что влияние маски затрагивает лишь пространственные характеристики волнового поля, не меняя его частоту (а в случае немоно- немонохроматических волн — частотный спектр). Это общее свойство линейных и стационарных оптических систем.
8.2. СПЕКТРАЛЬНЫЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ДИФРАКЦИИ 455 8.2. Спектральный метод решения задачи дифракции Перейдем к решению второй проблемы: как, зная граничное поле (8.2), найти волновое поле в области z > 0. Математически проблема сводится к решению волнового уравнения, удовлетворяющего заданному граничному условию. Рассмотрим вначале спектральный подход к решению проблемы, основан- основанный на представлении дифрагированной волны в виде суперпозиции плоских волн разных направлений. Напомним, что комплексная амплитуда плоской волны, волновой вектор к которой составляет угол а с осью z, имеет вид -Р ( т 7\ г (кх sin a-\-kz cos а-\-ср) где а — амплитуда волны, к sin a = кх и к cos a = kz — проекции вектора к на оси х ж z соответственно (рис. 8.3), мы рассматриваем для простоты случай ку = 0, if — начальная фаза, т. е. фаза колебания в точке х = 0, z = 0. Обра- Обратим внимание на чрезвычайно простое правило, по которому можно найти волновое поле плоской волны в любой плоскости z > 0. Действительно, в плоскости z = 0 имеем поэтому т. е. комплексные амплитуды /(ж, 0) и /(ж, z) отлича- \ \Овершости ются множителем eikzcosa, определяющим набег фазы плоской волны при распространении между двумя плос- Рис. 8.3 костями, разделенными промежутком z (набег фазы, равный kz = kzcosa). Запишем, наконец, поле плоской волны в плоскости 2; = 0в виде /(ж, 0) = Feiux, (8.4) где множитель F = аег(р определяет как амплитуду а, так и начальную фазу if волны, а через и обозначена ж-компонента вектора к: к sin a = кх = и (при этом ^-компонента вектора к есть к cos a = л/А;2 — и2). Обратим внимание на аналогию (8.4) с выражением /(?) =Felujt, которое, как мы знаем, есть не что иное, как комплексная форма записи гармони- гармонического колебания частоты о;, причем комплексный множитель F = аег(р определяет амплитуду колебания, и его начальную фазу. На основании этой аналогии величина и = к sin а может быть названа пространственной ча- частотой. Можно сказать, что волны разных направлений а — это волны разных пространственных частот. Итак, представим граничное поле /о(х) в виде fQ(x) = ? Fnj«»x. (8.5) Математически выражение (8.5) полностью аналогично формуле A.39) — представлению колебательного процесса в виде суперпозиции гармониче- гармонических колебаний разных частот шп] гармоническому колебанию частоты шп в разложении A.39) соответствует плоская волна определенного направления ап (sman = un/k) в разложении (8.5). Подчеркнем, что частота волны ио задана, и маска ее не меняет, следова- следовательно, модуль |k| = lo/с всех гармоник в пространственном фурье-разло- жении (8.5) одинаков.
456 ГЛ. 8. ДИФРАКЦИЯ Все, что было сказано ранее по поводу возможности представления функ- функции времени в виде суммы гармонических колебаний разных частот, можно повторить по отношению к (8.5): представлению волнового поля /о(х) (функ- (функции координат!) в виде суммы плоских волн разных направлений — ведь математику не очень заботит различие в физическом смысле переменных (времени t в A.39) или координаты х в (8.5)). В общем случае, как мы знаем, произвольный колебательный процесс представляется в виде интеграла Фурье — непрерывной суммы гармони- гармонических колебаний различных частот: /(?) = — / F(u)eiutdu. (8.6) 2тг J Точно так же произвольное граничное поле fo(x) представляется в виде интеграла fo(x) = ^ I F(u)e^ du, (8.7) т. е. в виде непрерывной суммы плоских волн различных пространственных частот. Мы говорили ранее о замечательном соотношении, связывающем длитель- длительность сигнала At с шириной его спектра Аи (соотношении неопределен- неопределенностей A.45)): AtAco ~ 2тг. Из математической тождественности выраже- выражений (8.6) и (8.7) следует, что аналогичное соотношение неопределенностей должно связывать протяженность Ах граничного поля с шириной Аи его пространственного спектра Ах Аи « 2тг. (8.8) Пространственная протяженность граничного поля, согласно граничным условиям Кирхгофа (8.2), определяется характерным размером препятст- препятствия, в нашем примере — размером b отверстия в непрозрачном экране. По- Поэтому ширина спектра плоских волн (область значений пространственных частот Аи, в которой пространственный спектр F(u) заметно отличен от нуля) можно оценить так Аи « 2тг/6. Разброс пространственных частот определяет разброс направлений слагае- слагаемых плоских волн за препятствием: Аи = fcA(sina), откуда A(sina) « А/6 или, для малых углов, Аа « А/6. Это и есть дифракционная расходимость пучка света за отверстием раз- размера Ь. Важно подчеркнуть, что речь идет о линейной задаче: распространение волны от плоскости z=0+ до плоскости наблюдения z = const > 0 описыва- описывается линейным волновым уравнением D.5) или, поскольку мы пользуемся комплексным представлением, линейным уравнением Гельмгольца D.26). Основное свойство линейного уравнения: сумма решений является решени- решением, или, более подробно, если мы имеем два решения fi(x, z) и /2(ж, z), удовлетворяющих на границе z = 0+ условиям /i(:r, 0) = /ю(х) и /2(ж, 0) = /20 (х)
8.2. СПЕКТРАЛЬНЫЙ МЕТОД РЕШЕНИЯ ЗАДАЧИ ДИФРАКЦИИ 457 (fio(x) и /20(х) — заданные функции координаты ж), то линейная суперпо- суперпозиция решений /i(x, z) и /2(ж, z) /(ж, z) = cifi(x, z) + с2/2(ж, 2;) есть решение уравнения Гельмгольца, удовлетворяющее граничному ус- условию: /о (ж) = cifio(x) + с2/2о(я). Вспомним теперь, что плоская волна есть решение уравнения Гельмгольца, удовлетворяющее на плоскости z = 0 граничному условию поэтому сумма плоских волн есть решение, удовлетворяющее граничному условию (8.5). Это и есть решение дифракционной задачи. Мы нашли волновое поле в лю- любой плоскости наблюдения, отстоящей от препятствия (непрозрачного экра- экрана с отверстием) на расстояние z. В более общем случае, если граничное поле fo(x) представляется непрерывной суперпозицией плоских волн (8.7), искомое решение имеет вид F0(u)e^ux+v/k2~u2z"> cb, (8.10) где Fq(u) — преобразование Фурье граничного поля /о (х) (т. е. спектр плос- плоских волн граничного поля). В выражениях (8.9) или (8.10) существенным является следующее обсто- обстоятельство: каждая слагаемая плоская волна при распространении до плос- плоскости наблюдения z = const > 0 приобретает свой фазовый набег срп = = y/k2 — u^z, зависящий от ее пространственной частоты ип. Поэтому фа- фазовые соотношения между слагаемыми плоскими волнами на границе z = 0 и в плоскости наблюдения, отстоящей на расстоянии z, различны. Измене- Изменение фазовых соотношений между слагаемыми плоскими волнами приводит к тому, что изменяется результат интерференции этих плоских волн. Поэтому результирующее поле /(ж, z) в плоскости наблюдения может кардинально отличаться от граничного поля /о (х) (хотя и то, и другое составлено из су- суперпозиции тех же бегущих плоских волн). Переписав выражение (8.10) в виде f(x, z)= I F0(u)eiVk2-u2zeiuxdu = I F{u, z)eiux du, мы видим, что функция F{u, z) = F0(u)eiVk2-u'2z представляет собой не что иное, как преобразование Фурье (пространствен- (пространственный спектр) монохроматического волнового поля /(ж, z) в плоскости наблю- наблюдения (это поле рассматривается как функция координаты х в плоскости наблюдения при фиксированном z).
458 ГЛ. 8. ДИФРАКЦИЯ 0 -b/2 /oto X b/2 F(u) 8.3. Область геометрической оптики Из многих опытов мы знаем, что в некоторых случаях (когда плоскость наблюдения отстоит недалеко от препятствия или когда размеры препят- препятствия достаточно велики) дифракционная картина оказывается подобной картине поля на границе — ситуация, показанная на рис. 8.1 а. Итак, выяс- выясним условия, когда выводы, основанные на представлениях геометрической оп- оптики, справедливы. Пусть щель в непрозрачном экране ширины 6, освещается плоской нормаль- нормально падающей волной с амплитудой а. Тогда граничное поле /о (х) имеет вид, показанный на рис. 8.4 а. Его простран- пространственный спектр F(u) (фурье-преобра- Рис. 8.4 зование функции fo(x)) показан на рис. 8.4 б, он имеет точно такой же вид, как спектр прямоугольного импульса, который мы изучали в гл. 1.4. Функция F(u) заметно отлична от нуля в пределах главного максимума, в области \и\ < 2тт/Ь. Поскольку мы полагаем, что b > А, то \и\ < к = 2тг/А. Итак, интервал пространственных частот плоских волн имеющих заметную амплитуду, ограничен величиной \Аи\ < 2тг/Ь. Эта оценка справедлива по порядку величины и в общем случае, как следует из соотношения неопре- неопределенностей. Для плоской волны, бегущей вдоль оси z (и = 0), набег фазы при рас- распространении до плоскости наблюдения равен kz. Для волны с простран- пространственной частотой и он равен <р(и) = л/А;2 — u2z, или приближенно <р(и) ~ ж kz— (z/2k) и2 (мы разложили радикал л/А;2 — и2 в ряд по степеням малого параметра (и/к)\ ограничившись двумя членами разложения). Пространственные частоты плоских волн, бегущих от щели (интерес пред- представляют лишь волны, амплитуды которых имеют заметную величину) не превышают величины \и\ < 2тг/6, поэтому разность фазовых набегов не пре- превышает величины А<р < (z/2k) Bтг/6J = 7r\z/b2. (8.11) Если эта разность много меньше величины тг, то можно считать, что все плоские волны из интересующего нас интервала \и\ < 2тг/Ь приобретают один и тот же фазовый набег, равный kz. Следовательно, фазовые соотно- соотношения между плоскими волнами, образующими граничное поле /о(ж), и теми же плоскими волнами в плоскости наблюдения z = const > 0 практически одинаковы. Значит, интерференция этих плоских волн дает в плоскости на- наблюдения суммарное поле, которое (с точностью до фазового множителя elkz) тождественно повторяет граничное поле fo(x): f(x, z) = e*kzf0(x). При этом картина интенсивности /(ж, z) тождественно повторяет картину на границе /(ж, z) = /о(ж) = |/о(ж)|2. Как следует из (8.11), условие Аср <^ тг выполнено, если р2 = \z/b2 < 1. (8.12)
8.4. ПРИНЦИП ГЮЙГЕНСА-ФРЕНЕЛЯ 459 Это и есть условие геометрической оптики. При любых фиксированных z и 6 это условие выполняется, если А —>• 0, а при любом фиксированном А законы геометрической оптики работают, как следует из неравенства (8.12), при достаточно малых z и (или) при достаточно больших Ь. 8.4. Принцип Гюйгенса—Френеля Принцип Гюйгенса-Френеля является рецептом для расчета дифракцион- дифракционных задач, отличным от изложенного выше спектрального подхода. Пусть волна света, созданная источниками, расположенными в области z < 0, достигла плоскости z = 0 (каких-либо препятствий на пути света пока еще нет), см. рис. 8.5 а. Световое поле в этой плоскости нам известно. , P(x,y,z) Рис. 8.5 Пусть его комплексная амплитуда есть /о(ж, у) = ао(ж, у)ег(р°(х>у\ где функ- функции ао(ж, у) и (ро(х, у) описывают распределение амплитуд и фаз колебаний в плоскости z = 0. Что происходит с волной далее, по мере ее распростра- распространения в области z > 0, как изменяется структура волны — распределение амплитуд и фаз колебаний, что собой представляет световое колебание в некоторой точке наблюдения Р? Согласно принципу Гюйгенса, каждую точку (ж, у) плоскости z=0, куда пришла волна, каждую малую площадку d*S, можно рассматривать как ис- источник вторичной волны. То есть можно представить себе, что волна воз- возбуждает колебания некоторого фиктивного источника, который и переиз- переизлучает вторичную волну. Френель дополнил принцип Гюйгенса, предложив расматривать световое колебание в любой точке наблюдения Р в области z > 0 как результат интерференции этих вторичных волн. Какие свойства приписывает принцип Гюйгенса-Френеля фиктивным ис- источникам и вторичным волнам, которые переизлучаются ими? Поясним принцип Гюйгенса-Френеля, вернувшись к рассмотренной ра- ранее задаче — дифракции на непрозрачном экране с отверстием (рис. 8.5 б). Маленькая площадка d*S, расположенная в точке (ж, у) на открытой части волнового фронта (т. е. в области отверстия), рассматривается как источник сферической волны где R — расстояние от источника до точки наблюдения Р, т. е. для вычи- вычисления вклада, который дает эта площадка в суммарное колебание, нужно учесть ослабление амплитуды (множитель 1/R) и набег фазы (множитель eikR^ как в сферической волне. При этом предполагается, что амплитуда
460 ГЛ. 8. ДИФРАКЦИЯ излучения а (ж, у) площадки dS и ее начальная фаза (р(х, у) задаются ам- амплитудой ао(ж, у) и фазой (fo(x, у) колебания, созданного в точке (ж, у) освещающей волной. Напомним, что согласно принятым граничным услови- условиям (8.2) на открытой части волнового фронта, т. е. в области отверстия, вол- волна не искажается препятствием, причем работают лишь вторичные источни- источники, находящиеся на открытой части, незатененной непрозрачным экраном. Разумеется, амплитуда а (ж, у) пропорциональна также размеру переиз- переизлучающей площадки d*S, т. е. числу вторичных когерентно переизлучаю- переизлучающих фиктивных источников внутри площадки. Наконец, предполагается, что амплитуда колебания в точке наблюдения пропорциональна видимой из этой точки величине площадки d*S, т. е. пропорциональна d*Scosa (рис. 8.5). Итак, а(ж, у) ~ ао(ж, у) dScosa, a <р(ж, у) = (fo(x, у). Таким образом, вклад элемента dS можно записать в виде: (ао(ж, y)/R) e^R+M^y)) dScosa = /0(ж, у) (eikR/R^j cosa- dS. (8.13) Полное световое колебание есть результат интерференции всех вторич- вторичных волн, т. е. волн, посылаемых всеми площадками d*S, расположенными в области отверстия: f(P) = Kojfo(x, у) (elkR/R) cosadS, (8.14) s где К о — некоторый коэффициент пропорциональности, который еще под- подлежит определению, f(P) — комплексная амплитуда в точке наблюдения Р. Формула (8.14) представляет собой количественную формулировку принци- принципа Гюйгенса-Френеля, которую можно использовать для решения конкрет- конкретных дифракционных задач. 8.5. Дифракция Френеля. Дифракционные задачи с осевой симметрией Круглое отверстие в непрозрачном экране. Применим принцип Гюй- Гюйгенса-Френеля для нахождения светового колебания в точке наблюдения Р, находящейся на оси круглого отверстия в непрозрачном экране. Отверстие освещается плоской нормально падающей волной амплитуды uq (рис. 8.6). Полагаем, что радиус отверстия г о много меньше расстояния z до точ- точки наблюдения, поэтому множитель наклона в (8.13) можно считать близ- близким к единице: cos а ~ 1. Кроме того, при том же условии Rq <^ z ам- амплитудный множитель 1/Д, учитывающий сферическую расходимость волн от вторичных источников, расположенных в области отверстия, можно счи- считать приближенно одинаковым для всех вторичных источников и равным 1/R с± 1/z. Тогда из (8.14), находим = K0— [ elkRdS. (8.15) Разумеется, расстояние R в фазовом множителе elkR необходимо вычи- вычислить аккуратнее: ведь ошибка в определении R на величину А/2 приводит к ошибке в фазе колебания в точке наблюдения на величину тг, что недопусти- недопустимо (ошибки в фазах слагаемых колебаний должны быть малы в сравнении
8.5. ДИФРАКЦИЯ ФРЕНЕЛЯ 461 с тг). Расстояние R от некоторого вторичного источника d*S, находящегося на расстоянии р от центра отверстия до точки Р, оценим так (рис. 8.6): R = (г2 + ^ Тогда из (8.15) получим Г Рассмотрим все элементарные площадки, т. е. все вторичные источники, находящиеся на фиксированном расстоянии р от центра отверстия в преде- пределах тоненького колечка радиуса р малой толщины dp (см. рис. 8.6). Площадь dS такого колечка dS = 2npdp. Интеграл в послед- последнем выражении принимает вид .18) _ (S) Рис. 8.6 где введено обозначение р2 = ? (d? = 2pdp). Нахождение суммарного колебания в точке наблю- дения сводится к суммированию вкладов элементар- элементарных колечек. Разбив все отверстие на такие элементарные колечки одина- одинаковой площади AS = 2тгрАр, мы приходим к задаче сложения колебаний одинаковой амплитуды Д?, фазы которых растут пропорционально номеру кольца: срп = nk/Bz) A?. Сдвиг по фазе обусловлен тем, что каждое по- последующее колечко (большего радиуса) отстоит от точки наблюдения на большее расстояние и сдвиг по фазе связан с разностью расстояний AR: Аср = kAR. Суммарное колебание ^ /\^ешк/B^А^ в пределе, при А? —>> О п дает значение интеграла. Построим векторную диаграмму, которая и позво- позволит нам вычислить интеграл (8.18). Итак, колебание, созданное элементом d*S, находящимся в центре отвер- отверстия (? = 0) изобразим вектором, длина которого равна амплитуде колеба- колебания А?, а его направление горизонтально (фаза колебания ср = k/Bz)? = 0). Вклад n-го колечка, (?п = пА?) есть A^emk^2z^A^; он изображается векто- вектором той же длины А? с углом наклона срп = nk/Bz)A^. Мы получаем цепочку векторов, в которой каждый последующий вектор повернут относительно предыдущего на один и тот же угол Аср = k/Bz)At; (рис. 8.7). Последний из изображенных на рис. 8.7 векторов SN повернут относительно первого вектора Si на угол тг, т. е. последнему колечку соот- соответствует фаза колебания, равная тг. Получаем k/Bz) ?N = тг, ?N= 2nz/k = Xz. (8.19) Соответствующий радиус кольца есть: Pi = л/С7 = ^- (8.20) Он называется радиусом первой зоны Френеля (т. е. первая зона Френе- Френеля — круг радиуса р\). Разность фаз колебаний SN и S, равная тг, означает,
462 ГЛ. 8. ДИФРАКЦИЯ Рис. 8.7 что расстояние R\ от края первой зоны Френеля до точки наблюдения Р больше, чем расстояние от центра отверстия до точки Р на А/2: R\ = z-\-X/2. Суммарный вклад первой зоны Френеля изображается век- вектором Ai — суммой всей цепочки векторов на рис. 8.7. Продолжая далее такое разбиение на тонкие колечки, мы получим векторную диаграмму, показанную на рис. 8.8. По- Последний вектор в этой цепочке векторов антиколлинеарен первому, т. е. последний вектор изображает вклад колечка, которое отстоит от точки наблюдения на расстояние i?2, ко- которое больше расстояния R\ на А/2: i?2 = R\ + А/2 или i?2 = z-\- А. Ясно, что колебание, созданное последним колеч- колечком, сдвинуто по фазе на 2тг, т. е. синфазно с колебанием, созданным малой площадкой, расположенной в центре от- отверстия (вектор Si на рис. 8.7). Разности расстояний А соот- соответствует разность фаз 2тг, т. е. k/Bz)? = 2тг, откуда ? = 2А;?, а радиус последнего колечка (которому отвечает последний вектор на диаграмме рис. 8.8) равен р2 = V^Xz. Кольцевая зона на отверстии между р\ и р2 называется второй зоной Френеля, р2 — это внешний радиус второй зоны Френеля. Суммарный вклад второй зоны изображается век- вектором А2, который антиколлинеарен вектору Ai на рис. 8.7, т. е. колебание, созданное в точке наблюдения второй зоной Френеля, противофазно колебанию от первой зоны. Если бы вклады всех элементарных колечек имели равную амплиту- А? были бы Рис. 8.8 и Рис. 8.9 ду, то суммарные амплитуды колебаний одинаковы и колебания первой и второй зон погасили бы друг друга полностью: Ai + A2 = 0. В действительности с ростом радиуса колечка амплитуда его вклада постепенно уменьшается: роль игра- играет как постепенное, очень медленное уменьшение множителя наклона cos a, так и уменьшение амплитуды с ростом расстояния ~ 1/R. Итак, каждый элементарный вектор в цепочке векторов на рис. 8.8 чуть меньше каждого вектора в цепочке на рис. 8.7. Поэтому и суммарный вектор А2 чуть меньше вектора Ai. Векторная диаграмма, изображающая вклад двух зон Френеля показана на рис. 8.9. Суммарный вклад двух зон хотя и чрезвычайно мал, но все же отличен от нуля. Итак, интенсивность света в точке Р близка к нулю, если отверстие содержит две зоны Френеля: г о = v2Xz. Пусть радиус отверстия постепенно увеличивается и, нако- наконец, становится равным рз = V3Xz. Читатель легко проверит, что край отверстия отстоит при этом от точки Р на расстоя- расстояние i?3 = z + ЗА/2, а колебание, созданное тонким колечком, примыкающим к краю, сдвинуто по фазе на величину Зтг по отношению к колебанию от центрального элемента отверстия (т. е. эти колебания противофазны). рз — это внешний радиус третьей зоны Френеля (кольцевой зоны между р2 и р%). Очевидно, суммар- суммарный вклад третьей зоны Аз лишь чуть меньше по амплитуде вклада второй зоны. Векторная диаграмма, изображающая вклад трех зон Френеля — на рис. 8.10. Амплитуда суммарного колебания лишь немного меньше ампли- амплитуды Ai колебания, созданного отверстием в одну зону Френеля. р
8.5. ДИФРАКЦИЯ ФРЕНЕЛЯ 463 При дальнейшем увеличении радиуса отверстия «открываются» все но- новые и новые зоны Френеля: начинают «работать» все новые и новые витки очень медленно скручивающейся спирали, которая показана на рис. 8.11 и называется спиралью Френеля. Радиус т-й зоны Френеля равен рт = VmXz. (8.21) Ясно, что если отверстие содержит четное число зон Френеля, то интен- интенсивность света в точке наблюдения близка к нулю, а если нечетное, то ин- интенсивность почти такая же, как и при отверстии в одну зону Френеля. Конечно, с ростом радиуса отверстия «скручивание» спирали проявляет- проявляется все сильнее и сильнее, множитель наклона cos а уменьшается с ростом а, сказывается также увеличение расстояния между вторичными источни- источниками, лежащими вблизи края отверстия и точкой Р — все это приводит к уменьшению амплитуд колебаний от этих источников в точке наблюдения. Понятно, что если работают все зоны Френеля (т. е. непрозрачный экран отсутствует), то все витки спирали на рис. 8.11 дают свой вклад, а вектор Ао, проведенный из начала спирали в ее фокус есть ни что иное, как ампли- амплитуда колебаний в точке Р при отсутствии какого-либо препятствия на пути волны. Обратите внимание на удивительное обстоятельство: амплитуда ко- колебаний в точке наблюдения при отсутствии препятствия на пути волны Aq вдвое меньше, чем амплитуда А\ колебания, созданного отверстием в одну зону Френеля: А ~ Ai/2, а интенсивность вчетверо меньше: Io/Ii — 1/4. Построенная нами векторная диаграмма позволяет попутно определить константу Ко в формуле (8.14). Длину цепочки векторов, образующих дугу полуокружности на рис. 8.7, можно найти с помощью (8.18). Действительно, каждый элементарный вектор в цепочке имеет длину Д?, а длина всей це- цепочки ?N = NAt;. Согласно (8.19), она равна: ?N = 2nz/k = Xz. Радиус этой полуокружности представляет собой не что иное, как значение интеграла (8.18) при го —>> оо (что соответствует ситуации, когда пре- препятствие на пути волны отсутствует). Мы получаем / О Мнимая единица учитывает, что суммарный вектор на рис. 8.11 повернут на тг/2 (г = ег7Г/2) относительно первого вектора, фазу которого мы приняли за нуль. Подставляя полученное зна- значение в правую часть (8.17), а также учитывая, что при отсутствии препят- препятствия f(P) = A§elkz, находим A$elkz = K^{A^elkz/z) \zi, откуда получаем Ко = 1/(*А). Количественная формулировка принципа Гюйгенса-Френеля (8.14) при- принимает вид: HP) = J^J Mx, y)—cosadS. (8.22) s Зонная пластинка Френеля. Поставим на пути плоской, нормально па- падающей волны прозрачную пластинку и фиксируем положение точки на- наблюдения Р на расстоянии z за пластинкой (рис. 8.12). Разобьем пластинку
464 ГЛ. 8. ДИФРАКЦИЯ на кольцевые зоны Френеля согласно формуле (8.21). Далее, все нечетные зоны Френеля (первую, третью, пятую и т. д.) оставим прозрачными, а все четные зоны (вторую, четвертую, шестую и т. д.) зачерним, сделав их не- непрозрачными для света. Такая пластинка (с чередующимися прозрачными и непрозрачными зонами Френеля) называется зонной пла- пластинкой Френеля. В векторной диаграмме на рис. 8.11 остаются «работаю- «работающими» только полувитки, отвечающие нечетным зонам; по- полувитки четных зон «выбывают из игры», поскольку запол- заполняющие их вторичные источники оказались затененными. Оставим на векторной диаграмме лишь работающие полу- р ~ ^ витки нечетных зон, пристроив их последовательно друг к другу (без изменения ориентации всех элементарных векто- векторов, рис. 8.13). Мы видим, что вклады всех оставшихся нечетных зон Ai, A3, А5, ... изображаются коллинеарными векторами, т. е. колебания, со- созданные в точке наблюдения всеми нечетными зонами, оказываются син- синфазными. Амплитуда результирующего колебания А равна при этом сумме амплитуд слагаемых колебаний: А = А1+А3+А5+..., а интен- А?* * сивность I = А2 = (А\ + А^ + А$ + ... J. Мы видим, что зонная ,^ пластинка Френеля обладает фокусирующими свойствами, су- щественно увеличивая интенсивность света в точке Р, которая является точкой фокусировки зонной пластинки. Заметим, что размеры пластинки (ее радиус Rq) обычно существенно мень- меньше, чем расстояние z до точки фокусировки, поэтому вклады всех зон Френеля примерно равны по амплитуде и равны А\. Найдем выигрыш от фокусировки — отношение интенсивности света / в фокусе зонной пластины к интенсивности света /о, падающего на пластинку (при отсутствии пластинки такая же Рис 8 13 интенсивность Iq была бы и в точке Р). Итак, число зон Френе- Френеля, укладывающихся на пластинке радиуса Rq найдем из усло- условия: Rq = \fm\z, откуда т = R^/(\z) (из них половина зон — нечетные). Каждая нечетная зона дает вклад, равный примерно А\, поэтому суммар- суммарная амплитуда колебаний в точке Р равна А = Aim/2 = AiRq/B\z) = = 2AqR%/B\z) = AqR%/(\z). Мы находим /До = (А/А0J = Ril{\zf. Это и есть выигрыш от фокусировки. Например, при Rq = 1 см, z = 10 см и А = 5 • 10~5 см (зеленый цвет) получаем I/Iq ~ 4 • 106! Подумайте, каким образом можно еще увеличить выигрыш от фокуси- фокусировки, использовав вклады четных зон Френеля? Какова максимально воз- возможная интенсивность в точке наблюдения, если размер отверстия в непро- непрозрачном экране равен радиусу первой зоны Френеля (отверстие освещается плоской волной интенсивности Iq)? Пятно Пуассона. Пусть на пути плоской волны расположен непрозрач- непрозрачный круглый диск (либо круглый шарик). Какова интенсивность света в точке Р, расположенной за диском на оси, проходящей через его центр (рис. 8.14)? Если расстояние z столь мало, что выполняются условия гео- геометрической оптики (л/Xz/Rq <С 1, Rq — радиус диска), то в плоскости
8.6. ДИФРАКЦИЯ ФРЕНЕЛЯ НА ОДНОМЕРНЫХ СТРУКТУРАХ 465 Рис. 8.14 наблюдения мы получим резкую границу света и тени, точка Р находится как раз посередине круговой области тени и интенсивность равна нулю. Бу- Будем постепенно удалять точку наблюдения от диска. Число зон Френеля, перекрываемых диском, будет постепенно умень- уменьшаться. К чему это приводит? Прежде, чем ответить на этот вопрос, напом- * ним, что при отсутствии препятствия на пути —— i волны колебание в точке наблюдения изобра- ! жается вектором Aq (т. е. амплитуда колебаний *~Л определяется длиной вектора Ао), проведенным ! из начала спирали в ее фокус (рис. 8.11). По- ! нятно, что это колебание можно представить как сумму колебаний, которые создаются сравните- сравнительно небольшим количеством нескольких первых зон Френеля (вектор Ai на рис. 8.15 изображает вклад трех целых зон плюс примерно треть четвер- четвертой зоны — три и одна треть полувитков спирали Френеля) и колебания, созданного всеми остальными зонами — их вклад изображается вектором А на рис. 8.15. Действительно, мы видим, что сумма векторов Ai и А дает нам вектор Aq. Если теперь на пути волны установить непрозрачный диск, перекрывающий вклад нескольких первых зон Френеля (на- (например, тех самых трех и одной трети зон), то колебание в точке наблюдения создается теперь лишь оставшимися пе- периферийными зонами, вклад которых изображается векто- вектором А. Мы видим, что если число перекрытых диском зон не слишком велико, так что скручиванием спирали можно пренебречь, то длина вектора А, т. е. амплитуда колебаний ^ис- 8-15 в центре тени от диска практически такая же, какая была бы в точке Р при отсутствии диска. Из сказанного выше ясно, что совершенно неважно, каков конкретный радиус диска (или шарика). Вектор А на рис. 8.15 практически не изменился бы, если бы диск перекрыл не три с небольшим зоны Френеля, а, скажем, семь с небольшим зон или тринадцать с небольшим зон. Важно лишь, чтобы не стало проявляться скручивание спирали, о котором мы говорили ранее. Яркое пятно, возникающее в центре геометрической тени от шарика (или диска), называется пятном Пуассона. Интересно, что Пуассон не верил в справедливость волновой теории света и привел изложенные нами выше соображения как доказательство ее абсурдности. Лишь после этого яркое пятно в центре тени от шарика наблюдал экспериментально Араго. 8.6. Дифракция Френеля на одномерных структурах Дифракция на щели. В качестве примера такого рода задач рассмотрим дифракцию плоской волны на непрозрачном экране, отверстие в котором имеет вид очень длинной щели с прямолинейными краями (рис. 8.16). Края щели параллельны оси г/. Верхний край совпадает с прямой ? = Ь]_, а нижний ? = &2 (ширина щели Ь = Ь\ — Ъ^). Нас интересует световое колебание в точке Р, расположенной на расстоянии z за щелью. Рассмотрим вначале колебание, созданное в точке наблюдения Р всеми вторичными источниками (элементарными площадками ASq = d?dr/), находящимися на оси г/. Пусть
466 ГЛ. 8. ДИФРАКЦИЯ амплитуда колебаний, созданных всеми этими площадками (узкой полоской толщины d?) в точке Р равна aod? (начальную фазу примем равной нулю). Каково колебание, созданное столь же узкой полоской, параллельной оси г/ и находящейся на расстоянии ? от оси г/ (см. рис. 8.16)? Сравним вклады двух элементарных площадок &S и dSo, одна из которых dSo находится на узкой полоске, совпадающий с осью г/, а вторая &S — на интересующей нас полоске на расстоянии ? от dSo- Сравним расстояния R и Rq от dS и S до точки Р: RQ = л/^2 + ^2 ^ z + rf/{2z)\ R = y/z2 + r/2 + i2 ~ z + W jBz) + i /{2z) (это приближение мы уже использовали ранее, см. (8.16)). Из последних равенств находим разность расстояний А = ^2 /2z и разность фаз колебаний в точке Р Понятно, что и суммарное колебание, создан- созданное в точке Р полоской площадкой d*S, отстает по фазе на величину Аср от колебания, создан- созданного полоской площадкой dSo, находящейся на оси г/. Итак, колебание от интересующей нас по- полоски вторичных источников в точке наблюде- наблюдения Р можно записать в виде A0d?eiktt2z)t2. (8.24) Рис. 8.16 Разбив всю щель на такие элементарные по- полоски, параллельные краям щели, и сложив колебания от всех элементар- элементарных полосок, заполняющих щель (от Ъ\ до 62), найдем ь2 f(P)=A0J< (8.25) Удобным и наглядным методом расчета светового поля f(P) является ме- метод векторных диаграмм. Разбив щель на узкие полоски Д?, параллельные краям щели, изобразим колебание (8.24), созданное n-ой полоской (?п = = пА?) в точке наблюдения Р, в виде вектора, длина которого равна AA? а угол наклона (относительно горизонтальной оси) срп = k/{2z)^l = k/Bz) x x(A?nnJ. В частности, вклад полоски вторичных источников, лежащих на оси г\ (? = 0), изображается горизонтальным вектором. Важно обратить внимание на различие формул (8.18) и (8.25). В первом случае речь идет о рассчете светового поля на оси круглого отверстия, где колебание представляется суммой вкладов ^ /\^elk^2z^n (?n = пА?) от вто- п ричных источников, заполняющих отдельные тонкие колечки. При этом изображающие векторы составляют цепочку, в которой каждый последу- последующий вектор повернут относительно предыдущего на один и тот же угол А(р = k/Bz)(n + 1)Д? - k/Bz)nA? = k/Bz)A?. Именно поэтому и полу- получается равномерно закручивающаяся спираль Френеля, где каждый виток является окружностью (если пренебречь множителем наклона).
8.6. ДИФРАКЦИЯ ФРЕНЕЛЯ НА ОДНОМЕРНЫХ СТРУКТУРАХ 467 Рис. 8.17 Во втором случае разность фаз колебаний от двух соседних полосок за- зависит от номера полоски п: Асрп = k/Bz)(^+1 — ?^) = k/Bz)A^2Bn + 1). Поэтому угол между двумя соседними векторами на диаграмме не сохра- сохраняется неизменным. При малых п этот угол мал и соседние элементарные вектора выстраиваются почти в прямую линию. Однако с ростом п этот угол начинает быстро нарастать — цепочка векторов быстро скручивается (рис. 8.17). Разумеется, ломаная цепочка векторов превращается в гладкую скручивающуюся кривую при Д? —)> О — при переходе от суммы к интегралу (8.25). Последний из изображенных на рис. 8.17 векторов ai антикол- линеарен первому вектору ао- Это означает, что вклад последней полоски противофазен вкладу первой полоски (находящейся на оси г/). Мы получаем k/{2z)^l = тг, откуда находим расстояние от края n-ой полоски до оси г/: ?п = ^2-Kzjk = \/Xz. Суммар- Суммарный вклад всей полосы (от оси г/ до n-ой полоски) изображается вектором Ai, проведенным из начала первого вектора ао в конец последне- последнего вектора ai. Будем продолжать наше построение, пристраивая на вектор- векторной диаграмме вклады последовательно расположенных полосок, все далее отстоящих от оси г/. Мы получим еще один полувиток, причем вектор а2 изображает вклад полоски, отстоящей от точки наблюдения на расстояние z + А (оно больше, чем расстояние от оси г/ до точки наблюдения, на длину волны А), поэтому вектора ао и &2 коллинеарны — разность фаз колебаний А(р = 2тг (рис. 8.18). Мы имеем k/Bz)^2 = 2тг, откуда ? = y/2Xz. Вектор А2 изображает суммарный вклад полосы, лежащей между дву- двумя прямыми ? = ?i = \[Xz и ? = ?2 = V2Xz. В данном случае вместо кольцевых зон Френеля мы имеем зоны в виде полос (их называют зонами Шустера). Продолжая дальше построение векторной диаграммы, мы при- придем к спирали Корню, изображенной на рис. 8.19. Спираль, очень быстро скручиваясь (благодаря квадратичной зависимости фа- фазы колебаний ср = k/Bz)^2 от координаты ?), все ближе прибли- приблиS ф К Рис. 8.18 р /() ) жается к точке Si, называемой фокусом спирали. Каждый последующий по- полувиток спирали изображает вклад в суммарное колебание последовательно расположенных зон Шустера, причем n-я зона Шустера — это полоса, внеш- внешний край которой отстоит от точки наблюдения на расстояние z + пХ/2 и на расстояние ?n = y/nXz от оси г/. Нижняя половина спирали Корню (от нуля до точки S2) описывает вклад вторичных источников (элементарных полосок ?п), расположенных ниже оси г/ (?п < 0). С ростом ширины щели (Ъ\ —>• 00,62 —>• — оо на рис. 8.16) работают все более мелкие витки спира- спирали Корню, которые все ближе прилегают к фокусам S\ и *§2. Вектор Ао, соединяющий фокусы спирали, определяет амплитуду колебаний в точке наблюдения при отсутствии препятствия. Очевидно, амплитуда колебаний в точке Р близка к максимальной, если открыты две зоны Шустера (т. е. «работает» один полувиток верхней поло- половины спирали и один полувиток нижней половины, рис. 8.20). Амплитуда колебаний (длина вектора А) при этом больше, чем амплитуда колебаний Aq при отсутствии препятствия. Соответствующая ширина щели равна при этом b = 2\[Xz. Если размер щели увеличить таким образом, что 6/2 = \/2Xz
468 ГЛ. 8. ДИФРАКЦИЯ (так, что на верхней и нижней полуспирали начинают «работать» полувитки вторых зон Шустера, рис. 8.21), то амплитуда колебаний в точке наблюде- наблюдения уменьшается: длина вектора А на рис. 8.21 меньше, чем Aq. Рис. 8.19 Рис. 8.20 Рис. 8.21 Рис. 8.22 Дифракция на краю экрана. С помощью спирали Корню можно качест- качественно исследовать картину дифракции плоской волны на полубесконечном экране (непрозрачный экран с прямолинейным краем пе- перегораживает нижнюю полуплоскость ? < 0, рис. 8.22). Согласно законам геометрической оптики, в плоскости наблюдения мы должны были бы иметь распределение интенсивности, показанное на рис. 8.22 пунктирной ли- нией: интенсивность равна нулю в области тени (х < 0) и равна Iq = const при х > 0. Реальная картина /(ж), полу- полученная с помощью спирали Корню, показана на рисунке. Упражнение. Найдите с помощью спирали, изобра- изображенной на рис. 8.19, какова интенсивность 1\ на границе света и тени, в точке 0, если при отсутствии препятствия она равна Iq. Исследуйте с помо- помощью векторной диаграммы рис. 8.19 характер осцилляции интенсивности в области х > 0, оцените интенсивность света в точке Р, смещенной в область тени на расстояние Ах = V2Xz. Оцените также, на каком расстоянии от геометрической границы света и тени (в области х > 0) осцилляции интен- интенсивности не превышают 10% от значения Iq. 8.7. Дифракция Френеля на периодических структурах. (Эффект Тал бота) Примером периодической структуры является непрозрачный экран с пе- периодически расположенными одинаковыми отверстиями, например, парал- параллельными щелями одинаковой ширины 6, расположенными на одинаковом расстоянии d друг от друга. Пусть такой экран (решетка) освещается слева плоской нормально падающей волной; амплитуда волны Aq, длина волны А. Согласно граничным условиям Кирхгофа (8.2) на выходе из экрана (в плоскости, примыкающей к нему справа) получаем световое поле, комплекс- комплексная амплитуда которого показана на рис. 8.23, граничное поле /о(х) явля- является периодической функцией с периодом d, которую можно представить в виде ряда Фурье: JnB7r/d)x (8.26)
8.7. ДИФРАКЦИЯ ФРЕНЕЛЯ НА ПЕРИОДИЧЕСКИХ СТРУКТУРАХ 469 Каждое слагаемое ряда (8.26) представляет собой поле плоской волны (см. гл. 8.2), пространственная частота которой ип = п2тг/с1 определяет на- направление волнового вектора kn (ип = ksman) этой волны. Комплексная амплитуда волны в плоскости наблюдения, отстоящей на расстоянии z от решетки, имеет вид (8.9). Напомним, что величина срп = л/А;2 — u^z представляет собой набег фазы плоской волны, имею- имеющей пространственную частоту ип. Будем полагать, что в сумме плоских волн (8.26), образующих периодическую структуру, существенно отличны от ну- нуля лишь значения Fn, для которых ип = = п 2тг/'d много меньше |к| = 2тг/А. В этом случае можно приближенно записать \/к2 — и2^ с± к — и^/Bк). Для набега фазы n-ой плоской волны получаем Рис. 8.23 ~kz- z/Bk)un (8.27) Или, поскольку ип = п2тг/с/, то срп = kz — z/\2к)Bтг/dJn2. Конечно, роль играет лишь разность фазовых набегов, поэтому будем сравнивать набег фазы n-й плоской волны с набегом фазы сро плоской волны, бегущей вдоль оси z (перпендикулярной плоскости решетки): сро = kz. Мы получаем Aipn = щ-(рп = z/Bk)B7r/dJn2 = n27r\z/d2. (8.28) Рассмотрим плоскость наблюдения, отстоящую от плоскости решетки на расстояние zx = 2d2/X. (8.29) В этой плоскости имеем Асрп = 2тгп2, т. е. относительной набег фазы всех плоских волн кратен величине 2тг. Очевидно, что и разность фазовых на- набегов любых двух волн (с пространственными частотами n\2n/d и тт^тг/сГ), равная 2тг(п2 —ть^), также кратна 2тг. Но изменение разности фаз колебаний на величину, кратную 2тг, ничего не меняет в суммарном колебании. Мы пришли к замечательному результату: фазовые соотношения между слагае- слагаемыми плоскими волнами оказались одинаковыми как в плоскости, примыка- примыкающей к решетке (где сумма плоских волн (8.26) образовала граничное пери- периодическое поле /о(ж)), так и в плоскости (8.29). Одинаковость (с точностью до величины, кратной 2тг) фазовых соотношений слагаемых плоских волн приводит к тому, что одинаков и результат интерференции этих плоских волн, т. е. световое поле в плоскости z\ = 2d2/А отличается от граничного поля /о (х) лишь постоянным фазовым множителем elkz: Мы наблюдаем в плоскости z\ периодическую структуру, тождественно повторяющую граничное поле fo(x). Очевидно также, что такое восстано- восстановление изображения периодической структуры повторяется на расстояниях, кратных z\\ zm = m2d2/X (m = l, 2,...). (8.30) Описанный эффект называют эффектом самовоспроизведения, или (по имени первооткрывателя) эффектом Талбота.
470 ГЛ. 8. ДИФРАКЦИЯ 8.8. Дифракция Фраунгофера Удаляясь от препятствия все дальше, мы оказываемся в дальней волновой зоне (или в зоне Фаунгоферовой дифракции) p=y/\z/b^$>l. Вновь обратимся к принципу Гюйгенса-Френеля и его математической формулировке — равенству (8.22). Используем приближения, о которых уже неоднократно говорили ранее: при условии, что размер препятствия (напри- (например, размер отверстия в непрозрачном эк- экране) мал по сравнению с расстоянием Rq до точки наблюдения, амплитудный мно- множитель 1/i?, учитывающий уменьшение амплитуды в сферической волне по ме- мере удаления от вторичного источника d*S, можно заменить постоянной величиной 1/Ro (рис. 8.24). Множитель наклона rasF \Л i - -Яб"" . __ " 'У X ¦ ~х Рис. 8.24 cos а также считаем приблизительно одинаковым (и равным единице) для всех вторичных источников d*S, расположенных в области отверстия. Тогда из (8.22) находим 1 Г Г (8.31) Точное выражение для расстояния R от вторичного источника (малой площадки dS = d^dr/, расположенной в точке (?, г/)) до точки наблюдения Р(ж, у, г) равно R = лД2 + (^-?J + (У ~VJ' (8.32) Вычисляя величину i?, входящую в фазовый множитель ег/сЯ, мы не можем довольствоваться грубой оценкой R ~ Rq: ошибка при вычислении фазы колебаний kR должна быть мала по сравнению с тг и, следовательно, ошибка в вычислении R мала по сравнению с длиной волны А. Выражение (8.32) запишем в виде R = л/ (z2 + х2 + у2) — 2х^ — 2ут] и далее, поскольку z2 + х2 + у2 = i?o, то R = Ща 1 - 2——z Г?2 2 R2 ¦ Считая поправку к единице под знаком радикала малой, получим R ~ До - (ж? + yri)/Ro + (?2 + r]2)/2R0. (8.33) Разумеется, мы полагаем при этом, что отброшенные члены разложения радикала в степенной ряд малы по сравнению с длиной волны А. Обратим внимание, что, согласно граничным условиям Кирхгофа, граничное поле /о(?, TJ) отлично от нуля лишь на открытой части волнового фронта, поэтому при оценке выражения (8.33) интерес представляют лишь значения (?, г/), лежащие в области отверстия. Очевидно, что последнее слагаемое в (8.33) ограничено величиной У2/2Rq:
8.8. ДИФРАКЦИЯ ФРАУНГОФЕРА 471 где b — максимальный линейный размер отверстия. Потребуем теперь, что- чтобы точка наблюдения находилась столь далеко от отверстия и (или) размер отверстия был столь мал, чтобы выполнялось неравенство Ь2/2Щ <С А или, что то же, р = у/Щ/Ь > 1. (8.34) Последнее неравенство — условие применимости полученных соотноше- соотношений — называется условием дифракции Фраунгофера. Обсуждая ранее условия, при которых справедливы выводы геометриче- геометрической оптики (в частности, закон прямолинейного распространения света), мы пришли к неравенству (8.12) Xz/b2 <С 1, которое, очевидно, противо- противоположно неравенству (8.34). Если геометрическое приближение справедли- справедливо при малых расстояниях z и (или) больших размерах препятствий 6, то фраунгоферовы дифракционные картины, возникают, напротив, на больших расстояниях z и (или) при малых размерах препятствий, расположенных на пути волны. Условие р ^> 1 эквивалентно следующему: размер отверстия b много меньше размера первой зоны Френеля. Промежуточная область р ~ 1 называется обычно областью Френелевской дифракции. В этой ситуации раз- размер отверстия Ъ и радиус первой зоны Френеля v Xz сравнимы между собой. Тогда получим следующее приближенное выражение для R: R~Ro-(x? + yri)/Ro (8.35) и вместо (8.31) имеем оо оо pikRo ШгЛ I Ш^)е~г{(кх1К°^+(ку1Ко)Г1)^АП- (8-36) — оо —оо Введем обозначения kx/Ro = гл, ky/Ro = v; формула (8.36) приобретает вид оо оо f(P)~ / / MZ,rj)e-%M+™i)dtdri. (8.37) — oo —oo Последнее соотношение означает, что для нахождения светового поля в точке наблюдения достаточно найти преобразование Фурье граничного поля /о(?, rj). В частном случае, если граничное поле является функцией одной переменной, /о@5 то (8.37) приобретает вид f(P)~ f М?)е-*и*д?. (8.38) — оо Еще раз отметим, что в (8.37) (или одномерном аналоге (8.38)) положение точки наблюдения полностью определяется параметрами (и, v) (или пара- параметром и — в случае функции одной переменной). Обратимся для простоты к одномерной задаче (рис. 8.25). Рассмотрим ко- колебание в точке Р как сумму колебаний от всех вторичных источников d*S, заполняющих отверстие. Принимая фазу колебания от вторичного источ- источника, расположенного в начале координат, нулевой, найдем фазу колеба- колебания от источника d*S, находящегося на расстоянии ? от начала координат.
472 ГЛ. 8. ДИФРАКЦИЯ При достаточном удалении точки Р (неравенство (8.34)) разность расстоя- расстояний А = Д — До можно оценить так: А с± — ?sin# (угол 6 определяет на- направление на точку наблюдения: sin6 = ж/До). Разность фаз колебаний кА ~ — kt;sm6 = (—kx/Ro)^. Если падающая на щель волна имеет в точке ? комплексную амплиту- амплитуду /о (?), то колебание в точке наблюдения от этого вторичного источника есть d/ ~ /о (О <1^е~г^ж/Яо^, а суммарное колебание О / /о( что совпадает с выражением (8.38), где гл = /еж/До = Рис. 8.25 =fcsin6>. Еще раз подчеркнем, что при выполнении нера- неравенства (8.34) f(P) зависит от направления на точку наблюдения — угла в. Если точка наблюдения смещается вдоль фиксированного направления, приближаясь или удаляясь, так что угол в остается неизменным: sin в = = ж/До = const (и при этом остается справедливым неравенство (8.34)), то значение интеграла (8.38) остается неизменным: ?. (8.39) В частности, картину дифракции можно характеризовать распределением интенсивности света (потока энергии) по углам / = 1F) 2 ПО) //.( (8.40) Это распределение 1@), изображенное в полярных координатах, называют диаграммой направленности дифракционной картины. Продолжая изучение дифракции Фраунгофера, рассмотрим три конкрет- конкретных примера. Дифракция Фраунгофера на щели (ширина щели 6, щель освещает- освещается слева плоской нормально падающей волной). Граничное поле /о@5 воз~ никающие в плоскости z = 0, примыкающей к непрозрачному экрану со щелью справа, имеет вид изображенный на рис. 8.4. Согласно (8.39), для нахождения картины Фраунгоферовой дифракции, необходимо найти пре- преобразование Фурье этой функции. Задача полностью аналогична нахожде- нахождению спектра прямоугольного импульса, (см. § 1.4). Здесь роль длительности импульса г играет ширина щели 6, а роль частоты ш — величина и = к sin в (которую мы назвали ранее пространственной частотой). Используя эту ана- аналогию, находим sin((fcb/2)sinfl) ТУ> (kb/2)sme ' [ ' Распределение интенсивности 1F) = |/(#)|2 показано на рис. 8.26. Бли- Ближайшие к направлению 6 = 0 направления, в которых 1F) обращается в
8.8. ДИФРАКЦИЯ ФРАУНГОФЕРА 473 нуль, определяются условием kb/2s'm6 = ±тг, откуда находим /(9) (8.42) Как показывает анализ формулы (8.41), в угловом конусе |sin0| ^ А/6 сосредоточена подавляющая величина потока энергии (более 80%). Этот угловой конус (интервал углов от —А/6 до А/6) называют главным мак- максимумом дифракционной картины (легко найти с помощью (8.41), что мак- максимальная интенсивность в ближайшем боковом максимуме, в направлении sin 6 = C/2) А/6, соста- составляет примерно 0,05 от интенсивности в направле- направлении sin 6 = 0). Мы видим, что сужение щели (умень- (уменьшение 6) приводит к уширению угла 6: свет расхо- расходится от щели во все более широком интервале углов. Можно сказать и по-другому: с уменьше- уменьшением ширины щели уширяется пространственный спектр — спектр плоских волн, бегущих от щели. Дифракция Фраунгофера на круглом отверстии (рис. 8.27). При ди- дифракции плоской волны на круглом отверстии в непрозрачном экране, на удаленной плоскости наблюдения (т. е. при условии \fXzjd ^> 1, d — диа- диаметр отверстия) наблюдается картина дифракции, показанная на рис. 8.27 а: центральное яркое дифракционное пятно (которое называется пятном Эй- ри) окружено чередующимися светлыми и темными кольцами. Соответству- Соответствующий график 1F) показан на рис. 8.27 б. Угловая полуширина пятна Эйри (главного максимума в картине 1F)) определяется условием sin<9 = 1,22 X/d. (8.43) В телесном угле 6 сосредоточена подавляющая доля потока энергии (~ 80%) дифрагированной волны. /(9) Рис. У 1— 1,22(Ш) Рис. 8.27 х А z Рис. 8.28 Дифракция Фраунгофера на решетке. Рядом со щелью, дифракцию на которой мы рассмотрели выше (эта картина дифракции описывается функцией /(#), см. формулу (8.41)), расположим параллельно еще одну та- такую же щель, центр которой находится в точке ? = с/, рис. 8.28. Расстояние от второй щели до точки наблюдения (от любого элемента этой щели) на величину А = d sin 6 меньше расстояния между соответствующим элемен- элементом первой щели и точкой наблюдения (рис. 8.28). Соответственно, фаза колебаний отличается на величину а = -А;А = -kdsmd, (8.44)
474 ГЛ. 8. ДИФРАКЦИЯ поэтому колебательный процесс, созданный второй щелью в точке наблю- наблюдения, описывается функцией /(в)ега. Волны, посылаемые в точку наблю- наблюдения двумя щелями, интерферируют, суммарный колебательный процесс в точке наблюдения есть f(9) + fF)elOL. Если расположить рядом еще одну щель, сдвинутую относительно первой на расстояние 2d (и на расстояние d от второй), то получим суммарное колебание f@) + f(O)eia + fF)el2oL. Нако- Наконец, если мы имеем решетку, состоящую из N параллельно расположенных щелей (период решетки of), то суммарное колебание имеет вид N-1 9@) = № Y, еШа- (8-45) п=0 Сумму, входящую в (8.45), можно найти, построив векторную диаграмму. Каждое слагаемое ета изобразим вектором единичной длины, угол наклона которого (относительно горизонтальной оси) равен па. Мы получим цепочку векторов, показанную на рис. 8.29. В этой цепочке угол между двумя сосед- соседними векторами равен а, а вся цепочка представляет собой часть правильного многоугольника. Суммарное колебание изображается вектором, соединяющим начало первого вектора с концом последнего. Радиус окружности, в которую вписана цепочка векторов, равен (см. рис. 8.29) 1/2 ~~~" I Рис. 8.29 Л=2вш(а/2)' (8'46) а длина А суммарного вектора есть А = 2Rsm(P/2) = 2Rsm(Na/2). (8.47) Из (8.46) и (8.47) находим, используя (8.44): g-n /JVkdsin9 \ V 2 У Распределение интенсивности 1(9) по углам описывается формулой 2 sin I |2 (8.49) Первый сомножитель \fF)\2 описывает картину дифракции на щели (фор- (формула (8.41)). Второй сомножитель связан с интерференцией волн, приходя- приходящих от разных щелей к точке наблюдения. Наиболее интересным в картине дифракции на решетке является нали- наличие узких дифракционных максимумов, в которые идет подавляющая доля общего потока энергии. Направления на эти максимумы вт определяются условием Am = dsmern = m\ (m = 1, 2,...), (8.50) волны от всех щелей решетки приходят в точку наблюдения с разностью хо- хода Ат, равной целому числу длин волн и, следовательно, создают син- синфазные колебания. Итак, разность фаз ат = кАт = 2тгт. Амплитуда сум- суммарного колебания А оказывается при этом в N раз больше амплитуды
8.8. ДИФРАКЦИЯ ФРАУНГОФЕРА 475 колебаний, созданных одной щелью: А(в) = N /(#), а интенсивность 1{вт) = = N2\fF)\2 в N2 раз превышает интенсивность волны от одной щели, т. к. при а = 2тгга все векторы, составляющие цепочку векторов на рис. 8.29, оказываются ко л линеарными, поэтому длина суммарного вектора в N раз больше длины слагаемых векторов). Читатель может самостоятельно убе- убедится, что второй сомножитель в (8.49) равен N при условии (8.50): lim .\ > =N. (8.51) График функции (8.49) показан на рис. 8.30. Пунктирной линией показана «огиба- «огибающая» зависимости от в первого сомно- сомножителя \fF)|2, т. е. функция (8.41), описывающая картину фраунгоферо- вой дифракции на щели ширины Ь. Для картины, изображенной на лМллл/Иллау 7F) 0 /\лл/! \ллл/;\л sin6 -2Ш -Ш X/d 259 Рис. 8.30 рис. 8.30, характерно, что уже при небольшом отклонении от направления вт (т. е. от направления, определяемого условием (8.50)) интенсивность рез- резко уменьшается, обращаясь в нуль при в = вт ± 56. Определить величину этого отклонения можно из следующих соображений. В направлении вт векторная диаграмма имеет вид, показанный на рис. 8.31 а — цепочка коллинеарных век- векторов, состоящая из N векторов: ат = kd sin вт = 2тгга. Спрашивается, при каком отклонении 56 от направле- направления вт векторная диаграмма будет иметь вид, пока- показанный на рис. 8.31 б\ замкнутая цепочка векторов, в которой конец последнего вектора N совпадает с нача- началом первого вектора и, следовательно, длина суммар- суммарного вектора будет равна нулю. Чтобы векторная диа- диаграмма, показанная на рис. 8.31 а, преобразовалась в замкнутый многоугольник векторов рис. 8.31 б', необхо- необходимо, чтобы разность фаз колебаний от двух соседних щелей решетки в точке наблюдения изменилась на величину 5а = 2tt/7V, т. е. 5(kdsm6) = 2tt/N или 6(sm0) = X/(Nd). (8.52) Для сравнительно небольших углов в можно приближенно написать 59 = X/(Nd). (8.53) Это и есть оценка полуширины главных дифракционных максимумов. Це- Целое число т в (8.50) называется порядком главного максимума (или поряд- порядком дифракции). Например, при га = 1 имеем первый порядок дифракции; значению га = — 1 отвечает минус первый порядок дифракции. Максималь- Максимальное значение га, как ясно из (8.50), ограничено величиной d/X. (8.54) Реально же заметными являются лишь те дифракционные максимумы, которые лежат в пределах углов \$тв\ ^ А/6, (8.55)
476 ГЛ. 8. ДИФРАКЦИЯ поскольку, как мы выяснили ранее, только в пределах этих углов в основном распространяется поток энергии от всех щелей решетки. Поэтому (при b > А) максимальный порядок т можно оценить из условия (см. рис. 8.30) mX/d ^ А/6 или mmax ^ d/b. (8.56) При этом общее число главных дифракционных максимумов, в которые по- попадает подавляющая часть потока энергии, равно приблизительно 1 + 2d/b. 8.9. Разрешающая способность спектральных приборов Ранне мы говорили о том, что излучение любого источника света можно представить как сумму волн различных частот (спектральное разложение). Распределение энергии по спектру излучения (зависимость интенсивности от частоты I(uj)) является чрезвычайно важной характеристикой, которая исследуется с помощью спектральных приборов. Мы рассмотрим несколько возможных способов. Дифракционная решетка. Два обстоятельства позволяют использо- использовать дифракционную решетку для спектральных измерений. Во-первых, как следует из (8.50), положение главных дифракционных максимумов зависит от длины волны, и во-вторых, ширина этих максимумов, как видно из (8.53), чрезвычайно мала, а поток энергии (интенсивность) велик при большом чи- числе щелей решетки. Схема спектрального прибора, основанного на использовании дифракци- дифракционной решетки, показана на рис. 8.32 а. Рис. 8.32 Излучение исследуемого источника S проходит через малую диафрагму (отверстие в непрозрачном экране) D, расположенную в фокальной плос- плоскости объектива Л\. Сколлимированное объективом излучение (параллель- (параллельный пучок света) падает на дифракционную решетку. При дифракции на решетке возникает ряд пучков, распространяющихся в направлениях 0Ш, определяемых равенством (8.50). Угловая расходимость каждого из них 56 дается формулой (8.53). Следовательно, в фокальной плоскости объекти- объектива Л-2 возникает картина дифракционных максимумов, положение которых (расстояние от оптической оси) есть хт = / -tg0m ~ / -ятвт = mXf/d, а полуширина максимумов 5х = fS0 = A/ /Nd; f — фокусное расстояние объектива Л.2- Пусть излучение содержит две близкие спектральные линии А и А + 6Х одинаковой интенсивности. Положение m-ого дифракционного максимума, отвечающего длине волны А, определяется условием = mXf /d.
8.9. РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ СПЕКТРАЛЬНЫХ ПРИБОРОВ 477 Соответственно, положение m-ого максимума для длины волны А-\-6А есть / • а А + 6Х / х2 = / sin02 = т —-— /. Какова минимальная величина дА, при которой мы можем по наблюдае- наблюдаемой картине дифракции в фокальной плоскости линзы «/72, зафиксировать наличие двух спектральных линий? Согласно критерию Релея, предельно разрешимыми считаются спектраль- спектральные линии для которых смещение дифракционных максимумов Ах = = Х2 — х\ = mf SX/d в точности равно их полуширине дх = Xf/(Nd) (в данном случае полуширина линии определяется по первому нулю интен- интенсивности) . Эта ситуация показана на рис. 8.32 б. Слева изображены кривые интенсив- интенсивности 1\{х) и 72(ж), отвечающие m-ым максимумам для длин волн А и А + ?А, соответственно. Справа наблюдаемая в предельном случае суммарная кар- картина интенсивности I(x) = Ii(x)-\-^(х). Как показывает расчет, основанный на формуле (8.49), в наблюдаемой картине 1(х) имеется примерно 20%-ный провал, по наличию которого легко определить, что излучение источника содержит две спектральных линии. Разумеется, критерий Релея является условным: например, если расстояние Ах между центрами картин 1\{х) и 72(ж) будет немного меньше величины дх, то провал в суммарной картине будет несколько меньшим (например 15% или 10%), что визуально также можно определить. При достаточно малом смещении Ах или существенно разной интенсивности линий провал в суммарной картине вообще может от- отсутствовать, однако и в этом случае наблюдаемая картина отличается от картины дифракции, создаваемой строго монохроматическим источником. Тем не менее, критерий Релея широко применяется для оценки возможно- возможностей спектральных приборов. Итак, используя критерий Релея Ах = дх, находим mSX/d = X/(Nd), откуда получаем Х/дХ = mN. (8.57) Отношение длины волны А к предельно допустимому (согласно крите- критерию Релея) интервалу длин волн дХ называется разрешающей способностью спектрального прибора. Высокая разрешающая способность дифракционных решеток достигается за счет большого числа N (до 105 и более). При этом общий рабочий размер решеток D = Nd не может быть слишком большим (обычно D < 10 см), так как в противном случае возникают трудно выполнимые требования как к качеству объективов Л\ и «/72, так и к качеству самих решеток (равномер- (равномерности нанесения штрихов). Расстояние между штрихами (период решеток d) при этом сильно ограничено: у хороших решеток величина d составляет всего несколько длин волн (в оптическом диапазоне). Соответственно мак- максимальная величина порядка дифракции mmax, согласно (8.54), ограничена несколькими единицами. Из (8.57) и (8.54) следует, что максимальная вели- величина разрешающей способности дифракционной решетки есть (А/а)тах = ттах • N ~ D/X. (8.58)
478 ГЛ. 8. ДИФРАКЦИЯ 1A) Из (8.58) получаем оценку минимально разрешимого интервала длин волн (<5A)min ~ X2/D. (8.59) Имеется еще одна важная характеристика: максимальный спектральный интервал излучения, который может быть проанализирован с помощью спек- спектрального прибора. Итак, пусть спектральный состав излучения содержит ряд компонент, лежащих в интервале от А до А + АА (рис. 8.33). При этом разрешающая способность решетки достаточно высока, так что даже ближайшие линии в спектре излучения (с расстоянием между ними 6Х) разрешаются нашей решет- решеткой. Однако есть еще одна проблема. Каждая спектральная компонента создает в фокаль- фокальной плоскости объектива Лъ (рис. 8.32 а) свою карти- картину дифракционных максимумов. Пусть положение (га + 1)-го максимума спектральной компоненты А (на- (находящейся на левом краю спектрального диапазона излучения источника) совпадает с положением га-ого дифракционного максимума спектральной компоненты А + АА (находящейся на правом краю спектрального диапазона излучения). То есть выполняется условие: Рис. 8.33 = (га + 1)А = ш(А + АА). (8.60) Ясно, что при этом наблюдаемая картина дифракции в фокальной плос- плоскости объектива Л^ не дает возможности определить, наблюдается ли т-ый максимум для длины волны А + АА или мы видим (га + 1)-ый максимум для длины волны А. Равенство (8.60) является предельным условием, при кото- котором спектральные максимумы разных порядков начинают перепутываться; спектральный диапазон, превышающий предельное значение А А, определяе- определяемое условием (8.60), не может быть проанализирован. Этот максимально до- допустимый диапазон АА называется областью дисперсии. Из (8.60) находим ДА = А/га. (8.61) Чем больше порядок дифракции га, в котором анализируется излучение, тем меньше допустимая область дисперсии. В частности, в первом порядке дифракции (га = 1) может быть проанализирован весь видимый диапазон излучения, однако разрешающая способность при этом (8.57) минимальна. Интерферометр Фабри—Перо. Интерферометр Фабри-Перо предста- представляет собой плоскопараллельную прозрачную пластинку, на поверхность которой нанесены высокоотражающие покрытия, либо интерферометр состоит из двух пластин с z параллельными отражающими покрытиями, раз- '"""" деленных воздушным промежутком. Многолуче- Многолучевая интерференция в данном случае возникает за счет многократного переотражения падающей волны от высокоотражающих покрытий (зеркал) Рис. 8.34 интерферометра. Пусть плоская монохроматиче- монохроматическая волна падает на интерферометр под углом в (угол между волновым вектором и нормалью к отражающим поверхностям — осью z на рис. 8.34). Введем т и р — амплитудные коэффициенты пропускания и отражения зеркал.
8.9. РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ СПЕКТРАЛЬНЫХ ПРИБОРОВ 479 Коэффициенты тир связывают между собой амплитуду падающей на зер- зеркало волны с амплитудами прошедшей и отраженной волн. Согласно опре- определению: ^-прош = ^-пад ^~i ^-отр = ^-пад Р- Соответственно, интенсивности волн связаны равенствами: /прОш = ^пад т2? 1отр = ^пад р1- Будем полагать, что поглощение отсутствует. Тогда, очевидно ^пад = ^прош + ^отр^ откуда следует т2 + р2 = 1. Если ввести энергетические коэффициенты отражения и пропускания ЛиТ, то R + T = 1. Пусть падающая на интерферометр волна имеет амплитуду Aq. Пройдя внутрь интерферометра, волна ослабится, ее амплитуда станет равной Aqt. Пройдя затем через второе зеркало, волна выйдет из интерферометра впра- вправо, имея амплитуду А\ = Aqt . Назовем эту волну первой волной. Однако часть волны (с амплитудой Aqt) отразится от зеркала 2, а затем и от зеркала 1. После первого отра- А±. жения ее амплитуда станет равной Aqt/э, а после второ- второго Аотр2. После выхода из интерферометра вправо (после прохождения сквозь зеркальное покрытие 2), ее амплиту- амплитуда станет равной А2 = А$тр2 • г = Aqt2р2'. Назовем эту * 2 волну второй волной (рис. 8.35). Легко сообразить, что Рис. 8.35 третья волна будет иметь амплитуду A3 = Aqt2p4". Итак, на выходе из ин- интерферометра мы имеем суперпозицию плоских волн, все они распространя- распространяются под углом в к оси z, а амплитуды этих волн отличаются множителем р2: Ап+1 = Апр2. Каждая последующая волна в этой суперпозиции проходит в интерферо- интерферометре дополнительный путь 2L (L — расстояние между зеркалами), при- приобретая набег фазы а, равный kz 2L: a = 2Lkcos6 (8.62) (для интерферометра, состоящего из двух зеркал, разделенных воздушным промежутком). Таким образом, суммарная волна на выходе из интерферометра имеет амплитуду А = А0т2 + А0т2р2ега + А0т2р*ег2а + • • • = А0т2/ A - р2ега) (8.63) (сумма бесконечной геометрической прогрессии со знаменателем p2eia). Ам- Амплитуда суммарной волны, прошедшей сквозь интерферометр, максималь- максимальна, если происходит синфазное сложение волн, т. е. am = 2kLcos6m = 2тгт (га — целое число). (8.64) При этом векторная диаграмма, изображающая сумму (8.63), представля- представляет собой цепочку коллинеарных векторов, длины которых уменьшаются в геометрической прогрессии, а амплитуда прошедшей волны равна амплиту- амплитуде падающей волны: A = AOT/A-R) = AO, (8.65) т. е. волна полностью проходит сквозь интерферометр! Поучительно рассчи- рассчитать, какова при этом амплитуда отраженной волны (разумеется, мы долж- должны получать в результате расчета Аотр = 0). Мы предоставляем проделать это читателю в качестве упражнения.
480 ГЛ. 8. ДИФРАКЦИЯ Синфазное сложение волн, возникающих при многократных переотраже- переотражениях от зеркал (при условии (8.64))приводит к тому, что амплитуда коле- колебаний поля внутри резонатора может существенно превосходить амплитуду падающей волны (так же, как амплитуда вынужденных колебаний в высо- высокодобротном колебательном контуре существенно превосходит амплитуду внешней э. д. с, вызывающей процесс колебаний). Действительно, посколь- поскольку амплитуда прошедшей волны равна, AqT/A — i?), то амплитуда волны, падающей на зеркало 2 внутри резонатора (бегущей слева направо), есть А^ = Аот/A -R)= A0/VT^R, а амплитуда волны, бегущей справа налево внутри резонатора, как следует из последнего равенства, равна А<_ = A0(VR/y/l-R). (8.66) Если коэффициент отражения R близок к единице, то амплитуда сум- суммарной волны (в пучностях) близка к значению 2А^ = 2Ао/у/1 — R. При значении R = 0,96 (что легко достигается при использовании многослой- многослойных диэлектрических зеркал) получаем А ~ 10Д), а интенсивность волны внутри резонатора почти в 100 раз больше интенсивности падающей волны. Вернемся к вопросу о разрешающей способности интерферометра Фабри- Перо. Условие резонанса (8.64) выделяет длины волн Ат, которые проходят сквозь интерферометр, имея максимально возможную амплитуду. Это усло- условие можно переписать в виде Am = 2L cos в = тАт. (8.67) При изменении А (при фиксированном угле падения в) нарушается син- фазность волн, возникающих при переотражениях от зеркал. Разность фаз становится отличной от 2тгга: а = 2тгт + ?, а разность хода А — от целого числа длин волн тХ: А = шА +Аб/2тг. Нарушение синфазности интерферирующих волн приводит к уменьшению амплитуды суммарной волны, прошедшей сквозь интерферометр. Так же, как и у дифракционной решетки, спектральная избирательность интерферометра Фабри-Перо обусловлена многолучевой интерференцией. Изучая дифракционную решетку, мы выяснили, что ее разрешающая спо- способность определяется формулой Х/6Х = mTV, (8.68) где т — порядок интерференции — отношение разности хода между волна- волнами, прошедшими через соседние щели решетки, к длине волны А (для решет- решетки эта величина равна т = d sin в/А), N — число интерферирующих волн (в решетке оно просто равно числу щелей). Формулу (8.68) можно использо- использовать и для оценки разрешающей способности интерферометра Фабри-Перо. В этом случае порядок интерференции, как следует из (8.67), равен т = Am/A = 2Lcos#/A ~ 2L/A (условие малости угла в всегда используется в спектральных измерениях). Число интерферирующих волн в принципе бесконечно, а амплитуда ка- каждой последующей волны Ап+\ отличается от предыдущей множителем R: Ап = An-i R. Однако ясно, что реально результат интерференции не зависит
8.9. РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ СПЕКТРАЛЬНЫХ ПРИБОРОВ 481 от волн, амплитуда которых слишком мала. Мы можем говорить о некото- некотором эффективном числе интерферирующих волн Л/"эф, вклад которых су- существенен. Качественную оценку Л/"эф можно сделать следующим образом. Представим себе, что синфазно складываются волны одинаковой ампли- амплитуды, равной амплитуде первой прошедшей через интерферометр волны А\ = Aqt2 = AqT. Сколько таких волн дадут в результате интерференции волну, амплитуда которой равна суммарной амплитуде прошедшей через интерферометр волны? Положим А\ • Л/"эф = Д), откуда получаем Л/"эф ~ ~ 1/Т = 1/A — R); для разрешающей способности получаем оценку Одной из важных характеристик любого резонансного устройства (маят- (маятник, колебательный контур) является добротность Q — величина, характе- характеризующая скорость потерь энергии при колебаниях. Q = 2ttW/6W, (8.70) где W— энергия колебаний, 6W — потери энергии за время, равное одному периоду колебаний. Напомним также, что добротность определяет относи- относительную ширину резонансной кривой колебательной системы, т. е. ее спек- спектральную избирательность: при отклонении частоты возбуждающей силы lo от резонансной частоты ujm амплитуда вынужденных колебаний заметно уменьшается (например, в у/2 раз): Q = ojm/6u; = Am/AA. (8.71) Интерферометр Фабри-Перо также является колебательной системой, ре- резонирующей на определенные частоты (длины волн) колебаний. К этой си- системе полностью применимо понятие добротности, определив которую, мы определим и спектральную избирательность — т. е. разрешающую способ- способность системы. Итак, пусть / — интенсивность волны, бегущей в резонаторе слева напра- направо, к зеркалу 2. После отражения от зеркала интенсивность уменьшается на величину АД = /A — R). При значениях i?, близких к единице, пример- примерно таково же уменьшение интенсивности при втором отражении (от зеркала 1). Уменьшение интенсивности при полном обходе волны через резонатор (туда-обратно) равно, следовательно, А/ = 2/A — R). Соответственно, связь между полной энергией волны в резонаторе W и потерями энергии при пол- полном обходе, т. е. за время т = 2L/c, есть AW = 2WA-R). За время, равное одному периоду колебания Tq = А/с, потери энергии составляют 6W = (T0/r)AW = (X/L) • W(l - Д), откуда W/6W = L/(XA -R)) и Q ~ 2ttL/(AA - R)). (8.72) Формулы (8.69) и (8.72) дают качественные оценки разрешающей способ- способности интерферометра Фабри-Перо и справедливы по порядку величины. Точный расчет основан на формуле (8.63), из которой можно найти связь
482 ГЛ. 8. ДИФРАКЦИЯ между интенсивностью прошедшей волны / = |А|2 и интенсивностью пада- падающей волны / = Aq и получить /(«) = 1олм^2~^ • (8.73) 1 + R2 — 2R cos a Кривые 1(&) (зависимость интенсивности прошедшей волны от разности фаз а) при различных значениях R показаны на рис. 8.36. На графике по- показана величина е — отклонение разности фаз двух соседних интерфери- интерферирующих волн от резонансного значения 2тгга, при -7?=0,04 котором интенсивность прошедшей волны умень- -R=0,\ шается вдвое (т. е. I = 1о/2). Эта величина может быть найдена с помощью *R=0,5 (8.73) при подстановке cos a = cosB7rm±?) = cos e. .^=0,9 ^ firm R. близких к единице, можно получить 2тг(т-1) 2пт а р /am, j Рис. 8.36 6=2A~Д). (8.74) VR С другой стороны, изменение разности фаз е = а — 2тгт при отклонении длины волны Ai = Хт + SX от резонансного значения Хт можно найти из равенств 2тг Т л 2ttL cos 6> am = 2—Lcosu = 2тгт; а = 2 —. Am Am + о А При малых SX находим а = откуда e = a - am = 2irm 8X/X. (8.75) Из (8.74) и (8.75) получаем A nVR 2ttLVR a = m (TTr) = a(T7r) • (8'76) Это и есть правильное выражение для разрешающей способности, спра- справедливое при значениях i?, близких к единице. Расстояние между зеркалами (отражающими поверхностями) в интерфе- интерферометре Фабри-Перо составляет обычно величину порядка нескольких сан- сантиметров. Резонаторы лазеров могут иметь длину порядка метра, поэто- поэтому порядки интерференции m = 2L/A огромны: в оптическом диапазоне m c± 105 и более. Соответственно, чрезвычайно малой оказывается рабочая область дисперсии АА = A/m c± A /2L. В этом существенная особенность интерферометра Фабри-Перо как спектрального прибора. 8.10. Оптическое изображение и пространственная фильтрация. Разрешающая способность оптических систем Идеальная линза. Построение изображений с помощью лучей (т. е. осно- основанное только на законах геометрической оптики, рис. 8.37) не позволяет от- ответить на многие важные вопросы: действительно ли изображение подобно
8.10. ОПТИЧЕСКОЕ ИЗОБРАЖЕНИЕ И ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ 483 Рис. 8.37 предмету? Каковы предельные возможности оптических систем? Как упра- управлять их характеристиками? Ответ можно найти, используя волновые пред- представления. Основным элементом любой оптической системы (фотоаппарат, микро- микроскоп, телескоп) является линза. Будем рассматривать линзу как тонкий экран (гл. 8.2) и введем функцию пропускания линзы. Рас- Рассмотрим тонкую прозрачную пластинку, одна из поверх- поверхностей которой плоская, а другая — сферическая радиуса R (рис. 8.38). Считая линзу тонкой, мы полагаем, что рас- распространение волны через линзу происходит по законам геометрической оптики, т. е. чтобы связать световое поле в точке х на входе в линзу (в плоскости z = 0_) с полем в той же точке х на выходе (в плоскости z = 0+, примыкающей к линзе спра- справа), достаточно найти набег фазы вдоль луча 5, проходящего через линзу на расстоянии х от оптической оси. Луч, проходящий вдоль оптической оси (х = 0) приобретает набег фазы, равный сро = кпАо (п — показатель преломления, Aq — толщина линзы на оптической оси — расстояние между плоскостями, примыкающими к лин- линзе слева и справа). Для луча S набег фазы равен (р = кп А + +/с(До—А) — мы учитываем при этом, что часть оптическо- оптического пути луч проходит внутри линзы, т. е. в среде с показате- показателем преломления п (А — толщина линзы на расстоянии х от оптической оси), а другую часть пути, равную (До —А) — вне линзы, т. е. в среде с показателем преломления п = 1. Относительный набег фазы, который только и представляет интерес, есть Аср = ср - сро = к(п - 1)(А - До), Рис. 8.38 где До - Д = R - VR2 - х2 ~ x2/2R. Это выражение получено с помощью разложения радикала в ряд по (x/RJ и означает фактически, что сферическая поверхность линзы заменяется па- параболической. Таким образом д" = -т*2 = -^ <877> где через / обозначена величина, определяемая равенством 1// = (п - 1)/Я Она называется фокусным расстоянием линзы. В общем случае, если ра- радиусы кривизны поверхностей R\ и i?2, то вместо последнего равенства легко получить (8.78) Эта формула хорошо известна в геометрической оптике. Будем называть линзу с описанными выше характеристиками идеальной. Проходя через иде- идеальную линзу, волна приобретает различный в разных точках набег фазы, при этом амплитуда волны не меняется (отражением света от поверхности линзы мы пренебрегаем).
484 ГЛ. 8. ДИФРАКЦИЯ Таким образом, функция пропускания идеальной линзы определяется ра- равенством т(х) = e-ik/Bf)x\ (8>79) Разумеется, если мы говорим в действительности о сферических поверх- поверхностях (а не цилиндрических), то вместо (8.77) следует написать + y2), (8.80) а вместо (8.79) т(х, у) = е-^/B/)(*2+г/2). (8.81) Функция пропускания связывает между собой комплексную амплитуду волны /-(ж, у) на входе в линзу с комплексной амплитудой волны /+(ж, у) на выходе: f+(x,y) = f-(x,y)-m(x,y). (8.82) Поле в фокальной плоскости линзы. Рассмотрим точечный источ- источник — светящуюся точку *S, находящуюся в фокальной плоскости идеаль- идеальной линзы, на расстоянии ? от оптической оси (рис. 8.39). Каковы колебания поля в плоскости z = 0, примыкающей к линзе слева? В области значений ж, малых по сравнению с расстоянием Rq от источни- источника до центра линзы О, амплитуду колебаний в сферической волне можно считать постоянной величиной uq/R c± uq/Rq = = а = const. Распределение фаз колебаний есть (р(х) = kR = k^J(x — ?J + /2. Заменяя, как и ра- ранее, сферический волновой фронт параболическим, найдем ф) = kR0 - k( 2 p д ™ Играет роль, конечно, относительная фаза коле- колебаний, поэтому, принимая фазу колебаний на опти- оптической оси на входе в линзу (т. е. при х = 0) нулевой, запишем ф) = -k(?/Ro)x + b;2/Bi?o). Вводя угол a (sin a = ?/i?o) и полагая его малым, так что в последнем слагаемом можно положить Rq c± /, получим ф) = -кхъша + кх2/B$). (8.83) При распространении через линзу возникает дополнительный набег фазы Д<р, определяемый формулой (8.77). Таким образом, на выходе из линзы, т. е. в плоскости, примыкающей к линзе справа, получаем (р+(х) = (р(х) + А(р(х) = — A; sin a • х. (8.84) Формула (8.84) выражает замечательный результат: волна от точечного источника, расположенного в фокальной плоскости (сферическая волна), преобразуется линзой в волну с плоским волновым фронтом (в плоскую вол- волну) , причем направление волны (угол а) определяется положением источни- источника в фокальной плоскости а с± ?//. Разумеется, верно и обратное: плоская волна, падающая на линзу под углом а к оптической оси, т. е. имеющая про- пространственную частоту и = к sin а, преобразуется идеальной линзой в волну
8.10. ОПТИЧЕСКОЕ ИЗОБРАЖЕНИЕ И ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ 485 сферическую, которая фокусируется (сходится) в точку ?, расположенную на расстоянии ? = fa от оптической оси (рис. 8.40). Что собой представляет картина поля в фокальной плоскости, если иде- идеальная линза освещается произвольной монохроматической волной с ком- комплексной амплитудой /(ж)? Целесообразно представить эту волну в виде суперпо- суперпозиции плоских волн разных направлений ап, т. е. раз- разных пространственных частот ип = ksman (см. гл. 8.3, равенство (8.5)). Каждая плоская волна, фокусируясь идеальной линзой в свою точку ?n ~ fsman = fun/k, создает в этой точке колебания, амплитуда и фаза ко- которых определяется амплитудой и фазой той плоской волны, которая в эту точку фокусируется. Имеется, как мы видим, взаимно однозначное соответствие между точками фокальной плоскости и простран- пространственными частотами плоских волн, суперпозиция которых образует падаю- падающую на линзу волну: ип = k?n/f. Таким образом, поле в точке ?п фокальной плоскости пропорционально величине Fn = F(un) в сумме (8.5). Обозначив комплексную амплитуду поля в фокальной плоскости через #(?), мы можем записать Рис. 8.40 Разумеется, наше утверждение справедливо и в общем случае, когда вме- вместо дискретной суммы (8.5) волна, падающая на линзу, представляется не- непрерывной суперпозицией плоских волн: (8.85) где F(u) = J f(x)e~mx dx — преобразование Фурье поля f(x). Итак, картина поля в фокальной плоскости линзы является преобразова- преобразованием Фурье поля, падающего на линзу. Заметим, что картина фраунгоферовой дифракции также связана пре- преобразованием Фурье с граничным полем (т. е. с полем, возникающим не- непосредственно за препятствием), причем аргументом преобразования явля- является величина к^/гб. Таким образом, для наблюдения дифракции Фраунго- фера нет необходимости удаляться от препятствия на большое расстояние z ^> б2/А — достаточно установить за препятствием линзу и наблюдать картину в ее фокальной плоскости. Принцип двойной дифракции и формирование оптического изо- изображения. Пусть точечный источник света находится на расстоянии z\ от линзы на ее оптической оси (рис. 8.41). Тогда распределение фаз ко- колебаний в плоскости, примыкающей к линзе слева, определяется формулой (f-(x, у) = к/Bz\)(ж2 + у2). После прохождения линзы (в плоскости, примы- примыкающей к ней справа) получим ;, у) = <р-(х, у) + Аф, у) = (к/2) (l/zl - 1//) (х2 + у2), (8.86) где Д<р(ж, у) — набег фазы волны при прохождении линзы, см. (8.80). Сравнив полученную формулу с выражением / ч _ fc / 2 _|_ 2\
486 ГЛ. 8. ДИФРАКЦИЯ описывающим распределение фаз колебаний в сходящейся сферической вол- волне (см. гл. 4.1), находим 1 1 _ 1 Zl Z2 f (8.87) Ф-Wx z=0_ г=0+ Функция <р(ж, у) описывает форму волнового фронта в сходящейся волне, если Z2 > 0, что соответствует действительному изображению (рис. 8.41). При Z2 < 0 формула (8.86) описывает расходящуюся волну, при этом изображение оказывается мнимым (рис. 8.42). Аналогичным образом можно показать, что фор- формула линзы (8.87) справедлива для любой точки S, расположенной недалеко от оптической оси, т. е. для предметов малого размера. Формирование изображения с помощью линзы мо- можно рассматривать, основываясь на идее простран- пространственного спектрального разложения. Такой подход аналогичен спектральному анализу процесса выну- вынужденных колебаний в линейной колебательной системе (например, в колеба- колебательном контуре). Напомним, что спектральный анализ основан на пред- представлении внешнего воздействия возбуждающего вынужденные колебания в виде суперпозиции гармонических колебаний раз- разных частот. Представим монохроматическую волну, идущую от предмета, в виде суперпозиции плоских волн разных направлений а, т. е. разных пространст- пространственных частот и = к sin а. Каждая гармоника — плоская волна определенного направления — фо- фокусируется линзой в «свою» точку фокальной Рис. 8.41 Рис. 8.42 плоскости, в которой возникает, таким образом, картина пространственно- пространственного спектра: амплитуда и фаза колебаний в точке ? фокальной плоскости однозначно определяется амплитудой и фазой колебаний той плоской вол- волны, которая в эту точку фокусируется. По этой причине фокальную плос- плоскость линзы называют фуръе-плоскостъю. По термино- терминологии Аббе, впервые предложившего такой подход, поле в фокальной плоскости называют первичным изобра- изображением. На рис. 8.43 показана ситуация, когда предме- предметом является решетка, освещаемая плоской нормаль- нормально падающей волной. При этом в фурье-плоскости, как мы знаем, возникает картина фраунгоферовой дифрак- дифракции: набор ярких точек дифракционных максимумов. Итак, в процессе распространения света от предмета до Рис. 8.43 фурье-плоскости осуществляется преобразование Фурье светового поля (по терминологии Аббе, первая дифракция). Далее каждая точка фурье-плоскости (каждый дифракционный макси- максимум) рассматривается как источник сферической волны. Все сферические волны, исходящие из разных точек фурье-плоскости, интерферируя, образу- образуют в плоскости, находящейся на расстоянии Z2 за линзой, собственно изобра- изображение объекта. Это изображение Аббе назвал вторичным, а процесс распро-
8.10. ОПТИЧЕСКОЕ ИЗОБРАЖЕНИЕ И ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ 487 странения света от фурье-плоскости до плоскости изображения — второй дифракцией. Особенно наглядно принцип двойной дифракции проявляется в оптиче- оптической схеме, показанной на рис. 8.44. Схема состоит из двух линз с общей фокальной плоскостью Ф. Задняя фокальная плоскость линзы Л\ совпа- совпадает с передней фокальной плоскостью линзы «/72. В этом случае первая дифракция — это распространение света от передней фокальной плоскости линзы Л\, где расположен пред- предмет, к плоскости Ф, где возникает картина простран- пространственного спектра — первичное изображение. Далее, сферическая волна идущая из любой точки фурье- плоскости, преобразуется линзой «/72 в плоскую вол- волну. Таким образом, каждая плоская волна идущая от предмета, преобразуется системой двух линз в пло- скую волну, приходящую к плоскости изображения (задней фокальной плоскости линзы Л^). Причем, как видно из рис. 8.44, если фокусные расстояния линз одинаковы, то волна с пространственной ча- частотой и = k sin а преобразуется в волну с пространственной частотой «—и» (х — компонента вектора к изменяет знак). Это приводит к инверсии — изображение оказывается перевернутым. Можно сказать, что в процессе образования изображения происходит два последовательных преобразова- преобразования Фурье: от входной плоскости 77i к фурье-плоскости — первая дифрак- дифракция, и затем от фурье-плоскости с помощью линзы «/72 к выходной плоскости 7?2 — вторая дифракция. Особая роль фурье-плоскости обусловлена тем, что именно в этой плоско- плоскости возможно избирательное воздействие на разные пространственные гар- гармоники: установив в любой точке ? фурье-плоскости маленькую пластинку, вносящую определенное поглощение и (или) фазовую задержку, мы изме- изменим амплитуду и (или) фазу плоской волны с пространственной частотой и = &?//, не изменяя амплитуд и фаз других плоских волн. Устанавливая в фурье-плоскости различные амплитудно-фазовые маски, можно направлен- направленно изменять пространственный спектр изображения, влияя таким образом на его характеристики. Этим путем можно решать самые разнообразные задачи: улучшение качества изображений, разрешающей способности опти- оптических систем, визуализация фазовых объектов, выполнение самых разно- разнообразных преобразований пространственной структуры световых полей и т. д., т. е. решать широкий круг задач оптической обработки информации. Визуализация фазовых объектов. В качестве простого примера рассмо- рассмотрим проблему визуализации фазовых объектов, которую можно решить, используя метод фазового контраста, предложенный Цернике. Пусть фа- фазовый объект — тонкая прозрачная пластинка, имеющая разный в разных точках показатель преломления (или толщину), но не изменяющая ампли- амплитуду прошедшей волны, находится во входной плоскости 77i оптической системы, показанной на рис. 8.44. Функция пропускания такой пластин- пластинки т(х) = ег(р(х\ где <р(х) = kn(x)d (d — толщина, п(х) — распределе- распределение показателя преломления). При освещении пластинки (фазового объек- объекта) плоской, нормально падающей волной, комплексная амплитуда волны в плоскости примыкающей к пластинке справа, согласно (8.3), есть fo(x) = _ eiip(x) ^ Если оптическая система идеальна, то комплексная амплитуда
488 ГЛ. 8. ДИФРАКЦИЯ в выходной плоскости 772 тождественно повторяет (с точностью до инвер- инверсии) входное поле /о(ж), а наблюдаемая картина интенсивности Iq(x) = = |/о(ж)|2 = 1, т. е. в плоскости 7?2 мы наблюдаем равномерную засвет- засветку: информация о фазовой структуре предмета потеряна, фазовый объект не видим. Для визуализации фазового объекта Цернике предложил установить в фурье-плоскости, на оптической оси, маленькую фильтрующую пластин- пластинку, которая, не изменяя амплитуды прошедшей волны, вносит фазовую за- задержку, равную тг/2. Проанализируем структуру светового поля в выходной плоскости 772, рассмотрев в качестве примера объект — фазовую синусои- синусоидальную решетку с малой глубиной модуляции (то <С 1). В этом случае /0(ж) = eimocosux ~ 1 + гт0 cosих = 1 + г-^еШх + г-^-е~тх. (8.88) А А Итак, входное поле представляется в виде суммы трех слагаемых, в со- соответствии с этим, от входной плоскости 77i вправо распространяются три плоские волны. Первое слагаемое ответственно за появление плоской волны единичной амплитуды Д(ж, z) = elkz, бегущей вдоль оси оптической систе- системы (оси z). Второе и третье слагаемые — плоские волны с амплитудой то/2, направления распространения которых составляют углы ±а с оптической осью, где sin а = =ЬО/А; (т. е. О и —О — пространственные частоты этих волн). Обратим внимание, что в точке х = 0 входной плоскости колебание первой волны отличается по фазе на тг/2 от колебаний двух наклонных волн (обратите внимание на множитель г = е*71"/2). Три слагаемых в (8.88) — это три гармонических колебания, которые мож- можно изобразить в виде векторов. На рис. 8.45 а показано положение этих векторов в начале координат (х = 0). Горизонтальный вектор единичной а ив г Рис. 8.45 длины изображает колебание, созданное осевой волной, два вектора длины ттт-о/2 ^ 1? повернутые на угол тг/2 — колебания боковых волн. При смеще- смещении из точки х = 0 перпендикулярно оси z, фаза колебания осевой волны не меняется, поэтому соответствующий вектор остается горизонтальным. Фазы боковых (наклонных) волн изменяются: (р = ±Г2ж, поэтому изображающие векторы поворачиваются (по и против часовой стрелки). На рис. 8.45 б по- показано положение векторов в точке, где fix = тг/2: векторы повернулись на угол ±тг/2, а на рис. 8.45 в в точке ж, где ftx = тг, векторы поверну- повернулись на угол =Ьтг. При смещении на расстояние, равное периоду решетки х = 2тг/0, восстанавливается исходное расположение векторов (рис. 8.45 г). Легко видеть, что суммарный вектор, не меняя своей длины (с точностью до величины порядка ?77q) изменяет угол наклона ср от — то до +то, что и соответствует фазовой структуре волнового поля. Обратите внимание на полную аналогию с векторным изображением колебания, модулированного по фазе (гл. 1.3).
8.10. ОПТИЧЕСКОЕ ИЗОБРАЖЕНИЕ И ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ 489 Осевая плоская волна, фокусируясь линзой в начало координат фурье- плоскости (? = 0) проходит через фазовую фильтрующую пластинку, а две наклонные волны, фокусируясь в точки ?i52 = foi = /^/&, не «задевают» пластинку. Далее линза Л2 преобразует сферические волны, исходящие из точек ? = 0 и ?i52 = f&/k, в плоские волны, которые, интерферируя, обра- образуют изображение. Наличие маленькой фазовой пластинки в фурье-плоскости на оптической оси приводит к относительной фазовой задержке в тг/2 осевой волны (отно- (относительно боковых наклонных волн), поэтому поле в точке х = 0 выходной плоскости можно записать в виде f{x) = e^W + {im/2)eiux + (гт/2)е"Шя;, или f(x) = г A + (т/2) еШж + (т/2) е~Шж) = гA + mcosOx). Изменение фазовых соотношений между осевой и наклонными волнами иллюстрируют векторные диаграммы, показанные на рис. 8.46. Поворот век- вектора единичной длины (изображающего колебания осевой волны) на тг/2 приводит к тому, что в точке х = 0 все три изо- изображающих вектора оказываются коллинеарны- ^ \ \ ^ ^ ^ ) | ми. При смещении из начала координат изменя- изменяется фаза боковых волн. Как видно из векторных диаграмм, длина сум- суммарного вектора при смещении по координате х х=0 x=(n/2)/Q x=n/Q изменяется, что и соответствует чисто амплитуд- ной структуре, т. е. полю с плоским волновым ис. о. фронтом и меняющейся от точки к точке амплитуде. Таким образом, метод фазового контраста позволяет преобразовать исходную фазовую решетку в амплитудную решетку в плоскости изображения. Наблюдаемая картина интенсивности имеет вид I(x) = \f{x)\2 ~ (I + mcosOxJ ~ I + 2mcosOx (с самого начала, благодаря условию т < 1, членами порядка т2 и выше мы пренебрегаем). Итак, фазовые изменения входного поля fo(x) оказались визуализированы: мы наблюдаем изменения интенсивности, повторяющие изменения фазы входного поля. Обратите внимание на аналогию описанно- описанного здесь метода фазового контраста с методом преобразования колебания, модулированного по фазе, в амплитудно-модулированное колебание (т. н. прием с изменением фазы несущей, см. гл. 1.4). Читатель может самостоя- самостоятельно проанализировать «метод темного поля». В этом методе вместо фазо- фазовой пластинки в тг/2 в Фурье-плоскости на оптической оси устанавливается непрозрачный маленький экран. Осевая плоская волна, фокусируясь линзой в начало координат Фурье-плоскости, поглощается непрозрачным экраном и не участвует в формировании изображения. Боковые же волны остаются без изменения. Какова в этом случае картина интенсивности в выходной плоскости? Метод темного поля аналогичен методу, который в радиотехнике исполь- используется для преобразования фазовой модуляции в амплитудную и называет- называется «приемом без несущей». Разрешающая способность оптических систем. Всякая реальная оп- оптическая система отличается от идеальной по крайней мере одним важным
490 ГЛ. 8. ДИФРАКЦИЯ обстоятельством: ее линзы имеют конечные размеры. Учет конечных раз- размеров используемых объективов чрезвычайно важен для оценки предель- предельных возможностей оптических систем. Необходимо иметь в виду, что функ- функция пропускания линзы (8.81), о которой мы говорили ранее, правильно описывает преобразования волны линзой только в той области значений (ж, у), которые находятся в пределах «зрачка» линзы. Если диаметр линзы D, то функция (8.81) справедлива при \х2 + у2\ ^ (D/2) . Действительно, свет, проходящий «мимо» линзы, не представляет интереса, поскольку не участвует в формировании изображения. Все происходит так, как если бы идеальная бесконечная линза (функция пропускания которой описывается формулой (8.81)) задиафрагмирована непрозрачным экраном с отверстием диаметра D, оставляющим открытой центральную часть линзы. Именно та- такая модель используется обычно для расчета дифракционных эффектов, связанных с конечным размером объектива. Итак, пусть на линзу падает плоская волна, рас- распространяющаяся вдоль оптической оси. Волна из- ] л у чается удаленным источником, настолько удален- удаленным, что в пределах площади зрачка, т. е. в пре- пределах диафрагмы диаметра D (рис. 8.47), волновой фронт неотличим от плоского. Пройдя через диафрагму, волна падает на идеаль- идеальную (бесконечную) линзу. Изображенная на рисун- рисунке оптическая схема есть не что иное, как схема наблюдения дифракции Фраунгофера плоской волны на круглом отверстии диаметра D. Мы уже отмечали, что для наблюдения дифракции Фраунгофера на каком-либо пре- препятствии достаточно установить за препятствием линзу — при этом картина в фокальной плоскости линзы подобна картине, которая А?) возникает на большом расстоянии за препятствием (z ^> V Рис. 8.47 S Рис. 8.48 М) Еще раз поясним, в чем суть дела. Плоская волна, прой- пройдя через отверстие-диафрагму, уже не является плоской волной: за отверстием мы имеем непрерывный спектр плос- плоских волн (т. е. набор плоских волн разных направлений). Каждая плоская волна из этого спектра фокусируется иде- идеальной линзой в свою точку фокальной плоскости, в ре- результате мы и получаем распределение интенсивности, показанное на рис. 8.48 — дифракционное пятно (пятно Эйри), в котором концентрируется подавляющая доля светового потока, окруженное чередующимися светлыми (очень слабыми) и темными кольцами. Полуширина пятна Эйри (см. (8.43)) ?о = 1,22 \f/D. (8.89) Это и есть изображение бесконечно удаленного точечного источника: изо- изображение вовсе не точка, как следует из законов геометрической оптики, а дифракционное пятнышко, причем чем больше размер объектива Z?, тем меньше дифракционное пятно, тем больше это пятно похоже на точку. Следует подчеркнуть, что дифракционная формула (8.89) не приводит к правильному результату в пределе при D —>> оо: при увеличении D пятно не становится как угодно малым. Мы уже подчеркивали, что бегущие волны не могут образовать в сумме световое поле, которое бы резко изменялось на
8.10. ОПТИЧЕСКОЕ ИЗОБРАЖЕНИЕ И ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ 491 расстояниях порядка длины волны. Пятно, размер которого существенно меньше длины волны, получить невозможно! Поток энергии, падающий на линзу и равный /оSo, где Iq — интенсив- интенсивность волны, Sq = ttD' /4 — площадь линзы, концентрируется в маленькое пятнышко, площадь которого равна S = tt^q с± тг (А//D) . Средняя интен- интенсивность волны в пятне Эйри оказывается при этом равной / ~ IQ So/S ~ (Jo/4) D4/(\fJ. (8.90) Для линзы диаметром 1 см с фокусным расстоянием / = 10 см выигрыш от фокусировки для длины волны А = 500 нм (зеленый цвет) равен I/Iq ~ 106! В реальных линзах такой выигрыш достигается, если удается устранить аберрации, возникающие в линзах, поверхности которых имеют сферичес- сферическую (а не параболическую) форму. Дифракционная формула (8.89) с тем же успехом при- применима для оценки размера дифракционного пятна в фо- фокусе параболического зеркала диаметром D (рис. 8.49), поскольку распределение фаз колебаний в плоскости, при- примыкающей к зеркалу (после отражения плоской волны от зеркала), аналогично фазовому распределению (8.80), ко- которое обеспечивается линзой. При освещении линзы плоской нормально падающей рис g 49 волной на выходе из линзы в плоскости, примыкающей к ней справа, распределение фаз колебаний описывается формулой (8.77). Эта формула означает, что колебания в точке, отстоящей на расстояние х от оптической оси, опережают по фазе колебания в точке, расположенной на оптической оси, на величину А(р = кх2 / B/). Вспомним теперь о принципе Гюйгенса-Френеля: представим себе, что плоскость, примыкающая к линзе справа, заполнена вторичными источ- источниками, излучающими сферические волны. Легко сообразить, что колеба- колебания, созданные всеми этими вторичными источниками в точке F — главном фокусе линзы — оказываются синфазными, поскольку опережение по фа- фазе Аср(х) компенсируется отставанием, возникающим при распространении света от вторичного источника до точки F. Действительно, разность рассто- расстояний равна (R — /) = л/х2 + /2 — / — ж2/B/), а соответствующая разность фаз k(R — /) = kx2/Bf) в точности компенсирует начальную разность фаз Аср для любой точки х. Это свойство линзы называется таутохронизмом: все оптические пути (для любого луча, проходящего от источника через линзу в точку, являющуюся изображением) занимают одно и то же время. Синфазность колебаний в точке F от всех вторичных источников, запол- заполняющих плоскость z = 0+ (примыкающую к линзе справа) означает, что с помощью линзы мы выстраиваем все элементарные векторы, составляющие спираль Френеля, в ко л линеарную цепочку векторов: часть спирали Френе- Френеля, образованная зонами, уложившимися в диафрагму, как бы вытягивается в прямую линию (сравните с векторной диаграммой для зонной пластинки Френеля, рис. 8.13). Длина полувитка спирали равна ttAq, где Aq — амплитуда волны, падаю- падающей на линзу. Тогда суммарная амплитуда колебаний есть А = ттгАо, где т — число зон Френеля, укладывающихся на линзе диаметром D: D/2 = = y/mXf, откуда т = D2/DA/) и А = ttD2/DA/)Ao. Отношение интенсив-
492 ГЛ. 8. ДИФРАКЦИЯ ности света в фокусе к интенсивности падающей на линзу волны равно /До = (А/А0J = (тг2/16) Я4/(А/J. (8.91) Разумеется, интенсивность в фокусе больше, чем средняя интенсивность в пятне Эйри. Если точечный источник света находится на конечном расстоянии z\ от линзы, то дифракционное пятно Эйри возникает не в фокальной плоскости, а на расстоянии z2 за линзой, где z\ и z2 связаны формулой линзы (8.87). При этом полуширина пятна определяется формулой Со = 1,22 Xz2/D. (8.92) Это и есть изображение точечного источника. Обратимся теперь непосредственно к вопросу о разрешающей способности оптических систем. Пусть во входной плоскости (на расстоянии z\ от линзы) находятся два близко расположенных некогерентных источника света S\ и а§2. В плоскости изображения (на расстоянии z2) возникают два пятна Эйри. В силу некогерентности источников картина интенсивности в плос- плоскости изображения представляет собой сумму интенсивно- стей, созданных каждым из источников. Если расстояние ме- между центрами пятен Эйри мало (меньше их размера), то пят- пятна накладываются друг на друга. Возникает вопрос: можно ли по наблюдаемой в плоскости изображения картине ин- интенсивности сделать вывод о том, что во входной плоско- iTсти действительно имеются два источника света, а не один р r> rQ (вдвое более яркий)? Согласно критерию Релея, предельно допустимой являет- является ситуация показанная на рис. 8.50: расстояние между центрами пятен Ах в точности равно полуширине пятна Эйри: Ах = ?о = 1,22 \z2/D. При этом, как показывает расчет, в суммарной картине интенсивности между двумя максимумами возникает небольшой ~ 20% провал, по наличию которого можно визуально разрешить два источника. Смещению пятен Ах в плоскости изображения соответствует расстояние между точечными источниками во входной плоскости (на расстоянии z\ от линзы), равное I = {z\/z2) Ax. Мы получаем оценку минимального разре- разрешимого расстояния между точечными источниками Imin = l,22\z1/D. (8.93) Если вы рассматриваете с расстояния наилучшего зрения z\ — 25 см две светящиеся точки, то, принимая диаметр зрачка равным D с± 3 мм и А = 500 нм (наиболее чувствительная для глаза область спектра), получим ^min — 0,5 • 10~2 мм. Это и есть оценка минимально разрешимого расстояния для человека с нормальным зрением. При оценке возможностей любой оптической системы (в том числе гла- глаза человека) следует принимать во внимание и характеристики непосред- непосредственно регистрирующей среды: фотоэмульсии, если мы используем фото- фотопленку или фотопластинку, или чувствительных к свету элементов сетчатки человеческого глаза (палочки и колбочки), если речь идет о визуальном на- наблюдении. Любая регистрирующая среда обладает определенной дискрет- дискретностью; чувствительные элементы — зерна фотоэмульсии или палочки в
8.11. ПРИНЦИПЫ ГОЛОГРАФИИ 493 сетчатке глаза имеют конечные размеры и, что существенно, реагируют на свет (поток энергии) как целое. Это означает, в частности, что свет, фокуси- фокусируясь оптической системой в малое пятнышко, которое, быть может, много меньше размеров зерна, вызывает химическую реакцию в зерне целиком. Другими словами, минимальный размер площадки в фоточувствительной среде, реагирующий на свет, не может быть меньше размера зерна фото- фотоэмульсии. Интересно, что размер палочек в сетчатке человеческого глаза удивитель- удивительным образом согласован с размером зрачка, т. е. как раз равен размеру пят- пятна Эйри на сетчатке. Если рассматриваются удаленные объекты, то обычно говорят об угловом расстоянии а = I/ z\. Изображение рассматривается при этом в фокальной плоскости линзы (при z\ —>• оо, %2 —>• /)• Согласно (8.92), имеем: amin~l,22A/Z>. Рассматривая удаленные источники невооруженным глазом (D ~ 3 мм), получаем ат[п ~ 2 • 10~4 рад. При наблюдении удаленных источников (на- (например двух звезд) в телескоп с диаметром объектива D = 5 м, находим c^min — 1 • Ю~7 рад. Зеркальный объектив такого размера, т. е. параболиче- параболическое зеркало, используемое для фокусировки света, находится в лаборато- лаборатории Маунт-Паломар, в Кордильерах, США; на Кавказе имеется телескоп с диаметром зеркала D ~ 6 м. 8.11. Принципы голографии Мы уже отмечали ранее, что любой приемник света (глаз человека, фото- фотопластинка, фотоэлемент) реагирует на энергию световой волны, т. е. вели- величину, пропорциональную квадрату амплитуды волны. По этой причине все эти приемники объединяют общим названием — квадратичные детекто- детекторы. При таком способе регистрации волнового поля информация о фазовой структуре волны (т. е. о форме волнового фронта) оказывается как будто бы утраченной. Проблема, которую называ- называют в оптике «фазовой проблемой», состо- ит в том, чтобы по картине интенсивно- сти (квадрата амплитуды) восстановить полную информацию о волновом поле: не только распределение амплитуд колеба- ний, но также и фазовую структуру вол- ны, т. е. форму волнового фронта. Пусть некоторый предмет (пешка, изо- с< браженная на рис. 8.51) освещается когерентным светом лазера и пусть волна, отраженная предметом (будем называть ее далее предметной вол- волной), создает в плоскости z = 0 световое поле: Мх,у) = а(х,у)е^х'У1 Сейчас мы хотим подчеркнуть наиболее важное для понимания идеи го- голографии обстоятельство: задание распределения амплитуд а (ж, у) и фаз <р(ж, у) колебаний в плоскости z = 0 однозначно определяет ход волнового процесса в области z > 0. Это утверждение означает, в частности, следую- следующее: представим себе, что нам удалось воссоздать в плоскости z = 0 то же самое распределение амплитуд и фаз колебаний в отсутствии предмета.
494 ГЛ. 8. ДИФРАКЦИЯ Тогда в области z > 0 возникнет волновое поле, тождественное полю, со- созданному предметом: ни один наблюдатель, находящийся в области z > 0, не отличит это поле от поля реально присутсвующего предмета. Наблюдатель и увидит этот предмет именно там, где он находился, создавая на плоскости z = 0 поле /п(ж, у). Вопрос состоит в том, как реализовать «правильное» граничное условие? Попробуем сделать это, установив в плоскости z = О в схеме эксперимента, изображенного на рис. 8.51, фотопластинку. Пред- Предположим, что функция пропускания фотопластинки после необходимой об- обработки (проявление, закрепление) пропорциональна интенсивности волны, освещающей пластину во время экспозиции, т. е. пропорциональна величи- величине /(ж, у) = |а(ж, у)\2. Попробуем теперь, используя полученную пластин- пластинку, восстановить изображение предмета. Установим пластинку в плоскости г = 0и осветим ее слева плоской, нормально падающей волной (предмет при этом отсутствует). Пластинка, изменяя амплитуду прошедшей волны, не влияет на форму волнового фронта, поэтому в плоскости, примыкающей к ней справа, получим световое поле с плоским волновым фронтом (и раз- разной в разных точках (ж, у) амплитудой колебаний). Ясно, что полученное на выходе из пластинки (в плоскости z = 0+) граничное поле отличается от поля, которое создавалось предметной волной. Поэтому и волна в области z > 0, будет иметь мало общего с волной, возникающей при отражении от предмета — изображение не восстановится. Попробуем поступить по другому. Представим себе, что нам удалось ка- каким-то образом изготовить тонкую пластинку-транспарант толщины d, ам- амплитудная прозрачность которой меняется от точки к точке по закону а(ж, у), а набег фазы волны при прохождении пластинки есть <р(ж, у), напри- например, за счет правильно подобранного распределения показателя преломле- преломления п(ж, у): (р(х, у) = kn(x, y)d, т. е. функция пропускания пластинки есть га(ж, у) = а(ж, y)elip(x'y\ Установим эту пластинку в плоскости 2; = 0и осве- осветим ее слева плоской нормально падающей волной (никакого предмета при этом нет). Тогда на выходе из пластинки, в плоскости, примыкающей к ней справа, мы и получим поле с требуемой комплексной амплитудой fu(x, у), а в области z > 0 возникнет волна, неотличимая от волны, созданной пред- предметом. Наблюдатель, находящийся в области z > 0, который смотрит на пластинку (как в окно) увидит предмет, именно в том месте и в том положении, где он находил- находился, создавая граничное поле. Однако технологи- технологические трудности, возникающие на таком пути получения изображений, трудно преодолимы. Голография — интерференционный метод ре- У^ гистрации и последующего восстановления изоб- изображений, предложенный Габором A947 г.), позво- позволяет обойти эти трудности. Следуя идее Габора, изменим схему эксперимента, изображенного на рис. 8.51. На фотопластинку, установленную в плоскости z = 0 (рис. 8.52), теперь падают две волны: предметная волна, создающая на фотопластин- фотопластинке поле /п(ж, у), и опорная волна с известным распределением амплитуд и фаз колебаний /о(ж, у). При этом необходимо обеспечить когерентность предметной и опорной волны — волны должны интерферировать. Напри- Например, как показано на рис. 8.52: излучение лазера частично проходит через / опорная волна предметная волна Рис. 8.52
8.11. ПРИНЦИПЫ ГОЛОГРАФИИ 495 полупрозрачную пластинку Л, освещая предмет, а частично отражается от нее, создавая опорный пучок. Когерентность предметной и опорной волны обеспечивается высокой степенью монохроматичности лазерного излучения (разность хода между предметной и опорной волной меньше длины когерент- когерентности для любой точки фотопластинки). Суммарное поле на голограмме /(я, У) = /п(ж, у) + /о(ж, у), а интенсивность (а следовательно, и функция пропускания фотопластинки после необходимой обработки) есть га (ж, у) ~ /(ж, у) = |/п(ж, у) + /о (ж, у)|2. Фотопластинка с зарегистрированным на ней результатом интерференции предметной и опорной волны называются голограммой. Для уяснения сути метода рассмотрим в качестве предмета точечный ис- источник света S, т. е. создадим сферическую предметную волну. В качестве опорной волны возьмем плоскую волну, бегущую вдоль оси z и падающую нормально на фотопластинку, расположенную в плоскости z = 0 (рис. 8.53): fo = aeikz, т. е. опорная волна создает во всех точках фотопластинки поле одинаковой амплитуды. Принимая фазу колебаний в плоско- плоскости z = 0 равной нулю, запишем /о = а. Поле предметной волны есть аоег/сг/г, где г = л/^q + х2 + у2 — ( ) Рис. 8.53 расстоя- расстоя/ /q ние от источника S до точки (ж, у) фотопластинки. Для упрощения формул будем далее полагать, что амплитуда сферической волны во всех точках фо- фотопластинки равна амплитуде плоской волны. Тогда /п с± ае , суммарное поле есть / = ае гкг а. После необходимой фотообработки получаем голограмму с функцией про- пропускания га(ж, у) , у) = а + ae i/cr (8.94) действительное изображение изображение Мы описали первую стадию голографического процесса — процесс записи голограммы. Теперь необходимо использовать полученную голограм- голограмму для восстановления (реконструкции) изобра- Рис. 8.54 жения. Устанавливаем голограмму в плоскости z = 0 л освещаем ее плоской нор- нормально падающей волной (рис. 8.54). Для упрощения формул будем считать амплитуду волны равной единице, а фазу без ограничения общности равной нулю, т. е. комплексная амплитуда этой волны (ее называют восстанавли- восстанавливающей волной) есть /_(ж, у) = 1. Тогда на выходе голограммы, в плоскости, примыкающей к ней справа, получим: > У) = f-(x, , У) = а + ае гкг (8.95)
496 ГЛ. 8. ДИФРАКЦИЯ Итак, суммарное поле за голограммой описывается действительно поло- положительной функцией. Исследуем его более детально. Из (8.95) находим /+(ж, у) = 2а2 + a2eikr + a2e~ikr. (8.96) Поле в плоскости z = 0+ представляется в виде суммы трех слагаемых. Со- Соответственно, волна в области z > 0 есть сумма трех волн: каждое слагаемое на границе z = 0+ ответственно за появление «своей» волны в области z > 0. Первое слагаемое 2а2 «отвечает» за появление волны Д = 2a2elkz — плоской волны, бегущей в области z > 0 вдоль оси z. Второе слагаемое /2 = a2eikr — волновое поле со сферическим волновым фронтом: именно такое поле создавал в каждой точке плоскости z = 0 точечный источник света, который находился на расстоянии zq слева от голограммы в процессе записи. Ясно, что и в области z > 0 поле /2 порождает расходящуюся сфе- сферическую волну, неотличимую от предметной волны (сферической волны, исходящей из точки S в процессе записи голограммы). Поэтому наблюда- наблюдатель, который находится справа (в области z > 0) и смотрит на голограм- голограмму как в окошко, «увидит в окне», на расстоянии zq слева от голограммы, светящуюся точку Sf, т. е. расходящаяся сферически волна кажется наблю- наблюдателю исходящей из точки S", хотя никакой светящейся точки на стадии реконструкции изображения нет — есть только фотопластинка-голограмма, освещаемая плоской волной. Это — мнимое изображение предмета. Рассмо- Рассмотрим теперь последнее, третье слагаемое в (8.96): /з = а2е~гкг. Волновой фронт в этой волне «вывернут наизнанку» по отношению к вол- волне Д: если в волне /2 колебание в точке (ж, у) плоскости z = 0 отстает по фазе от колебаний в начале координат, то в волне /з колебание в точке (ж, у) опережает по фазе колебание в начале координат на ту же величину. Это слагаемое описывает поле, которое создавала бы в плоскости z = 0 сфериче- сферическая волна, сходящаяся в точку S" на расстоянии zq справа (рис. 8.54). Ясно поэтому, что граничное поле /з, возникающее в процессе реконструкции, по- порождает сферическую волну, сходящуюся в точку Sf/. Это — действительное изображение предмета. Его можно наблюдать, расположив на расстоянии zq за голограммой экран наблюдения — мы увидим яркую точку, в которую сфокусирована волна. Описанные закономерности сохраняются в общих чертах при голографи- голографировании произвольного предмета: в процессе реконструкции возникают три волны: волна создающая мнимое изображение, которое находится слева от голограммы, там же, где находился предмет при записи; волна, создающая действительное изображение, которое располагается симметрично справа от голограммы; а также волна, бегущая вдоль оси ? и не несущая информации о форме волнового фронта предметной волны. Вернемся к интерференционной картине (8.95), которая записана на голо- голограмме точечного источника. Как она выглядит? Функцию (8.96) можно переписать в виде /(ж, у) = а2\1 + eikr\2 = 2а2A + cos кг). Используем приближенное выражение г ~ y/z^ + х2 + у2 с± zq + х ^у — = zq + p2/2zo, где р2 = ух2 + у2 — расстояние от начала координат до точки (ж, у) в плоскости фотопластинки. Соответственно, фаза колебаний в
8.12. РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ ГОЛОГРАММЫ 497 сферической волне в точке (ж, у) есть (р = кг = kzo + k/Bzo)p2. Принимая начальную фазу на оси z в плоскости z = 0 нулевой, запишем ср = k/Bzo)p2. Мы полагаем таким образом, что колебания опорной (плоской) волны и сфе- сферической волны в точке (х = 0, у = 0) синфазны. Тогда получим J(/o) = 2а2 A + cos ^f- (8.97) Мы видим, что интерференционная картина имеет вид колец, центр ко- которых находится в начале координат. Функция 1{р) показана на рис. 8.55. Радиус первого (темного) кольца р\ находим из усло- условия kpl/Bzo) = тг (при этом cos(kpl/2zo) = — 1 и 1{р\) = 0) откуда получаем: р\ = \[\z§. Вообще радиусы светлых и темных колец находятся по формуле Рт = (при т нечетном — темные кольца, при т четном — светлые), которая совпадает с выражением, определя- определяющим радиусы темных и светлых колец в зонной пла- пластинке Френеля. Отличие состоит в том, что в нашем 0 Pi P2 РЗ Рис. 8.55 случае переход от светлых колец к темным происходит плавно. Интерфе- о Рис. 8.56 у р р рф ренционная картина (8.96) (голограмма точечного источника) показана на рис. 8.56 и называется зонной решеткой Габора. Как следует из проведен- проведенного выше анализа, зонная пластинка Габора работает одновременно и как собирающая линза (фокусируя параллельный пучок света в точку S" — действительный фокус зонной пластинки), и как рассеивающая линза, которая преобразует параллельный пу- пучок, падающий на пластинку, в расходящуюся сферическую волну, исходящую из мнимого фокуса Sf, и как плоскопа- плоскопараллельная пластинка, поскольку часть света за пластинкой сохраняет структуру освещающего параллельного пучка. В случае произвольного предмета на голограмме записы- записывается сложный интерференционный узор, который можно рассматривать как совокупность зонных кольцевых решеток Габора, причем каждая из них ответственна за восстановление «своей» точки предмета на стадии рекон- реконструкции изображения. 8.12. Разрешающая способность голограммы Рассмотрим более детально волну, ответственную за создание действите- действительного изображения. Конечно, сходящаяся сферическая волна не фокусиру- фокусируется строго в точку Sf: изображением является не точка, а маленькое диф- дифракционное пятнышко. Действительно, плоская восстанавливающая волна, пройдя сквозь голограмму, преобразуется в сферическую волну (мы говорим сейчас о той части волны, которая ответственна за создание действительного изображения), причем сферический волновой фронт ограничен размерами голограммы. Эта сходящаяся сферическая волна ничем не отличается от сферической волны, возникающей за собирающейся линзой, размер D кото- которой равен размеру голограммы. При фокусировке света линзой возникает дифракционное пятно (пятно Эйри), размер которого определяется форму- формулой (8.92). Ясно, что и голограмма создает изображение — дифракционное
498 ГЛ. 8. ДИФРАКЦИЯ пятно, размер которого определяется аналогичной формулой: Ах ~ Xzo/D, (8.98) где zq — расстояние от точечного источника до голограммы в процессе запи- записи, D — размер голограммы. Если записывать на голограмму изображения двух точек, расстояние между которыми меньше Дж, то при восстановлении изображений возникают два пятна, налагающиеся друг на друга так, что, согласно критерию Релея, они оказываются неразрешимыми. Сказанное ка- касается, разумеется, и мнимого изображения точечного источника: наблю- наблюдателю оно кажется маленьким пятнышком размера Дж, находящимся на расстоянии zq за голограммой. Ограничения на разрешающую способность голограммы могут быть свя- связаны также с зернистостью регистрирующей среды. Для того чтобы оцен- оценка (8.98) была справедлива, необходимо, чтобы размер зерна фоторегистри- рующей среды был меньше мельчайшего размера интерференционных по- полос на голограмме, возникающих при интерференции предметной и опорной волны. Вернемся к примеру, рассмотренному выше — голограмме точечного ис- источника. Оценим минимальное расстояние между интерференционными ко- кольцами в зонной пластинке Габора диаметра D (это расстояние уменьшается от центра голограммы к краю). Пусть кольцо, примыкающее к краю голо- голограммы, имеет порядок га. Тогда rm = D/2 = \fmXz, откуда га = D2/(AXz). Минимальное расстояние между кольцами Аг = гт — rm-i = = VmXz A — ~ (D/2) [1 - A - 1/Bт))] = D/Dm), — 1/га] ~ мы полагаем га 3> 1. Итак Ar ~ D/Dra) = (D/4) 4A^/D2 = Xz/D. Итак, чтобы полностью использовать разрешающую способность голограммы раз- размера D, необходимо использовать фоторегистрирующую среду с размером зерна ?3, определяемым условием 53 ^ Xz/D. 8.13. Схема с наклонным опорным пучком При наблюдении голографических изображений, полученных по схеме Га- бора, действительное и мнимое изображения создают взаимные помехи: изображения S' и S" находятся на одной прямой с точ- точкой, в которой расположен глаз наблюдателя (рис. 8.54). Помехи создаются также возникающей при восстановле- восстановлении плоской волной, бегущей вдоль оси z и не несущей информации об объекте. В 1962 году Лейт и Упатниекс предложили использовать для записи голограммы на- наклонный опорный пучок. Проследим, каким образом введение опорного наклон- наклонного пучка обеспечивает возможность независимого (без взаимных помех) наблюдения действительного и мнимо- мнимого изображений. На рис. 8.57 «предметом» является «точечный источник» S. Наклон опорного пучка обеспечивается призмой П. Поле предметной волны на голограмме есть /п(ж, у) = аег '^ Z°AX +у ) (мы вновь используем пара- Рис. 8.57
8.14. ОБЪЕМНАЯ ГОЛОГРАММА 499 болическое приближение). Наклонная опорная волна имеет вид /о = аеш°ж, где щ = к sin a — пространственная частота опор ной волны. Мы полагаем, что волны имеют равные амплитуды и создают в начале координат плоскости ж, у (плоскость голограммы) синфазные коле- колебания. Функция пропускания проявленной голограммы, пропорциональная интенсивности суммарной волны при записи, имеет вид га ( , у) ае ,iuox Предоставляем читателю убедиться, что слагаемые, ответственные за по- появление действительного и мнимого изображения при восстановлении, мож- можно представить в виде: be-ik/Bzo)((x+zo sin aJ +у2) , У) , у) где Ь = a^elZQ^2k^u^ — комплексная константа. Выражение /з(ж, у) предста- представляет собой поле, которое создавал бы в плоскости z = 0 точечный источник, находящийся в точке с координатами xq = — ZQsma, у = 0, на расстоянии zq слева от голограммы. Это мнимое изображение предмета Sf (рис. 8.58). Соответственно, /4(ж, у) описывает поле схо- сходящейся в точку S" сферической волны. Эта точка находится справа от голограммы на расстоянии zq и смещена относительно оси z на расстояние xq = —zq sin а. Это — действи- действительное изображение. Мы видим, что введе- введение наклонного опорного пучка приводит к сдвигу мнимого и действительного изображе- изображения таким образом, что наблюдатель может рассматривать их из разных положений A и 2 на рис. 8.58) в которых они не создают вза- взаР Рис. 8.58 ) имных помех. Разумеется, угол наклона опорного пучка а (т. е. его простран- пространственная частота) должен быть выбран правильно: чем шире пространствен- пространственный спектр предметной волны, тем больше должен быть угол наклона опор- опорного пучка, при котором волны, ответственные за создание действительного и мнимого изображений, не создают взаимных помех. 8.14. Объемная голограмма То, что мы рассматривали до сих пор, называется тонкой голограммой. Тонкой потому, что интерференция предметной и опорной волны регистри- регистрируется в тонком слое регистрирующей среды-фотоэмульсии. Рассмотрим те- теперь, какие возможности открывает объемная регистрирующая среда. Чтобы понять, когда и почему начинает играть роль третье измерение — толщина фоторегистрирующей среды, — посмотрим, каков результат ин- интерференции двух плоских волн, если рассматривать его не только на плос- плоскости z = const, но и по толщине, вдоль оси z. Итак, пусть в фотоэмульсии распространяются две волны. Заметим, что до фотообработки (проявления) фотоэмульсия прозрачна. Одну из волн, бегущую вдоль оси z, /о = aelkz бу- будем считать опорной, а вторую fn = аег(кх8та+кгС08а) ? волновой вектор ко- которой составляет угол а с осью z — предметной волной (при этом мы имеем
500 ГЛ. 8. ДИФРАКЦИЯ в виду, что любую предметную волну можно представить в виде суперпози- суперпозиции плоских волн разных направлений а). Легко найти интенсивность сум- суммарной волны /(ж, z) = |/о + /п|2 = 4а2 cos2 (kx(sma)/2 — kz(l — cosa)/2). Максимумы интенсивности располагаются вдоль плоскостей х sin а — z(l — cos a) = тгга (га — целое число). При этом /(ж, z)=4a2. Эти плоскости составляют с осью z угол /3, равный tg /3 = A — cos a)/ sin a = tg(a/2), т. е. C = а/2: плоскости интерференцион- интерференционных максимумов располагаются по биссектрисе угла между направлениями волн /о и fn (рис. 8.59). В любой плоскости z = const волны сходятся под одним и тем же углом а, поэтому и ширина полосы / в любой фиксирован- фиксированной плоскости z = const одна и та же и равна / = A/ sin a. Расстояние между плоскостями интерференционных максимумов d = / cos /3 = А/ Bsin(a/2)) . (8.99) При переходе от одной плоскости z = const к другой происходит сдвиг интерференционных полос. Сдвиг на ширину полосы происходит при рас- расстоянии Az между сечениями z = const, равным Az = h0 = l/tg/3 = A/(l -cosa). Перемещаясь вдоль оси z на расстояние /го/2, мы перейдем из максимума в минимум. В максимумах, где интенсивность суммарной волны велика, велико хи- химическое воздействие света на среду, в минимумах воздействие света мало. Будем полагать, что плоскости, где интенсивность света велика, становятся после обработки подобны- подобными частично отражающим свет зеркалам. Плоскости, где интенсивность близка к нулю, после обработки полностью прозрачны. Итак, в результате обработки в фотоэмульсии образуется набор «зеркал», частич- частично отражающих, а частично прозрачных для света. Период d этой объемной решетки зеркал определяет- определяется формулой (8.99). Фотообработка проэкспонированной голограммы может производиться и таким образом, что от интен- интенсивности света при экспозиции будет зависеть не отражающая способность слоев фотоэмульсии, а их оптическая плотность (коэффициент преломле- преломления п). В этом случае объемная решетка оказывается фазовой. Толщина h фоторегистрирующей среды никак не будет проявляться, если она заметно меньше величины ho/2: ведь в этом случае тонкий луч света, проходя через среду, не будет пересекать слои различной прозрачности. Та- Такая голограмма аналогична тонкому экрану. Наоборот, при толщине, много большей /го, луч света, бегущий вдоль оси z, много раз пересекает слои раз- разной прозрачности, частично проходя сквозь каждый слой — зеркало, а ча- частично отражаясь от него. Итак, эффект объемности фоторегистрирующей среды проявляется, если ее толщина h превышает величину ho: h>h0 = A/(l-cosa). (8.100) Из последнего условия ясно, что один и тот же слой фотоэмульсии можно считать тонким или толстым, в зависимости от того, как организован экс- эксперимент. Если волны сходятся под малым углом а, то /iq — 2A/a2 велико, Рис. 8.59
8.14. ОБЪЕМНАЯ ГОЛОГРАММА 501 лазера предмет - l толщина данного фотослоя оказывается много меньше ho и голограмма по- получается тонкой. Именно так записывается голограмма по методу Габора или Лейта-Упатниекса. Голографические фотослои имеют толщину от нескольких микрон (~ 10~4 см) до нескольких десятков микрон (~ 10~3 см) (длина волны зеле- зеленого цвета А ~ 0,5 мкм). В схеме Лейта-Упатниекса углы схождения волн порядка и меньше ОД радиана, поэтому параметр ho имеет величину по- порядка и более 100 мкм, т. е. h < ho — условие (8.100) не выполняется. Как уменьшить параметр /iq? Кардинальный способ — осветить слой фотоэмуль- фотоэмульсии с разных сторон. Тогда угол а приближается к тг, а величина ho — к А/2. При этом на той же толщине фотоэмульсии укладывается много зеркаль- зеркальных слоев, возникающих после обработки. То есть восстанавливающая вол- волна, бегущая на стадии реконструкции (восстановления) изображения вдоль оси z, испытывает много отражений от этих слоев, образующих объемную решетку. Схема получения объемной голограммы, предложенная русским ученым Ю. Н. Денисюком, показана на рис. 8.60. Излучение направляется на фото- фотопластинку, за которой расположен гологра- голографируемый объект. Свет свободно проходит сквозь прозрачную фотоэмульсию, отражает- отражается от предмета и вновь проходит через слой фотоэмульсии. Прямой лазерный пучок, проходящий через фотоэмульсию слева на- направо — это опорная волна, а отраженный от предмета и идущий ему навстречу — это пред- предметная волна. Схема Денисюка так и называется — схемой во встречных пучках. Углы схождения волн в этой схеме близки к тг, что и обеспечивает выполнение условия (8.100). Рассмотрим подробнее процесс восстановления изображения объемной го- голограммы, вернувшись к простому примеру, когда предметной волной явля- является плоская волна, составляющая угол а с осью z, а опорной — плоская волна, бегущая вдоль оси z. Итак, пусть восстанавливающая волна — плос- плоская волна, бегущая вдоль оси z, падает на го- голограмму, которая (напомним) представляет со- собой объемную решетку, состоящую из большого числа частично отражающих зеркальных слоев, составляющих угол /3 с осью z (рис. 8.61). Вос- Восстанавливающая волна частично отражается от зеркального слоя, а частично проходит сквозь не- него, встречает следующий слой и снова частично отражаясь, проходит далее и т. д. Так возникает большое количество отраженных волн 1, 2, 3, регистрирующая среда Рис. 8.60 В С Рис. 8.61 и т. д. (три зеркальных слоя АА1', В В1', СС показаны на рис. 8.61). Обратим внимание на то, что отражается восстанавливающая волна в направлении, точно совпадающим с направлением предметной волны, которая падала на голограмму в про- процессе записи (ее интерференция с опорной волной и образовала эту систему зеркальных слоев), поскольку угол падения на зеркало равен углу отраже-
502 ГЛ. 8. ДИФРАКЦИЯ ния. Существенно при этом, что волны 1, 2, 3, ... , отраженные разными «зеркалами», интерферируют. Каков результат интерференции? Найдем разность хода волн, отраженных от двух соседних зеркал АА' и ВВ' (расстояние d между слоями — период объемной решетки — опре- определяется формулой (8.99)). Волна 2, отраженная от зеркала В В1', прохо- проходит оптический путь МО + ON', в то время как волна 1, отраженная от зеркала АА1', проходит путь МТ. Если точки N и Т лежат в одной плос- плоскости, перпендикулярной направлениям отраженных волн (т. е. на одной волновой поверхности), то это означает, что колебания в плоскости 7VT, созданные волнами 1 и 2, синфазны, а значит разность оптических путей {МО + NT) — МТ равна длине волны А7, используемой при восстановления изображения: (МО + NT) — МТ = А7. Легко убедится, что последнее условие можно записать в виде 2dsin/3 = А7. (8.101) Это — условие интерференционного отражения волны объемной решеткой с периодом с/, где /3 — угол скольжения (угол между падающей волной и плоскостями решетки). Оно называется условием Брэгга-Вульфа. Если дли- длина восстановливающей волны А7 такова, что выполняется условие Брэгга- Вульфа, то волны, отраженные от разных зеркальных слоев решетки, ока- оказываются синфазными — возникает сильное отражение — восстанавлива- восстанавливается предметная волна. Вспомнив, что период d решетки определяется фор- формулой (8.99), а C = а/2, находим: сильное интерференционное отражение возникает лишь на длине волны А7, совпадающей с длиной волны А, исполь- используемой при записи голограммы. Мы видим, что объемная голограмма обла- обладает спектральной избирательностью — она «запоминает» цвет — длину волны света, с помощью которого записывается голограмма. Если восста- восстанавливать голограмму белым светом, то объемная решетка «выбирает» из белого света лишь ту спектральную компоненту, которая использована при записи. Это свойство объемной голограммы используется для записи голо- голограмм художественных произведений: при этом добиваются великолепной цветопередачи при восстановлении изображения белым светом. Отметим еще одно важное свойство голограммы: при большом числе отражающих зеркальных слоев, составляющих объемную решетку, интенсивность восста- восстановленной волны оказывается близкой к интенсивности волны, падающей на голограмму при реконструкции изображения; другими словами, практи- практически весь световой поток преобразуется объемной голограммой в волну, образующую единственное мнимое изображение. 8.15. Чем отличается голографическое изображение от фотографии При фотографировании каждая точка предмета рассеивает сферическую волну, которая с помощью объектива фотоаппарата фокусируется в неболь- небольшое пятнышко на фотопластине. Так как отражательная способность раз- разных точек объекта различна, то различна и интенсивность света, падающе- падающего на разные участки фотопластинки. Почернение разных участков фото- фотопластинки после фотообработки (которое пропорционально интенсивности), повторяет распределение яркости на предмете — мы получаем негативное изображение.
ВОПРОСЫ И ЗАДАЧИ 503 Отметим три особенности фотографического изображения. Во-первых, на фотопластинке фиксируется лишь распределение интенсивности и, следова- следовательно, фотоизображение содержит неполную информацию о предмете (нет распределения фаз и в частности, нет рельефа предмета). Во-вторых, на ка- каждом небольшом участке фотопластинки получается изображение лишь не- небольшого («сопряженного») участка предмета. В-третьих, трехмерные объ- объекты регистрируются в виде плоских двумерных изображений. Голограмма, как мы видели, сохраняет полную информацию об объекте: возникающий на ней интерференционный узор зависит как от амплитуды, так и от фазы предметной волны. Наблюдатель, который при восстановлении смотрит сквозь голограмму (как в окно), видит как бы реальный предмет; так, изменяя положение, наблюдатель может увидеть те детали объекта, которые не были видны (затенены другими деталями) ранее — голографическое изображение трех- трехмерно. Важнейшее свойство голограммы состоит в том, что любой ее малый участок содержит информацию обо всем объекте: ведь поле в каждой точ- точке голограммы является суперпозицией полей, посылаемых всеми точками предмета (и опорной волной). Другими словами, интерференционная картина на каждом небольшом участке голограммы содержит информацию об амплитуде и фазе колеба- колебаний всех точек предмета, поэтому изображение может быть восстановлено с помощью небольшого осколка голограммы, полученной при записи. Разу- Разумеется, разрешающая способность определяется размером осколка. Вопросы и задачи 1. Найти спектр плоских волн за синусоидальной решеткой с амплитудным коэффици- коэффициентом пропускания т(х) = l-\-acosQx (a < 1), освещаемой нормально падающей плоской волной. 2. Плоский монохромотический пучок света с длиной волны Л дифрагирует на двух последовательно расположенных синусоидальных решетках с амплитудным коэффициен- коэффициентом пропускания mi (ж) = rri2(x) = 1/2 A + cosQx). При смещении одной из решеток вдоль оси z со скоростью v интенсивность нулевого дифракционного максимума периодически изменяется. Определить частоту ш этих изменений, а также отношение максимальной и минимальной интенсивностей. 3. Диск из стекла с показателем преломления п закрывает полторы зоны Френеля для точки наблюдения Р. При какой толщине диска освещенность в точке Р максимальна? Ответ: h = Bm + 5/4)/B(n - 1)) Л (m = 0, 1, ... ). 4. Какова интенсивность волны в центре картины дифракции на круглом непрозрач- непрозрачном экране, если он закрывает 1) одну зону Френеля, 2) две зоны Френеля, 3) 4,5 зоны Френеля? 5. Показать, что если точечный источник света находится на расстоянии а от непро- непрозрачного экрана с отверстием, а точка наблюдения — на расстоянии Ъ от него, то радиус m-й зоны Френеля определяется формулой рт = ^т\аЪ/(а + Ь). 6. Точечный источник света и точка наблюдения Р расположены симметрично на рас- расстоянии 2L друг от друга на оси круглого отверстия в непрозрачном экране. Отверстие оставляет открытой одну зону Френеля. Во сколько раз изменится интенсивность света в точке Р, если к отверстию без нарушения осевой симметрии приложить тонкую линзу с фокусным расстоянием / = L.
504 ГЛ. 8. ДИФРАКЦИЯ 7. Оценить, с какого расстояния L можно увидеть раздельно свет от двух фар автомо- автомобиля. 8. Коллиматорная щель S, освещаемая источником света, находится в фокусе линзы с фокусным расстоянием / = 20 см. Пройдя через линзу, свет падает на дифракционную решетку с числом штрихов N = 1000 и периодом d = 0,001 см. Какова должна быть шири- ширина коллиматорной щели, чтобы была полностью использована разрешающая способность решетки в окрестности длины волны Л = 500 нм? 9. С помощью интерферометра Фабри-Перо исследуется выделенный системой филь- фильтров участок спектра шириной АЛ = 1,2 нм. Минимальная разность длин волн соседних спектральных линий АЛ = 0,001 нм. Оценить максимальное значение коэффециента про- пропускания зеркал, при котором можно исследовать этот участок спекта. 10. Два пучка белого света, полученные от одного точечного источника, сходятся на входной щели регистрирующего спектрального прибора. Разность хода равна А = 300 м. Оценить разрешающую способность R спектрального прибора, который может обнаружить интерференцию этих пучков. Ответ: R^ А/Л ~ 5 • 108. 11. Линза с фокусным расстоянием / = 50 см и диаметром D = 5 см освещается па- параллельным пучком света (Л = 630 нм). Во сколько раз интенсивность волны / в фокусе линзы больше интенсивности /о падающей на линзу волны? Оценить размер пятна в фо- фокальной плоскости линзы. 12. Камера с малым отверстием глубиной L = 10 см предназначена для фотографи- фотографирования удаленных объектов. Оценить диаметр отверстия, при котором она имеет макси- максимальную разрешающую способность, Л = 500 нм. 13. При аэрофотосъемке местности используется объектов с фокусным расстоянием f = Ю см и диаметром D = 5 см. Съемка производится на фотопленку, имеющую раз- разрешающую способность R = 100 мм. Определить, какие детали местности могут быть разрешены на фотографиях, если съемка производится с высоты h = 10 км. 14. Оценить расстояние L, с которого можно увидеть невооруженным глазом свет лазе- лазера, генерирующего в непрерывном режиме мощность Р = 10 Вт на частоте v = 4 • 10 Гц, если для формирования луча используется параболическое зеркало диаметром D = 50 см. Глаз видит источник в зеленой части спектра, если в зрачок (диаметра d = 5 мм) попадает п = 60 квантов в секунду.
ГЛАВА 9 ДИСПЕРСИЯ ВОЛН 9.1. Фазовая и групповая скорость. Формула Релея Приступая к изучению волновых процессов, мы ввели понятие фазовой скорости волны — скорости, с которой перемещаются волновые поверхно- поверхности (поверхности с фиксированным значением фазы колебаний). Это поня- понятие применимо к монохроматической волне с заданной частотой о;, бесконеч- бесконечно протяженной в пространстве и во времени. Реальный волновой процесс всегда ограничен во времени, а это означает, что он представляется супер- суперпозицией волн различных частот ио. При этом различные гармонические составляющие суммарного волнового процесса могут иметь разные фазовые скорости. Наблюдаемая зависимость фазовой скорости от частоты называется дис- дисперсией. Среда, в которой возникает дисперсия, называется диспергирую- диспергирующей средой. Зависимость v = v(uj) называют законом дисперсии. Часто закон дисперсии среды задают в виде зависимости волнового числа к от часто- частоты к(ш) = u)/v(ui) или зависимости показателя преломления от частоты n(uj) = c/v(<jo). Для описания процесса распространения волн в диспергиру- диспергирующей среде возникает необходимость ввести новую характеристику, назы- называемую групповой скоростью. Поясним физический смысл этого понятия на следующем примере. Пусть некоторый излучатель является источником сигнала /(?) = а^)егш°г (пусть, например, эта функция описывает изменение электрического поля вблизи излучателя), где с^о — частота несущего колебания, a(t) — закон модуляции, который и содержит передаваемое сообщение. Возникшая при этом электро- электромагнитная волна начинает распространяться в диспергирующей среде и че- через некоторое время достигнет приемной антенны, находящейся на рассто- расстоянии z от излучателя. Будем считать, что сигнал имеет конечную длитель- f a@ \em° f/@ ность т, причем на протяжении боль- большого числа периодов несущего коле- колебания 2тг/ш() функция a(t) остается практически неизменной, т. е. харак- характерное время ее изменения т много больше периода несущей: т ^> 2tt/u;q. На рис. 9.1 в показан пример сиг- сигнала /(?), который представляет собой произведение медленно меняющейся «огибающей» a(t) длительности т — функции, равной тождественно нулю вне интервала времени т, большим по сравнению с периодом несущего ко- колебания т ^> 2тг/с^о (рис. 9.1 а) и быстро осциллирующей гармонической Рис. 9.1
506 ГЛ. 9. ДИСПЕРСИЯ ВОЛН функции elujQt. Разумеется, на графике рис. 9.1 б'показана Re eluJot т.е. ко- косинусоида. Представим закон модуляции a(t) в виде суммы гармонических колебаний различных частот О a(t) = f A(tt)eiQtdtt, (9.1) где A(Q) — спектр (преобразование Фурье) функции а(?), показанно на рис. 9.2 а. Поскольку изменения функции a(t) медленные в масштабе периода несу- несущей, ширина ее спектра А (О), равная согласно соотношению неопределенно- неопределенности АО с± 2тг/т, много меньше частоты несущей: АО <С ujq. Используя (9.1), можно записать: О (9.2) или, после замены переменной ш = ujq + О f(t) = — шг\)е Aut (9.3) Сравнивая последнее равенство с выражением, связывающим функцию f(t) с ее спектром F(u): Л Q AQ a f(t) Г = J находим Рис. 9.2 т. е. спектр сигнала f(t) можно получить из спектра «огибающей» а(?), перенося по- последний по оси частот на величину с^о, как показано на рис. 9.2 б. Каждой гармонической составляющей «огибающей» а(?), имеющей низкую частоту О, соответствует гармоническая составляющая сигнала /(?) высокой частоты ш = с^о + О, причем ujq ^> О, по- поскольку все низкие частоты О, составляющие огибающую а(?), лежат внутри полосы частот АО: |О| < АО. Условие АО <^ uq есть условие квазимонохро- квазимонохроматичности сигнала f(t). Каждая гармоническая составляющая сигнала /(?), имеющая согласно (9.1) вид А(О)ег^0+п^ порождает в среде монохроматический волновой про- процесс вида где волновое число к соответствует частоте с^о + ^Л т. е. к = k(cjQ-\-ft). Мы по- полагаем для простоты, что возникает плоское волновое возмущение, бегущее вдоль оси z по направлению к приемной антенне. Суммарный волновой процесс, созданный в среде всеми гармоническими составляющими, частоты которых лежат в пределах узкой полосы частот АО (вблизи несущей частоты cjq), есть ж *: = f A(Q)t ,i((ujo+n)t-k(ujo+n)z) (9.4)
9.1. ФАЗОВАЯ И ГРУППОВАЯ СКОРОСТЬ. ФОРМУЛА РЕЛЕЯ 507 Такую группу волн принято называть волновым пакетом. Что происходит с волновым пакетом по мере распространения в диспергирующей среде, че- через какое время этот пакет достигнет приемной антенны, каковы колебания поля вблизи приемной антенны? Пусть закон дисперсии среды задан в виде к = к(ш) (рис. 9.3). Рассмо- Рассмотрим простейшую ситуацию. Пусть для всех частот о;, лежащих внутри спек- спектральной полосы сигнала \ш—ujq\ < АО, кривая дисперсии мало отклоняется от касательной, проведенной в точке с^о, т. е. дисперсион- дисперсионную зависимость на этом интервале частот можно заме- заменить приближенно линейной зависимостью к(ш) = к(шо + О) ~ k(wo) + (dk/duj)UQ О. (9.5) На графике рис. 9.3 производная (dk/duj)LJo определя- определяет тангенс угла наклона касательной: ig/3 = (dk/duj)LJo. Введем обозначение к(шо) = &о, т. е. ко — волновое чи- число, соответствующее монохроматической волне часто- ^^AQ- ты с^о- Напомним, что фазовая скорость этой волны есть п. , . / L, .гИС. с).о Используя (9.5), запишем показатель экспоненты в (9.4) в виде (с^о + Q)t — k(u)Q -\- ?i)z — (c^ot — kQz) -\- O(t — zdk/du)). Далее, экспоненциальный множитель ^(^ot-koz) ^ не зависЯщИй От перемен- переменной cj, можно вынести из под знака интеграла. Мы получаем z) = Запишем окончательно, учитывая соотношение (9.1): /(t, z)=a(t -zdk/du;) е*("°*-*°*). Полученный нами результат означает следующее: волновой пакет, форма которого задается «огибающей» а(?), распространяется в среде без искаже- искажения и на расстоянии z от излучателя воспроизводит закон модуляции a(t) с запаздыванием по времени At, равным At = zdk/dcu. Из последнего равенства находим скорость волнового пакета и = z/At = dco/dk. В общем случае зависимости частоты от трехмерного вектора к, получается, соответ- соответственно, и = дио/д\т. Иллюстрацией являет- являет4 Рис. 9.4 / ся рис. 9.4, на котором показано положение волнового пакета вблизи излу- излучателя (к моменту времени, когда излучение закончилось) и его положение через время At: волновой пакет сместился на расстояние z = uAt почти без изменения своей формы. Скорость движения волнового пакета как целого называется групповой скоростью. Заметим, что угол наклона касательной C на рис. 9.3 ctg/3 = l/{dk/du) = = duo/dk = и отличается от угла а, определяющего фазовую скорость мо- монохроматической волны частоты cjq- ctga = шо/ko = v, т. е. групповая ско- скорость — скорость, с которой переносится сигнал, отличается, вообще говоря,
508 ГЛ. 9. ДИСПЕРСИЯ ВОЛН от фазовой скорости «несущей волны» ег(^-ког) ^ Поскольку волновой пакет не искажается (не «деформируется») в процессе движения, для определе- определения групповой скорости можно следить за движением любой точки волно- волнового пакета, например, за движением максимума огибающей (точкой А на рис. 9.4), т. е. максимума амплитуды, либо точкой В — локального макси- максимума амплитуды, либо любой другой точкой волнового пакета. Согласно современным представлениям, универсальная физическая кон- константа с, равная скорости света в вакууме, определяет предельную скорость распространения любых сигналов. В частности, групповая скорость любого пакета, какова бы ни была его форма, в какой бы среде он ни распространял- распространялся, какова бы ни была физическая природа волны, не может превосходить скорость света в вакууме. Что касается фазовой скорости, то она может быть любой, как больше, так и меньше скорости света в вакууме, поскольку скорость перемещения волнового фронта идеальной, бесконечно длящейся синусоидальной волны не связана с переносом какой-либо энергии или пе- передачей информации. Найдем связь между фазовой и групповой скоростью. Пусть закон диспе- дисперсии задан в виде зависимости фазовой скорости от длины волны v = v(X). Используя выражение для фазовой скорости v = ш/k, запишем ш = vk. Тогда из (9.6) находим и = dcj/dk = d(vk)/dk = v + kdv/dk. Далее, поскольку А = 2n/k и, следовательно k/dk = —A/dA, имеем u = v-\dv/d\. (9.6) Формула (9.6), связывающая фазовую и групповую скорость, называется формулой Релея. Если d^/dA > 0 (фазовая скорость растет с ростом длины волны), то и < v — групповая скорость меньше фазовой: огибающая a(t — zju) отстает при движении волнового пакета от несущей гармонической волны ^(^ot-koz) (например, максимум амплитуды движется медленнее, чем волновые по- поверхности). Такого рода дисперсия называется нормальной. В обратном слу- случае d^/dA < 0 имеет место аномальная дисперсия. Если фазовая скорость всех волн, составляющих волновой пакет, одина- одинакова (v = const, независящая от А), то di>/dA = 0 и дисперсия отсутствует — групповая скорость равна фазовой. Часто свойства оптически прозрачной среды задаются зависимостью по- показателя преломления среды от частоты п = п(ио). Напомним, что согласно определению, п = c/v и следовательно dv/v = — dn/n. Кроме того, из со- соотношения и>\ = 2тгс/п имеем dA/A + duj/uj = —dn/n. Используя последние соотношения, можно получить из формулы Релея: и = ^—71-- (9-7) п + uj dnjduj Поскольку фазовая скорость v = c/n, то из (9.7) следует, что при dn/d(jo > 0, и < v — имеет место нормальный закон дисперсии, а при dn/dco < 0, и > v — аномальная дисперсия. Выше мы рассмотрели ситуацию, когда можно использовать линейный за- закон дисперсии (9.5). Именно в этом случае волновой пакет распространяется в среде не деформируясь и можно ввести понятие групповой скорости. Если же форма волнового пакета изменяется по мере перемещения (например так, как показано на рис. 9.5, то становится неясным, с движением какой
9.2. ДИСПЕРСИЯ ЭЛЕКТРОМАГНИТНЫХ ВОЛН 509 Рис. 9.5 < АО, то ею можно пренебречь; тогда остается спра- точки волнового пакета следует отождествлять групповую скорость. Одна- Однако и в этих случаях нередко оказывается удобным формально использовать величину дси/дк. Чтобы выяснить условия, при которых деформацией волнового пакета при движении можно пренебречь, воспользуемся разложением функции k(uQ-\-ft) в степенной ряд, учтя следующий после линейного член разложения. Мы имеем: к(ш + О) « к0 + (dk/d(v)UQ П + 1/2 (d^/cL;2)^ О2. Поправка в фазе колебания, обусловленная по- последним слагаемым, есть 1/2 (d2fc/dct;2) Q?z. Если эта поправка мала (<С тг) для всех спек- спектральных компонент, составляющих волновой па- пакет, т. е. для всех || < ведливой линейная зависимость (9.5) — волновой пакет, на деформируясь, движется с групповой скоростью и = (doo/dk)^. Итак, достаточное условие справедливости (9.5) имеет вид: 1/2 (d2k/du;2)cuo Aftz < тт. Последнее неравенство налагает ограничения на ширину спектра пакета АО, дистанцию z, которую проходит пакет в среде, и закон дисперсии к(и) (именно величина второй производной определяет, как быстро кривая к(ш) отклоняется от касательной). Заметим, что, если справед- справедлива линейная связь между к и ш (9.5), которую можно записать в виде к = а-\-Ьш, то имеет место также линейная связь между v и X: v = af + bfX. В этом легко убедиться, использовав связи: к = 2тг/А и и; = 2nv/X. Если закон дисперсии задан в виде v = v(X) (рис. 9.6), то лишь в области длин волн А А вблизи длины Ао (соот- (соответствующей частоте о;о), где касательная мало отклоня- отклоняется от кривой г>(А), дисперсия не приводит к деформации волнового пакета при распространении в среде. Из рис. 9.6 ясно, что точ- точка пересечения касательной с осью ординат как раз и определяет величину групповой скорости и = v — Xtga = v — X/ 0 9.2. Дисперсия электромагнитных волн Классическая теория, созданная Лоренцем, основана на идеализирован- идеализированной модели среды, в которой распространяется электромагнитная волна. Согласно этой модели, среда представляет собой набор невзаимодействую- невзаимодействующих между собой атомов (наилучшим приближением является газообраз- газообразная среда). В простейшем случае предполагается, что в атоме имеется один «оптический» электрон, квазиупруго связанный с ядром: сила, действующая на этот электрон со стороны поля ядра (экранированного частично электро- электронами внутренних оболочек) линейно связана со смещением г из положения равновесия: fynp = —кг. Таким образом, электрон в атоме рассматривается как линейный осциллятор (см. гл. 2.1). Вынужденные колебания осцилля- осциллятора обусловлены полем электромагнитной волны: внешняя сила, действу- действующая на электрон, есть eE(t), где е — заряд электрона, Е(?) = ~Eoetujt — электрическое поле монохроматической волны частоты ш.
510 ГЛ. 9. ДИСПЕРСИЯ ВОЛН Колеблющийся электрон сам становится источником электромагнитной волны, благодаря чему его свободные колебания затухают; это обстоятель- обстоятельство учитывается феноменологически введением «силы трения», пропорци- пропорциональной скорости и равной /?г (так называемое радиационное затухание, см. гл. 6.5). Уравнение движения электрона имеет вид гаг = кг - /Зг + eEoeiuit или, вводя как обычно константы uq = к/т и 7 — /3/2т: г + 27Г + ujqT = (е/га) Еоег^. Уравнение вынужденных колебаний гармонического осциллятора имеет хорошо известное решение: *. (9.8) ^Z 'Z _|_ В этом решении опущены две константы интегрирования vq и tq. Тем са- самым подразумевается, что в среде нет ни макроскопического заряда, ни макроскопических токов, которые были бы обусловлены положениями и скоростями элементарных зарядов в среде. Смещение г(?) из положения равновесия приводит к появлению дипольно- го момента атома р = ег, который, как ясно из (9.8), изменяется по гармони- гармоническому закону, пропорционально меняющемуся по гармоническому закону электрическому полю волны. Важно обратить внимание на то, что коэффи- коэффициент пропорциональности, связывающий р и Е (и называемый атомной поляризуемостью) „ е2/т р = аЕ, а=^ ? , 9.9 иг — иг + 2г^ш является, в общем случае, комплексным, а это означает, что колебания р происходят со сдвигом фазы по отношению к колебаниям Е, причем фазо- фазовый сдвиг зависит от частоты. Колеблющиеся диполи вещества сами стано- становятся источниками излучения. Это переизлучение происходит с той же ча- частотой и). Переизлученные колеблющимися диполями волны, складываясь (интерферируя) с первичной волной, образуют волну, распространяющуюся в среде, причем отставание по фазе вторичных волн по отношению к первич- первичной волне (зависящее от частоты), приводит к тому, что фазовая скорость результирующей волны также становится зависящей от частоты — в этом суть явления дисперсии. Рассматриваемая нами среда достаточно разрежена, она состоит, как бы- было отмечено, из невзаимодействующих, т. е. достаточно далеко отстоящих друг от друга, атомов. Тем не менее, в пределах элемента объема, малого по сравнению с длиной волны, в котором поле Е(?) можно считать однородным (одинаковым в каждый момент времени во всех его точках), находится дос- достаточно большое число атомов. Например, для видимого света А~5-10~7м, и в объеме, равном А3, содержится около 4 • 105 атомов газообразного ве- вещества при нормальных условиях. Итак, мы можем считать, что большое число осцилляторов в пределах малого элемента объема в каждый момент времени имеют один и тот же дипольный момент. Тогда поляризация среды
9.2. ДИСПЕРСИЯ ЭЛЕКТРОМАГНИТНЫХ ВОЛН 511 (дипольный момент единицы объема среды) равен Р = Np, где N — число осцилляторов в единице объема. Используя (9.9), находим Итак, поляризация среды Р колеблется с частотой о;, равной частоте вол- волны, бегущей в среде. Согласно определению, диэлектрическая восприимчи- восприимчивость среды х — это коэффициент пропорциональности, связывающий Р и Е: Р = ?оХ^- Мы получаем (9.11) Соответствующее выражение для диэлектрической проницаемости е = - 1 + х есть: «М-1+ f^'lT' . (9.12) Зависимость диэлектрической проницаемости среды от частоты определя- определяет закон дисперсии среды п(ш) = у/е(ш) или к(си) = (w/c)n(w). Обратим внимание на еще одно важное обстоятельство: поскольку ди- диэлектрическая проницаемость е(и) является в общем случае комплексной величиной s{ui) = е1'(ш) + г?П(ш), то и показатель преломления п(ш), и сле- следовательно, волновое число — также комплексные величины: п(и)) = п'(ио) + in"(u;); k(uo) = k'(uo) + ik"(uo). Что собой представляет плоская электромагнитная волна при комплекс- комплексном к? Подставляя в уравнение плоской волны f(z, t) = ае-гМ-*^) комплек- комплексную величину к = к' + ifc", находим f(z, t) — ае~к"zе-1{и1~к'z)^ Мы видим, что волна f(z, t) не является плоской волной в обычном понимании, по- поскольку по мере роста z амплитуда волны ае~к z экспоненциально убывает (показатель экспоненты — к"z — действительное отрицательное число), вол- волна затухает, причем затухание связано с мнимой частью к" волнового числа (и, следовательно, с мнимой частью показателя преломления п"). Действи- Действительная часть к' и п' определяют фазовую скорость волны v = ui/kf. Итак, рассмотрим различные ситуации, основываясь на общем соотноше- соотношении (9.12). Введя обозначение: Ne2/(s0m) = ш\ (9.13) (величина ши называется плазменной частотой), запишем: 2 ^ . (9.14) Нормальная дисперсия. Сравним величины ш$ — ш2 и 2^ш, входящие в 2 знаменатель второго слагаемого в (9.14). Пусть Аси = cjq — ш, тогда c^q — ио2 = = (с<;о + с<;)Ас<;. Величина 7? как известно, определяет ширину резонансной кривой при вынужденных колебаниях гармонического осциллятора. Пусть
512 ГЛ. 9. ДИСПЕРСИЯ ВОЛН частота волны далека от резонансной частоты осциллятора ujq, тогда Аш ^> 7 и следовательно (с<;о + с<;)Ас<; ^> 2^ш, т. е. мнимое слагаемое в зна- знаменателе (9.9) и (9.14) мало по сравнению с действительным и им можно пренебречь. Тогда a = ^hn_ е(а;) = 1 + _^Ц> (9.15) т. е. диэлектрическая проницаемость — действительное число. Действитель- Действительным является также и волновое число: к" ~ 0, а это означает отсутствие по- поглощения — среда оказывается прозрачной для электромагнитной волны. Физически этот результат понятен: при частотах внешней силы, далеких от резонансной частоты осцилляторов, амплитуда вынужденных колебаний мала; волна, распространяясь в среде, практически не отдает энергию ос- осцилляторам, т. е. не поглощается. Собственные частоты «оптических» электронов многих веществ лежат в далекой ультрафиолетовой области спектра, поэтому для волн видимой области шС^ои условие Да; ^> 7 выполняется. Кроме того, если концентрация осцилляторов достаточно мала (что имеет место в газах), то а;п < |о;§ — о;2|. В этом случае имеем приближенную формулу / ^2 Л ,,,2 (9.16) Зависимость (9.16) показана на рис. 9.7 (пунктиром обозначена область графика п(о;), в котором перестает выполняться неравенство Да; ^> j и, следовательно, указанная зависимость уже не справедлива). Эмпирическая формула П2(А) = 1 + ЛA + Б2/А2), (9.17) где А ж В — константы, была известна задолго до создания электронной теории дисперсии. Она может быть получена из (9.16), причем константы А и В связаны с характеристиками среды равенствами П-\ , ! А = (о;п/о;оJ, В = 4тг2с2/о^. (9.18) со Исследовав экспериментально зависимость п(А), мож- можно определить константы АиВис помощью равенств (9.18) найти величины ujq и о;п. В области частот, где формула (9.16) справедлива (сплошная кривая), имеет место нормальная дисперсия: Рис 9 7 п Растет с ростом частоты. Левая ветвь соответствует частотам, меньшим uq (в частности, видимый свет). Для этих частот показатель преломления больше единицы и, следовательно, фа- фазовая скорость меньше скорости света в вакууме v = с/п < с. Для частот и > cjq (например, рентгеновский диапазон спектра) п < 1 и v > с, что, как мы отмечали ранее, не противоречит специальной теории относительности, согласно которой скорость любых тел или сигналов ограничена величиной с, что не имеет отношения к фазовой скорости монохроматической волны.
9.2. ДИСПЕРСИЯ ЭЛЕКТРОМАГНИТНЫХ ВОЛН 513 Если выполнено сильное неравенство ш ^> ujq (и тем более ш ^> 7о)? то формула (9.16) дает: е{ш) = п2(и) - 1 - ojI/oj2. (9.19) Эта формула справедлива приближенно как для волн рентгеновского диа- диапазона, так и для радиоволн в ионосфере, которая представляет собой плаз- плазму — полностью ионизованный газ, дисперсия волн в которой обусловлена свободными электронами. В последнем случае формула (9.19) справедлива, поскольку на свободные электроны не действует квазиупругая сила, связы- связывающая электроны в атоме, поэтому с^о = 0 и сильное неравенство и; ^> с^о выполняется даже для низкочастотных радиоволн. Соотношение (9.19) позволяет объяснить особенности характера распро- распространения радиоволн в ионосфере. При ш < ши (что соответствует длинам волн А > 10 м) показатель прело- преломления п = VI ~</ (9-20) становится чисто мнимым, амплитуда волны экспоненциально спадает и волна не проникает вглубь ионосферного слоя; при этом коэффициент от- отражения (определяемый, согласно формулам Френеля, действительной частью п), равен единице. Напомним, что, в частности, при нормальном падении R = ((п7 — 1)/(п7 + 1)) =1, по- поскольку п' = 0. Таким образом, полное внутренее отра- отражение происходит при любом угле падения. Отражение длинных радиоволн от ионосферного слоя используется для дальней радиосвязи (см. рис. 9.8), когда передатчик А и приемник В находятся вне прямой види- мости. Наоборот, ультракороткие радиоволны (А < 10 м) с< 9<° свободно проходят сквозь ионосферу: при ш > ши показатель преломле- преломления — действительное число, пп = 0 и волна проходит ионосферный слой без затухания. Такие волны используются для связи со спутниками, лока- локации планет и Луны. Закономерности поведения электромагнитных волн в ионосфере во многом подобны их поведению в металлах. И в том, и в другом случае дисперсия об- обусловлена взаимодействием волны со свободными электронами, на которые не действует квазиупругая сила: ujq = 0, поэтому справедлива формула вМ = п» = 1 - ^^, (9.21) которая получается из общего соотношения (9.14) при uq = 0. При низких частотах, таких, что ш ^С 7 ж-> следовательно, ш2 ^С 2^ш получаем из (9.21) 2 п2Ы = l + i—^. (9.22) 2^ш Концентрация свободных электронов в металлах такова, что справедли- справедливо неравенство ши ^> 7? поэтому иJи/B^и)) ^> иJи/B^2) ^> 1, т. е. мнимое
514 ГЛ. 9. ДИСПЕРСИЯ ВОЛН слагаемое в (9.22) много больше по абсолютной величине первого (действи- (действительного) слагаемого. Мы получаем (9.23) п(ио) ~ Поскольку ег7Г/4 = cos(tt/4) +isinGr/4) = 1/л/2A + i), то из (9.23) следу- следует, что показатель преломления является комплексным числом с равными действительной и мнимой частью Из неравенства п" ^> 1 следует, что амплитуда волны быстро уменьша- уменьшается по мере проникновения в металл (глубина проникновения z c± 1/к" много меньше длины волны), при этом коэффициент отражения, определя- определяемый действительной частью показателя преломления, близок к единице: R = ((п7 — 1)/(п7 + 1)) при п' ^> 1 (при нормальном падении) — волна практически полностью отражается. В случае высоких частот ио ^> 7 приходим к формуле (9.20), из которой можно сделать те же выводы, которые относились ранее к дисперсии ра- радиоволн в ионосфере. В частности, при и > и>и показатель преломления становится действительным, а металл прозрачен для волны (обычно усло- условие ш > ши начинает выполняться для металлов в рентгеновской области частот). В оптическом диапазоне частот ситуация не столь проста, о чем говорит хотя бы эффект избирательного отражения — желтый цвет золо- золота и меди. Это значит, что помимо электродинамики, здесь важна атомная физика. Аномальная дисперсия. Выше мы рассматривали дисперсию в обла- области частот, далеких от собственной частоты осцилляторов: \ш — ujq\ ^> 7- В этом случае диэлектрическая проницаемость е(и) является действительной функцией, среда оказывается прозрачной для волны (отсутствует поглоще- поглощение) и показатель преломления растет с ростом частоты — т. е. имеет место нормальная дисперсия. Обратимся теперь к случаю, когда частота волны близка к собственной ча- частоте атомных осцилляторов. Одну важную особенность мы уже отмечали: если \и — с^о| — 7? то функция е(и) оказывается комплексной. Поглощение волны средой в этом случае обусловлено передачей энергии волны колеб- колеблющимся осцилляторам, амплитуда вынужденных колебаний которых становится особенно большой, когда частота силы, раскачивающей колебания (т. е. частота колебания электрического поля вол- волны), близка к резонансной. Детальное исследова- ние общего соотношения (9.14) показывает, что в области, где волна испытывает сильное поглоще- поглощение, характер дисперсии является аномальным: в области частот \ио — ио$\ < 7 показатель преломле- преломления уменьшается с ростом частоты. Графики зависимости действительной и мнимой частоты показателя преломления от частей, следующие из общей форму- формулы (9.14), показаны на рис. 9.9. Следует обратить внимание, что зависимость п" (из) мнимой части показателя преломления от частоты (ответственного за поглощение волны в среде) подобна резонансной кривой атомных осциллято-
ВОПРОСЫ И ЗАДАЧИ 515 ров: чем больше амплитуда вынужденных колебаний, тем сильнее поглоще- поглощение волны в среде; и именно в пределах ширины полосы резонансной кривой имеет место аномальный характер дисперсии. В области частот, далеких от резонансной, кривая п'(ио) на рис. 9.9 совпадает с кривой, показанной на рис. 9.7. Эффектная демонстрация аномальной дисперсии была предложена Кунд- том. Использованный им метод скрещенных призм показан на рис. 9.10. Рис. 9.10 Первая призма (стеклянная) с вертикальным основанием обладает нор- нормальной дисперсией, поэтому разлагает пучок белого света в горизонталь- горизонтальную радужную полоску: от красного до фиолетового цвета (фиолетовая, более коротковолновая волна, преломляется сильнее). Вторая (скрещенная) призма имеет горизонтальное основание, поэтому смещает полоску по вертикали. Если она также обладает нормальной дис- дисперсией, то фиолетовая (коротковолновая) часть полоски смещается по вер- вертикали сильнее, чем красная (как показано на рис. 9.10 а). На рис. 9.10 б вторая призма обладает аномальной дисперсией. В опытах Кундта вторая призма образована парами натрия, обладающими сильным поглощением в желтой части спектра. Именно там, где должна была бы рас- располагаться желтая часть цветной полоски, образуется разрыв (желтая часть спектра поглотилась парами натрия). При этом примыкающая к желтому цвету более длинноволновая часть полоски (для которой п > 1) отклоня- отклоняется вверх (к основанию призмы), а более коротковолновая часть (для нее п < 1) отклоняется вниз, т. е. форма полоски воспроизводит кривую диспе- дисперсии п(А). Вопросы и задачи 1. Вычислить групповую скорость и для различных законов дисперсии (v — фазовая скорость): а) v = г>о = const (недиспергирующая среда); б) v = ал/А (гравитационные волны на поверхности воды); в) v = а/л/Л (капиллярные волны); г) v = а/Л (поперечные колебания натянутой струны); д) v = л/с2 + Ь2 + Л2 — электромагнитные волны в ионосфере (с — скорость света в вакууме, Л — длина волны в среде). 2. Найти групповую скорость и ренгеновского излучения в среде, если предельный угол полного внутреннего отражения при падении этих волн в среду из воздуха равен а. Указание: закон дисперсии рентгеновских волн определяется выражением п(ии) = = 1 — cjn/o;2, где ип — константа.
516 ГЛ. 9. ДИСПЕРСИЯ ВОЛН 3. Плоская волна распространяется в среде с законом дисперсии v=a-\-b\, где а и Ь — постоянные. Показать, что каково бы ни было возмущение, его форма периодически вос- восстанавливается по истечении времени т = dA/dv = 1/b. Показать, что отношение пути S, пройденного возмущением за время т, к продолжительности этого промежутка, равно групповой скорости. Указание: достаточно показать, что по истечении времени т восстанавливается взаим- взаимное расположение любых двух монохроматических компонент суммарной волны. 4. Показатель преломления ионосферы для радиоволн с частотой v = 10 МГц равен п = 0,9. Найти концентрацию N электронов в ионосфере, а также фазовую и групповую скорость для этих радиоволн. Ответ: 7V~2,4- 1011 м~3. 5. Для оценки интегральных и средних характеристик межзвездной плазмы можно ис- использовать экспериментальный факт, установленный сразу же после открытия пульсаров. Оказалось, что из-за дисперсии плазмы импульсы радиоизлучения пульсаров на более низких частотах всегда запаздывают по отношению к импульсам более высоких частот. Определить полное число п свободных электронов на пути сигналов (т. е. их полное чи- число в цилиндре площадью 1 м и высотой, равной расстоянию источник—приемник), если испущенные одновременно импульсы с длинами несущих волн Ai = 3 см и А2 = 5 см запаз- запаздывают друг относительно друга на время At = 10~5 с. Определить также среднюю кон- концентрацию свободных электронов на пути сигналов, если их относительное запаздывание At/to = 10~15. Концентрация электронов на пути сигналов не постоянна, хотя показатель преломления мало отличается от единицы. Указание: воспользуйтесь формулой, связывающей фазовую и групповую скорость волн в плазме и • v = с ; время распространения импульсов определяется групповой ско- скоростью. Ответ: п = 2тгс/ (Л| - Л?) At/r0 ~ 4 • 1017, где г0 = е2/(тес2) ~ 2,8 • 103 см, N = = n/(ct0) = 2тг/ (го(Л| - Л?)) At/to ~ 4 • 10 см.
ГЛАВА 10 ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ 10.1. Модель анизотропной среды Принятая в предыдущей главе модель среды основана на представлении о том, что атомные осцилляторы, заполняющие среду, являются изотропны- изотропными: ни жесткость квазиупругой связи (и, следовательно, собственная часто- частота осцилляторов), ни коэффициент затухания 7 не зависят от ориентации вектора Е в электромагнитной волне, распространяющейся в среде и вызы- вызывающей процесс вынужденных колебаний осцилляторов. Согласно (9.9) это означает, что не зависит от ориентации вектора Е атомная поляризуемость а, а направление дипольного момента атома р совпадает с направлением поля Е: р = а Е. Не зависит от ориентации Е также ни диэлектрическая восприимчивость вещества х = ?oNa, ни диэлектрическая проницаемость е = 1 + Х-) ни показатель преломления п = у/е. В каком бы направлении ни распространялась волна и как бы ни был ориентирован вектор Е этой волны (в плоскости, перпендикулярной направлению распространения), фа- фазовая скорость волны v = с/п одна и та же. Суммарное электрическое поле вторичных волн, переизлучаемых колеблющимися осцилляторами, совпа- совпадает по направлению с полем первичной волны, поэтому линейно-поляризо- линейно-поляризованная волна (с фиксированной плоскостью колебаний вектора Е) остается линейно-поляризованной, и в ней сохраняется неизменной плоскость коле- колебаний суммарного вектора Е. В этой главе мы рассмотрим особенности оптических явлений в анизо- анизотропных средах. Физическая природа анизотропии вещества, главным обра- образом монокристаллов, связана с тем, что квазиупругая сила, возвращающая оптический электрон в положение равновесия, обусловлена не только сфе- сферически симметричным полем ядра, но и экранирующим полем внутренних оболочек, которые не обязательно сферически симметричны; полем соседних атомов и ионов; а равно и электронов, при- принадлежащих не конкретному атому, а кристаллу как целому. На рис. 10.1 показана двумерная механическая модель ани- анизотропного осциллятора. Если внешняя сила, вызывающая процесс малых вынужденных колебаний, горизонтальна, то квазиупругая сила обусловлена пружинами кх. При верти- вертикальной внешней силе работают пружины жесткости ку ф кх. Рис. 10.1 Соответственно, различными оказываются и собственные частоты осциллятора при горизонтальных и вертикальных колебаниях &0х Ф шоу Различны, как следует из (9.11), также, поляризуемость ах ф ау и дипольные моменты рх ф ру.
518 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ При произвольной ориентации вектора Е (с проекциями Ех и Еу) проекции дипольного момента осциллятора есть рх = ыхЕх и ру = ауЕу. Ясно, что при ах ф ау вектор р дипольного момента осциллятора не совпадает по направлению с вектором Е. Итак, в анизотропной среде дипольные моменты осцилляторов не совпада- совпадают, вообще говоря, по направлению с электрическим полем волны, которая индуцирует эти дипольные моменты. Соответственно, не совпадают по на- направлению с вектором Е и вектор поляризации среды Р = Np и вектор D = ?qE + Р. В отличие от изотропной среды, в которой справедлива век- векторная связь D = sqs'E и свойства которой характеризуются единственным параметром ?, в анизотропной среде связь между векторами D и Е имеет вид Dx = (епЕх + ?UEy + ?1зЕг)ео, Dy = {s2iEx + ?22ЕУ + ?2sEz)?0, A0.1) Dz = т. е. ж-компонента вектора D зависит в общем случае как от ж-компоненты вектора Е, так и от его у и ^-компонент. То же самое касается и других проекций вектора D. Такая связь между векторами D и Е называется тен- тензорной, а совокупность девяти чисел (?п ?12 ?13 ?21 ^22 ^23 ?31 ?32 ?зз образует тензор диэлектрических проницаемостей. Заметим, что тензором называется не любая матрица, но лишь такая, которая связывает два ис- истинных вектора согласно правилу з Компоненты тензора ец зависят от выбора системы координат. Можно выбрать направления осей декартовой системы координат так, что симме- симметричный тензор sij становится диагональным: en 0 0 0 ?22 0 0 0 езз В этой системе координат, вместо A0.1), имеем Dx = ?о?хЕх, Dy = ?о?уЕу, Dz = ?O?ZEZ. A0.2) Это означает, что существуют три направления в кристалле, такие, что, если вектор Е в волне совпадает с одним из этих направлений, то векторы D и Е оказываются ко л линеарными. Очевидно, что коллинеарны при этом и векторы Е и Р: направление дипольного момента атомных осцилляторов со- совпадает с направлением электрического поля волны. Направления (ж, у, z) в кристалле, для которых справедливы равенства A0.2), называются глав- главными направлениями.
10.2. ВОЛНЫ В ОДНООСНЫХ КРИСТАЛЛАХ 519 Трем параметрам ех, еу и ez соответствуют три главных показателя пре- преломления пх = д/б^, пу = у/б^ ип2 = д/ej. Это означает, что волна, в которой вектор Е параллелен оси х, бежит с фазовой скоростью vx = с/пх, соответ- соответственно, волны, в которых колебание поля происходит параллельно осям у и z, имеют фазовые скорости vy = с/пу, vz = c/nz. Кристаллы, для которых все три главных показателя преломления различны: пх ^ пу ^ nz называ- называются двуосными. Мы далее будем говорить об одноосных кристаллах, для которых nz ^ пх = Пу. В этом случае ось z называется оптической осью кристалла. Показатель преломления nz обозначают обычно пе, показатели преломле- преломления пх = пу обозначают щ. Подчеркнем, что оптическая ось — это не фик- фиксированная прямая в кристалле, а направление, т. е. любая прямая, парал- параллельная оси z, является оптической осью кристалла. Кристаллы, у которых пе > щ называются положительными. Примером является кварц, для которого пе — щ с± 0,01. У отрицательных кристаллов пе < щ. Примером отрицательного кристалла является исландский шпат, обладающий сильной анизотропией: щ — пе ~ 0,2. 10.2. Волны в одноосных кристаллах Итак, рассмотрим, как проявляется анизотропия кристалла при распро- распространении в нем световой волны. Пусть х, у, z — главные направления в кристалле, az — оптическая ось. Прежде всего, введем терминологию, которая используется для описания волновых явлений в одноосных кристаллах. Плоскость, в которой лежат луч света, т. е. нормаль к волновому фронту, и оптическая ось, называется главной плоскостью, или главным сечением кристалла. Подчеркнем, что эта плоскость лишь одной из прямых, ее образу- образующих, привязана к кристаллической структуре, другую же задает световая волна. Если колебания вектора Е в волне происходят в главной плоскости, то такая волна называется необыкновенной (смысл этих терминов будет ясен из дальнейшего). Пусть, например, луч света Si лежит в плоскости zy (плоскость рис. 10.2), тогда плоскость zy — главная плоскость, а волна Si — необыкновенная, поскольку колебания Е происходят в главной плоскости (что по- показано поперечными стрелками на рисунке). В волне $2 (луч $2 также лежит в плоскости zy) колебания вектора Е перпендикулярны главной плоскости. Эта волна является обыкновенной. Луч S% также, как Si p -jq 2 и а§2, лежит в плоскости рисунка — плоскости zy. Эта волна содержит как обыкновенную компоненту (с колебаниями поля, пер- перпендикулярными главной плоскости — плоскости zy), так и необыкновен- необыкновенную компоненту, в которой колебания поля происходят в плоскости рисунка. Рассмотрим вначале, что происходит при распространении света вдоль од- одного из главных направлений. Пусть монохроматическая волна бежит вдоль оптической оси (волна 1 на рис. 10.3). В поперечной электромагнитной вол- волне, бегущей вдоль оси z, вектор Е может иметь только х- и у-проекции Ех и Еу, т. е. волну можно рассматривать как суперпозицию двух линей- линейно-поляризованных волн, в одной из которых вектор Е колеблется вдоль
520 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ оси ж, а во второй — вдоль оси у. Фазовые скорости этих волн одинаковы: v = с/пх = с/пу = с/щ. В суммарной волне вектор Е не имеет проекции на оптическую ось (ось z) — она является обыкновенной (ее фазовая ско- скорость определяется показателем преломления по). Волна, бегущая вдоль оптической оси — всегда обыкновенная. Распространяясь в кристалле, ка- каждая из составляющих волн Ех и Еу приобретает один и тот же фазовый набег kxz = kyz = (ш/vq) z, поэтому разность фаз колебаний Ех и Еу не меняется по мере распро- распространения волны вглубь кристалла. Это означает, что не изменяется состояние поляризации волны. Если, скажем, на входе в кристалл волна была ли- линейно-поляризована (разность фаз колебаний на входе 0 или тг, см. гл. 4.3), то и в любом месте вну- внутри кристалла она остается линейно-поляризован- линейно-поляризованной с неизменной ориентацией плоскости колеба- колебаний вектора Е. гис. 10.6 Рассмотрим теперь волну 2, бегущую вдоль дру- другого главного направления, например, вдоль оси у. Две компоненты волны Ех и Ez имеют вид Ez = А\ cos(u;t — kzy), Ех = А2 cos(u;t — кху). В первой из этих волн вектор Е колеблется в главной плоскости (парал- (параллельно оптической оси z). Эта волна необыкновенная, ее фазовая скорость ve = с/пе отличается от фазовой скорости второй, обыкновенной волны vq = = с/по, соответственно, отличаются волновые числа kz и кх: kz = (ш/с)пе = = Bтг/А)пе, кх = Bтг/А)по, где А — длина волны в вакууме. В соответствии с принятой терминологией, показатели преломления пе и по называются со- соответственно необыкновенным и обыкновенным. Проникая вглубь кристалла на глубину у, волны приобретают разность фаз А(р = Bтг/А)(пе — щ)у. Пусть пластинка вырезана из одноосного кристалла параллельно оптической оси (как показано на рис. 10.3), толщина пластинки d. Пучок света падает на нее по нормали, т. е. бежит вдоль оси у. Тогда на выходе из пластинки возникает дополнительная разность фаз, равная А<р = 2тг/А (ne - no)d. A0.3) Если толщина d такова, что Аср = тг/2 + 2тгга, где т — целое число, (Ю.4) то такая пластинка называется пластинкой в А/4, или четвертьволновой пластинкой. Пусть на входе в пластинку (при у = 0) колебания Ех и Ez синфазны. Так происходит, если на пластинку падает линейно-поляризованная вол- волна, в которой плоскость колебаний лежит в первом и третьем квадрантах (рис. 10.4 а). Тогда на выходе (при у = d) разность фаз равна тг/2. Мы по- получаем эллиптически поляризованную волну, причем главные оси эллипса совпадают с осями х и z. Если, кроме того, плоскость колебаний вектора Е на входе составляет угол 45° с осями х и z, то амплитуды волн Ех и Ez одинаковы и на выходе получаем свет, поляризованный по кругу.
10.2. ВОЛНЫ В ОДНООСНЫХ КРИСТАЛЛАХ 521 Если A0.5) то пластинку называют пластинкой в А/2. Линейно-поляризованная на входе в пластинку волна с синфазно коле- колеблющимися составляющими Ех и Еу останется на выходе линейно-по- линейно-поляризованной, причем колебания Ех и Еу станут противофазными, а это означает, что положение плоскости колебаний изменится, как показано на рис. 10.4 б. Если разность фазовых набегов обыкновенной Ех и Ez необыкновенной Ez компонент волны кратна целому числу 2тг: — = 2тгш, A0.6) / то пластинку называют пластинкой в А. Такая пла- а б стинка не изменяет характера поляризации падающей рис -^ 4 волны. В общем случае, если толщина d пластинки не удовлетворяет равенствам A0.4), A0.5) и A0.6) (разность фаз колебаний Ех и Еу на выходе отлична от нуля, тг или тг/2), линейно-поляризованная на входе в пластинку вол- волна становится эллиптически-поляризованной, причем главные оси эллипса поляризации не совпадают с главными направлениями пластинки. Следует подчеркнуть, что разность фазовых набегов, определяемая фор- формулой A0.3), зависит от частоты (длины волны) как благодаря множителю 2тг/А = с«;/с, так и вследствие возможной дисперсии, т. е. зависимости пе(и>) и П()(ш). Поэтому, если мы говорим, что данная пластинка является, напри- например, четвертьволновой, то это относится к волне определенной частоты (или длины волны), а именно той длины волны, для которой Аср = тг/2 + 2тгга. Пусть в одноосном кристалле, где ось z — оптическая ось кристалла, в начале координат имеется точечный источник света S (рис. 10.5 а). Про- Проведем из начала координат во всевозможных направлениях лучи, лежащие в плоскости рисунка. Эта плоскость является главной плоскостью. Пусть вектор Е во всех этих лучах перпендикулярен главной плоскости (так бу- будет например, если излучателем является точечный диполь, ось которого перпендикулярна главной плоскости — плоскости рисунка), т. е. источник излучает обыкновенную волну. Отложим на каждом луче отрезок, равный фазовой скорости волны. Все эти отрезки одинаковы, поскольку, каким бы ни было направление луча, вектор Е в этом луче не имеет проекции на ось z. В нашем случае он имеет проекцию лишь на другое главное направление — ось ж, поэтому фазовая скорость равна vq = с/щ для лучей любого направления. Концы всех отрез- отрезков находятся на одинаковом расстоянии от источника — на окружности, радиус которой равен vq. Разумеется, если мы рассмотрим множество лучей, лежащих в любой другой плоскости, повернутой вокруг оси z вместе с излу- излучающим диполем так, что колебания поля Е происходят перпендикулярно этой плоскости, а значит и оптической оси z, то результат не изменится: концы всех отрезков будут находится на расстоянии vq от источника. Итак, множество концов отложенных отрезков лежит на сфере радиуса vq — эта сфера является волновой поверхностью обыкновенной волны.
522 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ Обыкновенные волны в кристаллах ведут себя так же, как волны в изо- изотропных средах, в которых фазовая скорость волны не зависит от направ- направления, поэтому волновые поверхности, исходящие из точечного источника, являются сферами. Отсюда смысл названия — обыкновенная волна. Рассмотрим теперь лучи, в которых колебания вектора Е лежат в глав- главной плоскости (в плоскости рис. 10.5 б), т. е. излучение источника является необыкновенной волной в кристалле. В луче 2, бегущим перпендикулярно оптической оси (вдоль оси у на рис. 10.5 б) вектор Е параллелен оптической оси, он не имеет проекции на главные направления у и ж: в этом направлении волна бежит со скоростью ve = с/пе. z - опт. ось Рис. 10.5 Рис. 10.6 В луче 1, бегущим вдоль оптической оси z, вектор Е не имеет проекции на ось z (в нашем случае он имеет отличную от нуля проекцию лишь на другое главное направление — ось у), поэтому в направлении оптической оси необыкновенная волна бежит со скоростью, равной vq = с/пу = с/щ. Если луч бежит в каком-либо промежуточном направлении (луч 3), то реализуется промежуточное значение скорости между значениями vq и ve. Если, как и ранее, отложить на каждом луче отрезки, равные фазовой ско- скорости волны, их концы образуют эллипсоид вращения с полуосями с/щ и с/пе. Заметим еще раз, что скорость волны, бегущей вдоль оптической оси z, равна с/по, т. е. совпадает со скоростью обыкновенной волны: на оптической оси эллипсоид лучевых скоростей необыкновенной волны касается сфери- сферической поверхности лучевых скоростей обыкновенной волны. На рис. 10.6 показаны поверхности лучевых скоростей обыкновенной и необыкновенной волны для положительного кристалла (для которого пе>по, поэтому ve<VQ и эллипсоид лежит внутри сферы, рис. 10.6 а) и для отрицательного кри- кристалла (ve > vq — сфера лежит внутри эллипсоида, рис. 10.6 б). В любом случае точки касания сферы и эллипсоида лежат на оптической оси. 10.3. Преломление на границе анизотропной среды, двойное лучепреломление Ранее мы рассмотрели, как ведет себя луч света, падающий нормально на кристаллическую пластинку, вырезанную параллельно оптической оси (т. е. оптическая ось параллельна поверхности, на которую падает луч света): на- направление распространения луча не меняется, а анизотропия проявляется в том, что скорость волны оказывается различной для волн разной ориента- ориентации вектора Е (обыкновенная волна, в которой вектор Е перпендикулярен
10.3. ПРЕЛОМЛЕНИЕ НА ГРАНИЦЕ АНИЗОТРОПНОЙ СРЕДЫ 523 м( м А А, В в, -d-> С с, D к| N у ) оптической оси, бежит со скоростью с/по, и необыкновенная, в которой век- вектор Е параллелен оптической оси, бежит со скоростью с/пе). Проиллюстрируем особенности возможных более сложных ситуаций на следующем примере. Пусть на поверхность одноосного кристалла падает нормально луч света с поперечным сечением d (рис. 10.7). Оптическая ось кристалла z составляет угол а с поверхностью и лежит в плоскости рисун- рисунка, поэтому эта плоскость является главной плоскостью кристалла. Будем считать падающий на кристалл свет естественным, в котором содержится как компонента вектора Е, лежащая в плоско- плоскости падения, так и перпендикулярная плоско- плоскости падения. Определим направление волн в кристалле, используя построение Гюйгенса. Волновая поверхность MN в падающей волне (перпендикулярная направлению рас- распространения и следовательно, параллельная поверхности кристалла) одновременно дости- достигает всех точек поверхности (от А до D) возбу- возбуждая в диэлектрике вторичные волны. Источ- Источниками этих вторичных волн являются воз- возбуждаемые падающей волной осцилляторы среды, находящиеся в точках поверхности от А до D. Рассмотрим сначала обыкновенную волну в кристалле, в которой вектор Е пер- перпендикулярен главной плоскости (плоскости рисунка). В этом случае каждая точка являет- является вторичным источником сферической волны (т. к. скорость обыкновенной волны одинакова во всех направлениях). Оги- Огибающая этих сферических поверхностей одинакового радиуса — плоская поверхность, параллельная поверхности кристалла — является волновой поверхностью обыкновенной волны; мы видим, что вектор ко обыкновенной волны, направленный по нормали к волновому фронту, совпадает по напра- направлению с вектором к в падающей волне (как и должно быть в соответствии с законом преломления). А каково направление луча, т. е. вектора Пойнтинга, в обыкновенной вол- волне? Обратим внимание, что к моменту времени, когда волновой фронт обык- обыкновенной волны, удаляясь от поверхности кристалла со скоростью г>о, дости- достигает положения MqNq, колебания поля на фронте имеются лишь на участке от А\ до D\. Действительно, колебание в точке А\ в этот момент времени создается только источником, находящемся в точке А (волны от других вто- вторичных источников i?, С, D не успевают достичь точки А\ к этому моменту). Колебание в точке В\ создано только источником в точке В и т. д. Итак, возмущение из участка AD переместилось к участку A\D\, сместившись вертикально вниз. Можно сделать вывод: луч, т. е. вектор потока энергии So направлен так же, как и волновой вектор ко на рис. 10.7 — вертикально вниз. Рассмотрим теперь необыкновенную волну. Волновые поверхности необы- необыкновенной волны, переизлучаемой каждой из точек A, i?, G, D — элли- эллипсоиды. (На рисунке показан отрицательный кристалл: для него пе < щ и
524 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ следовательно ve > vq). Огибающая этих эллипсоидов — плоская поверх- поверхность MeNe — является волновой поверхностью необыкновенной волны. По- Показанная на рисунке волновая поверхность Me7Ve, удаляясь от поверхности кристалла со скоростью, большей, чем скорость vq обыкновенной волны, оказалась дальше от поверхности кристалла. Нормаль к волновой поверх- поверхности MeNe направлена вертикально вниз, именно так направлен волновой вектор ке необыкновенной волны, что также находится в согласии с законом преломления. А какое направление имеет луч, т. е. поток энергии в необыкновенной вол- волне? Очевидно, что возмущение на волновом фронте локализовано на участке от А 2 до D%. Действительно, к моменту времени, зафиксированному на ри- рисунке, возмущение в точке А% создано лишь излучателем, расположенным в точке А поверхности кристалла (возмущения от всех прочих излучателей В, С, D не успели дойти до точки А2). То же самое касается всех прочих точек волнового фронта MeNe: возмущение в точке i?2 создано излучате- излучателем В, в точке Съ — излучателем С и т. д. До точек волнового фронта, лежащих вне участка A2D2 возмущение не успело дойти ни от одного из излучателей от i до D, возбужденных падающим на кристалл лучом све- света. Таким образом, результирующее возмущение в необыкновенной волне, локализованное первоначально на участке AD, оказалось локализованным через некоторое время на участке A2D2. Направление, в котором распро- распространяется луч, определяется направлением прямой, соединяющей точку А с точкой касания эллипсоида (волновой поверхности, удаляющейся от точки А) с волновым фронтом MeNe, т. е. с точкой А2. То же направление имеют и прямые ВВ2-) СС2 или DD2. Итак, падающий на кристалл луч света возбу- возбуждает в кристалле необыкновенный луч, направление которого не совпадает в общем случае с направлением падающей волны даже при нормальном па- падении. Такое необычное поведение и явилось причиной названия — необык- необыкновенный луч. Важно обратить внимание на тот факт, что в необыкновенной волне направление скорости перемещения волновых поверхностей (волново- (волнового вектора ке) не совпадает в общем случае с направлением потока энергии (вектора Пойнтинга S), то есть с направлением луча. Еще раз подчеркнем, что закон преломления определяет направление волнового фронта (вектора к) в преломленной волне, а не направление луча — потока энергии. Итак, при падении на одноосный кристалл световой волны, в нем воз- возникают две волны, распространяющихся от поверхности в общем случае в разных направлениях с разными скоростями и по-разному поляризован- поляризованных (в главной плоскости необыкновенный луч и перпендикулярно главной плоскости — обыкновенный луч). Это явление называется двойным лучепреломлением и было открыто в 1670 г. Бартолином в кристалле исланд- исландского шпата. Опыт, демонстрирующий эффект двойного лучепрело- лучепреломления, показан на рис. 10.8: узкий пучок света нормально Рис. 10.8 падает на естественную грань кристалла исландского шпа- шпата, имеющего форму ромбоэдра. Из противоположной гра- грани выходят два параллельных пучка света: несмещенный (обыкновенный) и смещенный (необыкновенный). При повороте кристалла вокруг оси пада- падающего пучка, обыкновенный луч остается неподвижным, а необыкновенный
10.4. ДИХРОИЗМ. ПОЛЯРИЗАТОРЫ 525 поворачивается вокруг оси обыкновенного луча. Лучи о и е оказываются поляризованными во взаимно перпендикулярных направлениях. 10.4. Дихроизм. Поляризаторы Еще одним проявлением анизотропии является дихроизм. Это явление со- состоит в том, что в некоторых кристаллах световая волна с определенной ориентацией вектора Е поглощается сильнее, чем волны с другой ориента- ориентацией электрического поля. Например, кристалл турмалина толщиной около 1 мм поглощает практически полностью обыкновенный луч и почти не по- поглощает необыкновенный луч. Аналогичным свойством обладает синтети- синтетический дихроичный материал, называемый поляроидом. Сильный дихроизм поляроидной пленки проявляется уже при толщине порядка 0,1 мм. Дихроичные материалы используются для получения и анализа поляри- поляризованного света, то есть в качестве поляризаторов и анализаторов. При нор- нормальном падении естественного света, который можно представить как су- суперпозицию двух взаимно-перпендикулярных колебаний (например, Ех и Еу) с хаотически изменяющейся разностью фаз и равной интенсивностью, одно из направлений колебаний совпадающее с «запрещенным» направле- направлением поляризатора (например, ж-составляющая) практически полностью по- поглощается, а составляющая света, колебания в которой совпадают с «разре- «разрешенным» направлением, проходит поляризатор без ослабления. Таким обра- образом, волна на выходе поляризатора оказывается практически полностью линейно-поляризованной, в ней ориентация вектора Е совпадает с «разре- «разрешенным» направлением поляризатора, а ее интенсивность равна половине интенсивности падающей на поляризатор волны / = Iq/2. Если теперь прошедшую через поляризатор световую волну напра- направить на второй поляризатор, разрешенное направление кото- которого составляет угол ср с разрешенным направлением первого (рис. 10.9), а значит и с плоскостью колебаний вектора Е в па- падающей на него волне, то он пропустит без поглощения лишь составляющую волны, в которой колебания поля совпадают по направлению с разрешенным направлением Р; составляющая с колебаниями, перпендикулярными Р, полностью погасится. ис< Амплитуда волны на выходе Авых будет равна Авых = Aq cos <p, а интенсив- интенсивность (квадрат амплитуды) /BbIX = /cosV (Ю.7) Это соотношение называется законом Малюса. Для получения поляризованного света используют также поляризацион- поляризационные призмы. Первая поляризационная призма (рис. 10.10), изготовленная Николем A828 г.) так и называется — призмой Ни- коля. / р г Разрезанная по диагонали АВ призма из исланд- y^-4^xl I у\ ского шпата склеивается канадским бальзамом, по- /_^ казатель преломления которого п = 1,549 меньше, чем показатель преломления щ и больше величины пе для исландского шпата. При определенных углах падения на границу раздела исландский шпат- канадский бальзам обыкновенный луч (для которого щ > п) испытывает полное внутренне отражение, а необыкновенный луч, частично отражаясь,
526 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ частично проходит через слой бальзама, так как для него исландский шпат является оптически менее плотной средой, чем бальзам (пе < п). Таким образом, луч, выходящий из призмы параллельно падающему лучу, оказы- оказывается полностью поляризованным (колебания электрического поля в нем происходят в главной плоскости). 10.5. Электрооптические и магнитооптические эффекты Эффект Керра. Многие вещества состоят из анизотропных молекул, не обладающих собственным дипольным моментом. Анизотропия этих молекул проявляется в том, что дипольный момент, который приобретает молекула во внешнем электрическом поле, зависит от направления поля. В некотором направлении молекула поляризуется внешним полем легче, чем в других (ось наибольшей поляризации). Пусть, например, электрическое поле Е направлено вдоль оси z, а мо- молекула ориентирована в пространстве таким образом, что индуцированный полем дипольный момент молекулы оказался равным р = aiE (a\ — по- поляризуемость вдоль оси z). Если поле направлено вдоль оси х или вдоль оси у, то р = о^Е. При а\ > «2 ось z является осью наибольшей поля- поляризуемости молекулы. Ясно, что при произвольном направлении внешнего поля (относительно оси наибольшей поляризуемости) дипольный момент, который преобретает молекула, не совпадает, вообще говоря, с направле- направлением поля. Хаотическая ориентация в пространстве анизотропных молекул (в жидкостях и газах) приводит к тому, что оптическая анизотропия тем не менее не проявляется: ни одна из ориентации молекул не является пре- преимущественной, поэтому макроскопически (в объеме, содержащем большое число молекул) среда оказывается оптически изотропной — характер рас- распространения света не зависит от его направления и поляризации. Если такое вещество поместить во внешнее поле, то возникающий при этом момент силы, действующей на индуцированный полем диполь, заста- заставляет молекулу повернуться таким образом, чтобы ось наибольшей поля- поляризуемости сориентировалась преимущественно вдоль поля — хаотическая ориентация осей наибольшей поляризуемости молекул сменяется частично упорядоченной ориентацией и среда становится оптически анизотропной, подобной одноосному кристаллу, в котором направление оптической оси со- совпадает с направлением поля. Световой волне, в которой вектор Е совпадает с направлением ориентирующего внешнего поля (т. е. необыкновенной вол- волне), соответствует показатель преломления пе и фазовая скорость ve = с/пе, а волне, в которой вектор Е не имеет проекции на направление внешнего по- поля (обыкновенной волне), соответствует показатель преломления щ < пе, т. е. среда во внешнем поле приобретает свойства положительного кристал- кристалла. Анизотропия, возникающая во внешнем электрическом поле, была от- открыта Керром в 1875 г. Опыт показывает, что разность фаз обыкновенной и необыкновенной волн в среде равна ср = 2тг/А(пе - no)d = 2nBdE2, A0.8) где d — путь проходимый лучом света в среде. Квадратичная зависимость разности фаз от напряженности поляризующего поля указывает на незави- независимость знака пе — щ от направления поля (вверх или вниз на рис. 10.11). Константа В называется постоянной Керра. Особенно заметно эффект Кер-
10.5. ЭЛЕКТРООПТИЧЕСКИЕ И МАГНИТООПТИЧЕСКИЕ ЭФФЕКТЫ 527 ра проявляется в нитробензоле, который обладает большим значением В: на пути d = 10 см и напряженности поля Е = 1,5 • 106 В/м разность фаз близка к значению ср ~ тг/2 (луч света распространяется в среде перпендикулярно приложенному полю). На рис. 10.11 показана схема наблюдения эффекта Керра. Между двумя скрещенными поляризаторами Р\ и Р2 (их разрешенные направления взаимно-перпендикулярны) помещается ^ I Л «ячейка Керра» — конденсатор, заполненный исследуе- исследуемым веществом. При отсутствии напряжения на конден- Г+~ саторе, луч света не проходит через систему, что указы- рис -^о 11 вает на то, что среда при отсутствии поля изотропна. При наложении внешнего поля (приложении разности потенциалов между пла- пластинами конденсатора) среда становится оптически анизотропной, поэто- поэтому линейно-поляризованная первым поляризатором Р\ волна, пройдя через среду, становится эллиптически поляризованной и частично проходит через второй поляризатор ?2- Эффект Керра проявляется также в некоторых веществах, имеющих по- полярные молекулы, дипольный момент которых не совпадает с направле- направлением оси наибольшей поляризуемости. Пусть, например, эти направления взаимно-перпендикулярны, а собственный дипольный момент существенно превосходит дипольный момент, индуцированный внешним полем. Тогда, оказавшись во внешнем поле, молекулы ориентируются преимущественно таким образом, что с направлением поля будет совпадать собственный ди- дипольный момент, а ось наибольшей поляризуемости окажется перпендику- перпендикулярной полю. Такое вещество в электрическом поле подобно отрицательно- отрицательному кристаллу. Важно отметить исключительно малую инерционность эффекта Керра: при включении поля анизотропия вещества проявляется уже через время порядка 10~12 с. Подавая на обкладки конденсатора переменное напряже- напряжение, можно использовать устройство на рис. 10.11 для прерывания (модуля- (модуляции) лазерного пучка вплоть до частот порядка 109 Гц. На этом принципе основаны высокочастотные оптические затворы. Эффект Поккельса. Электрическое поле может изменять не только оптические характеристики жидкостей и газов, оптически изотропных в от- отсутствие поля, но также и оптические свойства кристаллов. Если поместить одноосный кристалл в электрическое поле и направить вдоль оптической оси z луч света, в котором поле Е может иметь только х- и у-компоненты, то фа- фазовые скорости волн Ех и Еу становятся различными (в отсутствие поля обе компоненты имеют равные скорости vx = vy = с/щ). Это явление называет- называется эффектом Поккельса. Малая инерционность позволяет использовать эф- эффект для высокочастотной модуляции света. В отличие от эффекта Керра, разность фаз волн Ех и Еу в кристалле оказывается пропорциональной пер- первой степени напряженности поля. Изменение показателя преломления (An) при эффекте Поккельса происходит за счет смещения электронов в сложном кристалле в сторону того или иного иона (например, в случае ниобата лития LiNbO3 — это ион ниобия), при этом за счет изменения электронной кон- конфигурации меняется поляризуемость, а с ней — и показатель преломления. В силу линейности эффект Поккельса может наблюдаться лишь в кристал- кристаллах, не обладающих центром симметрии. Дело в том, что при изменении
528 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ направления ориентирующего поля на противоположное, должен изменить- измениться на противоположный и знак An. Это невозможно в кристаллах с центром симметрии, поскольку для них оба взаимнопротивоположных направления поля физически эквивалентны. Оба эффекта — Керра и Поккельса — могут проявляться как в измене- изменении свойств оптически анизотропных сред, так и в наведении искусственной анизотропии в среде, изотропной в отсутствие внешнего воздействия. Анизотропия в магнитном поле проявляется у веществ, молекулы которых обладают постоянными магнитными моментами (эффект Коттона-Муто- на, открытый в 1905 г). Эффект Фарадея. При прохождении света через вещество, помещенное в магнитное поле, наблюдается поворот плоскости поляризации (плоскости колебаний вектора Е) линейно-поляризованной световой волны. Этот эф- эффект открыт Фарадеем в 1846 г. Чтобы понять физический механизм явле- явления, следует обратиться к модели среды, которая используется в классиче- классической теории дисперсии. Необходимо лишь учесть, что кроме квазиупругой силы, действующей на оптический электрон в атоме, и силы электрическо- электрического поля световой волны еЕ, действует также сила Лоренца, обусловленная магнитным полем F л = е[гВ], где г — скорость электрона. С учетом этого обстоятельства уравнение движения электрона (при пренебрежении затуха- затуханием) имеет вид г + ш%г= (e/m)(E + [rB]). Вводя далее вектор циклотронной частоты Г2 согласно равенству П = (е/ш)В, A0.9) запишем г- [rf]]+w02r = eE. A0.10) При наблюдении эффекта Фарадея пучок линейно-поляризованного све- света направляют вдоль направления магнитного поля (оси z). В этом пучке поле Е может иметь х- и у-компоненты Ех и Еу. Для дальнейшего удобно представить линейно-поляризованную волну как суперпозицию двух волн с круговой поляризацией, в одной из которых вектор Е вращается против часовой стрелки (волна ??+), а в другой — по часовой стрелке (волна Е_). Тогда можно записать Ех = Eq cosc^t; Ey = ±Eq sinc^t, Ez = 0. Знак «+» в Еу соответствует волне Е+, а знак «—» волне Е_. Соглас- Согласно A0.9), вектор fi имеет проекции на оси (ж, у, z\ соответственно, @, 0, Г2), поэтому проекции вектора [гП] есть, соответственно, (уО, —iO, 0). Проек- Проекции векторного уравнения A0.10) на оси ж, у, z имеют вид х — Qy + oJqX = (e/m) Eq cos cj?, у + ttx + ijo\y = ±(e/m)E() sinc^t, A0.11) z + ooqZ = 0 (ясно, что магнитное поле, направленное вдоль оси z, не влияет на движение электрона вдоль этой оси). Можно убедиться непосредственной подстанов- подстановкой в уравнения A0.11), что вынужденные колебания x(t) и y(t) (решения
10.5. ЭЛЕКТРООПТИЧЕСКИЕ И МАГНИТООПТИЧЕСКИЕ ЭФФЕКТЫ 529 уравнений) имеют вид Из уравнений A0.12) ясно, что волна круговой поляризации вынуждает оптический электрон двигаться по окружности с частотой о;, причем радиус окружности R = у/х2 + у2 различен для волн со встречным направлением вращения вектора Е (т. е. для волн Е+ и Е-). Возводя левые и правые части равенств A0.12) в квадрат и складывая их, находим траекторию движения электрона (c<;q — cj^ =b OcjJ т. е. вращающийся вектор Е световой волны заставляет вращаться диполь- ный момент атома, равный по модулю р± = eR±. Таким образом, величина индуцированного дипольного момента оказывается различной для волн Е+ и EL; соответственно различна поляризация среды, диэлектрическая про- проницаемость и, следовательно, показатель преломления. Проекции индуцированного дипольного момента есть рх = ex(t) и ру = = ey(t). Напомним, что атомная поляризуемость определяется равенством Р = SooiEi. Используя A0.12), находим атомную поляризуемость для волн Е+ и Е— а± = — Заметим, что циклотронная частота О даже в очень сильных магнит- магнитных полях существенно меньше частоты света оптического диапазона {ш с± - 1015 с, О - 1010 с при В - 10 Тл), поэтому знаменатель в A0.13) удобно записать приближенно c^q — ио2 ± Ocj с± ио^ — (ио ± ОJ, тогда получим Сравним полученное выражение с формулой (9.15), определяющей атом- атомную поляризуемость а в отсутствие магнитного поля (при О = 0). Фор- Формула A0.14) может быть получена из (9.15) заменой w на о; ± (]/2 т. е. a±(uj) = а(и> =Ь О/2). Поскольку показатель преломления среды связан с а равенством п = у/е = у/1 + Na, то, соответственно п±(ш) = п(ш ± О/2) - n(o;) ± dn/ck; (O/2). A0.15) Мы пришли к следующему результату: показатель преломления для волн круговой поляризации с различным направлением вращения вектора Е раз- различен. Следовательно, различны и фазовые скорости волн Е+ и Е- — v± = с/п± — это и приводит к повороту плоскости колебаний вектора Е линейно-поляризованной волны. Поскольку величина О отрицательна (за- (заряд электрона е < 0), то n_ > n+, a v+ > V- при dn/du; > 0, т. е. в области нормальной дисперсии. Связать угол поворота плоскости поляризации с раз- разностью показателей преломления (п+ — п_) можно, используя следующие соображения.
О О\ 530 ГЛ. 10. ВОЛНЫ В АНИЗОТРОПНЫХ СРЕДАХ. ЭЛЕМЕНТЫ КРИСТАЛЛООПТИКИ Пусть на входе в среду (в плоскости z = 0) вектор Е в волне колеблется в вертикальной плоскости — вдоль линии 00 на рис. 10.13 а. Это эквивалент- эквивалентно тому, что векторы волн Е+ и Е_, поляризованных по кругу (сумма кото- которых и дает волну линейной поляризации), вращаются в противоположных направлениях с одинаковой угловой скоростью о;, занимая в любой момент времени t симметричное расположение относительно вертикальной оси 00: ср+ = ср_ = uot (считаем для простоты, что при t = 0 (р+ = if- = 0, т. е. векторы Е+ и Е_ в этот момент направлены вертикально вверх и, значит, суммар- суммарный вектор Е в этот момент имеет максимальную длину и направлен вертикально вверх). Пройдя в среде путь, равный z, волны Е+ и Е_ приобретают набег фазы, равный ср± = kz = = (ио/с) n±z — он и определяет положение векторов Е+ и Е_ в момент вре- времени t. Как ясно из рис. 10.13 б', суммарный вектор Е повернут относительно первоначальной вертикальной ориентации на угол if = A/2) (<р_ - <р+) = (ио/2с) (п_ - гс+)г, A0.16) колебания происходят вдоль направления О'О1. Используя A0.15) и A0.16), находим 'dnN duo Рис. 10.13 uj ecu dn — zB. d A0.17) P2 i- с \ duo J 2mc duo Схема эксперимента, демонстрирующая эффект Фарадея, показана на рис. 10.14. Исследуемое вещество помещается между полюсами электромаг- электромагнита. В сердечнике магнита просверлен канал, через который пропускается пучок света, линейно-поляризованный поляризато- поляризатором Pi. При отсутствии магнитного поля (ток в обмот- обмотке электромагнита выключен) свет не проходит через скрещенный поляризатор Ръ- При включении магнит- Р с 10 14 ного поля происходит поворот плоскости поляризации света на угол <р, который пропорционален пути света в веществе z и индукции магнитного поля В: ср = pzB, A0.18) где константа р называется постоянной Верде. Угол поворота плоскости ко- колебаний можно определить поворотом анализатора, определив тем самым константу р экспериментально, и сравнить полученное значение с теорети- теоретическим если закон дисперсии среды п{ш) известен. Данные эксперимента находятся в хорошем согласии с формулой A0.19), полученной на основе приведенной здесь теории. Отметим, что в соответствии с теорией, направление поворота плоскости поляризации не зависит от направления распространения света (по полю или против поля). Поместив исследуемое вещество между двумя зеркалами и заставив таким образом луч света многократно проходить путь туда-обратно, можно существенно увеличить угол поворота.
ВОПРОСЫ И ЗАДАЧИ 531 Время установления значений п+ и п_ после включения поля менее 10 9 с, что позволяет использовать эффект Фарадея для высокочастотной модуля- модуляции света. Вопросы и задачи Рис. 10.17 1. В интерфернционном опыте Юнга между щелью S и щелями Si и $2 введен поляроид Р (рис. 10.17), разрешенное направление которого параллельно либо перпендикулярно щелям Si и $2. Как изменится интерференционная картина на экране Э, если и ft и & прикрыть пластинками в Л/2, ориенти- ориентированными взаимно-перпендикулярно друг к другу (параллельно и перпендикулярно к щелям)? Что произойдет, если поляроид повернуть на 90°? Какая кар- картина будет наблюдаться, если убрать поляроид? 2. Ответить на те же вопросы, если вместо пластинок в Л/2 использовать пластинку в Л/4. 3. Некогерентная смесь линейно-поляризованного света и све- света, поляризованного по кругу, рассматривается через поляроид. Найдено положение по- поляроида, соответствующее максимальной интенсивности прошедшего света. При повороте поляроида из этого положения на угол Л = 30° интенсивность света уменьшилось на 20%. Найти отношение интенсивности света Ik, поляризованного по кругу, к интенсивности ли- линейно поляризованного света. 4. Как будет окрашена в скрещенных поляроидах кристаллическая пластинка, дающая разность хода d(ne — по) = 650 нм. Ответ: в синий свет (дополнительный к оранжевому). 5. Один поляроид пропускает 30% света, если на него падает естественный свет. После прохождения света через два таких поляроида интенсивность падает до 9%. Найти угол между разрешенными направлениями поляроидов. 6. Плоская монохроматическая волна, поляризованная по кругу, создает в точке Р интенсивность /о- На пути волны ставят две боль- большие пластинки 1 и 2 в Л/4, как показано на рис. 10.18. Главные напра- направления пластинок ориентированны взаимно-перпендикулярно. Найти интенсивность I в точке Р. 7. Расположив пластинку из исландского шпата, вырезанную па- параллельно его оптической оси, между скрещенными поляроидами, можно осуществить монохроматор, позволяющий задержать одну из спектральных ли- линий дублета натрия и пропустить другую. Какой должна быть минимальная толщина dm[n пластинки и как ее следует ориентировать? Показатели преломления пе и по для исландского шпата пе\ = 1,48654, по1 = 1,65846 (для линии Л1 = 589 нм), пе2 = 1,48652, п02 = 1,65843 (для линии Л2 = 589,6 нм). 8. Показатель преломления кристаллического кварца для длины волны Л = 589 нм равен по = 1,544 для обыкновенной волны и пе = 1,553 для необыкновенной волны. На пластинку из кварца, вырезанную параллельно оптической оси, нормально падает ли- линейно-поляризованный свет, занимающий спектральный интервал АЛ = 40 нм. Найти толщину пластинки d и направление поляризации падающего света, если свет на выходе из пластики оказался неполяризованным. 1 Рис. 10.18
ГЛАВА 11 ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ 11.1. Модель нелинейной среды В явлениях, которые мы изучали до сих пор (интерференция и дифракция, дисперсия и распространение волн в анизотропных средах), молчаливо пред- предполагалось, что характеристики среды, в которой распространяются волны (в частности ее показатель преломления п = д/б), не зависят от того, велика или мала напряженность электрического поля волны (хотя, конечно, пока- показатель преломления может зависеть от координат, если среда неоднородна и от ориентации вектора Е, если она неизотропна). Следствием является линейность волнового уравнения и справедливость принципа суперпозиции: распространение волны в среде не изменяет ее свойства, поэтому одна волна проходит в среде так, как будто другой волны нет — волны распространя- распространяются в среде, не «замечая» друг друга. Независимость показателя преломления от напряженности поля для све- световых волн, излучаемых обычными тепловыми источниками (нить накали- накаливания электрической лампы, нагретый газ и т. д.), обусловлена пренебре- жимой малостью поля световых волн по сравнению с внутренним микро- микроскопическим полем в веществе. Напряженность поля в излучении обычных источников не превосходит величины порядка 104 В/м. Сравните эту ве- величину например, с полем, действующим на электрон в атоме водорода е/Dтг?0Д2) ^ 1,5 • Ю11 В/м. Можно ожидать, что световая волна изменит характеристики среды, если ее поле окажется сравнимо с внутриатомными полями в веществе. Возмож- Возможность получения интенсивных пучков света появилась после создания лазе- лазеров (Прохоров, Басов, Таунс — 1954 г.). В сфокусированном лазерном пучке напряженность поля достигает значений порядка 108-1010 В/м. Именно ла- лазеры открыли по-настоящему эру нелинейной оптики (хотя и до их создания отдельные нелинейные эффекты в оптике наблюдались). Чтобы понять механизм влияния интенсивных световых волн на свойства среды, полезно вернуться к модели, которую мы использовали ранее: мате- материальная среда представляет собой набор осцилляторов (не взаимодейству- взаимодействующих между собой в простейшем случае). Осциллятор — это оптический электрон в атоме. Исследуя ранее явление дисперсии, мы молчаливо предпо- предполагали, что напряженность поля световой волны достаточно мала, поэтому малым оказывается смещение электрона из положения равновесия, вызван- вызванное этим полем. При малых смещениях г, сила, действующая на электрон со стороны поля ядра и стремящаяся вернуть электрон в положение равно- равновесия, предполагалась пропорциональной смещению (квазиупругая сила): f = -Ат, A1.1)
11.2. ЭФФЕКТ УДВОЕНИЯ ЧАСТОТЫ. ОПТИЧЕСКОЕ ВЫПРЯМЛЕНИЕ 533 подобно тому, как малые деформации пружины при ее растяжении или сжа- сжатии приводят к линейной зависимости упругой силы от величины деформа- деформации — закон Гука. Исходя из линейной связи A1.1) мы и получали ранее линейную связь между поляризацией среды и напряженностью поля све- световой волны Р = ?охЕ, где х — поляризуемость среды — определяется формулой (9.11) и не зависит от Е. В сильных полях смещение уже нельзя считать малым, при этом связь между силой и смещением усложняется: в линейное соотношение A1.1) сле- следует ввести нелинейные поправки. Для того, чтобы понять, какова их роль и к каким эффектам они приводят, будем далее полагать что поправки, возни- возникающие в сильных полях, являются все же малыми по сравнению с первым (линейным) слагаемым. f = -A;r + /r2 + gr3, A1.2) здесь / и q константы, и именно они, как мы увидим далее, приводят к новым оптическим эффектам. В общем случае в анизотропной среде направление смещения г не совпа- совпадает с направлением «упругой силы», возвращающей электрон в положе- положение равновесия, однако мы далее будем пользоваться упрощенной моделью, считая, что векторы f и г параллельны (т. е. в равенстве A1.2) /г = 1тг и qr3 = qr2r). 11.2. Эффект удвоения частоты. Оптическое выпрямление Рассмотрим вначале эффекты, к которым приводит наличие лишь первой нелинейной поправки, т. е. f = -kr + lr2. A1.3) Отметим, что такого рода зависимость невозможна в изотропных средах или в кристаллах, обладающих центром симметрии, например, в кубических кристаллах, поскольку согласно A1.3), изменение знака смещения (—г вме- вместо г) приводит к изменению величины силы / (при замене г на —г второе слагаемое не меняет знака, а первое изменяет, поэтому суммарная сила / изменяет величину). Уравнение движения электрона, осциллирующего под действием поля Е(?) световой волны, имеет при этом вид гаг = -кг + /г2 + еЕ(?) (вновь пренебрегаем затуханием, полагая, что частота поля световой волны далека от собственной частоты осциллятора). В силу сделанных выше предположений можно перейти к скалярному уравнению r-uolr + (//га) г2 = (е/га) E(t), где ujq = у/к/гп — собственная частота малых колебаний осциллятора. Умножая левую и правую части последнего равенства на Nq, перейдем от уравнения для смещения г к уравнению для поляризации среды Р = Ner = = Np (p = ег — дипольный момент осциллятора, N — число осцилляторов в единице объема) Р + ulP - l/(Nem) P2 = (Ne2/m) E(t). A1.4)
534 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ Колебание поля световой волны E(t) считаем гармоническим E(t) = = Eq COS OUt. Малость нелинейной поправки (l/(Nem)P2 <С c^qP) позволяет при реше- решении уравнения A1.4) воспользоваться методом последовательных приближе- приближений: решение уравнения будем искать в виде Р(?) = Po(t) + Pi(?), где Po(t) — нулевое приближение — решение линейного уравнения, которое получается из A1.4) отбрасыванием нелинейного члена l/(Nem) P : Ро+ш%Ро = (Ne2/m)E0 cos ut, A1.5) ому п Ne2 /т а Р\ (t) — малая поправка к нулевому приближению (Pi (t) <С Po(t)). Решение Po(t) хорошо известно: 9 — UJ1 A1.6) Коэффициент пропорциональности между Po(t) и E(t) — это поляризуе- поляризуемость линейной среды хо (не зависящая от напряженности поля E(t)) (лл ^ Щ — UJ1 Колебания поляризации Po(t) происходят с частотой световой волны ш и приводят к переизлучению на той же частоте. Поляризуемость Хо(^) яв- является функцией частоты ио. Эта функция и определяет хорошо извест- известный закон дисперсии в линейном приближении. Далее, подставляя функ- функцию P(t) = Po(t) + Pi(t) (с уже найденным нулевым приближением Po(t)) в уравнение A1.4), получаем P0 + Pi+ ^о(ро + Pi) - l/(Nem) (Po + Р\J = (Ne2/m) Eo cosoot или, в силу A1.5) А + си^Рг = l/(Nem)(P0 + PiJ. A1.8) Это и есть уравнение для нахождения поправки Р\ (t) к найденному решению Ро(?). В правой части уравнения A1.8) члены, содержащие P2(t) и Pq(?)Pi(?) можно отбросить (они малы по сравнению с членом, содержащим P^(t)), поэтому А + w02P! = l/(Nem) P2(t), A1.9) где Po(t) — решение линейного уравнения A1.5) — определяется форму- формулой A1.6), т. е. Pi + uolPi = l/(Nem) ?0X0^0 cos2 ^ (Хо — линейная диэлектрическая восприимчивость), или, т. к. cos2 u)t = 1/2+ + A/2) cos2o;t Pi + ulPi = CEl + QEl cos 2ut, где введена константа C C = lx2oe2o/BNem). Итак, для поправки Pi к нулевому приближению мы получили линейное дифференциальное уравнение. Точно такой же вид имеет уравнение гармо- гармонического осциллятора, на который действует внешняя сила, состоящая из
11.2. ЭФФЕКТ УДВОЕНИЯ ЧАСТОТЫ. ОПТИЧЕСКОЕ ВЫПРЯМЛЕНИЕ 535 двух слагаемых: постоянной силы, равной mf3E^ и гармонической внешней силы, меняющейся с частотой 2cj. Соответственно, и решение Р\ (в силу линейности уравнения) состоит из двух слагаемых. Одно из них (отвечаю- (отвечающее постоянной внешней силе) имеет вид Р[ = /ЗЕ^/с^, т. е. при постоянной внешней силе осциллятор отклоняется от положения равновесия на посто- постоянную величину (свободные колебания осциллятора относительно постоян- постоянного значения Р[ рано или поздно прекращаются при сколь угодно малом реально существующем затухании). Второе слагаемое, отвечающее гармони- гармонической внешней силе частоты 2cj, как легко убедиться, имеет вид BE2 Итак, к колебанию поляризации среды Po(t) = SoXoE(t), изменяющейся с частотой возбуждающей волны E(t), прибавляются два слагаемых: одно из них — постоянная (не меняющаяся во времени) добавка к поляризации Р = /ЗЕ^/ш^ и второе слагаемое — колебание поляризации i^W? происхо- происходящее с удвоенной частотой. Итак: BE2 BE2 P(t) = ?ОХоЕо cos ojt+tL<L+ f о CO82cjt. (П.П) Согласно A1.11), колебание гармонического светового поля E(t) возбу- возбуждает в среде колебание поляризации, которое не является гармоническим. Спектр функции P(t) содержит кроме компоненты частоты ио (совпадаю- (совпадающей с частотой колебаний световой волны) также и спектральную компо- компоненту удвоенной частоты, а также постоянную составляющую. Мы хорошо знаем, что в линейных системах внешнее гармоническое воздействие приво- приводит к возникновению вынужденных колебаний, частота которых совпадает с частотой внешней силы. Присутствие двух последних слагаемых в A1.11) свидетельствует о возникновении двух нелинейных эффектов. Постоянная добавка к поляризации среды ответственна за появление в среде постоянных, не меняющихся во времени поляризационных зарядов. Эти поляризационные заряды создают свое собственное постоянное, не ме- меняющееся во времени, электрическое поле. Итак, в нелинейной среде бы- стропеременное поле световой волны (меняющееся со световой частотой и) порождает постоянное не меняющееся во времени поле. По понятным при- причинам этот нелинейный эффект называют оптическим выпрямлением. Последнее слагаемое в A1.11) — колебание поляризации с удвоенной ча- частотой. Это колебание приводит к переизлучению на частоте 2ш. Таким образом монохроматическая световая волна частоты ио приводит к возникнове- нию в среде переизлученной волны удво- енной частоты. Волна удвоенной частоты ^ существует, конечно, наряду с переизлу- 1 чением на частоте о;, обусловленным пер- первым слагаемым в поляризации P(t). .тис. 11.1 Схема одного из первых экспериментов, демонстрирующая эффект удво- удвоения частоты, показана на рис. 11.1. Импульс излучения рубинового лазера 1 (Ai = 694,3 нм) фокусировал- фокусировался с помощью объектива JIi в кристалле кварца 2. Мощность в импульсе
536 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ длительности ~ 10 мкс составляла приблизительно 10 кВт. Изучение, вы- выходящее из кристалла, содержит кроме переизлучения с длиной волны Ai также и вторую гармонику (А2 = 347,15 нм), лежащую в ультрафиолетовой области спектра. Оно анализируется с помощью призменного спектрогра- спектрографа 3. В первых экспериментах A961 г.) мощность, преобразованная во вторую гармонику, составляла приблизительно 0,1 мВт, т. е. около 10~8 мощности исходного лазерного импульса. Чтобы понять, почему в первых экспериментах коэффициент преобразо- преобразования энергии исходной волны в волну второй гармоники оказался столь малым, а также понять, каким образом можно его увеличить, рассмотрим более детально волновые процессы, происходящие в нелинейном кристалле. Итак, пусть исходная волна, бегущая в кристалле, имеет вид E(z, t) = Eq cos(ojt — k\z). Это плоская волна частоты о;, волновое число к\ этой волны определяет ее фазовую скорость v = ш/ki = с/п(ш), n(uj) — показатель преломления для волны, имеющей частоту и. Эта волна возбуждает в каждой точке среды колебания поляризации с частотой 2cj, определяемые формулой A1.10). Существенно, что волна по- поляризации P2(z, t) бежит с той же фазовой скоростью, что и исходная вол- волна E(z, t). Действительно, если принять, что колебания поля (при любом фиксированном z) происходят по закону Eq cos cot, то колебания P2{t) про- происходят по закону A1.10), т. е. без сдвига фазы, который зависел бы от z. Ясно поэтому, что волна поляризации P2(z, t) имеет вид P2(z, t) = AcosBut - 2kiz), т. е. волновое число этот волны есть 2&i, а ее фазовая скорость v = 2ujj2k\ = = ио/к\ как раз оказывается равной фазовой скорости исходной волны. Эту волну поляризации можно рассматривать как бегущую в среде антенну или движущийся и колеблющийся с частотой 2lo электрический диполь. Как следствие (см. часть «Электричество и магнетизм»), должна излучиться волна второй гармоники E2(z, t) частоты 2ш E2(z, t) = BcosBu;t - k2z). Из-за дисперсии ее фазовая скорость v2 = 2ои/к2 = c/nBoj) не равна, вооб- вообще говоря, фазовой скорости исходной волны, (т. к. п(ш) ф nBuj)\ а значит, и фазовой скорости волны поляризации P2(z, ?), т. е. скорости излучающей эту волну антенны. Это означает, что между волнами, излучаемыми «ан- «антенной» в разные моменты времени (и в разных местах) возникает фазовый сдвиг, равный Аср = (к2 — 2k\)z. Пока путь волны в кристалле достаточно мал: Аср= (k2-2k1)z^n, A1.12) все «вторичные волны», излученные бегущей антенной, складываются син- фазно, поэтому амплитуда суммарной волны нарастает.
11.2. ЭФФЕКТ УДВОЕНИЯ ЧАСТОТЫ. ОПТИЧЕСКОЕ ВЫПРЯМЛЕНИЕ 537 Такое синфазное сложение схематически показано на рис. 11.2: все три волны, излученные бегущей антенной А в положении 1, 2, 3 оказывают- оказываются почти синфазными, и энергия исходной волны преобразуется в энергию второй гармоники. Условие A1.12), при котором волны второй гармоники, испущенные разны- разными осцилляторами среды, складываясь синфазно, образуют в сумме волну, амплитуда которой при распространении в кристалле нарастает, называется условием фазового синхронизма. Эффективное расстояние, на котором энер- энергия второй гармоники нарастает, называется длиной когерентности. Мы по- получаем /ког-тг/(^-2?;1), A1.13) где к\ = (шI'с)п(ш), &2 = Bш/с)пBш). Для кварца разность показателей преломления пBи) —п(ио) ~ 0,025 (для длины волны А = 2пс/и; = 694,3 нм). Согласно A1.13), длина когерентности оказы- вается черезвычайно малой: /ког ~ 10А ~ —- —— ~ 10~2 мм. При увеличении пути в кристалле ^ > /ког расфазировка вторичных волн, излу- ченных бегущей антенной (волной поляриза- поляризации P2{z-> t)) становится существенной: ампли- амплитуда суммарной волны на частоте 2си начинает уменьшаться, а значит, происходит обратная «перекачка» энергии второй гармоники в ис- 3 ходную волну. Таким образом, по мере рас- распространения в кристалле, волна второй гар- гармоники периодически (с периодом 2/ког) то Рис. 11.2 нарастает, то уменьшается. Качественно зависимость интенсивности второй гармоники от глубины проникновения в кристалл показана на рис. 11.3. Про- Проблема, следовательно, состоит в том, чтобы увеличить длину когерентности и таким образом увеличить размер области, в ко- которой амплитуда второй гармоники нарастает. Заметим, что в изотропной среде условие A1.12) невозможно выполнить на всем пути рас- распространения волны в кристалле: из-за диспер- дисперсии (п(ш) т^ п{2и))) оно рано или поздно нару- нарушается. Однако, если волна распространяется в 0 /ког анизотропном кристалле, можно, при определен- ном направлении распространения относительно -тис. а.6 оптический оси, добиться выполнения условия по(ш) = пеBш) — равенства показателей преломления обыкновенной волны частоты и; и необыкновенной волны частоты 2и. Напомним, что в линейных средах (т. е. в слабых полях) векторная связь Р = %Е, справедливая для изотропных сред, заменяется тензорной связью в анизотропной среде: Pi = 3 (каждый из индексов i, j пробегает значения 1, 2, 3, соответствующие про- проекциям на оси z, ж, у).
538 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ Соответственно, если речь идет о нелинейной среде, то вместо связи р = хЕ + 6Е2, справедливой для изотропной среды, в анизотропных кристаллах имеет ме- место равенство: JEJ + Yl bvkEjEk. A1.14) 3 3, к Будем считать для определенности, что индекс 1 соответствует оптической оси z, а индексы 2 и 3 — двум другим главным направлениям х ж у. Если исходная волна в кристалле является обыкновенной, вектор Е в этой волне перпендикулярен оптической оси (проекции Ej и Е^ равны нулю при j, к = 1), но благодаря нелинейным слагаемым в A1.14), содержащим про- произведения Ej Efr (т. е. величины Е^^з? Е\ и Е\\ проекция вектора поляри- поляризации Р на оптическую ось z (ось 1) оказывается отличной от нуля: Р\ ш' содержит слагаемые, пропорциональные величинам Е^ • Е%\ Е^ • Е^ и Е?з * ^з • ДРУГИМИ словами, благодаря нелинейности обыкновенная волна частоты lo порождает колебания поляризации, которые происходят с удво- удвоенной частотой вдоль оптической оси (индексы вверху подчеркивают, что колебания Е2 и Е% происходят с частотой о;, а проекции вектора поляриза- поляризации на оптическую ось Р\ — с частотой 2ш). Колебания поляризации Р{ , параллельные оптической оси, порождают световую волну удвоенной часто- частоты (вторую гармонику), в которой колебания вектора Е также параллельны оптической оси, т. е. вторая гармоника в кристалле яв- является необыкновенной волной. Далее, в некоторых кристаллах можно выбрать направление распростра- распространения, в котором фазовая скорость необыкновенной волны частоты 2ио оказывается равной фазовой ско- скорости обыкновенной волны частоты ио. Рис. 11.4 ил- иллюстрирует такую возможность. Например, в отрицательном одноосном кристалле дигидрофосфата калия КН2РО4 (краткое название KDP), имеется направление распространения (целый конус направлений), где волновая поверхность обык- обыкновенной волны частоты ио (сфера vq(uj)) пересекает- пересекается с волновой поверхностью частоты 2и> необыкновенной волны (эллипсоид veBw)), т. е. в этом направлении, составляющем угол в с оптической осью (в кристалле KDP в = 41,5°) фазовая скорость исходной (обыкновенной) вол- волны в кристалле совпадает со скоростью необыкновенной волны частоты 2cj, излучаемой волной поляризации. Для этого направления условие фазового синхронизма А;2 = 2к\ выполняется при любом z, а это означает, что на всем пути распространения волны второй гармоники в кристалле ее амплитуда нарастает (происходит перекачка энергии из исходной волны). Таким обра- образом удается существенно увеличить коэффициент преобразования исходной волны во вторую гармонику. Так, в опытах с кристаллом KDP, в которых используется лазер на неодимовом стекле (Ai = 1,06 мкм — инфракрасное излучение) во вторую гармонику (А2 = 0,53 мкм — зеленый свет) преобра- преобразуется до 30% энергии исходной волны. Рис. 11.4
11.3. ГЕНЕРАЦИЯ ТРЕТЬЕЙ ГАРМОНИКИ 539 11.3. Генерация третьей гармоники. Самофокусировка и самоканализация Рассмотрим теперь эффекты, возникающие благодаря кубической нели- нелинейной поправке в A1.2): f = -kr + Cr3. A1.15) Такого рода зависимость проявляется и в изотропных средах, где квадра- квадратичная нелинейность —/г2 отсутствует (обратим внимание, что изменение знака г приводит к изменению знака силы, но не меняет ее абсолютную величину, что характерно для изотропной среды). Уравнение движения осциллятора имеет в этом случае вид тг + кг — /Зг3 = Eq cos cot. Мы по-прежнему полагаем, что затухание отсутствует, а поле световой волны меняется по гармоническому закону с частотой ио. Переходя, как и ранее, к уравнению для поляризации Р = TVer, получаем P + oolP ^— р3 = — ?0 cosoot. A1.16) mN2e2 m Вновь используем метод последовательных приближений: будем искать решение A1.16) в виде где Рз ^ Ро — малая поправка к решению Po(t) линейного уравнения A1.5), которое, как мы знаем, описывается функцией A1.6). Подставляя реше- решение A1.17) в уравнение A1.16) и оставляя в нелинейном слагаемом (Pq+РзK лишь член Pq (поскольку остальные слагаемые малы в сравнении с Pq ), по- получим для нелинейной поправки Рз линейное дифференциальное уравнение Рз + оо2оР3 = ^_ хзЕз СО8з ш1_ A1 Л8) Точно такой же вид имеет уравнение линейного осциллятора, вынужден- вынужденные колебания которого возбуждаются внешней силой, меняющейся со вре- временем пропорционально cos3 uot. Поскольку cos3ct;t = Ccosct;t + cos3ct;t)/4, то правая часть A1.18) —«внеш- —«внешняя сила» — представляется суммой двух сил, одна из которых меняет- меняется с частотой cj, а вторая — с утроенной частотой 3ct;. Соответственно, и вынужденные колебания Р%(ио) также являются суммой гармонических колебаний с частотами ио и Зс<л Найдя решение, отвечающее каждому из двух слагаемых правой части A1.18), получим в результате полное выра- выражение для поляризации среды Р(?), которое с учетом линейного слагаемого Ро(?) = боХо^о cosc^t имеет вид P(t) =6oxo (I + hE^Eo cos ojt + b2E% cos 3cj?, A1.19) где b\ и &2 — константы, определяемые равенствами
540 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ Таким образом, кубичная ангармоничность (т. е. поправка к линейной за- зависимости / = — кг, пропорциональная кубу смещения г) приводит к двум эффектам. Во-первых, изменяется поляризуемость среды на частоте и; световой волны: X = Хо + XiEq, где xi = Хо&ь A1.20) причем это изменение пропорционально квадрату напряженности поля Eq (т. е. пропорционально интенсивности волны); хо — линейная поляризуе- поляризуемость среды, т. е. поляризуемость, не зависящая от напряженности поля волны в среде. Во-вторых, возникают колебания поляризации с частотой Зс<л Эти коле- колебания генерируют в среде волну утроенной частоты — нелинейный эффект, называемый генерацией третьей гармоники. Остановимся более подробно на первом из упомянутых эффектов. Будем рассматривать лишь волну, частота которой равна частоте и; пада- падающей на среду волны. Поляризуемость среды на этой частоте определяется формулой A1.20), соответственно, диэлектрическая проницаемость и пока- показатель преломления среды на частоте ш есть е = 1 + Х= A + Хо) - Считая поправку к линейному показателю преломления по = д/1 + Хо ма" л ой, получим П = П0 +П1#о, (И-21) где ni = xi/Bra0). Рассмотрим пучок света ограниченного сечения частоты ш распространяю- распространяющийся в нелинейной среде вдоль оси z, рис. 11.5. Согласно A1.21), в пределах сечения пучка показатель преломления под действи- действием поля в пучке увеличивается (п > по); вне пучка, при х > d/2 показатель преломления остается равным по (рис. 11.6). В лазерных пучках света интенсивность обычно максимальна у оси пучка (на оси z) и спадает к краям. Соответственно и показатель преломления п Рис. 11.5 максимален на оси, постепенно уменьшаясь к краям, т. е. среда под действием светового пучка становится подобной собирающей линзе. Диаметр пучка по мере распространения в среде постепенно уменьшается так, как если бы на его пути находилась фокусирующая линза. Этот нелинейный эффект называется самофо- Рис. 11.6 кусировкой. Разумеется, фокусирующему воздействию нелиней- нелинейной среды препятствует дифракционная расходимость пучка: в обычной (линейной) среде с показателем преломления п пучок сечения d с плоским волновым фронтом не может распространяться, оставаясь параллельным пучком неизменного сечения. Угловая расходимость пучка, определяемая дифракцией, равна sin#o — A/d = Ao/(nd), где Ао — длина волны в ваку- вакууме. Смысл последнего равенства состоит в следующем: пучок света ограни- ограниченного сечения может быть представлен суммой плоских волн разных на- направлений, причем в этой сумме заметную амплитуду имеют лишь плоские
11.4. ПАРАМЕТРИЧЕСКИЕ ПРОЦЕССЫ В НЕЛИНЕЙНЫХ СРЕДАХ 541 волны, направления которых (углы с осью z) ограничены углом 6q. Если для волны, распространяющейся под углом #о? выполнено условие полного вну- внутреннего отражения на границе пучка и окружающей среды: sinanpeA = щ/п (рис. 11.6), то и для всех волн, направления которых #<#о? это условие так- также будет выполнено, т. е. дифракционная расходимость пучка оказывается полностью скомпенсированной фокусирующим эффектом полного отраже- отражения. Получаем = cos#0 = no/(no + ni?;o)- A1.22) Поскольку разность показателей преломления п — щ = n\El мала, то cos^o близок к единице. Тогда cos#o — 1 — #о/2. Правую часть равенст- равенства A1.22) также приближенно представим в виде Щ 1 П0 + П\Щ 1 - откуда получаем 6q ~ Bni/no) Eq. Используя далее выражение для угла дифракционной расходимости sin#o — #о = ^o/nod, находим El ~ \Ц Bn0nid2) . A1.23) Последняя формула определяет пороговое значение напряженности поля в световой волне, при которой пучок распространяется в нелинейной среде без расходимости, (т. е. дифракционная расходимость компенсируется пол- полным внутренним отражением) и сечение пучка остается неизменным. Этот нелинейный эффект называется самоканализацией. Свяжем напряженность поля Eq с мощностью пучка, т. е. с потоком энер- энергии, проходящим через сечение пучка в единицу времени. Мы имеем S = = ?qc ЕВ — абсолютная величина вектора Пойнтинга и, поскольку В = = Еп/с, то (S) = ?осп(Е2) = cnElso/2. Эта формула определяет поток че- через единичную площадку. Полный поток через сечение пучка диаметра d равен Р = E)тгA2/4 = 7Г?оспЕ^с12/8 откуда El = 8Р/(тг?оспс12) и, исполь- используя A1.23), находим окончательно A1.24) Например, пороговая мощность излучения рубинового лазера (А=694,3 нм) в сероуглероде равна приблизительно РПор — 20 кВт. 11.4. Параметрические процессы в нелинейных средах Пусть в среде с квадратичной нелинейностью A1.3) распространяются две монохроматические волны с частотами ш\ и с^2- E\{t) = Eicosc^it и i?2(?) = E% cosuizt. Повторяя выкладки проведенные в гл. 11.2, вновь придем к уравнению A1.9), определяющему поправку P\{t) к линейному приближе- приближению Po(t). Последнее в нашем случае является решением уравнения Ne2 Ро + JqPo = (-Ei cos u)\t + E2 cos ^i). lib Решение этого (линейного) уравнения является, очевидно, суммой двух решений, каждое из которых отвечает «своей» правой части
542 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ где xi и Х2 — диэлектрические восприимчивости на частотах ш\ и Ш2 Ne2 _ Ne2 Х.1 / о 9\"' А-2 / о 9\~ * Подставляя это решение в A1.9), находим Наличие в правой части слагаемых, содержащих квадраты полей E\(t), и E2(t) приводит к уже рассмотренным нами эффектам: генерации вторых гармоник с частотами 2ш\ и 2<^2 и оптическому выпрямлению (появлению постоянного электрического поля). Новый эффект, который здесь возникает, связан с наличием в правой ча- части слагаемого, содержащего произведение coscjitcostt^t, что эквивалентно сумме двух колебаний с частотами ш\ + Ш2 и ш\ — Ш2- Соответственно, не- нелинейная поправка к поляризации P\{t) содержит колебания на частотах ио\ + 002 и ио\ — с^2, что приводит к переизлучению на этих частотах, причем амплитуды волн пропорциональны произведению Е\Е2 амплитуд исходных волн с частотами ш\ и^. Генерация волн с суммарной и разностной часто- частотой позволяет получать когерентное излучение в более широком диапазоне частот. Кроме того, появляется возможность, смешав в нелинейном кристал- кристалле инфракрасное излучение (ИК) с видимым светом, преобразовать частоту ИК диапазона в видимый спектр, где шумовые характеристики существую- существующих приемников света существенно лучше приемников ИК области спектра. Качественно эффект возникновения комбинационных частот в излуче- излучении, прошедшем нелинейную среду, можно понять следующим образом. Пусть волна частоты uj\ имеет достаточно большую амплитуду, так что ее распространение в среде приводит к изменению оптических свойств среды с частотой cl?i, т. е. под действием этой волны возникает модуляция показа- показателя преломления среды, а следовательно, модуляция фазы второй волны. Мы знаем, что спектр колебания, имеющего несущую частоту L02-, фаза ко- которого промодулирована с частотой cji, содержит компоненты с боковыми частотами uj\ ± UJ2- Сказанное выше позволяет понять идею параметрического усиления све- света, предложенную С. А. Ахмановым и Р. В. Хохловым в 1962 году. Пусть в среде распространяются волны с частотами ио\ и ио2 и пусть волна частоты ш\ имеет большую амплитуду, приводящую к нелинейному изме- изменению свойств среды (возникновению квадратичной нелинейности в кри- кристалле). Назовем мощную волну Е\ частоты uj\ волной накачки, а слабую волну Е2 частоты uj2 сигнальной волной. Это приводит, как мы видели, к появлению нелинейной добавки P\{t) к поляризации среды Po(t), которая осциллирует с частотой uji — 0J2 = 003- Колебания поляризации с частотой и>з индуцируют в среде вторичные волны — переизлучение на этой частоте. Волна поляризации Pi (r, t) = A\ cos (ct^ — (ki — k2)r) распространяется в среде с фазовой скоростью г>ф = с^з/А:, где k = ki — к2- Направим теперь на нелинейный кристалл, в котором распространяются волны с частотами uj\ и UJ2-! третью волну малой интенсивности, частота которой равна uj\ — 002 = ^з- Эту волну называют холостой. Выберем направление холостой волны (вол- (волновой вектор кз) так, чтобы выполнялось условие кз = ki — к2- Тогда ее
11.5. КОМБИНАЦИОННОЕ РАССЕЯНИЕ СВЕТА 543 уравнение имеет вид E3(t, г) = А3 cos^t - к3г), а ее фазовая скорость Уф = oj^/ks совпадает с фазовой скоростью волны поляризации. Переизлученные волной поляризации Pi (r, t) вторичные волны оказыва- оказываются при этом точно сфазированными с волной Ез(г, t) (выполнено условие фазового синхронизма): к3 = кх - к2. A1.25) Амплитуда колебаний волны поляризации пропорциональна амплитуде волны накачки (частоты c^i), поэтому и вторичные волны частоты с^з также пропорциональны ее амплитуде. В результате исходная слабая волна Е%, благодаря фазовому синхронизму со вторичными волнами той же частоты, усиливается по мере прохождения в нелинейной среде, черпая свою энер- энергию из исходной сильной волны — явление называется параметрическим усилением света. Поместим нелинейный кристалл (например, кристалл е{ /^;;>;>j\2 * с°2 ниобата лития LiNbO3 или KDP) между зеркалами М\ и -^ (%§§:) -^юз М2 оптического резонатора (рис. 11.7). Кристалл сори- сориентируем таким образом, чтобы для волны Е\ (волны Рис. 11.7 накачки частоты ио\)^ а также некоторых волн Е2 и Е^^ распространяющих- распространяющихся вдоль оси резонатора перпендикулярно поверхности зеркал М\ и М2, частоты которых UJ2 и с^з удовлетворяют условию резонанса, выполнялось условие фазового синхронизма A1.25). Волна накачки Е\ от внешнего ла- лазера попадает на кристалл через зеркало Mi, прозрачного для волны Е\. Слабое излучение Е2 и Е<$ (с частотами иJ и и)%) существует в резонаторе благодаря колебаниям осцилляторов, возбужденных тепловым движением. Для волн ?^2 и ?з5 частоты которых удовлетворяют условию с^2 +<^з = ^Ъ а волновые векторы — условию фазового синхронизма к2 + кз = ki, возника- возникает усиление первоначально слабого спонтанного излучения на частотах с^2 и ь)<$- Если, при достаточно мощной волне накачки, усиление превосходит потери за проход (включая потери при отражении от зеркал, поглощение и рассеяние), происходит самовозбуждение генератора. Изменение ориентации кристалла приводит к тому, что условие фазового синхронизма выполняет- выполняется для другой пары частот с^2 и с^з, т. к. благодаря изменению показателя преломления необыкновенной волны, распространяющейся вдоль оси резо- резонатора, изменяются волновые числа. Таким образом, может осуществлять- осуществляться плавная перестройка частоты генерации. Генерация волн с частотами UJ2 и ш% происходит благодаря модуляции параметров нелинейной среды под действием поля волны накачки, что и обуславливает название — параме- параметрическая генерация. В связи со сказанным выше имеет смысл вспомнить о параметрической раскачке механических или электрических колебаний (гл. 3). 11.5. Комбинационное рассеяние света В линейном приближении квазиупругая сила, действующая на оптический электрон со стороны поля ядра, может быть представлена как производная от потенциальной энергии U(r) = kr2 /2: / = —dU/dr = —kr.
544 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ Если смещение г электрона не мало, то в выражении для потенциальной энергии следует учитывать следующий член разложения в степенной ряд по г потенциальной энергии U{r) = k-^-\lr\ A1.26) откуда получается квадратичная поправка к квазиупругой силе / = -dU/dr = -kr + lr2. При этом следует учесть, что потенциальная энергия в положении равно- равновесия г = 0 принимается равной нулю и, кроме того, линейный по г член в выражении U(r) отсутствует, поскольку положение равновесия соответству- соответствует минимуму потенциальной энергии, т. е. (dU/dr)^ = 0. Изучая поведение оптических электронов в поле световой волны, мы по- полагали, что из-за большой массы ядра атомов не смещаются. Рассмотрим теперь эффекты, возникающие при учете этого смещения. Пусть смещение ядра относительно узла кристаллической решетки, где оно находится в от- отсутствии поля, либо относительно положения равновесия в молекуле жид- жидкости или газа есть R. При учете этого смещения потенциальная энергия (как функция двух переменных г и Л) может быть записана в виде U(г, R) = ^ + ^ + \lrz + \LRZ + f3r2R + arR2. A1.27) Используя это выражение, получаем силу, действующую на электрон. Она имеет вид т^щ_ = _kr _ lr2 _ 2f3rR_aR2 дг Эффект, связанный с появлением квадратичной поправки по г мы уже обсуждали. Он отличен от нуля лишь в анизотропной среде и приводит к генерации второй гармоники. Здесь мы его учитывать не будем. Послед- Последнее слагаемое зависит только от закона колебания ядра i?(?), которое из-за большой массы имеет низкие частоты, далеко выходящие за рамки оптиче- оптического диапазона (соответствующее излучение осцилляторов приходится на далекую инфракрасную область). Это слагаемое мы также рассматривать не будем. В результате остаются два слагаемых f = -kr- 2CrR, причем второе (нелинейное) слагаемое является малой поправкой к квази- квазиупругой силе —кг. Используя полученное выражение, имеем уравнение движения электрона тг + (к + 2/3R)r = еЕ$ cos u)t. Вводя эквивалентную жесткость квазиупругой силы k(R) = k-\-2f3R, имеем г + ujq(R)t = (е/т) Eq cosc^t, где зависящая от движения ядра собственная частота осциллятора равна Vo(R) = к/т + 2/3R/m = ш% + 2/3R(t)/m. A1.28)
11.5. КОМБИНАЦИОННОЕ РАССЕЯНИЕ СВЕТА 545 Переходя от уравнения для г к уравнению для поляризации Р = получаем P + oj%(R)P = (Ne2/m)E0 cos cut. A1.29) Обратимся теперь к уравнению, описывающему колебания ядра массы М ^> т. Упругую силу, действующую на ядро, найдем, дифференцируя выражение для энергии A1.27) по координате R: F = dU/dR = -KR - LR2 - 2arR - Cr2. Априори ясно, что смещение ядра мало, поэтому членом —LR2 можно пре- пренебречь. Третье слагаемое не существенно, так как произведение rR меня- меняется с частотой, близкой к частоте колебаний электрона, которая велика по сравнению с частотой колебаний тяжелого ядра (другими словами, за вре- время, равное периоду колебаний ядра, это слагаемое в силе F(t) множество раз изменяет знак, поэтому его усредненное влияние ничтожно). Остаются лишь два слагаемых: F = -KR-Cr2. A1.30) Как следует из последнего равенства, влияние движения электрона r(t) на колебания ядра существенно лишь в случае сильного поля, когда необхо- необходимо учитывать нелинейное слагаемое. В слабых полях (обычных тепловых источников света) им можно также пренебречь. В этом случае уравнение движения ядра имеет вид mR = —KR + еЕо cos u)t. Наконец, влиянием поля световой волны высокой частоты ш пренебрежем (так же, как мы пренебрегли быстро меняющимся слагаемым — 2агД), и мы получаем уравнение свободных колебаний Д + О2Д = 0, где О2 = К/М. Возбуждаются эти колебания благодаря тепловому движе- движению атомов и молекул, их средняя энергия пропорциональна температуре. R(t) = До cos Ш. Для молекул частота О лежит в инфракрасном диапазоне спектра. Вернувшись теперь к уравнениям A1.28) и A1.29), мы видим, что коле- колебания ядра (или совокупности ядер, образующих молекулу) приводят к мо- модуляции собственной частоты ujq(R) осциллятора, частота модуляции равна О, а глубина модуляции — отношение амплитуды переменного слагаемого к постоянному слагаемому — f3R$/(ти^), обычно много меньше единицы. По- Поэтому в A1.29) в слагаемом ujq(R)P, которое содержит малую поправку к c^q, заменим поляризацию Р «невозмущенным» решением Pq = еох(ш)Ео cosut. В результате искомое уравнение для поляризации примет вид р + си^Р = (Nq2/m) Ео cos cut - BCео/т) х#о cos cut • Ro cos Ш. A1.31) Правая часть уравнения A1.31), которая играет роль внешней силы, воз- возбуждающей вынужденные колебания поляризации, содержит три слагаемых с частотами о;, и; + О и и; — О, поскольку cosc^t cos Ш = A/2) (cos(о; + О) t + + cos(ct; — O)t). Соответственно, вынужденные колебания поляризации со- содержат слагаемые на частотах и и и =Ь О. Возбуждаемые этими осциллято- осцилляторами вторичные волны имеют соответственно частоты и и и =Ь О. Рассеяние
546 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ первичной волны, содержащее кроме основной частоты ш также и комбина- комбинационные частоты ш =Ь О, называется комбинационным рассеянием. Излучение на частоте и; — О называется красным сателлитом или сток- совой компонентой (в честь физика Стокса, впервые наблюдавшего это из- излучение) . Излучение на частоте и + О называется фиолетовым сателлитом или антистоксовой компонентой. 11.6. Вынужденное (стимулированное) комбинационное рассеяние Выше мы рассмотрели комбинационное излучение, обусловленное воздей- воздействием на колебания молекул колебаний ядер атомов, образующих молеку- молекулу. При этом в выражении A1.30) для упругой силы мы пренебрегли слага- слагаемым P2, A1.32) где Р = Ner — поляризация, обусловленная смещением г оптического элек- электрона. Пусть теперь источником возбуждения является сильное световое поле (мощный импульс излучения лазера), а нелинейная среда, в которой возни- возникает комбинационное излучение, помещена в резонатор. Две причины заста- заставляют нас учесть теперь влияние этого слагаемого. Учтя ранее влияние колебания ядра на колебание электрона, мы выяс- выяснили, что поляризация среды состоит из слагаемых на частотах ш и ш =Ь О. Учтем далее лишь стоксову компоненту, т. е. будем полагать P(t) =pM(t)+p("-n\t). Ясно, что при этом Р2 содержит слагаемое, осциллирующее на разност- разностной частоте ш — (ш — О) = О. Эта частота совпадает с резонансной часто- частотой колебаний молекулы и может вызвать сильную раскачку этих колеба- колебаний. Разумеется, воздействие на этой частоте имело место и при тепловом возбуждении, однако комбинационное излучение, возбужденное тепловым движением, имеет случайную фазу, т. е. фазы колебаний разных молекул не согласованы между собой, поэтому и не возникает эффективного нако- накопления излучения на комбинационной частоте. При помещении нелинейной среды в резонатор, комбинационное излучение, которое распространяется вдоль оси резонатора, отражается от зеркал и, следовательно, вновь воз- возвращается в нелинейную среду, оказывая обратное влияние на колебания молекул: их фазы колебаний оказываются согласованными, а комбинаци- комбинационное излучение когерентно. Такое комбинационное излучение называется вынужденным или стимулированным. Ситуация отличается от предыдущей в двух отношениях. Во-первых, уве- увеличивается амплитуда колебаний внешнего воздействия на молекулу на ре- резонансной частоте О (она пропорциональна амплитуде колебаний поляри- поляризации на частоте и; и, следовательно, амплитуде колебания светового поля в импульсе излучения лазера). Во-вторых, комбинационное излучение, рас- распространяющееся вдоль оси резонатора, отражаясь от зеркал, накапливает- накапливается в резонаторе и «синхронизирует» колебания молекул: их комбинационное излучение оказывается когерентным (при когерентном сложении интенсив- интенсивность пропорциональна 7V2, в отличие от некогерентного, при котором ин- интенсивность пропорциональна N).
11.7. ВЫНУЖДЕННОЕ РАССЕЯНИЕ МАНДЕЛЬШТАМА-БРИЛЛЮЭНА (ВРМБ) 547 Схема на рис. 11.8 представляет собой генератор излучения на комбина- комбинационной частоте О и может быть названа комбинационным лазером. Между зеркалами резонатора (полностью отражающего М\, и частично прозрачного М^) помещается кристалл руби- l ^ 2 ^2со на 1, являющийся источником импульса на частоте о;, -l-fl-fTTT^-j;;; \-\ ~^> сосуд с нелинейной средой (бензолом) 2 и ячейка Кер- ^^3 ю ра 3, служащая для получения гигантских импульсов излучения (напряженности 107-108 В/см). В комбина- с< ° ционное излучение преобразуется до 20% энергии импульса на основной ча- частоте ш. 11.7. Вынужденное рассеяние Мандельштама—Бриллюэна (ВРМБ) В 1964 году был экспериментально обнаружен эффект, предсказанный ра- ранее Мандельштамом и Бриллюэном: мощное лазерное излучение частоты о;, попадая на кристалл, индуцирует в нем появление упругой (акустической) волны частоты О с одновременным рассеянием света на частоте и; — ft. Качественное объяснение этого эффекта с классической точки зрения та- таково. Из-за сильной связи атомов друг с другом в твердых телах и жидко- жидкостях тепловое колебательное движение одного атома неизбежно передается другому. Такое движение можно рассматривать как совокупность упругих (акустических) волн, распространяющихся во всевозможных направлениях и имеющих всевозможные частоты, спектр которых чрезвычайно широк: от звуковых (~ 102 герц) до гиперзвуковых (~ 1010 герц). Акустические волны в среде — это волны плотности (или давления), появление которых влияет и на оптические свойства среды: изменения плотности, с «оптической» точки зрения, это изменения числа осцилляторов в единице объема что, соглас- согласно классической теории дисперсии, приводит к изменениям (флуктуациям) показателя преломления #п(г, ?), имеющих волновой характер. Итак, тепловое движение приводит к появлению в среде волн показате- показателя преломления, которые можно представить в виде совокупности бегущих плоских волн различных частот О и направлений к. Любая из волн в этой совокупности может быть записана в виде <Угс(г, t) = 6щ cos(m - Кг - 0), A1.33) где волновое число есть, по определению, К = ft/v3B (v3B — скорость звука в среде), т. е. каждая волна показателя преломления #n(r, t) представляет собой бегущую фазовую синусоидальную решетку; в — начальная фаза. Что же происходит, когда световая волна большой интенсивности Eq(t, t) = = aocos(ct;t — kr) падает на среду, состоящую из набора таких бегущих ре- решеток? Чтобы в этом разобраться, вернемся к проблемам, которые мы обсу- обсуждали, рассматривая процесс записи и восстановления объемных голограмм (голограмм Денисюка). Прежде всего заметим, что бегущую интерференционную картину /(г, t) в объемной среде можно создавать с помощью интерференции опорной волны Eq(t, t) с «предметной» волной ??i(r, t) = ai cos ((a; - u)t - (k - К) г - в). A1.34) Суммарная картина интенсивности /(г, t) = \E$(r, t) + ?i(r, t)|2 (где чер- черта означает усреднение за время, существенно большее периода светового
548 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ колебания, и много меньшее периода «биений» 2тг/О) имеет вид I(r, t) = al + a\ + 2a0ai cos(m - Кг). A1.35) Напомним, что можно, находя сумму гармоничных колебаний с близкими частотами, воспользоваться векторной диаграммой: интенсивность суммар- суммарного колебания (квадрат длины суммарного вектора) найти с помощью те- теоремы косинусов. Обратите внимание, что последнее слагаемое в A1.35) описывается точно таким же соотношением, что и A1.33). Ясно поэтому, что если фотообработ- фотообработку полученной голограммы осуществить таким образом, чтобы голограмма стала «фазовой», т. е. чтобы оптическая плотность (т. е. показатель прело- преломления) объемной среды после обработки стала пропорциональна интенсив- интенсивности суммарной волны при записи голограммы, то наша голограмма при восстановлении изображения ничем не будет отличаться от среды, в которой возбуждена бегущая решетка A1.33). Разумеется, мы говорим сейчас о не- некоторой гипотетической голограмме с изменяющейся во времени функцией пропускания. Мы знаем, что голограмма в процессе восстановления изобра- изображения, при освещении ее волной, совпадающей с опорной волной, которая была использована при записи, восстанавливает предметную волну. Ясно поэтому, что волна Eq (r, t), дифрагируя на бегущей фазовой решет- решетке вида A1.35), дает «рассеянную» волну, которая отличается от A1.34) лишь встречным направлением (встречным перемещением волновых фрон- фронтов). Поскольку фазовая решетка, созданная тепловыми флуктуациями, чрезвычайно слаба Fщ <С по), то и дифрагировавшая волна имеет чрез- чрезвычайно малую амплитуду, если амплитуда волны Eq(t, t) не достаточно велика. Поскольку акустические волны A1.33) разных частот и направлений име- имеют случайную начальную фазу в (они созданы тепловым движением, име- имеющим случайный характер), то и рассеянные разными решетками волны некогерентны — это так называемое спонтанное рассеяние, аналогично из- излучению обычных тепловых источников, которое образовано спонтанным, несогласованным излучением разных атомов. Чрезвычайно важно, далее, обратное воздействие на среду электрическо- электрического поля волны Eo(r, t) большой интенсивности, которая способна влиять на оптические свойства среды (изменять ее показатель преломления). Интер- Интерферируя с первоначально слабой, дифрагировавшей на «тепловой» решетке волной ?i(r, ?), эта волна создает в среде бегущую решетку, которая ничем не отличается от уже имеющейся в среде решетки (которая и «породила» волну ?i(r, ?)). Дополнительное давление в среде и, следовательно, допол- дополнительное изменение ее показателя преломления пропорционально квадра- квадрату напряженности суммарного поля Е2 = (Eq + Е\J — нелинейный эф- эффект, который мы уже обсуждали, рассматривая явление самофокусировки и самоканализации. Таким образом, «затравочная», первоначально слабая волна показателя преломления когерентно усиливается бегущими волнами, образованными интерференцией интенсивной волны Eq и рассеянной волны Е\. Последняя, благодаря увеличению амплитуды бщ волны показателя преломления, также когерентно усиливается (ведь она возникает в резуль- результате дифракции на фазовой решетке со все большей глубиной модуляции фазы дщ/щ). Таким образом, как амплитуда акустической волны, так и амплитуда рассеянной волны частоты и — О будут постепенно нарастать по
11.8. ОБРАЩЕНИЕ ВОЛНОВОГО ФРОНТА 549 мере распространения в нелинейной среде — их энергия черпается из исход- исходной волны Eq(t, t) — волны накачки. В отличие от некогерентного рассеяния на тепловых флуктуациях показателя преломления, вынужденное мощной волной накачки рассеянное излучение является когерентным. \//л Рис. 11.9 11.8. Обращение волнового фронта Рис. 11.9 напоминает нам схему записи и восстановления объемной голо- голограммы (запись во встречных пучках). Рис. 11.9 а — схема записи: слева на голограмму падает опорная (в на- нашем случае плоская) волна 1, справа — предметная волна. В нашем случае предмет — точечный источник света, и соответственно, предметная волна — это «сферическая» волна, расходящаяся из источника — точки S. Пункти- Пунктиром условно показаны слои интерференционных максимумов и минимумов, которые после фотообработки образовали объ- объемную фазовую решетку (т. е. чередующиеся слои большего и меньшего показателя прело- преломления в объемной регистрирующей среде 2). Рис. 11.9 б— схема восстановления изобра- изображения. Восстанавливающая волна 1 падает на голограмму так же, как падала опорная волна при записи голограммы. Дифрагируя на объ- объемной фазовой решетке 2 эта волна образует восстановленную волну 3 — сферическую волну, сходящуюся в точку S'. Эта сходящаяся сферическая волна имеет «обращенный» по отношению к расходящейся предметной волне волновой фронт. Смысл термина «обращенный» состоит в том, что в обра- обращенной волне волновые фронты (поверхности одинаковой фазы колебаний), имея ту же пространственную форму, перемещаются во встречном напра- направлении, т. е. в каждой точке волнового фронта волновой вектор к имеет противоположное направление. Можно сказать, что обращенная волна по- повторяет ход прямой волны, но в обратной последовательности — «обращает ход событий во времени». Математически это выражается в том, что комплексная амплитуда обра- обращенной волны /обр(г5 t) в каждой точке г (ж, у, z) связана с комплексной амплитудой прямой волны /(г) равенством /обр(г) — /*(г)- Например, для плоской волны с комплексной амплитудой ae*(kr+a) (a — начальная фаза), обращенной является волна ае~1<^г+а\ что подразумевает изменение знака всех трех компонент вектора к, а также изменение знака начальной фазы а. Расходящаяся сферическая волна ао/гег^г+а^ после обращения становится сходящейся волной а$/г е~1(кг+а\ Вспомним, что волне с комплексной амплитудой /(г) = a(r)ei(p^ соответ- соответствует реальный волновой процесс E(r, t) = a(r) cos(a;? — <p(r)), T- e- обраще- обращение волнового фронта означает, что реальная волна E(r, t) превращается в волну ?70бр(г, t) = a(r) cos(ujt + Ц>(т)). Тот же самый результат получается, если в реальном волновом процессе изменить знак времени t (заменить t на —t). Мы получим Е{г\, —t) = a(r) cos(—u)t — <p(r)), что (в силу четности функции cos а) равно Е{т\, —t) = a(r) cos(a;? + <p(r)), а это и есть обращенная волна. Поэтому-то обращенная волна воспроизводит все изменения, которые
550 ГЛ. 11. ЭЛЕМЕНТЫ НЕЛИНЕЙНОЙ ОПТИКИ Рис. 11.10 происходят с прямой волной по мере ее распространения (быть может, в не- неоднородной среде), но в обратном порядке. Рис. 11.10 иллюстрирует заме- замечательное свойство обращенной волны. Пусть на слой неоднородной среды направлен параллельный пучок света 1 (с плоским волновым фронтом). Тогда на выходе из слоя фронт волны 3 окажется сильно искаженным, де- деформированным (рис. 11.10 а). Если нам затем удалось обратить волновой фронт с помощью некоего «волшебного зеркала» и заставить обращенную волну 3' пройти тот же слой неоднородной сре- среды 2 в обратном направлении, то на выходе из слоя мы получим хороший параллельный пу- пучок света V — ту же форму волнового фронта, который имела волна до того, как ее волновой фронт был «испорчен» (рис. 11.10 б). Голография, как мы видели, дает возмож- возможность получить обращенную волну в двухэтап- ном процессе (сначала этап записи голограммы, а затем стадия реконструк- реконструкции — восстановления изображения). При вынужденном комбинационном рассеянии обращенная волна возни- возникает в реальном времени, непосредственно при освещении нелинейной среды волной большой интенсивности. Схема эксперимента, подтверждающего, что при ВРМБ возникает обращенная волна, показана на рис. 11.11. Лазерный пучок большой интенсивности, имеющий хоро- хороший волновой фронт, искажается затем матовой пластинкой Л, которая сильно деформирует форму волнового фронта. Затем с помощью линзы «77, которая в ос- основном перехватывает весь рассеянный пластинкой свет, излучение напра- направляется на нелинейную среду НС (кювета, заполненная метаном или серо- сероуглеродом). После обратного рассеяния (ВРМБ) свет вновь проходит через линзу и матовую пластинку. При этом искажения, которые были внесены в пучок при его распространении слева направо, компенсируются при обрат- обратном ходе волны через ту же искажающую среду, и на выходе из пластинки П слева от нее волновой фронт снова становится «хорошим», почти плоским, что и контролируется с помощью полупрозрачного зеркала D, отводяще- отводящего часть отраженного обратно излучения в систему контроля К. Понятно, что такая компенсация внесенных в пучок искажений возможна лишь пото- потому, что рассеянное назад нелинейной средой излучение точно воспроизводит форму сложного волнового фронта падающей на среду волны, лишь изменяя направление перемещения волновых фронтов на противоположное. Кювета с нелинейной средой и является тем волшебным зеркалом, которое обращает ход событий во времени. (Если бы вы вдруг решили, что то же самое можно сделать, установив вместо кюветы с нелинейной средой самое обыкновенное зеркало, то вы убедились бы, что при обратном ходе волны через матовую пластинку искажения бы не скомпенсировались, а лишь увеличились бы, добавившись к уже имевшимся искажениям: обыкновенное зеркало не пре- превращает расходящуюся сферическую волну в сходящуюся — расходящаяся волна отразившись от зеркала, остается расходящейся.)
предметный указатель Автогенератор Ван-дер-Поля, 373 Автоколебания, 371 Анизотропная среда, 517 Архимед, 113 Архимедова сила, 127 Атом Томпсона, 339, 344 Биения, 327 Бинормаль, 30 Боковые гармоники, 328 Брюстера угол, 300 Вектор, 21 Пойнтинга, 412, 413, 523, 524, 541 Умова, 394, 396 модуль, 22 произведение, 30 Вес, 39, 91, 92 Видность, 425, 439, 446-448 Возмущение, 402 Волна, 379 амплитуда, 386 в анизотропных средах, 517 генерация третьей гармоники, 539 параметрическая генерация, 543 в кристаллах, 519 в нелинейных средах, 532, 535 векторная, 387 гармоническая, 382 линейно-поляризованная, 387, 388, 412 монохроматическая, 386 накачки, 542 необыкновенная, 519, 522, 523 обыкновенная, 519, 520, 522 отраженная, 399, 400, 406 плоская, 381, 383 плоско-поляризованная, 387, 416 поляризации, 543 поляризованная по кругу, 388 поперечная, 387, 400 продольная, 387 прошедшая, 400 сигнальная, 542 стоячая, 383, 384, 397 414 сферическая, 384 ударная, 403 упругая, 390 в жидкостях и газах, 392 в стержне, 398 холостая, 542 цилиндрическая, 385 электромагнитная, 278, 282, 293, 301, 407, 408, 410 в ионосфере, 513 в металлах, 513 в плазме, 314 импульс, 285 на границе двух сред, 295, 297, 299 отражение от идеального провод- проводника, 418 поляризация, 299, 411 энергия, 285 эллиптически-поляризованная, 388 Волноводы, 419 Волновые поверхности, 381 Время корреляции, 441 регистрации, 432 Вязкость, 130, 131 Газовый разряд, 305, 308, 309 Галилея преобразования, 35 принцип относительности, 137, 139
552 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Гармонический осциллятор, 340 вынужденные колебания, 355 затухающие колебания, 345 свободные колебания, 341 Гиромагнитное отношение, 215 Гироскоп, 114, 115 Гистерезис, 184, 223 Главные оси инерции, 114 Глубина модуляции, 328, 329 Голограмма, 495, 498 во встречных пучках, 501 восстанавливающая волна, 495 объемная, 499, 501 предметная волна, 493 спектральная избирательность, 502 Голография, 493 Гравитационная постоянная, 161 Гравитационное взаимодействие, 91 Градиент, 71, 170 Граница раздела двух диэлектриков, 422 Давление, 123 акустическое, 393 магнитного поля, 241, 243 Движение вращательное, 33 интеграл, 57, 75 относительное двух тел, 82 под действием постоянной силы, 50 поступательное, 33 равномерное, 28 по окружности, 28, 30 реактивное, 54 Двойное лучепреломление, 522, 524 Дебая радиус, 313 Декремент затухания, 348 Деформация, 122, 390, 391 Диамагнетизм, 220, 221 Дивергенция, 127, 167 Диполь, 171, 174, 415 в магнитном поле, 242 в электрическом поле, 173 магнитный, 212, 214 точечный, 415 Дипольное приближение, 172 Дипольный момент, 171, 172 магнитный, 242 Дисперсия аномальная, 508, 514 волн, 505 нормальная, 508, 511 электромагнитных волн, 509, 511, 513 Дифракционная расходимость, 456 решетка, 476 Дифракция, 424, 452, 459 Фраунгофера, 453, 470, 471, 490 главный максимум, 473 на круглом отверстии, 473 на решетке, 473 на щели, 472 Френеля, 453, 460, 465 на периодических структурах, 468 на решетке, 468 граничные условия, 453 диаграмма направленности, 472 на краю экрана, 468 на щели, 465 порядок, 475 спектральный метод, 455 Дихроизм, 525 Диэлектрик, 176, 177, 179, 182, 183 Диэлектрическая восприимчивость, 511 проницаемость, 179, 182, 511, 512, 514, 518, 540 Длина волны, 382 в волноводе, 421 Добротность, 349, 481 Домены, 225 Емкость, 168, 169 Жидкость, 125, 131 Закон Ампера, 205 Био-Савара, 205, 207, 221 Гука, 41, 120, 121, 123, 391 Джоуля-Ленца, 195, 197 Кеплера, 103 Кулона, 163 Лапласа, 205 Малюса, 525 Ньютона, 37 первый, 38 второй, 38, 137,139 третий, 44, 46, 144 Ома, 195
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 553 Паскаля, 127 Фарадея, 235 всемирного тяготения, 90, 91 дисперсии, 505 подобия, 135 сохранения импульса, 45, 46 сохранения массы, 85 сохранения энергии, 67, 71, 72, 76, 89 замкнутой системы, 86 Заряд закон сохранения, 193, 194 поверхностный, 178 связанный, 178 электрона, 162 Звук, 394, 399 Зонная пластинка Габора, 498 Френеля, 463 Зонная решетка Габора, 497 Зоны Шустера, 467 Изменение фазы несущей, 489 Измерение, 17, 41 Изохронность, 368 Импульс, 44, 156 момент, 101 закон сохранения, 102 обобщенный, 113 релятивистский, 154 силы, 44 Индуктивность, 233, 234, 246 коаксиальных проводников, 234 соленоида, 235 Индукция, 179, 181, 185 взаимная, 233 магнитного поля, 204 электрическая, 176, 177 электромагнитная, 233 Инертность, 46 Инерциальная система отсчета, 38 Инерция, 37 Интеграл Фурье, 333 Интенсивность, 322, 396, 432-440 звука, 396 спектральная, 440 Интерференция, 424-427, 436-438, 441, 443, 447 апертура, 438 максимальный порядок, 439, 441 порядок, 427 ширина полосы, 428 Интерферометр, 448 Майкельсона, 448, 449 Рэлея, 449 Фабри-Перо, 478 база, 448 Интерферометрия, 448 Кавитация, 397 Качение, 118 Кинематика, 26 Кирхгофа граничные условия, 453 правила, 198, 200 законы, 230 Классическая механика, 23 Когерентности время, 441 длина, 537 степень, 435 функция, 433, 435 время, 431 Когерентность пространственная, 443, 444, 447 Колебания амплитуда, 59 в струне, 400 векторная интерпретация, 321 векторные, 334 вынужденные, 258, 355, 365 гармонические, 57, 59, 76 двух тел, 83 диполя, 415, 416 квазигармонические, 325 квазимонохроматические, 428, 431, 436, 439, 440 квантование энергии, 398 комплексная амплитуда, 324 комплексная форма записи, 324 модулированные по амплитуде, 326, 328, 489 по фазе, 326, 489 несущие, 328 нормальные, 354 параметрические, 366 период, 59 плазменные, 313
554 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ под действием внешней силы, 60 противофазные, 323 синфазные, 322 спектральный анализ, 361 сумма, 322, 331 фаза, 59 эллиптически поляризованные, 335 энергия, 343 Колебательный контур, 255, 339, 344, 350, 366, 370 релаксационные процессы, 253 Комбинационное рассеяние, 546 света, 543 Конденсатор, 169, 179, 189 плоский, 170 сферический, 170 энергия, 186 Координата обобщенная, 114 Коэффициент Пуассона, 122 жесткости, 41 затухания, 346 отражения, 297, 300, 478 преломления, 293 прозрачности, 297, 300 пропускания, 478 самоиндукции, 234 трения, 74 Кристалл, 183, 220 анизотропный, 538 главная плоскость, 519 главные направления, 518 главные показатели преломления, 519 двуосный, 519 одноосный, 519 оптическая ось, 519 оптические свойства, 527 отрицательный, 519 положительный, 518, 519 Кристаллооптика, 517 Круговая поляризация, 412 частота, 321 Кручение, 123 Ламерея лестница, 372 Ламинарное течение, 133 Лапласа оператор, 170, 381 уравнение, 171 Ларморовая частота, 222 Линейная среда, 408 Линейные системы, 362, 363 Линза, 484, 485, 490, 491 идеальная, 483 фокальная плоскость, 486 фокусное расстояние, 483 Лоренц X., 151 Луч необыкновенный, 524 Магнетон Бора, 224 Магнитная восприимчивость, 220 проницаемость, 220, 223 Магнитные цепи, 228 Майкельсон А., 147 Максвелла уравнения, 268, 270, 407 Максвелловской релаксацией, 197 Масса, 39, 46, 156, 161 обобщенная, 113 приведенная, 82 Математический маятник, 338, 369 Материальная точка, 22 Мгновенная ось вращения, 117 Метод векторных диаграмм, 466 изображений, 227 изображения, 173 фазового контраста, 487 Методы подобия и размерности, 134 Минковский Г., 153 Мода, 398 нормальная, 354 основная, 398 собственная, 397, 398 Модулированные колебания, 325 Модуль Юнга, 122, 391 кручения, 124 сдвига, 123 Молекулярные токи, 218 Момент импульса, 101-103, 108, 215 инерции, 107, 108 перенос оси, 110 тонкого диска, 109, 110 цилиндра, 112
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 555 магнитный, 212, 214, 215 электрона, 224 силы, 101 Мощность, 64 Напряжение, 169, 391 Невесомость, 92, 144 Неинерциальные системы отсчета, 137 Нелинейная оптика, 532 Обертон, 394 Область дисперсии спектрального при- прибора, 478 Обменное взаимодействие, 224 Обратимые деформации, 120 Обращение волнового фронта, 549 Ом Г., 195 Оптика геометрическая, 458, 459 Оптическое выпрямление, 533, 535 Опыт Юнга, 446, 447 Осциллятор амплитудная характеристика, 358 ангармонический, 368 затухающий, 347, 351, 352 постоянное время, 348 частотная характеристика, 358 Ось инерции, 114 Пара сил, 103 Параболическое приближение, 385 Парамагнетизм, 221 Парамагнетик, 220, 225 Параметрическая раскачка, 367 Параметрическое усиление света, 543 Период колебаний, 321 Пироэлектрик, 185 Плазма, 305, 309 удержание магнитным полем, 310 квазинейтральность, 311 ленгмюровские колебания, 312 температура, 309 экранирование, 312 электромагнитные волны, 314 Плазменная частота, 511 Пластинка четвертьволновая, 520 Плечо силы, 112 Плотность потока энергии, 395 энергии, 129, 394, 395, 412, 413 Поверхностный заряд, 181 Пойнтинга вектор, 294 Показатель преломления, 293, 508, 512, 520, 540 главный, 519 дисперсия, 294 относительный, 294 Поле магнитное, 203 в веществе, 218 векторный потенциал, 211, 212, 214 граничные условия, 226, 227 индукция, 204, 228 напряженность, 204, 210, 212, 228 поток, 210 тока, 203, 207, 209, 210 электрический потенциал, 212 энергия, 245 потенциальное, 70, 212 соленоидальное, 212 электрическое, 171 в веществе, 177 граничные условия, 181 напряженность, 164 потенциальность, 171 энергия,185-189 электромагнитное глубина проникновения, 304 импульс, 274 квазистационарное, 252, 253 проводники, 240 энергия, 240 Поля, 24 Поляризация, 177-183, 299, 525, 535 ось наибольшей поляризации, 526 плоско-поляризованная волна, 411 Поляризуемость, 179, 510, 518, 529, 540 Порог нелинейной неустойчивости, 79 Порог слышимости, 396 Постоянная Верде, 530 Керра, 526 времени, 348 фотоприемника, 432 всемирного тяготения, 91 гравитационная, 91 Потенциал, 168-171, 187 Поток энергии, 400, 412, 413 Преобразования Галилея, 138
556 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Лоренца, 147, 151 Фурье, 331, 333 Прецессия, 116 Приближение абсолютно твердого тела, 31, 106 материальной точки, 31 Приведенная масса, 82 Призма Николя, 525 Принцип Гюйгенса-Френеля, 459, 463 Ленца, 235 двойной дифракции, 485, 487 относительности Эйнштейна, 147, 148 постоянства скорости света, 148 соответствия, 155 суперпозиции, 69, 166, 402, 424 суперпозиции полей, 164, 168 Проводимость, 195, 196 Проводник, 175, 227 Проницаемость вакуума, 205 Пространственная частота, 455, 458 Пространство, 17, 37 Пружинный маятник, 339, 370 Псевдовектор, 31 Псевдоскаляр, 31 Пьезоэлектрик, 183, 184 Пятно Пуассона, 464 Эйри, 473, 490, 491, 493, 497 Работа, 63, 64, 69 Равновесие, 77, 78 Радиационное затухание, 418 Радиоинтерферометр, 449 Радиус-вектор, 21 Размерности, 41 Размерность, 42 Разрешающая способность оптических систем, 482, 489, 492 спектрального прибора, 476, 480 голограмма, 497 Рассеяние, 96 Манделыптама-Бриллюэна, 547 Резонанс, 61, 260, 360 параметрический, 366 Резонансная характеристика, 359 Релея критерий, 477 формула, 508 Релятивистская механика, 147 длина тел, 151 длительность процессов, 151 импульс, 154 интервал, 153 энергия, 154, 156 Решетка, 489 Ротор, 208 Рычаг, 112 Самоканализация, 539, 541 Самофокусировка, 539, 540 Связанные осцилляторы, 352, 355 Сдвиг, 123 Сегнетоэлектрик, 183-185 Сердечник, 228 Сила, 161 Ампера, 206, 243 Кориолиса, 143 Лоренца, 206, 217 гироскопическая, 72 гравитационная, 90, 94 диссипативная, 72 звука, 396 инерции,139-142 консервативная, 67, 70 коэрцитивная, 223 момент, 108 непотенциальная, 72 нормального давления, 73 обобщенная, 113 объемная плотность, 128 принцип суперпозиции, 69 реакции опоры, 73 трения, 40, 72 покоя, 73 скольжения, 73 тяжести, 91 упругости, 40 центральная, 68, 69 Силовое поле, 67, 76 Силовые линии, 165 Силы гироскопические, 206 Система единиц СГС, 42 единиц СИ, 41 замкнутая, 45, 81 изолированная, 45
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 557 отсчета, 20 лабораторная, 85 неинерциальная, 139, 144 центра масс, 85 Скаляр, 21 Скачок уплотнения, 403 Скин-эффект, 262 Скиновая длина, 316 Скорость, 26, 28 абсолютная, 140 групповая, 505, 507, 508 звука, 392, 393 космическая, 93, 94 относительная, 140 первая космическая, 56 переносная, 140 света, 147, 148, 282 угловая, 29, 30, 114, 117 фазовая, 505, 508 Скэйлинг, 135 Соленоид, 209, 245 Соотношение неопределенностей, 440, 456 Сопротивление, 195 Сопротивление излучения, 418 Состояние покоя, 77 Соударение, 96 абсолютно неупругий удар, 97 абсолютно упругий удар, 97 Спектр, 440, 441, 456 Фурье, 333 ширина, 334 Спектральное разложение, 328, 330 комплексная форма, 332 Спектральный анализ, 361 метод, 455 Специальная теория относительнос- относительности, 148, 302 Спираль Корню, 467 Среднее значение, 344 Статистический характер светового из- излучения, 429 Степени свободы, 32, 33, 106 Стопа Столетова, 300 Таутохронизм, 491 Твердое тело, 121 вращение вокруг оси, 106, 108 динамика, 101 плоское движение, 116 трехмерное движение, 114 Тело поликристаллическое, 121 Теорема Гаусса, 165-167 Гаусса-Остроградского, 167 Кенига, 86 Лармора, 222 Пойнтинга, 272 Стокса, 208 о циркуляции, 207, 208, 220, 268 Течение Пуазейля, 130 линия тока, 125 стационарное, 129 трубка тока, 126 Ток электрический, 192 намагничения, 221 переменный, 258 плотность тока, 192 постоянный, 191 смещения, 268 Траектория, 22 Турбулентность, 133 Угловой размер, 448 Упругие деформации, 120 напряжение, 122 предел у прогости, 121 Уравнение Бернулли, 127, 129 Гельмгольца, 387, 456 Лапласа, 170 Пуассона, 170, 211 волновое, 380, 383, 392, 393, 401, 403, 407, 409 линейное, 402 моментов, 101, 103 непрерывности, 126 неразрывности струи, 126 однородное, 356 Ускорение, 26, 28, 161 переносное, 142 свободного падения, 91 центростремительное, 30, 142 Условие Беннета, 250 Условие Брэгга-Вульфа, 502 Устойчивое положение равновесия, 338 Устойчивость, 77, 78 линейная, 79 нелинейная, 79
558 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Фаза волны, 381 колебания, 321 начальная, 321 Фазовая модуляция, 326, 329 плоскость, 323 скорость, 382 траектория, 323 Фазового синхронизма условие, 537 Фактор размагничивания, 220 Ферриты, 226 Ферромагнетизм, 223 Ферромагнетик, 220, 223 Фигуры Лиссажу, 334, 336 Физический маятник, 338 Фильтры, 362 Фокус, 483 Формула Релея, 505 Пуазейля, 133 Торричелли, 130 Френеля зона, 461-463, 503 спираль, 463 формулы, 297, 299 Функции гармонические, 364 когерентности, 440 пропускания, 454 Фурье-анализ, 330 Фурье-плоскость, 486 Фурье-спектрометрия, 450 Характеристика, 370 Центр инерции, 83 масс, 83, 84, 86 Циолковский формула, 56 Цуг, 440, 441 Частица, 24 Частота, 59 критическая, 422 круговая, 60 собственная, 61, 346 циклическая, 60, 321 циклотронная, 206 электронная ленгмюровская, 313 Частотная характеристика, 364 Число Рейнольдса, 135 волновое, 381 дебаевское, 313 Чистый тон, 394 Штейнер теорема, 110 Электрические цепи, 252, 233 резонанс, 260 релаксационные процессы, 253 Электрический заряд, 162 дрейф, 217 Электрическое поле, 170 в веществе, 175 заряженной нити, 166 заряженной плоскости, 166 потенциальная энергия, 168 Электродвижущая сила, 198, 199 Электромагнит, 248 Энергия, 156 взаимодействия, 81, 88 внутренняя, 81, 89 гравитационного взаимодействия, 92 закон сохранения, 67, 75 кинетическая, 63, 65 вращения, 113 магнитного поля, 244, 245, 247 плотность упругой деформаци, 122 покоя,156 полная, 70 потенциальная, 67, 70, 86, 87 релятивистская, 154, 156 Эталон, 17, 19 Эффект Доплера, 403 Керра, 526, 527 Поккельса, 527 Талбота, 468, 469 Фарадея, 528 Холла, 230 возникновения комбинационных частот, 542 магнитооптический, 526 самовоспроизведения, 469 удвоения частоты, 533, 535, 538 электрооптический, 526
Учебное издание КИНГСЕП Александр Сергеевич ЛОКШИН Геннадий Рафаилович ОЛЬХОВ Олег Алексеевич ОСНОВЫ ФИЗИКИ. КУРС ОБЩЕЙ ФИЗИКИ Том 1 Механика, электричество и магнетизм, колебания и волны, волновая оптика. Редакторы: Е. С. Артоболевская, Н. С. Рытова, О. В. Савельянова Оригинал-макет: С. В. Баева Дизайн обложки: А. А. Логунов ЛР №071930 от 06.07.99 Подписано в печать 24.08.01. Формат 70x100/16 Бумага офсетная № 1. Печать офсетная Усл. печ. л. 45,2. Уч.-изд. л. 45,2 Тираж 5000 экз. Заказ № Издательская фирма « Физико-математическая литература» 117864 Москва, Профсоюзная ул., 90 Отпечатано с диапозитивов в РГУП «Чебоксарская типография №1» 428019 Чебоксары, пр. И. Яковлева, 15 ISBN 5-9221-0164-1 785922 101646