/
Tags: оптика
Text
В. О'НЕИЛ ВВЕДЕНИЕ В СТАТИСТИЧЕСКУЮ ОПТИКУ Перевод с английского В. И. АЛЕКСЕЕВА Под редакцией П. Ф. ИАГШИНА ИЗДАТЕЛЬСТВО «МИР» . МОСКВ
INTRODUCTION TO STATISTICAL OPTICS by E. L. O'NEILL Department of Physics Boston University ADDISON-WESLEY PUBLISHING COMPANY, INC., READING (MASSACHUSETTS) - PALO ALTO - LONDON 1963
УДК 535. Книга известного американского физика О'Нейла, основанная на курсе лекций автора для студентов-физиков и аспирантов Бостонского университета (США), посвящена новому направлению в оптике — анализу оптической систе- мы с точки зрения теории связи как фильтра простран- ственных частот. Теория формирования изображения, в част- ности теория аберраций и дифракции, излагается на основе методов преобразования Фурье. Проблема структуры изо- бражения и оценки его качества рассматривается с примене- нием теории информации. На основе матричной теории анализируются свойства когерентного и частично когерент- ного излучения, а также вопросы частичной поляризации. Книга написана так, что она будет понятна и аспиранту- физику, и радиоинженеру. По содержанию она рассчитана на физиков и инженеров-конструкторов, занимающихся разработкой оптических и оптико-электронных систем, применяемых в фотографии, телевизионной технике, военном деле, приборостроении и т. д. Она может быть полезной для студентов старших курсов университетов и оптико-механи- ческих факультетов втузов, специализирующихся в вопро- сах вычислительной и физической оптики, а также для аспирантов и научных работников. Редакция литературы по физике Инд.2-3-4
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ После некоторого затишья в развитии теории струк- туры изображения, даваемого оптическими системами, под давлением нужд практики внимание многих ученых вновь обратилось к этому вопросу. Исследования в этом направлении дают возможность глубже понять процесс формирования дифракционного изображения и в резуль- тате оценить предельные возможности оптики и указать пути дальнейшего усовершенствования оптических при- боров. Но оптические приборы работают всегда в соче- тании с теми или другими приемниками (глаз, свето- чувствительный слой фотопластинки, фотоэлемента, като- да электрооптического преобразователя и т. д.). В связи с этим представляет большой интерес вопрос о взаимо- действии света с приемником и выбор критерия качества изображения, пригодного для характеристики как опти- ческой системы, так и приемника. Желательно, чтобы качество изображения на приемнике всегда можно было оценить, зная в отдельности качество изображения, создаваемого оптической системой, и характеристику приемника. Таким критерием долгое время служило понятие разрешающей способности, но практика показала, что этот критерий не удовлетворяет нуждам практики. Его пришлось значительно усовершенствовать, что оказа- лось возможным благодаря, с одной стороны, некоторым успехам прикладной математики, а с другой, выбору определенного типа тест-объектов (в виде мир с перио- дической структурой).
Предисловие к русскому изданию Сравнительно недавно появившаяся книга Герцбер- гера [1 ] относится еще к первой группе перечисленных выше исследований. В ней рассмотрена главным обра- зом структура оптического изображения с точки зрения геометрической оптики (теория эйконалов и аберраций всех порядков). Вопрос о структуре изображения с точки зрения физической оптики (дифракционное изображение), а также развитие теории разрешающей способности в направ- лении использования таких новых понятий, как ча- стотноконтрастная характеристика, подробно и с большой ясностью освещены в книге Марешаля и Фран- сона [2]. Этим же вопросам, но с большим уклоном в сторону изучения свойств приемников, а именно с учетом «шу- мов» (зернистость приемника, рассеяние в слоях по- следнего и т. д.), посвящена книга Линфута [3], а также сборник [4]. Поскольку структура оптического изображения свя- зана со свойствами источника света, в частности с его когерентностью, оказалось необходимым изучить более подробно вопросы когерентности, что сделано отчасти в вышеупомянутой книге Марешаля и Франсона, а более полно в обзоре Вольфа и Манделя [5]. Немалую роль в вопросе структуры изображения играет поляризация света. Этому вопросу посвящена книга Шерклиффа [6]. В последнее время разработан новый подход к харак- теристике качества изображения, основанный на коли- честве разрешаемых деталей в изображении, и, таким образом, появляется связь между оценкой качества изображения и некоторыми аспектами теории информа- ции, возникшей в результате глубоких исследований в области теории связи. Первые шаги в анализе закон-
Предисловие к русскому изданию ности такого подхода сделаны Габором [7], который показал, с какой осторожностью нужно переносить поня- тия теории информации в область оптики. Следует отметить также большие успехи, достигнутые в последнее время в области голографии — техники полу- чения интерференционным путем особого рисунка на фото- пластинке, позволяющего простым образом получать изображение пространственных объектов и рассматри- вать их с различных положений. Этот метод, разработан- ный сначала Габором, в настоящее время благодаря работам Строука и его учеников, использовавших лазеры в качестве источников света, приближается к практиче- скому решению (см. книгу Строука [8]). Вопрос о структуре изображений все больше и больше связывается с вопросом о помехах («шумах»), играющих особенно важную роль в приемниках, но отчасти и в са- мой оптической системе, в которой неизбежно рассеяние света на поверхностях и оправах линз, а также на дру- гих дефектах материала или обработки линз и зеркал. Ясно, что эти явления имеют статистический характер, так как не могут быть заранее определены. Частично этот вопрос рассмотрен в упомянутой выше книге Линфута [3]. Значительно полнее он исследован в предлагаемой вниманию читателя монографии известного американ- ского ученого О'Нейла «Введение в статистическую оптику». В этой книге сделана удачная попытка изложить про- цесс образования изображения, начиная с объекта и кон- чая приемником, с единой точки зрения частотно-контраст- ных представлений. Автор при рассмотрении прохожде- ния света через оптическую систему рассматривает саму систему как фильтр пространственных частот с огра- ниченной полосой пропускания, и при этом стремится найти в оптике понятия, эквивалентные соответствующим
Предисловие к русскому изданию понятиям в радиоэлектронике. Такой метод изложения облегчает понимание оптики радиоинженерам, а оптики найдут в книге ряд интересных аналогий между оптикой и радиоэлектроникой. Ценной особенностью книги является наглядное сопо- ставление действия оптических и электрических элемен- тов цепей при прохождении «частотного импульса» через систему. При этом результаты применения преобразова- ния Фурье в обоих случаях сопоставляются в таблицах, что придает книге справочный оттенок. В некотором отношении форма изложения материала напоминает книгу Харкевича [9], пользующуюся широкой популярностью среди советских специалистов. Особый интерес представляет гл. 7, где автор дает последовательное статистическое рассмотрение процессов регистрации объектов на фотоматериалах с подробным обсуждением различных критериев, применяемых при оценке качества изображения, и статистических моделей, учитывающих свойство зернистости приемников. В гл. 8 и 9 на основе матричной теории рассматриваются свой- ства когерентного и частично когерентного излучения, а также вопросы частичной поляризации. Следует отме- тить, что в этих главах на основе единого метода автору удалось просто и наглядно вывести из общих формул предельные случаи, соответствующие строго когерентному и некогерентному освещению. Аналогичные предельные соотношения выведены и для случая поляризации света. Материал этих глав представляет большой научный интерес и выгодно отличается от содержания книг [2] и [61, где эти вопросы изложены в более популярной форме, но зато значительно беднее в познавательном отношении. Следует, однако, заметить, что книга не лишена недостатков. Материал гл. 1 почти без всякого ущерба
Предисловие к русскому изданию 9 для изложения последующих глав мог бы быть опущен. В ней рассматриваются различные задачи, связанные с решением дифференциальных уравнений второго поряд- ка. Показано, что во многих типичных случаях решение можно найти с помощью функции Грина. По-видимому, автор этими примерами хотел как-то обосновать принцип линейной суперпозиции при рассмотрении в дальнейшем процесса формирования оптического изображения. В свя- зи с этим следует отметить, что принцип линейной супер- позиции не нуждается в доказательстве, а возможность его применения следует искать в физике явления. Далее заметим, что гл. 3—5, посвященные вопросам геометри- ческой оптики и дифракционной теории, изложены слиш- ком сжато и имеют ряд недостатков, отмеченных в при- мечаниях редактора. Стиль изложения несколько небре- жен. При переводе встречались неясности в изложении и трудности в расшифровке ряда новых терминов, вве- денных автором. Поэтому пришлось иногда несколько отходить от текста, чтобы сделать его более понятным. Эти недостатки связаны, по-видимому, с лекционным характером книги. Дополнительная литература, приве- денная автором, не может претендовать на полноту, ибо содержит лишь основные источники. При переводе мы добавили литературу по данному вопросу, которая была издана главным образом в Совет- ском Союзе за последние годы. Книга может быть полезной для студентов старших курсов университетов и оптико-механических факуль- тетов втузов, специализирующихся в вопросах вычис- лительной и физической оптики, а также для аспирантов и научных работников. Г. Г. Слюсарев П. Ф. Паршин
10 Предисловие к русскому изданию ЛИТЕРА ТУ ГА 1. Герцбергер М., Современная геометрическая оптика, М., 1962. 2. Марешаль А., ФрансонМ., Структура оптического изображения, М., 1962. 3. Linfoot Б. Н., Fourier Methods in Optical Image Evaluati- on, London — New York, 1964. 4. Оценка качества оптического изображения, Сборник статей, М., 1959. 5. Вольф Э., Мандель Л., Успехи физических наук, 87, вып. 3, 491 A965). 6. Шерклифф У., Поляризованный свет, изд-во «Мир», 1965. 7. Gabor D., в книге Progress in Optics, vol. 1, ed. Б. Wolf, Amsterdam, 1961; Proc. Roy. Soc, A197, 454 A949); Proc. Phys. Soc, 64, pt. 6, 449 A951). 8. S t г о k e G. W., An Introduction to Coherent Optics and Holo- graphy, New York—London, 1966. 9. Харкевич Д. Д., Спектры и анализ, М., 1957.
ПРЕДИСЛОВИЕ Оптика — старый и почтенный раздел физики. Поэтому может возникнуть вопрос, для чего нужна данная книга. Дело в том, что оптика недавно прошла через период «возрождения» и были достигнуты большие успехи в ди- фракционной теории формирования изображения. Но эти успехи еще не нашли своего отражения в учебниках, которыми обычно пользуются студенты последних курсов, будущие специалисты по оптике. Правда, и наша книга, хотя в ней описываются некоторые новейшие достижения оптики, была задумана не как учебник. Тем не менее некоторые главы ее имеют самостоятельное значение, и материал этих глав легко включить в учебный курс. По своему содержанию книга рассчитана на студентов- физиков старших курсов, аспирантов первых лет обуче- ния и радиоинженеров, работающих в промышленности. Большая часть материала впервые появилась в виде конспектов лекций, розданных автором на семинаре в Бостонском университете летом 1956 г. Позже мате- риал пересматривался, дополнялся новейшими данными и перепечатывался в нескольких вариантах. В связи с растущим интересом к вопросам статистической оптики и просьбами продолжить конспекты лекций было решено переписать рукопись с самого начала. Хотя мы были вынуждены не затрагивать многих специальных тракто- вок влияния различных аберраций на оптические частот- ные характеристики, все же было решено излагать вопро-
12 Предисловие сы, связанные с аберрациями, таким образом, чтобы они были достаточно понятны как аспиранту-физику, так и радиоинженеру. Поэтому в гл. 1 и 2 в общих чертах описана роль функций Грина в математической физике и показаны существенные различия между простран- ственными и временными фильтрами. В гл. 3 кратко излагаются фундаментальные соотношения параксиаль- ной оптики с использованием компактной и эффективной матричной записи операторов перемещения и преломле- ния. В гл. 4—6 описано влияние различных аберрацион- ных членов на процесс формирования изображения с точки зрения и физической, и геометрической оптики. Содержание перечисленных глав более точно отражалось бы названием «Теория связи и формирование оптического изображения». Но в дальнейшем было решено включить в книгу статистическое описание картин, которые часто служат объектами для оптических приборов, и самого светового излучения в скалярной и векторной формах. Строго говоря, книга представляет собой введение в клас- сическую статистическую оптику. Предмет квантовой ста- тистической оптики, находящейся в процессе интенсив- ной разработки, требует, как мне кажется, совершенно отдельного изложения в более сложной и более совре- менной форме, чем та, которая дается здесь. Но можно думать, что студент будет лучше подготовлен к освоению квантовой оптики, если предварительно овладеет мате- матическими методами более простой классической ста- тистической оптики. У меня нет ни места, ни времени, чтобы в полной мере воздать должное многочисленным предшественникам, тру- ды которых служат фундаментом настоящей книги. И все же я не могу отказать себе в удовольствии выра- зить благодарность проф. Марешалю из Парижского оптического института и проф. Гопкинсу из Лондонского
Предисловие IS королевского колледжа, работы которых столь сильно привлекли мое внимание к статистической оптике. Не менее приятно вспомнить благотворное влияние проф. Вольфа, чьи идеи послужили источником моих позднейших замыслов. Мне также хотелось бы особо поблагодарить профес- сора Массачусетского технологического института Элиа- са, в отделе которого в качестве гостя я провел 1960/61 учебный год, подготавливая основную часть рукописи. Я также благодарен д-ру Броверу за разрешение вос- пользоваться частью его собственных статей, для того чтобы представить геометрическую оптику в сжатой и краткой матричной форме. Кроме того, я хотел бы выразить благодарность одному из моих аспирантов Мэретею (который будет вскоре вести самостоятельную работу в физике) за то, что он прервал свои собственные исследования ради написания гл. 9, без которой, я пола- гаю, книга не была бы достаточно полной. И наконец, хотя каждый учитель в долгу перед всеми своими студентами, мне хотелось бы особенно поблагода- рить де Велиса за проверку рукописи и за помощь в окон- чательном оформлении книги. Нидем, шт. Массачусетс Ноябрь 1962 г. О'Нейл
ГЛАВА 1 ФУНКЦИЯ ГРИНА И ЛИНЕЙНАЯ ТЕОРИЯ ? 1. Линейные дифференциальные операторы второго порядка Физики и инженеры хорошо представляют себе пре- имущества описания полей с помощью линейных уравне- ний. При таком описании эффекты от независимых источ- ников аддитивны. К сожалению, при быстром развитии науки и техники, которое сопровождается выделением самостоятельных узких направлений исследования, на общность некоторых основных положений линейной теории иногда не обращают внимания. Например, то, что инженеры-электрики называют импульсной реакциейг), является функцией рассеяния для физиков-оптиков и функ- цией Грина для физиков-теоретиков. То, что в одной дисциплине называется требованием причинности, в дру- гой известно как дисперсионное соотношение, а в треть- ей — как условие физической реализуемости четырех- полюсника. Используя лишь основные понятия операционного исчисления, мы хотим просто и в то же время в доста- точно общем виде показать здесь (базируясь на класси- ческой теории линейных дифференциальных уравнений второго порядка), как появляется интеграл, выражаю- щий принцип линейной суперпозиции. Рассмотрим систему, описываемую дифференциальным оператором D, для которой х (t) представляет собой функцию на входе системы, а у (t) — реакцию системы на эту функцию (фиг. 1.1). Так, например, для механиче- ского осциллятора с трением (фиг. 1.2) *) «Импульсная реакция» соответствует переводу английского термина «impulse response». В радиотехнической литературе он часто переводится как «импульсный отклик».— Прим. ред.
16 Глава 1 и реакция системы на функцию х (t) описывается выра- жением Dy(t) = x(t). A.1) Без всякого доказательства мы предположим, что суще- ствует обратный оператор D'1, такой, что D~W = 1. У//////////////Л Фиг. 1.1. Тогда, по крайней мере формально, мы можем записать y(t) = D-ix(t). A.2) Решение такого типа мы хотим найти, т. е. по данному х (t) мы хотим определить у (t). Рас- смотрим специальный случай, когда в качестве функции x(t), подаваемой на вход системы в момент времени t', мы имеем мгновенный импульс, пред- ставляющий собой функцию Дирака (дельта-функцию) б (t — t'). Теперь мы определим реакцию системы на х (t) как функцию Грина g (t, t'), так что t') = 6(t-t'). A.3) ; J- тп -и- Для дальнейшего важно заметить, что Фиг. 1.2. и Z), и D'1 — функции переменной t; t' только фиксирует момент возникно- вения импульса. Из равенства A.3) мы получаем g(t,t') = D-4(t-t'). A.4) Одним из других специфических свойств функции Дира- ка, определенной таким образом, является то, что она позволяет «отфильтровать» единственную ординату функ- ции: + 0О 8(t -t')x(t')dt'.
Функция Грина и линейная теория 17 Подставляя это выражение в равенство A.2), находим зависимость y(t)= J D-4(t-t')x(t')dt'. —оо С учетом формулы A.4) ее можно записать в виде y(t)= \g(t, t')x(t')dt', откуда мы видим, в чем смысл введения обратного инте- грального оператора D~x. Если система нечувствительна к смещению начала отсчета на временной оси, то g (t, t') можно записать в виде g (t — t'). Кроме того, если началь- ные условия выбраны таким образом, что g (t — t') = О для t < t', то тогда мы можем получить выражение y(t)= \g{t-t')x{t')df, которое показывает, что можно заглянуть в прошлое сигнала и учесть его вклад в настоящем, но нельзя заглянуть в будущее. Этот вывод хорошо известен тем, кто знаком с теорией линейной фильтрации *). Но такой подход к вопросу не совсем удовлетвори- телен. Не говоря уже о том, что D'1 определено недоста- точно строго и граничные условия проблемы точно не уста- новлены, можно добавить к правой части равенства A.2) однородное решение уравнения A.1) и получить еще одно совершенно приемлемое решение 2). Поэтому изложение вопроса об интеграле линейной суперпозиции мы начнем несколько необычно, основы- ваясь на классической теории линейных дифференциаль- *) Анализ этого вывода с точки зрения теории линейной филь- трации можно найти в работе [5*].— Прим. ред. 2) К сожалению, вопрос о единственности решения дифферен- циальных уравнений с помощью функции Грина автор в дальней- шем не рассматривает. См. по этому поводу [6*].— Прим. ред.
л а в а 1 ных уравнений [I]1). Рассмотрим однородное уравнение (и) ¦= а2 (х) —?- 4 «J (х) -^- + я0 (ж) Определим теперь сопряженное уравнение (и) - az (x) ~Ла, (.*) -g- + a0 (x) и = 0. A.5) при условии, что г / \ f / \ dP (и, v) vL (и) — mL (v) = —^ есть полный дифференциал. Оператор Р называется билинейным оператором взаимности2) и определяется выражением /^(u, у) = а1иу + а2у1 ~M"j~(rt2y)- (!••«) В результате всего этого мы можем написать ь Рассмотрим теперь два случая. § 2. Самосопряженные операгпоры Говорят, что оператор является самосопряженным, если L = L. Поэтому, написав (а2и)" — (aiu)' -\- аои = а2и"-\- а^и' -\-аом, или после преобразований 2а'2и -}- а"ги — а[и — '2а^и', мы видим, что L(u) является самосопряженным опера- тором, если __ , . dan (x) х) Литература дана в конце главы.— Прим. ред. 2) «Билинейный оператор взаимности» соответствует переводу английского термина «bilinear concomitant».— Прим. ред.
Функция Грина и линейная теория 1У Таким образом, дифференциальный оператор du является самосопряженным. Чтобы показать это более наглядно, произведем подстановку аг(х)--=-р(х), ao(x) = q(x), и тогда мы увидим, что самосопряженный линейный оператор второго порядка -, i yj , 1 f Oil — Li (ll) A./) dx V dx J ' x y > v ' есть дифференциальный оператор Штурма — Лиувилля [2]. Кроме того, в этом случае билинейный оператор взаим- ности приобретает весьма простую форму Р(и, v) = p{vu' — uv'). Уравнение Штурма — Лиувилля играет столь важную роль в теории спектрального разложения, что мы сде- лаем небольшое отступление. Заметим, что при v = u* основные уравнения для собственных значений, с кото- рыми приходится иметь дело в краевых задачах мате- матической физики, можно записать в следующем виде: L (ип) = — knw (х) ип (х), L (н,*) = — KnW (x) и*л (х), где ип — собственные функции и Кп—собственные значе- ния оператора L, a w (x) — положительная весовая функ- ция, характеризующая заданную систему координат. Помножив первое уравнение на и„, а второе на ип, произведя вычитание и используя уравнения A.6) и A.7), получим dx Для краевых задач, в которых функция или ее про- изводная исчезают на границе, правая сторона равна
20 Г л а в а 1 нулю, что приводит к следующим равенствам: ь ь \ u%.L (un) dx— \ unL(u*a) dx и \ unu%lw(x)dx = c2bmn. A.8) а Первое соотношение указывает, что L представляет собой эрмитовый оператор, а второе является условием орто- гональности х) для ряда собственных функций ип с весо- вой функцией w (х). Умножая ип (х) на постоянную с'1, можно также получить нормированные собственные функ- ции. Наконец, при т = п имеем Я,* = кп, так что соб- ственные значения оказываются действительными вели- чинами. § 3. Несамосопряжетше операторы Возвращаясь к вопросу о сопряженности, мы теперь попытаемся с помощью соответствующего интегрирующего множителя преобразовать все уравнения вида A.5) в само- сопряженную форму. Итак, умножая уравнение A.5) на 1 J (ax/ci2)dx мы получаем Li(u) = e^ai/a2)dX[u'> + ^-u' + ^- v ' L a2 ' а2 Вводя новые обозначения Go мы можем написать du dx x) Мы предполагаем, что собственные значения являются невырожденными, т. е. что Хт Ф %п.
Функция Грина и линейная теория 21 так что Li (и) становится самосопряженным. Следова- тельно, всем линейным дифференциальным операторам второго порядка может быть придана самосопряженная форма. § 4. Неоднородное уравнение Имея необходимые предпосылки, обратимся непосред- ственно к решению неоднородного дифференциального уравнения L(u) = p(x), A.9) где р (х) представляет собой некоторую исходную функ- цию. В соответствии с ранее изложенными методами определим g(x', x) с помощью равенства L(g) = b(x-x') = 'Lg{x, x). A.10) Умножим уравнение A.9) на g, а равенство A.10) на и, произведем вычитание и интегрирование1). Получим следующее выражение: ъ \ \gL(u) — uL(g)]dx=^ g(x', x)p(x)dx — а Ь — \ и (х) 8 (х — х') dx. а Теперь, используя фильтрующие свойства функции Дирака и вводя оператор Р, мы можем записать ь и(х')= J g(x', x)p(x)dx-[P(u, g)]*, A.11) где Мы видим, что путем выбора функции Грина, которая удовлетворяет тем же самым граничным условиям, что и и, второй член в правой части уравнения A.11) может х) Мц использовали то обстоятельство, ято ?(х, х') = g (x', х).
22 Г л а в а 1 быть сделан исчезающе малым. Более того, если резуль- тат не зависит от смещения осей системы координат, то можно получить следующее выражение: ь и{х')= ^ g(x' — x)p(x)dx. а Физически это очень важный результат, так как он утверждает, что каждая точка функции источника р (х) развертывается в линию, уравнение которой определяется функцией g (x — х), и результирующее распределение и (х') представляет собой линейную суперпозицию воз- действий от всех точечных источников. Далее, этот резуль- тат справедлив как для пространственных, так и для временных изменений и может быть легко обобщен на случаи двух- и трехмерных полей, изменяющихся во времени [3]. § 5. Определение функции Грина Теперь нашей основной задачей является определение функции Грина *). Этот вопрос сам по себе может пред- ставить интерес для исследований. Но мы ограничимся двумя специальными случаями: случаем, когда коэффи- циенты линейного уравнения постоянны, и случаем, когда мы имеем самосопряженное дифференциальное уравнение Штурма — Лиувилля. Постоянные коэффициенты. L(g) = a2g" + alg' + aog = 8(x-x'). A.12) Представим б (х — х') и g (x — х') в виде интеграла Фурье: 8(х — z') = 2S~ \ еШ(х"х'} dcu> A.13) G (со) e«fl(*-*') da. См. [6*].— Прим. ред.
Функция Грина и линейная теория S3 Подставляя эти интегралы в уравнение A.12), получаем соотношение G (со) [ — со2я2 + itoa-i + «о] eia>(x-x"> da = которым определяется G (со) и, следовательно, g(? — х') в виде ^(Ж —Ж') = о^- \ й 114 Здесь мы не будем останавливаться на том, как выбрать путь интегрирования [4] в комплексной плоскости, чтобы удовлетворить условиям физической осуществимости и устойчивости системы, т. е. граничным условиям, нала- гаемым на g (x, х'). Позже при сравнении пространствен- ных и временных фильтров мы вернемся к этому вопросу. В качестве иллюстрации рассмотрим простой контур R — L (фиг. 1.3). Функция Грина (импульсная реакция) R VVW ВДК, Фиг. 1.3. определяется посредством быстрого размыкания и замы- кания выключателя в момент t = t', так что g(t,t') = O, t<t\ Выполняя соответствующие подстановки в выраже- ние A.14), получаем
24 Глава 1 Здесь достаточно сказать, что мы воспользовались обратным преобразованием Лапласа вместо преобразова- ния Фурье, чтобы обеспечивалось выполнение условия g(t — t') — О при t <,t''. После всех выкладок имеем1) О, t<t'. Если рассматривать схему фиг. 1.3 как фильтр, то его частотная характеристика может быть получена путем g(t,t') \G(w)\ & Фиг. 1.4. обратного преобразования выражения A.13), осуществ- ляемого следующим образом: где (фиг. 1.4) 9 (со) = arc tg -д- Дифференциальное уравнение Штурма — Лиувилля (уравнение Ш — Л). В соответствии с ортогональным характером решений однородного уравнения Ш—Л, сле- дующего из формулы A-8), попытаемся теперь решить х) Конечно, в интеграле суперпозиции g (t, t') появляется в свернутой форме. (Этот же результат легко можно получить, если в интеграле сделать замену переменной z = ia>L, затем перейти к вычислению контурного интеграла на комплексной плоскости с помощью теории вычетов. Вычисление с помощью преобразования Лапласа см. в работе [7*].— Прим. ред.)
Функция Грина и линейная теория 25 уравнение L + b 8(x-x'), A.15) разлагая g (х, х') и б (ж — х') в ряд по собственным функциям г|)„ (х), удовлетворяющим уравнению = — Kw (x (следовательно, г|)„ (х) суть решения однородного урав- нения III — Л). Для функции Дирака мы имеем где что следует из ортогональности функций г|)„ (х). Так как 5(х — х') является действительной симметричной «функцией» х и х', можно записать Точно так же представим g (х, х') = 2 °п (*') ^» (я) п и, подставив эти выражения в уравнение A.15), получим 2 Сп {х') [L% + Xwtyn] = 2 < (^') % (х) w (х). п п Но поскольку Li|)rt = —^п^фп» мы имеем так что окончательно , '\ _ V ty" ^ ^" ^х'^ В качестве простого примера, показывающего, как изло- женные методы можно применять к многомерному слу- чаю, рассмотрим электростатическое уравнение Пуас-
26 Глава! сонаг). В единицах системы МКС это уравнение имеет вид Q(s, у, 2) где V — электростатический потенциал, обусловленный Фиг. 1.5. объемной плотностью заряда р(х, у, z). Функция Грина удовлетворяет уравнению где функция символически представляет изолированный точечный заряд в пространстве. Потенциал в точке (х', у', z'), обусловленный точечным зарядом, находящимся в точке х) Следует заметить, что при решении задач с помощью функ- ции Грина автор концентрирует внимание только иа одном из ее свойств, определяемом уравнением A.3). На самом деле следует различать свойства функции Грина в случае решения предельных задач обыкновенных дифференциальных уравнений типа рассмот- ренных выше и решения дифференциальных уравнений в частных производных.— Прим. ред.
Функция Грина и линейная теория 27 (х, у, z), описывается известным выражением где Таким образом, на основе принципа линейной супер- позиции потенциал V(х', у', z'), обусловленный зарядом р(х, у, z) (фиг. 1.5), находится как '(r, r')p(r)dr = 1 V* С* V" Q (х, у, z) dx dy dz # 6. Принцип линейной суперпозиции при формировании оптического изображения В духе сказанного выше мы можем теперь предполо- жить, что оптическое изображение может быть представ- лено как суперпозиция импульсных реакций на функции независимых точечных источников, распределенных по всей плоскости объектов х). На фиг. 1.6 изображена упрощенная схема работы оптической системы, относи- тельно которой принято, что увеличение ее равно еди- нице, излучение некогерентно, так что интенсивности складываются линейно, распределение света в точке (ж', у'), обусловленное точечным источником с координата- ми (ж, у), определяется выражением g (х — х, у' — у), и это распределение не изменяется по полю зрения систе- мы. Тогда, если о (х, у) описывает яркость объекта, a i (x', у') — яркость изображения, мы получим »(*'. V')=\\s (*' -х, у'-у)о (х, у) dx dy, A.16) —00 где действительные пределы интегрирования (размеры объекта) определяются значениями функции о (х, у). 1) Такое предположение допустимо только в том случае, когда Малы аберрации (соблюдается условие изопланатизма).— Прим. pf&.
Функция Грина и линейная теория 29 Иными словами, выражение A.16) устанавливает, что каждая точка в плоскости объекта излучает независимо от другой, а освещенность и положение изображения точки определяются произведением о (х, у) dx dy. Резуль- тирующее изображение представляет собой взвешенную сумму этих импульсных реакций, взятую по плоскости объекта. Целью последующих глав данной книги является детальное исследование возможности использования кон- цепции теории фильтрации, выраженной уравнением A.16) и наиболее полно разработанной в электрической теории связи, в теории формирования оптического изображения. Короче говоря, именно с этой точки зрения мы будем продолжать рассматривать формирование изображения оптическими системами, рассматривая сами системы как фильтры пространственных частот. ЛИТЕР Л ТУРЛ 1. I n с е Е. L., Ordinary Differential Equations, New York, 1953. 2. Margenau II., Murphy G. M., The Mathematics of Physics and Chemistry, New York, 1956. 3. Morse P. M., Feshbach H., Methods of Theoretical Physics, vol. 1, New York, 1953 (имеется перевод: П. М. М о р з, X. Ф е ш б а х, Методы теоретической физики, ИЛ, 1959). 4. Baghdad у Е. J., Lectures on Communication Systems The- ory, New York, 1961 (имеется перевод: Е. Д ж. Б а г д а д и, Лекции по теории связи, изд-во «Мир», 1964). 5*. Воде Г., Шеннон К., Теория информации и ее прило- жения, М., 1959, стр. ИЗ. 6*. Смирнов В. И., Курс высшей математики, т. 4, М., 1951. 7*. К о н т о р о в и ч М. И., Операционное исчисление и процес- сы в электрических цепях, М., 1964.
ГЛАВА СРАВНЕНИЕ ПРОСТРАНСТВЕННЫХ И ВРЕМЕННЫХ ФИЛЬТРОВ В гл. 1 было показано, что при использовании для описания полей и физических устройств линейных диф- ференциальных операторов применим принцип линейной суперпозиции. Было также установлено, что весовой функцией, которая позволяет выполнить суперпозицию и определить реакцию устройства, является как раз функция Грина, или импульсная реакция. Наконец, было указано, что функция g (х, х') должна удовлетво- рять не только дифференциальному уравнению, но и определенным граничным условиям. Поскольку такой подход обычен в различных областях теоретической и прикладной физики, для нас нет ничего неожиданного в том, что формирование оптического изображения можно описать иптегралом свертки, взя- тым по плоскости объекта, причем весовой функцией для интеграла служит распределение освещенности в изобра- жении точечного источника. Такое представление кажется настолько логичным, что может возникнуть желание непосредственно воспользоваться всеми методами, раз- работанными в теории электрических цепей, и применить их для описания процесса образования изображения в оптических системах. Но безоговорочное применение этих методов в оптике может привести к ошибочным выводам, так как пространственные фильтры в некоторых отношениях существенно отличаются от временных филь- тров. В дальнейшем мы будем рассматривать в основном лишь оптические системы, линейные относительно квад- рата электрического вектора, усредненного по времени, т. е. интенсивности света. Тем не менее значительная часть излагаемого материала будет применима (с некото- рыми модификациями) к инфракрасным, телевизионным
Сравнение пространственных и временных фильтров 31 и радиоантеиным сканирующим системам. Позже с соот- ветствующими оговорками мы проанализируем свойства оптических систем, линейных относительно комплексной амплитуды, т. е. систем, которые работают с когерентным излучением. Но пока что ограничимся рассмотрением некоторых идеальных оптических систем, для которых освещенность некогерентна, увеличение равно единице и распределение освещенности на изображении точечного источника не изменяется в пределах рабочего поля при- бора. Степень практической применимости результатов, полученных при таких ограничениях, будет исследована позже. Перейдем теперь к сравнению характеристик временных и пространственных фильтров. § 1. Временные фильтры Рассмотрим систему, представленную на фиг. 2.1. Обозначим импульсную реакцию системы через h (t) Bit) Фиг. 2.1. и введем линейный оператор, с помощью которого х (t) преобразуется в у (t): Lx(t) = y{t). B.1) Нас интересуют только те временные фильтры, которые удовлетворяют условиям, перечисленным ниже. а) Условие линейности L [ах, @ + Ъхг (t)\ = ay, (t) + by2 (t). Оно заключается в том, что сумме двух сигналов на входе соответствует сумма выходных сигналов. Так, например, ПРИ Удвоении входного сигнала выходной сигнал удваи- вается.
Глава 2 б) Условие инвариантности т. е. форма выходного сигнала не должна меняться при смещении начала отсчета на оси времени. Условия а ж б являются достаточными для того, чтобы в качестве собственной функции оператора L принять функцию est, в которой t — действительная временная переменная, a s в общем случае может быть комплексной величиной. в) Условие физической осуществимости h(t) = O, t<0. Этим условием исключаются эффекты опережения. Иными словами, оно говорит о том, что реакция не может появить- ся до тех пор, пока выключатель разомкнут. При исполь- зовании интеграла свертки это означает, что, остановив некоторую точку функции во времени, можно заглянуть в прошлое этой функции, но не в будущее. г) Условие устойчивости т. е. всякий конечный сигнал на входе системы дает конечный сигнал на ее выходе. Тот факт, что система является пассивной (отсутствуют активные элементы — батареи, генераторы и т. д.), на языке математики выра- жается как требование, чтобы импульсная реакция была абсолютно интегрируемой. Первые два условия приводят непосредственно к инте- гралу суперпозиции +°° = ^h{t-t')x(t')dt'. B.2) —00 Чтобы рассмотреть два последних условия, необходимо обобщить преобразование Фурье и ввести комплексную частоту s = а -{- ia>. Выполпяя преобразование Лапласа
Сравнение пространственных и временных фильтров 33 для уравнения B.1), получаем +00 и обратно = ~ j H(s)estds. оо—г»» Для понимания дальнейшего весьма существенно то обстоятельство, что Н (s) лежит в полосе s-плоскости 1), для которой определяется Н (s), и что вне этой полосы Н (s) не существует. Как мы увидим, ширина и положе- ние этой полосы в s-плоскости определяются из совер- шенно независимых физических требований виг. Рас- смотрим, например, контур R — L, приведенный в гл. 1. Различными способами нетрудно показать, что t>0. В это!^|лучае выражение B.3) принимает вид оо H(s)=\ h (t) e-st dt = и-г-гс [1 -lim e-«H/L)+']'], v "¦ "T ^" (-^oo 0 так что H (s) = ¦ D , если и только если о>—j-, где 8 = а-{-1(а (фиг. 2.2). Перечислим теперь требования, которым должна удовлетворять функция Н (s) в пло- скости комплексной частоты в силу условий а — г. 1) Так как Я (по) = := \\h(t)\dt, О х) Здесь автор допустил некоторую неточность, которая стано- вится очевидной в дальнейшем. На самом деле, Н (s) может суще- ствовать во всей правой полуплоскости.— Прим. ред.
34 Г л а т. е. условие устойчивости подразумевает, что па оси ш преобразование существует и ограничено. 2) Если h (t) вещественно, то Н (s*) = Н* (s). 3) Условие физической осуществимости подразумевает, что вещественная и мнимая части Н (ш) связапы преобра- зованием Гильберта [1]. 4) Все полюсы Н (s) расположены в левой половине плоскости. h(t)=1e-WOt Li О Фиг. 2.2. Последнее обстоятельство является следствием двух условий — условия физической осуществимости и усло- вия устойчивости, указанных выше. Условие физической осуществимости требует, чтобы область сходимости Н (s) была по крайней мере в правой половине плоскости. Условие устойчивости требует, чтобы область сходимости Н (s) включала по крайней мере мнимую ось s = ш. О том, что должна представлять собой система при выполнении обоих условий, хорошо сказал Зиберт (см. [2]), которого мы и процитируем, ибо вряд ли можно сказать лучше: «Если система и осуществима, и устойчива, то обла- стью сходимости Н (s) является по крайней мере вся правая половина плоскости Re [s] >0. Если же физиче- ская реализуемость не подразумевается, то считать, что
Сравнение пространственных и временных фильтров ЗЬ всякая система, у которой функция системы имеет осо- бенности в правой половине плоскости, неустойчива, было бы слишком большим упрощением». Выбор пути интегрирования в комплексной s-плоско- сти, как было указано ранее, зависит от граничных усло- вий, налагаемых на функцию Грина. Так же как g не является единственно возможной, если точно не опре- делены граничные условия, так и Н (s) и, следовательно, h (i) не являются единственными, если, как это проде- монстрировал графически (фиг. 2.3) Зиберт, область схо- димости точно не определена. При сохранении полюсов слева от мнимой оси, как мы это делали выше, в соответ- ствии с леммой Джордана и теорией вычетов получаем, что fi (?) = 0, t <C 0 для бесконечного полукруглого огибания правой половины плоскости. Форма h (t) для t >0 опре- деляется полюсами, охватываемыми бесконечной линией, окружающей левую половину плоскости. § 2. Классификация входных сигналов Перейдем теперь к описанию сигналов, поступающих на вход временных фильтров. В общем случае х \t) может быть периодическим сигналом, неустановившимся сигна- лом или случайным сигналом. Во всех трех случаях при выполнении условий а и б существует интеграл супер- позиции [формула B.2)]. Наложение других условий сводится к требованию, чтобы интегрирование произво- дилось только от бесконечного прошлого до настоящего времени t, но не для будущего времени. Далее, h (t — t') представляет собой свернутую форму h (t'), обращенную в прошлое. В частотном пространстве как для периодиче- ских, так и для неустановившихся входных сигналов остается справедливым простое перемножение где X и У — спектры сигналов на входе и выходе систе- мы. Для сигналов, имеющих на бесконечпом интервале случайную форму, преобразования Фурье не существует, и мы вынуждены обратиться к статистическому описанию сигналов.
О Система осуществима, устойчива ш -/¦ U О О Система осуществима, Система неосуществима,, неустойчива устойчива ио гш -/ 0 1 f i I . | 1 \ 1 1 i -1 О H(s) = His) - H(s) =
h(t) = О Системо неосуществима, Система неосуществима, неустойчива устойчива 1Ш r I'' " сг 7-s2 О Система неосуществима, неустойчива ico не существует *- о" Фиг. 2.3. (Из работы [2].)
38Глава 2 § 3. Случайные сигналы Здесь и находят себе применение понятия о корре- ляционных функциях и спектре мощности. Хотя точно определить, что происходит с сигналом любой формы в частотном пространстве, невозможно, мы можем сохра- нить мультипликативное соотношение между входным и выходным сигналами, если представим их в виде усред- ненных по времени функций спектральной плотности, которые дают мощность сигналов в интервале частот от ю до и + da. В силу статистической природы такого опи- сания мы не можем сохранить информацию о фазе, ибо существуют целые классы функций, подчиняющихся оди- наковым статистикам, и, следовательно, обладающих одинаковыми спектрами мощности. Эти положения хоро- шо известны в теории связи [3, 8*, 9*], и мы не будем их здесь доказывать, а приведем только наиболее важные соотношения. Определим автокорреляционную функцию фжж (т) слу- чайного сигнала х (t) как Ц>хх (т) = (х (t) x(t + т)> = Hmi( x (I) x (t + т) dt. т->0° _ у Эта функция обладает следующими свойствами: а) Фх*@) = <*2>, т. е. равно общей мощности сигнала; б) фх*(т) = фхх(— т), т. е. автокорреляционная функция является четной функцией; в) фхх@)>|фхх(т)|; г) Чхх(°°) = (хJ, т. е. равно постоянной составляющей мощности сигнала; поэтому разность фжж @) — фжж (оо) дает переменную составляющую мощности сигнала (фиг. 2.4). Если случайный процесс является стационарным (ста- тистика не изменяется со временем), то усреднению
Сравнение пространственных и временных фильтров 39 по времени будет соответствовать усреднение по ансамблю таких же случайных функций. Следовательно, (хи х2) dxx dx2, где w% (Xi, x2) dxx dx2 — вероятность того, что х{ лежит между Xi и Xi + dxu а х2 — между х2 и х2 + йж2, если ¦Полная мощность Переменная составляющая мощности Постоянная составляющая мошности- Ф и г. 2.4. случайная функция ж (t + т) смещена на время т отно- сительно ж (t). Подобные определения могут быть также даны для выходного сигнала у (t). Распределение Гаусса (нормальное распределение) характерно тем, что если оно имеет место на входе линейного устройства, то на вы- ходе также будет нормальное распределение. Эквивалент- ное, статистическое описание случайной функции х (t) в частотной области основано на теореме Винера — Хин- чина: —оо где Фхх (со) — спектр мощности х (t), который опреде- ляется соотношением ) = hm \Хп где Хт (и) — преобразование Фурье функции х (t), взя- той на интервале (— Т, Т). Из свойств фжж (т) следует, что Фхх (и) — вещественная четная и положительная
40 Глава 2 функция и. Короче говоря, Фхх (и) и <рхх (т) представ- ляют собой пару косинус-преобразований Фурье. Подобное статистическое описание можно, очевидно, ввести и для выходного сигнала у (t). Тогда спрашивается, как функции <РуУ (т) и Ф^ (и) будут связаны с функциями фжж (т) и Фхх (и)? Начнем с определения функции фу{/ (т): Заменяя у (t) и уA + т:) двумя интегралами суперпози- ции [формула B.2)], получаем +0° где J A(/-T + o)A(o)do. B.4) Заменяя интеграл в формуле B.4) преобразованием Фурье произведения преобразованных фь/^т) и фжж(т), приходим к соотношению \ |#И|2Ф«Ие^сй, B.5) и, так как фуг/ (т) и Фуу (и) связаны между собой преоб- разованием Фурье, Таким образом, хотя при описании случайного сиг- нала с использованием частотных представлений фазовая информация теряется, между входной и выходной спек- тральными функциями мощности сохраняется мультипли- кативное соотношение. Следовательно, если в системе имеется п каскадов, соединенных последовательно, то соотношения B.5) и B.2) остаются справедливыми при условии, что Н (и) (частотная характеристика системы) определяется выражением #И=ДЯ,(©). B.6)
Сравнение пространственных и временных фильтров 41 Это хороший пример аксиомы, которая утверждает, что прочность цепи определяется ее слабыми звеньями. По своей простоте выражение B.6) сравнимо с эквива- лентной n-кратной сверткой (во временной области) импульсной реакции в первом каскаде с последующими, представляющей собой эквивалентную импульсную реак- цию системы h(t). Часто представляет интерес величина среднего квад- рата флуктуации на выходе линейного фильтра. Она нахо- дится из формул B.4) и B.5), если положить т = 0: Заметим, что если оценивать систему по известному (у'2}, то, поскольку Н (со) входит в выражение для (г/2) в виде | Н (со) |, мы не можем сделать вывода о степени корре- ляции между максимумами и минимумами выходной у (t) и входной х (t) случайными функциями сигналов. Поэто- му запишем выражение для функции взаимной корреля- ции между входным и выходным сигналами: Заменим снова y(t-\-x) интегралом суперпозиции вида B.2) и после некоторых операций [3] получим следую- щее интересное соотношение: )= \ h(x+t)<?xx(t)dt. B.7) Выполнив опять преобразование Фурье обеих частей этого соотношения, получим зависимость Фху((й) = Н(<й)Фхх(а>), B.8) в которой теперь сохранена в Н (и) информация о фазах. Теперь мы уже можем определить степень сходства
42 Глава 2 между х (t) и y(t), полагая опять т = 0 в формуле B.7) и используя B.8): -{-оо Наконец, мы можем определить еще и третью величи- ну, средний квадрат разности между выходным и вход- ным сигналами: E = {\y(t)-x{t)\*), в который, очевидно, входят оба фактора, рассмотрен- ные выше. Эта величина фактически являлась отправной точкой винеровского анализа оптимальной фильтрации. § 4. Оптические пространственные фильтры Рассмотрим простую оптическую систему, представ- ленную на фиг. 2.5. Чтобы избежать в дальнейшем неже- лательных осложнений, связанных с введением новых обозначений, введем сразу следующие обозначения: 0 (I, "Л) — распределение интенсивности све- та в плоскости объекта; 1 (х, у) — распределение интенсивности све- та в плоскости изображения; s (х — \, у — ц) — «функция рассеяния», описываю- щая распределение света на плос- кости (х, у), обусловленное нали- чием точечного источника в плос- кости объекта (?, 11). Эти функции имеют двумерные спектральные распре- деления, описываемые выражением / (ю) = / ((ож, *»!/)= ^ 4х> y)e-iatdxdy, — оо где и аналогичным выражением для О (to). Далее, если не бу- дет специально оговорено, то полагаем, что преобразова- ние Фурье от s (х, у) нормализовано (приведено к единице
ю см'
44 Глава 2 при сож = а у — 0), и тогда оптическая передаточная функция т (ю), или частотная характеристика, будет выражаться следующим образом: +00 Ц S (X, у) в-™'' dxdy Т((О) = ,. U s (х, у) dx dy — оо Теперь снова вернемся к четырем условиям, рассмотрен- ным в предыдущем параграфе. Условие е, очевидно, непо- средственно вытекает из того факта, что независимой переменной является время. В оптических системах рас- пределение света не только существует по обе стороны х) оси координат, но и часто симметрично. Поэтому условие физической осуществимости в оптике не играет важной роли. Иначе обстоит дело с условием инвариантности б [4]. Дело в том, что распределение света в изображении точки не сохраняется, когда светящаяся точка переме- щается в плоскости объекта. В действительности, как это мы исследуем в гл. 4, существует зависимость аберра- ционных коэффициентов от угловых координат. Пытаясь сохранить оптико-электрическую аналогию, мы теперь вынуждены воспользоваться тем фактом, что распреде- ление света на практике не изменяется резко, когда точечный источник смещается в сторону от оси. В силу вышесказанного мы будем пользоваться условием инва- риантности, но только в таких областях (зонах) плоско- сти изображения, внутри которых функция рассеяния значительно не изменяется 2). Как следствие на прак- тике тогда придется представлять передаточную функцию т (ю) в виде графиков, характеризующих по отдельности ее зависимость от угла поля зрения, положения плоско- сти наилучшей фокусировки и длины волны (цвета). *) Интересный пример того, как это положение может не выпол- няться в оптике,— тест Фуко с четкой границей, в котором поло- вина и более спектра Фраунгофера резко обрывается. Как показал Линфут [5], это непосредственно приводит к необходимости введе- ния преобразований Гильберта. 2) Такое разбиение на зоны в оптике широко принято называть разбиением на изопланарные области.— Прим. ред.
Сравнение пространственных и временных фильтров 45 С учетом этого упрощающего предположения будем полагать, что поскольку каждый элемент в плоскости объекта о (?, т)) d?, йт) изображается в точке (х, у) пло- скости изображения элементом о (I, г)) s (х — I, у — г)) d\ dr\, распределение освещенности в плоскости изображения, обусловленное всеми элементами плоскости объекта, будет определяться выражением i(x, у)=\ \ s(x — I, y — r\)o(l, T))dgdi|. B.9) Выполнив преобразование Фурье для обеих частей соотношения B.9), получим зависимость где т (ю) — в общем случае нормализованная комплекс- ная функция двумерных пространственно-частотных пере- менных wx и Wy, измеряющихся в радианах на единицу длины. § 5. Оптическая коитрастио-частотиая передаточная функция Часто представляется удобным измерять характери- стики оптических систем путем использования плоских мир, прозрачность или отражение которых изменяется только в одном направлении. В таких случаях можно определить одномерную импульсную реакцию, или функ- цию рассеяния линии, I (х), записывая выражение B.9) для объекта в виде бесконечно тонкого линейного источ- ника излучения о (g, г)) = б (?): -{-оо Ц-оо \ ^(x~Z,y — r\N(%)dZdi[\= ^ s(x,y~r\)d(y—r\). При сведении задачи о формировании оптического изобра- жения к одномерному случаю не следует думать, что частотная характеристика становится одномерной. В об- щем случае функция рассеяния s (x, у) не имеет круговой
46 Глава 2 симметрии, так что линейчатые структуры, ориентирован- ные различным образом в плоскости объекта, будут изо- бражаться с различным контрастом. Например, для линейчатой структуры, расположенной под углом 0 Фиг. 2.6. к оси х, простой поворот приводит к новой системе коор- динат (х', у'), оси которой идут вдоль линейчатой струк- туры и перпендикулярно ей. Необходимо помнить, что в этом случае функцию рассеяния линии следует запи- сать в виде 1(х, 0), а ее преобразование Фурье, т. е. передаточная функция, запишется в виде т (ю, 0). Пол- ную информацию можно получить путем определения т(ю, 0) для всех углов 0. Наконец, в тех случаях, когда имеется круговая сим- метрия, двумерные преобразования Фурье, как показано в приложении А, приводятся к преобразованию Фурье — Бесселя. Для иллюстрации сказанного рассмотрим синусоидаль- ный тест, расположенный в плоскости объекта, с фоновой яркостью Во и модуляцией яркости Вх. Далее, пусть волновой вектор ю составляет угол 0 с осью ? (фиг. 2.6).
Сравнение пространственных и временных фильтров 4$ Если период пространственной волны равен р мм, то ю = = 2я /р, и мы можем написать о (I, г)) = Во + Bi cos cog' = B0(l -f Co cos cog'), где C0 = BJB0 — контраст в плоскости объекта, а старые и новые координаты связаны матрицей, описывающей поворот системы координат: cos0 sin0\ —sin0 cos0/ Имея в виду, что координаты объекта и изображения повернуты до совмещения ?' и х с волновым векто- ром (о, мы включили 0 как параметр в интеграл супер- позиции B.9): i (x, в)=^8(х'-Ъ',у'- г)') (Во + В, cos соГ) d\' dr\'. Выполнив интегрирование по т)', получим -|-оо J l(x'-t',e)dt'+Bl Первый интеграл равен постоянной величине т@), пол- ной освещенности, создаваемой функцией рассеяния. Второй интеграл путем замены переменных о=х' — |' можно представить в виде + 00 J I (о) cos со (.г' — о) da ——т^ = тс (со) cos (ox' -\- xs (со) sin сох', I l(a)da где тс и ts — нормализованные косинус- и синус-преоб- разования Фурье от импульсной реакции: J I (a) cos сост da J / (о) sin сост йст ю) = —+= ' т« (ю) = —ps • I l(a)da I I (a) da
48 Р л а в а & _____ Распределение света в изображении (фиг. 2.7) можно записать следующим образом: i(х, 0) = В'о[1 + Ct(©)cos{wx'-Ф(©)}], где Ф (ю) = arc tg -^ . Таким образом, изображением синусоидальной волны всегда будет также синусоидальная волна, но с другой Фиг. 2.7. амплитудой и фазой (фиг. 2.8) 1). Теперь понятно, почему т (ю) называется оптической контрастно-частотной Объект О Фиг. 2.8. передаточной функцией. Если объект состоит из черных и белых полос, то, используя разложение в ряд Фурье, х) Аналогичное рассмотрение периодической структуры можно найти в работах [10*, 11*].— Прим. ред.
Сравнение пространственных и временных фильтров 49 мы можем считать, что для каждой компоненты обра- зуется отдельное изображение, так что п=0 xcos[Bre+l)o>a;' —ф(со„)]| . § 6. Идеализированный случай В качестве другого примера, иллюстрирующего метод анализа оптических систем как фильтров пространствен- ных частот, мы рассмотрим теперь проблему формирова- ния оптического изображения с весьма элементарных позиций. Посмотрим, что произойдет с идеальным опти- ческим изображением (фиг. 2.9), если переместить его из фокальной плоскости. При этом вследствие идеализа- ции явления мы пренебрегаем влиянием дифракции и аберрациями. В дальнейшем мы исследуем их влияние на структуру изображения, но пока что будем иметь дело с идеализированной картиной, чтобы было легче про- иллюстрировать нашу точку зрения. Предположим, что функция рассеяния, или импульс- ная реакция, в этом случае имеет вид цилиндра (фиг. 2.10, а). Тогда частотную характеристику можно определить из выражения я J BqTq(w) r dr тИ = -Ч . B.10) J B®r dr 0 при выводе которого, исходя из наличия круговой сим- метрии, мы воспользовались преобразованием Фурье — Бесселя. Принимая во внимание хорошо известное для функций Бесселя соотношение A
Фокальная плоскость Фиг. 2.9.
в в
52 Глава 2 преобразуем при га = 1 выражение B.10) к виду как показано на фиг. 2.10, б. Первый предел разрешения (переход функции через нулевое значение) соответствует R Фиг. 2.11. J\ C,83) = 0, или о — 2л/р — 3,83/й. Таким образом, при отношении диаметра пятна к периоду синусоидальной миры, равном 2R/p = 1,22, контраста на изображении не будет. Для линейчатого теста с большей частотой т (ю) становится отрицательным, что указывает на наличие фазового сдвига в пространстве на 180°. Это означает, что черные и белые линии поменяются местами. Переход через нулевой контраст с последующим рез- ким изменением фазы показан на фиг. 2.10, б. Подоб- ный эффект, известный в оптике под названием «лож- ного разрешения», можно наглядно продемонстриро- вать, если спроектировать миру, состоящую из группы сходящихся полос, на экран и затем дефокусировать проектор. При этом будут хорошо видны полосы нулевого контраста, проходящие поперек миры, и резкое измене- ние фазы (фиг. 2.11). Можно, конечно, получить форму этой кривой, если просто представить себе, что происходит с интегралом
Сравнение пространственных и временных фильтров 53 свертки при сканировании миры световым пятном. Сна- чала, когда пятно намного меньше просвета между линия- ми, будут лишь размазываться края линий. Затем, когда диаметр пятна будет того же порядка, что и просвет, увеличение интенсивности пропущенного света при ска- нировании будет почти точно компенсироваться уменьше- нием и, следовательно, модуляции света не будет (нуле- вой контраст). Далее, когда сканирующее пятно начнет перекрывать две линии, света будет больше проходить от двух белых линий, когда в центре пятна находится черная линия, чем в том случае, когда в центре пятна находится белая линия. Этим объясняется возникновение области ложного разрешения. Подобным образом можно и дальше рассматривать процесс сканирования. Следова- тельно, хотя задача была сформулирована для несфоку- сированной идеальной линзы, подобный путь анализа часто пригоден и для других сканирующих систем (на- пример, телевизионных и инфракрасных), для кото- рых функция рассеяния может быть аппроксимирована цилиндрическим распределением, представленным на фиг. 2.10, а. § 7. Движение изображения В качестве последнего примера применения изложен- ных методов при анализе простейших ситуаций в оптике и прежде чем переходить к детальному описанию методов определения частотных характеристик реальных оптиче- ских систем, мы покажем, как можно учесть эффект перемещения плоскости изображения относительно пло- скости объекта. Более точно задача формулируется сле- дующим образом: даны s(r) и т (со), обладающие круго- вой симметрией; требуется определить s' (х, у) и т' (ш) в том случае, когда вследствие относительного движе- ния с постоянной скоростью v каждая точка смещается на длину L = vt, например вдоль оси х. Поскольку нас интересует новая точка плоскости изображения s' (x, у), мы напишем L/2 s'(x,y)= J s{x-l,y)dl, B.11) -1.12
64 Глава 2 т. е. s' (х, у) можно рассматривать как изображение, образованное неподвижной системой s (х, у) для объекта в виде тонкой яркой линии длины L, проходящей вдоль Фиг. 2.12. оси |, как показано на фиг. 2.12, где R (?) — прямоуголь- ная функция. Таким образом, выражение B.11) можно рассматривать как интеграл суперпозиции, взятый по пло- скости объекта в виде >' (х, у) = ^ s (х -1; у - ц) R (I) б di\. Для определения т' (о) необходимо применить преоб- разование Фурье к обеим частям этого выражения и вос- пользоваться теоремой свертки для преобразования про- изведения, в результате чего мы получим , . , . , sin ( Таким образом, при наличии движения мы можем рас- сматривать разультирующую частотную характеристику как характеристику двух неподвижных систем, соеди- ненных последовательно. Первая система формирует т (ю), а вторая максимальным образом влияет на линейчатые структуры, нормали к которым совпадают с направле- нием движения, и не влияет на линейчатые структуры, нормали к которым перпендикулярны направлению дви- жения. Влияние на другие направления можно опреде- лить, если учесть, что ых = со cos 0.
Таблица 2.1 Интеграл супер- позиции Периодический входной сигнал 'Непериодический входной сигнал Временные фильтры t y(t)= ^ h{t-t')x{t')dt' — СО -f-co х @=2 xnel(i>nt — oo + ОО — oo Yn=H(an)Xn +OO x(t)- \ X (а) еШ da — OO +00 1 (* — CO У(со)=Я (cd)X(cd) Пространственные фильтры -» -i i {x, y)= \ \ s (x — |) 0 (I) d% — OO +00 o(i, Tl)= 2S Omnelp'<i'rnn П, П——CO 1 \x' У) 2j2j ^mn^ m, П——00 1тп = т:(<йт,п)Отп +CO — 00 +00 — СЮ /@))=T(COH(W)
Продолжение табл. 2.1 Случайный вход- ной сигнал Временные фильтры Ф (со) = \ ф (т) cos cot dx — со 4-со — со — СО Пространственные фильтры Ф»(е')=('(е)»(е+е')> — оо + со f» I» Фн(г)= \ \ <pss(e—г) «оо(е) <}q — оо *^ii (®) :==1 Т> (©) l^^oo (©) ^ Г* — со ф^0 (о^ = X" (ю) Фоо (©) *) При пространственном усреднении </> определяется следующим образом: + L+L
Сравнение пространственных и временных фильтров 57 В заключение настоящей главы мы еще раз напомним об аналогии между оптическими и электрическими филь- трами. Мы можем рассматривать всевозможные распре- деления яркости в пространстве объектов как периоди- ческие, неустановившиеся или случайные. Тогда все соотношения, рассмотренные ранее для временных филь- тров, будут справедливы и для оптических систем, но с некоторыми отличиями. Во-первых, все преобразования, конечно, двумерны. Во-вторых, при некогерентном освещении интенсивности света складываются линейно, так что все входные и выход- ные функции всегда оказываются положительными функ- циями. Во многих случаях нас будут интересовать флук- туации яркости относительно ее среднего значения, и эти значения флуктуации могут быть, конечно, как положи- тельными, так и отрицательными. Наконец, усреднения для корреляционных функций и их преобразований явля- ются пространственными, а не временными, и произво- дятся по большой площади. Поэтому термин «спектр мощности» не соответствует используемому понятию, и в том случае, когда речь будет идти о преобразованиях Фурье для корреляционной функции, мы будем пользо- ваться выражением «спектр Винера». В остальном анало- гия полная (основные соотношения приведены в табл. 2.1). ЛИ Г Ё V А Т У ? Л 1. Guillemin E. A., Synthesis of Passive Networks, New York, 1957. 2. Baghdady E. J., Lectures on Communication Systems Theory, New York, 1961. 3. L e e Y. W., Statistical Theory of Communication, New York, 1960. 4. D u m о n t e t P., Optica Acta, 2, 53 A955). 5. L i n f о о t E. H., Recent Advances in Optics, Oxford, 1955. 6. Papoulis A., The Fourier Integral and Its Applications, New York, 1962. 7. Marechal A., F r a n с о n M., Editions de la Revue d'Optique, Paris, 1960. 8*. Харкевич А. А., Спектры и анализ, М., 1962. 9*. Г и х м а н И. И., Скороход А. В., Введение в теорию случайных процессов, М., 1965. 10*. Л и н ф у т Е. X., ОМП, № 7, 35; № 9, 40 A965). И*. Марешаль А., Ф р а н с о н М., Структура оптического изображения, изд-во «Мир», 1964.
г л л в л 3 ВВЕДЕНИЕ В ГЕОМЕТРИЧЕСКУЮ ОПТИКУ § 1. Принцип Ферма и закон преломления Снеля В физике принято описывать поля с помощью вариа- ционных принципов. Наиболее старым вариационным принципом в физике является, по-видимому, принцип Ферма, лежащий в основе геометрической оптики. В соот- ветствии с этим принципом луч света проходит через среду так, что общая оптическая длина хода луча (сумма геометрических длин, умноженных на соответствующие показатели преломления (х) оказывается экстремальной. Это значит, что луч распространяется от точки Pi к точке Рг таким образом, чтог) ^ xds = O. C.1) А Не следует делать поспешного вывода о том, что свет всегда распространяется по наикратчайшему расстоянию. Часто путь луча оказывается не минимальным, а мак- симальным. Принцип Ферма просто указывает на нали- чие экстремума. В случае однородной среды (jx = const) из уравнения C.1) вытекает дифференциальное уравне- ние Эйлера — Лагранжа, описывающее прямолинейное распространение света. В случае же неоднородной среды (например, атмосферы, плотность которой и, следователь- но, показатель преломления переменны) путь, удовле- творяющий уравнению C.1), будет криволинейным. Применим принцип Ферма к задаче о преломлении луча на поверхности, разделяющей две однородные сре- ды с показателями преломления (х и \х' (фиг. 3.1). х) Поскольку |х = civ, этот принцип часто записывается как стационарный интеграл по времени б \ с dt = 0.
60 Глава 3 В данном параграфе мы будем рассматривать только лучи, проходящие в плоскости xz. Пусть ф и q/ — углы падения и преломления луча на поверхности. В этом случае принцип Ферма сводится к выражению 8L = (х (s + 6s) + u,' (s' + 6s') — ((xs + (x's') = 0, или где 6 указывает на малое отклонение от действитель- ного пути луча. Из геометрических соображений можно написать s + 6s = s -4- ~PQ sin ф, s' + 6s' = s' — ~PQ siu ф', так что принцип Ферма приводит к соотношению jx sin ф = (x'sincp', выражающему закон преломления Снеля. Точно так же можно проследить ход луча ниже оси z, преломление на других поверхностях и в конце кон- цов определить его высоту и направление при выходе из последней поверхности. Но мы лишь отметим, что про- исходит с лучом за промежуток времени между прелом- лением на первой поверхности и выходом из последней. Луч сначала отклонится от первоначального направле- ния, затем пойдет прямолинейно, потом опять откло- нится, опять пойдет прямолинейно и т. д. Если заданы высота и направляющий косинус при- ходящего луча, то удобнее всего было бы заменить иног- да очень сложный оптический прибор оператором, кото- рый давал бы высоту и направляющий косинус выходя- щего луча. Если бы это было возможно, то уже не составило бы труда вернуться назад от первой поверхности к плос- кости объекта или перейти от последней поверхности к плоскости изображения. Мы получили бы тогда опера- тор, с помощью которого положение и направление луча, выходящего из плоскости объекта, преобразуются в поло- жение и направление луча, входящего в плоскость изоб- ражения.
Введение в геометрическую оптику 61 Какими же свойствами должен обладать такой опера- тор, чтобы все лучи (независимо от направления), выхо- дящие из плоскости объекта на высоте х, сходились в точку на высоте х', отличающейся от х масштабным множителем (увеличение |3')? То есть мы хотим знать, как найти плоскость изображения. Далее можно спросить, при каких условиях получается изображение плоскости с увеличением, равным единице (Р' = 1). Это вопрос о главных плоскостях системы. Наконец, мы можем опре- делить свойства оператора таким образом, чтобы луч, исходящий под углом а из точки объекта, лежащей на оптической оси, попадал в точку изображения, лежащую на оптической оси, под тем же углом а' = а. Такими точками определяется положение узловых плоскостей. Таким образом, оператор должен содержать все сведения о положении кардинальных плоскостей и кардинальных точек (точек пересечения кардинальных плоскостей с опти- ческой осью). § 2. Принятые обозначения и правила знаков Найти операторы, выполняющие эти преобразования, не представляет труда. Для решения подобных проблем идеально подходит матричная алгебра. Очевидно, что наши преобразования связаны с двумя основными операциями — преломлением *) и перемещением. Выведем выражения для матрицы преломления R и, матрицы перемещения Т. Но прежде всего условимся о правилах знаков и обозначениях. 1. Если особо не оговорено, то будем всегда считать, что свет направлен слева направо. 2. Любое расстояние положительно, если оно изме- ряется слева направо. 3. Расстояние всегда измеряется от преломляющей поверхности. 4. Вершиной преломляющей поверхности будем назы- вать точку ее пересечения с осью симметрии системы. х) Далее мы будем рассматривать отражение как частный случай преломления, вводя отрицательный показатель преломления в закон Сне ля.
t л а 5. Радиус кривизны считается положительным, если вершина расположена слева от центра кривизны. 6. Координаты луча до и после преломления обозна- чаются одинаковыми буквами, но после преломления эти буквы пишутся со штрихом. 7. Для обозначения поверхности, на которой проис- ходит преломление, используются индексы. Поверхности нумеруются в том порядке, в котором свет проходит через них. § 3. Матрица преломления Рассмотрим (фиг. 3.2) падающий и преломленный лучи. Для простоты будем иметь дело только с лучами, лежа- щими в плоскости xz {у = 0). Метод может быть непосред- ственно применен и к лучам, лежащим вне этой плоско- сти; в конце этого параграфа мы приведем соответствую- щие результаты для луча, пересекающего поверхность Преломленный луч Фиг. 3.2. в точке (х, у, z) с направляющими косинусами I, т, п. Обозначим радиус кривизны сферической преломляющей поверхности через г = PC и назовем кривизной поверх-
Введение в геометрическую оптику 63 ности величину R = 1 /г. Отложим на схеме отрезких) PU = \i, PF = [x'. Тогда US = \i sin ф, VT = [х' sin ф' и US = VT, как это следует из закона Снеля. Таким образом, пря- мые UV и PC параллельны и имеют один и тот же направляющий косинус 0—х „ cos а — = — хп. Далее рассмотрим проекцию треугольника PVU на ось х (фиг. 3.3). Мы видим, что cos (я-а), или после некоторых преобразований |хТ = [xZ + UV cos a = \il-UVj . Но, так как UV = РТ — PS = jo,' cos ф' — [х cos ф, то где . [Х' COS ф'—[XCOSCp называется оптической силой поверхности. Определим теперь «оптические направляющие косинусы» с помощью соотношений и так как ж' = л до и после преломления, то уравнение J) То есть, используя произвольные единицы, мы откладываем отрезок PU, равный показателю преломления.
Глава 3 преобразования при преломлении имеет вид 'L'\ /I -A\ IL х-I [о 1)[х где матрица преломления R определяется выражением /1 —А О 1 R: § 4. Матрица перемещения Опишем теперь прохождение луча от одной поверх- ности к другой после его преломления. Для удобствах) введем «приведенное расстояние» Т\^=Т\1\к'', где Т\ — гео- метрическая длина хода луча, а штрих указывает, что J Фиг. 3.3. Ф п г. 3.4. произошло преломление; индекс относится к j-и поверх- ности. Из фиг. 3.4 видно, что xin = Xi + ps cos a = Xi + T'il'i, или г) Величины, обозначенные жирными буквами Т, t, a, l и а, содержат показатель преломления среды.
liecOeuue и геометрическую оптику 65 но поскольку ТО при переходе от одной поверхности к другой а матрица перемещения имеет вид Рассмотрим теперь слоишую систему преломляющих поверхностей, центрированных относительно оптической оси. Матрица, описывающая преобразование высоты и направления луча при его перемещении от первой вер- шины системы V к самой последней V, определяется выражением так — ЧТО (i -АЛ 1 1 В — ( • \J-n-i л) ' I !) A l L'\ I В —Л\ IL Ы Ш Для лучей, наклонных к плоскости чертежа, мы могли бы провести точно такие же рассуждения и дополни- тельно к выражению C.3) получили бы уравнение 1М'\ I В —А\ 1М\ \y'l=\-D C)\y)' где М — оптический направляющий косипус по отноше- нию к оси у. Поскольку выражения для оси у могут быть непосредственно получены из подобных же выраже- ний для оси х, мы по-прежнему ограничимся рассмот- рением лучей, лежащих в плоскости xz.
Глава 3 § 5. Параксиальное приближение Имеется простой способ проверки матричного произ- ведения, представленного выражением C.2). Ввиду того что определители матриц перемещения и преломления равны единице, определитель конечной матрицы S также Фиг. 3.5. должен равняться единице (ВС — AD = 1). Это спра- ведливо на каждом этапе процесса приведения, и ука- занное положение может быть использовано для быстрой проверки расчетов оптических систем. К сожалению, в силу нелинейности соотношений основ- ные элементы А и Т' этих матриц различны для каждого луча, входящего в систему. Например, даже при обычном «сагиттальном»х) приближении оптическая толщина выра- жается через квадраты координат, определяющих прелом- ляющую поверхность второго порядка. Более того, закон Снеля описывает линейное соотношение между синусами углов падения и преломления, тогда как а — оптическая сила преломляющей поверхности — содержит косинусы J) Необычный, используемый лишь автором термин. Очевидно, имеется в виду зейделева область, т. е. область, окружающая парак- сиальную, в которой учитываются лишь аберрации третьего поряд- ка малости.— Прим. ред.
Введение в геометрическую оптику 67 этих углов. В результате каждая пара А и Т' отличает- ся для разных лучей. Чтобы установить некоторые общие свойства линзо- вых систем, мы вынуждены пойти на компромиссное решение, для чего рассмотрим только пучки лучей, про- ходящих вдоль оси системы (параксиально). При этом мы упростим анализ, но зато не сможем точно описать пове- дение луча, удаленного от оси. В этом первом прибли- жении мы берем только первые члены в разложении для А и Т'. В случае «параксиального приближения» мы напи- шем cos ф' да coscp да 1, А да ——— = а, T' = t', измеренные вдоль оси. Чтобы помнить о наличии прибли- жения, мы заменим большие буквы А, В, С, D малыми: — d Кроме того, на основании схемы фиг. 3.5 мы введем дополнительные приближения I = cos р = sin а да а, L==[xZ да [ха = а', L' = |iT да а', х да h = 1г . Наше основное матричное преобразование принимает сле- дующий вид: 1а[\ /1 -а\1аЛ /о,+1\ _ /1 0\ § 6. Образование оптического изображения Теперь нетрудпо перейти к рассмотрению процесса образования оптического изображения. Построим две пло- екости (фиг. 3.6): одну слева от передней вершины пре- ломляющей поверхности V и другую справа от задней вершины преломляющей поверхности V. Преобразование
68 Глава 3 ^ луча между этими плоскостями можно, очевидно, опи- сать двумя матрицами перемещения следующим образом: /1 0\ / Ъ —а\ /1 0\ Sp'p = , где с учетом принятого правила знаков I относится к передней, а /' — к задней вершинам прелом- ляющих поверхностей. Выполняя матричное перемноже- ние, получаем hl'-\-all' — d-lc с-Г а Назовем изображением точки Р точку Р', для которой х' = $'х (при любом угле а), где Р' — постоянный мас- штабный коэффициент, называемый увеличением. Это значит, что мы приравниваем нулю нижний левый эле- мент и в результирующей матрице перехода решаем уравнение относительно Ic + d V -- 1а-\-Ъ ' Далее b + la C.4) поскольку определитель матрицы должен быть равным единице. Отрицательная величина |3' просто означает, что изображение будет обратным (перевернутым). Напи-
Введение в геометрическую оптику 69 шем выражение для преобразования луча между сопря- женными х) плоскостями C.5) где, очевидно, R' х' и для сопряженных точек на оси (х -- 0) § 7. Кардинальные точки Определим главные плоскости AН, Гн) как сопряжен- ные плоскости с увеличением |3' = 1. Из выражения C.4) получаем с — 1'цп -= 1 == Ъ 4- fHa, или IH-—J-, 1>н~- а ¦ Этими соотношениями через величины элементов (а, в, с) матрицы системы Syv определяется положение главных плоскостей. Главные точки суть точки пересечения глав- ных плоскостей с осью системы, и так как р" = -\- 1, для этих точек приведенные углы одинаковы (а' = а). Допустим, что мы определяем положение плоскостей объекта и изображения относительно главных точек, а не передней и задней преломляющих поверхностей. Тогда из фиг. C.7) следует, что2) х) Плоскости объекта и изображения. 2) Значения этих величин будут отрицательными, если их опре- делять по отношению к передней вершине V.
H V V Н' s *¦ к * -5'- Плоскость объекта Плоскость изображения Фиг. 3.7.
Введение в геометрическую оптику 71 так что Р' = с — Га = с — в'а — Ъ'на — 1 — в'а и 5tZa 6 — = 5-t-Za = 6 + sa + ?Ha — 1 4- sa. Р Следовательно, если исходить из расстояний, отсчиты- ваемых от главных точек, матрица системы будет иметь вид ^ — I л ' ,'_ / ' r sa —a 0 i — s'aj и, так как определитель равен единице, можно записать A -f- sa) (I — s'a) = 1, откуда вытекает известная формула 1 1 Это выражение представляет собой простую формулу линзы. Далее, из соотношений |3' = 1—s'a и l/{5' = l-f sa находим Посмотрим теперь, каков смысл элементов (а, в, с, с?) матрицы системы. Эти величины известны как гаус- совы постоянные системы. Поскольку определитель дол- жен быть равным единице, достаточно исследовать только три из этих величин. Сначала, полагая в формуле C.6) расстояния до плоскостей объекта и изображения (s, s') поочередно равными бесконечности, мы определим а в зависимости от задних и передних фокусных расстояний /', /: а = 77=~Т ' или, исключая а, получаем
72 Г а а в а 3 Далее, если в формуле C.7) s-»-oo,to P' ->- 0, и заднее фокусное расстояние ГР, измеренное от задней вершины преломляющей поверхности, в соответствии с выраже- нием C.4) будет равно If ----- cf . а Точно так же 1/|3' -> 0 при &' —>¦ оо, и мы опять полу- чаем из формулы C.4) выражение для переднего фокус- ного расстояния 1р, измеренного от передней вершины: Таким образом, величины в и с показывают, какая часть фокусных расстояний лежит вне линз и косвенно где расположены главные точки. Узловые точки 1К и l'N оптической системы опре- деляются как сопряженные точки на оси, которые харак- теризуются тем, что лучи, проходящие через них, состав- ляют одинаковые углы а' =¦ а с осью симметрии. Пола- гая х — 0 в формуле C.5), путем подстановки = sj—r = 1 ИЛИ 6 -- -V = С — l л a |3 [л r [i мы можем получить для 1К и 1ц выражения (ц/ц')- 6 г с —(ц/[х') 'л- «л-^ 'л- так что в воздухе узловые и единичные точки совпадают. Главные и узловые точки часто называют кардинальными точками системы1). х) Если крайние показатели совпадают, узловые точки совпа- дают с главными и к группе кардинальных точек необходимо еще добавить фокусы.-- Прим. ред.
Введение в геометрическую оптику 78 § 8. Примеры Покажем, как нужно пользоваться матрицами в неко- торых типичных случаях1). Следует помнить: когда чер- тится пучок параксиальных лучей, проходящих через систему, параллельные лучи от пространства предметов, выходя из системы, проходят через задний фокус; луч, пересекающий переднюю главную плоскость 1Н, будет выходить на з&рдеш главной плоскости Гн на той же высоте (так как эти плоскости соответствуют увеличе- нию 1); и наконец, луч, проходящий через переднюю узловую точку под углом а к оптической оси, пройдет через заднюю узловую точку под тем же углом. 13 6 125 ,79 ,102 ,5 1 1 1 ,000 ,6203 ,5728 1 1 1 м.' , 6203 ,5728 ,0000 0 0 V ,290 , 590 0 0 V ,1790 ,3751 ,' 0, -о, -о, Таблица 6203 0475 5728 0, —0, -о, S.I а 04498 00778 00456 Пример 1. Телескопический дублет. В табл. 3.1 даны радиусы линз, показатели преломления и расстоя- ния. Необходимо вычислить матрицу системы: b -- / b ¦ \-d I1 [о о, -a\ *Г 0045В\ 1 / / Xl / [ 1 \ 0 1 0 1 1 3 \ -l) 1 ,3751 0\ ,179 l/ I1 \t 0 1 / I 0' и. w )( i 0 \ /1 -fl2\ /1 / \0 -1 / [t 1 0,00778\ 0 1 ) -0,04498 \ 1 I1 0\ ;i/ A z1- lo J) Все размеры ниже даны в сантиметрах, и, как уже говори- лось, величины, обозначенные жирными буквами У, t, a, l и s, содержат показатель преломления среды.
74 Глава 3 с Ъ —а — d 1,0039 — 0,0328\ 0,5546 0,9780/ ' /=--=-30,488, H = ^i= — 0,1189, /' = 1 = 30,488, = -0,6707, lF= --=—30,607, l'F = — = 29,817. a 'as Схема представлена на фиг. 3.8. Г Н Н' t F' Ф и г. 3.8. Телескопический дублет. Пример 2. Окуляр Рамсдена. В табл. 3.2 даны показатели преломления, расстояния и радиусы линз. Необходимо вычислить матрицу системы: S = Ъ - с — d 0 1 х 0 1 0\ /1 -о3 1/ \0 1 1 X X 1 — аЛ /1 0\ /1 — а^ 0 1 Д«; 1/ \0 1 1 0\ /1 -0,32055\ / 1 О 0,1637 1/ \0 1 j B,230 1 1 -0,27899\ / 1 0\ /1 0\ О 1 } ^0,2292 1/ [l 1/ ' X
Таблица 3.2 г со -1,890 1,645 со 1 1 1 1 |1 ,0000 ,5273 ,0000 ,5273 1 1 1 1 ,5273 ,0000 ,5273 ,0000 0 2 0 с ,350 ,230 ,250 0 2 0 V ,2292 ,230 ,1637 1* 0 -0 0 —0 '—11 ,5273 ,5273 ,5273 ,5273 0 0 0 0 а ,0 ,27899 ,32055 ,0 Таблица 3.3 1 -27 g 1 1 —2 Г ,628 ,57 ,457 ,582 со ,920 ,400 1,0000 1,6116 1,0000 1,6053 1,0000 1,5123 1,6116 1 1 1 1 1 1 1 ,6116 ,0000 ,6053 ,0000 ,5123 ,6116 ,0000 г 0,357 0,189 0,081 0,325 0,217 0,396
76 Г л а в а 3 Ъ -о\ /0,1935 - 0,4001\ rf с/" B,3482 0,3124/ /=-|=.--2,499, /'^1 = 2,016, *н=-1,719, Z?, = — А = - - 0,483, Гр - -1 = 0,780. Схема хода лучей представлена на фиг. 3.9. Пример 3. Объектив «Тессар». В табл. 3.3 даны показатели преломления, расстояния и радиусы линз. Вычисляем сначала я-0,1968, с = 0,8675, Ь-0,8489, «U--1,3387, а затем переходим к определению положения главных и фокальных плоскостей. Главные плоскости: 1Н -0,7678, 1'н ^ —0,6733. Фокальные плоскости: /= -5,082, /'-5,082. На фиг. 3.10 представлена схема объектива для этого случая. Пример 4. Этот интересный пример предназна- чен для читателя, желающего проверить, насколько он усвоил принятые обозначения и правила знаков. Опти- ческая система, показанная на фиг. 3.11, представляет собой стеклянную сферу с показателем преломления \х',
н' н 1 F Н' Н F' Ф и г. 3.9. Окуляр Рамсдена. Н Н Фиг. ЗЛО. Объектив «Тессар». F' Фиг. 3.11.
78 Глава 3 посеребренную с обратной стороны для того, чтобы поверх- ность была отражающей. Необходимо заметить, что среди других правил, сформулированных ранее, было принято условие, что расстояние считается положительным, если оно измеряется по направлению от объекта. Тщательно фиксируя знаки каждой величины, мы выполним расчет матрицы системы в следующем виде: Теперь, задавая различные значения величины \i', можно анализировать интересные частные случаи. Прежде чем заканчивать изложение параксиальной оптики, остановимся на одном интересном вопросе, кото- рый касается теории зрачков. Дело в том, что из полного пучка лучей, берущих начало в точке объекта, лишь часть падает на первую преломляющую поверхность, про- ходит через систему, выходит из последней поверхности и собирается в точке изображения. Для осевой точки, лежащей в плоскости объекта, пучок, проходящий через систему, более всего ограничивается какой-то диафраг- мой. Чтобы найти эту ограничивающую диафрагму, нуж- но построить изображения всех диафрагм, лежащих спра- ва от первой преломляющей поверхности системы (вклю- чая края линз), в пространстве объекта, начиная с первой поверхности. Та диафрагма, изображение которой в пространстве объекта более всего ограничи- вает угол, в пределах которого пучок лучей, испу- скаемый осевой точкой, входит в оптическую систему, называется входным зрачком Е. Ее изображение в про- странстве изображений называется выходным зрачком Е'.
Введение в геометрическую оптику 79 Очевидно, что положение входного и выходного зрачков зависит от положения плоскости объекта. Для фикси- рованной плоскости объекта при перемещении в сторону от оптической оси пучок лучей, исходящих из внеосевых точек, будет ограничиваться различными и иногда даже несколькими диафрагмами. Если все дальше и дальше отходить от оптической оси, то можно достигнуть такого положения, когда уже ни один луч не будет проходить через оптическую систему. Луч, идущий из внеосевой точки и проходящий через осевую точку входного зрач- ка, называется главным лучом для этой точки объекта. Поскольку, вообще говоря, прохождение этого луча в пре- делах системы может ограничиваться одной или несколь- кими диафрагмами, то только часть первоначального пучка, выходящего из данной точки объекта, будет частич- но заполнять выходной зрачок. Такой эффект называется виньетированием. Участок поля изображения, освещен- ность на краю которого примерно в 2 раза меньше осве- щенности в центре, называется полем зрения прибора. Диафрагма, которая перекрывает главный луч, идущий из точки объекта, соответствующей краю поля зрения, называется полевой диафрагмой в пространстве объектов. Сопряженная ей диафрагма в пространстве изображений называется полевой диафрагмой в пространстве изобра- жения. В ряде систем вводят линзы, которые не изменяют соотношений между объектом и изображением, но увели- чивают поле зрения. Такие линзы называются полевыми линзами (коллективами). ЛИ ГЕРАТУ Г Л 1. Brouwer W., Matrix Methods in Optical Instrument Design, New York, 1963. 2. Steward G. C, The Symmetrical Optical System, Cambridge, 1928.
ГЛАВА 4: ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ § 1. Волновая аберрационная функция Рассмотрим вопрос о формировании изображения в том случае, когда учитываются величины более высоких поряд- ков в разложениях А и 7" в основных матрицах R и Т. Развитие теории, основанной на представлениях парак- сиальной оптики, приводит к теории аберраций трех, пяти, семи и более высоких порядков. Вопрос о том, каким образом суммируются эти аберрации при пере- ходе от одной преломляющей поверхности к дру- гой, является основной проблемой при расчете линз. Детальное исследование этого интересного вопроса может увести нас очень далеко. Здесь достаточно указать, что в настоящее время быстродействующие вычислительные машины позволяют в принципе конструировать более сложные оптические системы и сводить к минимуму уто- мительные ручные расчеты. Но на практике машина может только выполнить вычисления по заданной ей програм- ме, так что степень точности расчетов, достижимой при данных физических и экономических условиях, опреде- ляется опытом и изобретательностью конструктора. Геометрическую теорию аберраций мы будем излагать феноменологически. В соответствии с фиг. 4.1 заменим символически реальную оптическую систему системой четырех плоскостей, а именно плоскостей объекта, изоб- ражения и входного и выходного зрачка. Затем построим сферу с центром в точке Р', являющейся гауссовым изображением точки Р. Радиус сферы R проходит через центр выходного зрачка и, следовательно, совпадает с главным лучом. Если бы оптический путь был одина- ков для каждого луча, выходящего из точки Р и про- ходящего через оптический прибор и его выходной зра- чок, тогда сфера сравнения совпадала бы с поверхностью
Входной зрачок A(u,v,h) \ Q(u,v,w) S'-— Реальная поверхность х Q'(x,y,z) Идеальная сфера Выходной зрачок фиг. 4.1.
82 Г л а в а 4 постоянного оптического пути и все лучи собирались бы в точке Р'1). Но на самом деле эта поверхность не является сферой, и функцию, характеризующую степень отклонения формы этой поверхности от сферы, мы будем называть аберрационной функцией А (и, v, А). Для абер- рационной функции возможны различные представления, но мы рассмотрим пока что только разложение в степен- ной ряд, и лишь несколько позже обратимся к представ- лению аберрационной функции в виде разложения по пол- ному набору функций, ортогональных к единичному кру- гу. Далее, можно показать, что при симметричной опти- ческой системе, если использовать для точек выходпого зрачка полярные координаты р и <р, величина А зависит только от трех инвариантов вращения: /г2, р2, ftp cos <p. В общем случае мы можем написать А (р, ф, h) = а0 + Ьо№ + V2 + bjip cos cp + со/г4 -f cipi + -1- c2/i2p2 cos2 cp -\- c3/i2p2 + cji3p cos cp + + с5Лр3 cos cp + dohe + dtpe +..., D.1) где —^— , 0 < p < 1, V v --- ap sin cp, cp = arctg — , a — радиус выходного зрачка. Заметим, что слагаемые, содержащие множители bt и Ь2, определяют фокусировку системы, а слагаемые с множителями сь с2, с3, с4, с5 характеризуют классиче- ские аберрации по Зейделю (сферическую аберрацию, астигматизм, кривизну поля изображения, дисторсию и кому). Мы вернемся к этим аберрациям позже и под- робно их исследуем, но сначала мы должны выяснить, как 1) Мысль автора лучше выразить следующими словами: если оптические пути одинаковы для всех лучей, сходящихся в точке Р, то поверхность волны, представляющая собой поверхность, ортого- нальную семейству лучей, будет сферической и не будет отличаться от поверхности сравнения, т. е. поверхности волны, соответствую- щей идеальной (безаберрационной) системе, имеющей вид сферы с центром в точке Р и служащей для сравнения истинной волновой поверхности с идеальной.— Прим. ред.
Геометрическая теория аберраций 83 влияет форма деформированной поверхности на степень отклонения лучей от точки гауссова изображения Р'. Чтобы ответить на этот вопрос, мы сделаем небольшое отступление и посмотрим, каким образом осуществляется переход от физической к геометрической оптике. § 2. Связь между геометрической и физической оптикой Метод исследования связи между геометрической и физической оптикой вполне аналогичен методу ВКБ 2) в квантовой механике. В этом методе начинают с вол- нового уравнения (уравнения Шредингера) и разлагают фазу функции гр в ряд по степеням постоянной Планка h. В приближении нулевого порядка волновое уравнение имеет только коэффициент при h° и решением его являет- ся известное из классической механики уравнение Гамиль- тона — Якоби: где grad W есть импульс р. Затем обычно последова- тельно рассматриваются приближения первого, второго и более высоких порядков. В оптике исходят из волнового уравнения где ^ — показатель преломления, решение которого можно записать в виде где Л (г) и L (г) — действительные величины. Подставляя для удобства вместо А (г) величину е"^ и замечая, что в волновом уравнении можно произвести замены ?2Ф = div grad cp = [V2 (а + ikL) + {grad (a + ikL)f] ф Метод Врптцеля — Крамерса — Бриллюопа.— Прим. ред.
84 Глава 4 мы получаем { V2a + (grad af - к* [(grad Lf - u2]} + + ik {2 (grad a) ¦ (grad L) + V2L} = 0. Приравнивая действительные и мнимые части обеих сто- рон уравнения, для действительной части2) имеем (grad Lf - u.2 = -^ [ V2a + grad af]. В пределе при К ->- 0 мы получаем основное уравнение эйконала геометрической оптики (gradL)8 = |i8. D.2) Следовательно, поверхности постоянного L являются поверхностями постоянной оптической фазы, и, таким образом, они определяют фронт волны. Далее, траекто- рии лучей нормальны к поверхности волны2). Так как формула D.2) является приближенной, то мы не можем рассчитывать на то, что она останется справедлива, когда изменения а(т) в пространстве уже не будут пренебре- жимо малыми по сравнению с 1/л. Следовательно, вблизи резкого фокуса, в котором происходит высокая концен- трация интенсивности света, мы можем встретиться со значительными отклонениями от результатов, предска- занных геометрической оптикой. § 3. Уравнения для отрезков луча Возвращаясь к рассмотрению выходного зрачка и имея в виду основное положение геометрической оптики (Х = 0), которое позволяет нам воспользоваться уравнением D.2), мы можем попытаться определить уравнение прямой ли- нии, проходящей между Q (и, v, w) и Q' (х, у, z) с до- полнительным условием, чтобы она была нормальна к А (и, г?, К), в точке Q. Уравнение реальной волновой *) Приравнивая мнимые члены, получаем соотношение, выра- жающее принцип сохранения энергии. 2) Это вытекает из закона Малюса, доказательство которого опирается на закон преломления.— Прим. ред.
Геометрическая теория аберраций 85 поверхности S' т,2 _| 7,2 I ,,,2 1 Т> I Л \2 приводится к уравнению идеальной сферы при А = 0. Поскольку большей частью мы будем иметь дело с дефор- мациями волнового фронта, выраженными в единицах длины волны света, можно пренебречь величиной А2, и мы получим и*-\-и*-\-и;2 — 2i?A — i?2 = 0. D.3) Направляющие косинусы единичного вектора п — i cos a + j cos p + k cos v, нормального к поверхности iS", и единичного вектора прямой, проходящей между Q и Q', определяются выра- жениями cos а = -гг ft \J 1 Л" | qq> V~R I QQ' W Z—W Г V21 grad S'\ QQ7 ' Уравнение луча, выходящего из точки Q выходного зрачка по нормали к фронту волны и пересекающего плоскость изображения в точке Q', имеет вид u—R(d&/du) v — R(dMdu) w ' или, так как в большинстве практических применений wtt—Д или -r-^-j- « -^- < 1, мы получаем ЖЛ;_.__ + Д__, у^-—-,-/?—. D.4) В гауссовой плоскости изображения (z = 0) выражение D.4) приводится к важным соотношениям „ 9А ,, 9Д // г\
86 Г л а в а 4 В равной степени важно указать, что в данном пара- графе х ж у обозначают отклонения от точки Р' пло- скости гауссова изображения. Точкой (x = 0 = y = z) мы считаем, как правило, внеосевую точку изображения Р', а не осевую точку плоскости изображения О. В поляр- ных координатах р и ср выражения D.5) имеют вид R / <ЭД sin ш <ЭД Хп « COS ф -= 2- ^т— R С . дА , cos го ЗА Л D# ' так что, если в некоторых случаях А=/=А(ф), то семей- ство лучен, для которых р= const = р1? будет пересекаться с гауссовой плоскостью изображения в кольце радиуса г0, определяемом выражением Величина р называется поперечной аберрацией. Продоль- ный разброс (вдоль оси) для этого частного случая можно определить в полярных координатах по формуле D.4), полагая в ней х=у = 0. Для данного кольца в выходном зрачке р = pi продольный разброс равен *=4Ц^- - D-8) а'р dp p=pj и общий эффект можно определить путем сложения сос- тавляющих от каждого кольца 0<;р!<;1. Проведем теперь подробное исследование каждого чле- на степенного ряда D.1). 1. Постоянные члены. Хотя такие члены могут иногда входить в общее выражение для А, мы видим из фор- мул D.5) и D.6), что, так как они не содержат им v и, сле- довательно, р и ф, то они не вызывают аберраций и все лучи собираются в точке Р' (х = О = у = z). Как мы увидим, в общем добавление постоянной величины не влияет на результаты, полученные с помощью либо гео- метрической, либо физической оптики. Добавление посто- янной величины просто соответствует выбору сферы раз- ного радиуса, но с одним и тем же центром.
Геометрическая теория аберраций 87 2. Ошибки фокусировки, а) Продольная: Из выражений D.7) и D.8) мы видим, что 2hR л ^ ^ а го = —х— pi, 0 < pj < 1, так что каждое кольцо в выходном зрачке с радиусом pt отображается кольцом в гауссовой плоскости изображе- ния с радиусом r0 = BbiR/a) ри имеющим максимальный размер Bb1R)/a для крайних лучей (фиг. 4.2). Однако все лучи проходят через точку [0,0 B&!i?2)/a2]. Следова- тельно, это не аберрация, а продольная ошибка в фоку- сировке. И наоборот, если мы передвинемся из фокуса, находящегося в точке Р', на величину 6L относительно новой идеальной сферы, центр которой расположен вне фокуса, то мы введем ошибку волнового фронта, равную ?>ip2. Зависимость между Ъу и 6L может быть определена непосредственно из геометрических соображений. Из подоб- ных треугольников получаем dL 2b^R го ~R~= а* =~а~ ' Отсюда следует, что аЧЬ б) Поперечная: А = b2hp cos Из выражения D.5) мы видим, что все лучи собираются в точке \(b2hRla), 0,0]. Следовательно, и эта ошибка не аберрация. Просто такой член описывает наклонный вол- новой фронт (фиг. 4.3). Наоборот, если переместиться из гауссова фокуса совершенной системы на величину ЬТ поперек главного луча, то мы получим ошибку вида, bzh = {abT)IR.
Фиг. 4.2. A=b2hpcoscp Фиг. 4.3. Л=с,р4 Фокус для Фокус для параксиаль- крайних, ных лучей лучей фиг. 4.4.
Геометрическая теория аберраций 89 3. Аберрации Зейделя. Следующие пять членов степен- ного ряда для А в выражении D.1) представляют собой классические аберрации Зейделя третьего порядка. Тре- тий порядок понимается в том смысле, что при дифферен- цировании общий показатель степени h и р среди этих членов уменьшается от 4 до 3. а) Сферическая аберрация. Это член третьего порядка, существующий только на оси h = 0. Используя выраже- ния D.7) и D.8), мы видим, что каждое кольцо pt создает свое собственное изображение в гауссовой плоскости, пересекающееся с осью в точке z, различной для разных зон. Максимальное значение этих отклонений для край- них лучей р — 1 определяется следующими выражениями (фиг. АЛI): с, и 61.=-^-с,. Этот эффект может быть частично скомпенсирован путем перемещения центра сферы из фокуса на расстояние б/ и рассмотрения деформации волнового фронта относитель- но новой идеальной сферы. Так как a2 RT , а2 Ш~°Ь и fe* = W то волновую деформацию относительно повой плоскости изображения можно представить в виде где bf определяет положение плоскости изображения: и. = 0 соответствует параксиальному фокусу; jj, = 1 соответству- J) Необходимо уяснить, что в этом и в других примерах знак минус перед Cj указывает на то, что реальный волновой фронт опе- режает идеальную сферу, а не отстает от нее, и, следовательно, крайние лучи должны фокусироваться впереди параксиального фокуса по направлению к выходному зрачку, а не за параксиаль- ным фокусом.
90 Глава 4 ет фокусу для крайних лучей. Форма волновых деформа- ций для различных величин ji показана на фиг. 4.5. Позже, при рассмотрении частотной характеристики опти- ческой системы при наличии аберраций мы попытаемся Фиг. 4.5. определить, какое из этих положений фокуса является оптимальным. Здесь достаточно заметить, что элементар- ные геометрические соображения приводят к выбору (л, = 1/2; это значит, что плоскость изображения должна быть расположена посредине между фокусами для край- них и параксиальных лучей1). х) Этот вывод может привести к недоразумениям, связанным со словом «геометрический». Если исходить из соображений геомет- рической оптики и искать плоскость, в которой кружок рассеяния от сферической аберрации третьего порядка имеет минимальное значение, то лучшее положение плоскости установки соответствует 3/4 пути от параксиального фокуса до точки пересечения крайних лучей с осью. Если же исходить из соображений физической оптики и искать плоскость, в которой получается наибольшая концентра- ция энергии при наличии небольшой сферической аберрации третьего порядка, то эта плоскость окажется в середине вышеуказан- ного промежутка.— Прим. ред.
Геометрическая теория аберраций 91 б) Астигматизм и кривизна поля изображения: А —- с2/г2р2 cos2 ф + с3/г2р2. Эти две аберрации обычно рассматривают вместе, и иног- да их исследование удобнее проводить, пользуясь прямо- угольной системой координат и и v: Как видим, в этом случае в сагиттальной (и = 0) и тан- генциальной (г? = 0) плоскостях они имеют вид продоль- ных фокальных ошибок; волновой фронт обладает различ- ной кривизной в этих двух плоскостях. Используя общее выражение D.4), мы видим, что в плоскости, смещенной на расстояние z от гауссовой плоскости, X=l —д + -р" (С2 + С3) J U, возводя их в квадрат и складывая, получаем + =п Р откуда следует, что каждое кольцо выходного зрачка изображается в виде эллипса в плоскости z (плоскости изображения). Максимальные размеры эллипса будут при р = 1 и тогда 2 2 где большая и малая полуоси определяются выраже- ниями 2RW , , ч 1 а Установим теперь значения с2 и с3. Во-первых, удобно ввести параметр а, определяемый как
92 Г л а в а 4 Затем мы отметим, что изображение превращается в линию (А = 0), когда лучи фокусируются в тангенциальной плоскости. Поверхность, на которой это происходит, опи- сывается уравнением Подобным же образом лучи в сагиттальной плоскости (и = 0) фокусируются в линию на поверхность, которая описывается выражением zs--=oc3. Общее расхождение между этими фокальными линиями равно Таким образом, мы установили, что с2 представляет собой коэффициент астигматизма. Он характеризует расстояние между тангенциальной и сагиттальной фокальными поверх- ностями. Далее, если с2 = 0, то А = В и zT = zg. Лучи собираются в точке, но эта точка все более и более откло- няется от гауссова изображения, если источник удаляется от оси (h увеличивается). Следовательно, мы получаем искажение, которое называется «кривизной поля изоб- ражения». В общем случае, когда с2 и с3 не равны нулю, имеется поверхность zc, на которой изображение точки превра- щается в кружок («кружок наименьшего рассеяния»)*). Чтобы определить эту поверхность, положим А2 = В2 и найдем решение для z = zc. В результате получаем zc = у Bс3 + с2) или zc= "т2 "s , т. е. поверхность, где образуется так называемый «кру- жок наименьшего рассеяния», лежит посредине между сагиттальной и тангенциальной фокальными поверхно- стями. *) Позже, при более точном физическом описании распределе- ния света в изображении нам придется отказаться от этого термина. На самом деле световое пятно оказывается не круглым.
¦ч-
94 Глава 4 Все возможные состояния изображения представлены на фиг. 4.6 и описываются соотношениями а = - в) Дисторсия: А = с4/г3р cos ф — Если рассматривать зависимость отклонения от апер- турных координат, то величина дисторсии тождественна поперечному сдвигу в плоскости изображения, о ко- тором мы говорили ранее: для точки поля, удаленной от оси на расстояние /г, все лучи фокусируются в точке [(R/a) cji3, 0, 0]. Но при этом смещение изменяется Fh Г"/ Х- п ил * 1—1 Бочкообразная дисторсия Подушкообразная дисторсия Ф и г. 4.7. пропорционально кубу угла поля зрения (так как в выра- жение для дисторсии входит /г3) и в зависимости от знака с4 приводит к хорошо известной либо «бочкообразной», либо «подушкообразной» дисторсии объекта, если пос- ледний имеет вид сетки, как это показано на фиг. 4.7.
Геометрическая теория аберраций 96 г) Кома: А Л3 cosqp. Подставляя это выражение в выражение D.6), мы полу- чаем х0 = рр2 C cos2 ф + sin2 ф) = рр2 B + cos 2ф), У о = Рр2 C cos ф sin ф — cos ф sin ф) = рр2 sin 2ф, где Можно записать эти выражения в несколько видоизме- ненной форме (х0 - 2рР2) = рр2 cos 2Ф, г/0 = рР2 sin 2Ф. Возводя в квадрат и складывая, приходим к уравнению из которого следует, что каждое кольцо выходного зрачка (р = const) создает кружок в гауссовой плоскости, центр которого находится на оси х и радиус которого увеличи- вается при возрастании р и увеличении угла поля зрения вследствие роста р и h. Кроме того, вследствие удвоения угла 2ф в аргументе одному повороту луча по кольцу в выходном зрачке соот- ветствуют два поворота в плоскости изображения. В ре- зультате действия всех зон @<!р<;1) образуется кар- тина, напоминающая комету, как показано на фиг. 4.8. На этом мы закончим наше предварительное рассмот- рение геометрических свойств аберраций Зейделя. Мы ие будем анализировать хроматические аберрации, с кото- рыми также связаны некоторые интересные эффекты. Кроме того, мы преднамеренно воздержались от поисков связи между распределением интенсивности света в изоб- ражении точки и геометрической формой изображения. Читателя, который заинтересуется этим, мы отсылаем к весьма интересным работам [1—3], в которых произво- дится наглядное сравнение как геометрических форм
Xn Аберрация от одной зоны выходного зрачка Аберрация от всех зон Ф п г. 4.8.
Геометрическая теория аберраций 97 изображения точки, так и более точных результатов распре- деления света в изображении, предсказанных физической оптикой, с фотографиями распределения света в изобра- жении точки при наличии отдельных аберраций г). § 4. Оптимальная компенсация сферических аберраций третьего и пятого порядков В отношении аберраций пятого порядка мы ограничим- ся рассмотрением одной интересной задачи, имеющей практическое значение. Предположим, что мы находимся па оси (Л = 0), и фронт волны, несколько удаленный от гауссовой фокальной плоскости, описывается выражением Д(Р) = (&1Р2 + ^Р4 + ^Р6). D.9) В соответствии с выражением D.8) продольная аберра- ция 2) 6L, соответствующая последнему уравнению (fet —- = 0), есть -4^. D-10) p dp ' к ' где sin а ~ alR представляет собой синус половины апертурного угла а. При этом нужно помнить, что если сместиться из параксиального фокуса на расстояние б/, то необходимо включить в А величину &ip2, где Теперь возникают следующие вопросы: какое отношение коэффициентов третьего и пятого порядков Cildi обеспе- чивает наилучшую компенсацию и каково оптимальное положение фокуса, определяемое выбором отношения bildil Ясно, что ответы на эти вопросы в значительной *) Связь между деформацией волнового фронта в зрачке и рас- пределением освещенности в изображении точки при малых абер- рациях хорошо изложена и богато иллюстрируется конкретными примерами в книге Марешаля и Франсона [5*].— Прим. ред. 2) Поскольку в выражении D.3) сделано допущение о малости члена Д2, эта формула является не совсем точной для теории абер- рации пятого порядка.
98 Глава 4 мере зависят от того, каковы критерии «наилучшего» или «оптимального». Одним из критериев, который исполь- зуется особенно часто и, как мы увидим в дальнейшем, имеет некоторые основания также и с точки зрения физи- ческой оптики, является критерий минимума среднего квадрата [3 ] деформации волнового фронта. Следуя Марешалю, мы вычислим сначала 1 2Я Д = —77Т2" \ \ A(p)pdpdcp. D.11) о о Затем образуем выражение ?0--=(Д — ДJ--Д2-(ЛJ, D.12) где 1 2я о 6 В общем случае Ео будет функцией frb q и dt. Далее желательно определить такое положение фокальной пло- скости (б/ ~ Ь\), при котором Ео будет минимальным. Таким образом, получаем уравнение дЬу и, решая его относительно bi—-bl{cudi), подставляем полученную величину обратно в выражение D.12), из которого следует, что (-Е'о)мин = Ео (q, dt). Это выражение в свою очередь можно минимизировать, чтобы получить оптимальное отношение cjd^. В рассма- триваемом случае выражения D.11) и D.12), применен- ные к деформации волнового фронта D.9), приводят к выражению 0 " 12 ' 6 п 20 ' 45 ~ 6 "" 112 • Полагая дЕо _0
Геометрическая теория аберраций 99 находим D.14) Подставив эту величину обратно в выражение D.13), получаем D.15) ^олмн —180-г 60 ~г 700 • Теперь можно ввести ¦r\—cildi и минимизировать это выражение по отношению к г\. В результате находим ъ = ^=-^, D.16) и тогда из выражения D.14) D.17) Формулы D.16) и D.17) дают ответ на поставленные выше вопросы. При данном коэффициенте аберраций пято- го порядка dL наилучшая компенсация коэффициента аберраций третьего порядка и положение точки фокуса, соответствующие мипимальтюму среднему квадрату дефор- мации волнового фронта, должны быть выбраны таким образом, чтобы Д/п\ — /7 / п" n^ L л2 1 (h. \ $*Л ОПТ \\^I " 1 \ г- Of' ?. i I ' \ / Чтобы выяснить, что произойдет при этом вблизи плоскости изображения, мы рассмотрим два частных слу- чая. Случай 1. Имеется только сферическая аберрация третьего порядка (d± = 0). Вернемся снова к выражению D.13), по используем уже формулу D.15), положим d{ =-- 0 и вспомним, что па основании сказанного ранее об абер- рациях Зейделя jj, = 6//6Z/. Тогда получим — J*L — fei _ i Это значит, что средний квадрат отклонения волнового фронта от средней идеальной сферы минимален при сред- нем положении плоскости изображения между паракси- альным и крайним фокусами (фиг. 4.9).
/00 Глава 4 Случай 2. Имеются сферические аберрации треть- его и пятого порядков (сь di Ф 0). Из выражения D.10) получаем величину г» . о D.19) измеренную от параксиального фокуса. Имеется зона р = ро, на которой волновой фронт может быть изогнут -\ \~-А~Л в другом направлении, так что лучи сведутся обратно к параксиальному фокусу \ЬЬ (р0) =0]. При этом ия выражения D.19) следует, что уСо-
Геометрическая теория аберраций 101 В зависимости от того, какое значение имеет р0 — больше единицы, равное единице или меньше, чем единица (фиг. 4.10), говорят, что система недокорректирована, скорректирована полностью или перекорректирована. Для приведенного отношения Cj/dj выражение D.19) прини- мает вид откуда следует, что при р = 0,707р0 мы имеем так что коэффициенты волнового фронта третьего и пято- го порядков выражены через величину максимальной продольной сферической аберрации и коэффициент, харак- теризующий степень коррекции. Если наблюдать изображение в плоскости, несколько смещенной относительно параксиального фокуса в направ- лении линзы на величину —б/, то продольные аберрации будут иметь вид 6L=-6/4%(pp^), Ро и деформация волнового фронта, измеренная относи- тельно новой идеальной сферы, будет равна где мы опять вводим безразмерный параметр н- в виде _ б/ —2^1/siJt2 a ^ ~ ~~ 6LMaKC == -(Зр^О/гзШаа ' или bi 3 4 чтобы указать положение плоскости изображения. Теперь мы получаем для деформации волнового фронта, которая видна из положения — б/ при коэффициенте коррек- ции р0, выражение
A-A Плоскость Параксиаль- изображения ный фокус Допуск по Марешалю 0,7 0,8 0,9 1,0 1,1 1,2 Ро Фиг. 4.10.
Геометрическая теория аберраций 103 Сравнивая полученные результаты с оптимальным выражением D.18), мы видим, что для достижения мини- мального значения среднего квадрата деформации волно- вого фронта необходимо сначала полностью скорректи- ровать систему (ро = 1); это значит, что мы должны пере- нести крайние лучи к параксиальному фокусу, а затем переместить фокус (ц = 4/5) в точку, соответствующую 80 % расстояния от фокальной плоскости для параксиаль- ных лучей до фокальной плоскости для максимального числа зон. Полное решение вопроса представлено на фиг. 4.10. § 5. Компенсация аберраций по методу Марешаля Представим теперь процедуру компенсации аберраций в несколько более общем виде. С этой целью мы должны включить в рассмотрение девять величин пятого порядка dj, / = 1, 2, . . ., 9. Но поскольку мы находимся факти- чески в фиксированной точке поля зрения (h = const), проводя усреднение по выходному зрачку, все величины, характеризующиеся одинаковой зависимостью от коор- динат выходного зрачка, сведем в коэффициенты третьего порядка. В результате нам достаточно будет ввести только четыре новые величины, функционально отличные от обычных коэффициентов Зейделя. Позднее, при переходе к другой точке поля зрения эти коэффициенты можно сно- ва разделить. Далее, чтобы подчеркнуть роль продольных и поперечных фокальных сдвигов как вдоль главного луча, так и перпендикулярно ему, мы произведем следующие изменения в обозначениях: Теперь перейдем к изложению самого метода. Сначала необходимо рассмотреть деформацию А (р, ф), которая видна из точки Р', гауссова изображения точки Р. Сог- ласно определению, первоначальный волновой фронт соответствует идеальной сфере, находящейся в центре выходного зрачка [А @, 0) = 0]. Затем мы перемещаемся
104 Глава 4 вдоль главного луча и перпендикулярно ему на величины bz и Ьх таким образом, чтобы деформация волнового фронта (по отношению к первоначальному волновому фронту), которая видна из точки Q', могла быть представ- лена зависимостью А' (р, Ф) = Lp2 + Гр cos Ф -f А Гр, ф), в которой, как нетрудно показать [4], L= -(l-cosaNz ^-у 8z, Т = — sin аба; « — абж. Теперь, вычисляя A7=A7(L, T, с,-, dj,h), i = l, ..., 5, / = 1, .... 9 из выражения 1 2я о о мы находим А"(р, Ф) = А' —А7, что представляет собой деформацию волнового фронта относительно средней идеальной сферы (А" = 0). Теперь можно определить средний квадрат деформации Ео = (А")а = (А')а — (А7J, D.20) который, вообще говоря, является функцией L, T, h, ci и dy, мы минимизируем его, положив 3Eq „ _ 3Eq Решение данной пары уравнений приводит к сле- дующим соотношениям: L = L(c,,dj,h), I i = l, 2, ..., 5. T = T(chdj,h), j / = 1, 2, ..., 9. D'2 } Поскольку эти уравнения линейны относительно Ьх и bz, qhh определяют поверхность в пространстве изображений,
Геометрическая теория аберраций 105 на которой средний квадрат деформации волнового фронта волны будет минимальным. Подставляя L и Т из выра- жений D.21) в выражение D.20), получаем (E0)mn = E0(cudj,h). D.22) Эти результаты отнюдь не тривиальны. Марешаль пока- зал, что при малых аберрациях четкость по Стрелю для классической физической оптики и, следовательно, общий объем, ограничиваемый оптической частотной характе- ристикой, непосредственно зависят от Ео. Позже мы иссле- дуем эти вопросы более подробно. Здесь достаточно заме- тить, что целесообразней ввести определенный допуск в целом на фронт результирующей волны, а не на каждую аберрацию, выраженную отдельно. Весьма важно также подчеркнуть, что разности хода, соответствующие гео- метрической оценке оптического пути от волнового фронта в выходном зрачке до распределения интенсивности в плоскости изображения, здесь не рассматриваются. Вели- чину же А, представляющую собой оптическую разность пути от волнового фронта до идеальной сферы, можно определить довольно точно. Мы останавливаемся столь подробно на этом вопросе потому, что некоторые усредне- ния А в?0 непосредственно касаются более точных оценок распределения света с точки зрения физической оптики. В заключение данной главы применим сказанное к про- стой оптической системе, а именно к случаю одной отра- жающей поверхности. При этом мы будем сохранять члены до пятого порядка. Рассмотрим разложение волновой де- формации, в котором имеются два члена, определяющих фокусировку, пять членов аберрации третьего порядка и девять членов аберрации пятого порядка. Если теперь привести подобные члены вида pm cosn ср, то А' можно выразить следующим образом: А' (р, ф) =• L'p2 + Т'р cos ф + С,р4 + С2ра cos2 ф + + С5р3 cos ф + Dtp6 -\- ZLp5 cos ф + .. . D.23) Соотношения между новыми и старыми коэффициентами даны в табл. 4.1. Из дальнейшего будет ясно, что если положить dj = 0, / = 1, 2, . . ., 9, то все формулы бу-
106 Глава 4 дут приведены к случаю аберраций третьего порядка [1]. Чтобы избежать длинных математических выкладок, мы Таблица 4.1 и Г с, °d L + c3 Т + сь C/J$ -\- d§h& dkh deft» продполо^ким, что (А'J и (А'J вычислены и подставлены в уравнение D.20) для Ео. Положив дЕд а дЕо дЬ дТ мы получим / J -^= — о ° 2 ю D.24) Подставив эти выражения обратно в соотношение для Ео, найдем его минимальное значение 6o- 16 72 30 48 700 i +¦¦ 120 ' 48 ' 720 ' 64 40 D-25)
Геометрическая теория аберраций 107 Вопрос о том, какое ограничение нужно наложить на (Е0)тш, отложим до того момента, когда мы будем рас- сматривать дифракционную теорию. Сейчас же займемся вопросом оценки коэффициентов в выражении D.25) в случае одной сферической отражающей поверхности, чтобы показать, каким образом различные члены входят в выражение для оптической разности пути А. В более сложных системах аналогичные члены появляются при преломлении или отражении на каждой поверхности, так что задачей оптика-конструктора и является нахождение удобного приема суммирования этих составляющих абер- раций от поверхности к поверхности с тем, чтобы в даль- нейшем он мог манипулировать ими для достижения неко- торого компромисса. § 6. П}Шмер: одна отражающая поверхность Пусть В (—h, О, I) на фиг. 4.11 — светящаяся точка, а В' (-\-h', О, I) — точка в плоскости изображения. IU Фиг. 4.11. Выясним кратко условия, при которых мы можем назвать точку В' изображением точки В. Поскольку справа от зеркала всюду только воздух, разность оптического пути
108 Г л а в а 4 выражается соотношением Д = [ВР + РВ'] — [ВО f OB'] ==• = [ВР — ВО] + [РВ'-ОВ']. D.26) Рассмотрим первое выражение в скобках. Все, что мы получим для первого члена, будет справедливо и для второго члена в скобках, если заменить I на Г и h на —ti. Сначала находим во= f?+? = i |/Ч + tga e и, разлагая это выражение в биномиальный ряд, получаем W=l + -jtg*Q-±lgie±ielg'Q-\ ... . D.27) Что касается ВР, то {BPf = (и 4 hf -| у2 -4- (u> — ZJ -- = и2 ~\- v% + w1 — 2lw -f 2/гм -( Л2 -} Г2; уравнение сферы можно записать в виде или 2Д так что соотношение для ВР можно представить сле- дующим образом: Ш*=/)/Т+С=/ + уС--^ + -^+..., D.28) где =-S—г tg" о -\ г2— и 0=—, 5^ ¦ Теперь, сохраняя члены до шестого порядка по а и /г, мы вычтем D.27) из D.28), чтобы получить первый член в скобках в соотношении D.26). Повторим то же самое для второго члена и заменим I на V, h на —h' и, естест- венно, Q на Q' — (l/l') — (l/R). Наконец, складывая две
Геометрическая теория аберраций 109 величины в скобках и собирая коэффициенты с одинако- выми степенями u"lhn, мы получаем ОЧ M^tgQ tg 6\ Чтобы В' было изображением В, главные члены ряда должны равняться нулю (коэффициенты двух величин ошибки фокусировки). Это значит, что мы требуем, чтобы Полученные соотношения определяют точку гауссова изображения в виде ¦jr + T = ~R (Ф°РмУла зеркала), В'= 9. Подставляя эти величины для 9', Г и, следовательно, tg 9') Q' обратно в ряд, мы можем определить коэффи- циенты аберрации третьего и пятого порядков. Прежде
110 Глава 4 всего введем одно упрощающее условие для зеркала, а именно: объект поместим на бесконечности; при этом /'— i?/2 = /'. Кроме того, чтобы получить результат в виде соотношения D.23), положим 2 _ к2 + v* sa Р ~ а* и = ар cos Тогда получим выражение tg2 9 / 3 „ n . \ , , ^—Q-^tg^O — 1J pacosa<p За5 tB 9 , ¦ оД4 P5COS9 + 2а3 tg3 0 , „ —— p^cos^cp, из которого найдем коэффициенты С и D путем непо- средственного сравнения этого выражения с соотноше- нием D.23). Зная эти коэффициенты, из выражений D.24) и D.25) можно определить L и Т и, следовательно, 6ж и 6.3 наряду с (?'0)мин как функции угла поля зрения и F# = f/2а. Таким образом, коль скоро установлен допуск, можно определить максимальный допустимый угол поля зрения при данном F# и поверхность Fж, бг), па которой соблюдается заданный допуск. § 7. Полиномы Цернике Заканчивая настоящую главу, укажем, что можно также пользоваться рядами, отличными от классических степенных рядов. В частности, хотелось бы упомянуть о некоторых преимуществах рядов в виде полиномов Цер- нике [2], которые образуют полную ортогональную систе- му на единичной окружности. В этом случае величину
Геометрическая теория аберраций 111 А (р, ф) представляют в виде со оо Д(Р. ф) = 2 -Т7|Д«(рН 2 2 олтД"(р)со 7| л=2 п=1 т = 1 (л, четное) (п—т, четное) где [(re — m)/2]\pm И 2я 2 _ i an-m) — \ \ R™ (p) ft™' (p) cos my cos m'qp dp dy = о о I onn'®mm' ^ л { 2T ' nU При соблюдении условий ортогональности средний квад- рат деформации волнового фронта Ео приводится к выра- жению ZJ n=l m=0 (n—m, четное) которое является суммой положительных линейно неза- висимых величин. Следовательно, при записи деформации в такой форме ставится вопрос не о компенсации аберра- ций, а просто об уменьшении до нуля возможно большего числа членов атп. Например, R°6 определяется формулой которая, как показывает сравнение ее с выражением D.18), описывает волновой фронт, имеющий минимальный средний квадрат деформации. Короче говоря, каждый полином Цернике определяется таким образом, чтобы он обладал этим свойством. Дальнейшее изучение дан- ного вопроса может увести нас слишком далеко в сторону
112 Глава 4 от основпой темы. Поэтому читателя, который заинтере- суется использованием полиномов Цернике, мы отошлем к ряду отличных книг, в которых они рассматриваются 1). ЛИТЕРАТУРА 1. Linfoot E. H., Recent Advances in Optics, New York, 1958. 2. Born M., Wolf E., Principles of Optics, New York, 1959. 3. Marechal A., Francon M., Editions de la Revue d'Optique, Paris, 1960. 4. H о p k i n s H. H., Wave Theory of Aberrations, New York. 1953. 5*. Марешаль А., Ф р а и с о и М., Структура оптического изображения, изд-во «Мир», 1964. *) Практические результаты применения разложения Цернике обсуждаются в работе [5*].— Прим. ред.
ГЛАВА 5 ДИФРАКЦИОННАЯ ТЕОРИЯ ФОРМИРОВАНИЯ ИЗОБРАЖЕНИЯ § 1. Общие замечания До сих пор мы рассматривали два весьма отличных друг от друга раздела науки: теорию линейной фильтра- ции и геометрическую оптику. Теперь мы попытаемся обосновать необходимость введения этих разделов, пока- зав, как они оба в действительности тесно связаны с пред- ставлением о формировании изображения в оптических приборах в результате фильтрации пространственных частот. Ранее мы указывали, что свойства системы опре- деляются либо импульсной реакцией системы (функцией Грина), либо ее преобразованием Фурье, т. е. частотной характеристикой системы. В оптике импульс представляет собой точечный источник света в пространстве объектов, а функция Грина для прибора (называемая функцией рас- сеяния в литературе по оптике) дается распределением освещенности в изображении точки. Оптическая частот- ная характеристика является тогда двумерным преобра- зованием Фурье этого распределения и называется опти- ческой контрастной передаточной функцией. Исходя из сказанного, мы можем с незначительными модификациями применить к оптическим системам представления теории линейной фильтрации, которые хорошо установлены в об- ласти электрических цепей. Но как определить распределение освещенности в изоб- ражении точки? В соответствии с фиг. 5.1 изобразим опти- ческий прибор как систему четырех плоскостей: плоскости объекта, плоскости входного зрачка, плоскости выходного зрачка и плоскости изображения. Рассмотрим изолирован- ный точечный источник Р, излучающий сферические вол- ны, часть которых входит в оптический прибор. Опти- ческий прибор должен преобразовать сферически расхо- дящийся волновой фронт (поверхность постоянной фазы
114 Глава 5 или оптического пути) в сферически сходящийся вол- новой фронт, с центром в точке Р', которая является гауссовым изображением точки Р. На практике волновой фронт, выходящий из прибора, никогда не бывает точно Плоскость объекта Входной зрачок Ф Выходной зрачок иг. 5.1. Плоскость изображения сферическим, и отклонение его от идеальной сферы с цент- ром в точке Р' характеризуется величиной Д, рассматри- вавшейся в предыдущей главе. В настоящее время суще- ствуют весьма хорошо исправленные системы, для которых Д пренебрежимо мало. На основании только геометри- ческой оптики мы могли бы прийти к заключению, что для таких хорошо исправленных систем, в которых все лучи сходятся в точке Р', импульсная реакция есть б-по- добная функция, и, следовательно, частотная харак- теристика такова что все частоты проходят без иска- жений. Но из опыта известно, что это невозможно. Всегда, даже в самых лучших приборах, точка изображается в виде светлого пятна, которое называется дифракционным диском. В этом нет ничего удивительного. Звезда, распо- ложенная на далеком крае нашей Галактики и удаленная от нас на много световых лет, испускает информацию о своем местоположении, равномерно расходящуюся в те- лесном угле 4я стерад и наполняющую все пространство. Рагсматривая из всей сферической поверхности волново- го фронта только ту часть, которая входит в телескоп, мы не удивляемся, что имеется некоторая неопределен-
Дифракционная теория формирования изображения 115 ность, связанная с определением точного положения звезды из наблюдений прохождения света в фокальной плоскости телескопа. Короче говоря, необходима физическая оптика, осно- ванная на принципе Гюйгенса, чтобы определить ампли- туду световой волны и, следовательно, распределение освещенности в плоскости изображения, зная амплитуду и фазу волнового возмущения в пределах выходного зрач- ка оптического прибора. Значит ли это, что мы полностью исключаем геометрическую оптику? Нет, не значит. Если мы временно пренебрежем воздействием поглощения или покрытия на амплитудное распределение по выходному зрачку, то окажется, что фазовое распределение по зрачку точно определяется оптическим ходом, который набегает в результате прохождения луча от одной поверхности до другой. В принципе такое суммирование оптической разности хода при прохождении луча от одной поверх- ности до другой может быть осуществлено с любой точ- ностью вплоть до выходного зрачка. Но для того чтобы определить распределение освещенности в изображении точки, на участке от выходного зрачка до плоскости изоб- ражения необходимо пользоваться физической оптикой. Тот факт, что схемы прохождения лучей в предыдущей главе часто грубо соответствовали действительности, хотя волновые отклонения достигали нескольких длин волн, проистекает из принципа оптического соответствия, но это обстоятельство не должно отвлекать нас от более фун- даментального факта. Мы не должны упускать из виду, что процесс прохождения света на участке между выходным зрачком прибора и плоскостью изображения — это процесс распространения волны. С этой точки зрения оптическую частотную характеристику не следовало бы рассматривать как fait accompli *), т. е. как нечто такое, что можно изме- рить лишь после того, как прибор сконструирован, изго- товлен и собран. Напротив, это — характеристика, нахо- дящаяся под непосредственным контролем конструктора оптических систем, и она полностью определяется формой волнового фронта, выходящего из выходного зрачка при- бора. Свершившийся факт (франц.).— Прим. ред.
116 Глава S § 2. Основная дифракционная проблема Чтобы более четко выразить сказанное выше, рассмот- рим основную задачу дифракционной теории: по опти- ческому возмущению, заданному на всей поверхности, окружающей точку Q' (фиг. 5.2), требуется определить возмущение в точке Q'. Очевидно,что мы имеем дело с вол- новой аналогией обычной задачи электростатики. Фиг. 5.2. Под оптическим возмущением ф (х, у, z, t) мы подра- зумеваем одну из скалярных составляющих электриче- ского вектора, связанного с естественным неполяризо- ванным светом. Так как внутри рассматриваемой нами области не имеется источников, ф (г, t) удовлетворяет однородному волновому уравнению Раскладывая ф (г, t) на гармонические составляющие вида х) Ч(Т>') = -%Г \ "оЛг)е-шс1а E.2) — оо и подставляя их в уравнение E.1), мы получаем уравне- ние Гельмгольца УЧз-НЧо = 0, E.3) х) Решение в форме E.2) имеет место только в случае стацио- нарной задачи дифракции. Проводя параллель с радиоэлектрони- кой мы сразу же обнаружим, что такое решение не может учитывать «переходные процессы», связанные с учетом начальных условий.— Прим. ред.
Дифракционная теория формирования изображения 117 где , со _ 2л с л — волновое число. В дальнейшем мы будем опускать индекс у и (г). Из выражения E.2) мы всегда можем опять получить зависимость возмущения от времени по извест- ному и (г). Функция Грина для однородного волнового уравнения имеет вид V2G + k2G= -б (г-г'). E.4) Далее, в соответствии с методом, рассмотренным в гл. 1, умножим уравнение E.3) на G, уравнение E.4) на и, вычтем одно из другого и проинтегрируем по объему, окружающему Q'. В результате получим \\ (GV2u-u^G)dx = \ J \ u8(r-r')'dx = В трехмерном случае теорема Грина из векторного ана- лиза эквивалентна билинейному оператору взаимности из гл. 1, так что интеграл по объему можно свести к интег- ралу по поверхности: u(Q') = ~\ \ (Ggradu— и gradG)-n da. Теперь попытаемся применить эту формулу непосредствен- но к случаю, изображенному на фиг. 5.3, где поверхность интегрирования включает плоскость 2 выходного зрачка, простирающуюся до бесконечности B') и ограничен- ную бесконечной сферой 2 ", окружающей точку Р'. Прикидывая порядки величин, можно показать, что вклад от 2" можно сделать ничтожно малым. Далее, используя граничные условия Кирхгофа, состоящие в том, что и = 0 = ди/дп на неосвещенной части плоскости выходного зрачка 2', мы проведем интегрирование по 2 в следующем виде: u(Q) = -7^\ \ ( Ь-5 и^г~ da. E.5) 2 Теперь удобно подставить G = elkr /r как сферически симметричное решение уравнения E.4); учтем также то обстоятельство, что сама диафрагма освещается сзади
118 Глава 5 точечным источником, и поэтому и = elhri/ri; и, нако- нец, проинтегрируем с множителем e~lwt (^со/2я), чтобы найти временную зависимость. В результате зтих преоб- разований мы получаем достаточно точное выражение для Фиг. 5.3. «коэффициента непрямолинейности» и приходим к хорошо известной теореме Кирхгофа, согласно которой возмуще- ние в точке Q' в момент времени t определяется тремя факторами: возмущением на границе, его нормальной производной и производной по времени, причем все они берутся со смещением на г/с сек в прошлое. Но теперь решение переопределено, так как, зная пространственно- временное распределение по апертуре, мы можем в прин- ципе найти пространственную и временную производные этого распределения. Следуя Зоммерфельду [1], мы предпочитаем устранить избыточность, построив функцию Грина, исчезающе малую во всей области интегрирования 2. Это согласуется со сказанным в гл. 1 и 2 относительно необходимости задания граничных условий для функции Грина. Если G исчезающе мало в области 2, то выражение E.5) приводится к виду х) х) Следует заметить, что при выводе E.6) необходимо потребо- вать, чтобы функция Грина удовлетворяла «условию излучения», т. е. г ( ikG J -*- 0 при г -*¦ оо.— Прим. ред.
Дифракционная теория формирования изображения 119 Теперь задача в том, чтобы построить функцию Грина G, которая была бы исчезающе малой в области 2, но обладала бы в этой области не исчезающе малой нормаль- ной производной dG/dn. В случае плоской поверхности, 9' Фиг. 5.4. как показал Зоммерфельд, для этого достаточно построить изображение точечного источника, как обычно делается в электростатике. Мы построим функцию Грина, поместив один точечный источник в точку наблюдения Q', а другой точечный источник, излучающий не в фазе с первым, — в точку Q[, являющуюся зеркальным отражением точки Q' в плоскости выходного зрачка х) (фиг. 5.4). Тогда функция Грина будет иметь следующий вид: Лкгл 1) Поскольку нас интересуют оптические возмущения только справа от этой плоскости, с левой стороны мы можем проводить любые операции, чтобы найти нужную нам функцию Грина, которая в конце концов является просто удобным математическим инстру- ментом для решения задачи. Напомним, например, прием, заклю- чающийся в помещении точечного заряда внутрь заземленной про- водящей сферы в присутствии внешнего точечного заряда, прием, необходимый для того, чтобы создать поле, которое исчезающе мало на поверхности сферы. Этот шаг является оправданным на основа- нии того, что мы хотим определить электростатическое поле в обла- сти вне сферы, если нам известно поле внутри нее.
120 Глава 5 Очевидно, что функция G равна нулю при r~rt на всей плоскости выходного зрачка 2 и 2', и поэтому устра- няется необходимость что-либо говорить о значении ди/дп в этой плоскости. Но что касается grad G, то дС eihr f ., i\ , . eihn /., 1\ , . -т- = ik cos (r, n) ik cos (ru n), или при rt - > ?¦ и cos (rb n)—> cos (r, n) dG o elhr 2 и, конечно, G~ 0. Затем сделаем вполне оправданное для оптики видимых лучей предположение, что /С---Т— >— И COS (Г, п)«1. При этих условиях выражение E.6) приобретает вид и (Q') -- —~ \ \ и da, E-7) откуда непосредственно видно, каким образом каждый элемент поверхности и da дает свой вклад в возмущение в точке Q', которое представляет собой суперпозицию сфе- рических волн. § 3. Уравнения, описывающие образование изображен и я Теперь необходимо найти выражение, характеризую- щее изменение и по поверхности. В соответствии с обозна- чениями предыдущей главы мы припишем точке Q' коор- динаты (х, у, 0), а элементу da координаты (и, v, w). Ясно, что, если бы оптическая система в совершенстве преобразовывала входящий волновой фронт в сфериче- скую поверхность с центром в точке Р', то и имело бы вид e~ihR/R. Но, вообще говоря, поверхность постоянной фазы будет отличаться от сферы на малую величину А (и, v, w). Кроме того, необходимо учесть изменения амплитуды, обусловленные наличием покрытий и другими подобными
Дифракционная теория формирования изображения 121 факторами. Поэтому мы напишем e-ih(R+A) Пусть F (и, v) — | F {и, v) | eihA <"¦"> представляет собой комплексную амплитуду возмущения на выходном зрачке. Тогда получим где г2 =--- (ж — иJ + {у — vf + w2 = R2 + х2 + г/2 — 2 (ггж -|- у г/). При суммировании составляющих от различных элемен- тов da в пределах апертуры величина Цг не будет значи- тельно изменяться, но небольшие изменения г могут приводить к значительным изменениям комплексной экспоненты. Поэтому мы вынесем 1/г за знак интеграла и разложим г в показателе степени в ряд: ux + vy ' ¦" R ^ R ^ R ^¦¦- • Можно пренебречь членами более высокого порядка на том основании, что мы рассматриваем световое возмущение только в малой области вокруг главного луча. Тогда выражение E.7) принимает вид и(х,у) = С \ [F (и, v) e-ih/R(ux+vv) du dv, V где для обозначения всех членов, не зависящих от и и г\ введена комплексная постоянная С. Чтобы преобразовать это выражение к более удобному виду, введем сначала угловые координаты затем «приведенные» координатыг) х) Заметим, что Р и у имеют размерность пространственных частот, т. е. радиан на единицу длины.
122 Глава 5 а также Далее, определим F (и, v) =¦ F (р, у) таким образом, что y) = 0 при a2 = Тогда из выражения E.8) следует, что, если не считать постоянной А, световое возмущение в гауссовой пло- скости изображения, возникающее из-за наличия точеч- ного источника в плоскости объекта, представляет собой двумерное преобразование Фурье от возмущения в пре- делах выходного зрачка в форме F ф, у) e-Wx+yvl d§ dy При когерентном освещении это выражение представляет собой функцию Грина для оптического прибора, так как она линейно суммируется от точки к точке. С другой сто- роны, преобразование Фурье этого выражения F @, у) является частотной характеристикой или передаточной функцией для когерентного освещения. Именно поэтому и возможна пространственная фильтрация при когерент- ном освещении, но к этому мы вернемся позже. В более общем случае некогерентного освещения или самосветящихся объектов линейно суммируется функция | и (х, у) | 2, которая и представляет собой функцию Грина или «функцию рассеяния» прибора s (x, у) в виде s(x, y) = u(x, у)и*(х, у). Нормализованная передаточная функция для этого слу- чая равна + СО Ц s(x, y)el<a-rdxdy Т (ft)) =Т (С0ж, СО,,) = ^р . I I s (х, у) dx dy
Дифракционная теория формирования изображения 128 Пойдем дальше и, воспользовавшись теоремой свертки для преобразования произведения, получим соотношение т(сож, ©„) = — ^ , E.9) которое по ряду причин имеет очень важное значение. Во-первых, оно непосредственно показывает, как дефор- мация волнового фронта влияет на пространственно- частотную характеристику. Поэтому мы получаем воз- можность определять частотную характеристику непо- средственно по информации, имеющейся в пределах выход- ного зрачка, без необходимости в подробном исследовании дифракционной картины, которая иногда бывает очень сложной. Во-вторых, хотя в принципе s (х, у) и т (©) связаны преобразованием Фурье и, зная одну из этих величин, мы тем самым знаем другую, смещение частоты выражений E.9) для т (©) обеспечивает некоторое сгла- живание, так что информацию о качестве и характеристи- ках оптического прибора часто бывает удобнее извлекать из графика т (ю), а не s (х, у). Наконец, в-третьих, отме- тим, что соотношение E.9) является следствием двух отдельных и различных преобразований Фурье. Первое преобразование, связывающее и (х, у) и F (Р, у), просто выражает тот факт, что при использовании только принци- па Гюйгенса картину телескопической дифракции или дифракции Фраунгофера в видимой области спектра мож- но приближенно рассматривать как двумерное преобра- зование Фурье распределения в пределах выходного зрачка. Второе преобразование Фурье возникает вслед- ствие того, что мы подходим к процессу формирования оптического изображения как к процессу фильтрации пространственных частот. При таком подходе вполне естественно, что импульсная реакция и сопряженная ей частотная характеристика находятся с помощью преобра- зования Фурье. Резюмируя сказанное, приведем в табл. 5.1 наиболее важные из полученных нами соотношений.
Таблица 5.1 Комплексное распре- деление амплитуды на выходном зрачке Комплексное распре- деление амплитуды в изображении точ- ки (линии) Функция рассеяния интенсивности Нормированная пере- даточная функция Двумерные: точечный источник, сферическая линза, круглая диафрагма Г I^(P. Y)f«~"iA(P' Y>> P> Y<=2 F (Р> Y) - | В v (? S „ ки kv R R +00 и (x, y)=A \ \ F (P, y) e-l(Px+W> dp dy —00 s (ж, ;/) = | и (x, y)\2 \\ s(x, y)elm-rdxdy — OO -~OO -j-00 [ \ F($,y)F* (p — сож, у — coy) dpdy — OO H 1 -^ (P' Y) I2 rfP dY —00 Одномерные: линейный источник, цилиндрическая линза, щелевая диафрагма Г j^(P)|e-ifeA(P), P (=S L 0 р (/ 2 /си "D 1 to +00 и(х) = А ^ F(P)e-<fi*d? — СО s(x) = \u(x)\2 \ s (х) е х dx -(-оо — ОО J F (P)F* (P —C0x)dp 1 l-P(P)l2dP — ОО
Дифракционная теория формирования изображения 125 § 4. Дифракция на щели Дадим несколько примеров применения вышеприведен- ных формул в различных идеальных случаях. Сначала рассмотрим идеальный одномерный случай, в котором отсутствуют изменения амплитуды (| F (|3) I = 1) *) на щели шириной d — 2а и нет аберраций (А = 0). При этих условиях мы получаем Эо u(x)^2A \ cosfizdfi, где fio = ka/R. Нормализованная функция рассеяния имеет вид Чтобы определить передаточную функцию, мы можем либо воспользоваться преобразованием Фурье от выра- жения E.10), либо выполнить свертку, изображенную на фиг. 5.5. Выбирая последнее, получаем / n *?,«.[ (i—W-) приК|<2р0, о)х-Ро { 0 при |сож|>2ро. Мы можем записать через синусоидальную разрешающую способность, обусловленную только дифракцией, 2п по г,, ¦ п * т 2 Sin 6 ах = у- = 2р0 =¦ 2k sm 6 или — -~ Мх--- = —^— в линиях на 1 мм, где sin 0 = alR —синус половины апер- турного угла. Для объекта, находящегося на бесконеч- ности, R = / (/ — фокусное расстояние) и Мх = 1 AF# х) На самом деле, такое предположение, хотя и имеет широкое распространение, никогда физически точно не реализуется, так как в результате взаимодействия света с веществом экрана F ф) отлично от нуля за пределами отверстия. Если не учитывать это обстоятель- ство, решение основного интегрального уравнения оказывается неоднозначным. Дискуссию по этому вопросу см. в [5*—7*].— Прим. ред.
126 Глава 5 где F# = f/d. Например, при образовании изображения в зеленом свете с Л = 0,5 мк синусоидальная разрешающая «Ъ+Ро Фиг. 5.5. способность, обусловленная дифракцией, составляет ffix = 2000/F#, так что для системы с F1Ъ величина Мх = 400 линий/мм. В{х) _sh 0 +C0 V7 ¦~_^ х Фиг. 5.6. Некоторые характеристики для рассмотренного нами идеального одномерного случая приведены на фиг. 5.6. § 5. Звездный интерферометр Майкельсона Далее, чтобы подчеркнуть наиболее важные особен- ности полученных ранее формул, мы рассмотрим одномер- ный эквивалент звездного интерферометра Майкельсона
Дифракционная теория формирования изображения 127 (фиг. 5.7). Сначала найдем распределение интенсивности света в изображении тонкого линейного источника, нахо- дящегося на большом расстоянии, при условии, что Их) Фиг. 5.7. в плоскости диафрагмы расположены две тонкие щели. Представим эти щели с помощью функции F (|3) = б (|3 ± ± |30), так что оо и (х) — 2А cos Распределение интенсивности определяется выражениями Передаточная функция представляет собой преобразова- ние Фурье от распределения интенсивности и состоит из постоянной составляющей и переменных составляю- щих с частотами о г> I fed wo= ±2ро= ± —• Величины, описывающие пространственный спектр объекта и изображения (фиг. 5.8), связаны зависимостью /(со) = т(соN>(со). Мы видим, что, изменяя расстояние d между щелями, можно провести гармонический анализ распределения интенсивности света на объекте.
о 3 О 3° 00 и е
Дифракционная теория формирования изображения 12У Это можно показать и другим путем, а именно опре- деляя структуру изображения в виде1) Цх)= J где s (х -1) = 2Л2 [1 4- cos соо (х -1)] = -— 2А2 [1 + cos юо| cos wox + sin co0| sin со0ж]. Тогда мы получаем i (х) —Во-\- Вс (щ) cos щх + /?s (co0) si n ш(|.т, где О (?) COS CD0| d\ sin Предположим для простоты, что объект имеет сим- метричную2) структуру, так что Б8(щ) = 0. Тогда мы получим i (х) = Во 4- Вс (щ) cos WqX. Интересно, что изображение всегда оказывается рядом полос с косинусоидальпым распределением интенсивности. Даже в случае одиночного точечного источника изобра- !) См. более подробный вывод в работе [4*].— Прим. ред. 2) В противном случае мы должны зарегистрировать не только амплитуду, но и фазу (положение полос), чтобы восстановить рас- пределение интенсивности в объекте.
ISO Глава 5 жение совершенно непохоже на объект. Мы намеренно как бы закодировали изображение и временно отбросили информацию относительно структуры объекта. После этого мы отыскиваем именно эту информацию, изменяя рас- стояние между щелями. Следуя Майкельсону, мы определим «видимость» полос, как г/ т/ Л1 \ ' у V \wq) — . 'макс 'мин . макс г'мин Вс (С0р) -"о о (|) cos Ш0| d% так что изменение контраста полос при увеличении рас- стояния между щелями дает нам фактически график про- странственного спектра объекта, из которого с помощью V(d) Фиг. 5.9. преобразования Фурье можно определить распределение интенсивности света в объекте. Рассмотрим объект равно- мерной яркости, геометрическое изображение которого имеет угловой размер 2ф0 = h/f в плоскости изображения. Тогда (фиг. 5.9) sin и0й/2 где
Дифракционная теория формирования изображения 131 откуда видно, что расстояние между щелями, при котором контраст полос впервые проходит через обращение фазы, определяется выражением d = л/А:ф0. Следовательно, заме- тив расстояние между щелями *), при котором это про- исходит, мы можем определить угловой размер объекта по формуле § 6. Дифракция на круглом отверстии Наконец, рассмотрим особенно интересный случай, когда изображение создается идеальной линзой радиуса а. Вследствие круговой симметрии линзы мы имеем оо и (г) = 2яА \ F (а) /0 (аг) а da. о В идеальном случае F (а) = 1 при 0<;сс<;а0 и F (а) — 0 в любой другой точке, так что нормированное распределение освещенности в пятне определяется выра- жением «W _ Го Jii<kr)V „ __ ka т. е. мы имеем дело с хорошо известным дифракционным диском Эри. Передаточная функция также обладает круговой сим- метрией, и поэтому для удобства мы вычислим интеграл свертки для перемещения в направлении |3 (фиг. 5.10): I' J a da dy в>/2 0 о х) Необходимо добавить, что для увеличения разности фаз [2] при двух щелях Майкельсон установил два зеркала на длинной балке и направлял свет к щелям, используя два внутренних зер- кала. Для звезды Бетельгейзе (угловой диаметр 0,047") внешние зеркала находились на угловом расстоянии 121".
132 Глава 5 ИЛИ при 2а„ В графической форме результаты представлены на фиг. 5.11. Ф и г. 5.10. Итак, нам удалось показать, каким образом амплитуда и фаза на выходном зрачке влияют на передаточную функ- цию оптической системы, и в нескольких идеальных слу- чаях мы проиллюстрировали эту взаимосвязь на примерах. В следующей главе мы исследуем более интересные и прак- тически более важные проблемы определения влияния произвольных амплитудных и фазовых (аберрационных) изменений на передаточную функцию (проблема анализа) и рассмотрим дальнейшие возможности выбора апертур- пого распределения с целью достижения некоторого тре- буемого результата (проблема синтеза). Укажем, что, как следует из формулы E.9), любая оптическая система
и в
134 I' л а в а 6 при некогерентном освещении представляет собой, по су- ществу, низкочастотный фильтр пространственных частот, разрешающая способность которого определяется только длиной волны и числовой апертурой. ЛИТЕРАТУРА 1. Sommerfeld A., Lectures in Theoretical Physics, vol. 4, Optics, New York, 1954 (имеется перевод: А. 3 о м м е р- ф е л ь д, Оптика, ИЛ, 1953). 2. Williams W. E., Applications of Interferometry, London, 1954. 3. Marechal A., F r a n 5 0 n M., Editions de la Revue d'Op- tique. Paris, 1960. 4*. Марешаль А., Ф р а н с о н М., Структура оптического изображения, изд-во «Мир», 1964. 5*. Т oral do di Francia G., Journ. Opt. Soc. Am., 45, № 7, 497 A955); 46, № 1, 72 A956). 6*. Linfoot E. H., Journ. Opt. Soc. Am., 46, № 1, 72 A956). 7*. Раутиан С. Г., ДАН, 109, № 4, 743 A956).
ГЛАВА О АНАЛИЗ И СИНТЕЗ ОПТИЧЕСКИХ СИСТЕМ § 1. Общие соотношения Мы видели в предыдущей главе, что амплитудой и фа- зой на выходном зрачке оптического прибора определяют- ся такие его характеристики, как импульсная чувстви- тельность, или функция рассеяния, а также ее преобра- зование Фурье, т. е. передаточная функция. Далее, мы еще раз подчеркиваем, что хотя уже становится обычкой практикой в оптическом производстве измерение переда- точных функций готовых оптических систем, вполне воз- можно рассчитывать эту функцию и на различных стадиях конструирования, причем ее значения тесно связаны с те- ми параметрами, с которыми обычно имеет дело конструк- тор оптических систем. Для управления ходом констру- ирования оптических приборов даже желательно иссле- довать время от времени вид передаточных функций при различных фокусных расстояниях, углах поля зрения и длинах волн. Пользуясь формулами табл. 5.1, мы продолжим в настоящей главе исследование влияния амплитудных и фазовых изменений в пределах апертуры на передаточ- ную функцию как для одномерного, так и для двумерно- го случаев. Но предварительно необходимо сделать неко- торые общие замечания. Рассмотрим сначала неравенство Шварца [1 ] /* (х) g (x) dx |2 < 5 /* (х) f (x) dx J g* (х) g (х) dx. Применяя его непосредственно к интегралу свертки для передаточной функции системы, в которой имеются толь- ко фазовые изменения (аберрации), при | F \ % = 1 мы
136 Глава 6 получим -}-оо — оо или где индекс 0 относится к идеальному случаю единично л амплитуды и нулевой фазы на выходном зрачке. Иначе говоря, если исключить амплитудные изменения, то наличие аберраций всегда приводит к потере в контрасте на всех пространственных частотах. С другой стороны, если имеются только амплитудные изменения F = F*, вызванные наличием покрытия на линзах, то, поскольку нормировка сводится к т @) = 1, имеются некоторые области в частотном пространстве, в которых т (ю) может превосходить т0(ю), где Т((й) = _ . 11 F2 (р, Y) dp dy Нри фотографировании для реализации такого повы- шения контраста приходится увеличивать время экспо- зиции. Как мы увидим дальше па примерах и как подска- зывает интуиция, при нанесении покрытия на централь- ную часть апертуры контраст для мелких деталей увели- чивается, а покрытия, которые уменьшают амплитуду по направлению к краю апертуры, повышают контраст для крупных деталей. § 2. Малые аберрации Рассмотрим опять случай, когда имеются только фазо- вые изменения. В классической оптике значительный интерес представляет четкость по Стрелю 3 [2], которая определяется как отношение интенсивности в максимуме дифракционного пятна, создаваемого данным прибором, к интенсивности в максимуме дифракционного пятна при
Анализ и синтез оптических систем 131 отсутствии у данного прибора аберраций: где а == \ \ dp dy — площадь отверстия диафрагмы в при- веденных координатах. Как показал Марешаль [3], мож- но получить интересное неравенство, если вместо А ф, у) использовать функцию Д"(Р, y), аберрационную функ- цию относительно средней идеальной сферы (см. гл. 4). Тогда можно написать 3- [ \ Для малых аберраций получаем где (см. гл. 4) представляет собой величину, предварительно определен- ную исключительно из геометрических соображений. Основное значение упомянутой работы Марешаля заклю- чается в том, что величина, определяемая всецело путем геометрического усреднения (^о)) оказывается связанной с классическим коэффициентом допуска C), определяе- мым на основании физической оптики. Соотношение между ними следующее: Классический допуск 3 > 0,80 г) соответствует здесь марешалевской величине E0?Ck2/184, или, если перейти *) В теории антенн [3] это соответствует снижению усиления из-за аберраций примерно на 1 дб, поскольку G = 10 lg (J/.Z).
ш Глава 6 к среднеквадратической ошибке волнового фронта, Полагая в этом выражении Ео равным (^о)мин из фор- мулы D.22), можно установить области фокусных расстоя- ний и углов поля зрения, в пределах которых соблюдается Допуск по Марешалк, 0,7 0,8 0,9 1,0 1,1 1,2 1,3 Рп Фиг. 6.1. марешалевский допуск. Более подробные сведения об эффектах, связанных с наложением этого допуска на фоку- сировку и аберрации, можно найти в диссертации Маре- шаля [4] или в отличной книге Марешаля и Франсона [5] J). В качестве иллюстрации укажем здесь, что, прини- мая оптимальным отношение сферической аберрации третьего порядка к сферической аберрации пятого поряд- См. также книгу [22*].— Прим. ред.
Анализ и синтез оптических систем 13У ка Ci/di — —3/г и оптимальное положение фокальной плоскости (л = — бу/6?маКс = 0,80, можно точно обес- печить марешалевский допуск при d^ да 4Я,. Конечно, при di, меньшем четырех длин волн, имеются области кор- рекции и положений фокальной плоскости, в которых можно оказаться ниже допуска. Все возможные варианты представлены на фиг. 6.1. В заключение заметим, что поскольку s (x, у) и т (ю) представляют собой взаимные преобразования Фурье, четкость по Стрелю можно также определить как норма- лизованный объем в частотном пространстве, ограни- ченный поверхностью передаточной функции: F.1) X0 (и) d(ox d(oy Как указал Линфут [6], непосредственное обобщение статистических описаний, рассмотренных в гл. 2, на дву- мерные случаи показывает, что для картин со случайным распределением яркости, характеризующимся спектром мощности, плоским до самой границы среза фильтра, правая часть выражения F.1) является мерой корреляции максимумов и минимумов распределения яркости в изоб- ражении с соответствующими максимумами и минимумами распределения яркости в объекте. § 3. Изменение амплитуды и фазы в одномерном случае В данном параграфе мы покажем, как влияет форма F ф) на величину^ т (сож). Рассмотрим колоколообразное распределение F (|3) по апертуре, изображенное на фиг. 6.2, а. Подставляя соответствующее выражение для ^ ф) в * Ю = ^^ F-2)
Анализ и синтез оптических систем 14J и выполняя элементарное интегрирование, получаем кри- вые, показанные на фиг. 6.2, б. По кривым видно, что контраст увеличивается в области низких частот и умень- шается в области высоких частот. Обратная картина наб- людается, если распределение прозрачности апертуры имеет вид, представленный на фиг. 6.3, а. Фиг. 6.3, б показывает, каким образом можно увеличить контраст для мелких деталей, если затемнить центральную часть апертуры. Подчеркнем, что кривые представлены в норми- рованном виде, и поэтому по ним нельзя оценить потерь в полной освещенности, обусловленных наличием покры- тия. Возвращаясь теперь к фазовым изменениям, легко заметить, что при F (Р) = e~ikAW фазовая ошибка вида Л (р) = ап$п приводит к следующему подынтегральному выражению в формуле F.2): F($)F*($-(i>x) = e+ikw^<i>x), F.3) где w — Л (р) — Л (р — (ох) представляет собой мно- гочлен степени п — 1 для р. Проанализируем последова- тельность кривых, изображенных на фиг. 6.4, а — е1), которые показывают влияние фазовой ошибки на переда- точную функцию при п = О, 1, 2, 3, 4. 1. п = 0. Как и следовало ожидать, появление по- стоянной величины в функции, описывающей фазовую ошибку, просто соответствует выбору различных идеаль- ных сфер и, следовательно, не влияет на результаты, полученные как с использованием представлений геомет- рической, так и с использованием представлений физи- ческой оптики. 2. п = 1. После вычитания зависимость правой части выражения F.3) от р исчезает и остается только член, линейный относительно сох. Из теории связи хорошо известно, что линейное изменение фазы приводит только к смещению всей импульсной реакции в целом. Таким образом, в оптике при введении стеклянного клина просто г) Следует иметь в виду, что на фиг. 6.4 и 6.5 высота поля (К) входит в коэффициенты аберрации.
«3 + со со и U в
Анализ и синтез оптических систем МП смещается все изображение. В то же время такая абер- рация, как дисторсия, линейна относительно р. Нежела- тельна же эта аберрация потому, что она пропорциональна кубу угла поля зрения. 3. п = 2. Этот член характеризует ошибку фокуси- ровки. Вследствие его относительной простоты проведем подробное интегрирование, чтобы показать, как произво- дятся расчеты кривых такого вида. Предположим, что имеется идеальная цилиндрическая линза с А = 0 и необ- ходимо определить, что произойдет с передаточной функ- цией, если расфокусировать систему и ввести фазовую ошибку А (Р) = &i(p/PoJ- Подставляя эту величину в фор- мулу F.2), получаем Ро тЫ=4" \ e-lftb^Bp<Dx-<D*)dp. их—ро Теперь приведем систему координат к центру перекры- вающейся области сг = р — (сож/2). Поскольку действитель- ная часть подынтегрального выражения — четная функ- ция, мы имеем Ро-(Их/2) Производя интегрирование, получаем т (сож) = )] при 0 при [мж|>2р0, где sina; sine х = - х k Ba) _ k 2a — ширина отверстия. Интересно отметить (см. фиг. 6.4, в), как быстро падает контраст после того, как достигнут релеевский допуск Ъ^ = Я/4. Далее, при bi >2Я пере- даточная функция изменяется как sine (cod), т. е. именно
т(ш) Ф п г. (i.4.
\r(to)] Г— / I \ k/F' -I ' = 0,15 зх Фиг. 6.4 (продолжение).
146 Глава в так, как и следует ожидать, если пренебречь дифракцией и предположить на основании чисто геометрических соображений, что световой поток распределен равно- мерно в пятне шириной 2d на плоскости, расположенной вне фокуса. 4. п — 3. Поскольку волновой фронт кубичен отно- сительно р, при оценках т (сох) приходится иметь дело с интегралом Френеля. Передаточную функцию удобно представить в виде х (сох) --= хс К) -1 iTe К) ----1 т (соа.) | еш"*\ где Ро т« (со,) -^ \ sin А [А (Р)- А (Р - со,)] dp. Ш..;-Ро Типичная кривая представлена па фиг. 6.4, г. Заметим, что не следует пренебрегать эффектом нелинейного фазо- вого отклонения. На фиг. 6.4, д представлено распреде- ление освещенности в изображении для двух систем, которые характеризуются одинаковым ослаблением амп- литуд, но в первой из которых — линейное фазовое отклонение, а во второй — фазовое отклонение, показан- ное на фиг. 6.4, г. В первом случае наблюдатель, вероятно, догадается, что объект представляет собой квадратно- волновой тест, но во втором случае он может быть введен в заблуждение из-за того, что гармоники суммировались не в фазе. Таков тип фазовой ошибки, связанной с комой. 5. п = 4. В заключение рассмотрим кривые, иллюст- рирующие эффект четвертой степени фазовых ошибок (сферической аберрации) в одномерном случае. Для общ- ности включим в А также член, характеризующий фоку- сировку. Как видно из фиг. 6.4, е, для полупериода сфе-
Анализ и синтез оптических систем 14t рической аберрации третьего порядка наилучший фокус для всех частот лежит посредине между фокусом для край- них лучей и параксиальным фокусом. При больших абер- рациях кривые пересекаются, и понятие «наилучшего фокуса» зависит, помимо прочего, от структуры объекта и от того, для каких целей будет использован оптический прибор. § 4. Амплитудные и фазовые изменения в двумерном случае Если не считать больших вычислительных трудностей, двумерный случай несущественно отличается от случая одномерных изменений. Влияние различных зейделев- ских аберраций на передаточную функцию иллюстрирует- ся кривыми фиг. 6.5 J). Если читателя интересуют под- робности вычислений, то ему следует обратиться к перво- источникам. Особенно интересно то обстоятельство, что кома вводит нелинейный фазовый сдвиг и что в случае астигматизма при так называемом «кружке наименьшего рассеяния» передаточная функция различна для линейных структур с разной ориентацией. Из фиг. 6.6 видно, как изменяется передаточная функция при такой степени коррекции (р0) и установке фокуса (ц), когда имеются сфе- рические аберрации как третьего, так и пятого порядка. Ясно, что при малых аберрациях (dt ¦< 4Я) марешалевский допуск дает однозначный ответ. При больших аберрациях, как мы увидим ниже, оптимальное положение фокальной плоскости зависит от того, какой критерий выбран для ее определения. В отношении более общих случаев сочетания аберраций мы сошлемся на оригинальную литературу. Для малых аберраций Марешаль [4, 5 ] и Стил [9 ] опубликовали ценные таблицы, в которых приведены данные для проз- рачных и затемненных апертур. Относительно больших аберраций, особенно при условиях, при которых допусти- мы приблизительные геометрические оценки, можно ука- зать работы Миамото [101 и Гопкипса [111. В частности, Гопкипс расширил понятие аберрационных допусков !) График б взят из работы [7], графики в и г — из работы [81, график д — из работы [19].
|T(CO)| т(а»х)
TO). 1,0 sr\ V _ 4Я\ 1 1 A = c2(cos!(p--ij V '/=2- \C2=0 4 ^ ¦u)x T@J) 1,0 ф и г. 6.5 (продолжение).
т(со) Фиг. 6.6.
А пализ и синтез оптических систем 151 и дал схему расчета передаточной функции при наличии всех видов аберраций. Амплитудные изменения на выход- ном зрачке широко освещены в обширной французской литературе [12], посвященной методам «аподизации», т.е. затемнения апертуры, позволяющего обеспечить неко- торую заданную форму дифракционного пятна. Работы, проводимые в этом направлении Люнебергом [13] и в пос- леднее время Баракатом [14], были посвящены проблеме расчета покрытия на основе вариационного исчисления. В методе Люнеберга — Бараката стараются при заданном световом потоке через апертуру по возможности полностью сохранить амплитуду центрального максимума дифрак- ционного пятна, накладывая в то же время некоторые дополнительные условия на получаемое изображение. Например, можно потребовать, чтобы первый минимум в пятне был сдвинут внутрь к некоторому заданному ради- усу, меньшему радиуса диска Эри. Или, еще лучше, мож- но попытаться найти такое распределение прозрачности апертуры, чтобы сконцентрировать максимальное коли- чество света на площади кружка с заданным радиусом. Эта и подобные ей задачи решены и имеют интересные интерпретации с точки зрения теории связи. Весьма интересны те изменения амплитуды, которые происходят
152 Г л а в а 6 при затемнении центральной части апертуры [9, 15]. Проб- лема определения передаточной функции для этого слу- чая может быть сведена к элементарной геометрической задаче расчета общей площади двух колец, одно из кото- рых скользит по другому. Результат представлен на фиг. 6.7. Снова мы видим увеличение контраста в области высоких частот. Кривые находятся в соответствии с заме- чаниями Стьюарда [16] относительно сужения централь- ного максимума и увеличения разрешения двух точек при затемнении центральной части апертуры. Между про- чим, весьма поучительно указать, что для достижения т], немного меньшего единицы, кривая приводится к мак- симуму при сох = 0, ±2р0. Но это как раз то, чего мы должны были ожидать, так как тонкое круглое кольцо является двумерным эквивалентом (с круговой симметрией) двойной щели в звездном интерферометре Майкельсона. § 5. Случайные фазовые ошибки Предположим теперь, что отклонение волнового фронта, испускаемого оптическим прибором, от средней идеальной сферы состоит из двух частей: первая — «контролируемая» часть Ас (Р, у)—обусловлена аберрациями, а вторая — «случайная» часть Дл (Р, у) — обусловлена различны- ми ошибками изготовления или атмосферными эффек- тами. Далее, если Дл зависит от времени, так что дифрак- ционное пятно все время «скачет», то мы должны мыслен- но взять целый ансамбль одинаковых систем, которые могут обладать различными графическими характеристи- ками Ал (Р~, -у), но которые эквивалентны в статистиче- ском смысле. Наконец, предположим, что мы можем соз- дать наш ансамбль таким образом, что среднее по времени будет эквивалентно среднему по ансамблю. Тогда можно определить _ где нормировка учтена коэффициентом К. а А = Дн + Ас. Усреднение сказывается только на Дл, и результат, буду- чи независимым от р и у, может быть вынесен за знак инте-
Анализ и синтез оптических систем 153 грала. Остающийся интеграл будет представлять собой передаточную функцию rL (ш), обусловленную только линзой. Поэтому, написав , F.4) мы должны теперь определить тл (©) = exp {ik [Ад (р, у) — Ал (Р — в>х,у — ©„)]}. F.5) Прежде чем идти дальше, мы должны сделать некоторые предположения относительно статистических свойств вели- чины Ад (р\ у). Примем, что Ад (р, у) имеет нормальное распределение, нулевое среднее значение, дисперсию сг2, а его автокорреляционная функция имеет вид ср (сож, coy) -= Ад (Р, у) Ад (Р - сож, у — coy). Разложив правую часть соотношения F.5) в ряд и усред- нив член за членом, получим n=0 При нормальном распределении моменты высших поряд- ков определяются через первые два момента в соответ- ствии с хорошо известными выражениями [20] vi - ~~ все пары Отсюда методом математической индукции получаем [Дл(Р, У)- Ая (P-«>*,Y -«»)]" = { )l [a3 —cp((o)]n/2, если п —четное, [_ 0, если ге —нечетное. Подставляя это выражение в формулу F.6) и заменяя индекс суммирования п на / = ге/2, получаем формулу j=0
154 Глава 6 которая представляет собой разложение в ряд функции Таким образом, скорость уменьшения контраста опреде- ляется средним квадратом флуктуации и величиной их корреляции по апертуре, причем обе величины выражают- ся в единицах длины волны. Кроме того, из формулы F.4) следует, что эти случайные флуктуации могут рассматри- ваться как линейное звено в цепи и всегда приводят к поте- ре контраста и разрешающей способности. Последняя определяется длиной волны и числовой апертурой через Ч И- § О. Проблема синтеза, когерентное освещение До сих пор мы рассматривали оптические системы, в ко- торых используется некогерентное освещение. В таких системах усредненный по времени квадрат электрического вектора складывается линейно от точки к точке в пло- скости изображения, т. е. отсутствует интерференция. Поэтому подобные системы всегда ведут себя как низко- частотные фильтры пространственных частот. Чтобы опти- ческие фильтры были столь же разнообразными, как и электрические, необходимо обеспечить возможность интерференции. При этом нужно учитывать, что интерфе- ренция не всегда лишь искажает изображение, но может быть использована и для улучшения его качества. Короче говоря, нужно иметь возможность воздействовать на амп- литудное и фазовое распределение точечного изображения. Как показали Марешаль и Крое [17] и О'Нейл [18], это возможно при использовании когерентного освещения в плоскости объекта. В схеме фиг. 6.8 преобразование Фурье для структуры прозрачного объекта производится тогда, когда свет проходит от плоскости объекта к пло- скости фильтра. В соответствии с принципом Аббе фурье- составляющие структуры объекта в результате действия второй линзовой системы рекомбинируют, образуя изоб- ражение. Необходимо иметь в виду, что в этой схеме опти- ческая система, расположенная слева от объекта, исполь- зуется просто для когерентного освещения плоскости объ- екта. Можно считать, что изображение в такой системе
It 00 CD IS e О «P OV3 ^ о с:
156 Глава 6 возникает в результате двух последовательных преобра- зований Фурье. Но оно всегда оказывается несовершен- ным, так как очень мелкие детали в структуре объекта дают спектр Фурье, который не попадает в апертуру лин- зы. Важно отметить, что, поскольку спектр Фурье объ- екта «развертывается» в плоскости фильтра, можно изме- нять спектр, из которого составляется изображение, встав- ляя соответствующие маски г). Наиболее известной иллю- страцией этого эффекта является, по-видимому, метод фазового контраста, при котором вводится сдвиг фазы между прямым и дифрагированным светом, и тем самым при наблюдении под микроскопом выявляются небольшие фазовые изменения в образцах, которые никак иначе нельзя увидеть. Нетрудно продемонстрировать особенности такой систе- мы как фильтра в теории связи. На фиг. 6.9 показан эффект, возникающий при введении небольшого поглощающего диска в плоскости фильтра. При этом излучение фона (постоянная составляющая) ослабляется по отношению к дифрагированному свету (переменная составляющая) и в результате контраст в изображении эталонной миры увеличивается. На фиг. 6.10 показаны малоконтрастпый тест с периодически изменяющейся прозрачностью и тест с оптическими «шумами», которые оба были помещены в плоскости объекта. Затем был специально изготовлен «гребенчатый фильтр Дирака», представляющий собой непрозрачную маску с иголочными проколами в точках, соответствующих расположению составляющих спектра Фурье малоконтрастной решетки. На полученном в резуль- тате изображении виден эффект блокирования двумерно- го спектра «шумов» (могут быть приведены также другие примеры). Существуют методы создания выравнивающих фильтров, сглаживающих фильтров, фильтров для ослаб- ления зернистости, фильтров, подчеркивающих края изоб- ражения, и т. д. Разработан и ряд оптических приборов [19], основанных на этом принципе. х) Напомним, что ограничение области пространственных частот происходит в результате ограничения угловой апертуры оптиче- ской системы, так как частоты C и у связаны с угловыми размерами выходного зрачка ц и v (см. гл. 5, § 3) соотношениями f5 = fcjx и у = kv.— Прим. ред.
Объект Изображение Ф и г. 6.9. Сигнал Шум "ч} Объект Изображение Ф и г. 6.10.
Ш Р лав а в Во многих случаях те или иные операции легче осу- ществлять с помощью оптических фильтров, а не их элект- рических аналогов. Марешаль [5] и его сотрудники пока- зали, каковы возможности восстановления деталей на фотографиях низкого качества при точном управлении амплитудой и фазой фильтрующей маски. В принципе вся методика, разработанная в теории электрических цепей, может быть перенесена в оптику. Упрощение же в оптике следует из того, что спектр естественным образом разделяется в результате самого процесса дифракции. Л И Т J? Р Л Т У Г А 1. Margenau H., Murphy G. M., The Mathematics of Physics and Chemistry, New York, 1956. 2. Born M., Wolf E., Principles of Optics, New York, 1959. 3. Brown J., Microwave Lenses, London, 1953. 4. Marechal A., Editions de la Revue d'Optique, Paris, 1948. 5. Marechal A., Fran? on M., Editions de la Revue d'Optique, Paris, 1960. 6. Linfoot E. II., Journ. Opt. Soc. Am., 46, 740 A956). 7. H о p k i n s H. II., Proc. Roy. Soc, A321, 91 A955). 8. D e M., Proc. Roy. Soc. A233, 91 A955). 9. S t e e 1 W. H., Editions de la Revue d'Optique, Paris, 1953. 10. Miyamoto К., в книге Progress in Optics, vol. 1, ed. E. Wolf, Amsterdam, 1961. И. Н о p k i n s H. H., Proc. Phys. Soc, B70, 1002 A957). 12. Dossier В., Editions de la Revue d'Optique, Paris, 1954. 13. Luneberg R. K., Mathematical Theory of Optics (Lecture notes), Brown University, 1944. 14. В a r a k a t R., Journ. Opt. Soc. Am., 52, 264 A962). 15. О ' N e i 1 1 E. L., Journ. Opt. Soc. Am., 46, 285 A956). 16. Steward G. C, The Symmetrical Optical System, Cambrid- ge A928). 17. Marechal A., Croce P., Compt. Rend., 237, 706 A953). 18. О ' N e i 1 1 E. L., IRE Trans.—PGIT, 2, 56 A956). 19. Mar a tli а у A. S., Proc. Phys. Soc, 74, 721 A959). 20. Wang M. C, Uhlenbeck G. E., Rev. Mod. Phys., 17, 332 A945). 21. Cutrona L. J., Leith E. H., Palermo С J., Pore ell о L. J., IRE Trans.—PGIT, 6, 386 A960). 22*. Марешаль А., Франсов М., Структура оптического изображения, изд-во «Мир», 1964.
ГЛАВА СТАТИСТИЧЕСКИЕ МЕТОДЫ § 1. Случайные объекты До сих пор мы старались подчеркнуть, что при рас- смотрении приборов, формирующих изображения, как фильтров пространственных частот теория в принципе оказывается более простой. При таком подходе изобра- жение объектов с периодической структурой или объектов, состоящих из простых геометрических фигур на темном фоне, теоретически получается очень просто, на основе разложения в ряд Фурье. В некоторых же случаях, как мы видели в предыдущей главе, можно говорить даже о синтезе изображения. Но часто вопрос о формировании изображения оказывается в лучшем случае статистиче- ской проблемой. Дело в том, что оптические приборы обычно конструируются для наблюдения не одного объ- екта, а целого класса объектов. Каждый, кому когда- либо приходилось фокусировать оптический прибор, знает, что положение плоскости наилучшей фокусировки для крупных деталей не совпадает с плоскостью наилучшей фокусировки для мелких деталей. Плавно меняя фокуси- ровку, наблюдатель «настраивает» прибор таким образом, чтобы наблюдать те детали изображения, которые его интересуют. Возникает вопрос: если заданы контрастно- частотные передаточные функции для нескольких поло- жений плоскости наилучшей фокусировки и для различ- ных углов падения лучей, то как выбрать оптимальную контрастно-частотную передаточную функцию? Очевидно, что ответ па этот вопрос зависит от того, что нам заранее известно об объекте и о предполагаемых условиях работы прибора. Как мы увидим, требования обеспечения макси- мальной четкости изображения весьма отличны от требова- ний обеспечения максимального согласования флуктуации яркости в плоскости объекта и в плоскости изображения
160 Глава 7 Мы уже использовали один показатель качества, поза- имствованный нами из классической оптики,— это чет- кость по Стрелю 3). Напомним вкратце, как эта величина появляется при анализе процесса формирования изображе- ния. Согласно Релею, изображение не ухудшается замет- ным образом, если максимальная волновая деформация относительно идеальной сферы не превышает А,/4. Маре- шаль же, исследуя полный волновой фронт, испускаемый выходным зрачком, установил соотношение между сред- ним квадратом деформации волнового фронта и интенсив- ностью в центре дифракционного пятна. Требование, что- бы отношение этой интенсивности к интенсивности, созда- ваемой в центре дифракционного пятна тем же оптическим прибором, но не имеющим аберрации, не превышало 0,8, эквивалентно в обозначениях Марешаля допуску на сред- неквадратичную волновую деформацию, равному Я/13,5. Как уже говорилось, это нормализованное соотношение известно под названием «четкость по Стрелю» и в наших обозначениях может быть записано следующим образом: s0 @, 0) +°° J l т0 (и) da — oo Позже Линфут [1 ] предложил использовать для оценки оптических систем показатели качества, которые пред- ставляют собой двумерное обобщение статистических характеристик, приведенных для линейных временных фильтров в гл. 2. Именно, он ввел следующие характе- ристики качества изображения: а) Относительное структурное содержание Т_ *(х, У) о2 (х, у) Этой величиной оценивается в основном резкость по сред- неквадратичным значениям г). Данный критерий ничего х) Черта указывает на усреднение по большой площади изобра- жения или объекта.
Статистические методы 161 не говорит о согласовании максимумов и минимумов ярко- сти в плоскостях объекта и изображения, т. е. не требуется, чтобы изображение было «похоже» на объект. б) Степень корреляции q __ i (x, у) о (х, у) о2 (х, у) Этой величиной оценивается в основном степень согла- сования распределения яркости в плоскостях объекта и изображения; такой критерий, вообще говоря, не позво- ляет выбрать систему, обеспечивающую наиболее резкое изображение. в) Дефект верности J) где И*, У) —г(Д, У)]2 о2 {х, у) Как было показано в гл. 2, этот показатель качества зависит от двух предыдущих. Все три показателя связаны между собой соотношением Следовательно, показатель F (или D) содержит харак- теристики, входящие как в Q, так и в Г. Перечисленными показателями качества удобнее поль- зоваться, если в их выражении перейти к пространству !) В советской научной литературе этот термин (fidelity defect) иногда переводится просто как «верность» [12*].— Прим. ред.
162 Глава! частот: 4-оо -(-oo \\\х (и) р ф00 (и) da 11 х (а) Фоо (а) 5о> — ОО -~ — ОО Фоо (<й) dw | I Фоо (a) —ОО + ОО J J [1 - 2т (и) +1 т (и) Р] Фоо (о) do Пока все хорошо. Оптическая система описывается функцией т (со), структура объекта — функцией Фоо (со), а характер назначения прибора укажет, какой фактор качества необходимо выбрать. Но чтобы практически использовать эти соотношения, необходимо сделать неко- торые предположения относительно Фоо (со). При отсут- ствии конкретных данных об объекте мы можем прибегнуть к теории информации и исходить, так сказать, из «прин- ципа максимального незнания». Именно, мы выберем для Фоо (со) форму «белого» (т. е. со спектром, равномер- ным по крайней мере до частоты среза фильтра) гауссова (нормального) шума. Это связано с тем, что среди всех структур объектов, характеризующихся фиксированной величиной среднего квадрата флуктуации яркости, струк- туре с нормальным распределением величин яркости соответствует максимальная энтропия. Выбор спектра, равномерного вплоть до пределов разрешения, позволяет нам вынести Фои (со) за знак интеграла и сконцентри- ровать внимание на зависимости показателей качества от параметров оптической системы [через т((о)]. На основе высказанных упрощающих предположений введем новые показатели качества, нормализованные по отношению к показателям качества идеального прибора: -(-оо -f.oo 11 | т (ш) |2 da 11 x («) da +<*> ' ч Qo +°° Ц\х0 (<o) |2 da 11 x0 (a) da — oo —oo f F _q—f\t
Статистические методы 163 где Подчеркнем еще раз, что величина Т, будучи независимой от фазы функции т (со), не характеризует систему с точки зрения «ложного разрешения». Далее, определенный выше Po=I.O 1,0 0,9 0,8 0,7 0,6 0,5 Sf 1,0 0,9 0,8 0,7 0,6 0,5 и Sf Фиг. 7.1. параметр q идентичен четкости по Стрелю 3. Наконец, Т представляет собой именно ту величину, которую Шейд [2] первоначально использовал для оценки оптических систем и которую он обозначил Ne и назвал эквивалентной поло- сой пропускания.
164 Глава 7 В заключение данного параграфа мы покажем, как изменяются показатели качества при изменении поло- жения фокальной плоскости для ряда значений отношения сферических аберраций третьего и пятого порядков. i,o\ 0,8 F 0,6 0,4 0,2 о 1.0 0,9 0,8 0,1 0,6 0,5 Sf X То 1,0 0,8 0,6 0,4 0,2 О 10 0,9 0,8 0,7 0,6 0,5 1,0 - ?о=О,9 1,0 0,9 0,8 0,1 0,6 0,5 Sf Фиг. 7.2. На фиг. 6.1 мы видели, что показатели качества соответ- ствуют марешалевскому допуску при полной коррек- ции (ро = 1) и фокусировке на ji = 0,8 для сферической аберрации пятого порядка с dj = 4А. При dt >4A, как видно из фиг. 7.1, кривые всех трех типов постепенно смещаются по направлению к зональному фокусу 1). х) Имеется в виду нормализованная величина. Сама величина Ы/ возрастает при увеличении dt.
Статистические методы 165 Из фиг. 7.2 видим, что в случае перекорректировки (р0 = = 0,9) также происходит смещение от наилучшего фоку- са для малых аберраций (ц. « 0,65) к зональному фокусу. Все это соответствует тому, что следовало бы ожидать на основании чисто геометрического анализа условий фоку- сировки при больших аберрациях. § 2. Другие статистические факторы: зернистость и гранулярность Пока что мы рассматривали вопрос о формировании оптического изображения, не учитывая шумов, обуслов- ленных флуктуациями числа фотонов, создающих изоб- ражение, или флуктуациями параметров чувствительного элемента (глаза, фотоэлемента, пленки и т. д.). При фото- графической регистрации изображения основным источни- ком шума являются флуктуации, обусловленные неодно- родной зернистой структурой. Конечно, с точки зрения теории информации для того, чтобы передать определен- ную плотпость информации в битах г) на 1 мм2, необхо- димо учесть не только ширину полосы пропускания (раз- решающую способность), но и шумовые ограничения (гра- нулярность). Это справедливо для всех физических изме- рений Каждый реальный физический сигнал ограничен во времени, в пространстве и по частоте. Кроме того, при любых измерениях неизбежны шумы. Ограниченной шири- ной полосы пропускания определяется конечное число степеней свободы формы сигнала, но если бы не было шума, дискретные значения ординаты можно было бы отличать друг от друга с любой степенью точности. Чтобы немного осветить вопрос о гранулярности и в то же время дать пример расчета двумерных корреляционных функций и двумерного статистического спектра, рас- смотрим две простые модели. Прежде всего обратимся к ситуации, представленной на фиг. 7.3. Пусть Т (|, г\) характеризует пропускание х) Бит (bit) —- американское название двоичной единицы инфор- мации (сокращенное от binary digit — двоичная цифра).— Прим. ред.
Убб Глава 7 в каждой точке рассматриваемой картины, А — площадь отверстия диафрагмы сканирующей системы. Нас будут Сканирующая диафрагма Выходной сигнал Плоскость пленки Источник света Фиг. 7.3. интересовать флуктуации пропускания относительно сред- него значения, т. е. величина l, т,) = 7\(|, Ц)-Т, где А-юо Введем автокорреляционную функцию В начале координат эта функция равна G.1)
Статистические методы, ltS7 Статистический спектр флуктуации пропускания опре- деляется на основании теоремы Хинчина — Винера сле- дующим образом: + ОО <?tt{x, y)e~iwrdxdy. = \\ Приведенные характеристики описывают флуктуации пропускания самого образца. При сканировании образца картина флуктуации несколько размывается. Действи- тельно, если функция s(|, ц) описывает импульсную реакцию диафрагмы сканирующей системы, то наблюдае- мые флуктуации будут определяться выражением При переходе к частотным представлениям получим Ф'« («О*, <йу) = [ Т ((Ох, (Оу) |2 ФН ((Ох, (Оу) и, осуществив еще раз преобразование Фурье, мы уста- новим следующий вид автокорреляционной функции на выходе измерительной системы: Фн (х, у) = f (|, т]) t' (I + х, г\ + у) = +00 T^' ^ 12ф»К. »!/) е^'Л(йхЛиу. G.2) Прежде чем идти дальше, сделаем одно историческое замечание. Сначала необходимо провести четкое разли- чие между понятиями зернистости и гранулярности. Зер- нистость относится к субъективному восприятию случай- ных флуктуации плотности образца и определяется па практике как увеличение, при котором появление зереп приводит к стиранию различий между деталями снимка. Термин же гранулярность был введен для описания резудьг-
168 Глава 7 татов объективных измерений зернистой структуры с по- мощью физического прибора. Одна из наиболее ранних характеристик гранулярности была предложена Гётцем и Гулдом [4]. Это величина G— = 1000 V^Cy, где <з'т — стандартное отклонение пропу- скания, измеренное при сканировании образца диафраг- мой с отверстием площадью А. Позже Селвин [5], который обнаружил явную зависимость гранулярности от плот- ности D, предложил характеризовать гранулярность пара- метром S = yr2Ao'D. Для диафрагм с отверстием, значи- тельно превышающим размеры зерна, величина S как функ- ция у А должна быть постоянной. Позднее Джонс и Хиг- гинс [6], стремясь наилучшим образом согласовать резуль- таты объективных измерений со шкалой зернистостр!, пред- ложили использовать в качестве параметра грануляр- ности среднее значение разности плотностей на двух соседних участках, просматриваемых сканирующей диаф- рагмой. Рассматривая совместно сложный параметр гра- нулярности 5Д/) и пороговую кривую контрастной чув- ствительности глаза, они получили шкалу субъективной зернистости. В дальнейшем для характеристики грануляр- ности было предложено использовать автокорреляцион- ную функцию и ее преобразование Фурье — спектр мощ- ности [7, 8]. В последнее же время Мэрридж и Питтс [9] показали, что различные параметры, которые были пред- ложены для характеристики гранулярности и зерни- стости, математически эквивалентны. На основании вышесказанного представим формулу G.2) в следующем виде: ? = (Г - ТУ = (О2 = ф« @, 0) = + 00 = Ш \ ] IT (to) I2 Ф" (to) dli)x d(*'J • \ \ q>tt (x, у) <fss (x, у) dx dy, G.3) где последнее выражение следует из теоремы Парсеваля, а q>ss (я. у) — не что иное, как свертка функции импуль-
Статистические методы 169 сной реакции апертуры с самой собой. Приведенному выражению, представляющему собой объем фигуры, вы- сота которой в каждой точке равна произведению cp^cpss, может быть дана интересная интерпретация. Рассмотрим для этого два крайних случая. В первом случае, когда отверстие сканирующей диафрагмы значительно меньше размеров зерен, <pss (х, у) может быть представлено в ви- де б (х, у). Выполнив эту подстановку и используя извест- ные фильтрующие свойства б-функции, получим Если же отверстие сканирующей диафрагмы значительно превышает размер зерен, то величина <fss (x, у) почти постоянна во всей области корреляции зерен и ее значе- ние ф68 @, 0) можно вынести за знак интегрирования: "г - ф88 @, 0) ^ \ ф„ (х, у) dx dy. G.4) — ос Для пленки определенного типа этот интеграл посто- янен. Чтобы определить зависимость ф88 @, 0) от разме- ров отверстия сканирующей диафрагмы, запишем пере- даточную функцию т (|i, v) в таких безразмерных едини- цах, чтобы при изменении размеров сканирующей диаф- рагмы и сохранении ее формы постоянной функция т (|i, v) также не изменялась. Безразмерные единицы опре- деляются следующим образом: V" = —Г^ i v = —Г^ » (ша:)макс (ш#)макс где иж)макс Z > (^ ¦тмакс причем жмаь.с и г/макс —максимальные размеры отверстия сканирующей диафрагмы. Поскольку cpss (х, у) и | т (озх, (Оу) |2 связаны друг с другом преобразованием Фурье, можно написать q>ss @, 0) ~ -i- ^ | т (|1, v) |2 dp dv = -^^ .
170 Глава 7 Подставив это выражение в формулу G.4), получим соотношение а'т У А = const, которое было установлено также на основании экспери- ментальных наблюдений [6]. Исходя из того, что размеры отверстия диафрагмы зна- чительно больше размера зерен, можно также найти выра- жение для флуктуации плотности. Из определения «фото- графической плотности» D = \g \IT следует, что = D-D= -lg r и при больших сканирующих диафрагмах, когда AT IT < 1, получаем Следовательно, величина S = y2Ao'D также не должна зависеть от У А при больших сканирующих диафрагмах. Теперь мы хотим выяснить, как изменится стандартное отклонение наблюдаемого пропускания при увеличении размеров сканирующей диафрагмы. С этой целью рассмот- рим две весьма упрощенные модели зернистости. § 3. Модель зернистости в виде шахматной доски Предположим, что образец, показанный на фиг. 7.4, закрыт диафрагмой с квадратным отверстием. Пусть площадь отверстия А = L2 и на нее приходится N квад- ратов, т из которых прозрачны, а п — непрозрачны (зер- на). Далее, площадь каждого зерна а = Z2, а вероятность того, что случайно выбранный квадрат окажется прозрач- ным, при большом числе квадратов равна отношению проз- рачной площади ко всей площади, т. е. р = mIN = Т, где Т — общее пропускание. Общее число квадратов
Статистические методы 171 на площади А равно Вероятность1) того, что т квадратов из общего числа N квадратов, содержащихся на площади А, будут прозрач- ными, дается биномиальным распределением ,-^—P^l-Pf-^p = f. Фиг. 7.4. При большом числе квадратов первые и вторые моменты биномиального распределения даются следую- щими выражениями: Мы можем использовать последнее соотношение, чтобы проверить правильность установленной Селвином зави- симости от }^А. Так как № TO aT(i-T) N откуда явствует, что оТу А является постоянной вели- чиной. При малом числе квадратов нужна некоторая х) См. приложение Б.
172 Глава 7 осторожность. Нетрудно показать, что корреляционная функция для данной модели имеет вид ф» (х, у) = т\ ('\ \х\ \ (\ \У\ i j ^ i j при m<-t. \у\^1' { 0 при | ж[>/, \у\>1, а спектр описывается выражением Фн (<*>х, озу) = T(l — T)P sine2 -~ sine2 -^- . Подобным же образом легко показать, что для скани- рующей диафрагмы 4>SS(X, У)'---- I L'1 ( 1 —Ц-L ) ( 1 у- ) при I х I < L, | г/1 < L, =¦-- j v L y v L J (О при |x|>L, \y\>L. В результате подстановки ф58 (ж, г/) и ф;г (х, у) в формулу G.3) и последующего интегрирования мы получаем ат -^ при при где " / У а ' На фиг. 7.5 показано, как изменяется 67j/ А при измене- нии У А, Можно сравнить этот результат с аналогичными результатами работы [61, где представлены данные экспе- риментальных измерений зернистых структур. Прежде чем закончить данный параграф, заметим, что все сказанное о а'т отнюдь нельзя непосредственно переносить на а'п. Ира малых сканирующих диафрагмах понятие фотографической плотности теряет смысл. Вслед- ствие логарифмической зависимости D от Т при малых сканирующих диафрагмах величина D очень сильно изме-
Статистические методы 178 няется. В результате в том случае, когда размер отверстия сканирующей диафрагмы равен нескольким диаметрам 1,0 0,8 GVA 0,6 o,4 0,2 О 10 Ф и г. 7.5. Фиг. 7.6. зерна, мы в основном получаем информацию о фильтрую- щих свойствах микроденситометра, а не о флуктуациях в образце. $ 4. Модель зернистой структуры, состоящая из круглых перекрывающихся зерен Обратимся теперь к модели [3] зернистой структуры, изображенной на фиг. 7.6, которая более соответствует действительности, нежели предыдущая модель. Такая модель для определения флуктуации пропускания и авто- корреляционной функции впервые предложена Писэн- боно [10]. Она сложнее простого двумерного обобщения задачи о случайном двухуровневом сигнале с пуассонов- ским распределением пересечений, хорошо известной в электрической теории связи. Для начала предположим, что а) зерна круглые и их центры расположены на плоскости случайно, независимо друг от друга; б) центры зерен распределены по закону Пуассона, т. е. вероятность того, что на площади А име- ется п зерен, определяется выражением Рп (А) = (п)пе- где d = п/А — плотность заполнения площади зернами;
174 Глава 7 в) размеры зерен подчиняются закону распределения вида р (г) = Вероятность (R < г). Для простоты будем полагать, что размеры всех зерен одинаковы; следовательно, р (г) будет изображаться пунк- тирной кривой на фиг. 7 7. Как и раньше, Т (х, у) представляет собой пропуска- ние в точке объекта, по величине равное либо 0, либо 1. Вычислим теперь среднее, или ожидаемое, значение про- пускания e(T) = T=lim-±r\\T(z,y)dzdy. G.5) А->оо А «3ДЛ Разобьем рассматриваемую плоскость на элементы at, которым припишем следующие свойства: В, если щ не содержит центр {xnji) зерна, захватывающего точку (х, у), и В, если at содержит центр (xt, yt) зерна, захватывающего точку (х, у). Вероятность того, что элемент щ имеет свой- ства В, обозначим pt. В соответствии с выражением G.5) мы можем разбить область интегрирования на две части: одна часть, для которой Т = 1, и другая — для которой Т = 0. Тогда Т равно отношению прозрачной площади ко всей площади. Иначе говоря, Т — это доля иэ общего числа событий, при которых случайно расположенная диафрагма накроет участки с Т = 1. Таким образом, Т = = Вероятность [Т = 1]. Но это может быть только в том случае, если элементы at, окружающие (х, у), имеют свой-
Статистические методы 175 ство В. Поэтому m G.6) причем для удобства мы выберем элементы я, кольцевой формы площадью 2nridrt с центром в точке {х, у) Ф и г. 7.8. (фиг. 7.8). Найдем теперь число случаев, в которых эле- мент at может иметь свойство В. Во-первых, он может не содержать зерен, во-вторых, может содержать одно зерно, которое не доходит до точки (х, у), в-третьих, может содержать два зерна, ни одно из которых не достигает (х, у), и т. д. В соответствии с пуас- соновским распределением размеров зерен напишем Pi = Po(at)+Pi (at) p (rt (rt) Рп(аг) рп (rt) = -ft e-nip (г,) п (г,) = где ni = aid = 2dnridri. Подставляя это выражение в фор- мулу G.6), получаем
176 Глава 1 и, переходя от суммирования к интегрированию, нахо- дим, что оо Т = ехр | — 2nd \ [\-р (/•)] г dr\ . о В случае когда размеры всех зерен одинаковы, эта формула приобретает вид f = е-яд2<г = е-(па)/А> G.7) где а = nR2 — площадь одного зерна. Смысл этого выра- жения заключается в том, что если разбрасывать зерна случайным образом по всей прозрачной площади, то пропускание сначала будет уменьшаться почти пропор- ционально числу зерен, а затем, когда зерна начнут пере- крываться, уменьшение пропускания будет экспоненциаль- ным. Действительно, так как фотографическая плотность D связана с плотностью заполнения соотношением D ~ = Ma (nIA), где М = lg e = 0,4343, то соотношение G.7) можно записать в виде т. е. мы получили более привычное выражение для экспо- ненциального уменьшения Т при увеличении d. Наконец, прежде чем приступать к вычислению авто- корреляционной функции для данной модели, мы укажем, что поскольку Т принимает только значения 0 и 1, то в каждой точке Т2 = Т. Следовательно, 02Т = (Т - ТУ = Т2 - (ГJ = Т A - Т). Что касается корреляционной функции, то она должна обладать круговой симметрией и зависеть только от рас- стояния между двумя точками. Поэтому мы упростим рас- смотрение, взяв на оси х две точки, находящиеся на рас- стоянии I. Из определения корреляционной функции имеем Фтт (I) = lim A- \\ T (х, у) Т(х-1, у) dx dy.
Статистические методы 177 В произведении Т (х, у) Т (х —- I, у) возможны 4 различ- ные комбинации. Но оно будет отлично от нуля только в том случае, когда и Т (х, у), и Т (х — I, у) равно еди- нице, т. е. фтт @ — Вероятность [Т (х, у)Т (х— I, у) = 1]. Определим элемент аь заново таким образом, чтобы он обладал свойством В, если не содержит центр зерна (xt, у), Д Ф и г. 7.9. захватывающего (х, у) или (х — I, у), и свойством В во всех других случаях. Далее, разделим плоскость на две части, как показано па фиг. 7.9, и введем следующие обоз- начения: Pi — вероятность того, что кольца в области / (г < 1Щ имеют свойство В; Ри — вероятность того, что срезанные кольца в области // (г>//2) имеют свойство В. Следовательно, Pi X Рп — вероятность того, что зерна в правой половине не захватывают ни (х, у), ни (х — I, у).
J78 Глава 1 Так как две половины плоскости независимы, то Фтт (I) = Вероятность [Т (х, у) Т {х-1, у) = 1] = (Рг х РцJ. На основании всего сказанного можно сразу написать Ч2 — 2nd\^ [l—p(r)]rdr} = exp I — 2nd \ \ [l — p(r)]rdrda\, 1/2 arc cos l/2r так что фтт (I) — exP \ — 4g! \ л \ fl — p (/•)] rt I It) 0 oo — \ arc cos y- [1 — p (/•)] r rfr I I . г/2 Теперь необходимо различать две области. При 1/2; второй интеграл в показателе степени исчезает и мы получаем как и следовало ожидать. При 1/2 ^.R оба интеграла дают свой вклад в конечное выражение где представляет собой как раз ту функцию, которая в диф- ракционной теории описывает свертку двух кружков рас- сеяния. Здесь она появляется, конечно, совершенно по другим причинам (фиг. 7.10). 2^'~2? У ^~\т) J
J_ 2/? Ф и г. 7.10. <PttU> 0,2 0,4 0,6 0,8 1,0 0,6 0,4 0,2 3 ф р и 4 Г. 5 D d ' 7. 6 R ~ Р 12. 9 10
180 Глава 7 Несколько удобнее с помощью соотношения G.1) перей- ти от фтт (I) к ф(( (Г). Тогда мы имеем при 1>2R, где М — lg е = 0,4343, a D — фотографическая плот- ность. Кривые, изображающие эту функцию, представ- лены на фиг. 7.11. Не составляет труда определить, что будет при скани- ровании нашей модели круглой диафрагмой с отверстием радиуса р. Передаточная функция имеет вид т (ю) = = 2/j (cop)/cop, и для <fss (Г) получаем I 0 при I > 2р. Подставляя эти выражения в формулу G.3) и производя интегрирование, находим зависимость, представленную на фиг. 7.12. Предлагаем читателю сравнить полученные результаты с данными для реальных зернистых структур, имеющимися в литературе [6]. В заключение следует ука- зать, что Писэнбоно [10] и его последователи [11] разви- ли дальше изложенную теорию зернистости с учетом частот- ного распределения как размеров зерен, так и их про- пускания. ЛИТ Ж V А ТУГА 1. L i n f о о t E. H., Journ. Opt. Soc. Am., 46, 740 A956). 2. S с h a d e О. Н., JSMPTE, 58 A952). 3. W e b b J. H., Journ. Opt. Soc. Am., 45, 379 A955). 4. G о e t z A., G о u 1 d W. 0., JSMP, 29, 510 A937). 5. S e 1 w у n E. W. H., Phot. Journ., 79, 513 A939). 6. Jones L. A., H i g g i n s G. C, Journ. Opt. Soc. Am., 35, 435 A945); 36, 203 A946); 37, 217 A947); 38, 393 A948); 41, 41 A951); 41, 64 A951); 41, 192 A951). 7. F e 1 1 g e t t P., Journ. Opt. Soc. Am., 43, 271 A953). 8. J о n es R. C, Journ. Opt. Soc. Am., 45, 799 A955). 9. M a r r i a g e A., Pitts E., Journ. Opt. Soc. Am., 46, 1019 A956); 47 A957). 10. Picinbono В., Compt. Rend., 240, 2206 A955). 11. S a v e 1 1 i M., Compt. Rend., 246, 3605 A958). 12*. Л и н ф у т Е. X., ОМП, № 7, 35; № 9, 40 A965).
гллв л 8 МАТРИЦЫ И ТЕОРИЯ КОГЕРЕНТНОГО ИЗЛУЧЕНИЯ $ 1. Введение. Функция взаимной когерентности Вольфа В предыдущих главах мы ограничивались в основном анализом и синтезом оптических систем, работающих с не- когерентным излучением. Только при рассмотрении неко- торых специальных случаев мы переходили к системам, в которых линейно от точки к точке складываются комп- лексные амплитуды. Несомненно, между этими крайними случаями не должно быть резкого перехода, и, действи- тельно, существует переходная область, известная под названием области частичной когерентности. Совершенное изложение вопросов частичной когерентности вместе с исключительно ценным историческим обзором дается в превосходной книге Борна и Вольфа [1] г). При изложении теории частичной когерентности в ее связи с проблемами формирования изображения мы при- мем феноменологический подход. Как с классической, так и с квантовой точки зрения представляется вполне естественным, что возмущения в двух точках должны быть коррелированы в пространстве и во времени. Луч света с полосой частот излучения Av, испускаемый источником площадью ст, должен давать эффекты когерентности в обла- сти протяженностью c/Av вдоль луча и в любых двух точках плоскости, перпендикулярной лучу, которые нахо- дятся в пределах дифракционного диска, соответствующе- го источнику ст как отверстию дифракционной диафрагмы. В этом когерентном объеме реального пространства, соответствующем элементу фазового пространства, должно обнаруживаться фотонное вырождение. Хорошо известно, что свойства симметрии волновой функции бозонов при- г) Новейшие данные по «частичной когерентности» изложены в работах [15*, 16*].— Прим. ред.
182 Глава 8 водят непосредственно к их «притяжению» или сдваива- нию. Интерес к теории когерентности в значительной мере обусловлен широко известными опытами Брауна — Твис- са [3] и разработкой лазеров, поскольку, как показал Мандель [2], вырождение может составлять от 10~3 в опытах Брауна — Твисса до 1012 для газовых лазеров. Учитывая необходимость применения в оптике таких величин, которые могут быть измерены, Вольф [4] пока- зал, что для описания корреляции между оптическими возмущениями в двух точках пространственно-времен- ной области вполне пригодна функция взаимной коге- рентности Г (х±, х2; т). Исходя из реального оптического возмущения, т. е. одной из декартовых компонент элект- рического вектора, мы представим его в виде интеграла Фурье, взятого по положительным частотам: оо V (l)=\ a (v) cos [ф (v) — 2nvt] dv. о Этому реальному возмущению соответствует комплексное возмущение, которое называется «аналитическим сигна- лом»: где оо V<'l)(t)=\ a (v) sin [ц, (v) — 2nvt\ dv, о но реальная F(r> (t) и мнимая V<{) (t) составляющие не являются взаимонезависимыми. То обстоятельство, что спектр Фурье от Y (t) исчезает для отрицательных частот, означает, что FC> (t) и У<{) (t) связаны друг с другом преобразованием Гильберта:
Матрицы и теория когерентного излучения 183 где символом Р обозначено главное значение интегралов при t' = t. Правда, VM (t) и, следовательно, V (t) не наблюдаются на оптических частотах. Наблюдать можно их средний квадрат, полученный усреднением за продол- жительное время: оо iyw (t)) = {VW (t)) = у (| V (t) |2) = 2 J G (v) dv, о где — спектр мощности сигнала F(r> (t), который рассмат- ривается как стационарная случайная функция времени. Угловые скобки указывают па усреднение по времени. После такого краткого введения мы определим функцию взаимной когерентности Вольфа через перекрестную кор- реляцию комплексного возмущения в двух точках про- странства в различные моменты времени: Г (хь х2; т) = Г12 (т) = (V (Xl, t + т) V* (х2, *)>. Заметим, что Г12 @) выражает корреляцию в двух точках пространства в одно и то же время и, поскольку эта вели- чина пропорциональна контрасту полос в звездном интер- ферометре Майкельсона, ее пространственное преобразо- вание Фурье дает информацию о распределении яркости в источнике излучения. Величина Гц (т) представляет собой значение функции корреляции в одной точке про- странства для двух значений времени, и, поскольку она пропорциональна контрасту полос в двухлучевом интер- ферометре Майкельсона, ее временное преобразование Фурье дает информацию о спектральном распределении энергии источника. Короче говоря, звездный интерферо- метр Майкельсона является анализатором пространствен- ных гармоник, а двухлучевой интерферометр — апали- затором временных1) гармоник [5]. С функцией взаимной когерентности тесно связана нормированная комплексная степень когерентности, кото- х) На^практике, конечно, изменяется оптическая разность хода Д = ст.
184 Г лава 8 рая определяется выражением где It = Гц @) и 12 — Г22 @) — значения интенсивности в точках Pt и Р2. Амплитуда и фаза Y12 (т) могут быть доста- точно просто определены по величине контраста и поло- жению полос, возникающих в результате иптерферепции света, вышедшего из точечных отверстий в точках Pi и Р2 непрозрачного экрана. § 2. Формирование изображения Можно показать [6], что вследствие линейности урав- нений Максвелла, а также вследствие того, что Vr (t) удовлетворяет скалярному волновому уравнению, Г12 (т) удовлетворяет двум волновым уравнениям вида Т72Т /Y Y . rr-\ — \ 1 * 2» / „ _ Л О Vgl 1Л|5 -^-Zi } "^ 13—9 1 " ' * Это — очень важное обстоятельство с точки зрепия форми- рования изображения. Наше представление об оптических системах при когерентном и некогерентном излучении как о фильтрах пространственных частот основано на ли- нейном преобразовании фурье-составляющих между пло- скостями объекта и изображения. При частично когерент- ном излучении фурье-составляющие структуры объекта оказываются «перепутанными» [7] и входят в формулу изображения нелинейно. Правда, эти составляющие всегда можно «распутать», если позаботиться об этом, но более желательно сохранить линейную связь величин Г (з^, х2, т) между плоскостями объекта и изображения и затем перейти к пределам. Имея в виду это обстоятельство, мы теперь представим оптическую систему в виде системы трех плоскостей, как показапо на фиг. 8.1. На этой фигуре вектор | относится к точке плоскости объекта, вектор (J расположен в пло- скости зрачка, а х — точка в плоскости изображения,
Матрицы и теория когерентного излучения 185 Если представить Г12 (т) в виде и подставить в волновые уравнения, то мы найдем, что f]2 (v) удовлетворяет паре уравнений Гельмгольца, а из Плоскость изображения \ \ Плоскость зрачка Плоскость объекта Фиг. 8.1. гл. 5 мы уже кое-что знаем о решениях таких уравнений для подобных проблем. Решая первое из этих уравнений, мы получаем выражение Г (X!, U v) =¦-- \ и (xj, 1ь v) v) (8.1) где и (х4, |i; v) — комплексное возмущение в точке хь обусловленное точечным источником, находящимся в точке |4, на частоте v. Для второго уравнения Гельм- гольца мы имеем Г (Xl, х2; v) = J и* (х2, |2; v) f (хь |2, v) d|2, (8.2)
186 Глава 8 где комплексно сопряженная величина и* (х2, |2; v) выби- рается таким образом, чтобы обеспечить выполнение условия Г (х4, х2; v) = Г* (х2, х4; v), вытекающего из определения Г(Х],х2;т) и предположе- ния о стационарности, что дает в свою очередь соотно- шение Г(х4, х2; т)=Г(х2—х4; т). Подставляя выражение (8.1) в выражение (8.2), мы полу- чаем соотношение, которое описывает характер распро- странения каждой спектральной составляющей функции взаимной когерентности между плоскостями объекта и изображения Г (х4, х2; v) = \ \ и (xt, |4; v) и* (х2, |2; v) X Выполняя временное преобразование Фурье и налагая условие пространственной стационарности на комплекс- ное распределение освещенности в изображении точки, мы получаем, наконец, следующее выражение: Г (хь х2; т) = J { J и (|j - xt; v) u* (|2 - x2; v) X X f (|lf |2; v) e-2^ dv d|t d|2. (8.3) Распределение интенсивности получаем при х2 —>- Xi и т —> ->- 0, что приводит к /' (х) = Ги @). Прежде чем перехо- дить к этим пределам, мы сначала должны ввести квазимо- нохроматическое приближение. Хотя ни один оптический источник не дает строго монохроматического излучения в смысле бесконечно длинных волновых цугов, в некоторых случаях можно считать, что Av С v, где v — средняя частота излучения, a Av — ширина спектральной полосы излучения, обратная времени когерентности т яз 1/Av. Для квазимонохроматического излучения мы имеем ft2(v)e-2xri(v-v)T dv,
Матрицы и теория когерентного излучения 187 и, так как (v — v)t = Avt « -^- < 1, мы можем написать +о° Г12 (т) « е-2я^ J f 12 (v) dv = Г12 @) е~2я^\ — оо откуда Производя подстановку в правую часть выражения (8.3) и интегрируя по dv, мы приходим к следующей зави- симости: Г(х1)х2; т)= \\ u(li — xt; v)u*(|2 —x2; v) X l2e-^ . (8.4) Ограничим рассмотрение еще больше; для когерентного освещения плоскости объекта Г B^, |2; 0) принимает осо- бенно простой вид [6]: Подставляя это выражение в формулу (8.4) при усло- вии, что х2 — щ = х, х —¦» 0, и пренебрегая зависимостью от v, мы имеем для рас- пределения интенсивности в плоскости изображения сле- дующее выражение: + ОО Г(х)=[\и (I, - х) и* (|2 - х) А (|0 Л* (|2) d|i dh, — ОО или в более удобном виде + ОО | I \2 (8.5)
188 Г л а в а 8 Это выражение четко показывает, что оптическая система является линейным фильтром по отношению к комплексной амплитуде. Вычисляем далее когерентную суперпозицию между двумя плоскостями, а затем возводим ее в квадрат. При некогерентном освещении плоскости объекта или для самосветящихся объектов Г (Si, %2\ 0) принимает следующий вид: Г (Si, h;0)=:r,i (уб^ -|2). Это означает, что каждая точка излучает независимо от другой точки. Выполняя опять подстановку в формулу (8.4), выбирая пределы х2 —>¦ х4 = х, т —>¦ 0, пренебрегая зависимостью от v и используя фильтрующие свойства б-функции, мы приходим к выражению «(S-x)|*/(S)d|, (8.6) которое достаточно хорошо иллюстрирует некогерентную суперпозицию. В заключение параграфа напомним, что выражения (8.5) и (8.6) можно записать в виде интегралов суперпозиции следующим образом: А' (х) = \ и (| — х) Л (|) d%, когерентный предел, — оо -j-oo /'(х)= \ s (%— x)/(|)ri|, некогерентный предел, — ОО где в первом из этих выражений Г (х) = | А' (х) | 2, а во втором s (х) = [ и (х) | 2. С точки зрения теории линейной фильтрации при когерентном излучении переда- точная функция представляет собой пространственное преобразование Фурье от и (х), которое, как показано в гл. 5, равно в точности F ф) — комплексной амплитуде на выходном зрачке. Именно это обстоятельство позволяет управлять фурье-структурой изображения в устройствах, где используется когерентная пространственная фильтра- ция, и в микроскопах с фазовым контрастом. Наконец, в случае некогерентного освещения передаточная функция
Матрицы и теория когерентного излучения 189 представляет собой пространственное преобразование Фурье функции s (х), которое, как видно из выражения E.9), представляет собой свертку функции F ((J) с ее комплексно сопряженной величиной. § 3. Матричная теория Всегда, когда это возможно, в математической физике стараются описывать поля с помощью линейных эрмито- вых операторов. Линейность желательна по причинам весьма очевидным, а эрмитовость — поскольку эрмитовы операторы дают в качестве наблюдаемых величин дейст- вительные собственные значения. Эту тенденцию легко видеть, например, на начальной стадии разработки кван- товой теории. Так, в центре схемы Шредингера в волно- вой механике стоит проблема определения основных соб- ственных значений с помощью линейного дифференциаль- ного оператора второго порядка. В матричной механике Гейзенберга все основано на другом, но математически эквивалентном решении уравнения для собственных зна- чений с помощью матричных операторов. Поэтому даже удивительно, что оптическое волновое уравнение, которое было известно гораздо раньше волнового уравнения Шре- дингера, до самого последнего времени не было представ- лено в матричном виде. Теперь главным образом благода- ря работам Габора [9] и Гамо [10] достигнута полная ана- логия между матричным и дифференциальным описанием как в волновой механике, так и в оптике. Мы начнем с то- го х), что вернемся к выражению (8.4) и, чтобы не загро- мождать изложение второстепенными деталями, ограни- чимся только одномерпыми изменениями. Снова положим х2 —> хх = х, т —> 0, и, пренебрегая явной зависимостью от v, получаем сле- дующее выражение для интенсивности в плоскости изоб- *) Далее дается упрощенное изложение изящной трактовки формирования изображения Гамо [13] с использованием матричных выражений для описания распространения волны и ее обнаруже- ния. Некоторые читатели могут заметить очевидное сходство изла- гаемых методов с методами матрицы плотности [14] в других обла- стях физики.
190 Глава 8 ражения: - х) и* A2 -х)Т &, l2) d& dl2. (8.7) Разложим теперь и (х) в ряд по ортогональным функциям. В поисках подходящего набора функций мы воспользуем- ся тем, что и (х), в силу самого процесса дифракции, огра- ничивается по полосе пространственных частот числовой апертурой прибора. Тогда, разлагая и (х) с помощью тео- ремы о дискретном представлении х), мы получаем п=— оо где гр / \ . ,п ш \ s\nBn,Wx — пп) Тп (х) = sine BnWx - пп) = B\Wx_nn) , цт sin 9 а 8 — половина апертурного угла. Так как выражение для теоремы о дискретном представлении не зависит от начальной точки выборки, мы можем написать оо и(\-х)= 2 = 2 ипЦ)Тп{х). (8.7а) П=—оо Подставляя формулу (8.7а) в выражение (8.7), мы при- ходим к следующей зависимости: I' (z) = 2 S T*m (х) ВтпТп (х) = TtBT, (8.8) m n где элементы Втп «матрицы освещенности» В опреде- ляются соотношением Втп = \ J и*п (Ы Г (glt |2) un (gj) dgj dg2) (8.9) х) Теорема Шеннона — Котельникова (см. гл. 9, § 5).— Прим. ред.
Матрицы и теория когерентного излучения 191 хорошо известным в квантовой механике. Прежде чем идти дальше, весьма поучительно свести эту формулу к выражениям (8.5) и (8.6) для случаев когерентного и некогерентного излучения. В случае когерентного излучения и Втп приводится к виду = A'*(j^)A'(j^=A'?A'n. (8.10) Подставляя полученное выражение (8.10) в формулу (8.8) и опять используя теорему о дискретном представ- лении, находим В случае некогерентного излучения r(glfga) = /(g1)S(gi-g2), так что Втп можно записать в виде ипA)с11. (8.11) Подставляя выражение (8.11) в формулу (8.8), полу- чаем что, конечно, согласуется с соотношением (8.6). Возвра- щаясь к выражениям (8.8) и (8.9), замечаем, что /'(а;)>0 и Втп — ВтП. Следовательно, В — положительно опреде- ленная эрмитова матрица. Интегрируя обе стороны выражения (8.8) по dx и используя ортогональные
192 Глава свойства функции отсчетов, мы видим, что общая осве- щенность в плоскости изображения определяется выра- жением \ /' (х) dx = -;Ш- У, У, ВтпЬтп = ™Sp (В) = COllSt. Определим теперь унитарное преобразование таким образом, что T = QS, (8.12) Tt = (QS)-I- - StQt. Тогда выражение (8.8) можно записать в виде jr i%\ _ gt cQ+BO) S (8 13) где от матрицы Q теперь потребуем, чтобы она диаго- нализировала матрицу В в форме Л = QtBQ = (8.14) При таких условиях выражение (8.13) можно записать следующим образом: т' / ~\ О+ А С \^ \ 02 /~,\ /Q А С\ П Прежде чем интерпретировать этот результат, мы заметим что числа Хп определяются из решения уравнения для собственных значений (8.14) при выполнении условия | В — Л | = 0. Подставляя эти числа снова в выраже- ние (8.14), находим собственные векторы унитарного преобразования (8.12), откуда можпо определить S. Интересно, что левые части соотношений (8.8) и (8.15) одинаковы. Величина /' (х) характеризует распределение интенсивности, которое мы должны наблюдать или фото- графировать. Правым же частям этих соотношений можно
Матрицы, и теория когерентного излучения 193 дать интересную интерпретацию. Так, выражение (8.8), представляя собой обобщенную квадратичную форму, описывает формирование с помощью линзы L^ изображения /' (х) объекта, дающего частично когерентное излучение Г (li, 5г)- Линза имеет функцию рассеяния точки и (х). Г(х) Выражение же (8.15) устанавливает, что мы должны получить точно такое же распределение интенсивностеп при замене линзы Li другой линзой, для которой интен- сивность изображения точки равна S2 (х), и при замене объекта с частично когерентным излучением последова- тельностью некогерентных излучающих точек (располо- женных на равных расстояниях друг от друга) с яркостью %i, %2, . . ., %п, как показано на фиг. 8.2. Так как инвариантность следа матрицы при унитар- ном преобразовании соответствует здесь тому физическо- му факту, что полная освещенность в плоскости изобра- жения одинакова в обоих случаях, мы выбираем для удобства нормировку Sp Л = V %п = 1. Далее, исходя t из нашей интерпретации выражения (8.15) как некоге- рентной суперпозиции пучков, испускаемых источниками с яркостью %и Х2, ¦ • •, hn, мы видим, что, если бы у нас имелось устройство, которое считало бы отдельные фото- ны г), то вероятность Р; того, что данный обнаруженный х) Напомним, что Я относится к случайному распределению яркости источника. Мы умышленно воздерживаемся от того, чтобы связывать с квантовой природой процессов излучения и поглоще- ния представление о «летящей частице».
194 Глава 8 фотон связан с t-м пучком, равнялась бы как раз А.?. С этой точки зрения весьма заманчиво построить энтропию (см. приложение Б) световых пучков в виде Я=- ? A^logA*. i = l Теперь можно спросить, когда Н будет максимальным N и когда минимальным, если соблюдать условие V ^ = 1? i=i Легко показать, что ЯМИц = 0 при А;=-1, Яг = 0, хф), и #макс = log-N при Я; = —для всех х. В случае, представленном на фиг. 8.2, значение Нтш = = 0 соответствует одному яркому источнику в простран- стве объектов, когда не может быть никаких сомнений относительно источника обнаруживаемых фотонов. Мак- симум Н соответствует случаю, когда яркость всех N точек одинакова, т. е. когда неопределенность (энтропия) максимальна. В приложении Б мы показываем, что собст- венные значения "Кг, полученные в результате перехода к когерентному и некогерентному пределам в выражениях (8.10) и (8.11), как раз и дают минимальное (в первом случае) и максимальное (во втором случае) значения Н. Тот факт, что описание когерентного и некогерентного излучения с использованием понятия энтропии согла- суется с нашими интуитивными представлениями об упо- рядоченной и неупорядоченной суперпозиции, весьма положителен. Эта идея отнюдь не нова, но первым иссле- довал на основе термодинамических представлений с ис- пользованием понятия энтропии частично когерентную суперпозицию световых лучей Лауэ [И]. Результат также не представляет ничего неожиданного. Величина Н опреде- ляется через величины %и которые, будучи собственными значениями матрицы освещенности, зависят от функции взаимной когерентности Вольфа. Последняя же, как уже говорилось, используется для описания свойств частично когерентных оптических полей.
Матрицы и теория когерентного излучения 195 ЛИТЕРАТУР Л 1. Born M., Wolf E., Principles of Optics, New York, 1959. 2. M a n d e 1 L., Journ. Opt. Soc. Am., 51, 797 A961). 3. Brown R. H., TwissR. Q., Nature, 177, 27 A956). 4. Wolf E., Proc. Roy. Soc, A230, 246 A955). 5. M i с h e 1 s о n A. A., Light Waves and Their Uses, Univ. of Chicago, 1902; New York, 1961. 6. P a r r e n t G. В., Journ. Opt. Soc. Am., 49, 787 A959). 7. H о р к i n s H. H., Proc. Roy. Soc, A217, 408 A953). 8. S t e e 1 W. H., Opt. Acta, 3, 49 A956). 9. G a b о r D., в книге Astronomical Optics, ed. Z. Kopal, Amsterdam, 1956. 10. Gamo H., Journ. Appl. Phys. Japan, 25, 431 A956). 11. Laue M., Ann. d. Phys., 23 A907). 12. P a r r e n t G. В., Beran M., Coherence Theory, New York (в печати). 13. Gamo H., в книге Progress in Optics, vol. 3, ed. E. Wolf, Amsterdam (в печати). 14. ТегНааг D., Reports on Progress in Physics, 24, 304 A961). 15*. Yamamoto Т., Opt. Acta, 12, 229 A965). 16*. Oilmen Y., Appl. Opt., 4, 1660 A965).
ГЛАВА О ТЕОРИЯ ЧАСТИЧНОЙ ПОЛЯРИЗАЦИИ § 1. Введение До сих пор мы имели дело со скалярной теорией излу- чения. При изучении частичной когерентности, например, мы связывали скалярное возмущение V (t) в какой-то точке поля х со временем t. Теория частичной когерент- ности была развита с использованием представлений о кор- реляционных функциях. В частности, оказалась очень полезной функция перекрестной корреляции возмущений в двух различных точках поля в различные моменты вре- мени, названная функцией взаимной корреляции Г12 (т). Теперь мы рассмотрим явление поляризации и затем перей- дем к исследованию частичной поляризации г). При этом необходимо будет принимать во внимание векторную природу света. Как мы увидим, теория частичной поля- ризации имеет много общего с теорией частичной когерент- ности. Законы элементарной оптики, связанные с именами Брю- стера и Малгоса, и методы сложения двух гармонических возмущений, направленных под прямым углом друг к дру- гу, хорошо известны, и мы не будем здесь на них останав- ливаться. Конечно, эти фундаментальные представле- ния очень важны и полезны для понимания физических основ явления поляризации. Но мы будем иметь дело главным образом с математической теорией, в которой обобщаются указанные основные представления и делается попытка найти математическое выражение также и для понятия частичной поляризации. Математический аппарат теории, не говоря уже о его изящности, значительно упро- J) Популярное изложение содержания данной главы с подроб- ным описанием практического использования явления см. в книге Шерклиффа [17*].— Прим. ред.
Теория частичной поляризации 197 щает анализ в тех случаях, когда речь идет о совокупном действии нескольких «поляризующих» приборов. Прежде чем переходить к изложению математической теории, целесообразно обрисовать в общих чертах главную идею современных методов исследования поляризации. х Фиг. 9.1. Мы ограничимся представлением о плоских волновых полях (монохроматических или немонохроматических). Предположим, что плоская волна распространяется в по- ложительном направлении оси z выбранной нами прост- ранственной системы координат (фиг. 9.1). Несколько оптических (поляризующих) приборов, соединенных после- довательно (показанных на фиг. 9.1 в виде черного квад- рата), «воздействуют» на приходящую плоскую волну, создавая затем выходящую плоскую волну. Прежде всего нам нужно найти такое представление плоской волны, которое было бы однозначно связано с ней. Тогда действие черного квадрата может быть охарактеризовано неким математическим «оператором». Мы потребуем, чтобы опе- ратор был линейным. Это согласуется с линейностью уравнений Максвелла, описывающих поле (и функцию взаимной когерентности Г1?), распространяющееся в соот- ветствии с принципом Гюйгенса. В современных методах исследования частичной поляризации, о которых мы соби- раемся говорить, рассматриваются в основном линейные задачи, а векторная природа света учитывается с по- мощью матриц. Первым, кто начал описывать поле посредством наблю- даемых величин, т. е. величин, которые могут быть непо- средственно измерены, был Стоке [1] A852 г.). Он ввел четыре так называемых «параметра Стокса». Один из них —
198 Г л а в а 9 полная интенсивность в любой точке поля, а остальные три, как мы увидим, определяют состояние поляризации. Позже Пуанкаре [2] A892 г.) ввел сферу, которая теперь называется сферой Пуанкаре и которая рассматривается нами в § 4, после того как вводятся параметры Стокса. Точки на сфере Пуанкаре представляют различные состоя- ния поляризации, а действие прибора на приходящее поле характеризуется перемещением изображающей точки по сфере. Такая геометрическая интерпретация удобна потому, что она способствует более глубокому физическо- му пониманию вопроса. Указанные представления широ- ко применяются и использовались при изучении одноос- ного и двухосного кристаллов, особенно Панчаратна- мом [3, 4]. Джонс [5] A941 г.) рассмотрел заново задачу о моно- хроматическом (и, следовательно, полностью поляризо- ванном) излучении и ввел при этом матричные методы. Вместе со своими сотрудниками он успешно проанализи- ровал полностью поляризованные волновые поля, опери- руя с составляющими поля и описывая прибор с помощью комплексной B X 2)-матрицы х). Но сами составляющие поля излучения не могут быть наблюдаемы на высоких (оптических) частотах. Учитывая это, Мюллер (см. [6]) использовал параметры Стокса, которые, как мы увидим, могут быть измерены в поле излучения. Параметры выхо- дящего поля были затем получены следующим образом: прибор представляется действительной D X 4)-матрицей (матрицей Мюллера), которая действует на четыре пара- метра Стокса, представленные в виде четырехэлементно- го векторного столбца (вектора Стокса), и дает вектор Стокса для выходящего поля. В более современной трактовке частичной поляриза- ции (и частичной когерентности) используются представ- ления о корреляционных функциях и «когерентных матри- цах», которые впервые были введены Винером [8], а за- тем Вольфом [9]. В дальнейшем Вольф [10] подчеркнул необходимость однозначной связи удобного (комплексно- го) представления с реальным полем и указал на пригод- J) B X 2)-матрицей называется матрица, содержащая две строки и два столбца.— Прим. ред.
Теория частичной поляризации 199 ность в этом смысле аналитического сигнала. Позже Пар- рент и Роман [11] установили формальную аналогию между когерентной матрицей поля и матрицей плотности в статистической квантовой механике. Они применили метод когерентных матриц к некоторым специфическим оптическим приборам, и в квазимонохроматическом слу- чае вывели закон преобразования когерентной матрицы, сформулированный с использованием приборных опера- торов. Теперь мы более подробно рассмотрим различные мето- ды, о которых вскользь говорилось выше. При этом мы будем придерживаться определенной схемы (такой схемы придерживался также Парк [7]). Именно, мы начнем с того, что представим поле в виде аналитического сигна- ла, введенного ранее в гл. 8. Запишем компоненты поля по осям х и у в типичной точке поля х в момент времени t в виде Ех (х, 0 ^ Е{;} (х, 0 -l iEg> (х, t) Вообще говоря, работа приборов зависит от частоты излу- чения. Они будут по-разному реагировать на различные по частоте фурье-составляющие поля. Но мы ограничимся квазимонохроматическим приближением. Тогда можно показать (Вольф [10]), что реакция прибора будет такой, как если бы на составляющие поля по осям х и у оказы- валось такое же действие, как и на среднюю частотную фурье-составляющую. Следовательно, в данном прибли- жении все величипы, зависящие от частоты, можно вычис- лять на средней частоте v и непосредственно воздейство- вать не на отдельные соответствующие частотные фурье- составляющие поля, а на компоненты поля по осям хну. В § 2 на конкретпом примере рассматривается метод Джонса. В § 3 вводится метод когерентных матриц. Затем в § 4 излагается метод Мюллера с использованием понятия сферы Пуанкаре. Наконец, в § 5 мы рассмотрим несколько специальных случаев частичной поляризации, представ- ляющих определенный интерес,
200 Глава 9 § 2. Метод Джонса Как уже было сказано ранее, мы рассмотрим здесь чисто монохроматические (и, следовательно, полностью поляризованные) поля. Мы ставим в соответствие полю (см. фиг. 9,1) приходящей плоской монохроматической волны вектор %, записываемый в виде двухэлементного столбца: Ех Здесь Ех и Еу — временные гармоники, т. е. величины, зависимость которых от времени имеет вид ехр (—i2nvt), где v — частота. Заметим, что действительная и мнимая части такого выражения сопряжены по Гильберту и, сле- довательно, его можно считать аналитическим сигналом. (Таким образом, аналитический сигнал — это естествен- ное обобщение представления, которое давно использова- лось для монохроматических полей.) Введем приборный оператор L, который имеет вид а Ъ с d где а, Ь, с и d — его возможные матричные элементы. Тогда поле на выходе прибора можно легко получить путем матричного умножения: g' = Lg. (9.3) Пример. Пусть иа компенсатор (четвертьволповую пластинку), ось наименьшей скорости которого направле- на вдоль оси х, падает плоскополяризованный параллель- ный луч света с плоскостью поляризации, составляющей угол 45° с осью х. Мы хотим получить поляризационные характеристики выходящего светового пучка. Сначала в соответствии с выражением (9.1) представим приходящий пучок в виде двухкомпонентного вектора
Теория частичной поляризации 201 где постоянная а включает в себя амплитуду и временной гармонический множитель ехр (—i2nvt). Так как теперь компенсатор не смешивает составляющие поля по осям х и у, то матричный оператор L [выражение (9.2)] должен х' Ось наименьшей скорости х Ось наибольшей скорости Ф и г. 9.2. быть диагональным. Кроме того, он изменяет только фазо- вый сдвиг между компонентами поля. Следовательно, мы имеем ?г26 О ИЛИ JL -— О О ,-гб (9.4) Из соображений симметрии мы выберем последнее выра- жение. Такой компенсатор будет создавать для компонент по осям х ж у относительный фазовый сдвиг 26. В част- ности, при б = я/4 оператор L будет представлять четверть- волновую пластину и в соответствии с законом преобра- зования (9.3) мы получим соотношение которое дает нам поле на выходе (фиг. 9.2). Двухэлемент- ный вектор %' ясно показывает, что г/-компонента запаз-
202 Г л а в а 9 дывает по фазе на я/2 относительно z-компоненты. Сле- довательно, поле на выходе поляризовано с правым вра- щением х). Полная интенсивность поля на входе и поля на выходе, очевидно, равна г |р 12 _| 1/7 12 I /7' 'i 12 | Чтобы получить операторную матрицу L системы N при- боров, расположенных последовательно, необходимо про- сто перемножить N операторов (L^L^.! . . . L^Lj). Поле на выходе легко получается по формуле (9.3). Таким образом, поставленная задача решается очень просто и изящно. Правда, монохроматические (полностью поля- ризованные) волновые поля являются лишь математиче- ской идеализацией. При анализе более соответствующего действительности квазимонохроматического приближения для поля излучения мы сразу же видим, что двух компонент поля, входящих в выражение (9.1), недостаточно для исследования частично поляризованных (или в крайнем случае неполяризованных) волновых полей. Поэтому приходится переходить к более высокому порядку пред- ставления поля. Один из вариантов такого представления мы укажем в следующем параграфе. § 3. Метод когерентных матриц В качестве примера мы рассмотрим сначала (естествен- ное) иеполяризованное квазимонохроматическое поле излу- чения. Под неполяризованным мы понимаем поле, для которого положение электрического вектора является неопределенным. Это означает, что все его направления в плоскости ху равновероятны. Иначе говоря, при дли- тельном наблюдении за его проекцией на ось х проекция окажется положительной столько же раз, сколько и отри- цательной; то же самое можно сказать и относительно проекции вектора на ось у. Следовательно, при усрсдне- х) Поле принято называть поляризованным с правым враще- нием, когда конец электрического вектора описывает окружность в направлении движения часовой стрелки, если смотреть в направ- лении, в котором приходит свет ([11], стр. 27),
Теория частичной поляризации 203 нии за достаточно продолжительное время мы можем ожи- дать, что (9.6) где угловые скобки обозначают усреднение по времени. Интенсивность же обеих компонент всегда положительна, так что интенсивность, усредненная по времени, не равна нулю. Мы можем ожидать, что средние значения интенсивно- сти х- и ^-компонент будут равны друг другу, т. е. (ЕХЕ1) = {EvEl). (9.7) Кроме того, в нашем примере х- и ^-компоненты некор- релированы и, следовательно, в среднем (ЕХЕ') = О = (Е„ЕЯ), (9.8) ибо они имеют нулевые средние значения 1см. выражение (9.6)]. Корреляционные функции, представленные выра- жениями (9.7) и (9.8), весьма удобно считать элементами B X 2)-матрицы 1 Г1 °1 4о 1J' (9>9) где / — полная интенсивность, т. е. //77 /7*\ 1 / /7 77*\ Матрица в выражении (9.9) называется когерентной матри- цей, описывающей неполяризованное поле излучения. Она просто равва единичной матрице с постоянным мно- жителем. Теперь мы дадим математическое представление (ква- зимонохроматического) поля, основанное на когерентной матрице. Рассмотрим квазимонохроматическую световую волну со средней частотой v, распространяющуюся в по- ложительном направлении оси z. Пусть Ех (t) = a, (t) exp [i {ф1 (t) - 2nvt}\, (9.10) Eu (t) ¦-= аг (t) exp [i {ф2 (t) - 2jiv/] ]
204 Глава 9 представляют собой две взаимноортогональные компоненты в точке поля х в момент времени t (см. [12], стр. 541). Сле- дуя г) Парренту и Роману [11], мы теперь определим когерентную матрицу J как произведение (Ех E%){ExEy-)l[Jxx Jxv (Еу Ех) (Еу El)] \_JyX Jyy В этом выражении Ех и Еу — элементы двухэлементного вектора-столбца $ [формула (9.10)]. Матрица g+ — эрми- тово сопряженная относительно матрицы %, т. е. одно- рядная матрица Знак X означает перемножение по Кронекеру (прямое произведение) $ и $^ в выражении (9.11), тогда как угло- вые скобки, как и прежде, обозначают усреднение по вре- мени. Если пучок света проходит через прибор, описываемый матрицей L, то $' = L$, (9.12) и поэтому когерентная матрица J' интенсивности выходя- щего пучка имеет вид откуда, используя выражение (9.11), получаем J' = LJLt. (9.13) Это закон преобразования когерентной матрицы в квази- монохроматическом приближении. Очень полезно рассмотреть с точки зрения метода коге- рентной матрицы пример, указанный в § 2. В этом частном случае операция усреднения по времени в определении когерентной матрицы (9.11) может быть опущена, так как поле, падающее на четвертьволновую пластинку, является совершенно монохроматическим. х) Мы отклоняемся от первоначального определения когерент- ной матрицы, данного Вольфом, просто ради единообразия изложе- ния.
Теория частичной поляризации 205 По определению [выражение (9.11)] когерентная матрица для падающего луча есть матрица Матрицу L для компенсатора можно получить из выра- жения (9.4) при 6 = -j- я/4. Используя закон преобразо- вания, представленный выражением (9.13), мы получаем когерентную матрицу для поля на выходе J' = LJLt = r/ Г . \а\Л J jMe егя/4 0 е- == 0 -гя а 2 -г 1 в виде когерентной матрицы для поля излучения, поля- ризованного с правым вращением. Полную интенсивность поля можно просто получить как след когерентной матрицы: т сп т — т хт 1 — »р J — J xx T •> уу В нашем примере полная интенсивность равна как для входящего, так и для выходящего пучка в соответ- ствии с выражением (9.5). Степень поляризации Р можно определить как отно- шение интенсивности поляризованной части излучения ¦Люляр к полной интенсивности /П0Лн, т. е. D •'поляр •* полн Читателя, интересующегося подробностями вычислений, мы отошлем к книге Борна и Вольфа [12]. По апалогии с теорией частичной когерентности мы можем определить нормированную функцию взаимной корреляции цху как Jxy •'XX У VV
206 Глава 9 (с помощью неравенства Шварца можно показать, что [ ц.х?/|< 1). Иными словами, мы считаем, что поле образовано путем когерентного сложения двух полей: одного — полностью поляризованного в направлении х, и другого — полностью поляризованного в направлении у. Как показали Паррент и Роман [11 ], степень поляризации можно тогда определить как максимальную модуляцию \ixy по отношению к вращению выбранной системы коор- динат относительно оси z. Формула для определенной таким образом степени поляризации имеет следующий вид [10]: где det J — определитель когерентной матрицы J. Выра- жение для Р инвариантно относительно вращения, так как det J и Sp J не зависят от выбора осей х и у. Мы видим, что степень поляризации естественного излучения, соот- ветствующая когерентной матрице (9.9), равна нулю. Для когерентных же матриц (9.14) и (9.15), которые опи- сывают монохроматические волновые поля, Р = -\- 1. При определении Р как максимальной модуляции цху видно, что 0<Р<1. Прежде чем закончить данный параграф, напомним, что когерентная матрица, описывающая частично поля- ризованное волновое поле, является эрмитовой. Матрица J представляет собой B X 2)-матрицу и, следовательно, содержит только четыре независимых действительных параметра. Эти четыре параметра могут быть определены экспериментально и полностью характеризуют поле. Преж- де всего заметим, что интенсивность — такой параметр, который можно наблюдать в любом эксперименте. Интен- сивность /' выходящего луча можно найти с помощью закона преобразования (9.13): Г = Sp J' = Sp [LJLt] = Sp [(LtL) J]. (9.17) Рассмотрим в качестве примера такой поляризатор, как призма Николя, которая пропускает только одну компо- ненту поля, скажем, составляющую угол 9 с направле- нием оси х. Таким образом, призма Николя может быть
Теория частичной поляризации 207 представлена в виде проекционного оператора Р(9) = cos2 9 sin 9 cos 91 sin 9 cos 9 sin2 9 (9.18) который является эрмитовым и дает проекцию jf-поля в направлении 9. Проекционные операторы удовлетворя- ют условию Р(8)Р(8) = Р(8). Если естественное неполяризованное излучение [выра- жение (9.9)] падает на призму Николя, то интенсивность /' выходящего поля можно найти с помощью выражения (9.17). Результат таков: Как мы видим, при этом передается только половинное значение начальной интенсивности. Теперь рассмотрим промежуточный случай, когда когерентная матрица луча подобна матрице (9.11). Если луч падает на поляризатор, ориентированный таким обра- зом, что 9 = 0, то мы имеем r = Sp[P(O)J]=/xx. (9.19) Таким образом, измеренное значение интенсивности /' дает нам величину параметра Jxx в выражении (9.11). Аналогичным приемом получаем выражение для ^-ком- поненты: [(f) j]=Jyu. (9.20) Далее, нетрудно показать, что /' = Sp [Р (-J) J] =4" I^H- Поэтому, если мы рассматриваем последовательность приборов, описываемую зависимостью
205 Глава У где С — компенсатор (9.4), то приходим к следующему выражению: ^ (9.22) В этом выражении оператор С (—я/4) соответствует ком- пенсатору С (-{-я/4), повернутому на я/2 относительно оси z (см. Мэретей [13]), т. е. оси наибольшей и наимень- шей скорости компенсатора меняются местами 1). Таким образом, выражения (9.19) — (9.21) показывают, что для определения четырех параметров /хж, Jyy, Re Jxy и Im Jxy когерентной матрицы необходимо измерить только четыре интенсивности. Имеется целый ряд способов измерения элементов когерентной матрицы, из которых мы указали только один. Таким образом, при методе когерентных матриц состо- яние поля и характеристики прибора описываются B X X 2)-матрицами, в общем случае имеющими комплексные элементы. В следующем параграфе мы дадим другой метод, метод Мюллера, при котором состояние поля описывается векторным столбцом (вектором Стокса), имеющим дейст- вительные составляющие, а характеристики прибора — D X 4)-матрицей (матрицей Мюллера), все элементы кото- рой действительны. § 4. Параметры Стокса и метод Мюллера Для удобства и для единообразия мы опять начнем с элементов когерентной матрицы. На этот раз определим векторный столбец с помощью формулы ~ J хх~ J ху ух (9.23) х) Главные оси эллипса поляризации называются наибольшей и наименьшей осями или осью наибольшей и осью наименьшей ско- рости.— Прим. ред.
Теория частичной поляризации 209 где звездочка означает комплексное сопряжение. Элементы ^ в формуле (9.23) те же самые, что и элементы когерент- ной матрицы. Еще одно преимущество описываемого мето- да достигается с помощью такого унитарного преобразова- ния в четырехмерном пространстве, при котором все новые элементы действительны. Мы можем записать S = T^, (9.24) где Т — унитарная х) матрица. Записывая полученную формулу в развернутом виде, мы приходим к следую- щему выражению: 0 0 1- 0 0-1 1 1 0 0J Si LS3J rl 1 0 L0 -i i xy ух -•'ни - (9.25) Определенные таким образом новые элементы называются параметрами Стокса, и они все действительные. Подобно когерентной матрице четыре параметра Стокса полностью характеризуют состояние поля. Найдем теперь закон преобразования параметров Сток- са в том случае, когда свет проходит через физический прибор. Обращаясь к выражению (9.12), мы видим, что ?' -(g'xg'*> = <LgyL*g*); или f-(LxL*)/. Здесь мы использовали соотношение (АА' X ВВ') - (А X В) (А' X В'), где А, А', В и В' — матрицы, а знак X означает их кронекеровское перемножение. Далее, используя мат- рицу преобразования Т [выражение (9.24)], мы легко установим, что S' = Tf =. Т (L X L*) TlTf = [T (L X L*) T] S, х) Матрица Т не совсем унитарная, так как нами был опущен постоянный множитель i /~\/2. Это было сделано для того, чтобы определение параметров Стокса, соответствующее выражению (9.25), совпало с обычным определением (Стоке, 1852 г.).
210 Г л а в а 9 или, определяя матрицу Мюллера М как M = T(LxL*)T, получаем S' = MS. (9.26) Мы предлагаем читателю самому решить пример, данный в § 2, с помощью метода Мюллера. Укажем только, что матрица Мюллера См F) для компенсатора С F), (9'27) может быть составлена на основе выражения (9.26). Она имеет следующий вид: Г1 0 0 0 - 0 10 О О 0 cos26 -.sin 26 LO 0 sin 26 cos 26 J (9.28) Для сравнения мы приводим в табл. 9.1 вектор Джонса g, когерентную матрицу J и вектор Стокса S для специаль- ных случаев совершенно монохроматических волновых полей при определенных состояниях поляризации. Для удобства в таблице опущены нормирующие множители. Если поле описывается с помощью параметров Стокса, то общая интенсивность дается элементом So, так как из выражения (9.25) следует, что So = Jxx + Jyy. Степень поляризации может быть выражена через параметры Стокса. Для этого мы просто подставим соответствующие величины из выражения (9.25) в выражение (9.16) и тогда получим р__ | 29) При измерении параметров Стокса необходимо сле- довать сказанному в § 3. В соответствии с выражением (9.25) параметры Стокса линейны относительно элементов когерентной матрицы. Поэтому их можно определить как линейные комбинации четырех измеряемых интенсивно- стей (9.19) - (9.22).
Теория частичной, поляризации 211 Таблица 9.1 Состояние поляризации Плоскость поляризации в направ- лении X Плоскость поляризации в направ- лении у Плоскость поляризации под уг- лом 45° к оси х Плоскость поляризации под уг- лом 135° к оси х Поляризация с правым вращением Поляризация с левым вращением [-1] [J] to-i о oj ГО 01 Lo l J L-i I] L.V.] Для полностью поляризованного волнового поля Р = = +1, и тогда в соответствии с определением, данным сте- пени поляризации [выражение (9.29)], мы можем записать О2 О2 I O2 t O2 Полученное соотношение представляет собой урав- нение сферы (в стоксовом подпространстве S,, S2 S3),
212 Глава 9 радиус которой равен полной интенсивности So. Такая сфера называется сферой Пуанкаре х). Для частично поля- ризованных волновых полей радиус сферы равен Ps0, а для неполяризованного (естественного) излучения сфера сжимается до нулевого радиуса. Каждой точке на этой сфере соответствуют определенные значения параметров Su S2, S3 и, следовательно, определенное состояние поля- ризации. На фиг. 9.3 показана единичная сфера в стоксо- вом подпространстве (Si, S2, S3). На этой сфере симво- лически изображены состояния поляризации, указанные в табл. 9.1. На примере, рассмотренном в § 2, мы видели, что изоб- ражающая точка на сфере Пуанкаре для падающего луча имеет координаты (О, +S2, 0). После прохождения через компенсатор (четвертьволновую пластину) выходящий 1) Сферу Пуанкаре обычно строят с радиусом, равным единице, и анализируют состояния поляризации, не связывая их со значе- нием полной интенсивности.
Теория частичной поляризации 213 луч имеет поляризацию с правым вращением. Иными словами, как было отмечено в § 1, изображающая точка перемещается по сфере Пуанкаре в новое положение с координатами (О, О, +53). Очевидно, что компенсатор с осью наименьшей скорости, совпадающей с направле- нием х, вызывает вращение относительно оси Si в стоксо- вом подпространстве. Об этом можно заключить и на основании формы матрицы Мюллера См в выражении (9.28). В качестве другого примера такого вращения в стоксо- вом подпространстве мы рассмотрим вращатель R @). Это такое физическое устройство, которое вызывает вра- щение плоскости поляризации. Матрица, описывающая подобный вращатель, имеет вид R@) = rcos6 -sin6l . (9.30) [sin 6 cos0 J Соответствующую матрицу Мюллера RAf можно полу- чить с помощью выражения (9.26). Она имеет следую- щий вид: rl 0 0 0-1 0 cos20 —sin26 0 0 sin 26 cos 26 0 L0 0 0 U Таким образом, поворот плоскости поляризации относительно оси z на угол 0 вызывает поворот относи- тельно оси S3 в стоксовом подпространстве на угол 20. Читателя, желающего подробнее ознакомиться с этим замечательным свойством сферы Пуанкаре (или, вернее, стоксова подпространства), мы отошлем к диссертации Мэретея [13]. Прежде чем закончить данный параграф, мы сведем в табл. 9.2 характеристики некоторых хорошо известных оптических приборов. Освоившись, таким образом, с методами анализа про- блем, связанных с поляризованным или частично поляри- зованным светом, мы можем теперь остановиться на неко- торых интересных частных вопросах.
B X 2)-матрицы и матрицы Мюллера для некоторых оптических приборов Таблица 9.2 Тип оптического прибора Компенсатор: вводит относи- тельный фазовый сдвиг 26 Вращатель: вращает плоскость поляризации против направ- ления движения часовой стрелки на угол 6 относи- тельно оси z Поляризатор: поворачивает проекцию вектора поля % в направлении, составляю- щем угол а с осью х Поглощатель: цх и цу— коэф- фициенты поглощения в на- правлениях х и у; 1 т) =— (г]х -f- Цу) — средний коэффициент поглощения; е=у(т1ж — Цу) — полураз- ность коэффициентов погло- щения Bх2)-матрица IVе 0 г<Н„ _« 1_0 е J Г cos 6 — sin 61 RF)=Lsinfl cos 6 ! P(a) = Г cos2 a sinacosu"] L sin a cos a sin2 a J [e~""x 0 1 ^e Lo ''+eJ Матрица Мюллера Cyf F) ^= -10 0 0 - 0 10 0 0 0 cos 26 —sin 26 0 0 sin 26 cos 26 RM F) = X -1 0 0 0- 0 cos 26 —sin 26 0 0 sin 20 cos 26 0 .0 0 0 1_ \ cos 2a sin2o U" cos 2a cos2 2a sin 2a cos 2a 0 sin2a sin 2a cos 2a sin2 2a 0 _ 0 0 0 0_ ch 2e — sh 2e 0 0' — sh 2e ch 2e 0 0 0 0 10 0 0 0 1-
Теория частичной поляризации 215 § 5. Некоторые частные вопросы а) Вероятностная интерпретация собственных значе- ний оператора J. Когерентная матрица J [выражение (9.11I является эрмитовой, и, следовательно, всегда может быть найдена соответствующая унитарная матрица, кото- рая преобразует ее в диагональную. Ее собственные зна- чения kt и Х2 можно получить путем решения характе- ристического уравнения. Они имеют следующий вид: При приведении к диагональному виду когерентная матрица записывается таким образом: А,! 01 о J- <9-31) В этом параграфе мы сначала дадим вероятностную интер- претацию когерентной матрицы, представленной выраже- нием (9.31). Когерентную матрицу диагональной формы [выражение (9.31)] можно переписать так: *i 01 , 1 ГО 0 I ~f~ ^2 Л1 + Л2 0 0 ^i + ^2 0 h (9.32) Представив в таком виде частично поляризованный пучок, когерентная матрица которого равна JB, мы полу- чаем как бы некогерентную суперпозицию двух незави- симых полностью поляризованных пучков, относительная интенсивность которых равна %i и %2- Пучок 1 с когерент- ной матрицей «Гд* полностью поляризован в направлении х, а пучок 2 с когерентной матрицей 3$ полностью поляри- зован в направлении у. Чтобы дать вероятностную интерпретацию собственных значений \ и Я^, рассмотрим проекционный оператор, собственные состояния которого представляют собой х- и у-состояния поляризации. (Мы выбрали такой проек-
216 Глава 9 ционный оператор потому, что когерентная матрица выра- жена через компоненты поля по осям х и у.) Поляриза- тор, призма Николя [выражение (9.18)] с ориентацией 0 = 0 или 0 = зт/2, очевидно, является, прибором как раз такого типа. Допустим, что поляризатор Р @) [выра- жение (9.18)] расположен на пути пучка, описываемого когерентной матрицей (9.32). Заметим, что интенсивность и состояние поляризации — взаимно независимые свойст- ва пучка. Теперь предположим, что интенсивность умень- шается до такой степени, что от источника к поляриза- тору Р @) в среднем поступает только один «фотон». Вероятность того, что этот фотон пройдет через поляри- затор Р @), который допускает только ж-состояние линей- ной поляризации, равна Х1/(Х± + X2). Вероятность же того, что ни один фотон не будет пропущен, равна X^KXi + X2). Подобные же рассуждения можно провести и для поляризатора, ориентированного под углом 0 = я/2. Можно спросить, какова будет вероятностная интерпре- тация собственных значений в том случае, когда поляри- затор ориентирован под промежуточным углом 0, который не равен ни 0, ни л/2? Чтобы ответить на этот вопрос, мы должны сначала, как принято в квантовой механике, представить состояние поля в виде линейной комбинации собственных состояний поляризатора Р @) [выражение (9.18)]. Мы уже показали в соотношении (9.32), что исход- ный пучок можно рассматривать как результат некоге- рептной суперпозиции двух полностью поляризованных пучков, когерентные матрицы которых равны Jg' и J$\ Для полностью поляризованного пучка 1 мы можем, например, записать вектор Джонса в следующем виде: Это выражение можно рассматривать как линейную комбинацию собственных состояний Р F), а именно: ./—хг~Г1"! i/ZKZ -Г cose I/ i — 1/ 1 cog V 111 A v 1 I 1 vwu Г Л| ~р Ло U ^ "i ^2 —j—— Г sin 61 , 7, sin e ^1 + ^2 |_COS 0J (9.33)
Теория частичной поляризации 217 Здесь cos 6 — sin0 — нормализованные собственные состояния оператора Р @) с собственными значениями + 1 и 0. Здесь важно отметить, что прибор с оператором Р F) «интерпретирует» состояние поляризации пучка 1 как суперпозицию своих собственных состояний. Поэтому вероятность того, что «фотон» пройдет через Р @), можно найти, снова обра- тившись к методам квантовой механики. Она равна квад- рату модуля коэффициента в выражении (9.33), харак- теризующего состояние COS0 "I — sinGj ' которое пропускается поляризатором Р (9). Если фотон проходит с вероятностью (A,j cos2 0)/(^i + ^г)? т0 это зна- чит, что его состояние характеризуется матрицей cos 6 — sin ( Подобные рассуждения применимы также к пучку 2. Сначала мы запишем COS 6 • sin Г . — sin i flrsin0l c Тогда вероятность того, что через Р F) проходит фотон от пучка 2, равна (^2 sin2 0)/(^i + iz). Теперь предположим, что интенсивность исходного пучка уменьшилась настолько, что в среднем от источ- ника к поляризатору Р @) поступает только один фотон. Вероятность того, что фотон пройдет через Р @), равна
218 Глава 9 просто сумме вероятностей, только что вычисленных для пучков 1 и 2, а именно она равна \ , [Xt cos2 0 + Хо sin2 0]. + А2 ' Так получается потому, что исходный частично поляри- зованный пучок был представлен в виде некогерентной суперпозиции пучка 1 и пучка 2 [выражение (9.32)]. Следует заметить, что коль скоро фотон прошел через призму Николя, скажем Р @), у него уже вполне опре- деленное состояние поляризации, а именно такое собст- венное состояние оператора Р @), собственное значение которого равно -f~ 1. Поэтому такой «эксперимент» можно назвать «подготовкой состояния», ибо если этот фотон опять пройдет через Р @), то результат второго «эксперимента» можно предсказать с полной уверенностью. Второй экспе- римент можно назвать «измерением», проводимым на фото- не. Но если измерение выполняется с помощью поляри- затора Р @'), ориентированного под углом 0' Ф 0, то исход эксперимента может быть оценен только в вероятностном плане, так как прибор Р @') «видит» приходящий фотон в суперпозиции со своими собственными состояниями, хотя фотон был «подготовлен» и первоначально характе- ризовался определенным собственным состоянием опе- ратора Р @). Все сказанное выше справедливо для любого проекционного оператора, собственным состояниям кото- рого соответствуют диаметрально противоположные точ- ки на сфере Пуанкаре. Проекционные же операторы (а не какие-нибудь другие) мы рассматривали исключительно ради удобства. Вопрос об описании с помощью эрмитовых матриц таких оптических приборов, операторы которых не являются проекционными операторами, читатель может проанализировать самостоятельно. Теперь обратимся к понятию «энтропии» и посмотрим, какова его роль в теории частичной поляризации. Напом- ним, что в гл. 8 степень «беспорядка» в системе описыва- лась энтропией
Теория частичной поляризации 219 При вероятностной интерпретации собственных значений энтропия оказывается равной Что касается НШШ1 и Ямакс, соответствующих условию ^i + ^2 -- const s С\ (9.34) то очевидно (см. конец гл. 8), что #м„я = 0, когда kj^-C, к-, =-(), 1ф]. i, j ¦ 1, 2, //макс = log 2, когда Л,- — -rj- для всех t'--l, 2. В первом случае только одно из собственных значений не равно нулю. Поэтому НМИН =- 0 соответствует пол- ностью поляризованному волновому полю. Во втором слу- чае, когда Ямак0 = log N, оба собственных значения одинаковы, что соответствует неполяризованному волно- вому полю. Весьма показательно, что энтропия является также мерой степени поляризации волнового поля. б) Разложение J. Из выражения (9.32) мы уже видели, что диагонализированная когерентная матрица может быть представлена в виде суммы двух когерентных матриц. Действительно, любую когерентную матрицу хх J ху ijx J yy в общем можно разложить па два слагаемых таким обра- зом, что r1Ol ^ °], (9.35) d* с] где А, В и С — действительные положительные величины. Такое разложение не является единственно возможным. Но если наложить дополнительное условие вида
220_ Глава 9 то разложение типа (9.35) оказывается единственно воз- можным. При этих условиях любое частично поляризо- ванное квазимонохроматическое волновое поле можно рассматривать как некогерентную суперпозицию полно- стью неполяризованного волнового поля и полностью поляризованного монохроматического волнового поля. Идя таким путем, мы находим, что выражение для степени поляризации Р [соотношение (9.16)] можно получить так, как это показали Борн и Вольф ([12], стр. 548). Возможно и иное разложение матрицы J, с исполь- зованием спиновых матриц Паули. Оно возможно потому, что набор спиновых матриц Паули является полным. Алгебра этих матриц определяется следующими соотно- шениями: 0, а, 0 = 1, 2, 3, a^P, а — 2iay, a, p, y = 1, 2, 3 (и циклические перестановки), ,„ „„ а0, i = 0, 1, 2, 3, Gu { = 0, 1, 2, 3. Если взять след первого из этих соотношений и вос- пользоваться третьим соотношением, то можно показать, что Sp [GtGj] = 2бу, i, /-0, 1, 2, 3. (9.37) Для удобства будем пользоваться спиновыми матри- цами в следующем виде: Г1 01 Г1 0 1 ГО 1 Hoi ' Но-1 ' ff8= ю о г -i 0_ (9.38) Все матрицы (9.38) являются эрмитовыми. Теперь любую B X 2)-матрицу можно представить в виде линейной комбинации спиновых матриц Паули. Коэффициенты такого разложения определяются из выра- жения (9.37) для следа матрицы. Особый интерес представ- ляет разложение [14] когерентной матрицы J [формула
Теория частичной поляризации 221 (9.11)]. Мы запишем з J = y2 ^ (9-39) i=0 Чтобы определить коэффициенты St, умножим обе сторо- ны полученного выражения на Oj и возьмем след от обеих сторон. Используя выражение (9.37), получаем ], f = 0, 1, 2, 3. Например, при / — О мы имеем " 0 = •* хх ~Ь Jyy ¦ Таким путем читатель может убедиться в том, что коэф- фициенты разложения Si в выражении (9.39) действи- тельно представляют собой параметры Стокса. Напомним теперь, что при методе когерентных матриц приборные операторы оказываются B X 2)-матрицами. Следовательно, такие операторы также можно разложить по спиновым матрицам Паули. Например, для компенса- тора С F) [соотношение (9. 27)] и вращателя R F) [соот- ношение (9.30)] получаются следующие выражения: С(б) —<r0cos6-fiffjsine, R@) = ffocos0 + jff3sin0. (9.40) Естественно спросить, каким оптическим приборам соот- ветствуют спиновые матрицы Паули и каков физический смысл перестановочных соотношений (9.36)? (Подробно данный вопрос разбирается в диссертации Мэретея [13].) Мы уже видели в § 4, что компенсатор вызывает вращение в стоксовом подпространстве Ei, S2, S3) на угол 26 отно- сительно оси Si, а вращатель — на угол 20 относительно оси S3. Примем аргументы б и 0 в выражении (9.40) рав- ными л/2. Тогда получим С (-J) = i^, R(-?-) = iff3. (9.41) Постоянный множитель i = ein I 2 представляет собой просто фазовый множитель, который оставляет неизмен- ным фазовый сдвиг между компонентами поля по осям х и у. Таким образом, из выражения (9.41) следует, что спиновая матрица Паули аг соответствует компенсатору,
222 Глава У который вызывает вращение относительно оси Si в стоксо- вом подпространстве на угол л. Точно так же спиновая матрица а3 соответствует вращателю, который вращает плоскость поляризации относительно оси z на угол зт/2 и вызывает вращение относительно оси S3 на угол л. Предоставим читателю, который интересуется этим вопро- сом, доказать, что матрица Паули <т2 вызывает вращение относительно оси S2- В соответствии с формой выражений (9.41) на основе спиновой матрицы а2 можно построить матрицу опти- ческого прибора. Нетрудно показать, что такой новый прибор будет не чем иным, как компенсатором С, повер- нутым на угол 45° относительно оси z против часовой стрелки [13]. При такой интерпретации определение собственных состояний для Cj становится тривиальным. Поскольку оператор Cj вызывает вращение относительно оси Si, состояния поляризации, которые представляются точками с координатами (+ Si, О, 0) и (— Si, 0, 0) на сфере Пуан- каре, остаются неизменными с точностью до постоянного множителя. Поэтому х- и г/-состояния линейной поляри- зации являются собственными состояниями Cj. To же самое можно сказать о матрицах а2 и а3. Выясним теперь физический смысл перестановочных соотношений для спиновых матриц. Заметим сначала, что матрицы а; {]' — 1, 2, 3) — эрмитовы, а матрицы (iOj) — единичные матрицы с определителем, равным + 1. Теперь, подставив первое соотношение (9.36) во второе, мы получим или Отсюда явствует, что два прибора аа и стр, соединенных последовательно, действуют на любой, но квазимонохро- матический, пучок так же, как и один прибор <JV. Более того, из выражения (9.42) видно также, что вращение на угол л относительно оси S$ с последующим поворотом на тот же угол относительно оси Sa (a =/= C) эквивалентно единственному повороту на угол л относительно третьей оси стоксового подпространства. Наконец, третье соотно-
Теория частичной поляризации '228 шение в (9.35), а именно О\ = Со, просто показывает, что двойное применение оператора ©г (i = 1, 2, 3), который вызывает вращение па угол 2л относительно оси S{, эквивалентно умножению на еди- ничную матрицу. в) Интерпретация измерения интенсивности в сток- совом пространстве. Особенно интересен тот способ, кото- рым когерентная матрица введена Борном и Вольфом (см. [12], стр. 542). Мы дадим здесь только основные наметки. Возьмем любой (квазимонохроматический) пучок света, у-компонента которого отстает по фазе на е по отношению к ^-компоненте. Это означает, что пучок проходит через компенсатор Ге+гЕ/2 0 Интенсивность световых колебаний / (9, е) в направ- лении, составляющем угол 9 с направлением х, можно наблюдать, пропуская пучок через поляризатор Р (9) [выражение (9.18)]. Выражение для интенсивности / (9, е) выходящего пучка, полученное таким образом, имеет вид [12] / F, е) = Jxx cos2 9 + Jvv sin2 6 + + JxMe~ie sin 9 cos 9 + JyxeiE sin 9 cos 9, (9.43) или в более компактной матричной записи 'Jxx /г/Л Г cos 9 где величины Jxx, . . . представляют собой элементы коге- рентной матрицы J исходного пучка. Определим теперь оператор А для двух приборов С и Р, соединенных последовательно: l"cos29e^/2 sin9cos9e-iE/2l А = Р F) С (г) = ^g.n 9 cog Qe.E/2 gin2 Qe_.E/2 J .
224 Глава 9 Когерентную матрицу J' для выходящего пучка можно получить на основании закона преобразования (9.13). Мы находим J' = AJAf. Тогда интенсивность выходящего пучка равна 7F, e) = SpJ' = Sp[AJAt]==Sp[AtAJ]. Написав матрицы в полной форме, мы, наконец, получаем Г/ cos2 6 e~iEsin6cos6\ 'Р. е) = 4U sine cose sin*e Jx yx J yy Это выражение для наблюдаемой интенсивности, соответ- ствующее данному приборному оператору, хорошо согла- суется с общей формулой (9.17). Мы хотим показать на примере, что соотношение для следа матрицы вида (9.44) при методе когерентных мат- риц дает наблюдаемую интенсивность как «скалярное про- изведение» двух векторов в стоксовом пространстве. Выра- зим оператор (А+А) через спиновые матрицы Паули. Мы получим AfA ==-. <r0 -f (cos 28) ai -f (sin 26 cos e) cr2 — — (sin 26 sine) ff3, (9.45) тогда как разложение когерентной матрицы по спиновым матрицам имеет вид [выражение (9.39)] Свяжем теперь с оператором (AtА) «приборный вектор» jf-. Компоненты этого вектора в соответствии с выражением (9.45) равны 1, cos 26, sin 26 cos e, — sin 26 sin e. Далее, с приходящим пучком свяжем четырехкомпонентный век- тор Стокса S с компонентами 1/250, 1/251, 1/iS2, 1/2^3. Интенсивность выходящего луча получается как скаляр-
Теория частичной поляризации 225 ное произведение этих двух четырехкомпонентных век- торов: /(О, E)-J#-S. В матричной записи -1 2 1 T 1 2 1 2 So' 2 ^3 /(9, s)=^ :A cos 26 sin 20 cos e —sin 28 sine) Подставив сюда параметры Стокса, выраженные через элементы когерентной матрицы [формула (9.25)], легко убедиться в том, что это выражение приводит к правиль- ной формуле для интенсивности [формула (9.43)]. Таким образом, интенсивность выходящего пучка действительно может быть определена как скалярное произведение «при- борного вектора» и «вектора Стокса» светового пучка. На этом мы закончим изложение классической статисти- ческой оптики. Мы говорили здесь в основном о распро- странении электромагнитного излучения и о его свой- ствах. Более интересные с точки зрения физики вопросы испускания и обнаружения излучения следует рассмат- ривать на основе методов квантовой теории. лиглг лгу г а 1. Stokes G. G., Trans. Cambr. Phil. Soc, 9, 399 A852). 2. Poincare H., Theorie Mathemalique de la Lumiere II, Paris, 1852, ch. 12. 3. Pancharantnam S., Proc. Indian Acad. Sci., A44, 398 A956). A. Pancharantnam S., Memoirs of the Raman Research Institute, Banglore, India, No. 92. 5. J о n e s R. C, Journ. Opt. Soc. Am., 46, 126 A956). 6. Schurcliff W. A., Polarized Light: Production and Use, New York, 1962. 7. Park e III N. G., Journ. Math, and Phys., 28, 2 A949).
226 Глава 9 8. Wiener N., Acta Math., 55, 118 A930). 9. Wolf E., Nuovo Cimento, 12, 884 A954). 10. Wolf E., Nuovo Cimento, 13, 1165 A959). 11. P a r r e n t G., Roman P., Nuovo Cimento, 15, 370 A960). 12. Born M., Wolf E., Principles of Optics, New York, 1959. 13. M a r a t h а у A. S., Thesis, Boston Univ., 1963. 14. Fan о U., Phys. Rev., 93, 121 A954). 15. McMaster W. H., Am. Journ. Phys., 22, 351 A954); Rev. Mod. Phys., 33, 8 A961). 16. Walker M. J., Am. Journ. Phys., 22, 170 A954). 17*. Ш е р к л и ф ф У., Поляризованный свет, изд-во «Мир», 1965.
ПГИЛОЖЕПМЕ А РЯДЫ И ИНТЕГРАЛЫ ФУРЬЕ - БЕССЕЛЯ § 1. Ряды Фурье Разложение периодической функции в сумму гармоник хорошо известно [1, 10*], и мы не будем здесь подробно говорить о нем. Но для большей полноты содержания основного текста мы приведем некоторые из наиболее важных форм этого разложения. Если Р — период функции (в пространстве или во времени), то функцию часто представляют в виде / (я) =-у--j-2j (^" cos ncox + Bn sin пах), (A.I) где о) = 2jt/P — угловая частота. На основании ортого- нальности тригонометрических функций в интервале — Р/2<^х<^Р/2 коэффициенты Фурье можно записать в следующем виде: +Р/2 2 С Л„ = -^- \ / (х) cos пах dx, -Р/2 +р/2 (А.2) 2 С Вп-'=~~р~ \ f (x)sinnaxdx. -Р/2 Если / (х) — четная или нечетная функция, то один ряд коэффициентов, очевидно, исчезает. Иногда функцию / (х) удобно разложить на сумму таких гармонических составляющих, которые отличают- ся не только амплитудой, но и фазой. Тогда имеем оо -Ф„). (А.З)
228 Приложение А Чтобы определить Сп и срп, мы запишем cos(rccoa:— Фп) в виде cos nmx cos фп + sin шах sin фп и представим постоянные Сп и фп через коэффициенты выражения (А,1): Сп = t Bn (А-4) «Pn = arctg-^ . Затем мы заменим sin пах и cos пах показательными формами комплексных чисел, подставим их в выраже- ние (А.1) и перегруппируем соответствующие члены, чтобы получить / (*)=2 4"(Лп+Шп) е"Ыюх+41+ оо + 2у(^-»5п)е1ми. (А. 5) п=1 Весьма удобно ввести следующие обозначения: iBn), (A.6) 0 ~~ ~ ' так что выражение (А. 5) можно записать в более ком- пактном виде + 00 f(x)= 2 Впе*™*, (АЛ) П=—оо где +Р/2 Dn = ^r J f{x)e-i™*dx. -Р/2 Необходимо заметить, что коэффициенты Ап и Вп — дей- ствительные, а коэффициенты Dn в общем случае явля-
Ряди и интегралы Фурье — Бесселя 229 ются комплексными величинами. Далее, при переходе к (А.7) область суммирования в первом члене выражения (А.5) должна быть расширена, так чтобы в нее вошли fix) td—т-i-r Р_ 4 ? г ъ0 ь, Фиг. АЛ. отрицательные целые числа. Наконец, последний шаг непосредственно следует из условия ортогональности + Р/2 еЦп-т)ах = 6„ -Р/2 или косвенно из выражения (А.6), которое при некоторых обстоятельствах можно решить относительно величин Ап и Вп. В качестве примера мы определим коэффициенты Фурье для теста Фуко (последовательности черных и белых линий), который часто используется для измерения харак- теристик оптических приборов (фиг. А.1). Прежде всего заметим, что функция — четная, так что Вп = 0. Затем мы видим, что Дополнительно Р/4 Р/2 4 С 4 (* Ап = -р- \ bi cos пых dx + -р- \ Ьг cos пах dx О Р/4
230 Приложение А ИЛИ I 0 при п четном, п = -I ( А п = -I 2 (Ь, — Ъ?) . пк гая пк прИ п нечетном. 2 г Теперь, вводя для образца величину «контраста» С, равную отношению F4 — Ь2)/2 к 60, т. е. отношению пере- менно!"! и постоянной составляющих, мы получаем f(x) — bo\ 1 -\ ( c , COS (ИХ 7T- COS 3CO? я V 3 4- -^- cos bu>x . . . \ \ , (А.8) где § 2. Интеграл Фурье При переходе от рядов Фурье к интегралу Фурье [2, 11] удобнее всего исходить из формы выражения (А.7) и рассматривать непериодическую функцию как периоди- ческую, а затем перейти к пределу при Р ->- оо. В таком случае мы получаем некоторую свободу в выборе постоян- ных, появляющихся в конечном соотношении для преобра- зования Фурье. При различном подходе к выбору постоянных имеются свои преимущества и свои недостатки. Мы полагаем удобным здесь выбрать постоянные таким образом, чтобы при интегрировании по частоте, т. е. при наличии dco, всегда появлялся множитель 1/2п. Запишем теперь выражение (А.7) в следующем виде: -Р/2 (A.9)
Ряды и интегралы, Фурье — Бесселя 231 где мы отождествили основную частоту coj == 2п/Р со спек- тральным интервалом Асо. Теперь перейдем к пределу для этих выражений (предполагая, что он существует) при Р->со и при гсДсо, стремящемся к текущей пере- менной со. Далее мы определим спектральную плотность функции g(co) как HmBnZ)n/co1). В результате получим Р->оо /(a^jL f g(co)eia3Cdco, g(w) = \ f(x)e~iaxdx. (A.10) — oo — oo Говорят, что в таком виде / (х) и g (со) представляют собой пару1) преобразований Фурье. Весьма просто пока- зать, что выполняется соотношение ортогональности f ei«0-0)')*d2-^2jT6(C0-C0'). (A.ll) § 3. Теория преобразования Фурье для двумерного случаи Формально все полученные результаты могут быть распространены и на случай двух (или более) измерений. Мы приведем здесь наиболее важные соотношения. Для двумерного случая комплексные ряды Фурье можно запи- сать в следующем виде: i(x,y)--- ^ 2 Z?mne2«'('»*/p.*H<ny/p1,\ (A.12) -1) Изложению строгой теории преобразований Фурье посвя- щена обширная литература. Наиболее важным результатом этой теории является то, что любой квадратно интегрируемой функции / (х) соответствует квадратно интегрируемое преобразование Фурье g (со), которое почти всюду оказывается единственным. Преобразо- вание Фурье от функции g (со) является функцией, которая почти всюду равна / (х). Так как большинство функций, встречающихся в физике, квадратно интегрируемы, то эта теорема и следствие из нее удовлетворяют большинству применений (см., например, [8]). Возможность применения преобразований Фурье к б-функции и подобным функциям может быть обоснована с помощью теории распределения (см., например, [9]).
232 Приложение А где + Рх/2 +Ру/2 Ann = -p4- \ \ f(x, Р/2Р/2 -Рх/2-Ру/2 При переходе к двумерному интегралу Фурье получаются следующие выражения: ^ и — оо +« (Л. 13) g (co.v, ыу) =-^1 (х, у) е~Шг dx dy, — 15О где о)-г — скалярное произведение ахх -) со^г/. Имеется одно важное соотношение, на котором сле- дует остановиться более подробно. Допустим, что мы преобразуем (а>х, соу) и (х, у) к полярным координатам (со, ф) и (г, 8). Предположим далее, что f (г) я g ((^обла- дают круговой симметрией (как часто бывает в оптике), так что интегралы не должны зависеть от 0 и ф. При таких условиях выражение (А.13) приводится к виду / (г) = -^ \ \ g (CO) e«Breos(9-<p) СО ЙСО dq>, о о со 2л (А.14) g (со) = ^ [ f (r) e-torcos(e-<p),. ^r ^е. о о Напомним, что существует известная связь между экспо- ненциальными функциями и функциями Бесселя: оо ep/2[t-(i/t)]= 2 Jn(p)t'1. гг=—оо Тогда, полагая ^ = ieli-Q~t\ можно получить интерес- ное соотношение + ОО >) = 2 inJn (p)einW-f\
Ряды, и интегралы Фурье — Ьесселн 233 Интегрируя обе стороны по 0 от 0 до 2я, мы полу- чаем интеграл, представляющий собой функцию Бесселя нулевого порядка: 2я Таким образом, при наличии круговой симметрии дву- мерные преобразования Фурье, описываемые выраже- ниями (А. 13), сводятся к одномерному преобразованию Бесселя: / (г) = -^ ^ g И /о Ю оз da. о (А.15) § 4. Теорема свертки С преобразованием Фурье связано несколько интерес- ных теорем. Наиболее важной из них можно считать теорему свертки, которая касается преобразования произ- ведения двух функций. Здесь мы будем говорить лишь об одномерных функциях времени, но ясно, что получен- ный результат может быть непосредственно применен (как здесь, так и во всем тексте книги) и к двумерным пространственным функциям. Итак, рассмотрим интеграл Подставляя вместо функций fi (t) и fz(t) их значения, выраженные в виде интегралов Фурье от величин Ft (м) и F2(a>), мы получаем F (со) = -j^- \\\Р, (у) Fz (a) e-i«o-v-a)t dy da dt. (A.17)
234 Приложение А Интеграл по t является интегральным представлением 6-функции, так что cr. (A.18) Интегрируя по у и пользуясь фильтрующими свойствами 6-функции, мы, наконец, имеем I U (*) U (t) е~ш dt = -^ J Fl((o-o)F2((y)do. (A. 19) Это соотношение известно как теорема свертки для преоб- разования Фурье от произведения двух функций. Сле- дует иметь в виду, что между интегралом свертки и конеч- ным корреляционным интегралом имеется различие [3]. В интеграле свертки одна из функций свернута и затем смещена. Для временных фильтров, например, где должно быть выполнено условие физической осуществимости, это весьма существенное обстоятельство. Но в оптике во мно- гих случаях функции оказываются симметричными, и по- этому указанное различие не играет роли. Если мы перейдем к использованию комплексных функций, то выражение (А. 19) примет следующий вид: ^ I Л(и + <г)^((г)йст. (А.20) Особый случай теоремы перемножения комплексных функций встречается, когда со = 0. В этом случае мы полу- чаем теорему Парсеваля ±- I Fi (о) Ft (о) do. (A.21) Далее, если fi(t) = f2(t), то -[-оо -f оо 0. (А.22) Это выражение часто имеет значение принципа сохра- нения. В теории оптической дифракции, например, оно соответствует тому факту, что все лучи, проходящие
Ряды, и интегралы Фурье — Бесселя 23о через апертуру, в конечном итоге проявляются в распре- делении освещенности в дифракционном пятне. В кван- товой механике оно выражает закон сохранения вероят- ности. § 5. Теорема о дискретном представлении Хотя теорема о дискретном представлениих) исполь- зовалась ранее Виттакером в теории интерполяции, в сов- ременную теорию связи ввел ее Шеннон. По существу, F(w) Fv(w) -2nR О 2жЯ Ф и г. А.2. в теореме о дискретном представлении идет речь о точной подгонке кривых для функций, предельные фурье-частоты которых симметричны относительно нулевой частоты. Мы докажем теорему о дискретном представлении и в то же время покажем, какое применение находит теорема свертки. Поскольку нас интересуют в основном оптические явления, целесообразно перейти от координаты времени t к координате х в качестве независимой переменной, изме- ряемой, например, в миллиметрах. Теорема о дискретном представлении гласит следующее: «Если функция / (х) не содержит частот, больших, чем В периодов на 1 мм, то она полностью определяется путем задания ее ординат в последовательных точках, отстоящих в пространстве друг от друга на расстоянии 1/2Й мм». При доказательстве этой важной теоремы мы будем рас- сматривать спектр функции / (t) как произведение перио- дической функции Fp (со) и одиночного прямоугольного импульса rect со, так что F (со) = Fp (со) rect со удовлетворяет условиям теоремы о дискретном представлении (фиг. А.2). х) В советской литературе по теории связи эта теорема известна под названием теоремы Котелышкова.— Прим. ред.
236 Приложение А Тогда мы получаем для / (х) + 00 /(Ж) = _!_ [ F (со) rect cuei0MC dco. (A.23) — ОО Так как Fp(w)— периодическая функция, то + <Х, Fp(a)= 2 Z>ne-i<ru°/2K>, (A.24) где 4-2яЛ -2яЯ +0О + = _i_ Г /Г (щ) еКп — оо (А.25) Теперь подставим это значение Dn в выражение (А.24), а затем то, что получится,— в выражение (А.23): if) S rect ие«*-(»/2Н)в>] d(D. (A.26) Преобразование Фурье для прямоугольного импульса хорошо известно и в конечном итоге дает +оо t(T\— ^ if п /И- 2j / VB Проще говоря, в теореме о дискретном представлении утверждается, что отправителю, находящемуся в Фила- дельфии и желающему передать сообщение / (х) в Бостон, не нужно передавать полностью все значения кривой, а достаточно передать только ординаты кривой, отстоя- щие друг от друга на расстоянии 1/2R. Если и отправи- телю, и получателю известна ширина спектра сообщения, то получатель в Бостоне может затем воспроизвести
Ряды и интегралы Фурье — Весселя 237 в совершенствег) первоначальное сообщение, построив функции sin х/х с центром в каждой из дискретных орди- нат. Из периодичности функции sin х/х видно, что такие функции дают вклад в сумму только в тех точках, в кото- рых они построены. Представление в виде ряда Фурье Ф и г. А.З. просто подчеркивает, что изменения кривой за интер- валы, меньшие 1/2Й, невелики (фиг. А.З). В двумерном случае для теоремы о дискретном пред- ставлении нетрудно получить следующее выражение: 2R,, X X sine BnRxX —- пл) sine BnRyy — гея), (А.28) где символом sine x обозначена функция sin х/х. В оптике во многих случаях функции и их спектры обладают кру- говой симметрией. Теорему о дискретном представлении для таких случаев доказали Габор [6] и Гамо [7]. Прежде чем закончить данный параграф, скажем несколько слов о терминологии. На протяжении всей книги термин корреляция использовался для обозначения средней величины, взятой по времени, пространству или г) Читатель должен иметь в виду, что на самом деле такое упро- щенное представление противоречит самому духу теории информа- ции. Дело в том, что передача каждого сообщения сопровождается шумом. Поэтому следует учитывать не только ограниченность поло- сы пропускания, но и степень, с которой эти случайные флуктуации ослабляют возможности получателя различать одну дискретную ординату от другой, соседней.
238 Приложение А по ансамблю. Термин же свертка применялся тогда, когда мы имели дело с преобразованием Фурье от произ- ведения двух функций. В случае действительных функций здесь не может быть двусмысленности. Но мы поль- зуемся термином свертка и для комплексных функций, хотя в действительности свертки функций в этом слу- чае нет, как видно из выражения (А.20). Поэтому начиная с гл. 5 и далее по всей книге передаточная функция при некогерентном излучении описывается как автосвертка комплексной функции апертуры. Наконец, при выводе всех выражений, включая и те, где опреде- лялись предел разрешения и интервалы отсчета, пред- полагалось, что мы имели дело с воздушной средой. Если это не так, то необходимо во все выражения, в кото- рые входит числовая апертура, ввести показатель пре- ломления среды. ЛИТЕРАТУРА 1. Р i p e s L. A., Applied Mathematics for Engineers and Scien- tists, New Jork, 1958. 2. Papoulis A., The Fourier Integral and Its Applications, New York, 1962. 3. Lee Y. W., Statistical Theory of Communication, New York, 1960. 4. Shannon C. E.( Weaver W., The Mathematical Theory of Communication, Urbana, 1949; см. также К. Шеннон, Работы по теории информации п кибернетики, ИЛ, 1963, стр. 243. 5. Whiltaker E. Т., Research Paper 8, Univ. of Edinburgh Math. Dept., 1935. 6. G a b о r D., в книге Progress in Optics, vol. i, ed. E. Wolf, Amsterdam, 1961. 7. Gamo H., Journ. Opt. Soc. Am., 47, 976 A957); 48, 12H A958). 8. Titch marsh E.G., Introduction to the Theory of Fouri- er Integrals, New York, 1948 (имеется перевод: Е. Тип- марш, Введение в теорию интегралов Фурье, М.—Л., 1948). 9. Lighthill H. J., Introduction to Fourier Analysis and Generalized Functions, New Y'ork, 1960. 10*. Толстой Г. П., Ряды Фурье, М., 1960. 11*. Винер II., Интеграл Фурье и некоторые его приложения, М., 1963.
II Г И Л О Ж Е Л И -Е В ТЕОРИЯ ВЕРОЯТНОСТИ И ЭНТРОПИЯ § 1. Биномиальное, пуассоновское и нормальное распределения В этом приложении мы приведем несколько наиболее важных результатов теории вероятности, которые исполь- зовались в основном тексте книги. Начнем с биномиаль- ного распределения, которое применялось в гл. 7 при описании модели зернистой пленки в виде шахматной доски. Нам необходимо определить вероятность PN (m) того, что среди N белых и черных квадратов, не разли- чимых по другим признакам, будет точно т белых квад- ратов. Ясно, что существует N положений для первого белого квадрата, (N — 1) для второго и (N — т + 1) положений для т-то белого квадрата. Общее число пере- становок для m элементов среди N положений равно но так как m белых квадратов неразличимы между собой, то число сочетаний m неразличимых элементов составляет Вероятность появления каждого из т квадратов равна сР, а вероятность появления (N — т) черных квадратов равна A — сР). Тогда мы получаем Можно элементарно показать для биномиального рас- пределения, что N т= 2 mPN(m) = &N, (Б.4) щ2 = ^ m^PN (т) = (mf + т{1— &), т=0
Приложение Б так что Теперь, если увеличивать N [1] и в то же время умень- шать сР так, чтобы при этом т = cJW оставалось конеч- ным, то оказывается, что биномиальное распределение стремится к пуассоновскому распределению, выражаемому формулой РАт)^Щ±, (В.5) где Далее, если увеличивать N, но так, чтобы у3/а, где т — 3d N т — т ~\/$°N (\ ?Р\ & ' оставалось малым1), то мы приходим к нормальному, или гауссову, распределению § 2. Представление об энтропии Рассмотрим теперь более общий случай, когда имеют- ся N исчерпывающих, взаимно исключающих и равно- вероятных случаев, и из них щ случаев благоприятствуют появлению события i. Определим аРг = nt/N как вероят- ность появления события i. Вероятность сРг представляет собой, очевидно, линейную меру априорной неопределен- ности результата и может принимать значения в интер- вале 0-<cPj-<l. Предположим далее, что с каждым х) Это значит, что мы рассматриваем распределение лишь вблизи максимума.
Теория вероятности и энтропия 241 i-м событием связана величина xt. Тогда средняя или ожидаемая величина х определяется как среднее взве- шенное величин xt с весовым множителем, равным частоте появления i-ro события: _ N %(x) = x=^x&i, (Б.7) ¦i=i н вообще для моментов любого порядка g(z'l)=^= 2 ^-. (Б.8) t=i Из выражений типа (Б.8) наиболее часто используется выражение для среднего значения и дисперсии f*?l . /о* _ О" I ^~™ *у*?> _^__ гу* Ы Кроме aPi часто весьма полезно иметь более мощную меру неопределенности события, изменяющуюся не от О до 1, а от 0 до оо, которая для независимых событий (например, в Бостоне бросают монету, а в Сан-Франциско открывают карту) удовлетворяет закону сложения. Более мощной мерой, которая удовлетворяет этим условиям, является log 1/eJV Так как эта мера также соответствует нашему интуитивному представлению о количестве «инфор- мации», которую мы получаем при появлении i-ro собы- тия, в современной теории связи она определяется как 7i = log2^- (Б. 9) в битах. Основание 2 здесь выбрано потому, что вычисле- ния обычно проводятся в двоичных единицах (битах). Среднее значение этой величины для большой последс- вателыюй выборки также определяется как среднее взвешенпое с весовым множителем, равным частоте появ- ления i-ro события, и называется оно «энтропией» рас- пределения вероятности aJ\-: N Н= — 2 =^г l°g ufy = l°g -Щ5~ • (Б.10) 1=1 '
242 Приложение Б Методом множителей Лагранжа и с учетом условия = 1 легко показать, что Ямакс = log N, и макси- i мум имеет место, когда все сР, равны, т. е. сР, = 1/N. Фиг. Б.1. Если с достаточной определенностью может встретиться только одно событие /, то 1 при i — j, На фиг. Б.1 представлена схема для основной задачи теории связи [2]. Посылается сообщение х, содержащее последовательность i символов, а в принимаемом сообще- нии содержится последовательность / символов. Опре- делим: вероятности cP(t) и аР(/); условные вероятности: Фг (/) — вероятность появления символа / при наличии символа i и аГ1^ (i) — вероятность появления символа i при наличии символа /; вероятность совместного события Ф (i, /) — вероят- ность появления символов i и /. Эти вероятности удовле- творяют следующим выражениям: i G каждой из этих вероятностей мы связываем следующие величины: энтропии
Теория вероятности и энтропия 248 условные энтропии # Л*) = - 2 5> (U) log ^ (О, г j г j и энтропию совместного события (х, у) Н (х, у) =-% % &(i,j) log&(i, i j которые удовлетворяют уравнениям или неравенству причем равенство справедливо в том случае, когда жиг/ статистически независимы. Предположим теперь, что посылается один символ i и принимается один символ /. Сколько «информации» передается при этом? Передаваемая информация равна разности уровней незнания до и после передачи. Более точно , , апостериорная вероятность %^'i ~~ °2 априорная вероятность С точки зрения отправителя тогда как с точки зрения получателя Но из выражения (Б. 12) следует, что ^ (/) 9> (i, /) _ &} (О Ш15) или sh-+j = iJ-i^h т. е. количество передаваемой «инфор- мации» не зависит от наблюдателя. Усредним это выра-
244 Приложение В жение по всем входным и выходным символам: (Б.16) г } После несложных преобразований это выражение при- водится к следующему виду: 7 = Н(х)-Н„(х) (Б.17) с точки зрения получателя или 7=Н(у)-Нх(у) (Б. 18) с точки зрения отправителя. Если использовать величины начальной [Я (х) ] и конечной [Hv (x) ] степени незнания ЮБ 24 2Б 104 Урна G) Урна ® Фиг. Б.2. содержания посланного сообщения, то выражение (Б.17) можно записать в виде Н„(х) = Н(х)-7, (Б.19) так что увеличение информации / приводит к уменьше- нию Ну (х). Конечно, при отсутствии «шума» Ну (х) = 0. В качестве иллюстрации сказанного рассмотрим при- мер с двумя урнами (фиг. Б.2). В первой урне содержится 10 белых шаров и 2 черных шара, а во второй — 2 белых шара и 10 черных. Из первой урны вынимается шар неиз- вестного цвета и кладется во вторую урну, содержимое которой затем перемешивается. Затем вынимается шар из второй урны и отмечается его цвет. После этого наблю- датель восстанавливает первоначальное состояние урн и все снова повторяется. Сколько бит передается в такой системе за один выбор? Пусть Wi соответствует событию, состоящему в вынимании белого шара из урны 1 и поме-
Теория вероятности и энтропия 245 щении его в урну 2, а В^ — то же самое для черного шара. Это —«посланное сообщение». Пусть W2 и Вг соответствуют событиям, состоящим в последовательном выборе белого или черного шара из урны 2. Это будет «полученным сообщением». Теперь, пользуясь опреде- лением различных вероятностей и теоремами полной вероятности и вероятности совместного события, мы можем составить следующую таблицу вероятностей. Посланное сообщение i Принятое сообщение / Р (i, /) Р (!) P(l) Pj (l) Pi (/) p(iti) *»> °^P(i)P(/) w2 15 78 5 6 17 78 15 17 3 13 i 18 l0g217 B2 50 78 5 6 61 78 50 61 10 13 60 2 78 1 6 17 78 2 17 2 13 . 12 l0g217 B, в, 11 78 1 6 61 78 11 61 11 13 66 l0g261 Отсюда 7=22 = H(x)- Hv (x) = H(y)~ Hx (y) - 50 . 60 , 15 , = 0,0318-0,0289 = — 0,0039 бит/выбор. 18 , 17 "i 11 , r80 66 2 , 12 22 T7
246 Приложение Б Энтропия в случае непрерывного сигнала. Для непре- рывных распределений вероятности также можно опре- делить энтропию, условную энтропию и энтропию совместного события следующим образом1): Н (х) = — \ф (х) log Ф (х) dx, Н(У)=- Hv ix) = - \ \ & (x, y) log Фу (х) dx dy, H* (y) = - l\ Ф (x, y) log Фх (у) dx dy, H(x,y)= — J J &(x,y)log&(x,y)dxdy. Мы уже видели в случае дискретного распределения вероятности, что пределы, достигаемые Н (х), ограничи- ваются только условием \ Ф (х) dx — 1. Предположим теперь к тому же, что мы фиксируем один из моментов вида Пользуясь опять методом множителей Лагранжа и пола- гая 6# = 0, можно показать, что Н достигает своего максимального значения, когда Ф(х) = Ае-*хП, (Б.20) х) Очевидно, что эти выражения неправильны с точки зрения размерности. Трудности возникают вследствие того, что при пере- ходе от дискретных величин к непрерывным появляется член lim (log Да;). На практике в теории информации существенна лишь Да:-). О разность энтропии, взятых в пределах одной и той же метрики, так что члены такого типа исчезают. Но в принципе, поскольку каждое физическое измерение дает конечное количество информации, Ах может только приближаться к Да;мин, интервалу, в пределах кото- рого мы можем в лучшем случае принять однородное распределе- ние, обусловленное ограниченной разрешающей способностью при- бора. Более того, в квантовой статистической механике принцип неопределенности абсолютно запрещает переходить к объему фазо- вого пространства, меньшему h3.
Теория вероятности и энтропия 247 где А и р выбраны таким образом, чтобы они удовлетво- ряли двум дополнительным условиям. В физике при х — Е (где Е — полная энергия системы) п = 1 и тогда выражение (Б. 20) представляет собой распределение Больцмана. Если х = v (где v — скорость молекул газа), то п = 2, и тогда выражение (Б.20) дает закон Максвел- ла — Больцмана для распределения скоростей молекул идеального классического газа. Перефразируя Вудвор- да [2], можно сказать, что при фиксированной величине среднего квадрата флуктуации распределение Гаусса является наиболее случайным из всех распределений в том смысле, что ему соответствует максимальная энтро- пия. С этой точки зрения все результаты, полученные Шенноном [3] для емкости канала передачи информации, потерь энтропии в линейном фильтре и т. д., могут быть непосредственно применены в оптике [4, 51 с соответ- ствующим переходом к двумерным представлениям. § 3. Матрица освещенности в случае когерентного излучения В гл. 8 мы пытались увязать понятия когерентности излучения и энтропии. Мы показали, что в случае коге- рентного и некогерентного излучений диагонализирован- ная матрица освещенности принимает вид, соответствую- щий минимальной и максимальной энтропии. Здесь мы будем исходить из выражения *т Ц2) Г &, l2) un (g,) dl, dl2. В данном параграфе нас будет интересовать в основном статистическая структура света, а не влияние объекта или линз. Следовательно, мы можем представить это выражение таким образом, чтобы оно было связано только с излучением. Для этого, во-первых, примем, что ком- плексный коэффициент пропускания объекта равен всю- ду С, и, во-вторых, что 2W
248 Приложение IS т. е. устраним влияние линз. Тогда выражение (8.27) принимает следующий вид: В случае некогерентного излучения Ттп = С28тп, т. е. матрица всегда имеет диагональную форму. Выберем N теперь постоянную таким образом, чтобы 2 Яг = 1, и тогда для некогерентного излучения мы получаем выражение • 1 ~Ж 1 т о 1 1 "Ж (Б. 22) соответствующее максимальной энтропии. В случае когерентного излучения и нам необходимо для получения величин собственных значений решить вековое уравнение |В-Л| = 0, (Б.23) которое всегда можно записать [4] в виде полинома от к кп -f d*," + С2%п~2 +...+Сп ¦= О, (Б.24) где С1 = — Si, г* (С *-^ п— \^ п~ 1 п п \ -J- Sn)
Теория вероятности и энтропия 249 и где 5n = SpB". Теперь для частичного упрощения вида матрицы В в случае когерентного излучения мы воспользуемся тем, что и что Таким образом, мы имеем Cj= — Si = — SpB= — 1, (Б.25) так что вековое уравнение запишется в виде (Г-Л,"-1) = 0=-А.п-1а —1), (Б.26) откуда следует, что диагонализированная матрица имеет следующий вид: 'о 1когерент - (В.27) х) Те, кто знаком с квантовой механикой, по этому выражению сразу узнают в В проекционный оператор. Собственные значения его могут быть непосредственно получены из матричного уравне- ния В™-1 (В — 1) = 0.
250 Приложение Б ЛИТЕРАТУРА 1. Fry Т. С, Probability and Its Engineering Uses, New York, 1928 (имеется перевод: Т. Ф р а й, Теория вероятностей для инженеров, М.—Л., 1934). 2. Woodward P.M., Probability and Information Theory, New York, 1953; см. также Ф. М. В у д в о р д, Теория вероятностей и теория информации с применениями в радиолокации, М., 1955. 3. Shannon С. Е., Weaver W., The Mathematical Theory of Communication, Urbana, 1949; см. также К. Шеннон, Работы по теории информации и кибернетике, ИЛ, 1963, стр. 243. 4. L i n f о о t E. H., Fellgett P. В., Trans. Roy. Soc, A247, 369 A955). 5. Toraldo di Francia G., Optica Acta, 2, 5 A955). 6. Bocher H., Introduction to Higher Algebra, New York, 1931.
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ 5 ПРЕДИСЛОВИЕ И Глава 1. ФУНКЦИЯ ГРИНА И ЛИНЕЙНАЯ ТЕОРИЯ 15 § 1. Линейные дифференциальные операторы второго порядка 15 § 2. Самосопряженные операторы 18 § 3. Несамосопряженные операторы 20 § 4. Неоднородное уравнение 21 § 5. Определение функции Грина 22 § 6. Принцип линейной суперпозиции при формирова- нии оптического изображения 27 Литература 29 Глава 2. СРАВНЕНИЕ ПРОСТРАНСТВЕННЫХ И ВРЕМЕННЫХ ФИЛЬТРОВ . . 30 § 1. Временные фильтры 31 § 2. Классификация входных сигналов 35 § 3. Случайные сигналы 38 § 4. Оптические пространственные фильтры 42 § 5. Оптическая контрастно-частотная передаточная функция 45 § 6. Идеализированный случай 49 § 7. Движение изображения 53 Литература 57
252 Оглавление Глава 3. ВВЕДЕНИЕ В ГЕОМЕТРИЧЕСКУЮ ОПТИКУ .... 58 § 1. Принцип Ферма и закон преломления Снеля ... 58 § 2. Принятые обозначения и правила злаков .... 61 § 3. Матрица преломления 62 § 4. Матрица перемещения 64 § 5. Параксиальное приближение 66 § 6. Образование оптического изображения 67 § 7. Кардинальные точки 69 § 8. Примеры 73 Литература 79 Глава 4. ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ АБЕРРАЦИЙ .... 80 § 1. Волновая аберрационная функция 80 § 2. Связь между геометрической и физической оптикой 83 § 3. Уравнения для отрезков луча 84 § 4. Оптимальная компенсация сферических аберраций третьего и пятого порядков 97 § 5. Компенсация аберраций по методу Марешаля . . 103 § 6. Пример: одна отражающая поверхность 107 § 7. Полиномы Цернике 110 Литература 112 Глава 5. ДИФРАКЦИОННАЯ ТЕОРИЯ ФОРМИРОВАНИЯ ИЗО- БРАЖЕНИЯ из § 1. Общие замечания ИЗ § 2. Основная дифракционная проблема 116 § 3. Уравнения, описывающие образование изображения 120 § 4. Дифракция на щели 125 § 5. Звездный интерферометр Майкельсона 126 § 6. Дифракция на круглом отверстии 131 Литература 134 Глава 6. АНАЛИЗ И СИНТЕЗ ОПТИЧЕСКИХ СИСТЕМ .... 135 § 1. Общие соотношения 135 § 2. Малые аберрации 136
Оглавление 253 § 3. Изменение амплитуды и фазы в одномерном случае 139 § 4. Амплитудные и фазовые изменения в двумерном случае 147 § 5. Случайные фазовые ошибки 152 § 6. Проблема синтеза, когерентное освещение ... 154 Литература 158 Глава 7. статистические методы 159 § 1. Случайные объекты 159 § 2. Другие статистические факторы: зернистость и гра- нулярность 165 § 3. Модель зернистости в виде шахматной доски . . . 170 § 4. Модель зернистой структуры, состоящая из круглых перекрывающихся зерен 173 Литература 180 Глава 8. МАТРИЦЫ И ТЕОРИЯ КОГЕРЕНТНОГО ИЗЛУЧЕНИЯ 181 § 1. Введение. Функция взаимной когерентности Вольфа 181 § 2. Формирование изображения 184 § 3. Матричная теория 189 Литература 195 Глава 9. теория частичной поляризации 196 § 1. Введение 196 § 2. Метод Джонса 200 § 3. Метод когерентных матриц 202 § 4. Параметры Стокса и метод Мюллера 208 § 5. Некоторые частные вопросы 215 Литература 225 Приложение А. РЯДЫ И ИНТЕГРАЛЫ ФУРЬЕ-БЕССЕЛЯ 227 § 1. Ряды Фурье : . . 227 § 2. Интеграл Фурье 230 § 3. Теория преобразования Фурье для двумерного слу- чая 231
254 Оглавление § 4. Теорема свертки 233 § 5. Теорема о дискретном представлении 235 Литература 238 Приложение Б. теория вероятности и энтропия • • . 239 § 1. Биномиальное, пуассоновское и нормальное рас- пределения 239 § 2. Представление об энтропии 240 § 3. Матрица освещенности в случае когерентного излу- чения 247 Литература 250
О'НЕЙЛ ВВЕДЕНИЕ В СТАТИСТИЧЕСКУЮ ОПТИКУ Редактор Е. Куранский Художник И. Литвишко Художественный редактор П. Некундэ Технический редактор Ю. Экке Корректор И. П. Максимова Сдано в производство 8/VIII 1966 г. Подписано к печати 9/XI 1966 г. Бумага 84 X 1081/з2=4,0 бум. л. 13,44 усл. печ. л. Уч.-изд. л. 11,13. Изд. № 2/3535 Цена 98 к. Зак. 456 Темплан 1966 г. изд-ва «МИР», пор. № 61. ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Московская типография № 16 Главпол-йрйфпрома Комитета по печати при Совете Минмв^ов C(j Москва, Трехпрудный перл