Text
                    С.А.РОДИОНОВ
АВТОМАТИЗАЦИЯ
ПРОЕКТИРОВАНИЯ
ОПТИЧЕСКИХ
СИСТЕМ
Допущено Министерством высшего и среднего
специального образования СССР
в качестве учебного пособия
для студентов оптических специальностей вуа#в
ЛЕНИНГРАД
МАШИН ОСТРОЕНИЕ
ЛЕНИНГРАДСКОЕ ОТДЕЛЕНИ
1 9


ББК 22.34 Р60 УДК 535.317 : 681.31 @75) РЕЦЕНЗЕНТЫ: кафедра прикладной оптики МВТУ им. Н. Э. Баумана и д-р техн. наук А. П. Грамматин Родионов С. А* Р60 Автоматизация проектирования оптических систем: Учеб. пособие для приборостроительных вузов. — Л.: Машино- Машиностроение, Ленингр. отд-ние, 1982. — 270 с, ил. В пер.: 85 к. 257-82 Издательство «Машиностр 038 @1)-82
ПРЕДИСЛОВИЕ Автоматизация проектирования на базе использования мате- математических методов и средств вычислительной техники является мощным фактором научно-технического прогресса и играет веду- ведущую роль в повышении производительности труда и качества продукции. В оптическом приборостроении в первую очередь автоматизи- автоматизируется проектирование оптических систем приборов. Проектиро- Проектирование или, как часто говорят, расчет оптических систем — слож- сложный творческий процесс, особенностью которого является большое количество трудоемких вычислений (в частности расчет хода лучей через оптическую систему), выполняемых по небольшому количе- количеству унифицированных схем (алгоритмов). Применение цифровых ЭВМ для этих целей было наиболее естественным и сразу же принесло существенный эффект. История автоматизации проекти- проектирования оптических систем начинается почти одновременно с по- появлением ЭВМ. Так, одна из первых ЭВМ «Mark-I» уже в 1944 г. использовалась для расчетов оптических систем, а с 50-х годов ЭВМ систематически применяются для этих целей. Большой вклад в автоматизацию проектирования оптических систем внесли советские оптики. Первые в СССР программы авто- автоматического расчета оптических систем на ЭВМ «Урал» были раз- разработаны А. П. Грамматиным в конце 50-х годов в Государствен- Государственном оптическом институте им. С. И. Вавилова. Сейчас проектирование оптических систем немыслимо без применения ЭВМ. На всех предприятиях, в научно-исследователь- научно-исследовательских институтах, учебных заведениях используются пакеты при- прикладных программ, обеспечивающие решение основных задач расчета оптических систем на ЭВМ самых различных классов. Во многих организациях ведутся исследования и разработки математического и программного обеспечения автоматизирован- автоматизированного проектирования оптических систем. Сегодняшнее состояние автоматизации проектирования характеризуется переходом от отдельных программ и пакетов программ, обеспечивающих некоторые трудоемкие расчеты, к си- системам автоматизированного проектирования (САПР), дающим возможность осуществлять проектирование оптических систем на новом более высоком качественном уровне. 3
Широкое распространение САПР в оптике потребует подго- подготовки значительного числа оптиков-программистов, осуществля- осуществляющих эксплуатацию и совершенствование САПР, а также изуче- изучения принципов построения и функционирования САПР всеми оптиками-конструкторами, использующими САПР в своей работе. Круг вопросов, относящихся к автоматизации проектирования в оптике, необычайно широк. Сюда входят принципы устройства и характеристики технической базы САПР, задачи проблемного и системного программирования, разработки специальных чис- численных методов и алгоритмов, входных языков для общения поль- пользователей с САПР и т. д. Весьма важны также методика и практика использования САПР, описание и анализ конкретных программ и систем автома- автоматизированного проектирования. Естественно, что в одной книге трудно охватить столь разно- разнородный и большой по объему материал, поэтому целью написания настоящего учебного пособия явилось изложение фундаменталь- фундаментальных сведений, с которых, по мнению автора, следует начинать изучение автоматизации проектирования в оптике как пользова- пользователям, так и разработчикам, а именно: теоретических основ, включающих в себя математические модели оптической системы как объекта автоматизированного проектирования и математиче- математические методы обработки этих моделей. Автор надеется, что, овладев этими знаниями, читатель сможет самостоятельно разобраться в принципах построения и особенностях той или иной программы автоматизированного проектирования оптических систем и гра- грамотно использовать заложенные в ней возможности, а при необ- необходимости самостоятельно разработать или усовершенствовать какой-либо метод или программу. Следует отметить, что рассматриваемые в книге математиче- математические модели оптической системы адаптированы к машинной обра- обработке, т. е. существенно ориентированы на использование всех возможностей современных численных методов и ЭВМ, поэтому они во многом отличаются от традиционных, принятых при не- неавтоматизированном проектировании и описанных в классических курсах технической оптики. Для чтения пособия необходимо знание современного математического аппарата, численных мето- методов и программирования в объеме соответствующих вузовских курсов, а также классической теории оптических систем. Автор считает своим приятным долгом выразить благодарность всем, кто помогал ему в работе над рукописью. Все замечания и пожелания автор просит направлять по ад- адресу: 191065, Ленинград, ул. Дзержинского, 10, ЛО изд-ва «Ма- «Машиностроение».
Глава 1 ОБЩИЕ ПОНЯТИЯ ОБ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ ОПТИЧЕСКИХ СИСТЕМ Проектирование любых объектов — будь то оптические си- системы, электронные схемы или другие технические устройства, имеет много сходных черт, которые особенно ясно видны при переходе к автоматизированному проектированию. Не имея воз- возможности достаточно подробно изложить общие принципы автома- автоматизированного проектирования, охватывающие любые объекты, отошлем читателя к учебному пособию И. П. Норенкова [23] и рассмотрим в настоящей главе наиболее существенные и специ- специфические для оптических систем понятия. § 1. ИСХОДНЫЕ ПРИНЦИПЫ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ ОПТИЧЕСКИХ СИСТЕМ Прежде всего необходимо дать определение объекту проекти- проектирования — оптической системе — применительно к нашим задачам. Под оптической системой будем понимать совокупность опти- оптических (прозрачных, однородных) сред, разделенных оптическими поверхностями (регулярными гладкими поверхностями опреде- определенной формы) и содержащими диафрагмы (экраны с отверстиями), предназначенную для формирования изображения посредством перераспределения в пространстве электромагнитного поля, исхо- исходящего от предмета. Физически оптическая система есть совокуп- совокупность оптических деталей (линз, призм, зеркал и других элемен- элементов), определенным образом расположенных в пространстве по- посредством закрепления их в оправах. Конструктивные параметры оптической системы — это вели- величины, необходимые и достаточные для однозначного определения ее конструкции. К ним относятся: параметры оптических сред, параметры формы и взаимного расположения поверхностей, пара- параметры диафрагм и покрытий. Целью проектирования (расчета) оптической системы является определение номинальных значений и допустимых отклонений всех конструктивных параметров, исходя из требований к качеству изо- изображения, а также технологических и экономических требований. Процесс проектирования — это последовательность операций, производимых над описаниями или математическими моделями
проектируемого объекта вплоть до получения окончательных проектных решений. По степени автоматизации проектирование разделяется на неавтоматизированное, когда все операции выполняются челове- человеком; автоматическое, когда все операции выполняются ЭВМ без участия конструктора, и автоматизированное, когда часть опера- операций выполняется ЭВМ, а часть — конструктором. Наиболее гиб- гибким и получившим наибольшее распространение оказалось именно автоматизированное проектирование, при котором оптимальным образом распределяются функции между конструктором и ЭВМ. С этой точки зрения существенными являются следующие свойства проектных операций: детерминированность или эври- стичность, объектно-независимость или объектно-ориентирован- ность, а также сравнительная их трудоемкость. Детерминированные операции выполняются по определенным жестким схемам (алгоритмам) и результат их выполнения не за- зависит от исполнителя. Для эвристических же операций, напротив, невозможно составить определенный алгоритм выполнения; ре- результат эвристических операций в сильнейшей степени опреде- определяется опытом, квалификацией и даже талантом исполнителя. Например, расчет хода лучей через оптическую систему или характеристик структуры изображения — детерминированные операции, а выбор типа исходной конструкции оптической си- системы — эвристическая. Детерминированные и, в первую очередь, самые трудоемкие операции наиболее эффективно выполняются ЭВМ, а эвристические — конструктором. Алгоритм и математический аппарат объектно-независимых (объектно-инвариантных) операций не зависят от проектируемого объекта. Такие операции являются универсальными и применимы к любым объектам. Содержание же объектно-ориентированных операций в большей или меньшей степени зависит от специфики проектируемого объекта. Например, расчет хода лучей через оптическую систему — объектно-ориентированная операция, а оптимизация — объектно-инвариантная. В процессе своего исторического развития автоматизация проектирования прошла несколько стадий — уровней. Низшим уровнем являлось наличие отдельных, не связанных между собой программ, обеспечивающих выполнение на ЭВМ некоторых наиболее трудоемких или наиболее частых операций проектирования. Более эффективным стало объединение программ в пакеты прикладных программ (ППП) с общей теоретической базой — систе- системой математических моделей объекта проектирования. Харак- Характерной чертой ППП является унификация обмена информацией между отдельными программами пакета. Высший уровень автоматизации представляют системы авто- автоматизированного проектирования (САПР), в которых оптималь- оптимальным образом распределены функции между конструктором и 6
ЭВМ. Очевидно, что для этого все детерминированные операции должны выполняться ЭВМ, а все эвристические — конструктором (для чего ему должна быть предоставлена возможность получения в наглядной форме результатов и оперативного вмешательства в необходимых точках). Отличительными чертами САПР являются: I) общая система математических моделей проектируемого объ- объекта; 2) автоматизация обмена информацией между отдель- отдельными программами САПР при помощи специальной системной программы — диспетчера (организующего взаимодействие ЭВМ с конструктором, выполнение его заказов и вызов для этого необ- необходимых проблемных программ; 3) наличие личных архивов кон- конструкторов, обеспечивающих хранение в ЭВМ и удобное исполь- использование исходных данных, промежуточных и окончательных результатов, а также банка общесистемных данных; 4) общение конструктора с ЭВМ посредством универсального и машинно- независимого языка; 5) наглядное (графическое) отображение информации и 6) работа в диалоговом (интерактивном) режиме одновременно с многими пользователями, позволяющая каждому конструктору легко оценивать результаты и принимать эвристи- эвристические решения о дальнейшем ходе процесса. Эффективность систем автоматизированного проектирования определяется их теоретической, программной и технической базами. Теоретическую базу, являющуюся предметом нашего рассмо- рассмотрения, составляет система математических моделей, описыва- описывающих объект проектирования — оптическую систему, и математи- математические методы обработки этих моделей. § 2. ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ ОПТИЧЕСКИХ СИСТЕМ И ОПЕРАЦИИ НАД НИМИ Математические модели оптической системы, как и любого другого объекта проектирования, должны быть: адекватными, т. е. описывать свойства объекта с необходимой точностью; уни- универсальными, т. е. пригодными для широкого класса объектов; экономичными, требующими минимального количества вычисле- вычислений при обработке, а также простыми и наглядными для исполь- использования. Никакая единая модель не может удовлетворить всем этим требованиям, поэтому используется система моделей, основанная на б'лочно-иерархическом подходе к описанию и проектированию объекта [23]. Процесс проектирования при этом разбивается на несколько иерархических уровней, на каждом из которых рас- рассматриваются системы, состоящие из небольшого, легко обозри- обозримого числа элементов, представляемых в свою очередь как си- системы на низших уровнях. При проектировании оптических систем можно выделить три иерархических уровня. На высшем уровне оптическая система рассматривается как элемент в цепи различных устройств, входящих в оптический при-
бор и функционирующих совместно. На этом уровне используется внешняя функциональная модель, описывающая оптическую си- систему безотносительно к физическим принципам ее работы, т. е. как преобразователь сигналов общего вида. Характеристики и понятия этой модели (внешние характеристики оптической си- системы) являются поэтому объектно-независимыми, применимыми к любым преобразователям, работающим вместе с оптической системой. В процессе проектирования на этом уровне опреде- определяются значения внешних характеристик всех элементов, в том числе и оптической системы, обеспечивающие оптимальное функ- функционирование оптического прибора в целом. На среднем уровне оптическая система представляется состо- состоящей из элементов. В зависимости от степени детализации рас- рассмотрения средний уровень в свою очередь можно разбить на несколько подуровней. На высшем из них в качестве элементов выступают узлы, имеющие самостоятельное значение (например, объективы, окуляры, оборачивающие системы), на среднем — компоненты с известными аберрационными свойствами, на низ- низшем — оптические поверхности и среды. Задачей проектирования на этом уровне является определение значений конструктивных параметров, обеспечивающих требуемые значения внешних харак- характеристик, полученных на высшем уровне. Здесь используются две математические модели. Внутренняя функциональная модель отражает физические принципы формиро- формирования оптического изображения. Основным понятием этой модели является зрачковая функция, показывающая влияние оптической системы на проходящее через нее электромагнитное поле. Харак- Характеристики и понятия этой модели (внутренние характеристики оптической системы) являются объектно-ориентированными и пригодными для описания только оптических систем. Принципиальная конструкционная модель включает в себя конструктивные параметры, определяющие функционирование оптической системы — параметры оптических сред, поверхностей и их взаимного расположения. Указанные модели, рассмотренные подробно в гл. 2, объеди- объединены системой обобщенных характеристику позволяющей удо- удовлетворить требованиям адекватности, универсальности, эконо- экономичности и простоты моделей. На низшем уровне проектирования оптическая система пред- представляется в виде совокупности оптических деталей, закрепленных в оправах; здесь определяются конструктивные элементы, обеспе- обеспечивающие надежное закрепление деталей и расположение их друг относительно друга с необходимой точностью. На этом уровне используется детальная конструкционная модель оптической системы, включающая в себя математическое описание крепежных элементов, взаимного расположения и подвижек деталей и т. п. Кроме рассмотренных моделей, из которых каждая является специфической для своего уровня проектирования, необходимо
Анализ Синтез Оптимизация Рис. 1.1. Условные схемы процессов ана- анализа, синтеза и опти- оптимизации рассмотреть математические модели, обладающие общими чертами и использующиеся на любом уровне. Оптимизационная модель описывает оптическую систему как объект оптимизации. Она включает в себя характеристики опти- оптической системы, которые мы хотим улучшить (оптимизировать) на данном уровне; параметры, изменением которых мы производим оптимизацию; ограничения на область возможных изменений и математические соотношения, связывающие параметры и характеристики. Статистическая модель характеризует оптическую систему как объект, полученный в процессе изготовления и сборки деталей. В силу неизбежных технологических по- погрешностей, носящих случайный характер, конструктивные параметры и характери- характеристики оптической системы становятся слу- случайными величинами, законы распределе- распределения которых и описываются при помощи статистической модели. Эта модель, рас- рассмотренная в гл. 6, необходима при опреде- определении допусков на технологические погреш- погрешности. Операции, производимые над математическими моделями. Про- Процесс проектирования на любом иерархическом уровне можно пред- представить в виде последовательности следующих типовых операций: анализа, синтеза и оптимизации. Под анализом (прямая задача) будем понимать вычисление значений характеристик по известным значениям параметров. Если все параметры объединить в вектор х, а характеристики — в вектор f; то условная схема анализа будет выглядеть так, как показано на рис. 1.1. Анализ является детерминированной и объ- объектно-ориентированной операцией. На среднем уровне проектирования анализ состоит в определе- определении внутренних характеристик оптической системы по известным значениям конструктивных параметров. Здесь можно выделить различные подуровни, отличающиеся степенью полноты и трудо- трудоемкостью: анализ в гауссовой и зейделевой областях (определение параксиальных характеристик и аберраций третьего порядка), вычисление аберраций небольшого количества действительных лучей, определение габаритов пучков и, наконец, аппроксимация аберраций и формирование внутренней функциональной модели. Основное содержание этих уровней анализа составляет рас- расчет хода лучей через оптическую систему, рассмотренный в гл. 3. Следующий уровень анализа, на котором входными данными х являются внутренние характеристики, полученные на низших уровнях или экспериментально, а результатами f — внешние характеристики, связывает между собой средний и высший уровни
проектирования. Этот уровень анализа, рассмотренный в гл. 4, отличается высокой трудоемкостью. На высшем уровне проектирования операции анализа заклю- заключаются в моделировании работы оптической системы в общей цепи преобразователей сигнала, входящих в оптический прибор. Вход- Входными данными для анализа здесь являются внешние характери- характеристики оптической системы и других преобразователей, а также параметры входного сигнала (предмета). Результаты анализа представляют собой параметры выходного сигнала (изображения) и характеристики, описывающие качество функционирования всего прибора. На любом уровне различают одновариантный анализ, когда выходные характеристики f определяются для одного значения входных параметров х и многовариантный анализ, называемый также анализом чувствительности или влияния параметров, когда определяется зависимость выходных характеристик от не- небольших изменений входных параметров, т. е. находится матрица производных df/dx. Под синтезом (обратная задача) будем понимать первоначаль- первоначальное формирование конструкционной модели, т. е. определение значений параметров х, обеспечивающих заданные значения характеристик f (рис. 1.1). Синтез в большинстве случаев яв- является эвристической и сугубо объектно-ориентированной опера- операцией. Его содержание определяется конкретным типом синтези- синтезируемой системы. В настоящее время поддаются алгоритмизации только некоторые виды синтеза: поиск конструкции из существу- существующих вариантов при помощи информационно-поисковой системы (ИПС), синтез простейших типов оптических систем, набор систем из элементов с известными свойствами по методике М. М. Руси- нова [27], сборка оптической системы из нескольких узлов или компонентов, а также операции перестроения системы (оборачи- (оборачивание, изменение в масштабе, удаление и добавление элементов). В любом случае операция синтеза может быть разбита на два уровня: структурный синтез (наиболее эвристическая операция), в процессе которой определяются количество, типы и последова- последовательность элементов, образующих систему, и параметрический синтез, задачей которого является получение конкретных значе- значений конструктивных параметров элементов. Благодаря высокой степени эвристичности. в процессе синтеза редко удается получить систему полностью удовлетворяющую всем заданным требованиям, поэтому обязательной операцией является оптимизация, под которой будем понимать направленное изменение конструктивных параметров, начиная от некоторых исходных значений, с целью достижения наилучших значений характеристик. Математический аппарат оптимизации относится не к самому объекту — оптической системе, а к ее оптимизацион- оптимизационной модели. Поэтому, когда эта модель построена, операция оптимизации является совершенно объектно-инвариантной и детер- 10
с предыдущего уровня проектирования решение удовлетворяет ТЗ на всех уровни анализа возможен переход к -оптимизации г— Построение оптимизационной модели Выпуск документации на следующий уровена проектирования Схема 1.1. Алгоритм процесса автоматизированного проектирования
минированной. Выбор же оптимизационной модели, т. е. решение вопросов о том, что оптимизировать и чем оптимизировать, для конкретной оптической системы является весьма эвристической задачей. Способность правильного выбора приходит с опытом и при глубоком понимании принципов оптимизации. Синтезу и оп- оптимизации посвящена гл. 5. Алгоритм проектирования на каком-либо иерархическом уровне, составленный из последовательности операций синтеза, анализа и оптимизации, изображен на схеме 1.1. В прямоуголь- прямоугольниках показаны детерминированные операции, выполняемые ЭВМ, в трапециях — эвристические операции, выполняемые конструк- конструктором. Ромбами обозначены эвристические решения о дальнейшем ходе проектирования, принимаемые конструктором на основе оценки результатов операций, выполненных ЭВМ. Из схемы видно, что процесс проектирования является итерационным, т. е. содержит возвраты на начальные этапы с изменением и услож- усложнением заданий на их выполнение. Заканчивается процесс после того, как результаты анализа на всех его уровнях будут положи- положительно оценены конструктором. Заметим, что в процессе развития автоматизации проектиро- проектирования все большее число ранее эвристических операций будет алгоритмизироваться. Весьма перспективными в этом направле- направлении представляются самообучающиеся алгоритмы. § 3. СВЕДЕНИЯ О ТЕХНИЧЕСКОЙ БАЗЕ И ПРОГРАММНОМ ОБЕСПЕЧЕНИИ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ В ОПТИКЕ Специфика проектирования оптических систем предъявляет определенные требования к используемой технической базе, со- состоящей из достаточно мощной универсальной ЭВМ и соответ- соответствующего периферийного оборудования. Возможность применения той или иной ЭВМ для автоматиза- автоматизации проектирования оптических систем определяется скоростью выполнения операций, относительной погрешностью вычислений, объемом оперативной памяти и возможностью подключения внеш- внешних устройств [14]. Для операций проектирования оптических систем характерно большое процентное соотношение арифметических вычислений в общем бюджете затрат и их значительная трудоемкость. Поэтому при оценке быстродействия ЭВМ следует исходить из типичной для научных задач смеси арифметических операций [14]. Ввиду большой трудоемкости таких операций проектирования, как ана- анализ структуры изображения и оптимизация, требующих до 1010 арифметических действий, минимально приемлемым для этих целей является быстродействие порядка 50 тыс. операций в се- секунду. Среднее время на анализ структуры изображения при этом составляет для одного варианта оптической системы от 20 12
до 40 мин, а на один цикл оптимизации — от 30 мин до нескольких часов. Для обслуживания нескольких конструкторов в режиме разделения времени такое быстродействие явно недостаточно; в этом случае требуется скорость не менее 10е операций в секунду. Для выполнения операций на высших уровнях анализа и опти- оптимизации существенным также является объем оперативной па- памяти, так как эти операции сопряжены с необходимостью вычис- вычислять и хранить матрицы большой размерности. Например, для анализа структуры изображения методом быстрого преобразова- преобразования Фурье, рассмотренным в гл. 4, требуется хранить в памяти и преобразовывать матрицы, состоящие как минимум из 64 X X 64 = 4096 действительных или комплексных чисел. В задачах оптимизации используются матрицы размерностью т X п (где т — количество оптимизируемых характеристик, п — количество параметров оптимизации) и поэтому при вполне реальных значе- значениях т =¦ 200 и п = 50 получаем 10 000 чисел. Кроме того, в па- памяти должны храниться и сами программы. Естественно, что для выполнения указанных операций, необходимых при проектирова- проектировании, минимальный объем оперативной памяти составляет 32 тыс. чисел, а при обслуживании нескольких конструкторов — не менее 250 тыс. чисел. Как известно, числа, используемые при расчетах на ЭВМ, делятся на два основных типа: действительные (REAL) и целые (INTEGER). Целые числа типа INTEGER могут принципиально принимать только целые значения (это, например, количество поверхностей в оптической системе, порядок матриц, номер эле- элемента в массиве и т. п.). Целые числа представляются в ЭВМ точно, без погрешности. Основной объем чисел составляют действительные, которые представляются в современных ЭВМ в форме с плавающей запятой (плавающей точкой) [14, 20] в нормализованном виде, а именно: х = ±та±р; а < т << 1, где т — мантисса числа; р — порядок (целое число); а — основа- основание системы счисления, в которой работает ЭВМ. Особенностью такой формы представления является то, что относительная погрешность вычислений, полученная из-за огра- ограниченного количества знаков мантиссы (погрешность округления), практически не зависит от величины числа, а определяется коли- количеством t разрядов, отведенных под мантиссу, т. е. б < а~^~~1К При проектировании оптических систем необходима высокая точность вычислений в процессе расчета хода лучей и определении аберраций (особенно в длинных системах). Приемлемой является относительная погрешность 6 < A0~8—10~~9). В СССР сейчас получили наибольшее распространение ЭВМ Единой системы (ЕС ЭВМ), относящиеся к третьему поколению ЭВМ [14]. Для автоматизации проектирования оптических систем подходят модели, начиная с ЕС-1022 при обслуживании конструк- 13
торов в пакетном режиме и с ЕС-1040 — в диалоговом. Объем памяти ЕС ЭВМ принято измерять в байтах (один байт равен восьми битам, т. е. двоичным разрядам). Для выполнения боль- большинства операций проектирования в пакетном режиме требуется объем оперативной памяти не менее 256 Кбайт, а в диалоговом — 1024 Кбайт A Кбайт равен 1024 байта). Действительные числа в ЕС ЭВМ могут быть одинарной точности, длиной 4 байта (при этом мантисса содержит шесть шестнадцатиричных разрядов, а относительная погрешность округления б < 16~5 г& 10~6) или двойной точности, длиной 8 байт (при этом мантисса содержит 14 шестнадцатиричных разрядов и б < 16~13 ^ 2- 10(i). Как видно из приведенных чисел, работа с одинарной точностью не всегда удовлетворяет потребностям оптики, поэтому необходимо выпол- выполнять расчет хода лучей через оптические системы, используя числа и арифметику двойной точности (при этом быстродействие ЭВМ снижается примерно в два раза). Для автоматизации проектирования оптических систем широко применяется относящаяся также к третьему поколению ЭВМ БЭСМ-6, имеющая скорость вычислений порядка 500 тыс. опера- операций в секунду, объем оперативной памяти 32—128 тыс. чисел и длину слова 48 бит, из которых на мантиссу отводится 40 двоич- двоичных разрядов, поэтому относительная погрешность этой ЭВМ (б = 2~39 я^ 102) вполне удовлетворяет потребностям оптики. Следует отметить, что наряду с большими ЭВМ оказалось весьма эффективным использование для проектирования оптиче- оптических систем настольных клавишных ЭВМ с программным управле- управлением. Основным их преимуществом наряду с малыми габаритами, низкой стоимостью и простотой обслуживания является возмож- возможность работы на них самому конструктору в режиме непосредст- непосредственного доступа, позволяющего просто и оперативно вносить изме- изменения в исходные данные в ходе проектирования. Эти ЭКВМ выполняют действия над десятичными числами с плавающей за- запятой, с длиной мантиссы 12 десятичных разрядов (б < 10~п). Оперативная память таких ЭВМ составляет до 32 Кбайт C2 тыс. команд или 4000 чисел), имеется внешняя память на магнитной ленте или картах и развитая система команд. Естественно, что операции высших уровней анализа или оптимизации на ЭКВМ выполнять невозможно из-за низкого быстродействия и малого объема памяти, но операции низших уровней анализа, простейшие операции синтеза выполняются на них часто не менее эффективно, чем на больших ЭВМ. Кроме ЭВМ для автоматизации проектирования оптических систем необходимо соответствующее периферийное оборудование. При работе в пакетном режиме специальных устройств не тре- требуется, а исходные данные подготовляются заранее на перфо- перфокартах и в ЭВМ вводится пакет, содержащий задания всех кон- конструкторов. Результаты расчета по мере выполнения выводятся на построчное алфавитно-цифровое печатающее устройство 14
(АЦПУ). На это же устройство может быть выведена и несложная графическая информация: эскиз оптической системы, карта волно- волновых аберраций, точечная диаграмма (см. гл. 2, 4). Более сложная и качественная графическая информация выводится в порядке поступления на чертежный автомату управляемый ЭВМ. Такой пакетный режим работы, однако, весьма неэффективен, так как не позволяет конструктору оперативно вмешиваться в процесс проектирования. Время ожидания результатов в пакетном ре- режиме составляет от 3 до 24 ч. Наиболее эффективным является диалоговый режим, в котором несколько конструкторов одновременно могут вводить в ЭВМ задания и оперативно получать результаты расчетов в наглядной форме. Для обращения конструкторов с ЭВМ в диалоговом ре- режиме используются алфавитно-цифровые и графические дисплеи, имеющие клавиатуру для ввода информации и экран на базе электронно-лучевой трубки для ее отображения [23]. В диалого- диалоговом режиме время ожидания конструктором ответа ЭВМ не пре- превышает нескольких секунд. Дисплеи используются для отобра- отображения оперативной информации, необходимой конструктору для принятия решений о дальнейшем ходе процесса проектирования; окончательная проектно-конструкторская документация, как и в пакетном режиме, выводится на АЦПУ и чертежный автомат. Таким образом, основными периферийными устройствами, обеспечивающими автоматизацию проектирования оптических систем, являются алфавитно-цифровые и графические дисплеи, а также чертежный автомат. Программное обеспечение автоматизации проектирования в оп- оптике. Из сказанного выше в гл. 1 нетрудно придти к заключе- заключению, что программное обеспечение автоматизированной системы проектирования оптических систем должно состоять из двух основных частей — системной и проблемной. Системная часть включает в себя диспетчер, организующий взаимодействие САПР с пользователями и выполнение их заказов в пакетном или диало- диалоговом режимах путем вызова соответствующих проблемных про- программ, и банк данных, через который производится обмен инфор- информацией между пользователями и системой, а также между отдель- отдельными проблемными программами. Проблемная часть программ- программного обеспечения состоит из библиотеки унифицированным обра- образом организованных программ, выполняющих отдельные операции проектирования, рассмотренные выше, так называемых функци- функциональных блоков. Сюда входят, например, блоки трансляции с вход- входного языка, блоки синтеза, анализа, оптимизации, отображения результатов и др. В свою очередь, функциональные блоки состоят из отдельных подпрограмм, решающих элементарные задачи как общематематического характера, т. е. проблемно-независимые (например, задачи линейной алгебры, численного интегрирова- интегрирования, оптимизации и другие), так и оптического характера — объ- объектно-ориентированные (например, расчет луча через одну поверх- 15
ность, нахождение граничного луча и т. д.). Эти подпрограммы обычно пишутся на универсальных алгоритмических языках высшего уровня, из которых наиболее распространенным, простым и в то же время достаточно универсальным является ФОРТРАН [14, 20]. Наиболее часто используемые подпрограммы (например, расчет хода луча через поверхность и систему поверхностей) целесообразно для получения более эффективной рабочей про- программы и, следовательно, сокращения времени выполнения писать на языках низшего уровня — АССЕМБЛЕРАХ, приближенных к системе команд конкретной ЭВМ [14]. Исходные данные и заказы ЭВМ Диспетчер L^J^J. банк данных Результат* / Рис. 1.2. Примерная структура САПР оптических систем Примерная схема программного обеспечения САПР оптических систем показана на рис. 1.2. Математический аппарат. При изложении практически любых вопросов, связанных с автоматизацией проектирования оптических систем, оказывается очень плодотворным и удобным применение математического аппарата матричной и линейной алгебры. При- Применение символики и понятий этих разделов математики позво- позволяет значительно упростить запись формул и преобразования, а также сопоставить многим понятиям наглядную геометрическую аналогию, облегчающую понимание их сущности. Предполагая, что читатель знаком с основными положениями линейной ал- алгебры, например, по книгам [11, 12, 13, 32], укажем здесь лишь некоторые обозначения, не являющиеся общепринятыми. Векторы в n-мерном пространстве будем обозначать жирными строчными буквами, матрицы — жирными прописными буквами, а их элементы — нежирными буквами, например: х = щ 16
ч VO dn Матрицы-столбцы будем рассматривать как векторы, строки — как транспонированные векторы, причем транспонирование об- обозначать индексом Т, хт = (х1У х2, ..., хп). Скалярное произведе- произведение двух векторов будем записывать как произведение одного транспонированного вектора на другой; под ||х|| будем понимать длину (евклидову норму) вектора. Таким образом: (х, у) = хту = утх = 2хаг, 1х) Для обозначения вектора градиента скалярной функции f (x) векторного аргумента будем использовать следующую запись: с df I df \ - В соответствии с формализмом матричной алгебры символом VVT/ будем обозначать матрицу Гессе вторых производных функ- функции / (х) =zz — дх1 \ dxt -1 При помощи -^- будем обозначать матрицу первых произ- производных векторной функции i (x) векторного аргумента (матрицу Якоби). Решение системы линейных алгебраических уравнений Ах = b будем формально записывать в виде х — A-1b, где А — матрица, обратная А, хотя фактически для нахождения х опера- операция обращения матрицы не производится, а система Ах = b решается стандартным методом гауссовского исключения с вы- выбором ведущего элемента и с использованием стандартных про- программ линейной алгебры, например, приведенных в сборнике [28].
Глава 2 ХАРАКТЕРИСТИКИ И ПАРАМЕТРЫ ОПТИЧЕСКИХ СИСТЕМ Задачей автоматизированного проектирования является опре- определение значений конструктивных параметров, обеспечивающих требуемые или оптимальные значения функциональных характе- характеристик. В свою очередь, правильный выбор параметров и характери- характеристик определяется математическими моделями, описывающими оптическую систему как объект проектирования, а именно: внеш- внешней и внутренней функциональными и конструкционными моде- моделями. Рассмотрению этих моделей и посвящена гл. 2. § 4. ВНЕШНЯЯ ФУНКЦИОНАЛЬНАЯ МОДЕЛЬ ОПТИЧЕСКОЙ СИСТЕМЫ Внешняя функциональная модель описывает общие закономер- закономерности формирования изображения в оптических системах, не связанные с физическими принципами их работы. Она исполь- используется на высшем уровне проектирования, где оптическая система рассматривается с внешних позиций как обобщенный преобразова- преобразователь некоторого сигнала. Поэтому полученные закономерности и характеристики — внешние характеристики — являются об- общими, пригодными для описания любых приборов, формирующих изображение независимо от их устройства и при соблюдении принятых ограничений. Внешняя функциональная модель отражает точку зрения заказчика оптической системы и позволяет легко описать еди- едиными понятиями работу сложной цепи или каскада преобразова- преобразования информации. Этот каскад включает в себя кроме оптической системы такие преобразователи, как фотографическую эмульсию, электронные блоки, фотоэлектрические преобразователи, телеви- телевизионные системы и другие, характерные для современных опти- оптических и оптико-электронных приборов. Так как при этом опти- оптическая система рассматривается как линейный фильтр сигнала, то математический аппарат внешней модели основан на теории линейной фильтрации и линейных систем, изложенной в работах [10, 21, 22], применительно к двумерным пространственным (оптическим) сигналам, 18
Описание предмета и изображения. Каждый изображающий прибор воспринимает информацию от предыдущего звена каскада и передает последующему. Входную информацию — входной сиг- сигнал — будем называть предметом, а выходную — изображением. Для построения универсальной внешней модели нам необхо- необходимо абстрагироваться от конкретного физического содержания предмета и изображения и рассматривать их как некоторые обобщенные сигналы или функции I (х) и Г (х') обобщенных ин- (х\ тенсивностей от векторов обобщенных координат х —-- I ixf 11 ж' - [у Для оптических систем и приборов, с ними непосредственно сопрягаемых, предмет и изображение являются оптическими сиг- сигналами, а обобщенные координаты хих' есть двумерные простран- пространственные координаты на некоторых поверхностях: поверхности предмета SA и поверхности изображения S'A. Конкретный смысл этих координат зависит от типа предмета и изображения, а также от формы их поверхностей. Для простоты будем рассматривать изображающие приборы с круговой симметрией, у которых все свойства инвариантны к повороту вокруг некоторой оси, а по- поверхности предмета и изображения будем считать плоскостями, перпендикулярными этой оси. Применительно к оптическим приборам можно выделить два типа предмета и изображения: удаленный предмет или изображе- изображение (на бесконечности) и близкий предмет или изображение (на конечном расстоянии). В первом случае обобщенные координаты на поверхности предмета или изображения есть угловые коорди- координаты, наблюдаемые из некоторого полюса — центра зрачка. По- Поместим начала систем координат Oxyz и О'х'у'г' в полюсы О и О' и направим оси г и zf на точки Ло и Ло, относительно которых определяются координаты точек Л и Л' (рис. 2.1, а). Угловые координаты точек А и Л' есть тангенсы углов, образуемых проек- проекциями радиус-векторов этих точек на координатные плоскости Oxz, Oyz и O'x'z' I O'y'z' с осью z или z1, т. е.: x=L ; х'= L . B.1) UgcoJ' \tgcoW Нетрудно также заметить, что: х ==: —гД; х' = —Гр"га.\ B.2) I *а\ , / хА \ где а = ; а = — двумерные радиус-векторы проек- \Уа) \Уа) ций точек Л и Л' на плоскости Оху и О'х'у'. Обобщенная интенсивность удаленного предмета есть энерге- энергетическая яркость1, а обобщенная интенсивность удаленного 1 В дальнейшем все световые величины подразумеваются энергетическими- 19
изображения есть энергетическая сила света выходного зрачка прибора в данном направлении. Во втором случае, т. е. для близкого предмета или изображе- изображения, обобщенные координаты есть линейные координаты: декар- декартовы координаты хА> уА или х'А, у'л точки А или Аг в системах координат Охуг и O'x'y'z', совпадающих с плоскостями SA и S'A соответственно, как показано на рис. 2.1, б, т. е.: х = а == ХА); (? у а ! \уа. Начала координат О и О' совпадают с центрами Ао и мета и изображения. а) B.3) пред- Рис. 2.1. Системы обобщенных координат: для удаленного (а) и для близкого (б) предмета и изображения Обобщенная интенсивность предмета и в этом случае есть яр- яркость, а интенсивность изображения — освещенность его пло- плоскости. Впоследствии будем обозначать удаленный предмет или изоб- изображение символом 0, а близкий — 1. Возможные комбинации типов предмета и изображения образуют четыре типа изобража- изображающих приборов, которые будем обозначать числами 00, 01, 10, 11, где первая цифра указывает тип предмета, а вторая — тип изобра- 20
жения. Применительно к оптическим системам эти приборы имеют следующие наименования: 00 — телескопическая система; 01 —фотографический объектив; 10 — микроскоп; 11 —репро- —репродукционная система. Изображающий оператор. Задачей изображающего прибора является преобразование входного сигнала — функции предмета / (х) в выходной сигнал —• функцию изображения /' (х'). Внешняя функциональная математическая модель изображающего прибора есть оператор (обозначим его L), осуществляющий это преобразо- преобразование в виде: /' (х') = L [/(х)], или /(х) ->/' (х'). В теории изображения предполагается, что этот оператор удо- удовлетворяет двум условиям: линейности, т. е. изображение суммы равно сумме изображений B.4) а также изопланатичности, или пространственной инвариантности Дх-а)-^/'(х'-а'), B.5) т. е. при смещении предмета на вектор а изображение только смещается на вектор а', причем а' пропорционален а, а именно: а' = Уа, где V — матрица обобщенных увеличений. Пусть в центре данной зоны имеется светящаяся точка единич- единичной энергии. Изображение этой точки — пятно рассеяния — опишется некоторой функцией h (x'), называемой функцией рас- рассеяния точки (ФРТ) данного прибора. Если теперь любой предмет / (х) представить в виде совокупности бесконечно близко распо- расположенных точек, то согласно формулам B.4) и B.5) изображение каждой точки будет описываться функцией / (х) h (х — Vx) dx, а изображение всего предмета — как бесконечная сумма таких изображений, т. е. как интеграл /' (х') = j J / (х) h (x' - Vx) dx. B.6) —оо Последняя формула описывает формирование изображения любым линейным изопланатическим прибором через его ФРТ, т. е. представляет собой линейный изопланатический изображающий оператор. Изопланатические зоны. Зональные и глобальные координаты и характеристики. Оптические системы с высокой степенью точ- точности можно считать линейными в рабочем интервале интенсив- ностей, но условие изопланатизма на всей поверхности предмета соблюдается крайне редко. Поэтому мы приходим к необходи- необходимости разбить поверхность предмета (и соответственно поверхность изображения) на ряд таких небольших изопланатических зон, 21
в пределах которых отступления от условия изопланатизма не- невелики. Таким образом, мы представляем работу оптической системы совокупностью линейных изопланатических операторов 1см. формулу B.6)], соответствующих различным зонам предмета (различным точкам или величинам предмета). При этом под точкой предмета подразумевается центр данной изопланатической зоны, а под величиной предмета или изображения для систем с круговой симметрией — расстояние этой точки от оси в обобщенных коорди- координатах. Будем обозначать через у0 и t/o обобщенные величины пред- предмета или изображения при хд = х'о — 0. В связи с рассмотрением передачи изображения в отдельных зонах предмета возникает необходимость введения систем координат, описывающих функцию предмета и изображения в пределах данной зоны, т. е. зональных систем координат. Соответственно и характеристики, описыва- описывающие передачу изображения в пределах данной зоны, мы будем называть зональными характеристиками. Зональные обобщенные координаты (относительно центра данной зоны) мы будем по- прежнему обозначать х и х'. Координаты же и свойства, относя- относящиеся ко всей поверхности предмета, мы будем называть глобаль- глобальными и обозначать х0, Хо. § 5. ВНЕШНИЕ ХАРАКТЕРИСТИКИ ОПТИЧЕСКИХ СИСТЕМ КАК ИЗОБРАЖАЮЩИХ ПРИБОРОВ Основными характеристиками внешней модели будут те, кото- которые показывают, как прибор преобразует предмет в изображение, т. е. чем отличается функция предмета от функции изображения. Назовем эти характеристики передаточными. С целью удобства и наглядности описания все передаточные характеристики можно разделить на три группы в соответствии с передачей в изображении различных свойств предмета: масштабные, энергетические и струк- структурные (частотные). Масштабные передаточные характеристики. Эти характери- характеристики описывают передачу прибором размеров и формы предмета или, другими словами, преобразование координат точек предмета в координаты соответствующих этим точкам изображений. Пусть координаты какой-либо точки предмета А есть х, а координаты центра ее изображения (пятна рассеяния) х\ Масштабные пере- передаточные характеристики описывают преобразование координат Если прибор удовлетворяет условию изопланатизма, то это преобразование не должно зависеть от положения точки на по- поверхности предмета и, следовательно, должно быть линейным преобразованием вида х' = Vx, B.7) где V — матрица размерности 2x2 обобщенных увеличений. 22
Всегда можно выбрать ориентацию систем координат на по- поверхностях предмета и изображения таким образом, что матрица обобщенных увеличений будет диагональна, т. е. будет иметь вид где vx — обобщенное увеличение в направлении х\ vy — обобщен- обобщенное увеличение в направлении у При этом формула B.7) принимает вид: х' = vxx; Итак, масштабные передаточные характеристики любых строго изопланатических приборов описываются в общем случае двумя параметрами — обобщенными увеличениями vx и vy. Для изо- изопланатических приборов с круговой симметрией из соображений симметрии увеличения vx и vy должны быть равны друг другу и для таких приборов достаточно одного параметра — обобщенного увеличения v0 — vx = vy. Изображение в таких приборах подобно предмету и называется ортоскопическим. В реальных приборах соотношение B.7) справедливо только в пределах каждой зоны, и параметры vx, vy называются обобщен- обобщенными зональными увеличениями. В приборах с круговой симме- симметрией зональные увеличения равны друг другу в общем случае только в параксиальной, т. е. близкой к оси зоне, в которой имеем х' = vQOx, где v00 — параксиальное обобщенное увеличение. Преобразование глобальных координат, т. е. изображение предметов, занимающих значительную часть поля зрения в при- приборах с круговой симметрией, должно быть инвариантно к пово- повороту, но не обязательно должно быть линейным, а именно xi = i>o[l+A(*o + WJIxo, B.9) где v0 — обобщенное глобальное увеличение; А (х\ + yl) — функ- функция относительной дисторсии, выражаемая обычно в процентах. Так как в приборах с круговой симметрией мы принимаем х0 = 0, то можно записать, что 0. B.10) Глобальное увеличение v0 может быть принято равным пара- параксиальному увеличению либо выбрано из условия минимума (например, в среднеквадратичном смысле) дисторсии. В последнем случае оно называется фотограмметрическим обобщенным увели- увеличением. Обобщенное увеличение или масштаб изображения мы опре- определили как отношение обобщенной величины изображения к об- обобщенной величине предмета. Это определение является общим для всех изображающих приборов, однако для приборов различ- 23
ных типов @0, 01, 10, 11), в соответствии с различным смыслом величины предмета и изображения, обобщенное увеличение имеет следующие размерность и название: Тип Предмет Изображение Обобщенное увеличение Размерность 00 Угловой Угловое Угловое или видимое увеличение — 01 » Линейное Переднее фотограмметрическое мм фокусное расстояние 10 Линейный Угловое Обратное заднее фокусное рас- мм стояние 11 » Линейное Поперечное увеличение — При проектировании оптических систем необходимо получить заданное значение глобального увеличения v0, а функцию относи- относительной дисторсии удерживать в заданных пределах (для обычных систем — в пределах нескольких процентов, а для систем, пред- предназначенных для измерительных целей, — до сотых и тысячных долей процента). Энергетические передаточные характеристики. Эти характе- характеристики описывают передачу прибором энергии предмета. Опре- Определим обобщенную энергию некоторого участка предмета или изображения как интеграл от функции их обобщенных интенсив- ностей по обобщенным координатам в пределах требуемого уча- участка, а именно: Е= J J/(x)dx; ?'= J \r(x')dx'. B.11) $А s'a Конкретный физический смысл обобщенной энергии зависит от смысла обобщенных интенсивностей и координат и, следова- следовательно, от типа предмета или изображения. Нетрудно установить, что обобщенная энергия удаленного предмета есть освещенность зрачка данной площадкой предмета, а обобщенная энергия близ- близкого предмета есть сила света данного участка предмета. Обобщен- Обобщенная энергия как близкого, так и удаленного изображения оказы- оказывается потоком, участвующим в формировании данного участка изображения. Передача энергии в пределах данной зоны определяется коэф- коэффициентом Я, который выражается соотношением Я = ЕЧЕ. B.12) Если сравнивать энергии предмета и изображения, перенесен- перенесенных в масштабе на одну поверхность, то получим другой коэффи- коэффициент Я', а именно E'r \\l> (Vx) dx det (V)-i J J /' (x') dx' R, E \\l(x)dx 24 - п = Н det (V)-\ B.13) I I / (V-!x') dx' det (V) I I / (x) dx
где det (V) = vxvy — определитель матрицы обобщенных увели- увеличений. Коэффициенты Я и Я' по аналогии с соответствующими поня- понятиями в теории оптических систем можно назвать обобщенными светосилами: Н — передняя зональная обобщенная светосила, а Я' — задняя зональная обобщенная светосила. Для линейных изопланатических приборов светосилы Я и Я' не зависят от вида предмета, т. е. являются собственными характеристиками при- прибора. Обобщенные светосилы Я и Я', как и светосила в теории оптических систем, характеризуют способность прибора давать более или менее яркие (интенсивные) изображения, но носят более общий характер. В частности, интенсивность изображения равно- яркого предмета пропорциональна, как нетрудно убедиться, зад- задней свэтогиле. Светосилы Я и Я' описывают работу прибора в пределах данной зоны. В общем случае для различных зон они могут быть различны, и в таком случае прибор дает неравномерное по полю изображение равнояркого предмета. Это свойство прибора можно охарактеризовать функциями светораспределения по полю, опре- определяемыми следующими соотношениями: ТТ Ф ¦= -77 передняя функция светораспределения; /7 п Я' 12.14) ф = — задняя функция светораспределения, "О где Но и Но —¦ центральные обобщенные светосилы, соответству- соответствующие центральной зоне. При проектировании оптической системы прибора нужно стремиться к получению функций светораспределе- светораспределения, особенно задней, как можно более близких к единице для всех величин предмета. Величина светосилы должна быть не менее заданной, обеспечивающей необходимую величину энергии или интенсивности изображения при заданном уровне энергии или интенсивности предмета. Заметим, что при изображении протя- протяженных предметов важна задняя светосила, а при изображении точечных предметов — передняя. Структурные передаточные характеристики. Изображающие приборы с одинаковыми увеличениями и светосилами могут давать изображения различного качества в смысле передачи тонкой структуры предмета (например, более или менее резкие, с боль- большим или меньшим различием мелких деталей). Способность пере- передавать тонкую структуру предмета относится к числу важнейших свойств изображающего прибора. Чтобы при рассмотрении передачи структуры предмета от- отвлечься от передачи энергии, вместо ФРТ h (x) используют нор- нормированную ФРТ h± (x;), энергия которой равна единице, т. е. Мх') = нг-; l\hx{xf)dxf =1. B.15) —оо 25
Нормированная ФРТ характеризует в чистом виде передачу прибором структуры предмета. В дальнейшем для упрощения записи мы будем индекс 1 опускать и под h (x) подразумевать нормированную ФРТ. Теперь исключим из выражения B.6) масштабные преобразования, описываемые матрицей обобщенных увеличений V. Для этого будем рассматривать предмет и изобра- изображение, приведенными на одну поверхность, т. е. изображаемыми с единичным увеличением. В результате получим следующую формулу, описывающую передачу структуры предмета: /(х') = J J /(x) h (x' - x)dx, B.16) где координаты х и х' рассматриваются в одном масштабе. В ма- математике подобное выражение, связывающее три функции /, h и /', называется сверткой и обозначается знаком <g>, т. е. /' = / ® h. Можно сказать поэтому, что передача структуры предмета описывается сверткой функции предмета с нормированной функ- функцией рассеяния точки. Для квазиодномерных (линейчатых) пред- предметов, интенсивность которых постоянна в одном направлении (например, в направлении у')9 удобно вместо ФРТ рассматривать функцию рассеяния линии (ФРЛ), представляющую собой распре- распределение интенсивности в изображении прибором бесконечно длин- длинной линии, совпадающей с осью у'. Как нетрудно видеть, ФРЛ связана с ФРТ следующим соотношением: ФРЛ =s(x')= j h(x\ y')dy'. B.17) '—ОО В астрономии для описания качества изображения приме- применяется функция концентрации энергии (ФКЭ), показывающая зависимость энергии ФРТ, содержащейся в круге определенного диаметра, от величины этого диаметра E(D')= \ f A^x'Jdx', B.18) где интегрирование производится по кругу диаметром D'. ФРТ, ФРЛ и ФКЭ могут быть выражены либо в координатах на поверх- поверхности изображения, либо в координатах на поверхности пред- предмета. Переход от одних координат к другим дается масштабным преобразованием B.7). Так, для фотографических объективов принято определять размеры ФРТ на поверхности изображения в миллиметрах, для астрономических приборов принято ФРТ и ФКЭ выражать в угловых координатах на поверхности предмета и для микроскопов — в линейных координатах на поверхности предмета. 26
Частотные передаточные характеристики. Описание пере- передачи структуры предмета в виде свертки функции предмета с ФРТ или ФРЛ хотя и является полным, но не всегда удобно и наглядно. Происходит это прежде всего потому, что сами функции предмета / (х) и изображения /' (х') не вполне наглядно представляют тонкую структуру предмета и изображения и должны быть за- заменены другими. Наиболее подходящим эталоном структуры является пери- периодический гармонический предмет (пространственное колебание), Рис. 2.2. Пространственное гармоническое колебание: в коор- координатном (а) и частотном (б) пространствах показанный на рис. 2.2. Он характеризуется пространственной частотой v (величиной, обратной периоду 7), углом ориентации Э относительно системы координат х, у, амплитудой и и начальным сдвигом Ь (начальной фазой <р = 2nvb)y причем и я b могут быть объединены в одну комплексную величину — комплексную ам- амплитуду g = и ехр (—i X 2nvb). Чем больше пространственная частота v, тем тоньше структура предмета. Пространственная частота имеет единицы измерения, обратные обобщенным коорди- координатам х. Так, для близкого предмета или изображения принято говорить о пространственной частоте в линиях на миллиметр, для удаленного — в линиях на радиан. Частоту v и угол Э можно считать длиной и углом с осью абсцисс некоторого вектора v в частотной плоскости (рис. 2.2, б). Проекции этого вектора на оси равны vx = v cos 6 и vu = v sin 6 и представляют собой ча- частоты пространственного колебания в направлениях х и у соот- соответственно. Как известно, структурное содержание сложного объекта / (х) или изображения /' (х') нагляднее всего описывается их спек- спектрами пространственных частот I (v) и /' (v'), показывающих распределение комплексных амплитуд по пространственным коле- колебаниям, на которые могут быть разложены / (х) и /' (х'). Функ- 27
ции предмета и изображения и их спектры частот связаны между собой преобразованием Фурье в соответствии с формулами: F „ I (х) *-> / (v) или / (v) = J J / (х) exp [2ш (vTx)] dx; —оо F +°° Z'(x') <->/>') или 7'(v') = f J/'(x')expl2m(v'V)Idx'. — сю Передача изображающим прибором структуры предмета, сле- следовательно, нагляднее всего описывается как передача его спектра пространственных частот. Выражение, определяющее передачу структуры в терминах пространственных частот, можно легко получить из формулы свертки B.16), применив к обеим ее частям преобразование Фурье. При этом, в соответствии со свойствами этого преобразования, операция свертки переходит в простое умножение, и мы имеем 7'(v) = 7(v)D(v), B.19) где функция D (v) = F [h (х')] представляет собой двумерное преобразование Фурье от ФРТ и называется оптической переда- передаточной функцией (ОПФ). Формула B.19) называется соотноше- соотношением фильтрования и показывает, что спектр пространственных частот изображения получается как произведение спектра про- пространственных частот предмета на оптическую передаточную функцию прибора. Последняя служит наиболее наглядной и удоб- удобной структурной (частотной) передаточной характеристикой для данной зоны. Естественно, что в выражении B.19) пространствен- пространственные частоты предмета, изображения и ОПФ должны рассматри- рассматриваться на одной поверхности — поверхности предмета или изобра- изображения. Приведение частот на одну поверхность осуществляется по формулам масштабных преобразований, обратным выраже- выражению B.7): у' = УЧ; v=Vv\ B.20) ОПФ в общем случае является комплексной функцией и пред- представляется двумя вещественными функциями: модулем Т (v) — модуляционной передаточной функцией (МПФ), называемой также частотно-контрастной характеристикой (ЧКХ), и аргументом Ф (v) — фазовой передаточной функцией (ФПФ), называемой также частотно-фазовой характеристикой (ЧФХ), а именно D(v) = 7»exp[/(p(v)]. B.21) Присоединительные характеристики. Одних передаточных ха- характеристик для полного описания внешней функциональной модели изображающего прибора недостаточно. Для правильной его работы в каскаде необходимо согласование с предыдущим звеном — генератором предмета и последующим — приемником 28
изображения. Характеристики, содержащие информацию, необ- необходимую для такого согласования, назовем присоединительными. Присоединительные характеристики, относящиеся ко входу при- прибора (предмету) назовем входными или передними, а к выходу прибора (изображению) — выходными или задними. Можно вы- выделить три различные группы присоединительных характеристик. Рис. 2.3 Определение присоединительных характери- характеристик оптических систем: для близких (а) и удален- удаленных (б) предметов и изображений 1. Характеристики предмета и изображения включают в себя: s и sf — обобщенные передний и задний отрезки — величины, указывающие расстояния до предмета и изображения. Для близ- близкого предмета или изображения обобщенные отрезки естественно измерять в миллиметрах от прибора, как показано на рис. 2.3, а, но для удаленных предмета или изображения такое определение не имеет смысла, поэтому определим для этого случая обобщенные отрезки в обратных миллиметрах (килодиоптриях) или обратных метрах (диоптриях) от зрачка до предмета или изображения соот- соответственно (рис. 2.3, б); 2у0 и ?уо — обобщенные размеры поля в пространстве предметов и изображений, которые определяются как удвоенные 29
максимальные размеры предмета или изображения в обобщенных глобальных координатах. Для близкого предмета или изображе- изображения 2г/отах и 2уотах — линейные величины и измеряются в милли- миллиметрах, как показано на рис. 2.3, а, для удаленных предмета и изображения — это угловые величины и измеряются тангенсами углов, под которыми видны крайние точки предмета и изображе- изображения из центров зрачков (рис. 2.3, б), т. е.: ak — относительные величины предмета, показывающие коли- количество и расположение изопланатических зон, на которые раз- разбивается поле зрения. Координата у0 центра каждой зоны равна 2. Зрачковые присоединительные характеристики указывают положение, форму и размеры зрачков приборов. Действие зрачка для данной зоны, как известно, проявляется в ограничении раз- размеров телесного угла, в котором распространяется входящее в прибор или выходящее из него излучение точки предмета. Зрач- Зрачковые присоединительные характеристики включают в себя сле- следующее. Обобщенные положения зрачков sp и sj,, которые показывают точки пересечения осей телесных углов с осью прибора (рис. 2.3). Для удаленного предмета или изображения (рис. 2.3, б) важно знать положение зрачка относительно прибора, поэтому sp и Sp определим как расстояния от прибора до центров зрачков в миллиметрах, причем sp= t\ sp= t'. Для близкого предмета или изображения (рис. 2.3, а), напротив, важно знать положение зрачков относительно предмета или изображения, например, для передачи перспективы, а также для установления зависимости увеличения от смещения предмета или изображения, причем рас- расстояния t и /' в этом случае могут быть бесконечно велики (теле- (телецентрический ход главных лучей). Поэтому для близкого предмета или изображения обобщенное положение зрачка удобно опре- определяется в обратных миллиметрах (килодиоптриях) или в обрат- обратных метрах (диоптриях) относительно предмета или изображения. Обобщенные апертуры, которые описывают размеры зрачков. Полное определение этих понятий будет дано в следующем пара- параграфе. Укажем здесь только, что размеры зрачков определяются как размеры сечений входящего и выходящего телесных углов сферами Sp и Sp, описанными вокруг центров Ло и Л о зон пред- предмета или изображения (рис. 2.3). Для близких предмета и изобра- изображения обобщенные апертуры определяются как угловые величины и выражаются в синусах углов, а для удаленных — как линейные. Такое определение наиболее правильно отражает влияние апертур как размеров зрачка на дифракционную структуру изображения и светосилу, а также позволяет получить соотношения, явля- являющиеся универсальными для любых систем, 30
3. Спектральные присоединительные характеристики необ- необходимы для согласования интервала длин волн излучения, в ко- котором воспринимается предмет и образуется изображение. Они включают в себя: Ян, Яв — нижнюю и верхнюю границы рабочего интервала длин волн и т (к) — функцию относительного спектраль- спектрального пропускания. Вместо Хп и А,и часто удобнее употреблять связанные с ними величины А,о — ¦ в "Г н — центральную или основную длину волны и АХ = в 2 н полуширину рабочего интервала длин волн. При этом функция спектрального про- пропускания выражается в относительных (канонических) спек- спектральных координатах % в виде т (%), где Х = -^- B-22) § 6. ВНУТРЕННЯЯ ФУНКЦИОНАЛЬНАЯ МОДЕЛЬ ОПТИЧЕСКОЙ СИСТЕМЫ Внутренние характеристики основываются на внутренней мо- модели, описывающей физические процессы формирования оптиче- оптического изображения. Физическим носителем информации в опти- оптических системах является электромагнитное поле, поэтому прежде всего необходимо кратко рассмотреть описание электромагнит- электромагнитного поля, удобное для построения внутренней функциональной модели. Описание и распространение электромагнитного поля. В боль- большинстве случаев достаточно рассматривать монохроматическое поле в скалярном приближении в соответствии с работами [4, 10, 21]. Для такого поля возмущение в каждой точке М (х, у> г) пространства зависит от времени t по гармоническому закону и может быть записано в комплексном виде как гармоническое колебание V(M, t) = u(M)exp(ikct), где k = 2 jx/X, —волновое число; К — длина волны; с — скорость света. Величина и (М) называется комплексной амплитудой поля в точке М и выражается в виде и (М) = а (М) ехр [йр (М)] = а (М) exp [ikE(M)], B.23) где а (М) = | и (М) | — вещественная амплитуда q> (M) = = arg [и (М) ] — фаза поля; Я (М) = ср (M)/k — эйконал поля, имеющий размерность единиц длины. Мы видим, что комплексная амплитуда полностью определяет монохроматическое поле; в дальнейшем, говоря «поле», мы будем иметь в виду комплексную амплитуду. Любые приемники не- непосредственно комплексную амплитуду не воспринимают, так как 31
они реагируют на интенсивность поля I (УИ), равную квадрату амплитуды а (М) или квадрату модуля комплексной амплитуды / (М) = а2 (/И) -= | (М) |2 - и (М) и* (Л!), •B.24) где * означает комплексное сопряжение. Фаза или эйконал поля непосредственно приемником не реги- регистрируется. Интенсивность полихроматического поля находится как сумма (в пределе — интеграл) интенсивностей монохромати- монохроматических полей с различными длинами волн при учете весовой функции q (i), показывающей относительный вклад каждого поля: К п5 =-i- J Q= j q(X)dk. B.25) Рис. 2.4. Схема геометрического рас- распространения электромагнитного поля в оптической системе Для анализа работы опти- оптической системы нам необходимо р ассмотреть р аспростр анение поля. При этом мы будем поль- пользоваться двумя выражениями. Первое выражение описывает так называемое геометрическое, или лучевое распространение, когда считают, что поле распространяется вдоль бесконечно узких световых трубок — лучей, перпендикулярных к фронту волны распространяющегося поля. Этот фронт последовательно совпадает с поверхностями равного эйконала, называемыми волновыми поверхностями (рис. 2.4). Отсюда следует, что орт q луча в каждой точке есть нормаль к волновой поверхности и может быть найден как градиент эйконала по формуле 1 q = —" B.26) Оптическая длина отрезка любого луча между двумя волно- волновыми поверхностями одинакова. Под оптической длиной, как изве- известно, понимается сумма [/] - 2 nklk. B.27) В средах с постоянным показателем преломления отрезки луча — прямые линии; прч переходе из среды в среду направле- направление луча меняется в соответствии с законом преломления, который в векторном виде формулируется так: n[q X g] = n'[q# X g], B.28) 32
где qnq' — орты падающего и преломленного луча; п к п' — по- показатели преломления сред; g — вектор нормали в точке падения; квадратные скобки обозначают векторное произведение. Итак, в векторном приближении можно рассматривать либо распространение лучей, либо нормальных к ним волновых поверх- поверхностей. Если известно поле и (Р) в точке Ру то поле и' (Р') в точке Р' в геометрическом приближении находится по простой формуле /2, B.29) где / (Р, Р') = т1^ (Р, Р') exp \ — ik [/>, р'\\ —функция ком- комплексного пропускания среды вдоль луча между точками Р и Р'\ х (Р, Р') — коэффициент энергетиче- энергетического пропускания; [Р, Р') — оптиче- оптическая длина луча, соединяющего точки Р и Р'\ dSp и dS'p — площади бесконечно малых площадок, вырезаемых лучевой трубкой на поверхностях Sw и S'w- Геометрическим приближением нель- нельзя пользоваться в тех случаях, когда волновые поверхности терпят изломы, а амплитуда поля меняется слишком резко, т. е. вблизи поверхностей пред- Рис- мета или изображения. В этом случае пользуются дифракционным интегралом в соответствии с принципом Гюйгенса — Френеля, который представляет поле в какой-либо точке Р как суперпози- суперпозицию полей, приходящих в Р от различных точек поверхности SA (рис. 2.5). Пренебрегая постоянным множителем, дифракционный интеграл можно представить в виде и {Р) = J J и (А) Г1 exp (~-iknr) К (a) dSA, B.30) SA где г — расстояние от Л до Р. Существуют различные формы дифракционных интегралов {Френеля, Кирхгофа, Зоммерфельда, Релея и другие [4, 21]}, которые несколько отличаются друг от друга, в частности, видом углового множителя К (а). Однако для анализа оптических си- систем эти отличия несущественны; более того, в большинстве слу- случаев углы а весьма малы и можно принять /С (а) = 1. Схема работы оптической системы. Рассмотрим, как оптиче- оптическая система формирует изображение некоторой точки Ло, на- например, центра некоторой зоны предмета (рис. 2.6). Можно рассматривать гомоцентрический пучок лучей, выходя- выходящих из этой точки, проходящий оптическую систему ОС и сходя- сходящийся к точке изображения Aq. Вместо пучка лучей можно также рассматривать сферический волновой фронт SWt концентричный Ло, распространяющийся далее через оптическую систему, оста- 33
ваясь нормальным ко всем лучам пучка. При любой трактовке действие оптической системы сводится к следующим четырем факторам: — преобразованию пучка лучей или волнового фронта, рас- расходящегося из точки предмета, в сходящийся к точке изобра- изображения; — ограничению размеров проходящего пучка лучей или волно- волнового фрхшта; — ослаблению интенсивности (амплитуды) проходящего поля; — нарушению гомоцентричности пучка или сферичности вол- волнового фронта, или изменению фазы проходящего поля. Рис. 2.6. Схема работы оптической системы Для рассмотрения всех этих факторов необходимо ввести коор- координаты, определяющие положение луча в пучке, или точки на волновом фронте — так называемые зрачковые координаты. Зрачковые координаты. В теории изображения принято опре- определять зрачковые координаты как координаты точек Р и Р' пере- пересечения луча с так называемыми входной и выходной сферами сравнения или опорными сферами Гаусса SP и S'p, концентрич- концентричными точке предмета Ао и точке ее идеального изображения А'о (рис. 2.7). Эти координаты определяются по-разному в зависи- зависимости от типа предмета и изображения. Каждому лучу приписы- I Рх \ вается пара входных зрачковых координат или вектор р = I \ Ру J и пара выходных зрачковых координат или вектор Р = I , • Для близкого предмета или изображения зрачковые координаты определяются как угловые: входные выходные B.31) — двумерные радиус-векторы про- где b = и b' = , екций точек Р и Р на координатные плоскости Оху и О'х'у', 34
совпадающие с плоскостями предмета и изображения (рис. 2.7, а); гр и г'р — радиусы сфер SP и S'p. Нетрудно заметить, что / sin ох. \ ( sin ох \ р = nqo=—n ; р' = n'qo — —п' / , B.32) \SiuOyoJ V \ Sin OyJ' где qo и q0 — проекции ортов q0 и qo на координатные плоскости Оху и О'х'у'] оХо, оУо, oXq, Оуо — углы, образованные этими ортами Рис. 2.7. Определение обобщенных зрачковых координат: для близких (а) и удаленных (б) предметов и изображений с координатными плоскостями Oyz, Oxz, O'y'z1', О'х'?' соответ- ственно. Орт q0 есть орт луча, входящего в систему, а орт qo есть орт идеального луча, соединяющего точку Р' выходной сферы с точ- точкой идеального изображения А'о. Для удаленного предмета или изображения зрачковые коор- координаты определяются как линейные: входные выходные р = пЪ; p' = /z'b', B.33) где b и Ь' — двумерные радиус-векторы проекций точек Р и Рг на координатные плоскости Оху и О'х'у', перпендикулярные направлению из центров зрачков О и О' на предмет и изображение 35
(рис. 2.7, б). Определение зрачковых координат по формулам B.31) и B.33) позволяет получить простые и универсальные соотношения, приведенные в следующих разделах. Ограничение размеров фронта и ослабление интенсивности. Не все лучи, выходящие из точки Ао предмета, могут пройти через оптическую систему. Это явление, называемое ограничением раз- размеров пучков или фронтов, математически описывается посред- посредством областей Q и п' в обобщенных зрачковых координатах, внутри которых лучи, проходящие через систему, существуют, Рис. 2.8. Области зрачков в обобщенных координатах: а и б — для осевой точки, виг — для внеосевой точки при наличии виньетирования а вне их — не существуют (рис. 2.8). Эти области можно назвать областями зрачков. Размеры их определяются обобщенными апер- апертурами (см. § 5 гл. 2). Для осевой зоны, в силу симметрии, у центрированных систем зрачки являются кругами и для описания их размеров достаточно передней центральной обобщенной апертуры Ао> а также задней центральной обобщенной апертуры Aq. Во внеосевых зонах вследствие геометрического и аберра- аберрационного виньетирования зрачки отличаются от кругов. В боль- большинстве случаев их с удовлетворительной точностью можно аппро- аппроксимировать эллипсами (показанными на рис. 2.8, в, г пунктиром), размеры которых определяются их полуосями: для входного зрачка передними обобщенными апертурами Ах и Ау, для выход- выходного зрачка — задними обобщенными апертурами А'х и А'у. Итак, ограничение размеров пучков описывается обобщенными аперту- апертурами, которые представляют собой просто размеры зрачков, выраженные в обобщенных зрачковых координатах. В соответ- соответствии с формулами B.32) и B.33) для предмета или изображения близкого типа апертуры — угловые величины, а именно: полу- за
разности синусов углов, образованных направлениями из центров зон предмета или изображения на крайние точки зрачков с соот- соответствующими координатными плоскостями, а для предмета или изображения дальнего типа апертуры — линейные величины. Для систем с центральным экранированием необходимо до- дополнительно указать величину центрального экранирования е. При более сложных формах зрачков необходимо указывать урав- уравнение контура, причем проще всего это сделать в относительных координатах. Ослабление интенсивности описывается функцией пропуска- пропускания энергии, выраженной во входных или выходных зрачковых координатах: т (р) или т (р'). Эта функция удовлетворяет условию О <т <1. Аберрации оптических систем. Нарушение гомоцентричности выходящего пучка или сферичности волнового фронта носит назва- название аберраций и может быть описано в терминах лучевых или волновых аберраций. Каждому лучу можно сопоставить пару лучевых поперечных аберраций ( « , или вектор обобщенных поперечных аберраций 8 Ах' = 11, представляющий собой не что иное, как обоб- обобщенные координаты точки А' пересечения луча с поверхностью изображения в системе зональных координат с началом в точке А'о идеального изображения. Так, для близкого изображения обоб- обобщенные поперечные аберрации—линейные величины, для удален- удаленного — угловые. В последнем случае поперечные аберрации в со- соответствии с формулой B.2) могут рассматриваться как угловые отклонения реального луча q' от идеального qo, соединяющего точку Р' на зрачке с точкой Ао идеального изображения, как по- показано на рис. 2.6, т. е. Ах' = qo — q'. Кроме Ах', можно рас- рассматривать также поперечные аберрации Ах, перенесенные в про- пространство предметов Дх = УЛх/. Волновые аберрации описывают отклонение выходящего волно- волнового фронта от выходной сферы вдоль данного луча (см. рис. 2.6) и измеряются обычно в длинах волн W^^L. B.34) Из принципа равенства оптической длины всех лучей между волновыми фронтами следуют формулы, служащие для вычисле- вычисления волновой аберрации при расчете хода лучей через систему: W=±-\[P, Р']-[О, О']}; B,35) г-^нл, />']-и0. or)Y B,36) 37
где [Р, Р' ] и [Ло, Р' 1 — оптические длины данного луча между входной и выходной сферами или между точкой предмета Ао и выходной сферой; [О, О' ] и [Ло, О' ] — то же для главного луча пучка. Формула B.35) удобна при удаленном предмете, а B.36) — при близком. Волновая аберрация и поперечные аберрации ме- меняются от луча к лучу данного пучка, т. е. являются функциями зрачковых координат W = W (р); Ах' = Ах' (р) или W = W (р')'> Дх' == Ах' (р'). Так как эти функции описывают одно и то же As4s'-s'0),mm As'-(s'-sr0),dnmp Рис. 2.9. Продольные аберрации для осевой точки предмета: для близ- близкого (а) и удаленного (б) изображений явление, они должны быть связаны между собой. В курсах оптики [4, 27, 30] приводятся выражения, которые легко получить из дифференциальной геометрии лад/ , , ем Уа=г1 ЛА-<р щ , где x'Ai у'а — координаты точки А'\ х'р, уР — координаты точки Р' в какой-либо системе координат. Отсюда, принимая во внимание определение обобщенных поперечных аберраций и обобщенных зрачковых координат, дан- данные в формулах B.31) и B.33), а также волновой аберрации, пред- представленной формулой B.34), получаем обобщенную формулу dW / dW 6G' = —Я ' = -X dp' или Ах' = — B.37) где \W обозначает вектор градиента функции W (р'). Таким образом, вектор поперечных аберраций пропорционален градиенту волновой аберрации в обобщенных зрачковых координа- координатах. Формула B.37) справедлива для всех типов оптических систем. Кроме волновых и поперечных аберраций для центрирован- центрированных систем используют понятия продольных аберраций. Для осе- осевой точки предмета удобно рассматривать обобщенную продоль- продольную аберрацию As', которая показывает расстояние от плоскости 38
изображения до точки пересечения данного луча с осью. Она выражается в миллиметрах для близкого изображения и в обрат- обратных миллиметрах (килодиоптриях) или в обратных метрах (диоп- (диоптриях) для удаленного изображения (рис. 2.9), т. е.: близкое изображение удаленное изображение As'=s'-s'o As'-f-!™—N~Y B.38) Для внеосевых точек предмета понятие продольных аберраций применяется к главному лучу. Обобщенными продольными астиг- астигматическими отрезками zm и z's называются расстоя- расстояния от плоскости изобра- изображения до фокусов F'm wF's> в которых собираются лучи бесконечно узких меридионального и сагит- сагиттального сечений в окрест- окрестности главного луча (рис. 2.10). При близком изображении гт и zs из- измеряются в миллиметрах, при удаленном — в диопт- диоптриях: близкое изображение удаленное изображение 1000 1000 zs = т 1000 rP 1000 B.39) Рис. 2.10 Продольные астигматические oi- резки: для удаленного (а) и близкого (б) изображений Перенос зрачковых координат и неизопланатизм. Входные и выходные зрачковые координаты не являются независимыми. Можно показать, что при соблюдении условия изопланатизма B.5) преобразование зрачковых координат является линейным, причем обратным преобразованию B.7) координат предмета и изображе- изображения, т. е.: Vp' = р; р' = V-1p или B.40) Отступление от этого правила, обычно не превышающее долей процента, вызывает изменение аберраций при смещении предмета, 39
т. е. — неизопланатизм. В технической оптике широко исполь- используется величина относительного неизопланатизма в осевой зоне 15, 27, 30], которую можно вычислить по формуле При этом vx = vy = v0. Из формулы B.40) вытекает универсальное соотношение между передними и задними обобщенными апертурами, справедливое для любых систем: Ax = vxA'x\ Ay = vyAy\ Ao = vqAo. B.42) Канонические координаты. Анализ работы оптической системы существенно упрощается, если вместо реальных обобщенных зрачковых координат р и р', а также реальных обобщенных коор- координат на предмете и изображении х и х' ввести так называемые канонические координаты. Зрачковые канонические или относительные координаты полу- получаются нормированием обобщенных координат к соответствующим апертурам: 'х/а'х\ ,0 O B- В силу условий изопланатизма B.40) и B.42), канонические входные и выходные координаты равны друг другу р' = р. Отсту- Отступления от этого равенства, характеризующие неизопланатизм, в реальных системах не превышают долей процента, поэтому в дальнейшем не будем разделять канонические зрачковые коор- координаты на входные и выходные. Области зрачков, которые в об- обобщенных координатах были эллипсами с полуосями Ах, Ау и А'х, А'у, в канонических координатах превращаются в круги единич- единичного радиуса. Канонические, или приведенные координаты на предмете и изображении определяются соотношениями: (хАх\ f (Пх\ 1 [х'А'х U) UJUJ B-44) Из формул B.42) и B.7) получаем равенство ц' = т|. Таким обра- образом, в канонических координатах любая оптическая система (в пределах данной зоны) имеет единичное увеличение и круглый зрачок единичного радиуса. Связь между поперечными и волно- волновыми аберрациями в канонических координатах приобретает предельно простую форму дрх дру 40
т. е. вектор поперечных аберраций в канонических координатах есть градиент волновой аберрации. Пользуясь выражением B.45), а также полученными ниже в пп. 7 и 8, удобно анализировать структуру изображения и аберрации оптической системы в кано- канонических координатах, а затем, при необходимости перехода к ре- реальным координатам, воспользоваться соотношениями B.43)и B.44). Зрачковая функция. Все рассмотренные выше факторы воз- воздействия оптической системы на проходящий пучок или волновой фронт удобно объединяются в так называемой зрачковой функции, выраженной в канонических координатах ( t1/2(p)exp Г— 2niW{о)\ внутри зрачка Qo; /(р)= Л V F VfV n ° B.46) vr/ I 0 вне зрачка Qo. v ' Как мы только что показали, у центрированных систем область зрачка Qo в канонических координатах представляет собой круг единичного радиуса. Зрачковая функция совместно с длиной волны А, и апертурами Ах> Ау> А'х, А'у составляют полную вну- внутреннюю модель оптической системы в пределах данной зоны и для данной длины волны (зональную монохроматическую мо- модель). Эта модель позволяет полностью определить все передаточ- передаточные характеристики оптической системы, а затем промоделиро- промоделировать формирование изображения в соответствии с материалом, изложенным в предыдущем параграфе. § 7. ВЫРАЖЕНИЕ ПЕРЕДАТОЧНЫХ ХАРАКТЕРИСТИК ОПТИЧЕСКИХ СИСТЕМ ЧЕРЕЗ ЗРАЧКОВУЮ ФУНКЦИЮ Рассмотренная в предыдущем параграфе внутренняя функци- функциональная модель позволяет получить простые и универсальные выражения, связывающие внешние передаточные характеристики оптических систем со зрачковой функцией. Светосилы и функции светораспределения. Пользуясь опре- определением обобщенных координат на предмете и обобщенных зрач- зрачковых координат B.2), B.3), B.31) и B.33), можно получить универсальное выражение для потока F'y проходящего через оптическую систему и участвующего в формировании изображения площадки dx предмета, имеющей интенсивность /, \ J т (р) dp. Учитывая, что Idx есть обобщенная энергия предмета, a F' — обобщенная энергия изображения согласно §5 {формулы B.12) и B.13)}, получим выражения для светосил: #=jJT(p)dp; B.47) п Н> =7ПГ- = 7Г7Г f f Т(РМР = | Ыр')Ф'- B-48) Vx^'y Vxvy J J J J 41
где — площадь зрачка Введем канонические зрачковые координаты в соответствии с формулой B.43). Делая замену переменных, получим: Н = АХАУ j j т (р) dp; Н' = А'ХА'У \ \ т (р) dp, B.49) где интегрирование ведется по каноническому зрачку Qo. В большинстве случаев коэффициент пропускания т можно считать постоянным по зрачку и вынести его за знак интеграла. Тогда: Я = xAxAyQ0) Я' = xAxA'yQ0, B.50) в канонических координатах. Без центрального экра- экранирования канонический зрачок представляет со- собой круг единичного ра- радиуса, поэтому Qo = я. При наличии экраниро- экранирования зрачок — кольцо и Qo = я A — в2). Для осевой точки предмета Ах = AtJ = Ао и Ах = =^ Ау = А'о, поэтому: /|2. Рис. 2.11. Геометрическая функция рассея- рассеяния точки Яо = Яо = B.51) Легко из этих формул получить также функции светораспре- деления по полю: Ф — —— — АхАу . ф/ — Н — х у /о ргг>\ ФРТ и ОПФ оптических систем в геометрическом приближении. В геометрическом приближении, пренебрегая дифракцией, мы можем считать, что поле от предмета вплоть до изображения рас- распространяется по законам лучевой геометрической оптики, нигде не выходя за пределы бесконечно узких световых трубок, образо- образованных лучами. Рассмотрим на выходе из системы такую свето- световую трубку, образованную лучами, идущими от точки предмета (рис. 2.11). На этом рисунке dS'P и dS'A — площадки, вырезаемые световой трубкой на зрачке (выходной сфере) и изображении соответственно. Интенсивность в точке А' пятна рассеяния, оче- очевидно, пропорциональна площади dSp и коэффициенту пропуска- пропускания т (р), а также обратно пропорциональна площади dS'A. При- Причем dSrA и dSp в соответствии с предыдущим разделом параграфа должны быть выражены в обобщенных координатах dx' и dp'. Нормируя весь поток к единице, получим выражение для норми- нормированной ФРТ 42
Координаты х' и р', дифференциалы которых входят в преды- предыдущую формулу, не являются независимыми; Ах' — вектор по- поперечных аберраций и есть функция от р', поэтому отношение дифференциалов -?т- в соответствии с правилами математики есть так называемый якобиан зависимости Ах' (р'). Он равен модулю определителя матрицы Якоби д f , составленной из частных производных поперечных аберраций по зрачковым координатам т det д Ах' др'у др'х Так как одному значению поперечных аберраций Ах' могут соответствовать несколько значений зрачковой координаты р', то при нахождении hg(x') необходимо суммировать т(р')-р- по всем точкам зрачка, в которых поперечные аберрации равны х', т. е. из которых лучи попадают в одну и ту же точку А' (рис. 2.11) (p')J-K B.53) Удобно выразить геометрическую ФРТ в канонических коор- координатах в виде ? .г1 = CV1 ? т (р)-^Н-= ( ' B-54) В точках стационарности поперечных аберраций (в точках кау- каустики), где J = 0, геометрическая ФРТ обращается в бесконеч- бесконечность, что противоречит физическому смыслу (это обстоятельство является следствием пренебрежения дифракцией). Геометрическая ОПФ легко находится как фурье-преобразо- вание геометрической ФРТ. Выражая ОПФ в канонических ча- частотах s, получим + ОО Dg (s) = FL[hg D)J = fio J J т (p) -JJ- exp [2nl (r,Ts)J d4. Сделаем замену переменных: t] = Ail(p); d^^-^-dp. Тогда Dg (s) = QqX j J т (p) exp [2ш A^7 (p) sj dp. B.55) fio Канонические частоты s связаны с реальными v и v' соотноше- соотношениями, обратными приведенным в формуле B.44)* 43
ФРТ и ОПФ с учетом дифракции. Явление дифракции не Позво- Позволяет нам пользоваться геометрическим выражением B.29) вплоть до поверхности изображения, однако до выходного зрачка гео- геометрическое приближение вполне пригодно. Найдем поле на вы- выходном зрачке (выходной сфере) от точечного предмета Ао (рис. 2.12). Будем вести рассмотрение в канонических коорди- координатах. Так как поверхность входной сферы совпадает с фронтом волны, то на этой поверхности поле имеет постоянный эйконал и при не очень больших апертурах — постоянную амплитуду Рис. 2 12. Схема распространения электромагнитного поля от то- точечного предмета через оптическую систему и (р) = 1. Поле на выходном зрачке определяется в соответствии с уравнением геометрического переноса B.29) в виде Учитывая соотношение р' = р для канонических зрачковых координат, получаем -гт = 1; кроме того, из формул B.35) и B.46), определяющих зрачковую функцию, можем записать \k [О О']) с точностью до постоянного множителя ехр [ik [О, 04} выраже- выражение для поля на выходном зрачке т1/2(р)ехр[-2шИ7(р)] Q =/(р). B.57) Другими словами, поле от точечного предмета на выходной сфере пропорционально зрачковой функции. Для нахождения поля на изображении воспользуемся дифракционным интегралом B.30), выразив в нем расстояние г' в следующем виде: г' = гр + А/*', где | Дг' | <С г'р из-за малости размеров пятна рассеяния по сравне- сравнению с радиусом сферы гр. В результате получим: и'(А) = \ \и (Р1) (г'р + ДО ехр [—ikn'r'p] exp \—ikri A/-'] dS'P & Sp & rfp~l ехр [~ikn'rp] \\и' (Р') ехр \—ikn' Ar'] dS'p. Sp Постоянный множитель перед интегралом мы можем в даль- дальнейшем не рассматривать, так как он не влияет на структуру 44
ФРТ. Из рис. 2.12 видно, что Дг' в первом приближении есть проекция вектора а' на орт q'o, т. е. \r' = (a/Tq'o). Вводя в это выражение обобщенные координаты точки А' и обобщенные зрач- зрачковые координаты точки Р' и переходя затем к каноническим координатам по формулам B.43) и B.44), получим простую и уни- универсальную формулу, справедливую для любых типов изобра- изображения. и' (ц) = J J и' (р) ехр [-2л/ (т]тр)] dp. B.58) Подставляя и' (р) в этот интеграл из формулы B.57), получим и' (Ч) = J J / (р) ^р (-2mV (P)) dp- B.59) В этой формуле легко узнать обратное фурье-преобразование. Таким образом, в канонических координатах поле в изображении точки описывается обратным фурье-преобразованием зрачковой функции И'(Ч) = ^"Ч/(Р)]. B.60) Предыдущая формула показывает ту важную роль, которую играет фурье-преобразование в анализе оптического изображения и, кроме того, демонстрирует необходимость введения обобщен- обобщенных и затем канонических координат, так как только в них фор- формирование оптического изображения описывается такими про- простыми и универсальными соотношениями. ФРТ есть распределение интенсивности, и в соответствии с формулой B.24) она получается возведением выражения B.60) в квадрат по модулю h(n) = \F-Hf(p)]\*. B.61) Таким образом, ФРТ в канонических координатах пропорци- пропорциональна квадрату модуля обратного фурье-преобразования зрач- зрачковой функции. ОПФ находится как фурье-преобразование ФРТ. Пользуясь свойствами фурье-преобразования, описанными, на- например, в работах [10, 21, 22, 37], можно получить простую фор- формулу, связывающую ОПФ непосредственно со зрачковой функцией D (s) = F [ft (т,)] = F | F'1 [/ (р)] |2 = F [(F-i [f (p)]) (/" [/ (р)])*] = = (FF-* [f (p)]) ® (FF-* [f* (-р)]) - / (р) ®Г (-Р). B.62) Последняя формула означает, что ОПФ есть автокорреляция зрачковой функции и в развернутом виде она записывается следу- следующим образом (член 1/В введен для нормировки D @) = 1): D^ = 1T Jj/(P)/(P~s)dp, B.63) a (s) где В = J j т (р) dp. Qo 45
При т = const можно записать, что = ТГ J J exp l~-2mW (p, s)] dp, B.64) где sV (p, s) = № (p) —W(p — s) — разностная волновая абер- аберрация. В предыдущих формулах интегрирование фактически произ- производится по общей заштрихованной области Q (s) двух канониче- P(pS) Рис. 2.13. Область интегрирования при вычислении дифракционной ОПФ в канонических координатах ских зрачков, смещенных на вектор s канонических частот (рис. 2.13). Геометрически- и дифракцион- дифракционно-ограниченные системы. В ка- каких случаях необходимо учиты- учитывать дифракцию, а когда можно пользоваться геометрическим при- приближением? Анализ показывает, что отличие дифракционной ФРТ от геометрической заключается в наличии тонкой структуры (ди- (дифракционного узора), имеющего пространственную частоту по- порядка единицы в канонических координатах независимо от абер- аберраций. В свою очередь дифрак- дифракционная ОПФ отличается от геометрической на высоких про- пространственных частотах (больших 0,5 в канонических коорди- координатах). Следовательно, если рабочий интервал частот, в котором нас интересует ОПФ (где она ОПФ существенно отлична от нуля), не превышает 0,5 в канонических частотах или -^- в реальных частотах, или, если геометрический размер пятна рассеяния пре- вышает пять канонических единиц E-тт- реальных единиц), \ я ) вполне допустимо пользоваться геометрическим приближением. Оптические системы, работающие в таком интервале частот или с такими размерами пятна рассеяния, что к ним применимо гео- геометрическое приближение, называются геометрически ограничен- ограниченными. Структура их изображения, как следует из выражений B.53) и B.55), целиком определяется картиной поперечных абер- аберраций и в явном виде не зависит от длины волны и апертуры. К таким системам относится большинство обычных фото-, кино- и телевизионных объективов. Критерием качества коррекции аберраций таких систем часто служит среднеквадратическая ве- величина поперечных аберраций = ]/~6G'2 - FG'J, B.65) 46
где черта сверху обозначает усреднение по зрачку, например, H Величина апертуры геометрически-ограниченных систем выби- выбирается из условия обеспечения достаточной светосилы в соответ- соответствии с выражениями B.50) и B.51). Оптические системы, работающие в интервале пространствен- ных частот больших -^г- или с пятнами рассеяния меньшими &К/А', называются дифракционно-ограниченными. Структура их изображения определяется, в основном, явлениями дифракции и должна рассчитываться по формулам B.61), B.62) и B.63). Степень коррекции аберраций дифракционно-ограниченных опти- оптических систем оценивается по среднеквадратической величине волновой аберрации a. V а„ / B.66) которая у хорошо корригированных систем не должна превышать 1/14 {критерий Марзшаля [21]}. К дифракционно-ограниченным оптическим системам относится большинство микрообъективов, визуальных приборов и т. п. Величина апертуры дифракционно- ограниченных систем должна выбираться с учетом необходимости обеспечения нужного качества изображения, так как в соответ- соответствии с выражениями B.63) и B.64) величина апертуры ограничи- ограничивает предельную разрешающую способность, что видно из сле- следующих соотношений: Хроматизм и полихроматические передаточные характеристики. До сих пор мы рассматривали монохроматические передаточные характеристики. В соответствии с формулой B.25) полихромати- полихроматические ФРТ и ОПФ могут быть найдены как средневзвешенные от монохроматических: 1 1 ') = ^- Jft(x', l)q(%)d%; /)поли (v') = -L j D(v', B.67) где Q = j q (%) d%\ q (%) — функция относительной спектральной —l эффективности, показывающая вклад отдельных длин волн в обра- образование изображения; q (%) = В (%) т (%) S (%), а В (х) — относи- относительная спектральная яркость предмета; S (%)—относительная 47
спектральная чувствительность приемника; % — каноническая спектральная координата, определяемая по формуле B.22). Зависимости h (х\ %) и D (v', %) от длины волны (координаты %), иначе говоря их хроматизм, определяются, в свою очередь, хрома- хроматизмом апертур и аберраций. Во многих случаях, однако, можно считать, что апертуры не обладают хроматизмом и ограничиться рассмотрением хроматизма аберраций. При этом волновая аберра- аберрация оказывается функцией не только зрачковых координат р, но и спектральной координаты %, т. е. W = W (р, %). Волновую аберрацию и канонические координаты в полихроматическом случае удобно выразить в основных длинах волн %0. В формулах B.61) и B.62) для дифракционных ФРТ и ОПФ необходимо, используя их для излучения других длин волн, умножить волно- волновую аберрацию W и каноническую координату ц на отношение L = -г— = 1 -f -т—%, а пространственную частоту s поделить Aq Aq на это отношение. § 8. ПРЕДСТАВЛЕНИЕ АБЕРРАЦИЙ При анализе аберраций конкретной оптической системы при- принято изображать графики зависимости аберраций от координат на зрачке в его меридиональном и сагиттальном сечениях {см. работы [3, 5, 27]}. Для внеосевых точек предмета, однако, такие графики не дают возможности судить об изменении аберраций по всему зрачку. Для полного представления волновой аберрации внеосе- вой точки предмета удобно построить карту уровней, т. е. линий равных значений (с определенным шагом) волновой аберрации на координатной плоскости рх, ру канонических зрачковых коор- координат. Полная картина поперечных аберраций может быть наглядно представлена в виде совокупности линий (годографов), описывае- описываемых на поверхности изображения (в обобщенных координатах) лучом, который на каноническом зрачке описывает концентри- концентрические окружности. Такая картина есть одна из форм так назы- называемой точечной диаграммы, описанной в работе [6]. Примеры карт уровней волновой аберрации и точечных диаграмм приведены в работах [6, 27, 30]. Численное описание аберраций (зональный монохроматический вариант). Для того чтобы исследовать влияние аберраций на структуру изображения в соответствии с приведенными выше формулами, необходимо иметь достаточно полное численное пред- представление функции волновой аберрации. Для этого чаще всего описывают функцию W (р) в виде разложения по некоторому базису от канонических зрачковых координат р), B.68) k где Pk (p) — функция базиса, 48
Коэффициенты разложения сл служат численным представле- представлением аберраций для данной точки предмета и данной длины волны. Базис должен удовлетворять требованиям полноты, линейной независимости, а также он должен быть достаточно простым и удобным в использовании. Для описания аберраций оптических систем употребляются два вида базиса. Степенной базис состоит из функций р*р{,, причем в силу симметрии для центрированных систем базис содержит только четные степени рЛ.. Чаще всего разложение B.68) записывается в полярных координатах = ||р||= J/p'i + p| и coscp — -??- в виде I + w2Qp2 + wnp cos ф + cos Ф ~Ь ЧчгР2 cos2 Ф "f" C0S Ф + ^42P4 COS2 Ф + W3'J( + -¦-, B-69) где i ^ /; i + / = 2k — четное. Как показывает практика, шести или семи строк B1 или 28 коэффициентов wLj) вполне достаточно для полного описания аберраций какой-либо точки предмета в любых оптических си- системах. Заметим, что постоянная составляющая w00 не влияет на структуру изображения и поэтому может не включаться в разло- разложение или всегда приниматься равной нулю. Смысл других членов разложения т^ подробно анализируется в работах [4, 21 ]. Легко увидеть, что значения коэффициентов w / выражаются в длинах волн и равны величине волновой аберрации данного типа на краю зрачка (при р = 1, ф = 0). Кроме рассмотренного, в последнее время все чаще использу- используется ортогональный базис в виде так называемых полиномов Цер- нике [4], обладающих рядом преимуществ. Условие ортогональ- ортогональности вообще означает, что интеграл по зрачку от произведения двух различных функций базиса равен нулю 0 при кф1 ь где б/?/ — символ Кронекера, т. е. дискретная дельта-функция, ( 1 при k = / равная ckl ~ < ; число сод, называется нормой k-n функции базиса. Полиномы Цернике проще всего выражаются в полярных координатах в следующем виде: Рп (Р) = Rn (Р) cos гтр9 B.70) где R™ (р) — радиальные полиномы Цернике, зависящие только от р, 49
Эти радиальные полиномы могут быть, в свою очередь, выра- выражены через полиномы от t = р2 B.71) где Q™ (t) — полиномы степени k, ортогональные на отрезке @, 1) с весом tm, т. е 1 \tmQ?(t)Q?(t)dt = 6kl2k + lm+l ¦ B.72) О Для полиномов Цернике условие ортогональности записыва- записывается в следующем виде: 1 2л j j R™ (p) Rk (p) cos mcp cos /фр dp dy = ЬпФт№™> B.73) о о я f 1/2 при m^O где со/г ^= «+ i I 1 при т= 0. Таким образом, эти полиномы ортогональны на единичном круге — каноническом зрачке. Разложение волновой аберрации по полиномам Цернике имеет вид = Ц2 CnmRn (P) COS ГЩ = Соо + + Cllfll (p) COS ф + 4 (Р) + ^31^3 (Р) COS ф + ?22#2 (р) COS 2ф + + ..., B.74) где n^m, п + m = 2k — четное. Преимущества полиномов Цернике заключаются прежде всего в том, что каждый член разложения представляет собой оптималь- оптимальную форму аберрации в смысле минимума среднего квадрата волновой аберрации. Общий средний квадрат волновой аберрации при этом находится как сумма квадратов коэффициентов, умно- умноженных на нормы полиномов (без коэффициента с00), ( 1/2 / оо о оо п о W2 ±224) 2й2 2) ) ) B.75) По известным коэффициентам хюц или спт легко найти при необходимости поперечные аберрации как частные производные волновой аберрации в соответствии с формулой B.45): Дч = 2 2wnv (р' cos/ ф)'> Аг1 = 2 2cm*v 1^ (р) cosmb B.76) t / /п п Полихроматическое описание аберраций. Коэффициенты раз- разложения в выражениях B.69) или B.74) в общем случае обладают 50
хроматизмом, что аналитически проще всего описать в виде разло- разложения каждого коэффициента, например w-,j, по базису от спект- спектральной координаты х 1=0 Если коэффициенты wt-f описывают разложение по степенному базису от координат рХ1 ру, то и по координате % логично выбрать степенной базис W (х, Р) = 2 S 2 Щцг? cos/ Ф. B.77) / i I Если коэффициенты стп относятся к ортогональным полиномам Цернике, то в качестве базиса Pt (x) логично выбрать полиномы, ортогональные на отрезке (—1, 1) с весом q (у) -ы J Piix)Pk{%)q(t)<h = bkfi>t. —1 В последнем случае волновая аберрация W представляется в виде W (х, Р) = 2 2 2 cimnPi (х) Rn (Р) cos тФ B.78) и среднеквадратическая полихроматическая волновая аберрация легко определяется по коэффициентам с/тя: г 2 2 2cL АI/2 • B79) Коэффициенты wuj или с1шп образуют полную численную математическую модель аберраций оптической системы для данной точки предмета; их знание позволяет определить волновые или поперечные аберрации для любой точки зрачка и любой длины волны. Нахождение значений этих коэффициентов и получение по ним значений аберраций будет более подробно рассмотрено в следующих главах. Глобальное полихроматическое описание аберраций. Для цен- центрированных систем часто бывает полезным представить функцию аберраций в виде разложения по базису не только от зрачковых координат р и спектральной координаты х, но и от относительной координаты на предмете а = Уо/уотах, включив в разложение тем самым и изменение аберраций по полю зрения. С учетом круговой симметрии эти координаты будут входить в базис в виде комбина- комбинаций, инвариантных к вращению, а именно: t = р2, и = a2, v = = ар cos ф, х- Как и ранее, можно записать более простое разло- разложение по степенному базису ОО СО 00 СО , or, p)= 2 S S S%«'«W B-80) 51
и разложение по ортогональному базису на зрачке, поле и на спектральном интервале ОО <ХЭ СХ) ~О W(%, a, p)==S^(x)Scos/V ? Rj2k(o) ? Rf2n(o)clikn, B.81) /=0 /=0 /г=//2 п-=//2 где 7?2^ (р) и /??п (ст) — ортогональные полиномы, представленные формулой B.71). Коэффициенты wikij и cijkn этих разложений образуют полную глобальную полихроматическую модель аберраций оптической системы, т. е. позволяют получить значения любых аберраций в любой точке поля, зрачка и для любой длины волны. § 9. КОНСТРУКТИВНЫЕ ПАРАМЕТРЫ ОПТИЧЕСКИХ СИСТЕМ. ПАРАМЕТРЫ ОПТИЧЕСКИХ СРЕД Конструктивные параметры описывают оптическую систему как физический объект в приближении, достаточном для матема- математического моделирования ее работы, т. е. для получения внутрен- внутренних характеристик. Как следует из определения оптической си- системы, приведенного в § 1, конструктивные параметры можно разбить на несколько групп: параметры оптических сред, пара- параметры поверхностей, параметры взаимного расположения поверх- поверхностей и параметры диафрагм. В настоящем параграфе мы начнем рассмотрение конструктивных параметров с параметров опти- оптических сред. Описание оптических сред. Такие среды (оптические стекла, жидкости, кристаллы, пластмассы, применяемые для изготовления оптических деталей) для наших целей характеризуются функцией п (к), показывающей зависимость показателя преломления среды от длины волны, а также рабочим интервалом длин волн (кпу кв). Кроме того, при проектировании оптических систем, работающих в широком интервале температур, необходимо знать так называе- называемые термооптические характеристики, описывающие зависимость показателя преломления п (к) от температуры, а также коэффи- коэффициент линейного расширения оптических материалов. В каталогах и справочных материалах, например ГОСТ 13659—78, приводятся значения п (к) для некоторых стандартных длин волн в количестве до 34, а также термооптические характеристики для небольшого количества длин волн (обычно D, F9 С). Однако задание конструк- конструктором при автоматизированном проектировании значений показа- показателя преломления для нужных длин волн с использованием спра- справочных материалов утомительно и часто приводит к ошибкам. Также неудобно и хранение в памяти ЭВМ значений показателей преломления для всех стандартных длин волн. Наиболее рацио- рационально использовать для описания сред параметры формул, с достаточной точностью аппроксимирующих зависимость п (к). Естественно предположить, что количество параметров этих 52
формул будет не очень велико, т. е. гораздо меньшим, чем коли- количество стандартных длин волн (заметим, что это количество s зависит от удачного выбора формул). Удобно, чтобы параметры формулы были связаны с аппроксимируемой величиной, например показателем преломления, линейной зависимостью п(к) = ЪскРк(Ь), B.82) где ck — параметры формулы; Рк (к) — некоторые функции от А,, представляющие собой базис аппроксимации. Вполне удовлетворительную точность аппроксимации показа- показателя преломления дает, например, формула Герцбергера [6], содержащая шесть параметров, п (к) = с0 + сг№ + с2№ + c,L + ?4L2 + c,L\ B.83) где L = (А,2 — kg)-1; Xo = 0,167 мкм. Термооптические характеристики при этом описываются как производные параметров ck по температуре. Определение параметров аппроксимирующих формул методом наименьших квадратов. Казалось бы, что для определения s пара- параметров аппроксимирующей формулы B.82) достаточно s значений показателя преломления на s отличных друг от друга длин волн. Однако, поскольку данные, приведенные в справочниках, неиз- неизбежно содержат погрешности округления или измерения, то для повышения точности аппроксимации в соответствии с рекоменда- рекомендациями математической статистики [34], желательно собрать как можно больше значений и находить параметры ck так называемым методом наименьших квадратов (МНК), широко применяемым при обработке экспериментальных результатов. Рассмотрим этот метод в наиболее общем виде, поскольку мы также будем пользоваться им не только для аппроксимации пока- показателя преломления (см. далее § 19). Итак, пусть мы имеем аппрок- аппроксимирующую формулу / (х) = J CjPj(x), содержащую s пара- параметров и т экспериментальных значений ft = f (xL) аппроксими- аппроксимируемой функции на т узлах xh i = 1, ..., m, причем т > s. Тогда мы можем составить т линейных уравнений для определе- определения s неизвестных параметров: S-1 2] CjPjix^fi, i= I, . . ., т. Запишем эту переопределенную систему уравнений в матричном виде: Ac = f, B.84) где А - (Ям (х/)); с = (см); f - (?•), i = 1, . .., /я; / - 1, .. ., s. 53
Решение этой системы в соответствии с принципом МНК нахо- находится из условия минимума суммы квадратов невязок между пра- правыми и левыми частями с учетом весов со^ различных уравнений этой системы. Логично выбрать веса обратно пропорциональными погрешностям правых частей. Итак, найдем минимум взвешенной суммы квадратов т I s—I \ 2 Ф=? [ft-JlciPfixM со?, где <в,-ж. Запишем предыдущее выражение в матричном виде: Ф = || W (Ас - f) ||2 = [W (Ас - f)]T [W (Ас - f)] = = fTW2f _ 2cTATW2f + cTATW2Ac, где W — диагональная матрица весов /щ \° ^/ \о Для нахождения минимума ср выразим дифференциал dcp, соответствующий небольшому изменению вектора параметров на dc, dcp = -2 dcTATW2f + dcTATW2Ac + cTATW2A dc = = 2 dcT (ATW2Ac - ATW2f). В точке минимума dq> = 0 при любом малом dc, что возможно только, если (ATW2Ac — ATW2f) = 0. Таким образом, для определения s неизвестных параметров с по МНК получаем си- систему s линейных уравнений с s неизвестными ATW2Ac — ATW2f. B.85) Эта система носит название нормальной системы МНК. Решая ее методами линейной алгебры, находим неизвестные параметры с. Формально это решение можно записать в виде с == (AWA)-1 ATW2f. B.86) Обратим внимание на то, что формально нормальную систему B.85) можно получить из выражения B.84), умножая обе его части на ATW2. Количество параметров аппроксимации подбирается экспериментальным путем до получения остаточной среднеквадра- тической погрешности аппроксимации такой же величины, как среднеквадратическая погрешность данных. При этом переаппрок- переаппроксимация, т. е. достижение слишком малой остаточной погреш- погрешности, также вредна, как и недоаппроксимация, так как в первом случае мы аппроксимируем уже случайные погрешности данных, что, разумеется, неверно. 54
Аппроксимация показателя преломления и нахождения пара- параметров с для каждой среды осуществляется программами машин- машинного каталога оптических материалсв. Найденные параметры, аппроксимирующие зависимость п (А,), совместно с Хн и Хв состав- составляют содержание этого машинного каталога. При необходимости иметь значения, например показателя преломления п для любой длины волны К, он находится подстановкой X в формулу B.82) или B.83). Это также выполняется автоматически программами, использующими каталог стекла, по заданному номеру или марке стекла (среды) и длине волны X. § 10. ОПИСАНИЕ ОПТИЧЕСКИХ ПОВЕРХНОСТЕЙ Наиболее распространенными поверхностями в оптике явля- являются плоскость и сфера, что объясняется простой технологией их получения благодаря свойству самопритираемости, а также про- простотой расчета хода лучей. Применение ЭВМ сделало возможным проектирование оптических систем с поверхностями сколь угодно сложной формы, а успехи технологии, в ча- частности появление станков, управляемых ЭВМ, обещают в ближайшем будущем боль- большее использование иесфе- рических поверхностей, по- поэтому в настоящем пара- параграфе мы рассмотрим описа- описание, пригодное практически для любых регулярных опти- оптических поверхностей. Система координат и ура- уравнение поверхности. Опти- Оптическая поверхность, как и любая поверхность в про- пространстве, описывается ура- уравнением относительно коор- координат точки, лежащей на этой форму уравнения поверхности Рис. 2.14. Система координат и элементы оптической поверхности поверхности. Запишем общую /(s, а) = 0, B.87) где s = I y I — вектор координат точки на поверхности в некото- некоторой системе координат; а — вектор параметров уравнения. При выбранной системе координат параметры а являются конструктивными параметрами поверхности. 55
При автоматизированном проектировании оптических систем принято описывать поверхность в так называемой системе коорди- координат Федера [19, 30, 39], т. е. декартовой системе, начало которой помещается в вершину поверхности, а плоскость Оху касается поверхности, как показано на рис. 2.14. Ясно, что при таком выборе координат уравнение B.87) не должно содержать свободных чле- членов, не зависящих от s. Возможны две различные ориентации системы Федера для любой поверхности, отличающиеся направле- направлением оси z. Примем, что ось z должна быть направлена из предыду- предыдущей среды по ходу луча в последующую, если показатель прелом- преломления предыдущей среды положителен, и в обратном направлении, если этот показатель отрицателен. Обычно принимают, что показатель преломления сред условно меняет знак после каждой отражающей поверхности. Сторону поверхности, обращенную к предыдущей среде, будем называть рабочей, а вторую сторону — нерабочей. Нормаль к поверхности и кривизна. В процессе расчета луча нам понадобится вектор g нормали к поверхности (рис. 2.14). Как следует из дифференциальной геометрии, проекции этого вектора равны частным производным уравнения поверхности по соответствующим координатам, т. е. /df/dx\ /f'x\ /gx\ g = Vf = \ df/ду = f'y = gy , B.88) \dfldzj \rJ W где \f обозначает градиент f. Потребуем из соображений удобства, чтобы в начале координат вектор нормали совпадал с ортом к оси z и имел бы единичную длину, т. е. чтобы при s = 0 g = к; ||g|| = Vgl + gl + g\ = 1. B.89) При расчете бесконечно узких пучков нам потребуется также матрица первых производных проекций нормали по координатам х, у, z или вторых частных производных уравнения B.87), т. е. так называемая матрица Гессе функции / (s). Эта матрица сим- симметрическая и имеет следующую структуру: (fxx fxy fxz \ П. Гуу ГЛ B.90) Izx tzy \zz / Матрица Н позволяет легко найти приращение dg вектора нормали при изменении вектора s координат точки поверхности на дифференциал ds dg=H ds. Для лучей меридионального сечения, лежащих в плоскости Oyz, вместо матрицы Гессе проще использовать понятия кривизны 56
поверхности в данной точке. Величина рт = \1гт представляет собой меридиональную кривизну, т. е. кривизну сечения поверх- поверхности меридиональной плоскостью Oyz, а р,= \1гь —-сагитталь- —-сагиттальную кривизну, т. е. кривизну сечения поверхности плоскостью, перпендикулярной Oyz и проходящей через нормаль g (рис. 2.14), причем гт и rs — соответствующие радиусы кривизны. Поль- Пользуясь формулами дифференциальной геометрии, можно получить выражения для значений кривизны рт и ps через элементы матрицы Н и вектора нормали g: (fz) fyy + (fy) fzz~2lyfzfyz . __ fxx В общем случае, когда точка не лежит в плоскости Oyz, выраже- выражения для значений кривизны становятся очень громоздкими. Впоследствии мы увидим, что при расчете лучей удобнее вместо рт и ps использовать ненормированные значения кривизны: Рт = Рт || g If = - (f'zY fyy - (fyf fzz + 2f'yf'/yz\ Ps = Ps||g|H-/L. B.92) Уравнение плоскости. Это уравнение не содержит параметров и является уравнением первой степени относительно s: г = 0, или в матричной форме sTk = 0, B.93) где к — орт оси г. Дифференцируя предыдущее уравнение по s, получаем вектор нормали и матрицу Гессе для плоскости: Нетрудно увидеть, что кривизны рт и ps в любой точке пло- плоскости равны нулю. Уравнение поверхности второго порядка. Добавляя к формуле B.93) член второго порядка относительно s, т. е. квадратичную форму относительно s, получим общее уравнение поверхности второго порядка в виде / (s, а) = sTk - -1. sTRs = 0 B.94) ^множитель y введен из соображений удобства^ . Матрица R квадратичной формы поворотом системы координат вокруг оси г всегда может быть-приведена к диагональному виду, поэтому без потери общности можно считать ее диагональной, т. е. B.95) 57
Величины р.., р/у, рг образуют параметры описания поверхности второго порядка в общем случае. Вектор нормали g и матрица Гессе Н, кривизны рт и ps в соответствии с равенствами B.88), B.90) и B.92) в этом случае выражаются следующими формулами: g-k-Rs; H--R; B.96) Рт = Ру\ Ps = Рх- B.97) Из уравнений B.97) видно, что р^ и ру равны кривизнам поверхности при вершине (в точке s = 0) в соответствующих сечениях Охг и Oyz. При рх = 0 или ру = 0 уравне- уравнение B.94) описывает со- соответствующие цилиндры: круговые — при рг = р^ или 7 ^ е2=0,5 вытянутый эллипсоид /гиперболоид 'параболоид Рис. 2.15. Блок-схема перехода от заданного радиуса г0 к кри- кривизне р0 Рис. 2.16. Образующие несферических поверхностей второго порядка имею- имеющих одинаковый радиус кривизны при вершине г0 и отличающихся экс- эксцентриситетом е рг = рх и некруговые — в противном случае. В оптике наи- наиболее распространены поверхности вращения вокруг оси г, для которых р^ = р^ = р0; рг = р0 A — е2). Такие поверхности имеют два параметра — кривизну при вершине р0 и квадрат эксцентриси- эксцентриситета образующей е2 = 1 — р2/р0. При е2 = 0 или, что то же самое, при р^ = ру = р^ = р0 уравнение B.94) описывает сферу, а при р0 = о (рх = ру = pz = 0) — плоскость. Для сферы вектор нор- нормали, матрица Гессе и кривизны pm, ps определяются простыми формулами: g = к — pos; Н = — pol; pm = ps = р0, B.98) где I — единичная матрица, причем длина нормали всегда еди- единична, т. е. Заметим, что в алгоритмах расчета удобно использовать в качестве параметров поверхности значения кривизны р0 или рх, 58
р^. Для оптиков более привычными являются радиусы кривизны го = 1/ро > гх = 1/р*"» гу = 1/ру При этом для плоскости, когда г0 = оо, или цилиндров, когда тх = оо или б 0 Т указывают р у у обычно вместо г = оо условно г = 0. Так как значение оо нельзя ввести в ЭВМ, а физически радиус не может быть равным нулю, то запись, например, г0 = 0 в соответствующих программах интер- интерпретируется как р0 =; 0; г0 = оо. Таким образом, переход от за- заданных значений радиусов к значениям кривизны, используемым затем в расчетах, осуществляется в соответствии с алгоритмом, блок-схема которого приведена на рис. 2.15. Нетрудно убедиться в том, что радиус положителен, если центр кривизны лежит на положительном направлении оси г. а) 2Ь 2а Эллипсоид Конус Рис. 2.17. Образующие несферических поверхностей второго порядка в канони- канонической форме: а — эллипсоид; б — гиперболоид; в — конус В зависимости от формы поверхности параметр е2 принимает следующие значения: е2 = 0 для сферы, 0 <<е2 <1 для вытя- вытянутого эллипсоида, е2 = 1 для параболоида, е2 > 1 для гипербо- гиперболоида, е2 < 0 для сплюснутого эллипсоида (рис. 2.16). Для нахож- нахождения г0 и е2 по известным полуосям а и b образующей, уравнение которой записано в каноническом виде (рис. 2.17), можно восполь- воспользоваться следующими формулами: ь2 е2 = 1 -|—2~ ~~ Для гиперболида; е2 = 1 2— Для эллипсоида. B.99) Знак радиуса выбирается по ориентации рабочей полости поверхности. Конус можно считать предельным случаем гиперболоида вра- вращения, когда радиус при вершине равен нулю. При этом е*= l-j-tg2a, B.100) где 2а — угол при вершине конуса. Практически, однако, для конуса радиус при вершине прини- принимают равным малой величине, например г0 = ±0,01. При этом знак радиуса выбирается по ориентации рабочей полости конуса, как показано на рис. 2.17. 59
Поверхности высшего порядка. Добавляя к формуле B.94) член высшего порядка относительно s, получим общий вид уравне- уравнения для описания любой поверхности высшего порядка /(s, а) •Q(s) = B.101) Конкретная форма члена высшего порядка Q (s) зависит от типа поверхности. Вектор нормали и матрица Гессе уравнения B.101) определяется следующими формулами: g = k — Rs — vQ; Высший порядок Рис. 2.18. Отклонение поверхности высшего порядка от базовой по- поверхности второго порядка Н = —R-vVTQ> B.102) где \Q и VVTQ — градиент и ма- матрица Гессе члена высшего порядка Q (s). Заметим, что условия, выра- выраженные равенством B.89), тре- требуют, чтобы при s=0 градиент \Q был равен нулю. Наиболее рас- распространенными являются по- поверхности вращения высшего по- порядка. При этом для неглубоких поверхностей, например, типа пластин Шмидта и других Q (s) выражается в виде полинома от переменной и = х2 + г/2, т. е. Q (S) = Р (и) = а2со2 + а3со3 Н , B.103) где со = и/Ну. Для глубоких поверхностей необходимо представить Q (s) в виде полинома от координаты z Q(s) = P (z) = б/»3 + 64со4 ~j , B.104) где со — zlhz. Масштабные множители — нормировочная высота hy и норми- нормировочная стрелка hz выбираются конструктором из соображений удобства; их значения произвольны, но не равны нулю. Нетрудно увидеть, что при этом коэффициенты ak и bk равны умноженным на длину нормали вкладам соответствующих членов полиномов B.103) и B.104) в деформацию поверхности высшего порядка относительно базовой поверхности второго порядка на расстоянии hy от оси для полинома B.103) и на расстоянии h2 от вершины для полинома B.104). При этом деформация измеряется вдоль нормали к поверх- поверхности. Отсюда ясно, что удобно выбирать hy и hz близкими к соот- соответствующим световым габаритам поверхности (рис. 2.18), 60
Выражения для градиента \Q и матрицы Гессе VVTQ Для уравнения B.103) имеют вид: ху 0N B.105) B.106) и для уравнения B.104): где рг __ Для описания поверхностей вращения высшего порядка исполь- используются и другие уравнения, приведенные в работах [5, 19, 30]: !-•••; B.107) B.108) Это уравнения меридионального сечения поверхности пло- плоскостью Oyz. Связь параметров универсального уравнения B.101) с пара- параметрами уравнений B.107) и B.108) дается следующими форму- формулами: для уравнения B.107) bk = ~cTlCkhkz\ ? = 3, 4, ...; для уравнения B.108) ro=l/Bd2); e2 = l; ак - d2khf; Л = 2, 3, . .. . К поверхностям высшего по- порядка, применяемым в оптике, относятся также торы — поверхности, получаемые вращением окружности вокруг оси, лежащей в ее плоскости (рис. 2.19). Рассмотрим, например, тор, ось вращения которого параллельна оси у. Такой тор описывается универсальным уравнением B.101) при члене высшего порядка Q (s) следующего вида: Рис. 2.19. Параметры торической поверхности ¦у2 1+Я ' B.109) 61
где R = J/ 1 — ply2; px и ру — кривизны тора при вершине; гу = 1/р^ — радиус вращаемой окружности; гх = \/рх — радиус вращения (рис. 2.19). Параметр pz в матрице R в этом случае должен быть равен рХУ т. е. р^ = рх. Градиент \Q и матрица Гессе \\TQ для тора находятся по формулам, получаемым при дифференцировании выражения B.109): /0 B.110) Очевидно, что при гх = гу величина Q (s) становится равной нулю и тор переходит в сферу, а при гх = 0 или гу = 0 тор пере- переходит в цилиндр. § 11. ОПИСАНИЕ ВЗАИМНОГО РАСПОЛОЖЕНИЯ ПОВЕРХНОСТЕЙ И ДИАФРАГМ С каждой поверхностью связана ее система координат Федера, поэтому задача описания взаимного расположения поверхностей в оптической системе сво- сводится к описанию взаим- взаимного расположения систем Федера. Прежде всего не- необходимо договориться о нумерации поверхностей. Наиболее принятой яв- является нумерация по ходу луча. При этом, если луч встречает одну и ту же физическую поверхность несколько раз (в зеркаль- зеркальных и зеркально-линзо- зеркально-линзовых системах), то в кон- конструктивном описании эта поверхность появляется также несколько раз с различными номерами (рис. 2.20). Мы ограничимся рассмотрением таких систем, в которых все лучи встречают какую-либо поверхность одинаковое число раз. Для того чтобы отличить отражающие поверхности от преломляю- преломляющих, существует несколько способов; наиболее распространенный 62 щ-1,6126 (TKW п, Рис. 2.20. Пример нумерации конструктив- конструктивных параметров в описании зеркально-лин- зеркально-линзовой оптической системы
из них основан на том, что формулы отражения луча получаются из формул преломления как частный случай, если показатели преломления до и после поверхности равны по величине и противо- противоположны по знаку. Поэтому, как только в системе встречается отражающая поверхность, показатели преломления всех сред после нее до следующей отражающей поверхности меняют знак на противоположный. Описание взаимного расположения последовательного типа. При описании взаимного расположения можно указать положение Рис. 2.21 Расположение систем Федера в центрирован- центрированных (а), деценгрированных (б) и пространственных (в) опти- оптических системах каждой последующей системы Федера относительно предыдущей — это так называемое описание последовательного типа. При этом количество параметров, необходимое для описания, зависит от класса системы. Наиболее распространенными являются центрированные си- стемы, в которых оси всех систем Федера параллельны и начала их расположены на одной прямой, совпадающей с осью z — опти- оптической осью системы (рис. 2.21, а). В таких системах для каждой &-й поверхности (кроме последней) достаточно указать одно число dk — осевое расстояние до вершины следующей поверхности. Правило знаков предусматривает, что это расстояние отсчитывается от предыдущей по ходу луча поверхности до последующей. В децентрированных системах, где оси всех систем парал- параллельны, но их начала не лежат на одной прямой (рис. 2.21, б), вместо одного параметра dk для каждой поверхности необходимы три параметра dXf}, dyk, dZk, образующих радиус-вектор сЦ = dy указывающий положение начала (k + 1)-й последующей системы Федера в предыдущей k-й системе. Знаки dXk, dyk, dZk определя- определяются, как для проекций вектора de в k-й системе координат. 63
В пространственных системах, в которых оси всех систем Федера в общем случае не параллельны и не лежат на одной пря- прямой (рис. 2.21, в), кроме вектора dk, для каждой k-й поверхности (за исключением последней) необходимо определить матрицу Фк поворота последующей системы Федера относительно предыдущей. Какой-либо ij-я элемент этой матрицы равен косинусу угла, образованного i-й осью (к + 1)-й системы с /-й осью k-й системы, если нумеровать оси в следующем порядке: ху у, г. Матрица Ф^, как всякая матрица поворота, ортогональна, т. е. обратная ей матрица совпадает с транспонированной Ф^Г1 = ФТк. Другими 3 3 словами, выполняются равенства ХфоФ// = ?ф/*Ф// = ^//> гДе Ьи — символ Кронекера. Отсюда следует, что для задания всей матрицы Ф^ достаточно трех независимых параметров, за которые удобно принять углы ах, ау, а2 последовательных поворотов вокруг осей х, у, z соответственно. При выполнении этих поворотов оси хкл ykJ zk k-и системы становятся параллельны осям хк+ъ Ук+ь *k+i {k + 1)-й системы. Тогда <bk = <bZk<by<bXk, где —матрицы поворота вокруг осей координат х, у, г. Заметим, что приняв другую последовательность поворота, получим другое описание матрицы Ф^ через три угла. Всего возможно 12 способов описания. Преобразование координат. Имея вектор dk и матрицу Фк, можно легко перейти от вектора s^ координат какой-либо точки пространства в k-тк системе координат к вектору s#+1 координат этой же точки в (k + 1)-й системе в соответствии со следующей формулой преобразования координат: s*+1 = <Dft(s*-d*). B.111) Обратное преобразование имеет вид j d*. B.112) Описание параллельного типа. Кроме рассмотренного описа- описания последовательного типа иногда применяется описание парал- параллельного типа, при котором положение каждой поверхности зада- задается относительно некоторой общей (базовой) системы координат 64
xQy yQy Zq. Для каждой k-и поверхности в общем случае задаются вектор do. положения начала ее системы в общей системе координат и матрица Фо^ поворота относительно общей системы. При расчете луча, описанном в следующей главе, всегда используется последо- последовательное описание, поэтому при задании параллельного описания необходимо перед расчетом лучей перейти к последовательному. Пусть нам известен радиус-вектор s^ какой-либо точки в k-я системе. Из выражения B.112) найдем ее вектор s0 в общей системе s0 = Фо^ + dOjfei затем по формуле B.111) определим ее вектор в (k + 1)-й системе Сравнивая последнее выражение с уравнением B.111), полу- получаем формулы перехода от параллельного описания к последова- последовательному: <^ФоЛ<Ч+1-<Ч); B.ПЗ) Описание диафрагм. С каждой поверхностью оптической си- системы связана диафрагма — оправа, ограничивающая световые габариты поверхности. Кроме того, в системе присутствуют и другие диафрагмы. Количество параметров, необходимых для описания диафрагм, зависит от класса системы. В наиболее распро- распространенном случае центрированных систем для каждой поверхно- поверхности требуется указание светового диаметра DGB или его половины hCB = DCB/2, а при наличии центрального экранирования — также и абсолютного или относительного диаметра экрана ?)экр или е == D3Kp/DCB. При рассмотрении диафрагм часто ограничи- ограничиваются только апертурной диаграммой, для которой указывают: номер kd поверхности, предшествующей по ходу луча диафрагме; расстояние dd от поверхности до диафрагмы; световой размер Dd диафрагмы и коэффициент экранирования. Если диафрагма распо- расположена перед системой, обычно принимают kd = 0 и dd в этом случае отсчитывается от первой поверхности с учетом правила знаков. § 12. ПРЕДСТАВЛЕНИЕ КОНСТРУКТИВНЫХ ПАРАМЕТРОВ К представлению параметров предъявляются различные требо- требования со стороны конструктора, задающего их значения (внешнее представление), и со стороны программиста, использующего их в конкретных программах анализа характеристик оптических систем (внутреннее или машинное представление). 65
Машинное представление конструктивных параметров. При использовании конструктивных параметров в программах жела- желательно, чтобы эти данные были представлены в виде, не требую- требующем каждый раз преобразования в необходимую форму. Например сферические поверхности должны быть заданы значениями кри- кривизны р0; ориентация поверхностей в пространственных системах — описанием последовательного типа; оптические среды — показа- показателями преломления на нужных длинах волн и т. д. Все данные должны быть в том виде, в котором производятся действия в ЭВМ (в большинстве случаев в двоичной системе счисления с плавающей запятой). Однородные данные, например: значения кривизны поверхностей, осевые расстояния, показатели преломления для удобства организации в программах циклов расчета луча, следует объединить в массивы. Например, для центрированных систем машинное представление конструктивных параметров может со- состоять из: NS, ND, NL — переменных целого типа, указывающих количество поверхностей в оптической системе, количество по- поверхностей, предшествующих апертурной диафрагме, количество длин волн; RO (NS) — массива из NS чисел, содержащего значе- значения кривизны всех поверхностей (действительного типа); D (NS — — 1) — массива из NS — 1 чисел действительного типа, содержа- содержащего осевые расстояния; Р (NS) — массива из NS целых чисел, показывающих порядки уравнения поверхностей [для сферы и плоскости условно Р (/) = 0]; С (NC) —массива из NC чисел действительного типа, содержащего коэффициенты всех несфери- несферических поверхностей; DCB (NS) — массива из NS чисел действи- действительного типа — световых диаметров поверхностей; N (NS, NL) — двумерного массива чисел действительного типа, содержащего показатели всех сред для всех длин волн [например, N (/, J) — показатель преломления 1-й среды для /-й длины волны]; DD> DA — чисел действительного типа, показывающих расстояние до апертурной диафрагмы от предыдущей поверхности и диаметр диафрагмы. Для децентрированных и пространственных систем массив D (NS — 1,3) становится двумерным, его столбцы содержат ком- компоненты векторов dXk, dyk, dZk и, кроме того, добавляется трехмер- трехмерный массив Ф C,3, NS — 1), содержащий матрицы поворота Фк. Внешнее представление конструктивных параметров. Внешнее представление должно быть ориентировано на достижение удоб- удобства конструктора, для которого привычнее задавать не кривизны, а радиусы кривизны поверхностей и не матрицы Фь а углы поворота ахауаг в градусах, минутах, секундах. Все данные необходимо приводить в десятичной системе счисления в привыч- привычной форме. Данные оптических сред удобнее задавать наименова- наименованием среды, длинами волн и т. д. Различие между машинным и внешним представлением, т. е. степень приближения к требова- требованиям конструктора, зависит от мощности используемых ЭВМ. На первых порах (при использовании маломощных ЭВМ) от кон- 66
структора требовалось вводить в ЭВМ все данные в машинном представлении, даже иногда в двоичной системе счисления. Сейчас в большинстве программ для средних, малых и настольных ЭВМ внешнее представление в основном соответствует машинному, за исключением того, что вместо кривизны задаются радиусы и все данные приводятся в десятичной системе счисления. Данные вво- вводятся в определенном порядке, соответствующем машинной форме представления. Соответствующие программы переводят данные в двоичную форму, а радиусы — в значения кривизны в соответ- соответствии с алгоритмом, показанным на рис. 2.15. Большие ЭВМ позволяют внешнее представление сделать максимально удобным для конструктора, что особенно необходимо в режиме диалога. Конструктивные параметры при этом описываются конструктором на входном языке, позволяющем вводить данные в любом порядке, указывать углы в любом измерении (радианах, градусах или в тригонометрических функциях), описывать среды марками или условными номерами, не записывать несколько раз подряд повто- повторяющиеся данные и т. д. Для реализации таких возможностей необходима разработка специальных программ — трансляторов с входного языка, которые осуществляют перевод внешнего представ- представления, записанного на входном языке, в машинную форму. При этом производится перевод данных в двоичную систему счисления, расстановка их в нужном порядке с учетом повторяемости сред, формирование массивов и обращение к программам машинного каталога оптических материалов. Кроме того, в процессе трансля- трансляции производится семантический контроль исходных данных, позволяющий обнаружить недостаток каких-либо данных или явно бессмысленные их значения, возникшие из-за небрежности или сбоя устройств ввода, и сообщается конструктору информация об обнаруженных ошибках. Естественно, что такие программы-транс- программы-трансляторы довольно сложны, занимают большой объем памяти ЭВМ и требуют значительных затрат на их разработку. Они могут быть реализованы только на достаточно мощных ЭВМ. Однако их разработка и использование оправданы. Следует заметить в связи с этим, что с развитием автоматизации проектирования оптических систем обслуживающая часть программного обеспечения, предназ- предназначенная для повышения удобства работы с ЭВМ, занимает все больший и больший объем по сравнению с собственно расчетной обрабатывающей частью. Сказанное выше о внутренней и внешней формах представления относится также и к результатам расчета по тем или иным про- программам. Для обмена данными между различными программами и функ- функциональными блоками используется внутренняя форма, в которой характеристики и параметры оптических систем представляются в обобщенном виде, в соответствии с описанной в пп. 4—8 системой обобщенных характеристик и координат. Так, например, для пред- мета идц изображения удаленного типа обобщеная величина пред- 67
мета и изображения представляется в виде тангенса, продольные отрезки и аберрации — в килодиоптриях, поперечные аберрации — в радианах и т. д. Это позволяет унифицировать и сделать универ- универсальным математический аппарат и алгоритмы обрабатывающих программ и блоков. Результаты, предназначенные для использования конструкто- конструктором, представляются во внешней форме, конкретный вид которой определяется соображениями удобства, традициями и т. д. Так, например, величина предмета и изображения удаленного типа выражаются в градусной мере, так же как и поперечные аберра- аберрации, продольные отрезки и аберрации — в диоптриях и т. д. Приведем пример описания конструкции оптической системы, показанной на рис. 2.20, на входном языке САПР оптических систем. Описание в соответствии с синтаксисом языка состоит из отдельных предложений, разделенных точкой с запятой; каждое предложение имеет левую часть, содержащую идентификатор описываемого конструктивного параметра или группы параметров, и правую часть, в которой указываются значения этих параметров; правая и левая части разделяются знаком =. Последовательность предложений безразлична за исключением тех случаев, когда правая часть должна быть определена ранее, в предыдущих пред- предложениях. Нужно учитывать также, что каждое новое значение какого-либо параметра, встретившееся в правой части, заменяет собой ранее присвоенное. В качестве идентификаторов могут выступать обозначения: 1) отдельных параметров, например, АР — обобщенная апертура, ОМ — полевой угол в пространстве предметов; 2) отдельных эле- элементов массивов, например, R A); R B), R C) — радиусы первой, второй и третьей поверхностей; 3) групп элементов массива, напри- например, R C—8) — радиусы поверхностей с третьей по восьмую, R B, 5, 7) — радиусы второй, пятой и седьмой поверхностей; 4) массивов целиком, например, R — все радиусы, D — все осевые расстояния. В правых частях могут стоять одиночные числовые значения, например, RI = 100, D5 = —15.3; идентификаторы, значения которых определены ранее; символьные обозначения (для стандартных длин волн, для марок стекла и так далее), а также последовательности каких-либо из перечисленных поня- понятий, разделенных запятыми, например, R A—3) = 100, —25.3, —D2; L A—3) = D, F, 0.7. В качестве элементов правых частей могут также использоваться простейшие арифметические выра- выражения. В соответствии с этими правилами описание конструкции, показанной на рис. 2.20, может выглядеть так: D A—7) = 20, 100, 15, —D3, —D2, 40, 20; — это предложение определяет значения осевых расстояний с учетом физической эквивалентности некоторых из них. # (l_8t = —ЮО, #1—01, —200, —300, #3, #2, 90, —#7; 68
— это предложение задает значения радиусов кривизны с учетом того, что первый и второй — концентричны, а пятый и третий, второй и шестой — физически эквивалентны. N = I — это предложение определяет предварительно все среды как воздух с показателем преломления, равным единице. МАРКА A, 3, 4, 7) = К8, Ф1, —Ф1, ТК16; — это предложение указывает марки стекол, причем после отра- отражения марка условно меняет знак так же, как и показатель; по заданным маркам и длинам волн показатели преломления опреде- определяются автоматически машинным каталогом стекла. N5 = —N2; — это предложение определяет показатель пятой среды с учетом отражения. L A—3) = Е, G', С — это предложение задает рабочие длины волн условными обозначениями, принятыми в оптике (Е — = 0,5461 мкм, С = 0,4341 мкм, С = 0,6563 мкм). АР = 0,2; ОМ = —3; — эти предложения определяют заднюю обобщенную апертуру Aq = 0,2 и половину углового поля в про- пространстве предметов, т. е. со = —3°. Заметим, что пользуясь синтаксисом языка, можно составить и множество других описаний той же самой конструкции, отли- отличающихся количеством и последовательностью предложений. Например, вместо одного первого предложения можно было записать: D A—3) = 20, 100, 15; D4 = — D3; D5 = —D2; D F-7) = 40, 20; Выбор того или иного описания определяется соображениями удобства.
Глава 3 РАСЧЕТ ЛУЧЕЙ И ОПРЕДЕЛЕНИЕ ВНУТРЕННИХ ХАРАКТЕРИСТИК ОПТИЧЕСКОЙ СИСТЕМЫ Расчет лучей составляет основное содержание анализа опти- оптической системы на среднем иерархическом уровне проектирования. При этом по известным значениям конструктивных параметров определяются характеристики внутренней функциональной модели. Как уже говорилось в гл. 1, можно выделить несколько под- подуровней или стадий такого анализа. На начальной стадии опти- оптическая система предполагается идеальной, т. е. не имеющей аберраций, а анализ заключается в расчете так называемых параксиальных или нулевых лучей и определении фокусных рас- расстояний, фокальных отрезков, увеличения, положения изображе- изображения и зрачков и других гауссовых характеристик оптической системы. На следующей стадии также на основе расчета нулевых лучей определяются так называемые аберрации третьего порядка или первичные, или зейделевы. Они соответствуют членам второй степени в глобальном полихроматическом разложении волновой аберрации, представленном формулами B.80), B.81), и удовлетво- удовлетворительно описывают качество коррекции оптических систем только при небольших размерах поля и небольших апертурах, когда членами высших степеней в разложениях B.80), B.81) можно пренебречь. На всех последующих стадиях анализа рассчитывается ход через оптическую систему реальных или действительных лучей — нормалей к волновому фронту. Эти лучи объединяются в пучки, выходящие из определенных точек предмета. Обычно рассматри- рассматривается осевая точка предмета и выходящий из нее осевой пучок, а также несколько внеосевых пучков, количество которых зависит от величины поля и степени неизопланатизма системы. § 13. РАСЧЕТ НУЛЕВЫХ ЛУЧЕЙ И ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК ОПТИЧЕСКОЙ СИСТЕМЫ В ГАУССОВОЙ ОБЛАСТИ В небольшой окрестности оптической оси, в так называемой параксиальной или гауссовой области, центрированную оптическую систему можно считать идеальной^ безаберрационной, Лучи? 70
лежащие в этой области, т. е* выходящие из близких к оси точек предмета и образующие малые углы с осью, называются параксиаль- параксиальными [3, 36]. При расчете их хода через систему пренебрегают различием между точкой М пересечения луча с оптической поверх- поверхностью П и точкой N пересечения его с плоскостью 0#, касатель- касательной к этой поверхности в ее вершине (рис. 3.1), а также считают, что tg а я** sin а & а и tg e я^ sin е « е, где а — углы, образуе- образуемые лучом с осью; 8 — углы падения луча на поверхность. Благо- Благодаря этому расчетные формулы получаются крайне простыми и линейными относительно ко- координат и углов луча, т. е. последние входят в формулы в степени не выше первой. Расчет параксиальных лучей, однако, неудобен из- за бесконечно малых вели- величин высот h и углов а, вхо- входящих в расчетные фор- формулы, поэтому вместо па- параксиальных используют нулевые лучи. Это фиктивные лучи, преломляющиеся не на реальных поверхностях, а на плоскостях, касатель- касательных к вершине этих по- поверхностей, пересекающие оптическую ось в тех же точках, что ц параксиальные лучи, но образующие с осью углы любой конеч- конечной величины. На рис. 3.1 параксиальный луч показан сплошной линией, а соответствующий ему нулевой — пунктиром. При расчете нулевых лучей также пренебрегают различием между точками Мо и Non пользуются формулами для параксиальных лу- лучей, но высоты h и углы а, входящие в них не обязательно беско- бесконечно малы. Нулевой или параксиальный луч в каждом пространстве в системах с вращательной симметрией определяется двумя пара- параметрами или координатами* линейной координатой — высотой /г, на которой он пересекает касательную плоскость ОП, и углом а, образуемым лучом с осью (рис. 3.1). В системах с двумя плоско- плоскостями симметрии, анаморфотах необходимо рассчитывать нулевые лучи в двух взаимно перпендикулярных сечениях (рис. 3.2), при этом на каждой поверхности нулевой луч характеризуется парой Рис. 3.1. Координаты нулевого и пара- параксиального лучей на оптической поверх- поверхности линейных координат — вектором h = вектором и парой угловых — Расчет нулевого луча через систему. Задача расчета луча состоит в определении его координат на данной поверхности по 71
i Hi w "lllllLL УХ in. Рис. 3.2. Координаты нулевого луча в систе мах с двумя плоскостями симметрии известным координатам на предыдущей поверхности и в повторении этого процесса от первой до последней поверхности оптической системы. Пусть известны координаты hk_\ и ak_x нулевого луча на какой- либо (k — 1)-й поверхности, а также расстояние <4_х от этой поверхности до следу- следующей, кривизна р^ = \lrk следующей поверхности, показатели преломле- преломления /г/е_хИ nk сред (рис. 3.3). Определим координаты hk и ak нулевого луча после преломления на k-й по- поверхности. В процессе расчета можно выделить два этапа. Первый этап — перенос точки вдоль луча на расстояние dk_i от предыдущей до данной поверхности (при этом изменяется только линейная координата h): fi< = f\i — (xb db C \} Второй этап — преломление луча на k-й поверхности (при этом изменяется только угловая координата а). Из закона преломле- преломления в параксиальной области следует, что пк_хг = nk&', где е и е' — углы падения и преломления — а#, где срд, = hjfk — Отсюда получаем, что щак = Обозначив через \ik = = щ/nk+i относительный по- показатель преломления на k-й поверхности, получим сле- следующую формулу преломле- преломления нулевого луча: д луча. Но Рис. 3.3. Прохождение нулевого луча через &-ю поверхность ™ Ц*). C.2) При практическом использовании формул C.1) и C.2) для составления алгоритма и программы удобно записать их в рекур- рекуррентном виде, убрав из них индексы поверхностей k и k — 1, т. е.: h = h — da — перенос; а = (ia -f- p A —¦ \i) h — преломление. C.3) Знак равенства в предыдущих выражениях нужно понимать в алгоритмическом смысле как знак присваивания значения. Формулы C.3) образуют алгоритм расчета нулевого луча через одну поверхность, кривизна которой р, относительный показатель 72
d=0 Г" Цикл по К от 1, шаг 1 до NS [входные координаты "I луча Гначало и,икла по >\ поверхностям 1NS-количество поверх- u 6 NSколи iHocmeu 6 системе h=h-ccd. перенос 0 *-pn(f-/l); преломления \i, расстоя- расстояние от предыдущей по- поверхности d. Войдя в этот алгоритм со значениями координат h и а на пре- предыдущей поверхности, мы получим в результате его выполнения для тех же переменных h и а значе- значения координат луча после преломления на данной поверхности. Такая ре- рекуррентная запись позво- позволяет легко организовать циклический процесс рас- чета луча через систему поверхностей. Для этого необходимо перед началом расчета определить коор- координаты луча на некоторой «нулевой» поверхности, предшествующей первой поверхности системы и находящейся на некото- некотором расстоянии d от нее (входные координаты луча), а затем организовать цик- циклическое использование ре- рекуррентных формул C.3), перебирая в качестве кри- кривизн р, относительного показателя j,i и расстоя- расстояния d соответствующие значения для всех поверх- поверхностей системы. Выбор входных коорди- координат зависит от цели, для которой рассчитывается луч и будет более подробно рассмотрен ниже. На схеме 3.1 показан алгоритм расчета нулевого луча, иду- идущего из бесконечности, с входными координатами h = 1; а =0; d =0. По окончании расчета луча в качестве выходных результатов опре- определяются фокусное расстояние f и задний фокальный отрезок s?". Описанный алгоритм относился к системам с вращательной симметрией. Для систем с двумя плоскостями симметрии принцип расчета остается таким же, но все действия производятся для пары коорди- координат hx, hy (вектора h) и соответственно ах, ау (вектора а), причем для каждого сечения берется соответствующая кривизна поверх- 73 Выбор параметров к-й поверхности {преломление и выбор -| следующего осевого L расстояния \ коней и,икла по 1 поверхностям расчет выходных результатов Схема 3.1. Алгоритм расчета нулевого луча через оптическую систему
ности рд; или ру. Расчетные формулы имеют вид, аналогичный выражениям C.3), что особенно заметно при записи их в матрич- матричном виде: перенос X ' X ~~~ JC > h __ 1 или h = h — ad; C.4) преломление i * /1 или а -= а\л -j- Rh A — fx) где R= I I —матрица кривизны. Применение матричной оптики для расчета нулевых лучей. Известно; что все свойства оптической системы в гауссовой области (в случае симметрии вращения) полностью определяются из расчета двух надлежащим образом выбранных нулевых лучей. Результаты расчета остальных лучей могут быть найдены затем без применения формул C.3). Это свойство особенно наглядно формулируется с использованием аппарата матричной оптики [12 ]. Объединим координаты h и а какого-либо нулевого луча (в систе- (h\ мах с вращательной симметрией) в двумерный вектор b = I . Тогда формулы расчета луча через одну поверхность приобре- приобретут вид: перенос (h\ /I] ~d\ (h\ ( j = M \ (I; или b-Db, C.5) где /1 —d\ D= I I —матрица переноса; преломление 0\ (h\ { n ч ; или b-Rb, C.6) VP A — (A) PI \a/ где 1 0^ / 1 R== yi ч —матрица преломления. \p(l -\x) \i) Рассматривая теперь расчет луча через систему поверхностей, нетрудно заметить, что он может быть записан как последователь- последовательность матричных умножений b' = R^D^x .. D.R^RiDob - Gb, C.7) (h\ где b = I I — вектор координат луча перед входом в систему \0С/ на «нулевой» поверхности, предшествующей первой и отстоящей от 74
(h'\ нее на нулевом расстоянии; Ь' = I , — вектор координат на выходе из системы после преломления на последней поверхности; G = R^D^_! ... D2R2D1R1D0 —гауссова матрица системы, опре- определяемая ее конструктивными параметрами и не зависящая от координат луча; Do - I —матрица переноса от нулевой до первой поверхности; R3 — матрица преломления на первой поверхности и т. д. Символ I обозначает единичную матрицу. При помощи выражения C.7) можно определить координаты Ь' любого нулевого луча на выходе из системы, если известны его входные координаты b и матрица системы G. Для расчета гауссовой матрицы воспользуемся ее выражением из формулы C.7), дописав справа в виде множителя единичную матрицу G = R/eD^x ... DsRaDiRxDoI. Последняя формула пока- показывает, что матрица G может быть получена из единичной матрицы последовательными умножениями ее на матрицы переноса и пре- преломления Do, Rb Dl5 R2 ... всех поверхностей. При каждом умно- умножении элементы матрицы G в соответствии с правилами матрич- матричного умножения пересчитываются рекуррентно сами в себя по следующим формулам: при переносе G = DG; или gn = gn - gnd; g12 = g12 - g22d; при преломлении G = RG; или g21=g21\i + gup A - v)\ 822 = StuP + ft2P(l—M-)- C-8) Расчет гауссовой матрицы по этой схеме эквивалентен расчету двух нулевых лучей, один из которых имеет входные координаты A ° I q , а другой — I - I на «нулевой» поверхности, касающейся первой поверхности системы; гауссова матрица составляется из выходных координат этих лучей. Определитель гауссовой матрицы равен отношению показателей преломления первой и последней сред, т е. det (G) = nxlnp+x, а значения ее элементов следующим образом связаны с карди- кардинальными отрезкми оптической системы: SF' ~ ff —SFSF' . f > 612 — f » 1 / Q_. ff c_C_.\ C.9) SF . §21 — ~ , §22 ^ JT Определение характеристик оптической системы в гауссовой области. Рассмотрим теперь последовательность расчета гауссо- гауссовых характеристик (фокусных расстояний, фокальных отрезков, обобщенного увеличения, положения зрачков, заднего отрезка) с использованием матричной оптики. 75
На первом этапе производится определение элементов гауссовой матрицы G всей системы и матрицы Gd части системы, предше- предшествующей апертурной диафрагме. Расчет производится по форму- формулам C.8). Заметим, что нет необходимости отдельно вычислять матрицу Gd, так^ как в ее роли выступает промежуточный результат расчета матрицы G, полученный до апертурной диафрагмы. Если диафрагма расположена перед системой, то матрица G^ является единичной. По полученной матрице G определяются фокусные расстояния и фокальные отрезки в соответствии с формулами C.9), т.е.: SF> = gll/g2U SF=— g22/g2i; f = §2 — C.10) На следующем этапе производится определение входных координат второго нулевого луча, которые обозначим через Ьп = — . Эти координаты находятся из условия, что луч проходит через центр апертурной диафрагмы, как показано пунктиром на рис. 3.4. Пусть вектор координат этого луча на диафрагме есть 1 0 1 ,, где nd — показатель преломления в пространстве диа- фрагмы. Тогда координаты его на предыдущей поверхности, сог- согласно рис. 3.4, есть Ьц = .В соответствии с выражением nd \ 1 / C.7) имеем Ьц — Gdbn. Следовательно, Ьл—07^11, где G71 — матрица, обратная Gd. Матрица G71 легко находится и в резуль- результате получаем, что JUJ (ЗЛ1) Зная входные координаты второго нулевого луча, легко опре- определить положение входного зрачка. Согласно классической теории оптических систем имеем: гр = #/|3, а в обобщенном смысле по определению, приведенному на стр. 30, для удаленного предмета (тип 0), в миллиметрах от первой поверхности sP = zp = Я/р и для близкого предмета (тип 1), в килодиоптриях от предмета « fL E И )9) НА " ^-Р* ' К } где НА = Н — ps — высота второго нулевого луча на поверхности предмета. На следующем этапе определяем входные координаты первого нулевого луча, выходящего из осевой точки предмета. Нормируем 76
эти координаты таким образом, чтобы они соответствовали единич- единичной величине передней апертуры. Для удаленного предмета по определению на стр. 36 передняя апертура есть линейная величина, равная Ао — nhp, где hp — высота луча на входном зрачке. При Ао =--- 1 получаем, что hp — изображение S) Рис. 3.4. Характеристики оптической системы в гауссовой области: а — для близкого предмета и изображения; б — для удаленного предмета и изображения = —. Угол а луча легко находится из рис. 3.4, б по формуле а = —, где s — передний отрезок в килодиоптриях. Осталось теперь найти высоту луча на первой поверхности h = hp + + asp = —A + ssp). Для близкого предмета высота луча на поверхности предметов равна нулю, а передняя апертура Ао по определению, приведен- приведенному на стр. 36, есть угловая величина, в параксиальной области равная Ао = —па. Поэтому при Ло = 1 получаем a = . 77
( Начало ) J начальное значение | 'гауссовой матрицы ЧЦикл по Л от f, \ [ начало цикла, ~'Т~ . 'входные координа- координаты 11-го нулевого луча,ест А А на- находится перед - ели темой _ I перенос для матрицы G • ,__Jh _, „ j Г выбор параметров а*рA-М>O ' 1 К-и поверхности [препоп пение для матри- ~] ць/ G • G=RG [входные координа- координаты П-го нулевого ~~] луча, если АД на- находится внутри L системы I W//ffi< Ц^/ГЛСГ /7/7 [поверхностям ^ '%гг sf'= ff/(f2i; j {вычисление кардиналь- "h-'ых отрезков ^ (удаленный предмет) (блисш предмет) [обобщенная Золи- \'\чь на предмета I Lf/7^C6f .OfЯ) ант гр ш 8 KUfloduonmpiw 1. ¦ 5 / [обобщенно* величина "[предмета (угловая) [обобщенное положе - А ние Входного зрачка [в миллиметрах [входные координаты "\ 1-го нулевого луча Схема 3.2. Алгоритм расчета характеристик оптической 78
выходньи 1-го нулевого луча ¦ Выходные координаты П-го нулевого луча (удаленное изображение) [задний отрезок ~1в миллиметрах г обобщенное положение _J Выходного зрачка В I миллиметрах Г задний отрезок В кило- \_диоптриях задний отрезок, т е~] положение плоскости\ установки задано от-Г носительно системы J (задано смещение плоскости установки да относительно плоскости Гаусса) - рабочий задний отрезок обобщенная Величи на изображениями •Ание Выходного зрач- щ В килодиоптриях I обобщенная величина | изображения(углоВая) У о — j обобщенное увеличение преобразование резуль- результатов Во Внешнюю орорму и печать ( коней, ) системы в гауссовой области (для одной длины волны) 79
Высота h на первой поверхности легко определяется из рис. 3.4, а по формуле h = sa = —. Итак, вектор входных координат первого нулевого луча имеет вид: для удаленного предмета для близкого предмета 1 +SSD\ ) Найдем обобщенную величину предмета у0 для II-го нулевого луча Р — для удаленного предмета (угловая величина); НА = Н — Ps — для близкого предмета (линейная величина). Нетрудно также увидеть, что величина у0 равна обобщенному увеличению части системы, заключенной между входной апертурой и апертурной диафрагмой, т. е. отношению половины диаметра диафрагмы к передней апертуре у0 = Dd/2A0. На следующем этапе находятся выходные координаты нулевых лучей bi и Ьп путем умножения векторов их входных координат на матрицу системы G. Удобно объединить векторы Ьх и Ьп, а также векторы Ы и bii в матрицы, рассматривая их как столбцы этих матриц. Тогда можно записать, что = G(bibn). C.15) На последнем этапе по выходным координатам лучей мы опре- определяем положение выходного зрачка, задний отрезок и обобщенное увеличение. Найдем сначала обобщенный задний отрезок sg. Для близкого изображения s'g измеряется в миллиметрах от последней поверхности и выражается в виде s'g = —- (рис. 3.4, а). Для удаленного изображения s'g измеряется в диоптриях относительно выходного зрачка. Из рис. 3.4, б ясно, что s'g = —гг- измеряется р в килодиоптриях. Но h'p = Ы—asp, где sp=H'/$' — обобщенное положение зрачка. Найденный задний отрезок показывает положе- положение изображения, сопряженного с предметом, в пределах гауссо- гауссовой оптики; рабочий задний отрезок s'o может отличаться от s'g на заданную величину смещения плоскости установки As'g. В неко- некоторых случаях положение плоскости установки вообще может задаваться независимо от s'g, поэтому после нахождения sg необхо- необходимо либо добавить к нему заданное смещение, либо вообще за- заменить его заданным отрезком. Обобщенное увеличение было нами определено в гл. 2 как отношение обобщенной величины изображения у'о к обобщенной величине предмета у0. Обобщенная величина уо изображения по 80
II-му нулевому лучу для близкого изображения есть линейная величина, равная координате На пересечения второго нулевого луча с плоскостью изображения, находящейся на расстоянии soot псследней поверхности, т. е. у'о = Н'А = #' — P'sq. Для удаленного изображения обобщенная величина изображе- изображения — угловая величина, под которой видно изображение из центра выходного зрачка, и она равна #6 = Р'. Таким образом в любом случае v0 = у'01у0, где у0 определяется из формулы C.14). Осталось определить обобщенное положение зрачка. Для уда- удаленного изображения s'p совпадает с положением зрачка zp по теории оптических систем, т. е. $'р = zp =-¦ #7|3'. Для близкого изображения обобщенное положение зрачка определяется в диопт- диоптриях относительно изображения и, как видно из рис. 3.4, а, s'p =¦ Р'/Ял в килодиоптриях. Определение параксиального хроматизма. Все сказанное выше в настоящем параграфе относилось к гауссовым характеристикам оптической системы для одной длины волны, т. е. к монохромати- монохроматическим характеристикам. Для определения хроматизма необходимо проделать те же самые действия, но с другими значениями показа- показателей преломления всех сред. При этом нужно учитывать, что вели- величина изображения для всех длин волн должна рассчитываться в одной и той же плоскости, соответствующей основной длине волны. На схеме 3.2 показан алгоритм определения гауссовых характеристик оптической системы на основании материала настоящего параграфа. Система с двумя плоскостями симметрии. В таких системах все вычисления производятся в двух сечениях — oxz и oyz, поэтому соответственно все гауссовы характеристики получают свои значения для этих сечений. Естественно, что плоскости предмета и изображения должны быть общими. § 14. РАСЧЕТ ХОДА ДЕЙСТВИТЕЛЬНЫХ ЛУЧЕЙ ЧЕРЕЗ ОПТИЧЕСКУЮ ПОВЕРХНОСТЬ Основной объем информации об аберрациях оптической си- системы в процессе ее анализа получают из расчета действительных лучей, идущих на произвольно большом расстоянии от оптической оси и соответствующих ходу реальных физических лучей — норма- нормалей к волновым фронтам. Расчет хода действительных лучей со- составляет значительную часть (от 30 % до 90 %) всей работы по проектированию оптических систем, при этом многократно повто- повторяется одна и та же процедура — расчет хода луча через одну поверхность. Количество обращений к ней в процессе проектирова- проектирования одной оптической системы достигает 108. Очевидно, что от скорости выполнения этой процедуры зависят общие затраты вре- времени на проектирование. Очень часто быстродействие различных ЭВМ, применяемых для оптических расчетов, оценивают не по количеству операций, а по количеству действительных лучей, которое можно рассчитать в секунду через одну поверхность. 81
Формулы для расчета лучей через оптическую систему известны с 1857 г. из работ И. Пецваля. Различные модификации этих фор- формул были ориентированы на выполнение человеком и основывались на использовании логарифмических и тригонометрических таблиц. Естественно, что эти схемы оказались мало пригодными для ЭВМ, которые на вычисление каждой тригонометрической функ- функции тратят большое количество элементарных операций. Наличие большого разнообразия схем расчета для специальных случаев, например, для плоских поверхностей или поверхностей большого радиуса, не являясь пре- препятствием для человека, представляло также суще- существенное неудобство при пе- переходе на ЭВМ. Поэтому для расчета хода лучей на ЭВМ были разработаны универсальные формулы, не содержащие тригонометриче- тригонометрических и логарифмических функций и требующие (кро- (кроме действия сложения, умно- умножения и деления) только двух извлечений квадратного корня. Заметим, что на ЭВМ квадратный корень извле- извлекается существенно быстрее, Рис. 3.5. Координаты действительного луча и его дифференциала в системе коор- координат Федера чем находится значение три- тригонометрической или лога- логарифмической функции. Идеи, положенные в основу этих формул, были сформулированы советским оптиком И. В. Лебедевым в работе [17] еще в 1938 г., но ввиду отсутствия в то время ЭВМ не получили распространения. Аналогичные формулы были предложены позже американскими оптиками М. Герцбергером [6] и Д. Федером [39, 40, 42]; послед- последние получили наибольшее распространение и известны под назва- названием формул Федера. Описание действительного луча. Действительный луч в общем случае описывается в системе координат Федера данной поверх- поверхности шестью величинами: тремя линейными координатами х, г/, (х\ г —проекциями радиус-вектора s = I у I какой-либо точки на луче, и тремя угловыми X = cos аХУ Y = cos a», Z = cos а — направ- (Л ляющими косинусами, т. е. проекциями орта q =( у (направления w луча (a*, ayt а2 — углы, образованные лучом с осями координат), 82
Из этих шести координат независимыми являются только четыре, так как X, У, Z связаны уравнением ||qf=qTq==X' + F2 + Z2=l, C.16) а точка s может быть зафиксирована на какой-либо поверхности, например, на плоскости хОу (в этом случае 2 = 0) или на опти- оптической поверхности, тогда х, у, z связаны уравнением поверхности B.87). Для лучей меридионального сечения координаты х и X равны нулю, поэтому достаточно двух координат, например у и Y ¦=-- cos ау •=- —sin oy, где Оу — угол между лу- лучом и осью г. Уравнение действитель- действительного луча, описывающее передвижение от точки s к точке s' вдоль луча на расстояние I (рис. 3.5), имеет вид: или х + XI; Z -\- LI. рис з.б. Прохождение действительного луча C.17) через поверхность Задача расчета хода луча через k-ю поверхность заключается в определении координат s^ и q^ луча, преломленного на этой поверхности в k-й системе Федера, по известным координатам siU-4 и q?_i луча в (k — 1)-й системе Федера, а также по параметрам k-й поверхности, показателям преломления nk_± и nk для (к — 1)-й и k-й сред и параметрам взаимного расположения систем Федера (рис. 3.6). Расчет действительного луча содержит те же этапы, что и расчет нулевого луча — перенос и преломление, но им пред- предшествуют два дополнительных этапа: преобразование координат и нахождение длины луча между поверхностями. Преобразование координат. На этом этапе мы переходим от векторов s^_i и q^-i в (к — 1)-й системе Федера к векторам sk и^в k-й системе данной поверхности. Содержание этого этапа зависит от класса системы по взаимному расположению поверх- поверхностей. В общем случае пространственных систем преобразование вектора s включает перенос начала координат на d^_x и поворот в соответствии с матрицей Ф?_ь согласно формулам B.111) гл. 2. Вектор q как свободный (орт луча) при параллельном переносе начала координат не изменяется, поэтому имеем: 83
Запишем это преобразование как алгоритм в рекуррентном виде, опустив индексы, как пересчет векторов s и q самих в себя, что необходимо для организации цикла расчета луча через систему поверхностей: s = <D(s-d); q = Oq. C.19) В децентрированных системах поворот отсутствует и при пре- преобразовании изменяется только вектор s, т. е. / s-s-d. C.20) В центрированных системах изменяется только координата z вектора s, т. е. z^z-d. C.21) После того, как выполнено преобразование координат, дальней- дальнейшие действия с векторами s и q производятся уже в одной fe-й системе Федера и не зависят от класса оптической системы. Нахождение точки встречи луча с поверхностью второго по- порядка. Два следующих этапа: нахождение длины / луча между поверхностями и перенос объединяются в одну задачу нахождения точки встречи луча с поверхностью, т. е. вектора s' по известным векторам s и q, а также параметрам уравнения поверхности. Легко увидеть, что задача сводится к решению системы уравнений, составленной из уравнения луча C.17) и уравнения поверхности B.87) s' = s + q/; <322> Здесь / — расстояние вдоль луча от точки s до точки s' пересече- пересечения луча с поверхностью. Подставляя s' из первого уравнения системы C.22) во второе, получаем одно уравнение относительно неизвестного / /(s + q/, a) = 0. C.23) Решив это уравнение и найдя /, подставляем найденное значе- значение в первое уравнение системы C.22) и находим вектор координат точки встречи s\ Основной проблемой, как мы видим, является решение уравне- уравнения встречи C.23), причем методы решения определяются видом уравнения поверхности. Полезно выделить поверхности второго порядка, для которых уравнение встречи C.23) получается квадратным и легко решается аналитически. Запишем это квадратное уравнение в следующем виде: аР - 2Ь/ + р = 0. C.24) Коэффициенты a, b, p этого уравнения найдем, если подставим в формулу C.23) уравнение B.94) поверхности второго порядка и в результате после преобразований получим: а = qTRq; b = qT (k - Rs); p = - sT Bk—Rs); C.25) 84
или а = р.У'2 = Z - + pj/Y р^ + рУ + Р^2г. C.26) Для поверхности вращения второго порядка в соответствии с § 10 имеем: рх = ру = р0 и pz = р0 A — е2), поэтому выражения для коэффициентов a, b, p с учетом C.16) упрощаются и полу- получаются в виде: C.27) -№)- Ъ = Z - Ро[хХ + yY + A - Рис. 3.7. Нахождение точки встречи луча с поверх- поверхностью: а — луч попадает на рабочую (в точке /) и на нерабочую (в точке 2) стороны поверхности; б — луч не пересекается с поверхностью Для сферы е2 = 0; р = р0 и потому имеем: C.28) Для плоскости рх — Ру = р- = 0; а = 0 и уравнение C.24) становится линейным —2Ы + р = 0, откуда . р = 2^ = ~ s к C.29) Решение квадратного уравнения C.24) для поверхностей вто- второго порядка может быть найдено по известной формуле 1=^=Г> C-30) где с = +// с2\ с2 = Ь2 — ар. Здесь, однако, необходимо выяснить три важных вопроса. Во- первых, какой знак брать у корня? Очевидно, что два знака дают две точки пересечения луча с поверхностью второго порядка (рис. 3.7), причем в одной из них (точке /) луч падает на рабочую сторону поверхности, а во второй — на нерабочую. Для того чтобы узнать, какой знак корня соответствует рабочей точке, 85
вспомним, что вектор нормали g направлен от рабочей стороны к нерабочей, т. е. из предыдущей среды в последующую (при п > >0), как показано на рис. 3.7, а. Следовательно, в рабочей точке вектор луча и вектор нормали образуют угол, меньший 90° и их скалярное произведение положительно, а в нерабочей точке — больший 90° и их произведение отрицательно. Найдем это скалярное произведение с = qTg. Вектор нормали выразим из формулы B.96) в виде g = k — Rs', где s' —точка пересечения луча с поверхностью. Подставляя s' = s + /q в соот- соответствии с уравнением C.17), получим: с = qT [k - R (s + /q)] - qT (к - Rs) - /qTRq = b-la, где а и b — коэффициенты квадратного уравнения C.24), опре- определенные формулами C.25). Подставим теперь / из формулы C.30) как решение уравнения C.24) и получим, что с = Ь ^— а = ± V с2- Как мы установили, в рабочей точке с >>0, откуда следует, что знак у корня должен быть положительным. Попутно мы доказали и следующие важные равенства: =,c = ]/rb2-ap или (qTgJ = с2 = Ь2 - ар, C.31) т. е. дискриминант квадратного уравнения C.24) равен квадрату скалярного произведения луча и нормали к поверхности в точке падения. Второй вопрос касается возможной потери точности для поверх- поверхностей большого радиуса. Действительно, например, для сферы, при малых значениях р0, числитель формулы C.30) представляет собой разность двух очень близких величин, что, как известно, приводит к большой относительной погрешности. В пределе при р0 -> 0 формула C.30) превращается в неопределенность типа -^-, что на ЭВМ приводит к сбою (арифметическому прерыванию — переполнению). Для того чтобы избавиться от этого недостатка, умножим числитель и знаменатель формулы C.30) на b + с. В результате получим новую формулу которая, как нетрудно убедиться, никогда не приводит к потере точности. Заметим, что при рх = ру = рг = р0 = 0, когда по- поверхность второго порядка переходит в плоскость, решение C.32) автоматически приводится к решению линейного уравнения C.29), поэтому при использовании формулы C.32) выделять случай плоскости нет необходимости. 86
Третий вопрос относится к случаю, когда дискриминант с2 = = Ь2 — ар квадратного уравнения меньше нуля и решения C.32) не существует. Очевидно, что при этом луч не пересекается с по- поверхностью второго порядка, как показано на рис. 3.7, б. Будем называть этот случай непопаданием луча на поверхность. Уточнение точки встречи для поверхности высшего порядка. Для таких поверхностей уравнение C.23) в общем случае неразре- неразрешимо аналитически, поэтому при его решении необходимо при- применять какой-либо численный метод. Как известно, все численные методы являются итерационными процессам уточнения корня, начиная с какого-либо начального приближения. Рассмотрим, например, один из наиболее употребительных методов—метод Ньютона—Рафсона, или метод касательной. Пусть на некотором k-м шаге процесса мы имеем приближенное значение корня №К Разлагая функцию / (Л в ряд Тейлора в окрест- окрестности / =~ /(/г) с сохранением первых двух членов, получим вместо C.23) линейное уравнение + ( (=о, решая которое, найдем уточненное значение корня Поправка А/(/г) определяется из следующей формулы: Принимая /<*+!) за начальное значение корня на следующем шаге, организуем итерационный процесс уточнения, который можно прекратить, когда абсолютная величина разности между двумя последовательными значениями корня станет меньше заданного допуска, т. е. когда выполняется неравенство | /»+!> _ ?с« | = | Д|»> | < е/- C.з4) Графически процесс Ньютона—Рафсона интерпретируется как замена реального графика функции / (/) касательной к гра- графику в точке l{k\ как показано на рис. 3.8. Процесс сходится тем быстрее, чем ближе начальное значение корня к искомому и чем ближе уравнение / (/) = 0 к линейному. Запишем выражения для числителя и знаменателя в формуле C.33). Из уравнения C.23) имеем: /(/<«) = /(в+ q/«); /;(/*) = /; (в+ q/tt>)=qT/; (в+ q*tt))- )=qTg = t, C.35) где с = qTg — скалярное произведение вектора нормали и орта падающего луча, 87
Очевидно, что одновременно с уточненным значением l{k) для точки встречи мы получаем также и уточненное значение с = qTg, необходимое затем для этапа преломления. В качестве начального приближения /<°) проще всего взять значение, полученное из решения квадратного уравнения C.24) без учета деформации высшего порядка. Для допуска 8/ окон- окончания процесса вполне приемлема величинами—10~7. Следует иметь в виду, что слишком малая величина 8/ может привести к тому, что условие C.34) никогда не будет выполнено из-за по- погрешностей вычисления ЭВМ. Рис. 3.8. Графическая иллюстрация процесса Нью- тона-Рафсона уточнения корня нелинейного урав- уравнения Если вместе с лучом производится расчет дифференциалов луча, то нам потребуется матрица Гессе Н уравнения поверх- поверхности, и в этом случае можно использовать ее для повышения сходимости процесса, добавив в ряде Тейлора еще один член где Решая получившееся квадратное уравнение относительно / и беря ближайший к l{k) корень, получим уже не линейный, а квадратичный процесс уточнения корня C.36) Поправка Д/(А:) находится по формуле 2/ ДГ' = - /' + sign (/') V Г2 - 2//"
В предыдущей формуле / = / (s + ql[k)), f — с = qTg. Элементы вектора нормали g и матрицы Гессе Н определяются по фор- формулам § 10. Как следует из формул B.105), B.106), для вычисления /, g и Н нам необходимо определять значения полиномов деформа- деформации высшего порядка B.103), B.104) и их производных. Для этой цели удобнее всего воспользоваться схемой Горнера, опи- описанной в пособиях [2, 11]. Эта схема основана на записи поли- полинома в виде Р («) = (••• ((а„<о + ап_г) со + а„_2) со + • • •) со + а0. C.37) Из формулы C.37) легко получается алгоритм, реализующий вы- вычисление полинома по схеме Горнера: Р = 0; для i от 0 с шагом 1 до р: Р = Рсо + ap_i. Дифференцируя этот алгоритм, получим алгоритм для сов- совместного вычисления значений полинома и его любых произ- производных: C.38) для i от 0 с шагом 1 до р: р(п) = р(п)^ + пр(п-1). р» = При реализации этого алгоритма необходимо учитывать, что в формулах B.103), B.104) полиномы неполные и не содержат членов нулевой, первой и второй степеней, поэтому в схеме Гор- Горнера надо принять соответствующие коэффициенты а0, аъ а2 равными нулю. Схема 3.3. иллюстрирует общий алгоритм нахождения точки встречи луча с поверхностью. Нахождение преломленного луча. Этап преломления не зави- зависит от вида поверхности. На этом этапе определяется вектор q' преломленного луча по вектору q падающего луча, вектору нор- нормали g в точке падения и показателям преломления п и п сред до и после поверхности. Вектор линейных координат луча при этом не изменяется. Формулы для нахождения преломленного луча основаны на векторной записи закона преломления B.28). Перенесем в формуле B.28) правую часть влево и вынесем за скобки общий множитель — вектор нормали. Тогда получим: [(/z'q' - nq) x g] = 0 или [(q' - uq) x g] = 0, C.39) где |i = n/n'. Если векторное произведение двух векторов g и q' — |Liq равно нулю, то это значит они коллинеарны, т. е. отличаются друг от друга только некоторым скалярным множителем Г: Ч' — ИЧ = Tg, откуда q' = \iq -f Tg. C.40) 89
\из блока преобразования - -1 KDOpQUHm а,Ь;р, с2=Ь2-ар {определение коэсрсрициентов идискрими- ¦—\нанта квадратного уравнения встречи \по формулам C.26)-C 28) да (непопадание) IST0P-1 [присвоение приз- наку непрохожде- непрохождения значения Выход решение квадратного уравнения Встречи по орормуле C.32) перенос точки вдоль луча на рас- расстояние по срормулам C 17) да (поверхность не выше второго порядка) t ¦ f определение значения деформации высшего порядка, её градиента и матрицы Гессе по формулам §10 'вычисление значений левой части уравнения поверхности, ее градиен- градиента и матрицы Гессе в текущей точ- точке по орормулам B.10!)-B102) вычисление значений первой и второй производных левой части уравнения поверхности по расстоянию вдоль L луча J вычисление поправки к расстоянию вдоль луча по формуле C.36) (процесс Ньютона-Рохдэсоиа сошелся) [уточнение расстояния вдоль луча -г-* [возврат на новый шаг 1 процесса Ньютона.- [_ Раорсона \к блоку вычисле- — ния преломленно- преломленного луча Схема 3.3. Алгоритм нахождения точки встречи действи- действительного луча с поверхностью 90
Для нахождения Г умножим предыдущее равенство скалярно на g, т. е. на gT в матричной записи: откуда gV = ,>т^ Fg g или с = \ic + Г C.41) где С = a1 q' = q' xg = || g || cos е'ис = gTq = qTg = || g | cos e равны соответственно косинусам углов падения и преломления, умноженным на длину нормали. Величина с была нами полу- получена в процессе нахождения точки встречи луча с поверхностью, а значение с находится с помощью закона преломления с'2 = || g ||2 cos2 е' = | g f A - sin2 8') = || g ||2 A - ^2 sin2 8) = - (i2 A - cos2 8)] = || g||2 - ^2 (||g|p -1 g2 IIcos2e). Итак: C.42) Нетрудно показать, что знак у корня должен быть положитель- положительным. Вариант, при котором с'г < 0, не позволяет найти прелом- преломленный луч и соответствует полному внутреннему отражению. Формулы C.40)—C.42) и составляют этап преломления в об- общем случае. Для поверхностей высшего порядка вектор нормали g определяется в процессе уточнения точки встречи, а для поверх- поверхностей второго порядка его нужно определить перед преломле- преломлением по формулам B.96). Для сферы и плоскости вектор нормали имеет простой вид g = k — pos; его длина ||g|| равна единице, поэтому формулы преломления могут быть упрощены; т. е. C.43) При этом вычисления вектора нормали не требуется. Вычисление волновой аберрации. Для вычисления волновой аберрации в соответствии с формулами B.35), B.36) необходимо в процессе расчета луча суммировать оптическую длину луча между поверхностями, т. е. Ul = S nl. Однако, как следует из формул, при этом волновая аберрация получается как разность двух очень близких величин и при недостаточной точности ЭВМ 9} ' 1 2/1 2\ i Lf ¦ • ¦ 1 ¦"— \X> ^1 "~~ Is j у и —— Y =i cf lie Xr = [iX — р0Гл:; q' -= jxq — pors + Гк или Y' = \iY — {Z' = aZ-
может иметь недопустимо большую погрешность. Действительно, погрешность волновой аберрации 6W получается из соотношения где б — относительная погрешность ЭВМ; [/] общая оптическая длина луча. Для уменьшения этой погрешности рационально вычесть из [/] сумму оптических осевых расстояний (в центрированных системах) и таким образом вместо [/] = ^nl находить [/] = =5 2 n (I — d). В этом случае погрешность волновой аберрации оценивается как 8W & -j- 6ndmax, где dmax — максимальное осе- осевое расстояние между поверхностями. При больших dmax и малой точности ЭВМ и этого приема оказывается недостаточно. В этих случаях приходится существенно усложнять формулы для вы- вычисления / и нахождения точки встречи луча, чтобы устранить в них источники погрешности — вычитание двух близких вели- величин. Такие приемы описаны, например, в статьях [26, 29]. Они применимы только к центрированным системам. В общем случае пространственных систем нужная точность достигается только за счет ЭВМ, т. е. необходимого количества разрядов в представ- представлении мантиссы чисел. § 16. РАСЧЕТ БЕСКОНЕЧНО УЗКИХ ПУЧКОВ И ДИФФЕРЕНЦИАЛОВ ЛУЧЕЙ ЧЕРЕЗ ПОВЕРХНОСТЬ Кроме действительных лучей в оптике широко используется расчет бесконечно узких пучков, т. е. лучей бесконечно близких к данному действительному лучу или дифференциалов лучей. Эти понятия являются обобщением нулевых лучей. При этом роль оптической оси выполняет произвольный действительный луч. Существуют различные формы описания бесконечно узких пуч- пучков и соответственно различные формулы для их расчета. Расчет положения фокусов бесконечно узких пучков. Наиболее распространенным является расчет положения фокусов Ft и F's меридионального и сагиттального бесконечно узких пучков в окре- окрестности основного луча, лежащего в меридиональной плоскости в центрированных системах (рис. 3.9). Пусть нам известны рас- расстояния t'k-x и sJU-i вдоль луча до фокусов F't и F's после (k — 1)-й поверхности; требуется найти расстояния fk и s'k после данной k-й поверхности. Как и в расчете нулевых лучей, здесь можно выде- выделить два этапа. Первый этап — преобразование координат и перенос — вы- выполняется по формулам, легко получаемым из рис. 3.9: tk = 4-i — /; sk = sk-i — I. 92
Второй этап — преломление—основывается на известных ин- инвариантах Юнга—Гульстранда [27, 30, 36]: / cos e 1 \ , , / cos &' 1 \ \ Я COS 8 ( —; ) = П COS 8 ( тт ) \ t rmj \ V гт 1 — меридиональный инвариант; / 1 cosе \ __ , / 1 cose' \ П \s пГ/~~П V"? ~) — сагиттальный инвариант, C.44) где гт и rs — радиусы кривизны поверхности в меридиональном и сагиттальном сечениях, определяемые по формулам B.91). Рис. 3.9. Прохождение дифференциала луча через поверхность Из выражений C.44) видно, что удобнее рассмативать не отрезки t, s, t', s и радиусы rm, rs, а обратные им величины тт, ^s, Tm, ^s, pm и ps. Из выражений C.44) получаем формулы пре- преломления для этих величин: Тт = -?5^7 [[X COS2 8Тт + (COS е' — [X COS 8) рт]; Ts = M-ts + (cos г — [яcose) ps. В процессе расчета основного луча мы получаем величины с = ||g|| cos 8, с = ||g|| cos г\ Г = (с — !ic)/||g||2. Подставляя их в предыдущие формулы, будем иметь: 93
Заметим, что в выражения B.91) для значений кривизны по- поверхности входят делители ||g[|3 и ||g||, поэтому удобнее исполь- использовать вместо реальных значений кривизны pw и ps рассмотрен- рассмотренные ранее в § 10 ненормированные значения рт = рт || g f и Ps = Psllgll B соответствии с формулами B.92). С введением рт и ps формулы преломления для дифференциалов упрощаются. Запишем окончательные формулы в рекуррентном виде: перенос х = %т * т = Ts • C 45) преломление тт = с'~2 (тт\м2 + Грт); ts = ts|li + Гт5. C.46) Всего на расчет отрезков тт и rs требуется четыре сложения и вычитания, восемь умножений и три деления. Расчет линейных и угловых дифференциалов меридионального луча. Вместо положения фоку- фокусов F't и F's удобно рас- рассматривать дифференциа- дифференциалы меридионального луча в системе координат основ- основного луча. Поместим начало декар- декартовой системы координат в точку пересечения основ- основного луча, идущего в мери- Рис. 3.10. Дифференциал луча в системе диональной плоскости, с координат, связанной с основным лучом поверхностью. Ось г напра- направим вдоль луча, как пока- показано на рис. ЗЛО. Луч бесконечно близкий к данному, или диффе- дифференциал луча, определяется совершенно аналогично параксиаль- параксиальному или нулевому лучу в системах с двумя плоскостями симмет- симметрии— двумя линейными дифференциалами hx и hy— координатами точки его пересечения с плоскостью Оху и двумя угловыми диф- дифференциалами — проекциями его орта на эту плоскость или углами ах и ау, образованными им с плоскостями Oyz и Охг со- соответственно. Так же как и для нулевых лучей, объединим thx\ линейные координаты в вектор h = I , а угловые — в век- тор а = у Отметим, что все последующие соотношения справедливы строго только для бесконечно малых величин hXJ hyy ax> ay, т. е. в бесконечно малой окрестности основного луча, аналогич- аналогичной рассмотренной в § 13 параксиальной области. Тем не менее, мы можем, по аналогии с нулевыми лучами, рассматривать диф- 94
ференциалы h и а любой величины, считая их пропорционально увеличенными бесконечно малыми дифференциалами. Окрест- Окрестность основного луча, в которой остаются справедливыми линей- линейные соотношения между дифференциалами, т. е. в которой можно пренебречь их вторыми и высшими степенями, называется гаус- гауссовой областью вокруг действительного луча. Рассмотрим расчет дифференциалов h и а. На этапе переноса, аналогичном таковому для нулевых лучей, изменяются только линейные дифференциалы (рис. 3.9): К - 1гЧ-г ~ a'*kJ* . и> , , или hk = h^_! - aA-i/. hyk — НУк-1 ~~ аУм-11'> Этап преломления включает в себя преломление линейных и угло- угловых дифференциалов. Для линейных дифференциалов преломле- преломление заключается в переходе от плоскости, нормальной падающему лучу, к плоскости, нормальной преломленному лучу. Из рис. 3.9 легко получить: h' h C0S8' — и с' • W — h п п •"" nVk Т ' xk — x W h Т ' xk — xk * Выражения для преломления угловых дифференциалов можно вывести из формул C.46), если учесть, что тт = ay/hy, %'m = = a'ylh'y, rs = ax/hx n i's = ax/hx. Таким образом получаем: ау = с (\мсау + Tpmh'y). Запишем окончательные формулы в рекуррентном виде: перенос hx = hx — aj;) и и # C-47) преломление hy - h/c'\ \ ах = |дос, + ГрА; C.48) ау = с'~* (iicc'ay + Tpmhy). J Всего требуется столько же действий, сколько при расчете продольных отрезков по формулам C.45), C.46), но выражения C.47), C.48), во-первых, не содержат особенностей (деления на ноль при / = 1/тт или / = 1/ts), во-вторых, позволяют полу- получить не только положение фокусов, но и координаты дифферен- дифференциала луча hX9 hy и aXi ay на каждой поверхности, что необхо- необходимо при определении габаритов пучков (см. далее § 17). Расчет дифференциалов в общем случае «косого» луча. В слу- случае внемеридионального косого луча формулы предыдущих раз- разделов не пригодны и необходимо рассчитывать дифференциалы 95
луча в системе координат Федера данной поверхности. Действи- Действительный луч, как мы видели, описывается в этой системе двумя векторами s и q. Луч, бесконечно близкий к данному, будет ха- характеризоваться векторами s + ds и q + dq, где ds и dq — беско- бесконечно малые дифференциалы (см. рис. 3.5). Таким образом, расчет бесконечно близкого луча можно свести к расчету дифференциалов ds и dq, составляющих вместе дифференциал луча. Как и раньше, будем рассматривать не только бесконечно малые, но и пропор- пропорционально увеличенные дифференциалы. Расчетные выражения для ds и dq легко получить дифферен- дифференцированием алгоритма расчета основного луча. Дифференцируя формулы C.19), найдем, что преобразование координат для дифференциалов заключается только в повороте, т. е: Дифференцируя формулы переноса C.17) получим ds' = ds + dqt + qdl. C.49) Здесь неизвестна величина dl. Чтобы найти ее, обратим вни- внимание на то, что точка s' + dsf пересечения бесконечно близкого луча с поверхностью должна удовлетворять уравнению поверх- поверхности B.87), т. е. f(s'+ds', a) = 0. При бесконечно малых дифференциалах ds' можно разложить предыдущую формулу в ряд Тейлора, содержащий только два члена: r(s', a) = 0, ho/(s', a) = 0, так как точка s' лежит на поверхности и удовле- удовлетворяет уравнению B.87), a v/ (s', a) = g — есть вектор нормали к поверхности. Таким образом получаем, что линейный дифференциал луча ортогонален к нормали в точке падения основного луча ds/Tg = gTds/ = 0. C.50) Воспользуемся полученной формулой и умножим обе части равенства C.49) скалярно на вектор нормали, т. е. в матричной форме на gT: gT ds = gT (ds + dql) + gTq dl = 0. Отсюда, учитывая, что gTq = qTg = ? = 1 g || cos e — величина, ко- которая находится в процессе расчета основного луча, получим Продифференцируем теперь формулы преломления C.40) dq' = dq[i + dgr + gdr. C.52) 96
Здесь неизвестны dg и dV. Дифференциал dg вектора нормали можно найти как произведение матрицы Гессе Н (матрицы вторых производных уравнения поверхности в точке падения) на вектор линейных дифференциалов ds', в соответствии с формулой B.90), Для определения дифференциала dY обратим внимание на то, что орт близкого к основному луча q + dq, так же как и орт основ- основного луча q, имеют единичную длину || q + dq f = (q + dqf (q -|- dq) = qTq + 2qT dq + dqT dq = 1. Так как qTq = ||q|p =¦ 1, то пренебрегая членом второй сте" пени dqT dq ¦= ||dqf, получим: dqTq = qTdq==O, C.53) т. е. угловой дифференциал луча ортогонален орту луча. Вос- Воспользуемся предыдущей формулой для нахождения dT. Для этого умножим обе части выражения C.52) на q'r. С учетом ра- равенства C.53) запишем q'T dq' = q'T (dqji + dgT) + q'TgdT = 0. Отсюда, так как q'Tg = gTqr =cf ^ ||g|| cos e' — величина, кото- которая находится при расчете основного луча, получаем Запишем сводку формул расчета дифференциала косого луча в рекуррентном виде в форме алгоритма: преобразование координат (только для пространственных си- систем) ds-=O>ds; dq = Odq; C.54) перенос ds-ds + dq/; d/= — UL; ds-ds + qd/; C.55) преломление dg-Hds; dq-dqjx C.56) Входящие в эти формулы величины, а именно: длина луча /, вектор нормали g, скалярные произведения с и с\ как мы видели, получаются в процессе расчета основного луча, поэтому целесооб- целесообразно рассчитывать одновременно основной луч и необходимое количество дифференциалов. Матрица Н находится по формулам § 10 также в процессе расчета основного луча. На расчет одного 97
дифференциала, без преобразования координат и вычисления матрицы Н, требуется 12 сложений и вычитаний, 21 умножение и два деления на каждой поверхности. § 16. РАСЧЕТ ДЕЙСТВИТЕЛЬНЫХ ЛУЧЕЙ И ИХ ДИФФЕРЕНЦИАЛОВ ЧЕРЕЗ ОПТИЧЕСКУЮ СИСТЕМУ Полученные в предыдущем параграфе формулы позволяют рассчитать координаты луча и его дифференциалов, преломлен- преломленных на какой-либо поверхности, если они известны после пре- преломления на предыдущей поверхности. Поскольку эти формулы записаны в рекуррентном виде, то легко организовать расчет луча через систему поверхностей, включив эти формулы внутрь цикла, в котором последовательно перебираются параметры всех поверхностей. Перед началом цикла нам должны быть известны координаты луча и дифференциалов на «нулевой» поверхности, предшествующей первой поверхности системы, а также положе- положение первой поверхности относительно нулевой (в центрированных системах — осевое расстояние d). Назовем эти данные входными координатами луча. По окончании цикла мы получаем коорди- координаты луча и дифференциалов, преломленных на последней по- поверхности, т. е. выходные координаты, из которых мы можем получить все необходимые сведения об аберрациях и других характеристиках системы, т. е. выходные результаты. В процессе расчета луча часто возникает необходимость опре- определить его координаты на апертурной диафрагме. Проще всего это достигается применением формул C.17), C.21) и C.29) пре- преобразования координат и переноса луча до диафрагмы сразу же после получения координат луча на поверхности, предшествующей диафрагме. Если диафрагма находится перед системой, то ука- указанные действия производятся перед началом цикла по поверх- поверхностям. При этом необходимо учитывать, что после определения координат луча на диафрагме, положение следующей поверх- поверхности должно уже определяться не относительно предыдущей, а относительно диафрагмы. Укрупненный алгоритм расчета луча через систему показан на схеме 3.4. Рассмотрим более по- подробно вычисление входных координат, предшествующее рас- расчету луча через систему, и выходных результатов, — заверша- завершающее его. Расчет входных координат. В первых программах расчета оптических систем на ЭВМ конструктор вынужден был задавать входные координаты каждого луча либо на поверхности предмета, либо на поверхности зрачка, что требовало от него дополнитель- дополнительных вычислений. В современных программах входные координаты определяются автоматически по следующим данным (ограничи- (ограничиваемся случаем центрированных систем): s, sp, y0 — обобщенный передний отрезок, обобщенное положение зрачка и обобщенная величина предмета и Ах, Ау, рх, ру — обобщенные апертуры и ка- 98
Расчет входных координат (о/пертурная диафрагма находится да перед системой) / Цикл по поверхностям\ —\д/?я horn 1 до NS ? \ / Л/Пг Расчет луча и дифференциалов через k-to поверх- поверхность dd PfO Перенос луча и дифференциалов до апертурной диафрагмы (апертурмая диафрагма находится да за этой поверхностью) Ро-0 Коней, цикла , \попо8ерхно- Ш1ЯМ. ' Расчет выход- выходных результатов перенос луча и дифференциалов до апертурной диафрагмы d=dk-dA Схема 3,4. Алгоритм расчета действительного луча через оптическую систему ионические зрачковые координаты в соответствии с определе- определением гл. 2. Конструктором из этих величин задаются только s и у0, а осталь- остальные определяются автоматически в процессе нахождения габари- габаритов пучков, как будет описано в следующем параграфе. Выбор нулевой поверхности и расчет входных координат зависят от типа предмета. 99
Рассмотрим случай близкого предмета (признак типа пред- предмета ОВ = 1). В этом случае за нулевую поверхность естественно принять поверхность предмета, т. е. плоскость SA (рис. 3.11, а), находящуюся на расстоянии s от первой поверхности оптической Рис. 3.11. Входные координаты действительного луча: для близкого (а) и уда- удаленного (б) предметов системы ОС. Следовательно d = —s. Вектор линейных коорди- координат луча на этой поверхности равен Вектор угловых координат Ч = I ^ ) в соответствии с § 6 W гл. 2 выражается следующим образом: причем координата Кгл легко находится из рис. 3.11, а по формуле tgco jA+tg2 co где sp — обобщенное положение входного зрачка в килодиоп- триях. Входные значения дифференциалов луча определяются типом дифференциалов и целью их расчета. Каждому дифференциалу, 100
независимо от его типа, можно поставить в соответствие диффе- [чес dpx ренциалы канонических координат на предмете dr\ = I , \ax\y и зрачке ф = Можно записать следующие выражения, связывающие диффе- дифференциалы dr\ и ф с входными координатами dx9 dy9 dzy dXy dYy dZy hxy hyy axy ay\ для дифференциалов косого луча dx = — dx\x -j-; dX = dpkAjn\ X dy = — dr\y —д—; dY = dpyAy/ny а координаты dz и dz находятся из условий C.50) и C.53), т. е. для дифференциалов меридионального луча в системе луча А, = — ^т]лЯ/Лх; ах = — dpxAx/n; hy = — dr\yXZ/Ay; ay = — dpyAy/nZ; поскольку dF = d (sin a) = cos о d da, a cos a = Z и do = ay. Чаще всего рассчитываются зрачковые дифференциалы, напри- например, для определения астигматических отрезков и габаритов пучков. При этом dr\x = dr\y = 0; dpx = 1; фу = 0 — для «сагиттального» дифференциала и dpx = 0, ф^ = 1 — для «ме- «меридионального» дифференциала. Перейдем теперь к случаю удаленного предмета (признак типа предмета ОВ = 0). В этом случае за нулевую поверхность необходимо принимать не поверхность предмета SA, которая может быть расположена сколь угодно далеко от системы, а по- поверхность зрачка — входную сферу SP, которая при удаленном предмете всегда находится вблизи системы и проходит через полюс О — центр зрачка. Таким образом, d = —sP (рис. 3.11,6). Определим координаты луча на входной сфере в системе xpypzp координат Федера этой сферы. В соответствии с определением зрачковых координат по формулам B.33) и B.43) имеем; хР = Pjn =* pxAxln\ УР = ру1п - pyAyln, 101
Координата zp находится из уравнения входной сферы, а именно: где рр = —, а гр легко находится из рис. 3.11, б: Г _ р S COS (О Заметим, что тангенс угла со есть в данном случае обобщенная величина предмета, т. е. tg со = уОу поэтому Полученный вектор sp = I Ур I необходимо теперь пере- переча/ вести в систему координат х, у, zy оси которой параллельны осям систем координат всех поверхностей в системе. Для этого необ- необходимо умножить вектор на матрицу Ф поворота на угол со, т. е.: (х\ / cosco sin со 0N у\ = I— sin со cosco 0|.(г/р]или zj \ 0 0 x = xD cos со -f yp sin со; , COS CO; где cos со == —. ; sin со = y0 cos со. У1+Уо Вектор угловых координат луча q легко находится из век- векторного треугольника АРО в виде откуда q = Чгл — pPs. I Заметим, что орт главного луча имеет координаты qrJI = I —sin со \ cosco Свяжем теперь входные координаты дифференциалов луча с дифференциалами канонических координат. Нетрудно полу- получить из рис. 3.11, б следующие соотношения: 102
для дифференциалов косого луча в системе Федера ds = <DdSp; dq = —p^ds, C.57) где dxP = dpxAJn; dyp = dpyAyln\ ^y „ 9p (Ур dyP + xp dxp) __ pp (yp dyp - 1 / 1 2/2 _i_ 2\ Л — для дифференциалов меридионального луча ^а = dpxAx/n; ах = Л^рр; /г?/ = dpyAy/n; ау = j При выводе мы полагали dr]x = dr|^ = 0, т. е. рассматривали случай зрачковых дифференциалов. Приведем сводку формул для вычисления входных координат: удаленный предмет (ОБ = 0) близкий предмет (ОБ — 1) COS со =— ; sin со = у0 COS со; х = 0; у = у0; г = 0; pD = scosco; sinco=-r=_^ ' Г^ \~/0 P Xp = рА/л; ^ = рИл-М; r/p = р^л; Z = К1 - X2 - Г2; х = хр cos со -j- yp sin со; = — хр Sin СО + УР COS 0); X = — ррх; Г — — sin со — Z = cos (о — ppz\ hx — Д,//1; hy = Л^/п; C.58) юз
Вычисление выходных результатов. После окончания расчета луча через систему мы имеем векторы s и q координат луча, пре- (hr\ ломленного на последней поверхности, а также векторы h = I ' и а = I дифференциалов луча. Кроме того, нам известен рабочий задний отрезок So, определяющий положение поверх- Рис. 3.12. Выходные координаты в пространстве изобра- изображений: для близкого (а) и удаленного (б) изображения ности изображения. По эгим данным необходимо определить абер- аберрации луча, его зрачковые координаты и другие характеристики. Как и при вычислении входных координат, формулы будут раз- различными для близкого и для удаленного изображения. Необхо- Необходимо также выделить случай для главного луча пучка. На рис. 3.12 изображены условно: последняя поверхность оптической си- системы ОС, поверхность изображения S'a, выходная сфера S'p и два луча — главный и неглавный. Рассмотрим случай близкого изображения (признак типа изоб- изображения IM = 1). Как для главного, так и для неглавного лучей прежде всего мы находим координаты точки пересечения луча 104
и дифференциалов луча с плоскостью изображения (рис. 3.12, а). Из формул переноса C.17) и C.47) получаем: ( } где /' определяется из условия z = z + VZ = 5q, откуда Г == Z ' Затем для главного луча, проходящего через центр зрачка, определяем следующие величины: — обобщенную величину изображения в миллиметрах Уо = У\ — положение зрачка относительно последней поверхности zp в миллиметрах и обобщенное положение зрачка s'p в килодиоп- триях: -' „ uZ, > Y' . — астигматические отрезки гт и zs в миллиметрах ~ У 7' <~ . х 7 ~т == *-* ¦> <^.s — ?*' Кроме того, находим кривизну рр выходной сферы по фор- формуле / — — = — — р Для неглавного луча определяем." — обобщенные поперечные аберрации bg'\ 8G' в миллиметрах 8g = У — Уо\ 8G = x'; C.60) — обобщенные выходные зрачковые координаты р'х и р'У9 т. е. умноженные на показатель преломления проекции Хо и Yq орта идеального луча q6, р'х = пХо\ р'у = n'Y'o. Нетрудно получить из рис. 3.12, а следующие соотношения: Via' V ' г' 1 а ' q(/p -f- Ax = q г или q0 = q ~ — Дх • гр гр Обозначим через Лг' ^ г' — г'р\ определение А/*' рассмотрим чуть ниже. Тогда 105
Таким образом: Py=n[Y(l+pp/ir')-pp6g]. Для нахождения волновой аберрации W, в соответствии с фор- формулами B.35), B.36), нам необходимо иметь оптические длины данного [Я, Р' ] и главного [О, О' ] лучей до выходной сферы. Прибавим к [Р, Р' ] и [О, О' ] в выражении, например, B.35), одну и ту же постоянную величину п'г'р — оптический радиус выходной сферы в следующем виде: W =\\\РЛ Р'\ + п'г _ п Лг' - [О, О'] - пгр], где г' = г'р + Л/*' — расстояние от точки Рг до А'. Заметим, что [Р, Р'] + п'г' = [Я, А'] и [О, О'] + п'гр = = [О, Ло] — это оптические длины данного и главного лучей до поверхности изображения, которые легко находятся по извест- известному расстоянию /'. Таким образом Поправка А/*' с достаточной степенью точности определяется следующим образом. Проведем сферу радиусом г'р с центром в точке Р\ которая пересечет луч q' в точке К!'. Опустим из точки Л о перпендикуляр А'0М' на луч q'. Тогда Лг' = К А' = М'А' — '8" — М'К - Но М'А' — проекция вектора Ах' = I ~г,\ на луч q', равная их скалярному произведению М'А' = аг = q'TAx' = = X8G' + Y8g'. Длина отрезка М'К' = а% находится прибли- приближенно из следующей формулы: М'К' = % ШУ = ^ 4 где а\ = 6G/2 + 8g'\ Окончательно получаем, что Аг' = (X8G' + Y8gr) — р'р X X 1б/2 + 6G'2 - (X6G' + Ybg'f]l2. Рассмотрим теперь вычисление выходных результатов для удаленного изображения {признак типа изображения IM = О, (рис. 3.12, б)). Для главного луча находим следующие результаты: — обобщенное положение выходного зрачка в миллиметрах от последней поверхности 106
— обобщенную величину изображения, которая в данном случае есть тангенс угла наклона главного луча с осью, Заметим, что для наглядности величина изображения может быть выражена и в градусной мере, но во всех выражениях, на- например при расчете дисторсии, эта величина щ должна рассма- рассматриваться как тангенс угла. Затем находим длину главного луча /' от последней поверх- поверхности до выходной сферы l' = -y/Y. Прибавим оптическую длину n'V к оптической длине луча, накопленной в процессе расчета, Перенесем дифференциалы луча до выходной сферы по фор- формулам переноса C.47): tixz^zhx — i' ах\ h'y=hy — l'ay и найдем обобщенные астигматические отрезки в килодиоптриях в соответствии с определением по формуле B.39): 7 аУ п * 2 — ах НУ Нх 1 где рр = — кривизна выходной сферы. р Из рис. 3.12, б видно, что Рассмотрим расчетные действия для неглавного луча. Прежде всего необходимо найти точку встречи луча с выходной сферой в системе координат Федера x'pypzp, связанной с этой сферой. Для этого сначала мы выполним преобразование координат век- векторов s и q, переведя их в систему xpypzp по формулам C.19), учитывая, что вектор переноса начала d и матрица поворота Ф будут иметь следующий вид (рис. 3.12, б): d= 0 где cos со;л = Zrjl; sin со;л = — 7ГЛ. Затем определяем длину луча /' от последней поверхности до выходной сферы по формулам C.28), C.32) для нахождения точки встречи со сферой, имеющей кривизну р0 = рр. Зная /', мы 107
можем нарастить оптическую длину луча до выходной сферы по формуле Обобщенные поперечные аберрации луча в данном случае угловые и в соответствии с формулой B.2) они равны C.61) Полученные обобщенные аберрации выражаются в радианах, а для наглядности их можно представить в градусной мере. Во всех рабочих формулах использовать их необходимо только в ра- радианах. И, наконец, находим обобщенные зрачковые координаты р' луча в соответствии с формулой B.33) Определение дисторсии производится по общим формулам, как для близкого, так и удаленного изображения. В соответствии с выражением B.10) находим абсолютную дисторсию в милли- миллиметрах для близкого изображения и в радианах — для удаленного Аг/о = Уо — voyo, где у0 — обобщенная величина предмета; v0 — обобщенное уве- увеличение; уо — обобщенная величина изображения для главного луча. Относительная дисторсия в процентах находится по формуле Д = -^ 100. v Для лучей осевого пучка определяется, кроме того, величина относительного неизопланатизма по формуле B.41) для любого типа изображения. § 17. ОПРЕДЕЛЕНИЕ ГАБАРИТОВ ПУЧКОВ В предыдущем параграфе при рассмотрении расчета хода луча через оптическую систему мы предполагали, что известны раз- размеры и положение выходящего из данной точки предмета пучка лучей, к которому принадлежит рассчитываемый луч, т. е. обоб- обобщенные передние апертуры Ах, Ау и обобщенное положение зрачка sp. Определение этих величин, т. е. габаритов пучков, 108
представляет собой самостоятельную и довольно сложную за- задачу, которая, в зависимости от возможностей ЭВМ и от потреб- потребностей данного этапа проектирования, может решаться с различ- различной степенью приближения к реальным габаритам. Условия прохождения луча через систему. Рассмотрим фак- факторы, определяющие габариты пучков в оптической системе. Из каждой точки предмета выходит неограниченный пучок лучей, однако не все лучи проходят через оптическую систему и дости- достигают поверхности изображения, а лишь те из них, для которых соблюдаются следующие условия прохождения; — условие попадания луча на каждую поверхность, которое математически формулируется как неравенство с1 > 0 в форму- формулах C.31); — условие преломления на каждой поверхности без полного внутреннего отражения, характеризующееся неравенством с'2 > О в формуле C.42); — условие прохождения луча не за границами пересечения данной и предыдущей поверхностей, которое определяется нера- неравенством nl > 0 в формулах расчета луча C.22); — условие прохождения луча внутри световых габаритов всех поверхностей; в центрированных системах, где световые габа- габариты представляют собой круги, это условие формулируется на каждой поверхности в виде неравенств: у > тр; у < -;р — для лучей меридионального I у2-f х2 <С (""тр") —Для общего случая косого луча; сечения; р) —Для общего случая косого луча; — условие прохождения внутри заданного габарита пучка на апертурной диафрагме, которое записывается в виде следу- следующих неравенств: Ус1^>Ус1 ; Уа^Уй —Для лучей меридионального сечения; о о / Da\2 yd~Vxd<A-Y) —для общего случая косого луча. В этих неравенствах через yd и yd обозначены верхняя и нижняя границы пучка на диафрагме (рис. 3.13). Они находятся по формулам: &в = :т-A-*»); ^н = —^-О-и C.63) где Dd — световой диаметр апертурной диафрагмы; kB и kn — заданные коэффициенты геометрического виньетирования пучка, показывающие какая часть пучка, по отношению к половине 109
диаметра, срезается сверху и снизу на апертурной диафрагме (рис. 3.13). Все перечисленные условия прохождения можно привести к единообразному виду ttt->0, i= 1, . . ., ЛГ, C.64) где щ — нормированная левая часть какого-либо условия. При- Причем, для достижения лучшей сходимости методов определения габаритов пучков щ полезно привести к форме, наиболее линейно зависящей от входных коорди- координат луча; например: для условия попадания — и = 1 — — У\ —с2; для условия пре- преломления без полного внутрен- внутреннего отражения — и = 1 — —1/1 — сг\ для условия прохо- прохождения внутри габаритов — + 1; и= 1-- и = Dr. и = 1 —¦ В + ф Dr. и т. д. Рис. 3.13 Схема геометрического виньетирования пучка на апертурной диафрагме зависимости от этапа проектирования при определе- определении габаритов пучков прини- принимаются во внимание различ- различные из перечисленных усло- условий. Определение габаритов осевого пучка. Габариты осевого пучка определяются одним числом — передней центральной апертурой Ло. Конструктор обычно задает апертуру осевого пучка либо не- непосредственно в виде Л о, либо в виде задней апертуры Л о или светового диаметра апертурной диафрагмы Dd. В последних двух случаях легко определить значение передней апертуры по формулам: J C-65) где vo — обобщенное увеличение; у о — обобщенное увеличе- увеличение системы между входным зрачком и апертурной диафрагмой. Величины vq и г/оп определяются в процессе расчета нулевых лучей. Полученное значение Ло может оказаться нереальным из-за того, что для апертурного луча с этим значением нарушаются условия прохождения. В упрощенных вариантах программ кон- конструктор сам следит за этим и принимает меры для устранения причин нарушения или уменьшает заданные значения Ло, А'о, Dd. В более сложных программах автоматически находится зна- значение Ло, соответствующее реальному апертурному лучу. Методы по
да (задана передняя апертура) Определение предваритель- предварительного значения передней апер- апертуры Сообщение обошибке г „ Нет данных, дляопре-j деления габаритов" Коней, (луч не проходит) да im да >-• (задана за'с апертура) A =A\v ' 0=2и Расчет хода апертурного луча через систему да (луч проходит через систему) ^(Высоталучаотли- т!!егТ1 "'чается отзаданной) да (высота луча ^ на апертурной диа- аррагме близка к задан- заданной) I Сообщение ¦ „ Апертурный j /луч не проходит или прохо-/ f дит не на заданной Высо-/ ' те на апертурной диавр-/ рагме X Поиск реального amp- турного луча С Коней, Коней, ) Схема 3.5. Укрупненный алгоритм определения габаритов осевого пучка нахождения такого граничного луча будут рассмотрены ниже. Кроме того, из-за приближенного характера формул C.65), реальные значения А'о и Dd могут отличаться от заданных на ве- величину неизопланатизма. Поэтому, если был задан световой диаметр реальной апертурной диафрагмы, найденное по формуле C.65) значение Ао необходимо уточнить. Процесс уточнения про- производится тем же методом, что и поиск реального апертурного луча в случае нарушения условий прохождения. Алгоритм определения габаритов осевого пучка показан на схеме 3.5. 111
Определение положения зрачка для внеосевых пучков. Опре- Определить положение зрачка — это значит найти главный луч, вы- выходящий из данной точки предмета и проходящий через центр апертурной диафрагмы (при отсутствии виньетирования) или через центр заданной области на апертурной диафрагме (при наличии виньетирования) (рис. 3.13). Другими словами, необ- необходимо найти луч, имеющий на апертурной диафрагме значение координаты yd, равное уц, где уц определяется по следующей формуле: Уи = (Учя + Уан)/2 = -Г" {k« - *»>• C-66> Положение главного луча на входе в систему определяется либо положением входного зрачка sp при фиксированных значе- значениях канонических координат рх = ру = О, либо канонической координатой р^ при неизменном sp. Таким образом, меняя sp при неизменных рх = р^ = 0 или, меняя р^ при неизменных sp и рх = 0, мы изменяем положение луча на входе, а следовательно и ход луча через систему и его координату yd на апертурной диаф- диафрагме. Необходимо подобрать такое значение ру или spy при котором выполняется равенство yd = уц. В дальнейшем для определенности будехМ в качестве параметра использовать sp. При любом значении sp мы может произвести расчет луча через систему и найти его координату yd на диафрагме. В этом смысле yd является функцией от spy т. е. yd = f (sp). Причем эта функцио- функциональная зависимость реализуется алгоритмом расчета луча через систему до апертурной диафрагмы. Таким образом, мы можем сформулировать нашу задачу как решение уравнений: f (sp) = Уч или / (sp) - уц = 0. C.67) Так как функциональная зависимость yd — f (sf) в явном виде неизвестна, то решить это уравнение можно только каким- либо численным методом уточнения корня, начиная с некоторого его начального значения, например, рассмотренным в § 14 ме- методом Ньютона-Рафсона, схема которого для данного случая может быть записана следующим образом: sP = sp -~ Asp, C.68) где Asp --=¦ dydldsp В качестве начального значения проще всего принять sp = = sPo, где sPo получено из расчета нулевых лучей. Для вычисления производной dydldsD также приходится приме- применять численный метод. В некоторых программах для этой цели рассчитывают через систему один или два дополнительных луча, отличающихся от основного луча по положению зрачка на малую 112
величину rb8s/;, и для этих лучей определяют координаты пере- пересечения их с диафрагмой yd± и ydi. Тогда: fL^hifJLL или М.** У"'~У'-' • C.69) ds p Это, однако, не рационально, поэтому проще вместо близкого реального луча рассчитывать меридиональный дифференциал луча, отличающийся от основного луча зрачковой координатой. При этом мы затратим меньше действий и получим производную более точно. Пусть при расчете меридионального дифференциала мы получили для него значение линейного дифференциала на апертурной диафрагме dyd = -—?-• Тогда ду dtj дру ___ dyd дру __ 1 dyd дру C 70) dsp dp у dsp dp у dsp Ау dp у dsp где dp у — приращение канонической зрачковой координаты для данного дифференциала (чаще всего берут dpy — 1). Производ- Производная -~У- обобщенной зрачковой координаты по обобщенному OSp положению зрачка выражается следующими формулами: -~- = —y0^cos303 —для близкого предмета, | X - <871> -—- = п sin (о — для удаленного предмета. dsp ) Процесс уточнения C.68) можно прекратить, когда разность Ud — Уц будет достаточно мала. Причем лучше всего оценивать ее малость по отношению к диаметру диафрагмы lM<Ljl]!zL < & - 10 -- Ю-4. C.72) В процессе нахождения главного луча описанным методом мы можем столкнуться с непрохождением луча через какую-либо поверхность, предшествующую апертурной диафрагме, т. е. с не- непопаданием или с полным внутренним отражением. В этом слу- случае мы не имеем возможности найти координату луча yd и его дифференциала dyd и продолжать процесс. Такая ситуация не- необязательно свидетельствует о невозможности найти главный луч, а может указывать просто на неудачное начальное прибли- приближение. При использовании простых программ для небольших ЭВМ (например, клавишных) в такой ситуации конструктор сам меняет начальное приближение sp до тех пор, пока не устранит непрохождение и не получит нужного главного луча или пока не убедится в бесполезности этих попыток. При использовании достаточно мощных ЭВМ решение этой задачи необходимо воз- возложить на программу. Для того чтобы устранить возникшее не- непрохождение луча, необходимо найти такое значение входного ИЗ
параметра spj которое обеспечило бы положительную величину с1 или с\ Таким образом, при непрохождении луча вместо уравне- уравнения C.67) необходимо решить при помощи метода Ньютона— Рафсона следующее уравнение относительно sp: u(sp) = ac, C.73) где и = 1 — i/'l — (? — для непопадания, и = 1 — V \ — с" — для полного внутреннего отражения. В качестве константы ас выбирается небольшая положитель- положительная величина, например 0,2, подбираемая экспериментально из условия лучшей сходимости метода. Запишем процесс Ньютона— Рафсона применительно к уравнению C.73) sp = sp — Aspy C.74) л и — ас где Asn = Значение и и производной duldsp определяются из результатов расчета луча и его дифференциала до той поверхности, на которой произошло непрохождение, с использованием формул C.71). Дифференциал du, необходимый для вычисления duldsp, нахо- находится дифференцированием формул C.73), C.28)—C.32) и C.42). Итак, если нам удалось рассчитать ход луча до апертурной диафрагмы, мы организуем поиск sp из условия yd = уц при помощи процесса Ньютона—Рафсона C.68), если же мы встре- встретились с непрохождением луча, организуем поиск значения sp, обеспечивающего прохождение в соответствии с процессом C.74). При этом может оказаться, что после устранения непрохождения луча на некоторой поверхности мы встретим непрохождение на другой поверхности, затем опять на первой и таким образом про- процесс не сходится, а зацикливается. В большинстве случаев это означает, что нужного луча не существует. Зацикливание можно проще всего обнаружить по очень большому количеству шагов в методе Ньютона—Рафсона (например, больше 50). В нормаль- нормальных случаях этот процесс сходится не более чем за 10 шагов. Определение приближенных значений передних апертур вне- осевого пучка. Одновременно с определением положения входного зрачка sp можно найти и приближенные значения передних апер- апертур Л, и Ау из условия их соответствия области пучка на апер- апертурной диафрагме. Эта область показана на рис. 3.13. Ее размеры в вертикальном, т. е. меридиональном направлении равны 2АУ а в горизонтальном — 2АХ . Причем очевидно, что: - У\ • C.75) Предположим, что соблюдается линейная связь, т. е. прямая пропорциональность между входными зрачковыми координатами и координатами луча на апертурной диафрагме. В процессе опре- 114
деления главного луча мы рассчитываем вместе с ним меридио- меридиональный дифференциал для получения производной dyd/dsp. Если при этом рассчитывать также и сагиттальный дифферен- дифференциал, который для нахождения sp не нужен, то мы получим не- необходимые данные для нахождения значений апертур. Пусть в результате расчета луча и дифференциалов до диафрагмы мы определили значения дифференциалов линейных координат на ней: dyd = —~ для меридионального дифференциала и dxd = = hX(i — для саггитального. Эти приращения соответствуют при- приращению канонических зрачковых координат на dpy = 1 и фл = = 1, т. е. на единицу начальных значений апертур Ах, А(у, с ко- которыми рассчитывался луч. Эти начальные значения могут быть произвольными, но не равными нулю. Составим пропорции: dxd AXd ' dyd Ayd ' из которых легко получить значения апертур Ах и Ау, в первом приближении обеспечивающие требуемые габариты пучка на апертурной диафрагме: A*=A*dnt> А«-Ау*чк- CJ6) Нахождение значений апертур по этим формулам необходимо производить после выхода из процесса Ньютона—Рафсона поиска главного луча, когда выполнится условие C.72), т. е. когда глав- главный луч будет проходить через нужную точку на диафрагме. После определения значений апертур продолжается расчет хода луча через систему далее до плоскости изображения. При этом меридиональный и сагиттальный дифференциалы также рассчиты- рассчитываются до конца и используются для определения астигматиче- астигматических отрезков z',n, z's по формулам § 16. На схеме 3.6 показан описанный процесс расчета хода глав- главного луча и двух его дифференциалов через систему, объединен- объединенный с поиском положения зрачка и определением приближенных значений апертур. Рассмотренная методика достаточно проста, требует мини- минимального количества вычислений и вполне удовлетворяет задачам, стоящим на начальных этапах анализа аберраций оптических систем. Однако у нее есть и существенные недостатки. Во-первых, полученные значения апертур являются прибли- приближенными и они справедливы только в тех пределах, где коорди- координата луча на апертурной диафрагме пропорциональна его зрач- зрачковой координате, т. е. не для очень больших значений апертур (особенно если диафрама стоит в сходящемся ходе лучей). Во-вторых, при определении апертур не учитываются усло- условия прохождения лучей, поэтому найденные значения могут ока- оказаться нереальными. 115
X №TEP=O Гобнуление канонических зрачковых ' "[координат для главного луча [вычисление значений диазтерен- I циалов канонических коороинат, "  соотвеп 'птвующих,, зрачковому" \дцфореренциалу луча [присвоение начального значения [обобщенному положению зрачка [обнуление номера шага процесса i-Рафсона \ ¦ А 0 Л 0 Ах=Ау ¦>У и, -f Возврат на новый шаг про- \цесса Ньютона-Рафсона 6 Вычисление размеров и координаты центра пучка на апертурной диа- диафрагме по срормулам C.66),C.75) присвоение начальных значений передним апертурам [начало процесса Ньютона-Раазсона Цикл по индексу к от 1, шаг 1 до NS [вычисление входных координат лу- Ivor и дифференциалов луча [вычисление значений производ- \ной по формулам C.11) [начало цикла по поверхностям; 1 NS-коли чество поверхностей Выбор параметров к-и поверхности Расчет луча и диср- среренциалов через к-ю поверхность Схема 3.6. Алгоритм нахождения главного луча 116
да (непрохождение луча на к-й поверхности) нет (луч проходит) да (апертурная диафрагма 1 расположена за этой паверх ностью) Вычисление значе- значений условия прохож- прохождения и и их диффе- дифференциала du Присвоение нового значения осевому расстоянию; fcdft Вычисление значе- значений координат лу- луча у $ и дисрсререи- u,uanoBdxdidyu ' диаоррагме ± Вычисление поправ- поправки Asp к положении) зрачка по срормуле C.7k) Вычисление зна- значений передних апертур Ах,Ау по формулам CJd) Присдоение нового значения осевому расстоянию-. ddd Вычисление поправ ни Asp к положению зрачка по формулам C.68),C.70) конец цикла NSTEP=NSTEP^ - -А наращивание номера шага ¦¦i Вычисление Выход- Выходных результатов для главного пуча NSTEP>50 да (процесс не сходится) уточнение поло- положения зрачка Ц Возврат на но-1 Вый шаг Г -5 /• 1 Сообщение о невозмож- невозможности нахождения глав-/ ного луча / и приближенных значений передних апертур 117
Для решения задачи определения габаритов пучков с учетом всех перечисленных факторов приходится создавать довольно сложный алгоритм, в основе которого лежит многократно повто- повторяющийся процесс нахождения граничного луча, т. е. луча, ле- лежащего на границе области зрачка. Рассмотрим более подробно этот процесс. Нахождение граничного луча. Пусть существует в канониче- канонических зрачковых координатах рх ру контур зрачка ?1Оу показанный на рис. 3.14 и определяемый совокупностью условий, перечислен- перечисленных в начале этого параграфа. Зафиксируем одну из координат, Рис. 3.14. Параметры граничного луча в канонических зрачковых координатах Рис. 3.15. Зависимость условий прохожде- прохождения от входного параметра луча например, рх = 0 или р^ = а. Тогда положение луча на зрачке полностью определяется второй свободной координатой р^ или pY. Обозначим эту свободную координату через р. Для лучей меридионального сечения р = ру, при рх = 0; для лучей са- сагиттального сечения р = рх при ру = а. Нам надо найти гранич- граничное значение параметра р, соответствующее лучу, лежащему на контуре зрачка. Очевидно, что это значение определяется усло- условиями прохождения, а именно: для лучей, соответствующих точкам, лежащим внутри контура зрачка, ни одно из условий прохождения из определенного списка не нарушено, а для лучей, проходящих вне контура зрачка, хотя бы одно из условий на- нарушено. Конкретный список условий определяется той задачей, для которой ищется граничный луч. Левые части условий про- прохождения C.64) изменяются с изменением параметра р и являются функциями от р, т. е. и = f (p). Рассмотрим рис. 3.15, на котором показана типичная зависимость условий прохождения от пара- параметра р. Область Qpy в которой все функции условий из данного списка положительны, определяет размеры зрачка, т. е. габа- габариты пучка по данному параметру. Нам надо найти границы рн и ри этой области. Для лучей сагиттального сечения в силу сим- 118
метрии достаточно одной границы рв. Обращаясь к рис. 3.15, видим, что задача сводится к нахождению наименьшего (для пра- правой границы) или наибольшего (для левой границы) корня из множества корней следующих различных уравнений /*(/>) = О, k=\, ..., N, C.77) где fk (p) — рассмотренные выше функции, показывающие за- зависимости левых частей условий прохождения C.64) от пара- параметра р. Мы можем для любого значения р получить значения всех функций fk (/?), рассчитав луч, имеющий координату на зрачке рх = р или р^ = р. Рассчитав одновременно с основным лучом близкий к нему действительный луч или его дифференциал, можно найти и приращения или дифференциалы функций dfkj соответ- соответствующие приращению dp параметра, т. е. производные dfk/dp. Поставленная задача может решаться такими же способами, как и задача нахождения корня одного уравнения. Наиболее простым является способ половинного деления. Пред- Предположим, что нам известно некоторое значение рг, лежащее внутри области Q.n для которого все функции положительны, и значение /?2, лежащее вне области Qpi т. е. справа от рх при поиске верхней границы и слева — при поиске нижней границы. Ясно, что искомая граница лежит между точками рх и /?2. Выбе- Выберем значение посередине между ними Для полученного значения параметра рассчитаем ход луча и определим для него значения всех левых частей условий про- прохождения C.64), т. е. значения функций fk (p). Если все функции положительны, то точка р лежит в Qp и мы выбираем новую пару точек рг = /?, /?2. Если хотя бы одна функция отрицательна, то точка р лежит вне Qp и мы выбираем пару ри р2 = р. Искомая граница опять лежит между точками р1 и р2, расстояние между которыми уже в два раза меньше, чем в начале поиска. Снова находим точку р посередине между pi и р.г и т. д. На каждом шаге описанного процесса интервал неопределенности, содержа- содержащий искомую границу, уменьшается в два раза. Процесс прекра- прекращается, когда этот интервал станет меньше заданного допуска гр. Алгоритм описанного метода показан на схеме 3.7. Достоинствами метода являются простота и неизбежная схо- сходимость, а недостатками — слишком медленная сходимость, а также необходимость иметь одну из начальных точек, лежащей в области зрачка Qp, что требует самостоятельного поиска (на- (например, рассмотренным ранее методом). Более быструю сходимость поиска границы дает метод Нью- Ньютона- Рафсона. Однако он требует кроме вычисления значений функций fk (p) в каждой точке р также и их производных по пара- 119
[начальные значения параметра; точка р1 находится В области 2Р, точка р2 находится дне этой ¦ области точка р нахо- находится те QD Расчет луча с пара- параметром р и определе- определение (рунщий гранич- граничных условий Все да ч ^клрложитепр^ jHem i Р2 = Р у Р,=Р — точка р находит- находится внутри Яр 11Г*г уточнения Схема 3.7. Алгоритм поиска граничного луча методом поло- половинного деления метру dfjdp. В процессе расчета хода луча, как только мы получили значение какой-либо функции fk и ее производной dfjdp, можно найти приближенное значение корня k-то уравнения по методу Ньютона-Рафсона в соответствии с формулой C.33) pk =. р — Л/?д-, C.78) где л, _ fk(P) Таким образом, рассчитывая ход луча через систему, мы последовательно находим по формуле C.78) корни всех уравнений и выбираем из них наименьший (для верхней границы) или наи- наибольший (для нижней). Легко увидеть, глядя на рис. 3.15, что при 120
йойске верхней границы необходимо искать корни только тех функций, производные которых по параметру отрицательны, а при поиске нижней — положительны. Если бы все функции fk (p) строго линейно зависели от параметра /?, то достаточно было бы одного расчета хода луча, т. е. одного шага процесса, чтобы найти границу. На практике из-за нелинейности этих функций требуется обычно два—четыре шага. Если в начальной точке луч не про- проходит через систему, требуется еще несколько шагов для поиска проходящего луча. Процесс прекращается, когда очередное при- приращение параметра, полученное на данном шаге, будет меньше заданного допуска. При этом, если в этой точке все функции по- положительны, то найдена граница непустой области Qp, если хотя бы одна из функций отрицательна, то найдена граница пустой области, у которой верхняя граница лежит ниже нижней. В пос- последнем случае приходится делать вывод, что не существует луча, выходящего из данной точки предмета и проходящего через си- систему без нарушения условий прохождения C.64). Описанный алгоритм показан на схеме 3.8. Отметим, что кроме сходимости преимуществом этого алгоритма является возмож- возможность начинать поиск границы из любой точки. Последовательность определения габаритов пучков. Последо- Последовательность определения габаритов пучков зависит от этапа про- проектирования, на котором выполняется анализ. Рассмотрим сна- сначала более простую задачу анализа габаритов на заключительных этапах, когда известны световые диаметры всех поверхностей и апертурной диафрагмы. В этом случае для каждого пучка, в том числе и осевого, независимо определяются верхняя, ниж- нижняя и боковая границы с использованием описанного выше алго- алгоритма. Причем в список граничных условий включаются условия попадания, преломления без полного внутреннего отражения и прохождения внутри световых габаритов всех поверхностей и апертурной диафрагмы. На начальных этапах проектирования световые диаметры неизвестны и их необходимо определить, исходя из заданных значений апертуры и геометрического виньетирования всех пуч- пучков. В этом случае процесс определения габаритов разбивается на два этапа. Сначала по заданному значению апертуры опре- определяются габариты осевого пучка, т. е. находится реальный апертурный луч и определяется диаметр апертурной диафрагмы. Затем по заданным значениям коэффициентов геометрического виньетирования по формулам C.63), C.66), C.75) находятся габариты каждого пучка на апертурной диафрагме. После этого для каждой длины волны определяется верхняя и нижняя границы всех пучков при помощи описанного выше алгоритма. В список граничных условий при этом включаются условия попадания, преломления без полного внутреннего отражения, прохождения не за пересечением поверхностей и прохождения внутри габари- габаритов на апертурной диафрагме. Полученные после определения 121
Начало / р;т А возврат на новый шаг Вычисление Вход- Входных координат лу- луча и дифференциа- дифференциалов р-начальное значение параметра; т - признак границы; т = 1 для верхней границы; т--1 для нижней границы ¦Рт-начальное значение левой части наименьшего гранич- граничного условия; Ар-начальное значениемакси- мального или минимального прираш,ения параметра / Начало цикла по ^ поверхностям для \ Komf дз NS Расчет луча и диарореренциалов через К-ю поверхность, определение значений левых частей граничных условий /J на этой поверхности ,их дифференциалов № и производных -F' л X ... Цикл по всем i-м усло- услодля к-и поверх- поверхности поиск наимень- наименьшего условия Схема 3.8. Алгоритм поиска граничного 122
mfl>0 J)a (нерабочее ycnodub) \нет т(Др-Дро)<0 коней, цикла по ус/ювТГям ** конец цикла по поверхностям"^ 0 Q АРо'АР ]уч не nf. юкодит д поиск наимень* шего при т-1 иш наидмьше- 20 при т--1при- - ращения Ityhh да (процесс сошелся) уточиениь параметра — наноВьш- шаг О Тнет jp^sjot (найдена гра- 'ница непустой области) Сообщение о не- невозможности найти границу Конец луча методом Ньютона—Рафсона 123
границ пучков значения виньетирования могут оказаться больше заданных из-за неучтенных условий прохождения, приводящих к дополнительному виньетированию пучков. В заключении первого этапа определяются световые диаметры всех поверхностей, как максимальные значения удвоенных модулей координат всех лучей. Определенное на первом этапе виньетирование может быть нереально большим и его нечем будет осуществить, поэтому после нахождения световых диаметров по желанию конструктора про- производится второй этап (заключительный), на котором заново определяются габариты всех пучков для всех длин волн по полу- полученным на первом этапе световым диаметрам, как если бы они были заданы. § 18, АППРОКСИМАЦИЯ АБЕРРАЦИЙ Расчет хода лучей, рассмотренный в предыдущих параграфах, позволяет получить значения волновых и поперечных аберраций в любой точке зрачка. Для анализа структуры изображения не- необходима, как было показано в гл. 2, полная внутренняя функ- функциональная модель оптической системы, включающая в себя в качестве основной составляющей функцию W (%, сг, р) волновой аберрации от координат на зрачке, предмете и спектральном интервале. В принципе можно каждый раз, когда понадобится значение волновой или поперечной абаррации в какой-либо точке зрачка, поля и спектрального интервала, рассчитывать необхо- необходимый луч и определять требуемые значения. Этот довольно про- простой путь нерационален, так как при анализе изображения, например, требуются значения аберраций в очень большом коли- количестве точек зрачка (до нескольких десятков тысяч) и ясно, что расчет такого количества лучей займет значительное время. С другой стороны, очевидно, что аберрации изменяются доста- достаточно плавно по зрачку, полю и спектральному интервалу, и для полного суждения об аберрациях обычно достаточно иметь их значения в небольшом количестве точек. В § 8 было показано, что волновая аберрация может быть полностью описана при помощи коэффициентов разложения по удачно выбранному базису. Причем требуется сравнительно небольшое количество коэффициентов. Имея значения этих коэффициентов, мы с помощью несложных формул B.69), B.74), B.76)—B.78), B.80) и B.81) можем найти требуемые значения как волновой, так и поперечных аберраций в любой точке зрачка, поля и спектрального интервала. Причем количество действий, требуемое для этого, неизмеримо меньше, чем для расчета хода луча через систему. Задача заключается, следовательно, в нахождении значений этих коэффициентов по результатам расчета хода небольшого ко- количества лучей в некоторых удачно выбранных точках зрачка, поля и спектрального интервала. Эта задача называется аппроксимацией аберраций. Формула, представляющая аберрацию через коэффициенты разложения 124
по базису, называется аппроксимирующей формулой или просто аппроксимацией; сами коэффициенты применительно к данной задаче — коэффициентами аппроксимации; точки зрачка, поля и спектрального интервала, в которых рассчитываются лучи и определяются значения волновой и поперечных аберраций, назы- называются узлами аппроксимации, а сами полученные значения — данными для аппроксимации. В зависимости от того, какие пере- переменные участвуют в аппроксимации, различают зональную моно- монохроматическую аппроксимацию, когда для каждой точки предмета и для каждой длины волны ищутся свои коэффициенты аппрокси- аппроксимации согласно формуле B.68), представляющие волновую абер- аберрацию как функцию от зрачковых координат р; зональную поли- полихроматическую аппроксимацию, когда для каждой точки пред- предмета ищутся коэффициенты аппроксимации по формулам B.77) или B.78), представляющие волновую аберрацию как функцию от зрачковых координат р и спектральной координаты %, и, на- наконец, глобальную полихроматическую аппроксимацию, при ко- которой находятся коэффициенты разложения по формулам B.80), B.81), описывающие функцию волновой аберрации в зависимости от всех координат %, о, р. В основном мы будем рассматривать зональный монохрома- монохроматический случай как более простой для изучения. Заметим, что совершенно нерационально, как это иногда делается, аппроксими- аппроксимировать отдельно и независимо друг от друга составляющие bg' (p) и 8G' (р) поперечных аберраций по полученным из расчета лучей значениям поперечных аберраций, а волновую аберрацию W (р) — по значениям волновой аберрации. Как ясно из гл. 2, функция волновой аберрации является основным описанием аберраций оптических систем, а поперечные аберрации выражаются через ее частные производные, поэтому задачей аппроксимации по лю- любым данным всегда будет нахождение коэффициентов аппрокси- аппроксимации волновой аберрации. По найденным коэффициентам, как уже было сказано, мы легко можем найти при необходимости по- поперечные аберрации. Аппроксимация типа интерполяции. Итак, пусть нам необхо- необходимо найти п коэффициентов разложения волновой аберрации по базису от зрачковых координат (как мы говорили п ^ 21—-28) в общем виде, представляемом формулой B.68). Пусть для нахож- нахождения этих коэффициентов мы хотим использовать значения вол- волновой аберрации в т узлах Wt = W (pf), i = 1, ..., m. Потребуем, чтобы аппроксимация B.68) совпадала с данным Wt во всех узлах. Это возможно, если количество узлов т равно количеству коэф- коэффициентов аппроксимации п. Таким образом, мы приходим к си- системе п линейных уравнений относительно неизвестных коэффи- коэффициентов аппроксимации: itckPk(pi) = Wi> i=*h • .-, п. C.79) 125
Эту систему удобно представить в матричном виде Ас = у, C.80) где с — вектор неизвестных коэффициентов; у — вектор пра- правых частей — данных аппроксимации; А — конструкционная или структурная матрица, составленная из значений всех функций базиса на всех узлах. Структура векторов с, у и матрицы А мо- может быть представлена следующими формулами: Решая систему C.80) стандартными методами линейной алгебры получим неизвестные коэффициенты с с = A-*y. C.82) Аппроксимация по методу наименьших квадратов (МНК). Рассмотренная только что аппроксимация была, по сути дела, интерполяцией, так как коэффициенты аппроксимации опреде- определялись из условий равенства аппроксимации известным значе- значениям во всех узлах. Такой подход может применяться только в тех случаях, когда погрешность данных у, по которым проводится аппроксимация, пренебрежимо мала, т. е. их можно считать точными. Эти данные мы получаем из расчета хода лучей и их погрешность опреде- определяется относительной погрешностью ЭВМ, а именно, длиной мантиссы в представлении чисел, видом расчетных формул и размерами оптической системы. Если длина мантиссы недостаточна, например, в ЕС ЭВМ при работе с одинарной точностью, то погрешность значений волно- волновой аберрации, вызванная округлением, будет настолько велика, что сильно исказит результаты аппроксимации. Полученные по формуле C.82) коэффициенты с будут иметь недопустимо большую погрешность. В таких случаях мы методом интерполяции аппрок- аппроксимируем в большей степени погрешность, чем истинный ход волновой аберрации. Особенно сильно сказывается погрешность аппроксимации на определении по ее результатам не самой вол- волновой аберрации, а ее производных — поперечных аберраций. На рис. 3.16 для примера показаны результаты аппроксимации волновой аберрации в одном сечении канонического зрачка. Сплошная кривая получена по точным значениям аберрации в узлах, крестиками обозначены данные, имеющие среднеквадра- тическую погрешность порядка 0,2 из-за недостаточной точности ЭВМ, пунктиром показана аппроксимация волновой аберрации, полученная интерполяцией по этим данным. Видно, что погреш- погрешность данных особенно сильно сказывается на ошибке в наклоне кривой, т. е. в поперечных аберрациях (штрих-пунктиром изоб- изображена рассмотренная ниже аппроксимация по МНК). 126
В таких случаях можно существенно повысить точность аппрок- аппроксимации без повышения точности вычисления данных при помощи метода наименьших квадратов, используя для уменьшения погрешности избыточную информацию, т. е. имея больше данных, чем определяемых по ним коэффициентов. Система уравнений, из которых определяются неизвестные коэффициенты, является при этом переопределенной и содержит больше уравнений, чем неизвестных коэффициентов (т > п). В соответствии с теорией Рис 3.16. Аппроксимация волновой аберрации МНК, рассмотренной ранее в § 9 гл. 2, вектор искомых коэф- коэффициентов с получается из решения нормальной системы: ATW2Ac = ATW2y C.83) или c-(ATW2A)-1ATW2y. Матрица весовых коэффициентов W в данном случае может быть единичной, так как все данные однородны и имеют одинаковую погрешность. Аппроксимация, полученная по найденным в соответствии с формулой C.83) коэффициентам, уже не совпадает со значениями волновой аберрации в узлах, как это было в случае интерполяции, но наименьшим образом (в среднеквадратическом смысле) уклоняется от них, как показано на рис. 3.16. Матрица (ATW^A^ATW2 в формуле C.83) зависит только от выбора базиса и узлов и может быть, как и матрица А в фор- формуле C.82) для метода интерполяции, рассчитана заранее раз и навсегда. Тогда аппроксимация каждый раз будет сводится к умножению этой матрицы на вектор данных у значений волно- волновой аберрации в узлах. 127
Сравнивая МНК и метод интерполяции, мы видим, что первый для получения избыточности требует большего количества узлов и, следовательно, большего количества рассчитываемых лучей при одном и том же количестве п коэффициентов. Можно по- показать, что необходимая избыточность зависит от погрешности 6W значений волновой аберрации, полученных расчетом лучей, и требуемой погрешности bW волновой аберрации, полученной аппроксимацией по найденным коэффициентам с. Между этими двумя погрешностями существует, как показывает математиче- математическая статистика, приближенное соотношение при т^> п Обычно достаточна двух- или трехкратная избыточность. Однако, если погрешности вычислений велики и если коэффи- коэффициенты аппроксимации используются затем для вычисления значений поперечных аберраций, требуется еще большая избы- избыточность. В силу этих соображений МНК следует применять только в тех случаях, когда значения аппроксимируемой функции имеют погрешность. Если эти значения известны достаточно точно, например, при использовании ЭВМ БЭСМ-6 или ЕС ЭВМ в ре- режиме двойной точности, применение МНК не приносит никаких выгод и нерационально из-за необходимости рассчитывать боль- большое количество лучей. В этом случае необходимо использовать аппроксимацию типа интерполяции, которая гораздо эконо- экономичнее. Заметим, что при аппроксимации данных, полученных не рас- расчетным, а экспериментальным путем, например, при помощи интерферометра в процессе контроля изготовленных оптических систем, погрешности данных всегда имеются и аппроксимация типа интерполяции совершенно не пригодна. В этом случае можно использовать только МНК. Выбор базиса и узлов аппроксимации. Выбор базиса должен преследовать две основные цели: простоту и удобство дальней- дальнейшего использования коэффициентов аппроксимации, с одной стороны, и достижение наименьшей погрешности аппроксимации, с другой. В смысле простоты использования наиболее удобным является степенной базис pl cos/ ср. Вычисление значений волновой абер- аберрации и ее производных по известным коэффициентам с в любой точке р канонического зрачка осуществляется крайне просто при помощи схемы Горнера (более подробно этот процесс освещен в гл. 4). Также просто осуществляется и вычисление элементов конструкционной матрицы \, равных значениям функций базиса в узлах. Однако степенной базис обладает крупным недостатком, вы- выражающимся в большой погрешности коэффициентов с при сравни- 128
тельно малой погрешности данных у. Как показывает теория ли- линейной алгебры, приведенная в работе [321, относительная II ЙС II погрешность коэффициентов ' '' , определенных, например, в соответствии с формулой C.82), связана с относительной погреш- погрешностью .у.' исходных данных аппроксимации следующим соотношением: ^^f J^L, C.84) где cond (A) — так называемая степень обусловленности кон- конструкционной матрицы А, равная отношению максимального и минимального ее сингулярных чисел. Чем больше cond (А), тем хуже матрица А и тем больше бу- будет погрешность коэффициентов с при одной и той же погреш- погрешности данных. Оказывается, что при степенном базисе матрица А получается крайне плохо обусловленной, a cond (А) достигает в практических случаях величин 104—105, т. е. относительная погрешность полученных коэффициентов аппроксимации в 104— 105 раз больше относительной погрешности данных. Если все вычисления в ЭВМ производятся с очень высокой точностью, то это не так уж и страшно, так как в этом случае погрешность дан- данных ничтожно мала. Однако уже при относительных погрешностях ЭВМ порядка 10~6 применение степенного базиса приводит к со- совершенно недопустимым погрешностям аппроксимации. В этом случае более благоприятным является ортогональный базис в виде полиномов Цернике, описанных формулой B.74). Конструкционная матрица получается существенно лучше обус- обусловленной, чем при степенном базисе. Степень обусловленности при прочих равных условиях оказывается близка к 10, т. е. погрешность коэффициентов разложения волновой аберрации по полиномам Цернике получается гораздо меньше (в 103—104 раз), чем по степенным полиномам, при одной и той же погрешности данных. Говорят, что аппроксимация полиномами Цернике го- гораздо более корректна или более устойчива, чем степенными полиномами. Недостатком церниковских полиномов является большая слож- сложность вычисления их значений и значений их производных по сравнению со степенными. Выбор узлов аппроксимации должен преследовать ту же цель, а именно, получения как можно лучшей обусловленности ма- матрицы А. В частности, два узла не должны быть очень близки друг к другу, узлы должны достаточно равномерно охватывать область зрачка и несколько сгущаться к периферии. На рис. 3.17 показано одно из удачных расположений 21-го узла на половине канонического зрачка в соответствии со 129
следующими формулами: 71 / n+i . где k = = 11. о) Для сравнения на том же рисунке показано и явно неудачное, но иногда применяемое расположение того же количества узлов, когда большое количество узлов приходится на центральную область зрачка, где аберра- аберрации изменяются достаточ- достаточно плавно. Обусловлен- Обусловленность матрицы А в этом случае во много раз хуже. Аппроксимация с ис- использованием значений по- поперечных аберраций. Вы- Выше мы говорили, что не- неправильно аппроксимиро- аппроксимировать отдельно функции поперечных аберраций, не принимая во внимание, что они пропорциональны частным производным вол- волновой аберрации по зрач- зрачковым координатам. С дру- Рис. 3.17. Схема расположения узлов на по- половине канонического зрачка при аппрокси- аппроксимации аберраций: удачное (а) и неудач- неудачное (б) расположения гой стороны, не вполне рационально производить аппроксимацию аберраций только с использованием значений волновой аберрации, полученных расчетом хода лучей, так как при расчете луча, как мы видели, одновременно и без дополни- дополнительных затрат получаются значения и волновых и поперечных аберраций. Рационально использовать эту дополнительную информацию для сокращения количества лучей, необходимого для аппрокси- аппроксимации при той же степени базиса. При таком подходе каждый луч дает нам в каждом узле не одно значение аппроксимируемой функции — волновой аберрации, а в общем случае косого луча — три: величину самой аппроксимируемой функции — волновой аберрации и два значения ее частных производ- производных по зрачковым координатам, полученных из поперечных аберраций. Таким образом, для нахождения п коэффициен- коэффициентов аппроксимации нам достаточно уже только /г/3 узлов, т. е. лучей. 130
Для каждого узла мы имеем не одно уравнение, как ранее, а три: п 2 ckPk(9i) = Wi; 2 ckP'xk (Pi) = Wi,; n где L — количество узлов (лучей). В матричной форме эта система уравнений запишется также, как и ранее, т. е. по формуле C.80), но структура конструк- конструкционной матрицы А и вектора правых частей у будет несколько иной, а именно: Pi(Pi)\ fW(p,)\ А = (ац) = [ Р'х, (Pi) |; у = (уд = I Wx Ы , C.85) где / = Е (—¦?—) —номер узла; i = I, ..., т\ /= I, ..., м; / = = I, ..., L; ? — обозначает целую часть. Если количество данных т = 3L равно количеству коэффи- коэффициентов я, то матрица А квадратная. При этом мы получаем ин- интерполяционные коэффициенты аппроксимации по формуле C.82) из условия равенства во всех узлах значений волновой и попереч- поперечных аберраций, полученных расчетом лучей и полученных из аппроксимации B.68). Если т > я, то мы получаем коэффициенты по методу наименьших квадратов в соответствии с формулой C.83). Матрица весов W при этом уже не единичная и для волно- волновой и поперечной аберраций должны быть назначены различные веса. Матрицы А и (ATW2A)~1ATW2 в выражениях C.82) и C.83) могут быть рассчитаны заранее. С использованием такой методики для аппроксимации аберра- аберраций практически любых оптических систем в любой внеосевой точке предмета достаточно девяти лучей. Расположение узлов (лучей) по зрачку выбирается из условия получения наилучшей обусловленности матрицы А. Полихроматическая аппроксимация. Полихроматическая зо- зональная аппроксимация состоит в определении коэффициентов формул B.77) или B.78), представляющих каждый монохромати- монохроматический коэффициент в виде разложения по базису от спектральной координаты %. Определить коэффициенты хющ или cimn можно тем же аппаратом аппроксимации, который рассматривался выше, по известным значениям монохроматических коэффициентов для нужного количества длин волн, т. е. значений координаты %• Сначала для каждого значения % производится монохроматиче- монохроматическая рассмотренная выше аппроксимация, в результате которой определяются монохроматические коэффициенты wtj (%/). Затем 131
эти данные используются для аппроксимации по ним зависимости от х каждого коэффициента и получения полихроматических коэффициентов wLlj. В заключение данного параграфа заметим, что наиболее пра- правильной и перспективной является глобальная полихроматиче- полихроматическая аппроксимация, когда аппроксимируется функция волновой аберрации по всем четырем координатам %, и, t, v в соответствии с формулой B.80). При этом учитывается взаимная зависимость аберраций различных пучков и длин волн. В результате можно получить полную модель аберраций оптической системы, исполь- используя довольно ограниченное количество лучей. К сожалению, су- существенным недостатком такой аппроксимации, препятствующим ее распространению, является большая размерность конструк- конструкционной матрицы, что приводит к большому объему требуемой памяти ЭВМ и большому количеству вычислений. § 19. ОПРЕДЕЛЕНИЕ ВЛИЯНИЯ ИЗМЕНЕНИЯ ПАРАМЕТРОВ НА ХАРАКТЕРИСТИКИ ОПТИЧЕСКОЙ СИСТЕМЫ В предыдущих параграфах настоящей главы мы рассматри- рассматривали математический аппарат и алгоритмы анализа аберраций оптических систем при определенных значениях конструктивных параметров, т. е. одновариантный анализ. В процессе проектирования необходимо также определять влияние небольших изменений параметров на все характеристики системы, т. е. проделать анализ чувствительности или влияния параметров [23]. Это необходимо, во-первых, для последующего направленного изменения параметров с целью лучшей коррек- коррекции аберраций (задача оптимизации), а во-вторых, с целью на- назначения технологических допусков на отклонения параметров от номинальных значений и решения вопроса о допустимости тех или иных отклонений (задача технологического анализа). Сформулируем указанную задачу математически. Объединим все параметры, влияние изменений которых определяется, в век- вектор параметров х, состоящий из п параметров, а все характе- характеристики — в вектор характеристик f, состоящий из т харак- характеристик. Конкретное содержание векторов х и f зависит от той задачи, для которой определяется влияние параметров. Для задачи оптимизации параметры — это кривизны поверхностей, осевые расстояния, коэффициенты несферических поверхностей, показатели преломления и т. п. Для задач технологического ана- анализа добавляются еще децентрировки, т. е. наклоны или попереч- поперечные смещения поверхностей и компонентов. Пусть х0 и f0 — векторы значений параметров и характери- характеристик для номинального состояния оптической системы. Каждая из характеристик Д зависит в общем случае от п параметров, т. е. является функцией от параметров: 132
Объединяя такие записи в вектор функций, зависящий от вектора параметров, получим векторную или матричную форму предыдущего выражения f =f(x). Разложим каждую функцию в ряд Тейлора в окрестности ки х0: точки х0 При небольших изменениях параметров достаточно ограни- ограничиться членами не выше первой степени относительно х-г Тогда предыдущее равенство можно записать в матричной форме сле- следующим образом: f = fo + A(x-Xo), C.86) где А=(-^г\—матрица первых частных производных всех функций по всем параметрам. Значения элементов вектора f0 получаются в результате расчета аберраций и других характеристик оптической системы при номи- номинальных значениях параметров с помощью методов, рассмотрен- рассмотренных ранее в настоящей главе. Назовем этот процесс получения значений всех необходимых характеристик при определенных значениях параметров пробой оптической системы при данных значениях параметров. Так как определенные значения всех параметров составляют вектор параметров, а каждому вектору в пространстве параметров может быть поставлена в соответствие точка, координаты которой равны проекциям этого вектора, мы будем говорить о пробе в данной точке пространства параметров. В дальнейшем эта терминология будет нами широко использо- использоваться в следующих главах. Итак, вектор f0 получается в результате пробы в номинальной точке. Целью настоящего параграфа является рассмотрение мето- методов получения матрицы производных А. Методы численного дифференцирования. Наиболее общими и простыми являются методы численного дифференцирования. Рас- Рассмотрим сначала их на примере функции одной переменной. Как известно, производная /' = —^ функции / (х) в точке х0 определяется следующим образом: dx При численном дифференцировании эта формула заменяется приближенным отношением, в котором 8х конечная величина. Пусть /0 — значение функции в точке xQy полученное пробой в этой 133
точке, а Д = / (х0 + х0 + дх. Тогда — значение, полученное пробой в точке fi-fo C.87) Для получения производной по этой формуле требуется, сле- следовательно, кроме пробы в номинальной точке еще одна проба в точке х0 + 8х. Графически формула C.87) соответствует замене касательной к графику функции / (*) секущей (рис. 3.18). Теоре- Теоретическая погрешность формулы определяется остаточным членом хо-дк х0 хо+6х х Рис 3.18 Графическая иллюстрация метода численного дифференциро- дифференцирования -?-f" (I), т. е. зависит от величины приращения параметра бл; и величины второй производной функции в некоторой точке ? ? € (#о» #о + бх). При уменьшении 6х теоретическая погрешность стремится к нулю, но одновременно быстро возрастает погрешность округления, возникающая из-за того, что при малых 8х в числи- числителе формулы C.87) стоит разность двух очень близких величин. При этом, как следует из теории, относительная погрешность результата становится очень большой. В пределе (при 8х -> 0) эта погрешность стремится к бесконечности. Следовательно, гра- график зависимости погрешности б/' от бл: выглядит так, как показано на рис. 3.19: при больших 6jc преобладает теоретическая погреш- погрешность, а при малых — погрешность округления. Величина мини- минимальной погрешности зависит от величины второй производной функции и погрешности ЭВМ. Для достижения ее требуется подо- 134
брать оптимальное значение 6xopt, что необходимо производить методом проб и представляет собой серьезную проблему. Для уменьшения погрешности можно воспользоваться форму- формулой, построенной по двум пробным точкам по обе стороны от но- номинальной, как показано на рис. 3.18, при этом h - U 2 6* C.88) гдб / i — / (#о — б#). Теоретическая погрешность этой формулы определяется оста- остаточным членом -jr-/'" (?), зависящим от квадрата 8х и от вели- величины третьей производной функции, поэтому приращение 8х может быть гораздо большим, чем при использо- использовании формулы C.87). Погрешность округления за счет этого существенно уменьшается и суммарная погрешность становится значительно меньшей. За- Заметим, что дополнительная пробная точка позволяет получить и вторую производную по формуле 1 dx* C.89) Распространим полученные резуль- результаты на многомерный случай. Фор- Формула вычисления производных по односторонним приобретает вид dft ft (...*/ +8х/...)—/о/ Рис 3.19. Зависимость по- грешности численного диф- дифференцирования от величины приращения параметра dxj а по двусторонним разностям дХ; h(. . .Xj + Sxj. . .)-//(. . .Xj-bxj. 2 6*/ разностям C.90) C.91) Следовательно, для того чтобы получить производные всех функций по одному параметру, т. е. столбец матрицы А по фор- формуле C.90), необходимо проделать одну пробу в точке, где пара- параметр Xj получает приращение бх7-, а остальные остаются при номи- номинальных значениях. При использовании формулы C.91) нужно для этого осуществить две пробы: в точках Xj + 8xj и xj — 6х}-. Для того чтобы получить всю матрицу производных, необходимо кроме пробы в номинальной точке проделать еще п или 2п проб в точках, где каждый параметр последовательно возмущается на бх/ или ±бх/. Эти точки образуют в пространстве фигуры, пока- показанные на рис. 3.20. 135
На схеме 3.9 приведен алгоритм вычисления матрицы А по односторонним разностям. Видно, что вычисление матрицы производных численным мето- методом представляет собой довольно трудоемкий процесс, требующий п или 2п проб, т. е. повторения расчета всех характеристик опти- оптической системы. Формулы C.91) требуют в два раза больше проб, чем формулы C.90), но обеспечивают существенно большую точность производных и, кроме того, позволяют вычислить в соот- соответствии с C.89) несмешанные вторые частные производные, а для получения смешанных производных требуется в общем случае еще (п — 1) л/2 проб. а) дх2 Рис. 3.20 Расположение пробных точек в про- пространстве параметров при дифференцировании с ис- использованием: односторонних (а) и двусторон- двусторонних (б) разностей Заключая данный раздел, заметим, что описанный метод вы- вычисления производных не связан каким-либо образом с конкрет- конкретным содержанием параметров и функций и является внешним по отношению к алгоритму пробы, т. е. формулам расчета лучей, аберраций и других характеристик оптической системы. Это свой- свойство и делает его универсальным. Назовем такой алгоритм вычис- вычисления производных внешней пробой производных. Аналитическое дифференцирование — внутренняя проба про- производных. Как мы видели, основным недостатком метода числен- численного дифференцирования является его высокая трудоемкость, выражающаяся в затрате п или 2п проб. Количество параметров в задачах оптимизации может достигать 100, а в задачах расчета допусков и того больше, поэтому вычисление производных ста- становится одной из самых трудоемких операций при проектировании оптических систем. В силу этих причин разработчики программ ищут пути сокращения количества вычислений при нахождении производных. Одним из таких путей является аналитическое диф- дифференцирование выражений, связывающих характеристики с пара- параметрами. При этом способе производные характеристик по параметрам вычисляются в процессе выполнения пробы по аналитическим 136
Проба X проба 8 исходной точке запоминание исходной точки Цикл по парамет-\у_ __ рам для jom1don/~~ Vколичество параметров j-текущий номер параметра возмущение j-eo параметра на 6xj проба 8 возмущенной точке т-количество функций; -текущий номер функции вычисление i]-гоэлементал матрицы производных А- ^ „ А конец цикла по функциям Восстановление возмуш,ен- ного параметра . \ конец цикла по параметрам Схема 3.9. Алгоритм внешней пробы производных 137
выражениям. Это способствует не только существенному сокра- сокращению количества операций при вычислении производных, но и повышению точности вычисления за счет устранения погрешно- погрешности округления, являющейся одним из основных источников по- погрешности при численном дифференцировании. Естественно, что формулы аналитического дифференцирования самым тесным образом связаны с теми алгоритмами, которые дифференцируются, т. е. с внутренним содержанием пробы. Будем называть поэтому алгоритм вычисления матрицы А, построенный на аналитических формулах, внутренней пробой производных. Как мы уже отмечали, достоинствами внутренней пробы произ- производных, по сравнению с внешней, являются меньшая трудоемкость и меньшая зависимость от точности ЭВМ; недостатками же — отсутствие универсальности, значительная сложность алгоритма и приближенный характер некоторых производных, обусловлен- обусловленный пренебрежением некоторыми факторами с целью упрощения формул. Формулы аналитического дифференцирования в гауссовой области нетрудно получить непосредственным дифференцирова- дифференцированием выражений, приведенных в § 13. Так, дифференцируя ма- матрицы переноса и преломления по конструктивным параметрам, имеем: дЪ @ -1\ 3R ( 0 0\ 3R / О О dd \0 О,/' 5р0 \1—|i 0/' дп \—ро/п' \/п' Остальные производные равны нулю. Подставляя теперь в выражение C.8) вместо матриц D и R их производные по пара- параметрам, найдем производные гауссовой матрицы. Продолжая таким образом, найдем производные всех гауссовых характери- характеристик, причем полученные выражения будут точными. Наибольшее время, как мы видели, тратится на расчет хода действительных лучей и определение их аберраций, поэтому основное внимание мы уделим дифференцированию аберраций действительных лучей. Нахождение производной волновой аберрации действительных лучей по параметрам оптической системы. Так как волновая абер- аберрация, в соответствии с формулой B.35), связана с оптической длиной хода луча между входной и выходной сферами, рассмо- рассмотрим изменение d [Р, Р' ] этой длины при произвольном возмуще- возмущении некоторой поверхности оптической системы. На рис. 3.21 изображен ход некоторого луча через систему от входной сферы Sp до выходной сферы S'p (Р и Р' — точки пере- пересечения луча с этими сферами). Пусть некоторая оптическая поверхность Sk из-за изменения какого-либо ее параметра воз- возмущается так, что ее участок в окрестности точки S падения луча смещается вдоль нормали g на величину dt в новое положение S\k. При этом ход луча после поверхности изменяется, как показано 138
пунктиром на рис. 3.21. Опустим перпендикуляры S±M из новой точки падения на старый преломленный луч и Р'Т на новый луч из точки пересечения старого луча с выходной сферой. В соот- соответствии с принципом Ферма оптическая длина старого Ш, Р' ] и нового [5Ь Т ] лучей между перпендикулярами S±M и Р'Т отличается на величину высшего порядка малости по отношению к смещению луча. При определении первой производной опти- оптической длины эту величину можно не учитывать. Таким образом мы получаем, что оптическая длина нового луча по сравнению Рис. 3.21. Изменение оптической длины луча при воз- возмущении k-Pi поверхности оптической системы со старым увеличилась на nk (SS^ в среде nky уменьшилась на nk+1 (SM) в среде nk+1 и увеличилась на п' (Т Р[) в пространстве изображений, т. е.: d IP, P'] = nk (SSX) - nk+l (SM) + n' (TP[). C.92) Рассмотрим сначала первые два члена формулы C.92), обозна- обозначив их разность через dlk. Из рис. 3.21 видно, что SM = = SSx cos (e' — е), поэтому dlk = nk (SSX) - nk+1 (SM) = (SS±) [nk - nM cos (e' - 8)] - = (SSi) [nk — nk+1 cos er cos e -— nk+1 sin e' sin e]. Ho 8 и г — углы падения и преломления, связанные законом преломления nk sin e = nk+1 sin &', поэтому dtk = (SSi) [nk(\ — sin2 e) — nk+1 cose' cos e] = = (S5X) (nk COS2 8 — nk+1 COS 8 COS 8') = (SS±) COS 8 (nk COS 8 — - nk+1 cose') = dt (nk cos 8 - nk+1 cose') = dtnk+1 (\ic - c')/\\ g ||, где с = |g|| cos 8 и с = [|g| cos e' — величины, определяемые в процессе расчета луча; \л ¦= nk/nk+l. При расчете луча, проходящего через поверхность, мы также получаем величину Г = (с —M^)/||g||2. Кроме того, величину dt смещения поверхности вдоль нормали можно представить как скалярное произведение произвольного вектора смещения ds 139
точки 5 на вектор нормали g, деленный на свою длину, т. е. dt = — (dsTg)/|| g ||- Подставляя dt в выражение для d4, получим про- простую формулу d/ft = -(dsTg)rnjk+1. C-93) Формулой C.93) удобно пользоваться, когда вся поверхность смещается как целое. Если изменяется какой-либо параметр поверхности, например, кривизна или эксцентриситет, то поверх- поверхность деформируется. Рассмотрим этот случай более подробно. Пусть в исходном состоянии точка 5 лежит на поверхности, т. е. ее радиус-вектор s удовлетворяет уравнению B.87) / (s, a) = 0. При изменении какого-то параметра а уравнения B.87) на da поверхность деформируется. Для того чтобы точка снова лежала на поверхности, необходимо ее сместить на вектор ds. Таким обра- образом смещенная точка s + ds удовлетворяет уравнению деформи- деформированной поверхности, т. е. Разложим предыдущее выражение в ряд Тейлора и отбросим члены выше первой степени относительно дифференциалов ds и da: Поскольку f(s, a) = 0 и -g- = v/ = g, a -^ds = gTds то можно записать: gT ds + ж da = ° или dsTg ^ Из общих формул C.93) и C.94) нетрудно получить выражения для производных оптической длины луча по всем параметрам поверхности. В частности, для сферической поверхности имеем один параметр — кривизну. Дифференцируя уравнение B.94) при рх = ру = рг = Ро, получаем: ^ (*2 + ?2 + 22) Hg 4^ + i'a + za)r/l При изменении осевого расстояния и децентрировках поверх- поверхность смещается как целая и можно воспользоваться непосред- непосредственно выражением C.93). При поперечном смещении поверх- И ности на величины dx, dy вектор смещения ds принимает вид! dy I. W Отсюда, а также из формулы B.95) получаем, что: 140
При наклонах поверхности вокруг осей х, у на малые углы dox и doу, как следует из теории бесконечно малых вращений, точка s смещается на вектор /dx\ / — doyz \ ds = [dy 1 = 1 — daxz \dz) \dOyX+ doxyj Отсюда, с учетом выражения B.98) для нормали к поверх- поверхности, получаем, что: дах - Рассмотрим изменение осевого расстояния d от предшеству- предшествующей поверхности до настоящей. При этом вся поверхность сме- (°\ щается на dd в направлении г. Следовательно, ds = I 0 и (d$Tg) = \ddj = ddgz\ dlk - —ddgzTnk+1. С учетом формулы C.40) можно записать, что g-Г = Z' — \iZ, где Z' и Z проекции на ось z ортов q' и q преломленного и пада- падающего луча. Таким образом, dlk = —dd (nk+1Zf — nkZ). Рассматривая это выражение и его вывод, мы видим, что оно соответствует смещению данной поверхности относительно не- неподвижных остальных на расстояние dd. Однако на самом деле при изменении осевого расстояния все последующие поверхности также смещаются на dd, поэтому из последней формулы нужно убрать член, соответствующий изменению на dd расстояния после данной поверхности, т. е. член ddnk+1Z'. Тогда % C.96) И, наконец, при изменении показателя преломления п^ точка падения луча не изменяется и приращение оптической длины луча равно dlk = dnklky где lk — длина луча в среде с показате- показателем nk. Пользуясь этими формулами, легко определить производные волновой аберрации данного луча по всем параметрам непосред- непосредственно в процессе расчета луча через систему с минимальной затратой дополнительных действий на вычисления по этим форму- лам> В соответствии с выражениями B.35), B.36) после вычисле- вычисления этих производных нужно вычесть из них соответствующие производные для главного луча пучка. Вспомним, что мы оставили без рассмотрения член п' (Т'Р[) в формуле C.92). Нетрудно увидеть, что этот член зависит от сме- смещения луча Р'Р[ по выходной поверхности и производной волно- волновой аберрации по координатам на этой поверхности. Если исполь- 141
зовать обобщенные или канонические зрачковые координаты, то легко получить, что п (Т'Р[) - dl ^Х (~у^)Т dp = К (\Wy dp^K (Arfr dp), где dp — вектор смещения луча по зрачку в канонических коорди- координатах; Дт) = \W = -т— — вектор канонических поперечных аберраций. Таким образом, если известна производная смещения луча dp по зрачку по данному параметру, т. е. -—-, то поправку найти нетрудно. Однако эта производная не может быть определена достаточно простыми средствами, поэтому в большинстве случаев для упрощения алгоритма поправкой dl' пренебрегают. Очевидно, что при возмущении какой-либо поверхности смещение луча на зрачке тем больше, чем дальше эта поверхность от апертурной диафрагмы или ее промежуточного изображения — промежуточ- промежуточного зрачка. Следовательно, тем больше и погрешность, которой мы пренебрегаем. Естественно, что указанная погрешность в боль- большей степени проявляется в длинных оптических системах, чем в коротких и особенно при анализе влияния параметров поверх- поверхностей, находящихся вблизи промежуточного изображения, т. е. наиболее удаленных от зрачка. Описанный метод позволяет определить производные только волновых аберраций лучей. Для определения производных попе- поперечных аберраций необходимо воспользоваться аппаратом аппро- аппроксимации, описанным в предыдущем параграфе. Несмотря на указанные недостатки, метод привлекает своей крайней простотой и минимумом дополнительных действий. Он позволяет найти производные аберраций по параметрам (с учетом указанных допущений) практически без серьезных дополнитель- дополнительных вычислений в процессе расчета хода лучей и определения аберраций, т. е. выполнения пробы. Дифференцирование формул расчета лучей. При изменении параметра какой-либо поверхности луч, преломленный на ней, (ds) \dqj' получает приращение — дифференциал I , , который может быть найден дифференцированием формул расчета луча через поверхность, приведенных в § 14. Таким образом, изменение параметра какой-либо поверхности порождает дифференциал луча, ход которого далее через остав- оставшуюся часть системы может быть определен по формулам, рас- рассмотренным в § 15. При этом могут быть найдены дифференциалы координат луча на всех последующих поверхностях и после вы- выхода из системы — дифференциалы поперечных аберраций. Сле- Следовательно, в процессе расчета основного луча через систему мы можем определить производные его координат на последующих 142
поверхностях и производные поперечных аберраций по параме- параметрам всех поверхностей, генерируя для каждого параметра диф- дифференциал луча и расчитывая его ход далее через систему. К мо- моменту выхода луча из системы у нас будет столько дифференци- дифференциалов, сколько параметров, производные по которым мы находим. Оценивая этот метод, можно сказать, что он гораздо более трудоемок, чем предыдущий, требует большего объема памяти для запоминания дифференциалов, порожденных возмущенными поверхностями, и приводит к значительному усложнению про- программы. Так же как и предыдущий, он не учитывает изменение хода лучей до возмущаемой поверхности, но в отличие от него позволяет определить производные координат хода луча и попе- поперечных аберраций, т. е. дает больше информации. По сравнению с методами численного дифференцирования он, конечно, менее трудоемок и меньше зависит от погрешности ЭВМ.
Глава 4 АНАЛИЗ СТРУКТУРЫ ИЗОБРАЖЕНИЯ Зная внутренние характеристики оптической системы, а именно зрачковую функцию для всех точек предмета, мы можем пол- полностью определить все свойства изображения, формируемого системой, вычислив структурные передаточные характеристики, функцию рассеяния точки (ФРТ) или оптическую передаточную функцию (ОПФ). Как было показано в гл. 2, эти характеристики однозначно связаны со зрачковой функцией и, в свою очередь, определяют изображение любого предмета, формируемое данной системой. Таким образом, на стадии проектирования мы можем осуществить сколь угодно полное численное моделирование работы оптической системы. Ранее, при неавтоматизированном проектировании, анализ оптических систем ограничивался изучением аберраций неболь- небольшого количества лучей и для суждения о качестве изображения часто приходилось изготовлять опытный образец. Количество вычислений, необходимое для полного анализа аберраций и, тем более, для последующего анализа изображения, столь велико, что может быть выполнено только при помощи современных мощ- мощных ЭВМ. В настоящей главе мы рассмотрим математический аппарат и алгоритмы, позволяющие по известной зрачковой функции определить передаточные характеристики оптических систем — ФРТ и ОПФ. Следует заметить, что сама оптическая система и ее конструктивные параметры не нужны для решения вопросов, обсуждаемых в этой главе. Зрачковая функция полностью заме- заменяет собой оптическую систему, которую она представляет. При этом совершенно неважно откуда получена зрачковая функция: либо из расчета лучей, рассмотренного в гл. 3, либо эксперимен- экспериментальным путем при исследовании изготовленных оптических систем, либо вообще сконструирована искусственно и не соответ- соответствует никакой конкретной оптической системе. § 20. ОСНОВНЫЕ СООТНОШЕНИЯ Рассмотрим соотношения и расчетные формулы, положенные в основу определения структуры изображения данной зоны пред- предмета. 144
Исходная информация. Такой информацией для расчета яв- является зрачковая функция B.46) / (р) в канонических зрачковых координатах, а также апертуры Ах, Ау, 'х, Ау и длина волны К. В полихроматическом случае необходимо знать основную длину волны XOj полуширину спектрального интервала ДХ, и функцию относительной спектральной эффективности q (%). В большинстве случаев область зрачка Qo в канонических зрачковых координатах считают кругом единичного радиуса, а коэффициент пропускания т — постоянным по зрачку (при этом для анализа изображения его можно принять равным единице). Это позволяет существенно упростить алгоритмы и программы расчета. В тех случаях, когда отступления от сделанных предположений велики, форма зрачка и коэффициент пропускания должны быть описаны. Таким образом, основная информация, определяющая струк- структуру изображения конкретной оптической системы, будет для нас содержаться в функции W (р) волновой аберрации, которая может быть представлена различными способами, рассмотренными ранее и позволяющими при необходимости получить ее значения и зна- значения ее производных — поперечных аберраций в любой точке р зрачка. Канонические и реальные координаты. Все соотношения в про- процессе расчета удобно выражать в канонических координатах, что позволяет унифицировать и сделать более независимыми друг от друга алгоритмы расчета. Как было сказано в гл. 2, в поли- полихроматическом случае канонические координаты, частоты и вол- волновая аберрация выражаются всегда в основных длинах волн *к0 следующим образом: хАх\ 1 (х'А'Л ш DЛ) где х, у, х\ у\ vX9 vy, v'x, v'y — реальные обобщенные координаты и частоты; rj, s, W — монохроматические канонические коорди- координаты, частоты и волновая аберрация, приведенные к своей длине волны К в соответствии с формулами B.43), B.44), B.56); L = % / t , ДА, \ = -у— = ( 1 + -г— % ) — множитель отношения длин волн. После получения результатов в канонических координатах переход к реальным осуществляется простым изменением масштаба в соответствии с выражениями D.1). Заметим, что апертуры Ах, Ау, А'х, Ау и длина волны А,о участвуют только в этой операции изменения масштаба и не нужны программам, выполняющим собственно вычисления ФРТ и ОПФ. 145
Дифракционные ФРТ и ОПФ. В соответствии с уравнением B.61) монохроматическая ФРТ находится через фурье-преобразо- вание зрачковой функции: ^ (%' Л) ~ — 1^1/ (РI Г2 == = ir IJ Jт1/2 (р) ехр ^2я^[W (f>) + ч>гр^dp Т' D>2) где канонические координаты ц и волновая аберрация W являются монохроматическими. Запишем это выражение в развернутом виде с полихроматическими координатами % и волновой аберра- аберрацией Wo: 1 (х> Чо) = 4- J J Ti/2 (р) ехр |2ш [Wo (р) + r,Tp]/L| dp D.3) Эта формула отличается от фурье-преобразования делителем L. Нормирующий делитель а0 чаще всего выбирается из условия, что при отсутствии аберраций, т. е. при W = О, ФРТ для основной длины волны в центре, т. е. h @, 0), равна единице. Отсюда имеем \\ D.4) Qo J Если т = 1, то ао = Qq, где ^° — площадь зрачка в канони- канонических координатах. Полихроматическая ФРТ определяется в соответствии с фор- формулой B.67) в виде +i ЛПоли(Чо)= J <7(ЭС)Л(Х. 4o)dK. D.5) Монохроматическая ОПФ может быть найдена в соответствии с уравнениями B.62) и B.63) как фурье-преобразование монохро- монохроматической ФРТ ^ D.6) или непосредственно как автокорреляция зрачковой функции D (х, So) - ¦?- J J xi/2 (p) Ti/2 (р _ LSo) ехр [2nisV (p, s0)] dp, D.7) 2 О () О (So) где sV (p, s0) = [W (p) — W (p — Ls0) 1/L — функция разностной волновой аберрации; Q (s0) — область интегрирования (см. рис. 2.13). Нормирующие делители выбираются из условия D (%, 0) = 1. Следовательно, (p)P а Jj^ =-J-. D.8) 146
Полихроматическая ОПФ может быть получена из формулы B.67) как средневзвешенная монохроматических ОПФ с учетом делителя L2 — (VA,0J (so) - j q (X) -JT D (X. so) ^X D-9) или прямо как фурье-преобразование полихроматической ФРТ D.5) D.10) Геометрические ФРТ и ОПФ. Для геометрически ограниченных систем (см. § 7 гл. 2) нецелесообразно пользоваться только что приведенными выражениями. Часто пренебрежение дифракцией, которое для таких систем вполне правомочно, позволяет упро- упростить алгоритм и уменьшить количество действий. При этом геометрическая ФРТ определяется формулами B.54), а геометри- геометрическая ОПФ — формулами B.55). Причем в этих формулах, как легко заметить, можно г], Дт], s и W без каких-либо изменений вы- выражать в основных длинах волн. Полихроматические геометрические ФРТ и ОПФ находятся по формулам B.67). Работа с комплексными величинами. В большинстве рассмо- рассмотренных выше формул фигурируют интегралы от комплексных величин общего вида / = j со (х) ехр [2ш\|) (х)] dx. D.11) При практических вычислениях на ЭВМ и составлении про- программ можно пользоваться переменными комплексного вида в тех алгоритмических языках, которые допускают такие переменные (например, ФОРТРАНе IV), но это не всегда возможно и удобно. Проще представить интегралы в виде суммы действительной и мнимой частей I^C + iS, D.12) где ia = —I; С = jco(x)cos[2tti|)(x)]<ix; S= jco(x) sin [2m|5 (x)] dx. Таким образом, практически вычисление сводится к нахожде- нахождению косинусного С и синусного S интегралов. Если интегрирование производится для определения ФРТ, то в соответствии с уравне- уравнениями D.2) и D.3), нам нужно найти квадрат модуля интеграла | / |2 по формуле |/|2 = C2 + S2. D.13) Если же вычисления производятся для получения ОПФ, то надо найти модуль |/| — модуляционную передаточную функцию 147
где signE) = (МПФ) и аргумент arg [I] — фазовую передаточную функцию (ФПФ) по формулам: | / | = V С2 + 5а ; arg [/] = arccos (-щ^ sign (S), D.14) 1 при S^>0 -1 при S<0* В формуле для аргумента мы воспользовались функцией arccos, так как область ее значений, а именно @, я), как раз соответствует половине области зна- значений arg [/], т. е. (—я, я). Учет свойств симметрии в цен- центрированных системах. В таких си- системах все свойства симметричны относительно меридиональной пло- плоскости, содержащей координату у, поэтому в выражениях D.2), D.3) и других интегрирование можно производить не по всему зрач- зрачку QQ, а только по его правой по- половине Q1 (рис. 4.1) и затем резуль- Рис. 4 1. Области итегрирова- тат умножить на два. В силу этих ния по каноническому зрачку же свойств ОПФ D (s) для осевой точки и для внеосевых точек при сагиттальном направлении частоты (при sy = 0) есть действи- действительная функция, т. е. синусный интеграл S во всех выраже- выражениях равен нулю и его вычислять не нужно, как и аргу- аргумент arg [/]. Вместо формул D.14) можно просто принять D = С. § 21. ВЫЧИСЛЕНИЕ ЗНАЧЕНИЙ АБЕРРАЦИЙ В УЗЛАХ При численной реализации формул данной главы требуется вычисление аберраций во множестве точек зрачка (узлах), причем количество узлов может быть очень велико — до 105. Способ по- получения этих значений зависит от представления аберраций. Одним из простых, но нерациональных способов является не- непосредственный расчет луча через систему каждый раз, когда требуется получить значение аберраций. Можно сказать, что аберрации в этом способе представлены алгоритмом расчета луча, рассмотренным в гл. 3. Естественно, что при этом затрачивается большое количество излишних действий. Кроме того, программы расчета структуры изображения оказываются связанными с про- программами расчета луча. Невозможно, например, при помощи этих программ определить качество изображения по эксперименталь- экспериментальным данным об аберрациях. Ввиду простоты этот способ можно рекомендовать для одноразовых задач анализа изображения в системах с небольшим количеством поверхностей, когда пере- перечисленные отрицательные факторы не имеют решающего значе- 148
ния. Несколько более экономичный способ основан на расчете лучей в достаточно редкой сети узлов, а затем, каждый раз, когда требуется значение аберраций в какой-либо точке, несовпадающей с узлом, — применении интерполяции по значениям аберраций в ближайших узлах. Обычно используется наиболее простая линейная интерполяция, а иногда — квадратичная. Количество лучей, требуемое при таком способе, меньше, чем в предыдущем, но все же достаточно велико, а остальные недостатки те же, что и у первого способа. Более рациональные и экономичные методы основаны на аппа- аппарате аппроксимации, описанном в § 18 гл. 3. Исходной информа- информацией при этом являются коэффициенты аппроксимации, получен- полученные либо по результатам расчета лучей, либо по эксперименталь- экспериментальным данным, либо синтезированные искусственно. Применение этого способа позволяет сделать программы анализа структуры изображения независимыми от программ расчета лучей, но тре- требует умения вычислять по коэффициентам аппроксимации зна- значений волновых и поперечных аберраций в любой точке зрачка. Исходная информация и соотношения. Пусть в качестве исход- исходной информации мы имеем коэффициенты wUj или сщ зонального полихроматического разложения волновой аберрации по степен- степенному или ортогональному базисам в соответствии с формулами B.77) или B.78). Эти коэффициенты полностью описывают абер- аберрации системы в данной точке предмета. Требуется вычислить при любых значениях х и Р волновую аберрацию W и, при необходи- необходимости, также поперечные аберрации. В выражениях B.77) и B.78) трехиндексные коэффициенты шщ и сщ могут рассматриваться как элементы некоторых трехмерных матриц, а при программиро- программировании — как элементы трехмерных массивов. Однако видно, что эти массивы будут заполнены чуть более, чем наполовину. Удобнее хранить коэффициенты в виде двумерных массивов (матриц), каждый столбец которых содержит коэффициенты определенной степени по %, а по строкам коэффициенты расположены, например, в порядке возрастания степени базиса. Ограничимся пятой степенью базиса по зрачку и четвертой по %. Тогда массив коэффициентов будет содержать 21 строку и пять столбцов. Монохроматические коэффициенты предста- представляются одним столбцом, т. е. одномерным массивов. Естественно, что рассмотренный способ является только одним из возможных. Приведем формулы B.77) и B.78) к виду, удобному для вы- вычислений, обозначив t = р2, v = р cos ср = р^ и hj = р' cos /ср. Тогда разложение по степенному базису примет вид где L- N-f a/ = 2 ЬР\ bt = - степень базиса N г L = 2 no x -N-f lo Wnj'% I L \i=i ' = Ца/Ы9 D.15) степень базиса по зрачку; 149
Коэффициенты wuj индексированы в соответствии со степенью переменных %, t и v. Если wln}- — коэффициенты индексированные п0 Ъ Р» cos Ф> а w (^» т) — элементы двумерного массива, содер- содержащего коэффициенты wlih то нетрудно получить следующие соотношения между их индексами: _¦ D16) Разложение по ортогональным полиномам запишем в следу- следующем виде: W(%, Р) = 2 { 2 Г 2 *и/Л (x)l Q/ (О) Л/ = 2 аЛ. D-17) /=о I t=o L 1=0 J J /=о N—f L где af = 2 bijQf.it); bif= Ц Ql7P/(X). Формулы D.15) позволяют легко получить значения волновой аберрации W и ее производных Wi, W'v по переменным t, v, поль- пользуясь схемой Горнера. После этого производные W'xn W'y по пере- переменным рд; и р^, необходимые для вычисления поперечных абер- аберраций, определяются следующими выражениями: так как t'Px = 2px; fQy^2py; v'Px = 0\ v'Py=l. Для нахождения производных W'x и W'y через ортогональные полиномы с применением формулы D.17) необходимо вычислить производные Щ9 W'h и W'hr Дифференцируя выражение D.17), получим: ^ D.19) (t) dhf dhi 1 t /V-1 sin (/ i) ф; = /p'-1 x SdQ1: (t) dhf b<>- -^r1 - -it = -/V-1 sin (/ - X COS(/— 1 П (/ ) По полученным значениям затем легко находятся производ- производные по рх и р^: W'x = W't2px + W'hx; W'y=*Wt2py + W'hy. D.20) При практическом использовании приведенных формул нам необходимо уметь вычислять значения степенных и ортогональных полиномов и их производных для случая нескольких переменных. 150
Организация вычислений для степенного базиса. В § 14 гл. 3 мы уже имели дело со схемой Горнера, позволяющей наиболее простым и компактным способом получить значения полинома и его производных в случае одной переменной. В соответствии с формулой D.15) нам необходимо вычислить значение полинома от трех переменных х, t и vy также его производных по перемен- переменным t и v. Мы видим, что коэффициенты полинома от v есть в свою очередь полиномы от /, а коэффициенты последних есть полиномы от %. Таким образом, алгоритм вычислений должен содержать три цикла по схеме Горнера: во внутреннем цикле вычисляются зна- значения полиномов Ьц от х> в среднем цикле — значения полино- полиномов а} от t и их производных а) по t, а во внешнем цикле — зна- значения полинома W от v, его производной W'v no v и полинома W't производной по t с коэффициентами а). Схема 4.1 иллюстрирует алгоритм вычислений. Приведенным алгоритмом удобно пользоваться для вычисления значений абер- аберраций в произвольных, никак не связанных друг с другом, узлах % и р. Если вычисления производятся в узлах прямоугольной координатной сети по %, / и ф, т. е. когда %, t и ф меняются по закону Х = Хь t = ti\ Ф = Ф/. где k= 1, . . ., /С; /= 1, . . ., L; алгоритм не является рациональным, так как, меняя, например, только ф, мы вынуждены все равно производить вычисления Ьц и ah хотя х и t не изменяются. Устранить эти излишние вычисле- вычисления можно, если ввести промежуточные массивы для запоминания коэффициентов Ьц и ау, вычисленных при определенных значе- значениях % и t. Как видно из схемы 4.2, для каждого значения % = %k мы сначала по схеме Горнера вычисляем все монохроматические коэф- коэффициенты Ьц и запоминаем их в массиве В в таком же порядке, как в столбце матрицы w (k, т). Затем для всех значений t = tt также по схеме Горнера вычисляем коэффициенты ау- и их произ- производные а}> запоминая их каждый раз в массивах А и Л1, и, на- наконец, пользуясь этими коэффициентами, для всех значений ф вычисляем волновую аберрацию W, ее производные W'ty W'v и W'Xy W'y по формулам D.18). Вычисление значений ортогональных полиномов и их произ- производных. Для работы с ортогональным базисом нам необходимо уметь вычислять значения ортогональных полиномов и их произ- производных при любом значении аргумента. Простая и компактная схема Горнера, которую мы использовали при вычислении значе- значений степенных полиномов, здесь уже не пригодна. Рациональнее всего для ортогональных полиномов пользоваться так называ- называемым трехчленным рекуррентным соотношением Форсайта [2 ], связывающим три последовательных полинома. Пусть Р (х) 151
Г' f Начало j I WB1,5);p,(p; t=p2;V=pC0S(p; NN"(N+1)(N+2)/2+f; Цикл по индексу J от J, шаг 1 до /V/ М t /V/V-J ;af= = Л/ 0; Цикл по индексу I от f, шаг 1 до J Цикл по индексуЬ от 1 .шаг 1 до 5 ввод исходных данных: р,(р-полярные канони- канонические координаты на зрачке; X - каноничес- каноническая спектральная коор- координата; W B1,5)-мас- B1,5)-массив, содержащий зональ- зональные полихроматические коэффициенты волновой аберрации; Н- степень разложения по зрачку присвоение начальных значений полиномов в схеме Гопнера по v \начало цикла схемы J Горнера по v присвоение начальных зна- значений индексов К, М, а также начальных значений поли- полиномов в схеме Горнерапо t начало цикла схемы »J Горнера no t ^присвоение начального зна- . J чения полинома в схеме Гор- [нера по % J начало цикла схемы Гопнера по % Схема 4.1. Алгоритм вычисления значений волновой аберрации и ее произ 152
Некоторые полиномы от переменной х, ортогональные на отрезке Q с весом q (x). Тогда справедливо следующее соотношение, вы- выражающее последующий полином через два предыдущих: - aft+1) Pk (x) - _г (х)]. D.21) Коэффициенты ak, $k, yk соотношения D.21) зависят только от интервала ортогональности Q> весовой функции q (x) и норми- нормировки. Умножим правую и левую части соотношения D.21) сна- сначала на полином Рк (х)у затем на Р&_х (х) и на Рк+1 (х). Далее b=b7C+W(K,6-L) схема Горнера по тС г а'= а = К= а ~Ь + at + к-м а- Ъ; конец цикла по L схема Горн эра not конец цикла по X — Наш* Горн ера по v —\конец цикла по J Вычисление производных волновой аберрации по ка- каноническим зрачковым координатам рхи рув соответствии с тормиш (W8) водных с использованием коэффициентов разложения по степенному базису 153
HN1--NN+I, f < Цикл по om1,uit /цикл по индексу 1 Г /ими по индексу L\ ~\от1,шаг1до5 / Ъ-ЪХЩН) Y Н2 Y ъщ-ъ /ц /Цикл по индексу С\ /цикл по индексу J х. х K-NNNiM-N _ /Цикл по индексу Г\ I X 7 / b(K) *D Y I /цикл по индексу l\ x^m 1, шаг 1 doly/ py=pcos(p; /цикл по индексу j\ \pmftuia2idoN1/ I ^Т uUL Схема 4.2. Алгоритм вычисления волновых и поперечных аберраций в узлах регулярной сети
проинтегрируем обе части с весом q (х) на интервале Q. В соответ- соответствии с условием ортогональности, которое при наличии веса q (x) выражается формулой (x)Pk(x)Pl(x)dx = 6kl(ok9 D.22) где bkl — символ Кронекера, со^, — нормы полиномов, в резуль- результате получим следующие равенства: О == J xq (x) P\ (x) dx — ак+хщ\ Q О = J xq (x) Pk (x) Pk_t (x) dx — $k+1(ok_i, Щ+i = Ук+г j xq (x) Pk+1 (x) Pk (x) dx. Из предыдущих равенств будем иметь \xq(x)P\{x)dx Коэффициенты yk зависят от нормировки полиномов. В ча- частности для полиномов Цернике нормировка выбирается та- таким образом, что значение всех полиномов на правом краю интер- интервала Q = @,1) равно единице, т. е. Р A) = 1. Отсюда получаем a*+i-P*+i)- D.24) Интегралы в формуле D.23) вычисляются аналитически или одним из численных методов, описанных в работах [2, 11, 15]. Первый полином Ро (х) вычисляется тривиально; обычно он равен единице [Ро (х) = 1]. Второй полином Рг (х) вычисляется по соотношению D.21), в котором принимается рг = 0. Вычисление коэффициентов ось р^, yk, как мы видим, представляет собой до- довольно трудоемкий процесс. Однако, будучи вычисленными один раз навсегда, они позволяют затем пользоваться соотношением D.21) без дополнительных вычислений каждый раз, когда тре- требуется получить значение полиномов данного типа. В частности, для полиномов по спектральной координате %, ортогональных на интервале (—1,1) с весовой функцией q (%) = 1, коэффициенты аь рь yk легко вычисляются аналитически и равны: Для * = 0, 1, 2. . . D.25) В этом случае мы получаем так называемые полиномы Ле- жандра. Для полиномов Цернике коэффициенты аь рь yk также могут быть вычислены аналитически. В соответствии с формулой B.71), 155
для определения полиномов Цернике нам надо вычислить поли- полиномы Q™ (t), ортогональные на интервале Q = @,1) с весовой функцией q (t) = tmy для различных т = 0, 1, 2, ... Из выраже- выражений B.72) и D.23) получаем: 1 \lm+l[Q^ (t)]4t _ 0 . от __ 2^ + m + 1 /yioc\ Коэффициенты уГ находятся из формулы D.24). Дифференцируя выражение D.21), получим рекуррентное соот- соотношение для вычисления производной Р' (х) ортогональных полиномов P'k+i (х) = уы l(x - аЛ+1) Р'и (х) - рЛ+1Ял-1 (*) + П (х)]. D.27) Формула D.27) должна применяться совместно с формулой D.21) для последовательного вычисления значений всех полиномов и их производных в данной точке х. Пользуясь рекуррентными соотношениями D.21) и D.27), заменяющими схему Горнера в случае ортогональных полиномов, легко произвести вычисления значений волновых и поперечных аберраций по формулам D.17), D.19), D.20) для ортогонального базиса. Алгоритм будет получаться различным в зависимости от того, нужно ли вычислять аберрации для произвольных узлов %, р или же в узлах координатной сети % = %^; t = tt\ cp = ф/. § 22. МЕТОДЫ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ Основная проблема при анализе структуры изображения со- состоит в вычислении определенных интегралов от двумерных ком- комплексных функций общего вида D.11), где в качестве я|) (х) может выступать, например, волновая аберрация при вычислении ди- дифракционной ФРТ по формулам D.2) и D.3), разностная волновая аберрация при вычислении ОПФ по формуле D.7) и т. д. Для опре- определения полихроматических ФРТ и ОПФ в соответствии с выра- выражениями D.5) и D.9) необходимо вычислять определенные ин- интегралы от одномерных функций. В реальных оптических системах, когда функция аберраций достаточно сложна, эти интегралы не могут быть найдены анали- аналитически и определяются численными методами, составляющими основу анализа структуры изображения. Особенности подынтегральных функций. Характерной чертой подынтегральных функций в интегралах D.11), D.2), D.3), D.7) и других является быстрое колебательное изменение их значений в интервале интегрирования. Такие подынтегральные функции называют быстроосциллирующими. Как следует из формулы 156
D.12), комплексный интеграл D.11) представляется в виде двух интегралов — косинусного и синусного. Следовательно, подын- подынтегральные функции, с точностью до множителя о (х), есть функ- функции косинуса или синуса, аргументы которых представляют собой функции я|) (х) от переменной интегрирования х. Даже при весьма плавном изменении аргумента о|) (я) подынтегральные функции cos [if> (x) ] или sin [if> (x) ] меняются очень быстро, как показано на рис. 4.2. Такой характер изменения подынтегральных функ- функций приводит к высокой трудоемкости методов численного интег- монотонности монотонности Рис. 4.2. Пример быстроосциллирующей подынте- подынтегральной функции sin [2яф (х) ] рирования, так как требует достаточного количества узлов на каждую полуосцилляцию, т. е. интервал между двумя нулями функции. Общие методы численного интегрирования. При использова- использовании численных методов, приведенных, например, в работах [2, 11, 15], определенный интеграл / = J f (x) dx от некоторой функ- функции / (х) по области Q приближенно заменяется суммой вида D.28) N 2j где fk = f (хк) — значения подынтегральной функции в узлах интегрирования х/г; ck —веса узлов интегрирования. Веса и узлы определяются методом интегрирования, а также областью й ине зависят от подынтегральной функции / (х). Сле- Следовательно, для данной области и метода они могут быть опре- определены раз и навсегда. Тогда вычисление интеграла сводится к на- нахождению значений fk подынтегральной функции в узлах и вы- вычислению суммы D.28). Точность формулы численного интегрирования определяется способом выбора узлов и весов, т. е. методом интегрирования, 157
а для конкретного метода — количеством узлов N. Чем больше узлов, тем меньше теоретическая погрешность (погрешность ограничения), а в пределе при N -> оо мы получаем теоретическое значение интеграла. При практическом применении формулы D.28) добавляется погрешность округления, которая при увели- увеличении количества узлов, как правило, возрастает. Суммарная погрешность при увеличении количества узлов сначала умень- уменьшается за счет уменьшения теоретической составляющей, а затем увеличивается из-за погреш- погрешности округления (сравните с погрешностью численного дифференцирования, рассмо- рассмотренной в гл. 3). Минимально достижимая погрешность за- зависит от выбранного метода, точности ЭВМ и поведения подынтегральной функции. На рис. 4.3 показан пример, из которого видно, что неудачный и недостаточно точный метод не только требует большого количества вычислений для 16 18 20 22 24N/100 ДОСТИЖеНИЯ НуЖНОЙ ТОЧНОСТИ, но и вообще может не дать ее ни при каком количестве узлов. Приступая к рассмотрению формул численного интегриро- интегрирования, заметим, что для одно- одномерного случая эти формулы называются квадратурами, а для двумерного — кубатурами. Рассмотрим сначала случай одномерных функций. Наиболее употребительными квадратурами являются формулы прямоуголь- прямоугольников, Симпсона и Гаусса. В методе прямоугольников интервал Q = (а, Ь) разбивается равномерно на N подынтервалов с шагом h = 6~a; узлы вы- выбираются в центрах этих подынтервалов; веса все одинаковы и равны hy т. е.: Рис. 4.3. Зависимость суммарной по- зх грешности б вычисления I sin х dx о методами Симпсона (кривая 1) и пря- прямоугольников (кривая 2) от количества узлов интегрирования N Ъ — а N = 1, N. D.29) Теоретическая погрешность формулы определяется остаточным членом: f"(t);a<t<b, D.30) где f" (I) — значение второй производной подынтегральной функ- функции в некоторой точке g внутри интервала. 158
Заметим, что в этом методе длины подынтервалов h могут быть и не одинаковы, тогда h = hk. В методе Симпсона узлы выбираются на краях подынтервалов, следовательно, количество подынтервалов равно N— 1. Узлы и веса определяются формулами: хк = а + h (к — 1); сг = cN = -T; c2k = -о-Л; c2k+1 = -^ /г, D.31) гАе ^ = 4^7-- В методе Симпсона количество узлов N должно быть нечетным. Остаточный член формулы Симпсона равен: ; a<l<b. D.32) В методе Гаусса весь интервал Q = (а, й) разбивается на т ^ 1 подынтервалов длиной /г (длины /г могут быть и не одинаковы). В каждом подынтервале выбирается п узлов, причем узлы и веса определяются из условия, чтобы квадратура была бы на этом подынтервале точной для полиномов наивысшей возможной сте- степени. Формулу Гаусса благодаря этому называют квадратурой наивысшей алгебраической степени точности. Узлы квадратуры Гаусса располагаются в корнях полинома Лежандра степени /г. Если Рп (z) полином Лежандра, то zk — корни полинома на от- отрезке (—1,1), т. е. табличные узлы квадратуры Гаусса; ck = 2 = "п \9гв' / м2 — табличные веса квадратуры Гаусса. Узлы xki для конкретного интервала (а, Ь), разбитого на т подынтерва- подынтервалов длиной Л, находятся по формуле **« = а +-2"(** + 2/ — 1), *= 1, 2, . . ., /г; i = 1, 2, . . ., m. D.33) Существуют таблицы узлов и весов квадратуры Гаусса для /г от 1 до 512. Однако на практике редко используют больше, чем 8—16 узлов. Остаточный член формулы Гаусса на каждом подын- подынтервале h равен Rr = Mnh^fW(l), D.34) где М (п1) Д УК1«-~ Bя + 1)[Bя)!]3 # В частности, Мг « 4-1(Г2, М, ^ 2-ЮЛ Ms & 5-ЮЛ М4 « ^б-Ю0, М5^4.10-13, M6^2.106, М7^2.10-23 и т. д. Сравнивая выражения D.30), D.32) и D.34) для теоретической погрешности, можно судить, что метод Гаусса является самым точным, затем идет метод Симпсона, а затем метод прямоуголь- прямоугольников. Недостатком квадратур Гаусса является неравномерное расположение узлов в интервале интегрирования, что часто бы- бывает неудобно. 159
Метод Прямо- уголь- угольников Симп- сона Гаусса Количество узлов 6 80 7 9 11 2 3 4 5 6 Погрешность теорети- теоретическая 3,6.10-2 2-10-4 1,3.10-3 4-10-4 1,7-10-4 6.10 1,5-Ю-з 1,7.10-6 1,Ы0-7 5,8-100 реальная 2,3-10-2 1,4-10-4 8,6-10-4 2,6-10-4 МО 6,4-Ю-2 1,4-10-3 1,7-10-5 МО 5,2-Ю-10 Выбор шага интегрирования и количества узлов. Рассмотрим, какое количество узлов требуется при использовании различных методов для получения необходимой точности при интегрирова- интегрировании быстроосциллирующих функций вида cos Ь|) (х) ] или sin [i|)(jc)]. Оценим сначала количество узлов, требующееся на каждую полуосцилляцию. Заметим, что полуосцилляция близка к отрезку синусоиды на Таблица 4Л интервале @, л). л Оценим количество Значения погрешности вычисления islnxdx узлов, необходимое ДЛЯ 0J вычисления интеграла я \ sin xdx, точное значение о которого равно двум. Рас- Рассмотрим сначала теорети- теоретические оценки, использо- использование которых упрощается благодаря тому, что мак- максимальное значение про- производной любого поряд- порядка от sin х равно единице. Из соотношений D.30), D.32), D.34) имеем (при b — а = я, т = 1): и29 • 1,7 (N-iy ' D.35) Практические результаты, приведенные в табл. 4.1, хорошо согласуются с этими оценками. Из приведенных данных можно сделать вывод, что для получе- получения относительной погрешности, например 10~4, наименьшее коли- количество узлов п0 на каждой полуосцилляции равно 80 в методе прямоугольников, 11 — в методе Симпсона и 4 — в методе Гаусса. Преимущество последнего метода при интегрировании быстро- осциллирующих функций здесь совершенно очевидно. Общее количество узлов N при интегрировании одномерных функций равно п0, умноженному на количество полуосцилляций. Как определить это количество? Естественно, что подынтегральная функция / (х) = cos [2яг|) (х) ] или / (а:) = sin [2jiif> (x) ] делает одну полуосцилляцию при изменении аргумента г|) (х) на 0,5. Следовательно, при монотонной функции г|) (#) количество полу- полуосцилляций т = 2Ая|), где Агр = i|)max — i|)mln — размах функ- функции г[) (х). При немонотонной функции т равно удвоенной сумме 160
размахов по всем интервалам монотонности (см. рис. 4.2), т. е, /я = 2 S Д%. D-36) Формулой D.36) пользоваться неудобно, если функция г|) (х) существенно нелинейна и полуосцилляции подынтегральной функ- функции имеют различную ширину. В этом случае, для того чтобы на каждую из них приходилось не менее п0 узлов, рационально вы- выбирать переменный шаг интегрирования в зависимости от ширины полуосцилляции. Можно, например, разбить интервал интегриро- интегрирования (Ь — а) на пх больших подынтервалов Я = таких, что ty (х) в каждом из них изменяется достаточно плавно и количе- количество узлов в подынтервале определять количеством mk приходя- приходящихся на него полуосцилляций Nk = nomk. Значение mk можно оценить по величине производной i|>i функции ф^, если прибли- приближенно считать, что в каждом из подынтервалов аргумент линеен Общее количество узлоз находится по формуле J^ ^ ^21№\, D.37) k где ^k — производные во всех подынтервалах. Такой метод, однако, существенно усложняет алгоритм интег- интегрирования, поэтому часто берут количество узлов с запасом, чтобы п0 узлов приходилось бы на самую узкую полуосцилляцию, ши- ширина которой может быть оценена как ^ | тщах I где | фтах | — максимальное по абсолютной величине значение производной г|) (х). Следовательно, общее количество узлов равно N - по-=~ = 2(Ь~-а) п01 i|w |. D.39) В этом случае при использовании методов прямоугольников и Симпсона весь интервал разбивают равномерно на N или Af + 1 подынтервалов в соответствии с выражениями D.29) и D.31). При использовании метода Гаусса сначала выбирают количество узлов п в подынтервале Л, а затем находят количество щ подын- / А/ \ тервалов (п1 = -^- ), после чего пользуются формулой D.33). Обычно п = 8-Г-16. Заметим, что формулы D.37) и D.39) отличаются тем, что в последнюю входит максимальная величина производной | ty'max |, а в первую вместо нее входит — 2|Фл| — средняя величина по всем подынтервалам, поэтому формула D.39) может дать суще- 161
ственно завышенное количество узлов по сравнению с формулой D.37) при сильно нелинейных функциях г|э (х). Оценим для примера количество узлов при вычислении дифрак- дифракционной ФРТ по формуле D.2). В этом случае аргумент г|) (х) комплексной подынтегральной функции есть ф (р) = W (р) + + т)тр и его максимальная производная по переменной интегри- интегрирования р равна | фта* | = | W'9 + Г] |тах ^ | W'9 |тах + | Т) |гаах. Но |Wp|max есть максимальная поперечная аберрация в кано- канонических координатах, a jr)maxj — максимальный размер ФРТ» для которого производится расчет. Этот размер выбирается таким, чтобы в нем заключалась основная энергия ФРТ. Если бы не было дифракции, то | г] |тах = | \^р |тах» Дифракционные эффекты при- приводят к размытию энергии за пределы геометрического пятна, но, как показывает опыт, не далее чем на 1,5—2,5 канонических единицы (оставшаяся часть плоскости изображения содержит менее 5 % всей энергии пятна). Примем для определенности h |max ^ | ^р Imax + 1>5. Тогда |г()тах | ^ 2| Wp|max + 1,5 и количество узлов по одной переменной, в соответствии с формулой D.39), есть N < 2 (Ь - а) п0 B1 №р|тах + 1,5) = п0 (8 | W'9 |тах + 6) > 6п0, или N ^ по8 | Т) |тах D.40) поскольку интервал интегрирования (Ь — а) есть размер зрачка в канонических координатах и равен двум. По двум переменным общее количество узлов будет порядка Af2 ^ 36nl (для целого зрачка) или порядка -^-N2^ I8nl (для половины зрачка с учетом свойств симметрии). Как было показано в гл. 2, пользоваться дифракционной формулой для ФРТ имеет смысл, если геометри- геометрический радиус пятна рассеяния, т. е. |№р|тах не превышает 2,5 канонических единиц. В этом крайнем случае имеем N ^ 26я0 и N2 ^ 340я?. Для метода прямоугольников N *& 2000 и -^ N2 ^ ^2-106, для метода Гаусса N & 100 и ~ N2 ^ 5000. Из приве- приведенного примера видно, что особенности подынтегральной функции приводят к значительной трудоемкости вычислений и что при- применение метода прямоугольников весьма неэффективно. Особенности двумерного случая. Граничная погрешность. Все рассмотренные методы, в принципе, можно распространить на случай функций двух переменных. Опишем вокруг области интегрирования Q прямоугольник, стороны которого параллельны осям координат (рис. 4.4). На сто- сторонах прямоугольника размечаются по каждой переменной х и у узлы в соответствии с формулами D.29), D.31) или D.33). Дву- 162
мерные узлы находятся на пересечении координатных линий, про- проведенных через узлы по каждой переменной, а двумерные веса c-j определяются как произведение весов, соответствующих этому узлу по каждой переменной. В двумерных узлах вычисляются значения подынтегральной функции flf. При этом, если узел не попадает в область интегрирования Q, то значение fLj принимается равным нулю и интеграл находится по общей формуле D.28). При всех прочих равных условиях количество узлов в двумерном случае равно квадрату количества узлов в одномерном случае. В двумерном случае по- появляется дополнительная по- решность из-за несовпаде- несовпадения границы области инте- интегрирования Q с координат- координатными линиями в переменных интегрирования, т. е. так называемая граничная по- погрешность. Из рис. 4.4 видно, что интегрирование факти- фактически производится не по истинной области Q, а по ступенчатой фигуре, обра- образованной пр ямоу гол ьными ячейками интегрирования. ^Для устранения гранич- граничной погрешности иногда бывает достаточно сделать замену переменных интегри- интегрирования, перейдя к таким переменным, в которых об- область интегрирования ограни- ограничена координатными линиями. Например, интегрируя по круглому или кольцевому зрачку в декартовых координатах ро ру, как пока- показано на рис. 4.5, а, мы имеем значительную граничную погреш- погрешность. Перейдя к полярным координатам р и ф или t и ср, мы пре- преобразуем область интегрирования из круга или кольца в прямо- прямоугольник, стороны которого есть координатные линии* и гранич- граничная погрешность исчезает (рис. 4.5, б). К сожалению, такой прием годится не для всех областей интегрирования. Так, например, для области, показанной на рис. 4.6, граничная погрешность на одной из границ (А или Б) не устраняется ни при какой замене переменных. В этом случае уменьшения граничной погрешности можно добиться только увеличением количества узлов и умень- уменьшением размеров ячеек в пограничных районах области интегри- интегрирования (рис. 4.6, а). Метод интегрирования по Гопкинсу. Большое количество узлов интегрирования в общих методах, вызванное быстрыми осцилля- циями подынтегральной функции, привело к необходимости 163 ¦4- V 5~ т 5 ¦ф- + * -*- -*¦ •*• V /г- + + * •*• -*¦ -*- ¦* •*¦ ¦* -*• •*¦ 1—-—i У -*- • -*- * -* W и 1 ч •*• ¦* Г -ф- -ф- > -ф- А 4- ч А */ j + Рис. 4.4. Ячейки и узлы интегрирования функций двух переменных (крестиками обозначены рабочие узлы: ноликами — нерабочие)
ж Т я 7 % S Н'р Рис. 4.5. Устранение граничной погрешности заменой переменных интегрирования: а — интегрирование по кольцевому зрачку в декартовых координатах рх, ру\ б — интегрирование по тому же зрачку в полярных координатах t = р2 и ф 1 -к J ( у \ \ / \ / Ч А ^* -Б А Рис. 4.6. Область интегрирования в виде сегмента с неустранимой граничной погрешностью: а — в декартовых координатах; б — в полярных координатах 164
разработки специальных методов интегрирования функций вида f (х) = со (х) ехр [2 шЧ|) (х)]. Такой метод, учитывающий ха- характер подынтегральной функции, был предложен специально для оптических приложений Гопкинсом [47]. Метод основан на разложении функции аргумента if> (x) в ряд Тейлора в окрестности каждого узла xk интегрирования (центра подынтервала шириной hk = 2&xk) с удержанием первых двух членов ряда ф (х) & г|) (хк) + Vx (xk) (x - xk). D.41) Интеграл представляется затем в виде суммы интегралов по всем подынтервалам, с учетом выражения D.41): Xk+Axk I = j со (х) ехр [2ш\|э (х)] dx ^ 2j j ^ (х) ехР х A k Ху—к X t# [tyk + Ч> (* ~~ *fc)H d#, D.42) где tyk = i|) (ял) — значение функции в узле; г|^ — значение ее производной. Если модуль подынтегральной функции со (х) изменяется до- достаточно плавно, то его можно считать постоянным в пределах sinz Рис. 4.7. График функции sine (z) = sin zlz ячейки 2&xk и вместе с постоянным множителем ехр [2ш'%] вы- вынести в формуле D.42) из под интеграла, который затем легко находится аналитически, Xk+Axk ехр [2ш'\|э? (х — Xk)] dx==2 Axk sin Получившаяся функция sin zlz, которая часто обозначается как sine (г), показана на рис. 4.7. Вычисление этой функции не представляет труда. При аргументе г, большем чем я/2, значение функции вычисляется непосредственно по формуле sine (z) = = sin zlz с использованием стандартной программы вычисления 165
синуса. При аргументе, меньшем чем я/2, рациональнее восполь- воспользоваться полиномом наилучшего приближения. Например sine (г) = @,00761г2 - 0,16605) г2 + 1. D.43) Погрешность этой формулы не превышает 2-Ю. Итак, интеграл от функции ехр [2щ\|? (х) ] по методу Гоп- кинса записывается в виде / ^ S со (xk) ехр Bя%) 2 Axk sine Bя\|^ Axk) = k = S /*2 д^ sine Bm|)fc Д*Л). D.44) При практических вычислениях получаем два интеграла — косинусный С = 2 2 Дл^ cos Bm|:*) sine Bя\|г? Дх^) со (л^) и синусный S = ? 2 Дх^ sin Bясо^) sine Bяг|^ Дл^) со (л^). Сравнивая формулы D.44) с D.28), мы видим, что в отличие от общих методов, например метода прямоугольников, в весовом множителе 2Дх^ sine Bя^Дх^) учитывается величина первой про- производной функции аргумента г^ (х), т. е. частота осцилляции подын- подынтегральной функции / (х). Благодаря этому количество узлов, необходимое при интегрировании по Гопкинсу, значительно меньше, чем в общих методах. В частности, при постоянной первой производной функции г|) (х) формула Гопкинса дает точный резуль- результат, т. е. она точна для линейных функций \|) (л:). Чем больше неучитываемая формулой D.44) величина второй производной функции \|? (jc), тем больше погрешность и тем больше требуется узлов. Вспомним, что при использовании общих формул количе- количество узлов определялось величиной первой производной функции аргумента г|) (л:). Можно поэтому сказать, что для функций вида ехр [2яд|) (х) ] формула Гопкинса на порядок производной точнее. В двумерном случае формула Гопкинса приобретает вид / = J j со (х, у) ехр [2ш\|э (*, у)] dx dy & п ~ ? h sine (Xk) sine (Yk) 2 Д^2 Ayk, D.45) k где 2Дхь 2Ayk — размеры ячеек, на которые разбита область интегрирования; fk = со (xk, yk) ехр [2яп|? (xk, yk)] —значение интегрируемой функции в центре k-й ячейки; Xk = 2я ^^х^ Ук> х Ayk. Заметим, что когда интегрирование производится в полярных координатах р и <р, мы должны найти интеграл, включающий мно- множитель р, появляющийся вследствие замены переменных dxdy = = pdpdcp, т. е. \\f(x, 166
В этом случае формула интегрирования по Гопкинсу суще- существенно усложняется [48]: k X {sinc(Rk) - 'ApA[C0S(pX~SinC№)] }sinc<ф*)' <46) где *Л = 2я L дрл; ф, в 2я ^^ дфА. Количество действий здесь гораздо больше, чем по формуле D.45), поэтому правильнее пользоваться не полярными координа- координатами р и ф, а / = р2 и ф. В этом случае множитель р не появляется, и можно применять общую формулу D.45), обозначив t = х Иф = у. Граничная погрешность в методе Гопкинса не исключается, как и в общих методах, поэтому применение формулы Гопкинса в случаях, когда граница области интегрирования не совпадает С координатной линией, не избавляет от необходимости увеличе- увеличения количества узлов в пограничных районах. Следует отметить, что хотя метод Гопкинса требует меньшего количества узлов, чем общие методы, для получения той же точ- точности интегрирования, но количество вычислений для каждого узла значительно увеличивается, так как кроме значения функции fk = со (xk, yk) ехр [2яд|) (xk) ] (как в общих методах) необходимо df (xk> Ук) df (xk> yk) еще получить значения производных v * и 1 и вычис- вычислить sine (X), sinc (Y). Поэтому выигрыш в общем количестве вычислений от использования метода Гопкинса может быть не так велик, как ожидается. При использовании метода Гопкинса, как и общих методов, наиболее просто располагать узлы интегрирования с постоянным шагом, что, однако, приводит к завышенному количеству узлов, "так как шаг должен выбираться исходя из наихудшего случая. Более рационально, как предложил А. В. Ленский в работе [18], взять базовую сеть узлов с довольно большим шагом (редкую сеть), а затем, в зависимости от значения вторых производных функции \|э (х, у)> в каком-либо узле сети — центре k-й ячейки дробить эту ячейку сети на ячейки второго уровня, причем коли- количество их выбирать в зависимости от величины второй произ- производной. Например, пусть xk, tjk — узлы редкой сети, xh yt — узлы частой сети. Тогда: 2 т 2п k /=1 /=1 Л1?Л!](»ау|4), ,4.4т, 167
где xf = xk - Axk + B/ - 1) -jfi-; yx = yk- byk + B/ - 1) т = О, если О ^ 2я | if1** \ Дх| < 1; т = 1, если 1 ^ 2л | \|/*д <2 и т. д. Аналогично выбирается и п. Вторая производная может быть легко оценена методом ко- конечных разностей, в соответствии с формулой C.89) Такое же дробление следует производить в пограничных ячей" ках. Эта процедура способствует уменьшению общего количества узлов и вычислений при одновременном повышении точности интегрирования, но существенно усложняет алгоритм вычисле- вычислений и требует дополнительных действий для получения значений вторых производных. Количество узлов, принятое в рабочих алгоритмах для вы- вычисления ФРТ и ОПФ, определяется обычно предварительно экспериментально: начиная от какого-то минимального, количе- количество узлов увеличивается, например, как степень двойки, и до тех пор, пока погрешность результата не окажется в приемлемых пределах. § 23. ОПРЕДЕЛЕНИЕ ДИФРАКЦИОННОЙ СТРУКТУРЫ ИЗОБРАЖЕНИЯ МЕТОДАМИ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ В этом параграфе мы рассмотрим основные принципы и алго- алгоритмы расчета характеристик дифракционной структуры изобра- изображения, т. е. ФРТ и ОПФ в соответствии с формулами § 21 насто- настоящей главы при использовании только что рассмотренных методов численного интегрирования. Вычисление дифракционной ФРТ. Расчет монохроматиче- монохроматической ФРТ в соответствии с формулой D.3) сводится к многократ- многократному вычислению определенных интегралов от комплексных функций при различных значениях г\0. Для устранения граничной погрешности удобнее всего производить вычисления в полярных координатах t = р2, ср на зрачке и тH, 9 на изображении. Тогда расчетная формула запишется в виде 1 1 , ф) х о о -^ \W(t, ф) + V1/2cos(cp-e)] D.49) 168
Интегрирование выгоднее производить по методу Гопкинса в соответствии с выражением D.45), которое применительно к дан- данному случаю принимает вид /«SSfe sine (Tk) sine (Ф,) 2 Atk2 АФ/, D.50) k i где Yt Atk = -^- [^ (tk, Ф/) + 4" Чо^172 cos (Ф' ~ e)l A/*'> Ф/ = 2m|)/' АФ/ = i?- [W^ D, Ф/) - т^1/2 sin (Ф/ - 0)] АФ/. В предыдущей формуле tkj Ф/ при й=1,...,/С, Z=l, ...,L — узлы сети интегрирования в полярных координатах / и Ф. Для центрированных систем в силу симметрии достаточно производить вычисления только для правой половины зрачка, т. е. при 0 < Ф < я и для правой половины пятна рассеяния при О < 0 < я. Количество узлов интегрирования удобно выбрать одинаковым для всех т]0 и 0. Тогда значения волновой аберрации и ее произ- производных W't и №фВ узлах при этом вычисляются один раз для всех rio и 0 и запоминаются в промежуточных массивах в соответствии с алгоритмом, показанным на схеме 4.3. Размер ФРТ в канони- канонических координатах Лотах, шаг Д% по радиусу гь и А0 по углу 0, а также количество узлов интегрирования К и L являются исход- исходными данными для алгоритма. Заметим, что шаг по радиусу дол- должен быть не более 0,25 канонических единиц, так как при любых аберрациях период дифракционной структуры составляет при- примерно 0,5 канонической единицы и при большем шаге мы просто не разрешим дифракционную структуру. Расчет при этом стано- становится бессмысленным и надо пользоваться геометрическим при- приближением. Волновая аберрация представлена своими коэффи- коэффициентами разложения по степенному или ортогональному базису. Вычисление значений волновой аберрации и ее производных в узлах интегрирования производится при помощи алгоритма, описанного в § 21 настоящей главы. Можно уменьшить количество вычислений, если определять значения волновой аберраций и ее производных только в верхней четверти зрачка т. е. в области ?22 на рис. 4.1, разбив волновую аберрацию на четную и нечетную составляющие по координате ру, т. е. по cos Ф: W(t, D.51) 169 W'9(t, ф) = И^(*. Ф) + Пн(<> Ф)-
I— 6 Начало WB1,5); XE);cE);At--i/2Nt; / W(K,L,I) = W; 'o 2 Цикл по индексу I от 1 с шагом 1 до Ng Цикл по индексу J от 1 с шагом f до Nq чтение исходных данных Вычисление узло8ивесов интегрирования • по пере- переменной X - по Гауссу, по переменным t и tp равно- равномерно - (по Гопкинсу) 'вычисление массивов значе- значений Волновой аберрации Wu ее производных not и tp в узлах интегрирования по алгоритму по схеме 4.2 начало цикла по полярному углу 9 на изображении наращивание полярногоуг- полярногоугла В, присвоение начального значения полярному радиу- .су По начало цикла по полярному радиусу 7]0 на изображении Г" Чо~Чо+Аг1; ^ наращивание полярного ра- радиуса 7j0; обнуление значения полихроматической ФРГ Ьполи Цикл по индексу L от 1 с шагом 1 до 5 Цикл по индексу К от f с шагом f до AV p <р=А<р начало цикла интегрирова- интегрирования по канонической спек- спектральной координате %\L- номер узла по этой координа- - те "CjS-начальные значения интегралов по Гопкинсу; Lq-множитель отношения длин волн \ /3 - Весовой множитель в интеграле по Гопкинсу начало цикла интегрирова- интегрирование по переменной t на зрач- зрачке ; К- номер узла по i наращивание координаты t, присвоение начального зна- значения полярному углу у на зрачке 170 Схема 4.3. Алгоритм вычисления поли
Цикл по индексу Н omi с шагом 1 до L^ \ начало цикла по полярно- \\ му углу (р на зрачке; уг"\м-номер узла по tp ГУ V шрщиВание координаты (р Вычисление аргумента под- интегральной срункциииего производных для интегриро- интегрирования по Гопкинсу использование стандартных программ „sine";,, cos" и „sin" {накапливание сумм - интегри- \ро8ание по Гопкинсу конец циклов по координатам на зрачке t и ip 'интегрирование по спектраль - ной коороинате X по методу Гаус- Гаусса; сA)-веса гауссовой квадра- квадратуры; с[- относительная спект- спектральная эффективность конец цикла по спектральной координате X [запись значений полихромати- \ческой ФРТ в двумерный массив конец циклов по координатам j^ W0 на изображении (~Тонец ароматической дифракционной ФРТ 171
Вычислив значения W4 и №н, а также Wl4, WiB и W^ W^n для верхней четверти Q2 зрачка, найдем по формуле D.51) значе- значения волновой аберрации и ее производных для нижней четверти Q3i поменяв знак у W'Hi WiK и W^4 на противоположный. Такой прием требует некоторого изменения алгоритма вы- вычисления волновой аберрации и ее производных с целью выделе- выделения четной и нечетной составляющих по cos ф. Для этого коэффи- коэффициенты разложения разбиваются на две группы, содержащие соответственно четные и нечетные индексы по переменной ф. Этот метод реализован в частности в программе Гопкинса [48] с тем отличием, что интегрирование производится не в полярных координатах t и ф, а в координатах р и ф по формуле D.46). Произ- Производные волновой аберрации в узлах вычисляются не по коэффи- коэффициентам разложения, а численным методом по формуле C.91). Вычисление полихроматической ФРТ сводится в соответствии с формулой D.5) к добавлению в рассмотренный алгоритм еще одного интеграла по переменной %. Этот одномерный интеграл рациональней всего вычислять по методу Гаусса по трем или пяти узлам. Вычисление ОПФ — общие понятия. Применение формулы автокорреляции D.7) сводится к многократному вычислению определенных интегралов для различных значений простран- пространственных частот s0. В подавляющем большинстве случаев ОПФ определяется только для двух направлений вектора частот: мери- меридионального, для которого 0 = 0, sx = 0, при этом D = D (sy)> и сагиттального, для которого Э = -у, sy = 0 при этом D = D (sx). Напомним, что в центрированных системах ОПФ для сагитталь- сагиттального направления получается вещественной благодаря симме- симметрии. Наиболее существенными моментами, отличающими различ- различные программы, являются: выбор координат и узлов интегрирова- интегрирования, способ вычисления функции sV (p, s0) разностной волновой аберрации и метод интегрирования. Заметим, что благодаря сим- симметрии волновой аберрации, которая в центрированных системах является четной относительно рХ9 разностная волновая аберрация sV также обладает симметрией, а именно: для меридионального направления частоты (sx = 0) она четная по р*, а для сагитталь- сагиттального направления — нечетная по р^. В обоих случаях интегриро- интегрирование достаточно производить по половине области Q (s0), т. е. по области Qi (s0) (рис. 4.8). Границы этой области йх (s0) ни при каком выборе перемен- переменных интегрирования не могут быть координатными линиями, поэтому при вычислении ОПФ граничная погрешность неустра- неустранима. Если выбрать декартовы координаты р^, ру, то получаем погрешность на круговой границе, если полярные координаты р, ф или t, ф — то на прямолинейной границе. Рассмотрим некоторые конкретные методы и алгоритмы вычисления ОПФ. 172
Метод Г. Г. Слюсарева для вычисления ОПФ. Г. Г. Слюсаревым в Государственном оптическом институте им. С. И. Вавилова разработана одна из первых в СССР программ для вычисления ОПФ [30]. Отличительными чертами этой программы являются следующие. Расчетом лучей через оптическую систему определяются зна- значения волновой аберрации в базовой прямоугольной сети на половине зрачка, состоящей из 50—100 узлов, т. е. рассчитывается 50—100 лучей для каждой точки предмета и длины волны. Затем Рис. 4.8 Области интегрирования при вычислении дифракцион- дифракционной ОПФ: для меридионального (а) и сагиттального (б) направ- направлений пространственной частоты линейной интерполяцией сеть сгущается до количества узлов от 100 до 400. Шаги сети на зрачке 2Дрх, 2Ар^ выбираются мень- меньшими в целое четное число раз шагов Asxy ksy изменения канони- канонических пространственных частот, т. е. Ар* = -т^-, Ар^ = -^-, где /п, п — любые целые числа (обычно т = п = 1). Это обеспе- обеспечивает смещение зрачков всегда на целое число узлов при вы- вычислении ОПФ по формуле D.7). Следовательно, разностная волновая аберрация может определяться в тех же самых узлах, что и волновая аберрация, по формуле sV = (i Ар,, / Ар,) = sVu = Wukm} hln - , ,-m, D.52) где в узлах; k = = W (/Ар*, — значения волновой аберрации / = Рассчитывать заново значения волновой аберрации в узлах интегрирования при изменении пространственной частоты не тре- требуется. При вычислении волновой аберрации ее величины округляются до 0,05, поэтому значения разностной волновой аберрации полу- получаются округленными до 0,1. Кроме того, от них сохраняется только дробная часть. Причем, если она отрицательна, то к ней Добавляется единица. Это допустимо, так как очевидно, что при 173
добавлении к sV любого целого числа exp [2mW] не изменяется. Таким образом получаем, что во всех узлах разностная волновая аберрация принимает одно из значений 0; 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9. Пусть п0 — количество узлов со значением 0, пг — со значением 0,1 и так далее до п9. Тогда, при интегрирова- интегрировании по методу прямоугольников D = C + iS, D.53) где С = — 2 cosB:nV*) = (п0 - пь) + cos-y-^ + n9- ne - щ) + к + cos 22- (п2 + п8-п7- /ia); S = sin -^(пг + n4 — n9 — лв) + sin-^(n2 + я3-л7- п8). Описанный прием не требует вычисления cos BnsVk) и sin BnsVk) и позволяет тем самым существенно сократить коли- количество действий, но может давать ощутимую погрешность при сложных формах волновой аберрации. Интегрирование по фор- формуле прямоугольников также дает весьма невысокую точность, поэтому рассмотренный метод применим в основном к дифрак- дифракционно-ограниченным системам, у которых волновые аберрации не превышают одной — двух длин волн. Заметим, что при описанном способе вычисления разностной волновой аберрации шаг по пространственным частотам не может быть произвольным, а всегда кратен шагу интегрирования по зрачку, т. е.: Asx = 4m Ар/, Asy = in Apy. Это обстоятельство также ориентирует на применение метода к дифракционно-ограниченным системам, работающим в большом интервале пространственных частот, так как даже при т = п = 1 и количестве узлов на половине зрачка порядка 400 мы имеем 2 Ар^2 Лр„ ^ -~ и Дрх = Ару & 0,03. При этом Asx « Asy > > 0,1. Для того чтобы судить о ходе ОПФ, обычно принято опре- определять ее в десяти точках i'As, / = 1, ..., 10. Следовательно, наи- наименьший интервал частот, в котором мы можем производить расчет, равен lOAs « 1, т. е. половине предельной частоты, что характерно для дифракционно-ограниченных систем. Методы А. В. Ленского и Дж. Макдональда для вычисле- вычисления ОПФ. Рассматриваемые в этом разделе методы основаны на интегрировании по Гопкинсу. В методе А. В. Ленского, разработанном в Государственном оптическом институте им. С. И. Вавилова, интегрирование произ- производится по области Qx (s) в декартовых канонических координатах 174
р^, р^. Значения волновой аберрации и затем разностной волновой аберрации в узлах сети интегрирования находятся с помощью коэффициентов разложения по степенному базису. Для уменьше- уменьшения граничной погрешности и повышения точности интегрирова- интегрирования производится сгущение узлов интегрирования в соответствии с модификацией А. В. Ленского метода Гопкинса. Первые и вторые производные функции разностной волновой аберрации, т. е. аргу- аргумента подынтегральной функции, находятся численным методом по значениям функции в узлах. Программа, построенная по опи- описанному методу, дает весьма высокую точность вычислений, и погрешность в значениях модуля ОПФ не превышает 0,002. 0,25 / 1 • \ \ Мб, • • • • • • • • • • • • • • • • • Рис. 4.9. Расположение ячеек интегрирования при вычисле- вычислении ОПФ по методу Макдональда: а — в декартовых коор- координатах рх, ру; б— в полярных t= p2 и ф (заштрихованы неполные граничные ячейки) Метод Дж. Макдональда [51] характеризуется следующими особенностями. Интегрирование производится в полярных коор- координатах / = р2 и ф. Благодаря этому граничная погрешность на окружности t — 1 исчезает (рис. 4.9). Для уменьшения гранич- граничной погрешности на прямолинейной границе (в декартовых координатах) пограничные ячейки, заштрихованные на рис. 4.9, уменьшаются в направлении ср (показано пунктиром на рис. 4.9). Это приводит к некоторому усложнению про- программы. Для определения значений разностной функции волновой аберрации и ее производных в узлах интегрирования, сначала вычисляются значения волновой аберрации в узлах 4, Ф/ базовой сети на зрачке 4 = Д? Bk— 1); ср/ = Аф B1—1), где ?=!,... -, Ut\ 1= 1, ..., Дф = ¦ Затем раз- 175
ностная волновая аберрация sV находится по следующей формуле: где 4 = р* + ру\ ф/ = arctg -?*- , а tkl = (Рх -SX)* + (ру - Syf = (Я/2 Sin Ф/ - S,J + (Я/2 COS Ф/ - Syf; Ф^ = arctg [(tlk/2 sin ф/ — sx)/(tl/2 cos ф/ — sy)]. Значения волновой аберрации в точках 4/, фл/ находятся мето- методом интерполяции по значениям в узлах tk, ф/. Производные разностной волновой аберрации по t и по ф определяются числен- численным методом в соответ- соответствии с формулой C.88). В этом методе произ- производится разделение волно- волновой аберрации и затем разностной волновой абер- аберрации на четную и не- нечетную по р^ составляющие аналогично тому, как было описано на стр. 169. Бла- Благодаря этому вычисления волновой аберрации про- производятся только в первом квадранте зрачка (об- (область Q2 на рис. 4.1) и объем вычислений сокращается. Рис 4.10. Эллиптическая аппроксимация об- области интегрирования при вычислении ОПФ Исследования этого метода показали его высокую эффектив- эффективность. Оптимальное количество узлов NtxN(i> оказывается рав- равным 12 X 8. При этом ошибка в МПФ в большинстве случаев не превосходит 0,01. Метод вычисления ОПФ с эллиптической аппроксимацией области интегрирования. Этот метод, один из самых быстрых, разработан в Ленинградском институте точной механики и оптики и основан на замене области интегрирования в выражении D.7) эллипсом. Полуоси эллипса а и Ъ можно определить из рис. 4.10: D.54) где со = si2 — относительная частота. Удобство этого приема заключается в том, что эллипс масштаб- масштабными преобразованиями координат pi = рх/а и р^ = ру1Ь легко деформируется в круг единичного радиуса. Следовательно, ин- интегрирование по области Q (s) мы заменяем интегрированием по единичному кругу QQ. Сделаем в соответствии со сказанным за- 176
мену переменных интегрирования в выражении D.7), для простоты положив т = 1 D (s) = 7" Я еХр Q(s) ^- — jjexp[2msV(p;, p^, Ho nab = Q3 & Q (s), где ?2Э — площадь эллипса, которым мы заменили Q (s). В свою очередь, Q (s)/Q0 есть ОПФ для круглого зрачка в отсутствии аберрации, т. е. при sV = 0. В соответствии с работой [21 ] = Do (s) = 4" t2a ~ sin 2«]i D-55) где а = arccos (со). Окончательно получим D(s) = D0(s)Dfl(s), D.56) где Da (s) = — J J exp [2ms 1/ (pr, s)] dp' — аберрационный множи- множило тель ОПФ. Вычисление ОПФ описанным методом сводится к вы- вычислению аберрационного множителя в соответствии с формулой D.56) и умножением его на безаберрационную ОПФ. Интегриро- Интегрирование в формуле D.56) производится для любых частот по еди- единичному кругу. В полярных координатах f = р' , ф' этот круг превращается в прямоугольник и, интегрируя в этих координатах, мы полностью избавляемся от граничной ошибки. Кроме того, можно выбрать сеть интегрирования постоянной для всех частот. Представим функцию разностной волновой аберрации sV (p\ s) разложением по базису от координат р\ cos <р\ Коэффициенты этого разложения оказываются довольно несложно связанными с коэффициентами разложения волновой аберрации по базису от координат р, ф. Для меридионального направления частоты (sx — 0) имеем sV (p'f ф\ s,)=SS tf/p''cosy, D.57) где vyij - A - (o)pb A - (д2уЬрУ. (со). Для сагиттального направления частоты (sy = 0) можно запи- записать соответственно sV (p', ф', sx) = p' sin ф'2 S v*jt>'1 cosV, D.58) i i где v*u - A - <*> A - oJ)^/P^ (со). В предыдущих формулах Pxif (со), Руц (со) — полиномы от относительной пространственной частоты со = Цу- или со = —-. 177
Причем коэффициенты этих полиномов не зависят от простран- пространственной частоты и представляют собой определенные линейные комбинации коэффициентов хюц разложения B.69) или B.74) волновой аберрации, которые могут быть вычислены заранее. Показатели степени рц, Цц не зависят от частоты и аберрации. Для каждого значения частоты действия сводятся сначала к вы- вычислению значений полиномов Р%/ и Pf/ по схеме Горнера и коэф- коэффициентов vytj и vxtj по формулам D.57) и D.58); затем к вычисле- вычислению в узлах сети интегрирования значений функции разностной волновой аберрации sV и ее производных по f и ср' с помощью двумерной схемы Горнера, описанной в §21, и наконец, к интег- интегрированию по Гопкинсу. Благодаря отсутствию граничной погрешности можно полу- получить удовлетворительную точность при небольшом количестве узлов интегрирования Nt no f и N^ no q/ практически для любых аберраций. Недостатком рассмотренного метода является некоторая слож- сложность алгоритма и наличие неустранимой теоретической погреш- погрешности, связанной с заменой области интегрирования эллипсом. Исследования показали, однако, что эта погрешность не пре- превышает в большинстве случаев 0,015 в значении МПФ. О точности вычисления ОПФ. Кроме рассмотренных в настоя- настоящем параграфе существуют и другие алгоритмы расчета ОПФ, отличающиеся в конкретных деталях. Причем результаты расчета по различным алгоритмам могут не совпадать из-за различных источников погрешности. В принципе, сгущая неограниченно сеть узлов интегрирования, можно получить любую точность вычисления ОПФ, но это приводит к резкому возрастанию объема вычислений и длительности расчета, поэтому излишняя точность здесь также вредна, как и недостаточная. Естественно, что нет смысла вычислять значения какой-либо характеристики намного точнее, чем они могут быть измерены или реализованы в готовом приборе. Современный уровень измерения МПФ оптических систем не позволяет получить погрешность менее чем 0,02—0,05, а погрешности изготовления и сборки приборов приводят еще к большему разбросу в значениях МПФ. Исходя из этих соображений, можно принять допустимой по- погрешность при вычислении МПФ (модуля ОПФ) порядка 0,02 и выбирать количество узлов интегрирования не большим, чем требуется для достижения такой точности. § 24. АНАЛИЗ СТРУКТУРЫ ИЗОБРАЖЕНИЯ В ГЕОМЕТРИЧЕСКОМ ПРИБЛИЖЕНИИ Как было показано в гл. 2, для многих геометрически-огра- геометрически-ограниченных оптических систем при вычислении ФРТ, ОПФ и дру- других характеристик структуры изображения можно пренебречь 176
дифракционными эффектами и пользоваться геометрическим при- приближением. Вычисление ФРТ методом элементарных площадок. К сожа- сожалению, пользоваться простыми на вид формулами B.53), B.54) непосредственно для вычисления ФРТ практически невозможно, поскольку для этого необходимо найти те точки (рА., р^) на зрачке, из которых попадают лучи в данную точку (г\х, ч\у) на изображении. w Зрачок 2Ax' Изображение Рис. 4.11. Расположение ячеек на зрачке и изображении при вычислении геометрической ФРТ методом элемен- элементарных площадок Для этого нужно решить следующую систему двух нелинейных уравнений: относительно р^, р^ при заданных цХУ цу. Нахождение этого решения в общем случае представляет гро- громадные трудности. Г. Г. Слюсаревым [30] был предложен для вычисления гео- геометрической ФРТ приближенный метод элементарных площадок, заключающийся в следующем. Весь зрачок разбивается на ряд равновеликих площадок (ячеек). Удобнее всего это сделать в полярных канонических координатах t = р2, ср и тогда центры этих ячеек будут иметь координаты: tk = teBk-l); Ф/ = АФB/ —1); * - 1, . . ., Nt- I = 1, . . ., N9, D.59) где А^ = ~2др; Аф = -g^—; i\f/ и Л/ф — количество ячеек по t и по ф. 179
Благодаря симметрии в центрированных системах достаточно рассматривать половину зрачка. Поверхность изображения также разбивается на ряд равновеликих ячеек, например в декартовых координатах, в соответствии со следующей формулой (рис. 4.11): 4 = 2 Axf (i - 1); у] = 2 Ay' (j - 1) - у'тах- i=l, ..., Nx; /=1, ..., Ny. D.60) Для центра каждой ячейки зрачка методами, рассмотренными в § 21, определяются поперечные аберрации луча, т. е. обобщен- обобщенные координаты x'ku y'ki точки пересечения его с поверхностью изображения. Затем количество лучей, попавших в ячейку изоб- изображения, имеющую координаты центра х\, у), суммируется с ве- весом, равным пропусканию зрачка т (tk, ф,). Значение геометри- геометрической ФРТ в точке х'с, у} приближенно принимается равным лм, 0/) = л*/~т?- D.61) В формуле D.61) sij= 2] J3 т(^, ф;), где суммирование про- производится по тем &, / ячейкам зрачка, из которых лучи попадают в I, /-ю ячейку изображения, т. е. для которых одновременно выполняются два условия: ||4/|-К-Ц<д*' и \у'ы-у}\<Ьу'. D.62) В первом условии |л&| и \xl\ взяты по модулю из-за симметрии, так как мы рассматриваем половины зрачка и изображения. Величина So находится суммированием по всем ячейкам зрачка по формуле So = S 2j тD, ф/). В случае, если пропускание равномерно, т. е. т = const, выражение D.61) упрощается: где Nk — количество лучей, для которых выполняются условия D.62), т. е. попавших в ij-ю ячейку изображения; N = NtN^ — общее количество лучей (ячеек) зрачка. Для получения ФРТ с хорошим пространственным разреше- разрешением по координатам х', у' необходимо брать мелкие шаги Дя', Ау', в плоскости изображения, т. е. большое количество ячеек. Для получения достаточного разрешения по интенсивности ФРТ необходимо, чтобы в каждую площадку, где ФРТ отлична от нуля, попадало бы существенное количество лучей (для уменьшения «дробового эффекта»), поэтому количество площадок на зрачке в этом методе должно быть довольно велико. В отличие от ФРТ функция рассеяния линии (ФРЛ) и функция концентрации энер- энергии (ФКЭ), служащие также характеристиками структуры изоб- изображения (см. § 5 гл. 2), требует гораздо меньше действий при 180
вычислении их методом элементарных площадок, так как они являются одномерными функциями. Количество ячеек на поверхности изображения при прочих равных условиях равно корню квадратному из количества ячеек для ФРТ (соответственно меньше и количество ячеек на зрачке). Напомним, что ФРЛ показывает распределение интенсивности в изображении линии. Пусть линия ориентирована вдоль коорди- координаты у'. Тогда ячейки на изображении, для которых подсчитыва- ется количество попавших в них лучей, представляют собой по- полоски шириной 2Ал:', а при подсчете лучей проверяется только первое из условий D.62), т. е. \\х'ы\— \х}\\ <; Ал:. ФКЭ показывает зависимость энергии пятна рассеяния, содер- содержащейся в круге диаметром D, от величины диаметра при условии, что полная энергия пятна рассеяния равна единице [см. формулу B.18)]. Для получения геометрической ФКЭ достаточно подсчи- подсчитать сумму (с весом т (tky ф,)) лучей, попавших из ячеек зрачка внутрь круга диаметром Dt на изображении, т. е. лучей, коорди- координаты xkU ум которых на изображении удовлетворяют условию D/ - х'с.у + {у'ы - ус.у < Щ-, D.63) где х'с, ус\ — координаты центра круга. Самым сложным в этом вопросе является выбор координат хс.у ус. центра круга, обеспечивающих максимум ФКЭ (особенно для несимметричной формы пятна рассеяния). Если не делать этого выбора, а принимать всегда х'с , у'С[ = 0, то можно получить заниженные значения ФКЭ для малых диаметров. В центрирован- центрированных системах задача облегчается тем, что благодаря симметрии х'с = 0 и у с можно найти простым перебором. Определение геометрической ОПФ. В геометрическом прибли- приближении ОПФ вычисляется по формуле B.55), Для вычисления ин- интеграла рациональнее всего применить метод Гопкинса, а интегри- интегрирование вести в полярных координатах t = р2, ф на зрачке с це- целью устранения граничной погрешности, которая в этой формуле может быть устранена полностью для круглого канонического зрачка. Применяя формулу метода Гопкинса к данному случаю, получим d к, v;) = с + ts - 4~ 2 2fkl sinc {Tkl) sinc {Okl)* D>64) k i где fki = exp 181
Информацией, необходимой для вычисления по формуле D.64), являются значения поперечных аберраций и их производных по t и ф в узлах интегрирования — центрах равновеликих площадок D.59) зрачка. Значения поперечных аберраций вычисляются так же, как и для определения ФРТ, ФРЛ, ФКЭ в центрах тех же самых ячеек, а значения производных проще всего могут быть определены численным методом конечных разностей в соот- соответствии с формулами C.88). Несколько отличный алгоритм предложен Г. Г. Слюсаревым [30]. В этом алгоритме, как и в рассмотренном ранее алгоритме того же автора для вычисления дифракционной ОПФ, интегри- интегрирование производится в декартовых зрачковых координатах рх, ру по методу прямоугольников и для вычисления cos [2я (&g'v'y + + 8G'v'x) ] и sin [2я (Sg'v'y + 6Gv*) 1 применен тот же прием, который описан на стр. 174. Видно, что здесь больше источников погрешности и поэтому точность вычисления существенно ниже. Построение точечной диаграммы. Как мы упоминали в § 8 гл. 2, для наглядного представления картины поперечных абер- аберраций употребляется так называемая точечная диаграмма, которая позволяет также получить и полуколичественное представление об ФРТ в геометрическом приближении. В общем случае точечную диаграмму можно представить как совокупность точек пересече- пересечения с поверхностью изображения лучей, проходящих через цен- центры равновеликих ячеек зрачка. Иногда применяют прямоуголь- прямоугольную сеть ячеек (в декартовых координатах рА, р^), но удобнее и нагляднее получается точечная диаграмма при полярной сети в координатах t = р2, ф на каноническом зрачке. Точки, принад- принадлежащие лучам с одинаковыми значениями t, т. е. одной окруж- окружности на зрачке, удобно соединить линией, номер которой соответ- соответствует номеру окружности на зрачке. Каждый луч несет равное количество энергии, поэтому по густоте расположения точек на диаграмме можно судить об интенсивности в пятне рассеяния: чем гуще расположены точки, тем больше интенсивность. Точечную диаграмму удобно выводить на построчное алфавит- алфавитно-цифровое печатающее устройство ЭВМ (АЦПУ). При этом по- поверхность изображения разбивается на ряд строк, состоящих из ячеек, размеры 2Ах\ 2Ау' которых пропорциональны в направ- направлении х' расстоянию а между символами в строке печати, а в на- направлении у' — расстоянию b между строками, т. е. Ах' = та\ Ay' = mb, где т — масштаб карты. Всего должно быть Л^ строк и Nх ячеек в строке, причем Nx<s? < Wmax> где Nmsx — длина строки печати АЦПУ (обычно Afmax = = 120 или Nmax = 128). Если область изображения, занятая точечной диаграммой предполагается квадратной, то aNx = = bNy или Ny =-yNx. Начало координат выбирается обычно 182
посередине квадрата, поэтому коордианты центра iy /-й ячейки равны: х} - Д*' B/ - Nx - 1); у} = Д/ B/ - % - 1). Пусть нам уже известны координаты точек пересечения лучей с поверхностью изображения, т. е. поперечные аберрации для всех ячеек зрачка в виде массивов bG'ki — 6G' (tk, ф/) и 6g?/ = bg' D, Ф/). Для каждой I, /-й ячейки i-й строки изображения проверим условия: ! х) — 6G'ki | < Ах или | у\ — bgki | < Ay D.65) для всех k и I. Если одно из этих условий выполняется для каких-нибудь k, /, то луч из k, 1-й ячейки зрачка попадает в iy /-ю ячейку изображе- изображения, и в этом случае в эту /-ю ячейку i-й строки заносится символ k, равный номеру окружности на зрачке, в противном случае зано- заносится пробел. После просмотра и занесения символов во все ячейки строки она выпечатывается и просматривается вся следу- следующая строка. Для центрированных систем в силу симметрии достаточно оп- определять поперечные аберрации для половины зрачка, т. е. для Ф ? @, я), а затем при проверке условия D.65) заменить его первую часть на \\х}\ — |6G?/[| < Ах'. В заключение данного параграфа заметим, что предваритель- предварительным этапом при вычислении всех рассмотренных характеристик в геометрическом приближении является получение значений по- поперечных аберраций 6g?/, 6G^/, а также коэффициента пропуска- пропускания %н в узлах сети — центрах равновеликих ячеек на зрачке. Причем для круглого канонического зрачка с целью исключения граничной погрешности, а также для упрощения вычислений удоб- удобнее всего использовать сеть в полярных координатах t = р2, Ф в соответствии с формулами D.59). Вычисление значений поперечных аберраций для такой сети производится по алгоритму, описанному в § 21 (например, по схеме 4.2). При сложных формах зрачка в этот алгоритм должна быть добавлена проверка того, не выходит ли данная ячейка за область зрачка. В этом случае необходимо принимать коэффициент про- пропускания %kl для этой ячейки равным нулю или при суммировании количества лучей не учитывать ее. § 25. ПРИМЕНЕНИЕ БЫСТРОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ ДЛЯ РАСЧЕТА ДИФРАКЦИОННОЙ СТРУКТУРЫ ИЗОБРАЖЕНИЯ Рассмотренные в § 23 методы расчета ФРТ и ОПФ основаны на численном интегрировании комплексных функций в выражениях D.3), D.7), которые, в свою очередь, получены из основных фор- формул D.2), D.6), показывающих, что ФРТ есть квадрат модуля фурье-преобразования зрачковой функции, а ОПФ есть фурье- 163
преобразование ФРТ. Таким образом, определение ФРТ и ОПФ по известной зрачковой функции может быть сведено к выполне- выполнению двух фурье-преобразований двумерных функций. По сути дела, описанные ранее методы вычисления ФРТ и осуществляли фурье- преобразование зрачковой функции, но как бы в завуалированном виде. При вычислении же ОПФ по формуле автокорреляции D.7) выполняемые действия уже не являются фурье-преобразованием. В настоящем параграфе мы рассмотрим получившие в недав- недавнее время широкое распространение методы, основанные целиком на численном дискретном фурье-преобразовании. Дискретное фурье-преобразование и связь его с непрерывным. В оптических приложениях непрерывное фурье-преобразование определяется в одномерном случае формулой f(v)= j / (х) exp Bnivx) dx, D.66) — оо а в двумерном — формулой -foo f К> vy) - J | / (x, у) exp [2ш (ухх + vyy)] dx dy. D.67) —oo На практике при анализе изображения оптических систем фурье-преобразование необходимо выполнять численно, что мо- можно, например, сделать, вычисляя определенные интегралы в формулах D.66), D.67) для всевозможных значений частот ка- каким-либо методом численного интегрирования. Пусть исходная функция определена на интервале Dx. Сле- Следовательно, на этом же интервале будет производиться интегри- интегрирование в выражении D.66). Будем вычислять значение фурье- образа f (v) в N равностоящих по частоте с шагом Av точках и воспользуемся для этого методом прямоугольников с шагом Ах, причем: Ax-Al = lh; Av=TC = T7T; ^Av=-^. D.68) В результате из формулы непрерывного фурье-преобразования D.66) приходим к выражению f (m Av) = Ах V / (k Ал:) ехр \2nik Ахт Av] = k=0 N-l A/Av D.69) которое называется дискретным преобразованием Фурье (ДПФ). На основе формулы D.69) построен наиболее удобный и быстрый способ численного фурье-преобразовация. Вообще говоря, ДПФ
может рассматриваться, как это часто делается, безотносительно к непрерывному фурье-преобразованию, а именно как преобразо- преобразование одного массива чисел fk в другой fm и обычно записывается в виде [4] го = 0, .... JV-1. D.70) Множитель —j^= выбирается из соображений симметрии и не является принципиальным. Однако, поскольку мы используем ДПФ только как численную реализацию непрерывного преобра- преобразования, полезно более подробно установить их связь. В ДПФ как исходная функция, так и результат преобразования пред- представляют собой выборки некоторых функций. Пользуясь свой- свойствами фурье-преобразования, приведенными, например, в ра- работах [10, 21, 22], нетрудно заметить, что ДПФ есть выборка длиной N чисел с шагом Av = -=:— фурье-образа выборки с шагом Ах = -др = дг Av = -?— исходной функции на интервале Dx. Как следует из теоремы Котельникова [10, 21, 22], ДПФ точно соответствует непрерывному преобразованию, если преоб- преобразуемая функция есть функция с финитным спектром, т. е. если ее фурье-образ отличен от нуля только в области 2vb, и если шаг выборки исходной функции удовлетворяет условию Ал: < Il2vbi т. е. Dv = 2vb. Двумерное ДПФ определяется аналогично одномерному по формуле М-\ JV—1 т = 0, . . ., М- 1; я-0, . . ., /V-1. D.71) Оно описывает преобразование исходной матрицы чисел двумер- двумерной выборки исходной функции с шагами Ах и Аг/ на области DxDy = MNAxAy в результирующую матрицу, представляющую собой двумерную выборку спектра преобразуемой выборки с ша- шагами Avx = м и Avu = jj-r— на области MNAvxAvy. Если в нашем распоряжении есть алгоритм одномерного ДПФ, то, как легко заметить из формулы D.71), двумерное ДПФ можно свести к последовательному одномерному преобразованию всех столбцов исходной матрицы, а затем всех строк. Быстрое преобразование Фурье — общие принципы. Приме- Применение ДПФ в чистом виде в соответствии с выражениями D.69)— D.71) не способствует уменьшению количества действий по срав- сравнению с обычными методами численного интегрирования и требует очень большого объема вычислений. Действительно, для ДПФ 185
массива из N чисел в соответствий с формулой D.70) требуется порядка N2 операций, под каждой из которых мы будем понимать выполнение комплексного сложения и умножения. Если учесть, что каждое сложение комплексных чисел эквивалентно двум арифметическим действиям сложения, а каждое комплексное ум- умножение — двум сложениям и четырем умножениям, то всего требуется 8N2 арифметических действий. Даже при умеренных значениях N количество действий получается очень большим. О 1 к, 2 3 5-Nt-1 fo f, ft f3 A f, ft fi h f$ f,o fu fa A> f« fn fn fi» fn fn fli fn fn fo ft ft f, h f, f, f$ ?, ft, h ?» fn fn fn f,s ~f*> f« fn Nfi-3 Рис. 4.12. Представление исходного массива чисел fk — ^fk^+ь (^)иегоДПФ fn=fniN2+n2 (б) в виде матриц Для выполнения двумерного ДПФ матрицы размерностью MN чисел требуется в соответствии с выражением D.71) М одно- одномерных ДПФ строк длиной по N элементов каждая, т. е. MN2 операций, и АГ ДПФ столбцов по М элементов, т.е. еще M2N опе- операций. Всего требуется MN2 + M2N = MN (M + N) операций. Для вычисления, например, ФРТ по зрачковой функции, требу- требуется выборка размерности 128x128 чисел. При этом количество операций получается равным 4194304. Необходимо еще учесть при подсчете количества действий вычисление значений еХр [2ш-^-] =cosBn-^-)+*sln Bя-^-). Если принять во внимание, что вычисление каждого косинуса или синуса эквива- эквивалентно нескольким (до 30) элементарным арифметическим дейст- действиям, то общее количество действий вырастает до астрономических размеров. В силу указанных причин ДПФ не находило практически ни- никакого применения в практике вычислений до изобретения в 1965 г. алгоритма так называемого быстрого преобразования Фурье (БПФ), описанного, например, в работах [16, 37] и поз- позволившего во много раз сократить количество вычислений при выполнении ДПФ. Возможность такого сокращения видна из сравнения двумер- двумерного и одномерного ДПФ. Как мы только что показали, для ДПФ матрицы, содержащей MN чисел, требуется MN (М + Af) опе- 186
раций, в то время как для выполнения ДПФ одномерного массива такой же длины MN чисел требуется (MNJ операций, т. е. в MN -¦ , дг- раз больше. Следовательно, сокращение количества вы- вычислений может достигаться путем представления одномерного ДПФ через многомерное. Рассмотрим указанный прием на при- примере представления одномерного массива в виде двумерной мат- матрицы. Естественно, что это возможно только в том случае, если количество N элементов массива не является простым числом, т. е. может быть разложено на множители, например: N = NtN2. Теперь номер k элемента fk в исходном массиве определяется положением этого элемента в матрице, имеющей N± строк и N2 столбцов, а именно номером строки кг = 0, 1, ..., N± — 1 и номером столбца k2 = О, 1, ..., N2 — 1. Нетрудно сообразить (рис. 4.12), что k^k^ + t^. D.72) Аналогично представим и результаты преобразования fn в виде матрицы из N2 строк и N± столбцов. При этом n = n1N2 + n2. D.73) Подставляя формулы D.72) и D.73) в одномерное ДПФ D.70), получим его в виде двумерного ДПФ fin п\- { V V flk к ) схо Г2я!{k2Nl + kl) (niN*+ щ) 1 - 1 2 k=0 k=O N,-1 Г = FkS ехр k1=0 L 2j ь k2=0 kt=O N2-[ S р(^)те1[f(kuk2)expBm^)\ X k1=0 В последнем выражении легко заметить два последовательных ДПФ. Действительно, обозначим N2-\ ъ п2) = ^= J /(*ь ^2)ехр Bш Это есть ДПФ &гй строки матрицы / (k±, k2), составленной из исходного массива fk. Тогда !(пъ п2) = -±= 2 Р{къ п2) ехр Bш'-^) - ДПФЛ1 [F(kly n2)], 1 Л1=0 где ?Фъ п2) - F(^b n2) ехр Bш-^) !87
и окончательно 1К п2) - ДПФЛ1 {ехр Bш *$-) ДПФ*2 [f (kx, *2)]}. D.74) Таким образом, мы представили одномерное ДПФ через дву- двумерное, свернув исходный массив в матрицу / (kly k2). Сначала нужно выполнить ДПФ всех строк этой матрицы, затем умножить преобразованные строки на множители exp [2ni—^-\, где kx — номер строки; п2 — номер элемента в строке, и выпол- выполнить ДПФ всех столбцов получившейся матрицы. Заметим, что при этом в матрице f (nly п2) результатов преобразованный мас- массив fn расположен не так, как в исходной, а как в транспониро- транспонированной по отношению к ней (рис. 4.12). Этот порядок называется инверсным, и для того, чтобы получить обычный порядок распо- расположения, нужно проделать обратную инверсию. Множители иногда называются орнаментирующими коэффи- коэффициентами. Легко подсчитать, что при описанном способе требуется на ДПФ каждой строки N\ операций, а на все строки — N\N\ опе- операций, затем на преобразование N2 столбцов N2N\ операций, т. е. всего N2N1 (N± + N2) = N (N± + N2) операций. Если числа Nx и N2 не простые, то ДПФ строк и столбцов, в свою очередь, можно представить в виде двух последовательных преобразований двумерной матрицы (как говорят «факторизовать» ДПФ) и тем самым еще сократить количество вычислений. В общем случае, если представить N в виде N = Nt X N2 ... ... Л/р, то требуемое количество операций, как можно подсчитать, р равно N Jj Ni% вместо N2, т. е. коэффициент ускорения вычислений (КУВ) равен tf/2 Nt . D.75) t=i Видно, что чем больше множителей содержит N, тем больше выигрыш за счет факторизации ДПФ. Максимальный выигрыш в количестве вычислений получается, если N состоит из небольшого количества наиболее простых сомно- сомножителей—двоек, т. е. представляет собой целую степень двойки (jV = 2р). При этом количество операций получается порядка Np = N\ogtN, а КУВ = А = _^_. В этом случае ДПФ факторизуется на ряд простейших ДПФ пар чисел. Причем ДПФ массива, состоящего из двух чисел, вы- выполняется наиболее просто, так как множители ехр 188
при N = 2 и k, п = О, 1 равны 1 и —1, а именно: 1 при & = 0 или п = 0; F \ 2 / V ' I _1 при & = Я =; 1. рф простейшего БПФ пары чисел показан на рис. 4.13. В узлах графа располагаются элементы входного массива и результаты пре- преобразования, стрелки связывают суммируемые величины, а числа при стрелках указывают коэффициент, на который они умножа- умножаются (единица не указывается). На рис. 4.14 показан для примера граф БПФ для р = 3, по которому легко проследить последова- последовательность преобразований. На этом рисунке использовано обозначение w = ехр BnilN). Благодаря возможности значитель- значительного сокращения количества действий (для Л^ = 1024 = 210, например, КУВ ^100) изобретение БПФ от- крыло широкие возможности практиче- рис# 4.13. Граф БПФ пары ского использования ДПФ для ана- чисел лиза оптического изображения. Выбор N = 2р никак не ограничивает возможностей алгоритма, пос- поскольку всегда последовательность, содержащую другое коли- количество элементов, можно дополнить недостающим количеством нулей. Заметим, что в математическом обеспечении современных ЭВМ почти всегда имеются стандартные программы, реализующие различные модификации БПФ, как одномерного, так и двумерного. Вычисление дифракционных ФРТ и ОПФ при помощи БПФ. Как следует из формул D.2) и D.6), для вычисления ФРТ необ- необходимо выполнить двумерное фурье-преобразование зрачковой функции и возвести результат в квадрат по модулю. Для вычис- вычислений ОПФ необходимо выполнить еще одно преобразование по- полученной ФРТ. Для того чтобы выполнить эти преобразования при помощи БПФ, необходимо представить зрачковую функцию в виде двумерной выборки на прямоугольной сети в декартовых координатах рх и ру с шагами Арх и Ару и размерами Dx = ЛЛ^Д и Dy = Ny&py. Причем так, чтобы количество отсчетов Nx, Ny по каждой координате было бы равно степени двойки. Основ- Основная задача состоит в выборе Арх, Ар^ и NXJ Ny. В начале этого параграфа мы показали, что если шаг выборки удовлетворяет условию X где ць — предельный размер фурье-преобразования зрачковой функции, т. е. размер ФРТ в канонических координатах, то ДПФ является точным. 189
К сожалению, как известно из работ [4, 10, 21 ], ФРТ с учетом дифракции отлична от нуля на всей поверхности изображения, поэтому, строго говоря, % = оо и при любом выборе шагов Дрг, Др^ ДПФ не может дать теоретически точные значения ФРТ, На практике, однако, можно пренебречь областями, содержа- содержащими малую часть энергии ФРТ и считать, что 2% — размеры области, включающей в себя, например, 95 % энергии пятна рас- рассеяния. Полученная при этом погрешность будет невелика. Из опыта следует, что практически в большинстве случаев основная Рис. 4.14. Граф БПФ при N = 2Р для р = 3 энергия ФРТ (95—96 %) содержится в области, размеры которой равны размерам геометрического пятна рассеяния плюс пять канонических единиц, т. е. 2% + 5, D.77) где 2r]g — геометрический размер, в котором без учета дифракции содержится большая часть (95 %) энергии ФРТ. Эта величина мо- может быть оценена с различной степенью точности различными способами. Если, например, считать, что распределение энергии в пятне рассеяния (ФРТ) похоже на гауссову функцию ехр Г— -gL , то 95 % энергии этой функции содержится в диа- диаметре, равном примерно 5ог, где 2а — среднеквадратическая ши- ширина функции. Поэтому можно принять, что: 2r]g = 5 Алскв и 2ть « 5 (Дг]скв + 1), D.78) где Дт|скв — среднеквадратическая величина поперечных аберра- аберраций в канонических координатах. При нахождении Apx. и Ар^ необходимо учитывать способ отображения полученных ФРТ и ОПФ. Если предполагается 190
выводить на АЦПУ карту уровней ФРТ, то шаги Ах' и Ау' в полу- полученной ФРТ в реальных обобщенных координатах должны от- относиться как шаги а и b по столбцам и строкам печатающего по- построчного устройства (АЦПУ). С учетом соотношений B.44) между реальными и каноническими координатами получим: или Из формулы D.68) получаем, что Дрх и Др,; должны находиться в обратном соотношении "'¦ D-79) "К Если же предполагается выводить на АЦПУ карту ОПФ полученной преобразованием ФРТ, то естественно, что Арх и Др^ должны удовлетворять прямому соотношению аА, ЬА'у D.80) где А'х, А у — апертуры. Если обе карты выводятся одновременно, то необходимо соб- соблюсти одновременно оба условия D.79) и D.80), что, очевидно, невозможно в общем случае при аАх Ф ЪА'У. Следовательно, одна из карт будет искажена (трансформирована) в ЬА'и раз. Для избежания этого необходимо одну из карт, например ФРТ, выводить в повернутом на 90° (транспортированном) виде. Тогда для Арх/Др,у необходимо придерживаться соотношения D.80). Как выбрать Nх и NJ? Обратим внимание на то, что в соот- соответствии с формулой D.71) количество точек в ФРТ, полученной посредством ДПФ из зрачковой функции, такое же, как и в по- последней, т. е. Nx и Ny в направлении х и у соответственно. Поэтому шаги Аг^ и Ат]у в канонических координатах, с которыми мы получим после ДПФ выборку ФРТ, равны 2г -; 2г| отсюда Xi y где Аг| — желаемое пространственное разрешение в ФРТ. Как указывалось в § 7, при любых аберрациях дифракционный узор всегда имеет шаг структуры порядка 0,5 канонической единицы и для разрешения этой структуры необходимо иметь шаг выборки по крайней мере в два раза меньше, т. е. Дт) < 0,25. Отсюда же 191
следует, что слишком мелкий шаг не яйляется необходимым й вполне достаточна величина Ац = 0,1, поэтому 0,1 < Ал < 0,25. D.81) Имея rj^ и Arj, мы можем определить количество точек N х и Ny, которые необходимо будет округлять до ближайшей степени двойки. Оценим наименьшие значения Nх и Ny. Наименьший размер ФРТ при отсутствии аберраций равен, в соответствии с формулой D.78) 2ць = 5, наибольший шаг Ат] — 0,25, откуда NA, Ny~^ -Q-^r < %р = 32. Следовательно, минимальный размер выборки при расчете ФРТ и ОПФ методом БПФ составляет 32 X 32. При наличии аберраций (увеличении 2%) или при увеличении раз- разрешающей способности (уменьшении Аг]) этот размер увеличива- увеличивается. Из соображений экономии объема оперативной памяти ЭВМ для хранения выборок и сокращения количества вычислений же- желательно ограничиться максимальной размерностью 128X128, что примерно соответствует количеству символов в строке АЦПУ. Такая выборка может быть отпечатана целиком в виде карты. Принимая этот размер 128x128 в качестве стандартного, полу- получим следующий алгоритм определения шагов выборки Ар* и Ар^ на зрачке. 1. Находим среднеквадратическую величину поперечных абер- аберраций Ат]скв и определяем максимальный размер ФРТ в канони- канонических координатах 2ч\ь по формуле D.78). 2. Принимаем Nx = Nу = N = 128 и находим шаг по ФРТ Лг|, в канонических координатах Ат] = -jogr. Если этот шаг удовлет- удовлетворяет условию D.81), то переходим к следующему пункту, если же нет, то к пункту 5. 3. Находим предварительный шаг по зрачку Ар = -х—- = гх\ь = -г—Т7-. Если вывод на АЦПУ не предусматривается, то находим и окончательные величины Apv = Ару = Ар, а в противном слу- случае переходим к следующему пункту. а Ах 4. Находим коэффициент а = b Ay если карта выво- Ах дится в координатах на изображении или а = -тт-т- , если карта выводится в координатах на предмете. Определяем Apx = = Ар У а и Ар^ = Ар/У а в соответствии с D.80). Находим новые шаги на ФРТ Дг]Л = Др/|/а и Аг\у = АцУа. Если какой-нибудь из них (пусть, например, А)]^ > 0,25), то умножаем Арх и Ар^ на тг^1"» а ^х и ^Лу делим на это отношение. \JfZo 5. Если в результате выполнения пункта 2 получаем, что Ат] > 0,25, то мы должны увеличить объем выборки, т. е. перейти 192
к объему 256x256, 512x512 и т. д. Это, однако, приводит к усло- усложнению программы, увеличению объема памяти и времени рас- расчета. В большинстве случаев, если объема выборки 128x128 не хватает для получения разрешения 0,25 по пятну рассеяния, то нерационально использовать БПФ и вообще рассчитывать дифракционную структуру изображения. В этом случае уже впо- вполне применимо геометрическое приближение в соответствии с § 24 настоящей главы. Если Ац <0,1, то можно уменьшить объем выборки до 64x64 или 32x32, выиграв в скорости расчета, но можно и оставить выбор- выборку 128x128, получив этом ФРТ с излишним при раз- разрешением. На рис. 4.15 показан при- пример расположения выбороч- выборочной сети на каноническом зрачке (узлы, попадающие внутрь зрачка — единичного круга, выделены жирным). Естественно, что в остальных узлах, расположенных вне зрачка, значения зрачко- зрачковой функции, подвергаемой БПФ, равны нулю. Заметим, что при шаге Ац < 0,25, в соответствии с формулой D.68), размер выборочной функции на зрачке Dp =^ = — > 4, т. е. выборка всегда, по крайней мере в два раза, больше зрачка подвергаемая БПФ матрица Рис. 4.15. Расположение выборочной сети 16Х 16 узлов на каноническом зрачке при вычислении ФРТ методом БПФ по размерам и, следовательно, выборки, всегда содержит много нулевых элементов. При БПФ таких матриц можно воспользо- воспользоваться тем, что нулевые строки вообще не надо преобразовывать, а строки, содержащие больше половины нулей, могут преобразо- преобразовываться по так называемому усеченному алгоритму БПФ, опи- описанному в работе [37], дающему существенный выигрыш во времени. На схеме 4.4 показана укрупненно последовательность вычисления ФРТ и ОПФ методом быстрого преобразования Фурье. Особенности расчета полихроматической ФРТ. Для получения полихроматической ФРТ необходимо вычислить несколько мо- монохроматических ФРТ при различных значениях К или %, а затем найти полихроматическую ФРТ по формуле D.5) численным ме- методом интегрирования, в качестве которого рациональнее всего воспользоваться методом Гаусса как наиболее точным. Удовлет- 193
( Начапо J Определение объема N и шагов Дрх,Дрч вы- выборки зрачковой орунм- ции ± Вычисление значений Выборки зрачковой функции• Двумерное 5ПФ ± Вычисление ФРТ I Двумерное БПФ Вычисление ШФ (ЧКХ) и ФИФ чч/2 Отображение МПФиФПФ Отображение ФРТ борительную точность дает метод Гаусса при исполь- использовании пяти узлов в ин- интервале х € (—Ы). В этом случае h где %k и ck — узлы и веса квадратуры Гаусса на стандартном интервале (-1Л). Однако при этом не- необходимо для каждой дли- длины волны (для каждого значения х) иметь свой шаг выборки по зрачку, чтобы на изображении шаги ФРТ Ах' и Ау' в реальных координатах совпадали бы для всех длин волн и значения ФРТ, следовательно, вычисля- вычислялись бы в одних и тех же точках. В соответствии с формулой D.1) получаем, что шаг выборки по зрач- зрачку Ар^, Ар^ для какого- то значения х должен быть равен: С Коней, ) ^ а а лг о лРо и Аро — шаги для Схема 4.4. Укрупненный алгоритм вычисле- х k vy ния ФРТ и ОПФ методом быстрого преобра- X — 0, т. е. ДЛЯ ОСНОВНОЙ зования Фурье длины волны, определен- определенные, как описано в преды- предыдущем разделе. Кроме того, при вычислении выборки зрачковой функции для отличных от нуля х необходимо пересчитать волно- волновую аберрацию на данную длину волны в соответствии с формулой D.1) W = WJL. После того как получена полихроматическая ФРТ, полихро- полихроматическая ОПФ вычисляется методом БПФ по полихроматиче- полихроматической ФРТ так же, как и в монохроматическом случае. 194
В заключение данного параграфа сравним метод БПФ с дру- другими методами вычисления ФРТ и ОПФ, рассмотренными ранее. Во-первых, при объеме выборок 128 X 128, как видно из преды- предыдущего раздела, применение метода ограничивается случаями, когда размеры ФРТ не превышают 2ць < 32 канонических еди- единиц. При больших размерах ФРТ система становится сугубо гео- геометрически-ограниченной. При этом необходимо увеличить объем выборок до 256x256 и более, но трудоемкость метода БПФ сильно возрастает и пользоваться им неразумно. Во-вторых, как показывает практика, метод БПФ обладает несомненным преимуществом перед другими по скорости вычисле- вычислений, когда необходимо получить полную картину ФРТ. Методы численного интегрирования и метод элементарных площадок уступают ему в этом случае. Если же достаточно оценить ФРТ только для какого-то одного сечения, то метод численного интегри- интегрирования, в соответствии с § 23, оказывается более эффективным как в смысле скорости, так и в смысле объема оперативной памяти (метод БПФ здесь дает много лишней информации). Аналогично, ФРЛ и ФКЭ в случае геометрически-ограничен- геометрически-ограниченных систем рациональнее определять в соответствии с алгорит- алгоритмами § 24. В-третьих, при вычислении только ОПФ метод БПФ обычно несколько проигрывает рассмотренным ранее методам по ско- скорости и требует несравнимо большего объема оперативной памяти. В отличие от других методов БПФ при этих затратах дает гораздо больше информации, а именно — полную картину ОПФ для всех частот в сетке узлов 128x128 вместо 10 значений и меридионального и сагиттального направления частот, как другие методы. Но в большинстве случаев для суждения о качестве изображения этой небольшой информации достаточно. В-четвертых, метод БПФ дает слишком крупный шаг по про- пространственной частоте при вычислении ОПФ. Действительно, минимальный шаг в канонических частотах при выборке 128 X 128 равен As = ^ =='з2"> что в Реальных частотах соот- ^тах А' ветствует Av' = -^-. Например, при А1 = 0,25, X = 0,5-103 имеем Av' ^ 16,5 лин/мм. Во многих случаях требуется более мелкий шаг, поэтому приходится увеличивать объем выборки. Таким образом, для вычисления ОПФ при оценке качества изоб- изображения лучше применять другие методы. В тех же случаях, когда вычисление ОПФ или ФРТ производится с целью дальнейшего моделирования работы системы и нужна полная информация об ОПФ, наиболее эффективно в любых случаях использовать именно БПФ.
Глава 5 АВТОМАТИЧЕСКАЯ КОРРЕКЦИЯ И ОПТИМИЗАЦИЯ ОПТИЧЕСКИХ СИСТЕМ Автоматизированное проектирование оптических систем, как было показано в гл. 1, состоит из многократно повторяемых операций синтеза, анализа и оптимизации. Однако, когда го- говорят об автоматическом расчете оптических систем, часто имеют в виду только программы синтеза и оптимизации. Синтез является эвристической операцией. Его алгоритмы разработаны лишь для простейших типов оптических систем и сугубо объектно-ориентированы, т. е. специфичны для каждого синтезируемого типа, поэтому программы синтеза в литературе по оптике, например в работах [19, 30], часто называют специа- специализированными программами автоматического расчета оптиче- оптических систем. В процессе синтеза редко удается получить окон- окончательную конструкцию. Синтезированные системы удовлетворя- удовлетворяют только небольшому количеству основных требований, поэтому почти всегда необходима последующая оптимизация. Благодаря этому в оптике получили наибольшее распро- распространение так называемые универсальные методы автоматического расчета оптических систем или точнее — методы автоматической оптимизации, рассмотренные в многочисленных работах [5, 7, 8, 9, 19, 30, 33, 35, 38, 41, 43—46, 49—55]. Математический аппарат оптимизации является объектно- инвариантным. Однако оптимизация требует предварительного синтеза начальной конструкции, поэтому синтез и оптимизация не конкурируют между собой, а дополняют друг друга. § 26. ОПТИМИЗАЦИОННАЯ МОДЕЛЬ ОПТИЧЕСКОЙ СИСТЕМЫ И ЗАДАЧА ОПТИМИЗАЦИИ Как мы уже говорили в гл. 1, для того чтобы сделать методы оптимизации объектно-инвариантными, необходимо выделить спе- специфику оптимизируемого объекта посредством такого понятия, как оптимизационная модель. Оптимизационная модель оптической системы — это сово- совокупность математических понятий, описывающих ее как объект оптимизации, а также соотношений, связывающих эти понятия. Основными компонентами оптимизационной модели являются 196
параметры оптимизации, оптимизируемые функции, критерий оп- оптимизации, ограничения и связывающие их соотношения — проба и проба производных. Успех оптимизации определяется совместно двумя факто- факторами — выбором оптимизационной модели и выбором математи- математического аппарата оптимизации этой модели. Причем часто при плохой оптимизационной модели бессильны даже самые сложные методы оптимизации и, напротив, удачная модель может успешно оптимизироваться простыми методами. Параметры оптимизации. Хотя в процессе оптимизации изме- изменяются конструктивные параметры оптической системы, нельзя отождествлять их с параметрами оптимизации. Во-первых, не все конструктивные параметры могут меняться; во-вторых, часто используются не непосредственно конструктивные параметры как таковые, а связанные с ними величины, например, углы нулевого луча; в-третьих, изменения нескольких конструктивных пара- параметров могут быть связаны между собой определенным законом и, наконец, в-четвертых, различные конструктивные параметры имеют различные физические размерности. Определим параметры оптимизации как некоторые безразмер- безразмерные величины, которым можно в процессе оптимизации придавать любые значения, однозначно определяющие конструкцию оптиче- оптической системы. Безразмерность достигается делением соответству- соответствующих конструктивных параметров на свои масштабы. Так как для оптимизации все параметры по смыслу одинаковы, то их удоб- удобно объединить в вектор параметров х, состоящий из п элементов; т. е. хт - (х19 хъ ..., хп). Элементы этого вектора можно рассматривать как координаты некоторой точки в л-мерном пространстве параметров. Следо- Следовательно каждой конструкции оптической системы соответствует определенная точка в пространстве параметров и наоборот. Движение в пространстве параметров, т. е. изменение вектора х, в то же время означает изменение конструкции оптической системы. Масштабы конструктивных параметров определяют так назы- называемую метрику в пространстве параметров. От выбора масштабов зависит сходимость некоторых методов оптимизации. Понятие век- векторного пространства параметров позволяет сделать изучение аппарата оптимизации значительно более наглядным. При выборе параметров оптимизации необходимо стремиться к тому, чтобы оптимизируемые характеристики оптической си- системы зависели бы от них как можно более линейно, так как в этом случае сходимость оптимизации максимальна. Для некото- некоторых методов оптимизации желательно, чтобы параметры были бы разделены, т. е. чтобы каждый из них независимо влиял бы на свою оптимизируемую характеристику. Чаще всего в качестве параметров используются значения кри- кривизны поверхностей р/с, коэффициенты несферических поверхно- 197
стей в2, ciky bk и осевые расстояния dk в соответствии со следующими формулами: vh В CLb bb db /p-iv V. -— * Y. : . * Y. ; * Y. * Y. ; I К 1 j где бр^, бе2, ..., Ык — масштабы. Использование вместо значений кривизны радиусов ги = pkl нерационально, так как их изменения существенно более нели- нелинейно связаны с изменением характеристик. Иногда вместо pk в качестве параметров используют углы ak нулевого луча с осью системы. По известным аь осевым расстоя- расстояниям dk и показателям преломления nk можно найти значения кривизны рА, если задана высота hx нулевого луча на первой по- поверхности Р*- hk(nh+1-nk) ' E'2) где hk = hk_x — akdk-i- Преимущество использования ak заключается в том, что, не включая в параметры оптимизации первый аг и последний ар+1 углы, а при необходимости и некоторые промежуточные углы aki мы автоматически сохраняем в процессе оптимизации фокусное расстояние системы (при аг = 0), увеличение (при ах =j= 0), теле- скопичность внутри системы и т. д. Недостатком этого приема является то, что при близких значениях показателей преломле- преломления nk+1 и nk или малых значениях hk небольшая разность в углах ak и ak+1 приводит к большим значениям pky т. е. к резкому изменению конструкции системы. Следовательно, в таких случаях изменения параметров ak и ak+1 не могут быть независимыми. В качестве параметров оптимизации могут использоваться также расстояние до апертурной диафрагмы dd и задний отрезок % определяющий положение плоскости наилучшей установки. Использование параметров оптических стекол для оптимиза- оптимизации имеет свои особенности. Согласно § 9, можно взять в качестве параметров оптимизации коэффициенты дисперсионной формулы B.83). Однако поскольку обычно оптическая система работает в значительно более узком интервале длин волн, чем охватывае- охватываемый формулой B.83), более правильно принять за параметры оптимизации какого-либо стекла коэффициенты разложения его показателя преломления по ортогональному базису от канони- канонической спектральной координаты х» определенной в соответствии с формулой B.22). В этом случае показатель преломления &-го стекла определяется следующей формулой: Ъ (X) ^ ПокРо (X) + "i/i (X) + пчР2 (х) + • • •, E.3) где Ро (х) = 1, Р\ (х), Р* (х) — полиномы, ортогональные на отрезке (—1,1) с весом q (%). 198
Для целей оптимизации обычно достаточно трех коэффициен- коэффициентов ЛоЛ, ti\k, ti2k. Коэффициент n§k влияет на монохроматические аберрации системы, ri\k — на «первичный хроматизм», п2, — на «вторичный хроматизм». Использование стекол для оптимизации осложняется тем об- обстоятельством, что в реальной конструкции параметры nOi пъ п2 могут принимать значения из ограниченного набора, определяе- определяемого каталогом стекла, причем возможные значения параметров распределяются в пространстве неравномерно, как показано на рис. 5.1. Для того чтобы в процессе оптимизации гараметры не вышли далеко за область, охватываемую каталогом, необходимо вводить ограничения, описывающие контур этой области. Таким образом, оптимизация с использованием параметров стекол всегда предполагает наличие ограничений. Оптимизируемые функции и оценочная функция. Целью опти- оптимизации является достижение наилучшего качества оптимизиру- оптимизируемой системы. Пусть мы имеем некоторый набор характеристик иъ и2у ..., иту определяющий это качество. В него могут входить самые разнообразные характеристики, например, увеличение, задний отрезок, положения зрачков, аберрации в том или ином представлении, характеристики качества изображения и другие, а также различные их комбинации. Характеристики имеют различный физический смысл, размер- размерность и различные цели оптимизации, причем одни необходимо приблизить к заданным значениям, другие сделать как можно меньшими или как можно большими по абсолютной величине. Для того чтобы придать им более однородный и удобный для опти- оптимизации вид, преобразуем все характеристики следующим обра- образом. Во-первых, приведем их к такому виду, чтобы целью оптими- оптимизации во всех случаях было бы получение как можно более близ- близких к нулю значений, во-вторых, поделим все характеристики на некоторое масштабы, имеющие ту же физическую размерность. В результате получим безразмерные нормированные величины — оптимизируемые функции ft в виде f ___ щ — щ E.4) U ~ Ьщ ' где uh uh Ьщ — текущее значение, заданное значение и масштаб какой-либо характеристики (если щ должны принимать, как мо- можно большие по модулю значения, то вместо них можно взять об- обратные величины u~il). Выбор масштабов Ьщ преследует цель не только сделать все функции безразмерными и однородными по содержанию, но и при- придает тот или иной вес данной функции в общем наборе. Чем меньше масштаб Ьщ, тем больше функция Д и тем больший вес она имеет в процессе оптимизации. Следовательно, назначение масштабов может существенным образом повлиять на ход и ре- результат оптимизации. 199
Рис. 5.1. Расположение оптических стекол в пространстве параметров, по осям которого отложены коэффициенты п0 и % разложения показателя преломления по полиномам Лежандра на интервале X ? @,4; 0,7)
Итак, оптимизируемыми функциями мы будем называть без- безразмерные величины fiy i = 1, ..., m, связанные однозначно с ха- характеристиками качества оптимизируемой системы, а также зави- зависящие от параметров оптимизации и преобразованные к такому виду, что в процессе оптимизации желательно как можно более приблизить эти функции к нулю. Так же, как и параметры, объединим все функции в т-мерный вектор f. Как следует из сказанного выше, все функции зависят от параметров xh т. е. // = // fa, ..., хп), i = 1, ..., т или в матричном (векторном) виде f-f(x). Будем считать, что эти зависимости являются однозначными и непрерывными. Отметим, что по своему характеру они в общем случае нелинейны. Если бы все функции /> линейно зависели от всех параметров xh то задача оптимизации решалась бы триви- тривиально. Чем более нелинейны зависимости f (x), тем сложнее опти- оптимизация. Если бы заранее было известно, что существует точка в про- пространстве параметров, в которой вектор функций равен нулю, то задача оптимизации свелась бы к поиску этой точки, т. е. к реше- решению системы нелинейных уравнений, f(x) = o. E.5) В большинстве случаев, однако, нельзя заранее гарантировать существование этого решения. В таком случае задача его поиска некорректна. Также некорректно требование нахождения всех функций в заданных интервалах, определяемых величиной до- допусков 6Д, т. е. задача решения системы нелинейных неравенств |Мх)|<6Д., f=l,...,m. E.6) Более общий характер имеет задача поиска в пространстве параметров точки, в которой вектор функций ближе всего к нулю. Такая точка всегда существует и поэтому постановка задачи кор- корректна, но при этом нам необходимо ввести критерий близости вектора f к нулю. Этот критерий в оптимизации называется оце- оценочной или целевой функцией. Наиболее простым и удобным критерием является оценочная функция в виде квадрата длины вектора f, т. е. суммы квадратов оптимизируемых функций т cpHlff = fTf = 2;/i E-7) Более сложные виды оценочной функции в большинстве слу- случаев могут быть сведены к формуле E,7) соответствующей моди- модификацией оптимизируемых функций, поэтому в дальнейшем без 201
потери общности мы будем использовать оценочную функцию вида E.7) и добиваться соответствия ее истинным целям оптими- оптимизации надлежащим Еыбором оптимизируемых функций. Целью оптимизации при введении оценочной функции вида E.7) является поиск в пространстве параметров точки xmln, в которой дости- достигается минимум ср. Так как ф в формуле E.7) — неотрицательная величина, то она всегда имеет минимум. Следовательно, искомая точка xmin всегда существует. Оценочная функция в соответствии с выражением E.7) опре- определяется через оптимизируемые функции, которые являются функ- функциями от параметров, поэтому в конечном итоге оценочная функ- функция ф есть функция от х, т. е. Ф = fTf = Ф (f) = Ф [f (x)l = ф (х). E.8) В связи с этим можно прийти к заключению, что понятие опти- оптимизируемых функций / (х) является излишним и можно рассма- рассматривать задачу оптимизации непосредственно как поиск в про- пространстве параметров минимума некоторой оценочной функции Ф (х), зависящей непосредственно от параметров х. Именно таким образом рассматривается задача в общематема- общематематической литературе по оптимизации [1 ]. В оптике, однако, тради- традиционно принято понятие оптимизируемых функций и оценочной функции, выражаемой через них в виде E.7). Такое казалось бы усложнение задачи имеет и существенные преимущества, которые будут ясны в дальнейшем. Очевидно, что выбор оптимизируемых функций кардинальным образом влияет на ход и результат оптимизации. Оптимальный выбор должен отвечать следующим основным требованиям, предъ- предъявляемым вообще к математическим моделям и рассмотренным в гл. 1. 1. Так как целью конструктора является получение наилуч- наилучшего качества изображения, а целью оптимизации — нахождение минимума оценочной функции E.7), необходимо, чтобы эти две цели соответствовали друг другу. Основное требование состоит в подборе таких оптимизируемых функций, сумма квадратов ко- которых как можно лучше коррелировала бы с критерием качества изображения (требование адекватности). 2. Ввиду того, что скорость оптимизации сильно замедляется при нелинейном характере зависимостей f (x), желательно, чтобы оптимизируемые функции как можно более линейно зависели бы от параметров (требование простоты, соблюдение которого зависит также и от выбора параметров оптимизации). 3. Так как затраты на оптимизацию прямо пропорциональны трудоемкости вычисления значений функций f при определенном значении параметров х, желательно иметь такие функции, для получения значений которых требовалось бы как можно меньше вычислений (требование экономичности). 202
Нетрудно заметить, что эти требования трудно совместимы, поэтому задача выбора оптимизируемых функций весьма сложна и не может считаться решенной. Наиболее простой и часто используемый способ основан на включении в оптимизируемые функции в соответствии с формулой E.4) всех тех характеристик оптической системы, которые обы- обычно контролируются при неавтоматизированном проектировании. При этом в качестве характеристик выбирают гауссовы величины (увеличение, задний отрезок, положение зрачков), суммы Зейделя и аберрации третьего порядка, аберрации небольшого, заданного конструктором набора реальных лучей. При таком выборе более или менее выполняются условия про- простоты и экономичности, но оценочная функция не имеет связи с критериями качества изображения и служит только «гидом» процесса оптимизации, т. е. первое и наиболее важное требование адекватности не соблюдается. Именно этим объясняется иногда встречающееся у оптиков скептическое отношение к понятию оценочной функции при оптимизации вообще. Для устранения этого недостатка иногда в качестве оптимизи- оптимизируемых функций выбираются волновые или поперечные аберрации большого количества (до 1000) лучей в каждом пучке, равномерно распределенных по зрачку. Оценочная функция при этом стано- становится приблизительно пропорциональной среднему квадрату вол- волновых или поперечных аберраций по формулам B.65) или B.66). Такой выбор, однако, требует расчета большого количества лу- лучей и, следовательно, не удовлетворяет требованию экономич- экономичности. Для сокращения количества лучей можно воспользоваться методом аппроксимации аберраций, рассмотренным в гл. 3. При этом оптимизируемые функции наиболее рационально связать с церниковскими глобальными полихроматическими коэффици- коэффициентами разложения B.81) волновой аберрации по ортогональному базису в соответствии со следующей формулой ft = own J/^/coW/i, E.9) где со/, (о^, @2л — нормы ортогональных полиномов. Методы аппроксимации позволяют определить значения коэф- коэффициентов cijkn по результатам расчета сравнительно небольшого количества лучей. Оценочная функция E.7), как нетрудно видеть из формулы B.79), в этом случае представляет собой средний квад- квадрат волновой аберрации. Несколько видоизменив выражение E.9), можно получить оптимизируемые функции, дающие оценоч- оценочную функцию в виде среднего квадрата поперечных абер- аберраций. Рассмотренный выбор оптимизируемых функций вполне удов- удовлетворяет требованиям простоты и экономичности, но оценочная функция, равная среднему квадрату волновых или поперечных аберраций, не всегда достаточно адекватна критериям качества 203
изображения. Для устранения этого недостатка возможны сле- следующие пути. Во-первых, использовать в качестве оценочной функции непо- непосредственно критерий качества изображения. Из работ [10, 21] известно, что наиболее обоснованным критерием является инте- интеграл от квадрата модуля ОПФ, в соответствии со следующей фор- формулой: jjdv. E.10) Здесь Ф (v) весовая функция или функция задачи, зависящая от вида объекта и назначения прибора. Чем больше критерий /С, тем лучше качество изображения данной точки предмета. Заменяя интеграл суммой, а квадрат мо- модуля ОПФ \D (v)|2 представляя в виде Re2 ID (v)] + Im2 [D (v)], получим оптимизируемые функции, сумма квадратов которых при- приблизительно пропорциональна критерию E.10): ft - Re [D К)] Ф (V/); fi+1 = Im [D (v,)] Ф (v,), где V/ при / = 1, 2,... — некоторый набор пространственных частот в рабочем интервале. Таким образом, оптимизируемые функции для данной .точки предмета есть значения вещественной и мнимой частей ОПФ на различных пространственных частотах V/ с весами Ф (V/). Для всей системы оптимизируемые функции составляются из функций отдельных точек предмета с учетом весов этих точек. Заметим, что в процессе оптимизации необходимо искать в этом случае не минимум, а максимум системы оптимизируемых функций, что несущественно меняет аппарат оптимизации. Такие функции использованы в некоторых программах, описанных в работе [50], и привлекают своим полным соответствием критерию качества изображения, т. е. соблюдением требования адекватности. Однако требования экономичности здесь совершенно не выполняются, так как вычисление ОПФ, как мы видели в гл. 4, требует гигант- гигантского количества операций. Кроме того, ОПФ гораздо более нелинейно зависит от параметров р, d, n, чем аберрации. Второй, наиболее перспективный путь заключается в эмпири- эмпирическом подборе оптимизируемых функций, связанных с аберраци- аберрациями лучей простыми линейными соотношениями, но тем не менее обеспечивающих лучшую корреляцию между оценочной функцией E.7) и критерием качества изображения. В общем виде такие опти- оптимизируемые функции можно представить формулой f-Tb, E.11) где b — вектор, составленный из аберраций небольшого набора лучей; Т — некоторая матрица, выбор которой должен обеспечи- обеспечивать соблюдение требования адекватности. Например, часто встречающиеся большие значения поперечных аберраций на краю 204
зрачка («хвосты» на графиках поперечных аберраций) вносят большой вклад в оценочную функцию, представленную в виде суммы квадратов аберраций, и в первую очередь устраняются за счет увеличения аберраций в средних зонах зрачка. В то же время известно, что для достижения высокой разрешающей спо- способности иногда полезно оставить «хвосты», но уменьшить абер- аберрации на остальной части зрачка. Это легко достигается уменьше- уменьшением веса аберраций лучей краевых зон зрачка или вообще исклю- исключением их из набора, что позволяет также уменьшить количество лучей. В формуле E.11) этому со- соответствуют малые значения эле- элементов матрицы Т, относящиеся к аберрациям краевых лучей. Заметим в заключение, что иногда применяются эмпирически подобранные оптимизируемые функции, удовлетворяющие требо- требованию адекватности и достаточно просто, но нелинейно связанные с аберрациями лучей. Например: I „Проба" где б 1,22Х, E-12) — размер диска Эри. Рис. 5.2. Связь пространств па раметров и функций В процессе оптимизации оце- оценочную функцию необходимо мак- максимизировать. При таком выборе не соблюдается требование линейной связи функций с парамет- параметрами и поэтому затрудняется оптимизация. Проба функций. Для исследования зависимости f (x) в про- процессе оптимизации мы должны иметь возможность при любых значениях параметров х получить значения функций f. Про- Процесс такого вычисления назовем пробой функций в данной точке х пространства параметров или сокращенно просто пробой. Проба, таким образом, дает нам возможность установить связь между пространствами параметров и функций в прямом направлении от х к f, как показано на рис. 5.2. Проба, в сущности, представ- представляет собой операцию анализа при оптимизации. Для ее выполне- выполнения мы должны: во-первых, перейти от значений параметров оп- оптимизации к конструктивным параметрам, во-вторых, произвести через оптическую систему с этими конструктивными параметрами расчет необходимого количества лучей и определить нужные харак- характеристики системы, пользуясь математическим аппаратом гл. 3, 4, и затем перейти от значений характеристик к значениям оптими- оптимизируемых функций. Структура пробь. для оптических систем показана на рис. 5.3. Проба при оптимизации оптических систем отличается значительной трудоемкостью. 205
Проба производных. Наиболее мощные методы оптимизации построены на использовании частных производных от оптимизи- оптимизируемых функций по параметрам, т. е. матрицы Якоби функцио- функциональной зависимости f (x), представленной в виде = 1,...,/и; /= E.13) где /-я строка матрицы А состоит из производных 1-й оптимизиру- оптимизируемой функции по всем параметрам, а /-й столбец — из производных всех функций по /-му параметру. Пара- Параметры оптими- оптимизации х Переход от пара- параметров оптимиза- оптимизации к конструк- конструктивным параметрам Расчет нулевых и действительных лучей и определение аберраций, а также других характеристик оптической системы Формирование вектора on тим изир уемых функций f и вычисление оценочной функции Ф = fTf f,q> Рис. 5.3. Схема алгоритма проба при оптимизации В гл. 3 мы рассматривали способы вычисления производных от характеристик оптических систем по конструктивным парамет- параметрам. Так как параметры оптимизации однозначно связаны с кон- конструктивными параметрами, а оптимизируемые функции — с ха- характеристиками, мы можем, пользуясь одним из рассмотренных в гл. 3 методов, вычислить элементы этой матрицы. Чаще всего используется внешняя проба производных, осно- основанная на численном дифференцировании. При этом, как следует из § 19, алгоритм вычисления производных не зависит от физи- физического смысла параметров оптимизации х и оптимизируемых функций f. Этот алгоритм включает в себя последовательное из- изменение параметров оптимизации на небольшие величины 8xj и выполнение проб в полученных точках (см. схему 3.9). В данном случае под х нужно понимать параметры оптимизации, а под f — оптимизируемые функции. Такой процесс вычисления элементов матрицы А не связан с конкретным содержанием пробы и оптими- оптимизационной модели. Он пригоден для оптимизации любых объектов, т. е. внешняя проба производных относится к аппарату оптими- оптимизации, а не к оптимизационной модели. Как следует из § 19, для получения матрицы Якоби внешней пробой производных требуется выполнить п или 2/г проб, т. е. внешняя проба произ- производных отличается значительной трудоемкостью. Если понятия оптимизируемых функций не используются, то внешняя проба производных при затратах п или 2п проб позволяет 206
получить вектор первых производных оценочной функции по параметрам, т. е. вектор градиента оценочной функции ср в виде Как мы увидим далее, при применении наиболее мощных ме- методов оптимизации используют матрицу вторых производных оце- оценочной функции — матрицу Гессе VVT(P = \дхдх- ) * ^ля получения матрицы Гессе непосредственно при помощи внешней пробы производных без использования понятий оптимизируемых функций, как нетрудно заметить, требуется п ( ^ проб. Такое большое количество проб делает в этом случае применение методов, использующих матрицу Гессе, практически нереальным. Если же рассматривать промежуточные понятия оптимизируемых функций f и определять оценочную функцию в виде E.7), то, как мы покажем далее, градиент \ц> и матрица Гессе VVT(P легко определяются через вектор f и матрицу А следующими выражениями: Vcp-2ATf; vVT(P^2ATA. E.15) Так как при внешней пробе производных для вычисления мат- трицы А требуется п или 2я проб, то использование понятий оп- оптимизируемых функций и определение ф в виде E.7) позволяет п+ 1 существенно в —^— раз сократить время на вычисление матрицы Гессе оценочной функции. Менее трудоемкой является внутренняя проба производных, ос- основанная на аналитическом дифференцировании соотношений, составляющих сущность пробы. Внутренняя проба производных есть уже часть оптимизационной модели, и ее содержание опреде- определяется этой моделью. Недостатками аналитических методов явля- являются: сложность алгоритма, отсутствие универсальности и при- приближенный характер некоторых производных. При использова- использовании внутренней пробы производных элементы вектора градиента \7ф и матрицы Гессе wT(P могут вычисляться аналитически и это обычно не приводит к большим дополнительным затратам по сравнению с вычислением матрицы А. Поэтому при внутренней аналитической пробе производных использование понятий опти- оптимизируемых функций f не является необходимым и не имеет пре- преимуществ перед непосредственной оптимизацией оценочной функ- функции ф (х) как функции от параметров. Ограничения при оптимизации. До сих пор мы рассматривали задачу оптимизации во всем пространстве параметров, не наклады- накладывая никаких ограничений на возможные изменения параметров. Такая оптимизация называется безусловной. Часто решение, по- полученное методами безусловной оптимизации, не удовлетворяет требованиям конструктивной или физической реализуемости. 207
Например, могут быть получены отрицательные значения рас- расстояний между поверхностями в оптической системе, слишком большие толщины линз и т. д. Все это приводит к необходимости ввести ограничения, которые в общем виде могут быть выражены через некоторые функции от параметров оптимизации (аналогично оптимизируемым функциям) в виде: b(x) = (Mx)); e (х) = (<?, (х)). E.16) Эти функции могут быть как линейными, так и нелинейными. В результате оптимизации значения функций е (х) (ограничений типа равенств) должны быть равны нулю, а значения функций b (x) (ограничений типа неравенств) должны быть больше или ра- равны нулю, е(х)=*о; Ь(х)>о. E.17) Будем считать, что функции ограничений отмасштабированы и безразмерны, так же как и оптимизируемые функции. Причем величины масштабов служат весами соответствующих ограниче- ограничений. Ограничения типа неравенств определяют в пространстве пара- параметров некоторую область Q#, в которой должна находиться иско- искомая оптимальная точка. Можно выделить два вида неравенств. Первый — это математические ограничения, описывающие об- область существования оптимизируемых функций f (x). При наруше- нарушении хотя бы одного из них мы не можем вычислить значения f в данной точке х. К таким ограничениям относятся: условия по- попадания всех лучей на поверхность и преломления без полного внутреннего отражения, записанные, например, в форме C.64). Второй вид — это физические или конструктивные ограничения. К ним относятся: ограничения максимальной и минимальной тол- толщины линз, величины воздушных промежутков, ограничения на параметры стекол, на общую длину системы, на величины заднего отрезка и положения зрачков и другие, записанные, например, в следующем виде: 6d ^rnax — / Ограничения типа равенств уменьшают размерность простран- пространства параметров на количество ограничений s. Таким образом, фактически поиск оптимума ведется в пространстве не п, а п — s измерений. Отсюда следует, что количество ограничений типа равенств не должно превышать количества параметров оптими- оптимизации. К ограничениям этого типа могут относиться условия ра- равенства заданным значениям увеличения, положения зрачков и других характеристик, условия телескопичности или телецентрич- ности в каком-либо пространстве и т. д. 203
Заметим, что часто перечисленные условия не включают в ог- ограничения, а относят к оптимизируемым функциям. К ограниче- ограничениям типа равенств можно отнести также связи между параметрами оптимизации. Последние довольно часто возникают в процессе оптимизации, например при оптимизации зеркальных и зеркаль- зеркально-линзовых систем, когда одна и та же физическая поверхность или среда появляется в конструктивном описании несколько раз (см. § 12), а также, когда при оптимизации желательно сохранить пропорциональность отдельных частей оптической системы. При этом значения конструктивных параметров или их изменений в про- процессе оптимизации связаны между собой соотношениями вида: xt = niifXj или Axi = mijAxj, E.18) где гпц — коэффициенты связи. Связи, требующие постоянства расстояния между какими- либо поверхностями, включают в себя параметры оптимизации, определяющие осевые расстояния в следующей форме: 4 + 4+1+•¦• +dl+k = c. E.19) Особенностью перечисленных связей является линейность по отношению к параметрам. Такие связи достаточно легко кон- контролируются в процессе оптимизации. К нелинейным связям относятся связи концентричности. Например, если 1-я и (/ + р)-я поверхности должны оставаться концентричными другу другу в процессе оптимизации, то параметры оптимизации xk и xh пропорциональные их кривизнам р,- и pi+p, связаны следующим равенством: - (d, + • • • + df+p-i)]6p7+P- E.20) Нелинейность связей сильно осложняет их контроль при опти- оптимизации. Заметим, что при наличии связей между параметрами можно не включать их в ограничения типа равенств, а возложить обра- обработку связей на алгоритм пробы, а именно на блок перехода от параметров оптимизации к конструкции (рис. 5.3). При таком способе из всех конструктивных параметров, участвующих в оп- оптимизации, выбираются свободные и только они включаются в па- параметры оптимизации. Остальные же параметры выражаются через свободные посредством уравнений связи E.18)—E.20). Таким образом, количество параметров оптимизации получается меньшим, чем количество изменяемых конструктивных параметров, на число уравнений связи. Оптимизатор имеет дело уже только со свободными параметрами без ограничений. При этом вид связей и их нелинейность никак не влияют на их контроль. Рассмотрен- Рассмотренный способ введения связей удобно применять при внешней пробе производных, так как при этом уменьшаются размерности матрицы производных А, градиента \7ф и матрицы Гессе VVT(P> a также 209
количество проб, необходимых для их получения методом конечных разностей. Такой прием, однако, не годится при внутренней аналитиче- аналитической пробе производных, поскольку здесь производные аберраций вычисляются отдельно по всем конструктивным параметрам, встречающимся по ходу луча. В этом случае в оптимизацию вклю- включаются все конструктивные параметры, которые могут изменяться (несмотря на наличие связей), а связи вводятся в виде ограничений типа равенств, т. е. задача обработки связей ложится на оптими- оптимизатор. Итак, мы рассмотрели основные компоненты оптимизационной модели оптической системы. Построить оптимизационную мо- модель — это значит определить параметры оптимизации, оптимизи- оптимизируемые функции, функции ограничений, структуру алгоритмов проба и проба производных. Задача оптимизации построенной модели заключается в поиске в пространстве параметров точки минимума оценочной функции в пределах области, определенной ограничениями, при помощи алгоритмов пробы и пробы произ- производных. Практика показывает, что рационально проводить оптими- оптимизацию в несколько стадий, усложняя и модифицируя от стадии к стадии оптимизационную модель. Сначала достаточно включать в оптимизируемые функции небольшое количество тщательно отобранных характеристик в виде E.4) и конструктивных ограни- ограничений. При этом возможно кардинальное изменение конструкции оптической системы. В этом случае выгоднее применять внешнюю пробу производных. На заключительных стадиях в качестве функ- функций рационально использовать аберрации в виде E.11), внутрен- внутреннюю пробу производных, а условия равенства увеличения и ра- равенства других характеристик заданным значениям вводить как ограничения типа равенств. Заметим, что выбор оптимизационной модели отличается значительной эвристичностью. § 27. ОБЩИЕ ПРИНЦИПЫ ОПТИМИЗАЦИИ В общем случае не существует точных аналитических методов решения поставленной задачи оптимизации, поэтому поиск ми- минимума оценочной функции всегда строится как итерационный процесс последовательных приближений к минимуму, состоящий из ряда повторяющихся шагов, при этом конечное состояние предшествующего шага является начальным для последующего. В силу этого достаточно описать один шаг оптимизации, чтобы ясен был весь ход процесса. Итерационное повторение шагов заканчивается, когда изменение состояния от шага к шагу ста- становится пренебрежимо малым. Прежде чем перейти к изложению различных методов оптими- оптимизации, полезно вспомнить некоторые важные понятия, обратив внимание на то, что оценочная функция образует в пространстве параметров скалярное поле, 210
срЩ(р-80 Рис. 5.4. Пример линий уров- уровня оценочной функции Основные свойства оценочной функции в пространстве пара- параметров. Полезным понятием является поверхность уровня, на которой оценочная функция постоянна. Уравнение этой поверх- поверхности имеет вид Ф (х) = с. Меняя значение константы с, мы получаем различные поверх- поверхности уровня. Через каждую точку пространства проходит одна поверхность уровня, причем поверхности уровня никогда не пере- пересекаются. В двумерном пространстве, легко изображаемом графи- графически, поверхности уровня выро- вырождаются в линии, подобные пока- показанным на рис. 5.4. При переме- перемещении по поверхности или линии уровня оценочная функция не изме- изменяется, а при движении в направле- направлении, пересекающем поверхность уровня, она меняется, причем бы- быстрее всего в направлении, перпен- перпендикулярном поверхности. Это на- направление и скорость изменения определяются в каждой точке век- вектором градиента оценочной функ- функции уф, выражаемым формулой E.14). По определению градиента изменение оценочной функции dcp при изменении координат точки х на бесконечно малую вели- величину dx равно скалярному произведению dx на уф, т. е. d(p = dxT\q) = (уф)т ^х- E.21) Как мы уже говорили, направление градиента совпадает с нор- нормалью к поверхности уровня (рис. 5.4). В точке минимума оценоч- оценочной функции вектор градиента равен нулю \7Ф (xmm) =* °- E.22) В пространстве двух переменных оценочная функция образует рельеф, который подобен рельефу неровной местности (рис. 5.5). При этом линии уровня аналогичны линиям равных высот или глубин, изображаемым на географических картах. Минимумы оце- оценочной функции соответствуют «ямам» на местности, максимумы — «холмам», а задача оптимизации формулируется как поиск самой глубокой ямы. Такая географическая аналогия и соответствующие понятия: ямы, долины, овраги, хребты, спуск, подъем — широко применяются благодаря наглядности при описании процесса опти- оптимизации. Рассмотрим линейную модель fL (x) реальной оптимизируемой системы функций f (x), которая получается из двух членов разло- 211
жения функции Д- (х) в ряд Тейлора в окрестности какой-либо точки х = х0: или /=1 h (х) = fо + А (х - х0) - fо + А Ах, E.23) где f0 = f (хо) — вектор значений функций в точке х = х0; А — (-^~L) — матрица Якоби в этой точке; Ах = х —х0. В некоторой окрестности QL точки х0 поведение реальной системы функций f (x) практически ничем не отличается от ли- линейной модели E.23). Эта окрестность называется об- областью линейности. Чем ближе реальная система к линейной, тем больше раз- размеры области линейности. Ценность линейной моде- модели E.23) заключается, во- первых, в простоте ее мате- математического анализа, а во- вторых, в том, что только такую модель мы можем по- построить, проделав в точке х0 пробу для определения век- вектора f0 и пробу производ- Рис. 5.5. Рельеф оценочной функции ных Для получения матри- матрицы А. Информации для по- построения модели более высокого порядка обычно не имеется. Рассмотрим оценочную функцию линейной модели, т. е.: <Pl = fIfl = (fo + A Ax)T (fо + A Ax) - = ffjffo + 2 AxTATf0 + AxTATA Ax. E.24) Сравним ее с разложением оценочной функции в ряд Тейлора в окрестности точки х = х0 (с использованием трех членов ряда); ср (х) ^ ф (х0) + Ахтуф + 4" A*TvvTcp дх* E>25) Очевидно, что в пределах области линейности имеем Фо =* ф (х0) = fJf0; \7ф = 2ATf0; \\/Тц = 2АТА. Таким образом, мы получили выражения, связывающие уф и \\т(р с f0 и А в области линейности. В дальнейшем для удоб- удобства введем следующие обозначения: g 212 Уф = ATf; g0 --- -у (х0) = ATf0; Н = -^ = АТА E.26)
и будем называть g градиентом, а Н — матрицей Гессе (причем go — градиент в точке х = х0). Как видно из формулы E.24), оценочная функция в области линейности есть квадратичная форма от вектора параметров х. Если выразить ее через ф0, g0, Н, то она будет иметь следующий вид: Фх, (х) - Фо + 2 AxTg0 + АхтН Ах. E.27) Нетрудно показать, что поверхности уровня оценочной функции в области линейности есть концентричные эллипсоиды, общий центр которых х*. является минимумом квадратичной сферы E.27). Форма эллипсоидов определяется матрицей Гессе Н, причем Рис. 5.6. Линии уровня оценочной функции в области ли- линейности: а, б — в случае разделенных параметров; б, г — в случае связанных параметров орты главных осей совпадают с собственными векторами ма- матрицы Н, а длины полуосей обратно пропорциональны корням из собственных чисел Ц матрицы Н. Напомним, что симметрическую положительно определенную матрицу, какой является матрица Н, можно представить в виде произведения Н - UA2UT, E.28) где U — ортогональная матрица, столбцы которой есть собствен- собственные векторы матрицы Н; Л2 — диагональная матрица, элементы Ц которой есть собственные числа матрицы Н. Пусть матрица Н — диагональна, т. е. вторые смешанные производные оценочной функции по параметрам равны нулю. В соответствии с выражением E.26) это означает, что матрица А — квазидиагональна, т. е. аИ = df-ldxj = О при / Ф у. Следова- Следовательно, в этом случае каждый параметр влияет только на свою функцию, т. е. говорят, что параметры разделены. Из формулы E.28) видно, что матрица U собственных векторов при этом еди- единична и, следовательно, оси эллипсоидов уровня параллельны осям параметров, как показано на рис. 5.6, а, б. Длины осей обратно пропорциональны влиянию параметров а/у- = -^-. Чем сильнее различие во влиянии параметров, тем больше вытяну- тость эллипсоидов (рис. 5.6, б), причем они вытянуты в направ- направлении относительно слабо влияющего параметра. 213
Если параметры не разделены, то матрицы А и Н — недиаго- нальны, матрица U — неединична и оси эллипсоидов уровня на- наклонены по отношению к осям параметров (рис. 5.6, в, г). В этом случае вытянутость эллипсоидов определяется степенью линейной зависимости параметров, т. е. линейной зависимостью столбцов матрицы А. Чем сильнее линейная зависимость, тем больше вы- вытянутость эллипсоидов (причем большая ось направлена в сто- сторону наименее влияющей комбинации параметров). Так, на рис. 5.6, г параметры хх и х2 влияют на все функции почти оди- одинаково (соответствующие столбцы матрицы А пропорциональны). Таким образом хг — х2 — практически невлияющая комбинация, a Xi + х2 — сильно влияющая. Заметим, что среди параметров оптических систем почти всегда встречаются невлияющие или ли- линейно зависимые, поэтому наиболее типичной является ситуация, показанная на рис. 5.6, г. Отношение длин осей эллипсоидов мо- может достигать величин 103—104. Из выражений E.23) и E.26) можно получить формулу для градиента в области линейности * go + H Ax. E.29) Эта формула аналогична линейной модели E.23), т. е. в обла- области линейности вектор градиента есть линейная функция от па- параметров. Рассмотренные свойства и соотношения справедливы для ли- линейных систем f (x) или для реальных нелинейных систем — в области линейности QL, окружающей точку х0. Пусть в пределах области линейности изменение Аф = ф (х) — — Фо реальной нелинейной системы отличается от изменения Дф? = (pL (х) — фо оценочной функции в виде квадратичной фор- формы E.27) не более чем на еДф^ где 8 — малая величина (напри- (например, s = 0,1). Тогда приближенно можно считать, что размеры со/ области линейности по каждому параметру обратно пропор- пропорциональны величине вторых производных функций f. Например: VI / dft \2 7 \ — 1 V' ? Lj \ dxj 1 2» aii шттт =е4^т, E.30) i 4 J или в соответствии с формулой А. П. Грамматина [19, 30] со;-2 =я max i Ьц E.31) Матрицу несмешанных вторых производных оптимизируемых функций В = [ з ] мы можем получить при внешней пробе производных, выполняемой по двусторонним разностям, как опи- 214
сано в § 19. Удобно объединить размеры области линейности coy в диагональную матрицу вида О О с Элементы этой матрицы пропорциональны размерам области линейности в направлении соответствующих параметров. При этом мы аппроксимируем область линейности эллипсоидом, оси ко- которого параллельны осям параметров. Заметим, что если известна и ориентация области линейности, то матрица Й может быть недиагональной. Тогда собственные вектора матрицы Й2 = йтй указывают ориентацию осей области линейности, а собственные числа пропорциональны квадратам длин этих осей. Методы оптимизации. Для оптими- оптимизации оптических систем в настоящее время применяются почти исключительно методы локального спуска, сущность кото- которых заключается в том, что из началь- начальной точки Xok) данного &-го шага опре- определяется направление, двигаясь по кото- которому мы предполагаем уменьшить оце- оценочную функцию, т. е. спуститься от исходной точки. Вдоль этого направле- направления производится спуск до некоторой конечной точки x{ek) данного шага, кото- которая затем принимается за начальную точку хо*+1) следующего шага. Таким образом процесс продолжается (рис. 5.7). Опишем направление спуска вектором Дх. Тогда спуск выра- выражается следующей формулой: х = х0 + рДх, E.32) где р — длина шага вдоль направления. Часто вектор Дх нормируют таким образом, чтобы значение р = 1 соответствовало бы наилучшей на направлении точке в пре- пределах линейной модели E.23) и E.27). Естественно, что вектор Дх должен всегда указывать на- направление спуска, а не подъема, т. е. должно соблюдаться условие AxTg0 =t gj Дх < 0. E.33) При нахождении конечной точки хе = х0 + реДх, т. е. при определении ре, должно выполняться условие сходимости в виде Фе = Ф (х*) < ф0 — ф (х0). f5.34) 215 Рис. 5.7. Схема локаль- локального спуска в простран- пространстве параметров
Это условие означает, что конечная точка должна быть лучше (ниже) начальной. Выполнение условий E.33) и E.34) в любом случае гаранти- гарантирует, что в процессе спуска мы придем к минимуму оценочной функции, остановив процесс, когда перемещение в пространстве параметров будет пренебрежимо малым. Итак, для построения конкретного метода спуска мы имеем две задачи: выбор направления Ах и спуск по направлению — выбор ре. Главное отличие метода определяется выбором направ- направления спуска. Для оптимизации оптических систем применяются преимущественно детерминированные методы. Стохастические или случайные методы, рассмотренные в работе [25], несмотря на свою простоту, не получили распространения из-за низкой схо- сходимости. В следующих параграфах мы рассмотрим основные ме- методы безусловной оптимизации, а затем коснемся задачи контроля ограничений. При анализе различных методов полезно сравнивать их с не- некоторым идеальным методом. Естественно, что в самом лучшем методе мы должны получить направление спуска от исходной точки прямо на искомый минимум, однако при оптимизации не- нелинейных систем у нас нет информации для такого прстроения. Максимально доступной информацией являются вектор f0 зна- значений функций в начальной точке, полученный алгоритмом пробы, и матрица Якоби А, определяемая алгоритмом пробы производ- производных. Как следует из соотношений E.23), эта информация доста- достаточна для построения линейной модели, поэтому будем считать идеальным методом тот, который на каждом шаге позволяет найти наилучшую точку в пределах области линейности fij^ данного шага. При этом на начальных шагах, когда искомый минимум далеко за пределами области линейности, мы продвигаемся практически до границ областей Q(l0), ^lu (рис. 5.7), причем то- точки х^0), х(е1) — лучшие в этих областях. Когда на очередном шаге искомый минимум попадает в область линейности Q^*, требуется один шаг для того, чтобы приблизиться к минимуму, и возможно еще один-два шага — для его уточнения. Скорость сходимости методов спуска может быть выражена порядком сходимости, показывающим уменьшение оценочной функции от шага к шагу. Порядок сходимости определяется следующей формулой: т In Ф Off)) Для построения направления спуска необходима информация о поведении оптимизируемой системы или ее оценочной функции в окрестности исходной точки. По объему используемой информа- информации принято различать методы нулевого, первого и второго по- порядков (в соответствии с порядком используемых производных оценочной функции). 216
В методах нулевого порядка, называемых также методами поиска, или прямыми методами, вообще не используют произ- производных. Достоинством этих методов является отсутствие необхо- необходимости в пробе производных, недостатком — медленная сходи- сходимость. В методах первого порядка, называемых также градиентными, используют первые производные оценочной функции, т. е. вектор градиента g0B исходной точке. Следовательно, направление спуска строится на основе линейной модели E.21) оценочной функции в окрестности точки х0. Для получения вектора градиента необ- необходимо проделать пробу производных в начальной точке каждого шага. В результате получаем или непосредственно вектор g0 = ==-o-V(P (если понятия оптимизируемых функций не использу- используются), или же матрицу Якоби А. В этом случае вектор g0 надо находить по формулам E.26). Методы второго порядка, называемые ньютоновскими, осно- основаны на использовании первых и вторых производных оценочной функции, т. е. вектора градиента g0 и матрицы Гессе Н. Направ- Направление спуска определяется из квадратичной модели E.27) оценоч- оценочной функции в окрестности исходной точки каждого шага. Эти методы имеют наибольшую сходимость. Однако их применение практически невозможно, если не вводятся понятия оптимизиру- оптимизируемых функций f (x), а минимизируется непосредственно завися- зависящая от параметров оценочная функция ф (х) произвольного вида (поскольку в этом случае при внешней пробе производных для получения матрицы Гессе на каждом шаге требуется большое количество п (п + 1)/2 проб). Если же оценочная функция опре- определена как сумма квадратов оптимизируемых функций в виде E.7), то в соответствии с формулами E.15), E.26) матрица Гессе легко находится по матрице Якоби А и вектору f0 оптимизиру- оптимизируемых функций с теми же затратами проб, что и в методах первого порядка. В оптике всегда оценочная функция определялась в виде E.7). Благодаря этому ньютоновские методы, имеющие высокую сходимость, получили наибольшее распространение {см. работы [7, 8, 9, 19, 30, 35, 38,41, 43,44, 49, 50, 52, 54, 55]}. Напротив, ква- зиньютоновские методы [1, 33], в которых матрица Гессе из-за трудо- трудоемкости ее непосредственного вычисления аппроксимируется за п шагов, для оптимизации оптических систем не употребляются, поэтому мы их не рассматриваем. Укрупненный алгоритм типичного метода локального спуска с использованием оптимизируемых функций представлен на схеме 5.1. Он включает следующие основные этапы: исследование поведения оптимизируемой системы в окрестности начальной то- точки шага, построение модели оптимизируемой системы на основе полученной информации, построение направления (траектории) спуска, спуск вдоль выбранного направления и проверку условия окончания спуска. 217
( Начало ) i / ВВод исходных 1 данных: /х-Вектор параметров ¦ Проба-- Запоминание начальной точки шага: X0=x;-f0=f; <ро=ф ¦ Проба производных; Вычисление матрицы \(JiAjl 1 Определение Век- Вектора направления спуска Ах ¦ Определение длины шагар и спуск- х=хо+рАх ¦ Проба В конечной точке шага-- /и X - Вектор параметров исходной конструкции проба В исходной точке исследование оптимизи- оптимизируемой системы В окрест- окрестности начальной точки шага, построение ее мо- модели спуск 8доль направле- направления Ах - ^выполненоли ^ Ja ^—ииливие ошча-^^ " ' " """  ^Ч. ния? ^ f [Яг/77 ( Коней, ) Схема 5.1. Алгоритм локального спуска Отметим, Что методы локального спуска приводят только к ближайшему от исходной точки минимуму и не позволяют найти самый глубокий, т. е. глобальный минимум оценочной функции, обеспечивающий самую лучшую конструкцию оптической системы. Опыт оптимизации показывает, что часто небольшие изменения начальной конструкции, параметров оптимизации, оптимизиру- оптимизируемых функций неожиданно приводят к другому более глубокому минимуму, чем ранее найденный. Поэтому задача построения глобальных методов оптимизации представляется очень заман- заманчивой. К сожалению, в настоящее время отсутствуют сведения о каких-либо успехах в этом направлении и решение этой задачи в ближайшем будущем представляется маловероятным из-за боль- больших теоретических и численных трудностей. 218
Практически поиск наилучшей конструкции достигается много- многократным использованием локальных методов с изменением на основе анализа результатов исходной конструкции и оптимиза- оптимизационной модели. Этот процесс является весьма эвристическим, требующим творческого участия конструктора. Перспективы ав- автоматизации этого процесса заключаются в разработке эвристи- эвристических, в частности, самообучающихся алгоритмов. § 28. МЕТОДЫ НУЛЕВОГО И ПЕРВОГО ПОРЯДКОВ В литературе по оптимизации, например в работах [1, 33], методам нулевого и первого порядков уделяется значительное внимание. Существует большое количество различных их модифи- «X, Рис. 5.8. Траектория движения в пространстве параметров мето- методом покоординатного спуска: а — при разделенных параметрах оптимизации; б — в общем случае каций, но по причинам, изложенным выше, для оптимизации оп- оптических систем они в настоящее время применяются редко, так как неспособны конкурировать с более эффективными ньютонов- ньютоновскими методами. В настоящем параграфе мы кратко рассмотрим основные модификации, имевшие применение в оптике. Методы прямого поиска. Простейшим методом нулевого по- порядка является покоординатный спуск, при котором последова- последовательно производится изменение каждого из параметров оптими- оптимизации хъ ..., хп\ после прохода по всем параметрам процесс по- повторяется. Вектор направления спуска в этом методе выражается следующей формулой: Дх=*±еу> /= 1, 2,...,л, где е; — единичный вектор (орт) в направлении /-го параметра. Сходимость метода для линейной модели иллюстрируется на рис. 5.8. Нетрудно увидеть, что метод удовлетворительно сходится только в случае разделенных параметров (рис. 5.8, а), а при нали- наличии той или иной степени линейной зависимости между параме- параметрами (рис. 5.8, б) сходимость сильно замедляется. 219
Несколько лучшей сходимостью обладают модификации, в ко- которых после цикла поиска по каждой переменной (исследующего поиска) производится спуск по направлению, соединяющему на- начальную и конечную точки данного цикла исследующего поиска (так называемый поиск по образцу), а затем снова производится исследующий поиск и т. д. Этот процесс показан на рис. 5.8, б пунктиром. Известны и другие модификации, описанные, напри- например, в работе [30], построенные по тому же принципу. Методы нулевого порядка одними из первых применялись для оптимизации оптических систем, но в дальнейшем не получили распространения из-за низкой сходимости. Градиентные методы оптимизации. Градиентные методы отно- относятся к методам первого порядка, поскольку в них используется для построения направления спуска вектор первых производных оценочной функции — вектор градиента. Идея первого из них, который называется методом быстрейшего спуска (МБС), осно- основана на том, что вектор градиента в исходной точке g0 указывает направление быстрейшего возрастания оценочной функции. Целью оптимизации является уменьшение этой функции, поэтому спуск производится в направлении, противоположном градиенту g0. Можно записать, что: Ах = —ago или х = х0 — pag0. E.35) Удобно выбрать нормирующий множитель а таким, чтобы при р = 1 точка х = х0 — ago была бы лучшей в данном направлении для линейной модели E.23), т. е. чтобы в этой точке был минимум квадратичной формы E.27) вдоль направления, выраженного фор- д(рТ мулами E.35). Легко увидеть, что а определяют из условия —~~- = = 0. Подставляя формулы E.35) в выражение E.27), дифферен- дифференцируя по а и приравнивая производную нулю, получаем $? E-36) Если а выражено из предыдущей формулы, то значение р = 1 в формулах E.35) дает лучшую точку на траектории для линейной модели. Мы видим, однако, что для определения а необходимо знать матрицу вторых производных Н — матрицу Гессе. Если используются понятия оптимизируемых функций, то матрица Н легко вычисляется по формулам E.26) без больших дополнитель- дополнительных затрат. Если же оптимизируется непосредственно оценочная функция, то проба производных нам дает только градиент уф или go в соответствии с формулой E.14) и пользоваться выражением E.36) мы не можем. В этом случае просто предполагается, что a = = 1, но при этом точка, в которой р = 1, уже не является лучшей на траектории для линейной модели. 220
Нетрудно заметить, что в оптимальной точке ропт (где ду/др = = 0) траектория касается очередной поверхности уровня и, сле- следовательно, она ортогональна градиенту в этой точке, т. е. на- направлению спуска следующего шага. Таким образом, в методе бы- быстрейшего спуска движение от шага к шагу производится по от- отрезкам взаимно перпендикулярных прямых (рис. 5.9). Для анализа сходимости метода рассмотрим сначала случай, когда искомый минимум лежит в области линейности и, следова- следовательно, совпадает с минимумом xLmin линейной модели, описан- описанной формулой E.23), т. е. с центром эллипсоидов уровня. Такая Рис. 5.9. Траектория движе- движения в пространстве параме- параметров по методу быстрейшего спуска Рис. 5.10. Траектории ньюто- ньютоновских и градиентных методов в области линейности ситуация показана на рис. 5.10, на котором х{00) — исходная точка, пунктирные эллипсы — линии уровня линейной модели, х{01\ х^2) — начальные точки последовательных шагов МБС. Мы видим, что в этой ситуации МБС весьма далек от идеаль- идеального, так как в общем случае с его помощью невозможно за один шаг достичь xL min (за исключением тех редких случаев, когда ис- исходная точка лежит на одной из вершин эллипсоида уровня). Количество шагов тем больше, чем более вытянуты эллипсоиды уровня, т. е. чем больше различие во влиянии параметров или чем больше их линейная зависимость. В практических, часто встре- встречающихся случаях с сильной линейной зависимостью количество шагов в области линейности может быть крайне большим (до 104). Естественно, что применение метода для оптимизации оптических систем оказывается неэффективным. В ситуации, когда минимум xLmin линейной модели лежит далеко за пределами области линейности, напротив, использо- использование метода рационально. Траектория МБС направлена не в сто- 221
рону слабо влияющих или линейно связанных параметров, а в сто- сторону активных и наиболее сильно влияющих, т. е. в МБС слабые и линейно зависимые параметры как бы автоматически исключа- исключаются из оптимизации. Действительно, если какой-либо /-й пара- параметр слабо влияет на оценочную функцию, то соответствующая производная dcp/dx, мала, т. е. /-й элемент вектора g0 близок к нулю. В соответствии с формулой E.35) близко к нулю и приращение этого параметра при движении по траектории МБС. Это положение иллюстрируется рис. 5.11, на котором показаны траектории МБС и идеального метода (пунктир) от исходной точки х0. На этом рисунке пунк- пунктирные эллипсы — линии уровня линейной моде- модели, xLmln ее минимум, сплошные линии — линии уровня реальной систе- системы, хм — лучшая точка в линейности Рис. 5.11. Траектории ньютоновских и гра- градиентных методов в случае, когда минимум линейной модели xL тШ далеко выходит за область линейности Q^ области QL, Хе — лучшая точка на траектории МБС (для сравнения показана и траектория AxN ньютонов- ньютоновских методов, рассмо- рассмотренных ниже). При опти- оптимизации оптических си- систем МБС применяет- применяется иногда как дополнительный к ньютоновским методам. Попыткой усовершенствования метода быстрейшего спуска является метод сопряженных градиентов (МСГ), основанный на том, что изломы траектории движения МБС в области линейности лежат на п прямых, сходящихся к минимуму xL min линейной мо- модели (см. рис. 5.10). Отсюда следует, что достаточно проделать не более п шагов методом быстрейшего спуска, чтобы на следую- следующем шаге определить направление к минимуму xLmin. Более де- детальный анализ дает следующие формулы для направления спуска в МСГ, приведенные в работе [41 ]: Ах = ad, E.37) где 4@). dK }= — go' — на начальном шаге; .(j(A;—1) — на последующих шагах; a ~ или а= 1, если Н неизвестна. d<*)THd<*> На той же идее основаны методы параллельных касательных, или ПАРТАН-методы (от слов PAR allel TAN gents — параллель- параллельные касательные). В этих методах делается два шага в направле- направлении, противоположном градиенту, так же как в МБС, затем шаг 222
ускорения вдоль направления, соединяющего начальную точку первого градиентного шага и конечную точку второго, затем опять два градиентных шага и шаг ускорения и т. д. МСГ и ПАРТАН-ме- тоды позволяют достичь минимума xL min квадратичной формы E.27) линейной модели E.23) не более чем за п шагов. На основе МСГ построена программа оптимизации оптических систем, разрабо- разработанная Федером и представленная в работе [41]. Как и методы нулевого порядка, градиентные методы, в том числе МСГ и ПАРТ АН-методы, существенно уступают по сходи- сходимости ньютоновским; при использовании оптимизируемых функ- функций и оценочной функции в виде E.7), когда матрица Гессе вы- вычисляется одновременно с градиентом, применение этих методов нецелесообразно. § 29. НЬЮТОНОВСКИЕ МЕТОДЫ Рассматриваемые методы относятся к методам второго порядка. Они основаны на представлении оценочной функции в виде ква- квадратичной формы E.27), которая, в свою очередь, получается из линейной модели оптимизируемых функций, выраженной форму- формулой E.23). Направление спуска в ньютоновских методах указывает прямо на минимум xL min линейной модели, поэтому они имеют обычно значительно лучшую сходимость, чем градиентные методы. Ха- Характерной их особенностью является необходимость решения на каждом шаге системы линейных уравнений. Название методов взято по аналогии с методом Ньютона—Рафсона уточнения корня нелинейного уравнения (см. § 14). В том и другом случае мы за- заменяем на каждом шаге нелинейное уравнение или нелинейную систему уравнений E.5) ее линейной моделью. По той же причине эти методы называют также методами линеаризации. Метод Ньютона при т = п. Если количество оптимизируемых функций т равно количеству параметров п, можно надеяться, что существует решение системы нелинейных уравнений E.5), т. е. существует точка хн, в которой значения всех функций равны нулю. Естественно, что эта точка и является одновременно мини- минимумом xmln оценочной функции cp=fTf (причем наиболее глубоким). В методе Ньютона (МН) на каждом шаге нелинейная система урав- уравнений E.5) заменяется линейной, полученной приравниванием нулю линейной модели E.23), т. е. f0 + AAx = o. E.38) Так как матрица А в этом случае квадратная, мы получаем систему п линейных уравнений с п неизвестными, которая имеет решение, символически записанное в следующем виде: Дх =* —А'1^. E.39) Это решение и определяет направление траектории в методе Ньютона. Сама траектория есть прямая линия, напра- 223
вленная вдоль этого вектора. Она может быть представлена в виде х ¦= х0 — pA^fo, E.40) где р — длина шага вдоль траектории. При р = 1 мы приходим в минимум xLmin линейной модели, обеспечивающий равенство всех функций в линейном приближе- приближении к нулю, поэтому в классическом методе Ньютона выбирается р — 1. Однако чаще всего при этом решение выходит за пределы области линейности и на практике выбирают р <; 1, пользуясь методами, рассмотренными ниже в§ 31. Метод наименьших квадра- квадратов (МНК) при тг>п. Если коли- количество функций т превышает количество параметров я, то нет смысла требовать решения нели- нелинейной системы уравнений E.5), так как уравнений больше, чем неизвестных, и система переопре- переопределена. Тем не менее минимум оценочной функции всегда суще- существует. Метод наименьших квад- квадратов (МНК) основан на том, что в искомой точке минимума вектор градиента равен нулю, поэтому задача поиска минимума заменяет- заменяется эквивалентной задачей полу- получения нулевого вектора градиента g, т. е. решения системы не- нелинейных уравнений g (х) = 0. При этом количество уравнений и неизвестных совпадают. Как и в МН, на каждом шаге нелиней- нелинейная система уравнений g (х) = 0 заменяется линейной, получен- полученной приравниванием нулю линейной модели градиента, выражен- выраженной формулой E.29), g0 + HAx-o. E.41) Рис. 5.12. Направление спуска по методу наименьших квадратов Решение этой системы дает направление спуска Ах = —H^go - - (А^) ATf0. E.42) Траектория спуска — прямая линия, которая описывается следующей формулой: (А^Г1 ATf0. х = х0 - = х0 - р (А^Г1 ATf0. E.43) Как и в МН, точка на траектории, соответствующая р = 1, есть минимум линейной модели, так как в ней gL = 0. Траекто- Траектория МНК показана на рис. 5.12. На этом рисунке х0 — исходная точка, xLmin—минимум линейной модели, xmin — минимум ре- реальной системы. 224
Уровни оценочной функции реальной системы показаны сплош- сплошными линиями, а уровни линейной модели — пунктиром. Название метода происходит из задачи аппроксимации экс- экспериментальной зависимости аналитической формулой, рассмо- рассмотренной в § 9; выражения для коэффициентов аппроксимации, обеспечивающих минимум суммы квадратов невязок, совпадают по форме с выражениями E.42). Рассмотрим некоторые черты метода. Легко увидеть, что при т = п МНК тождественен методу Ньютона (без учета погрешности вычислений). Действительно, в этом случае матрица А квадратная и, если она не вырожденная, то существует обратная ей матрица А. Тогда в формуле E.42) могут быть раскрыты скобки, что в соответствии с правилами мат- матричной алгебры дает следующее соотношение: дх = —A-VA^o = —А^Ио = —А-Х т. е. выражение, тождественное E.39). На практике, однако, результаты, получаемые по формулам E.39) и E.42), не совпадают из-за того, что в формуле E.42) производится больше вычислений и погрешность в результате по- получается другой. Из этого, в частности, следует, что при т = п для уменьшения количества вычислений и погрешности лучше пользоваться методом Ньютона, а не МНК. Метод Лагранжа (МЛ) при т < п. Матрица Н = АТА системы E.41), из которой получается траектория МНК, всегда квадрат- квадратная, поэтому на первый взгляд кажется, что МНК работает при любом соотношении между количеством параметров и функций (тем более, что сами функции в него в явном виде не входят). Однако на самом деле это не так. При т <; я, т. е. когда количество параметров превышает количество функций, матрица Н = АТА получается вырожденной, а система E.41), как и E.38), имеет бесчисленное множество решений. Для выбора из этого множества единственного решения необ- необходимо дополнительное условие. Естественно взять в качестве такого условия требование минимизации длины вектора Ах решения системы E.38), т. е. Минимизация |Ах||2 предохраняет решение от выхода далеко за пределы области линейности QL, в которой решение системы E.38) вообще имеет смысл. При известных размерах области QL имеет смысл стараться получить меньшими приращения тех пара- параметров, в направлении которых размеры области линейности меньше, т. е. в общем случае мы должны минимизировать не ДхтАх, а 2 АхусоТ = АхтЙ~2 Ах - min, E.44) где Я — матрица размеров области линейности. 225
В частном случае, когда Q неизвестна, можно положить Q = = I и выражение E.44) переходит в условие АхтАх = min. Объединив условие E.44) с недоопределенной при т <^п системой уравнений E.38), мы приходим к задаче поиска условного минимума некоторого функционала — квадратичной формы — при соблюдении системы линейных равенств: AxTQ'2Ax = min; «.ал E-45) fo + AAx = o. v ' Эта задача решается методом так называемых неопределенных множителей Лагранжа, рассмотренных, например, в пособиях [ 1,33 ]. Как известно, безусловный минимум функционала AxTQ~2 Ax достигается в точке, в которой равны нулю его производные д (ДхтЙДх) —-—¦= по всем параметрам, т. е. вектор градиента OX j \7 (Дхт?Г2Лх) — 2й~2Дх. Нетрудно убедиться в том, что услов- условный минимум, при соблюдении системы равенств f0 + AAx, до- достигается в точке, в которой градиент \ (ДхтЙГ2Дх) можно раз- разложить по векторам, перпендикулярным плоскостям, в которых соблюдаются отдельные условия системы f0 + AAx, т. е. по стро- строкам матрицы А. Другими словами, в точке условного минимума \/ (Дхт?Г2Дх) можно представить в виде т у(ДхтЙ~2Дх)^ > а]А, = АтЬ, E.46) t=i где &i — i-я строка матрицы A; Xt — некоторые коэффициенты, называемые лагранжевыми множителями; к — вектор, составлен- составленный из этих множителей. Условие E.46) совместно с системой уравнений E.38) и опреде- определяют условный минимум в задаче E.45). Легко показать, что в точке условного минимума равны нулю частные производные по х и по X так называемой лагранжевой функции г|э, полученной добав- добавлением к Дх,тЙ~2Дх суммы условий, умноженных на лагранжевы множители. В матричной форме можно записать, что Ч> = 4" Дхтй Ах - (f0 + А Дх)т к E.47) (коэффициент 1/2 введен для удобства). Действительно, дифферен- дифференцируя формулу E.47) сначала по х, а затем по к, получим систему, объединяющую выражения E.46) и E.38): Для решения этой системы выразим Ах через X из первого урав- уравнения Ах = _й2Ат^ E.49) 226
подставим его во второе уравнение и найдем решение в виде: —AQ2AT>. + f0 - 0; к = (ASi2AT)-1 f0. E.50) Подставляя это решение обратно в первое уравнение, полу- получим искомый вектор приращений параметров в методе Лагранжа (МЛ) Ах = —Q2AT (АОЧ7) f0. E.51) На практике окончательная формула реализуется в виде такой последовательности операций: сначала составляется система уравнений относительно к и находится решение этой системы в соответствии с выражениями E.50), затем полученное решение умножается слева на матрицу — Й2АТ в соответствии с уравне- уравнением E.49). Можно также записать систему E.48), объединив обе ее части в одно матричное выражение, используя блочные матрицы аЛт)(_ГЬЦ)- Составляя матрицу этой системы и вектор правых частей в со- соответствии с предыдущей формулой, мы получим в качестве реше- / Дх\ ния блочный вектор ( „ . Первые п компонентов этого вектора есть искомые приращения параметров. Такой метод, однако, не- неудобен, так как порядок системы E.52) равен т + п и соответст- соответственно требуется большая оперативная память ЭВМ {пропорцио- {пропорционально (т + пJ} и время решения {пропорционально (т + лK}. Сходимость ньютоновских методов. Для анализа сходимости методов, приведенных в этом параграфе, рассмотрим, как и ранее, две различные ситуации. Первая ситуация характеризуется тем, что точка решения xN = х0 + Ах, где Ах выражается формулами E.39), E.42) или E.51), т. е. точка на траектории, соответствующая р = 1, или, что то же самое, минимум линейной модели xLmln, лежит в области линейности QL. В этом случае, показанном на рис. 5.10, все ньютоновские методы близки к идеальному, т, е. позволяют получить за один шаг точку, лучшую в области линейности. Действительно, как следует из приведенной теории методов, ре- решение по формулам E.39), E.42) или E.51) основано на полу- получении точки xLmin, являющейся наилучшей для линейной мо- модели E.23). Поэтому, если эта точка лежит в области линейности, то она является наилучшей и для реальной системы на данном шаге, в пределах ?2L, т. е. в этом случае xL min = xM. В рассмотренной ¦ситуации, следовательно, ньютоновские методы обладают несом- несомненным преимуществом перед градиентными. Вторая ситуация характеризуется тем, что точка решения ньютоновских методов xN (она же минимум линейной модели xL min) 227
далеко выходит за пределы области линейности, в которой эта модель справедлива. В этом случае, приведенном на рис. 5.11, ньютоновские методы оказываются неэффективными. Из-за дву- мерности рисунка мы не имеем возможности изобразить различия между МН, МНК и МЛ (при п = т = 2 все три ньютоновских метода эквивалентны). Действительно, найденное в соответствии с выражениями E.39), E.42) или E.51) решение AxN в данной ситуации не имеет никакого смысла, так как оно основано на линейной модели, спра- справедливой только в области QL, за которую далеко выходит точка решения xLmin. При использовании построенного направления спуска мы сможем продвинуться по нему только на небольшое расстояние в пределах области линейности до некоторой точки х^, которая является наилучшей на этой траектории (см. рис. 5.11). Дальнейшее продвижение из-за нелинейности скорее всего при- приведет не к улучшению, а к ухудшению оценочной функции (счаст- (счастливый случай, когда нелинейность влияет благоприятным обра- образом, встречается крайне редко). Длина шага вдоль направления получается крайне малой (р < 1), т. е. построенное направление спуска используется только в своей малой части. При этом, как правило, мы продвигаемся не в оптимальном направлении и най- найденная точка оказывается гораздо хуже точки хм, наилучшей в области линейности QL. Благодаря описанным причинам, сходи- сходимость ньютоновских методов в рассматриваемой ситуации сильно замедляется. Когда же появляется эта неблагоприятная ситуация, т. е. когда решение Ах в ньютоновских методах в соответствии с фор- формулами E.39), E,42) или E.51) становится настолько большим, что выходит за область линейности? Рассмотрим сначала самый простой случай метода Ньютона с разделенными параметрами, когда каждый из них влияет только на свою функцию. В этом случае матрица А квадратная и диаго- диагональная, т. е. М 0 dn а решение E.39) по методу Ньютона имеет вид ^xi = —dj1for E.53) Очевидно, что если среди параметров имеется относительно слабо влияющий («лишний») или, что то же самое, какая-либо функция слабо зависит от своего параметра (является «лишней»),. то соответствующий элемент dt матрицы D стремится к нулю, а соответствующий компонент решения E.53) стремится к бесконеч- бесконечности. В результате сходимость метода сильно замедляется. Это 228
легко увидеть также из § 27, так как решение по методу Ньютона направлено в центр эллипсоидов уровня линейной модели, а в опи- описанной ситуации эллипсоиды сильно вытянуты в направлении xt и центр расположен далеко от исходной точки. Если в методе Ньютона параметры не разделены, то большая длина решения E.39) соответствует наличию слабо влияющей ли- линейной комбинации параметров или слабо зависящей от параметров линейной комбинации функций. В этом случае некоторые пара- параметры или функции могут быть выражены с той или иной степенью точности через линейные комбинации остальных параметров или функций. Следовательно, эти параметры или функции тоже яв- являются «лишними». Такой случай может быть сведен к предыду- предыдущему поворотом систем координат в пространстве параметров и функций. Матрица А здесь уже недиагональна, но может быть представлена в виде сингулярного разложения A = VDUT, E.54) где D — диагональная матрица; V и U — ортогональные матрицы поворота. Таким образом, в методе Ньютона достаточно иметь один «лиш- «лишний» в указанном смысле параметр или одну «лишнюю» функцию, чтобы вектор Ах направления спуска вышел далеко за область линейности и сходимость метода стала бы плохой. Рассуждая аналогично, приходим к выводу, что для плохой сходимости метода наименьших квадратов достаточно иметь хотя бы один «лишний» параметр, но не менее чем т — п + 1 «лишних» функций благодаря избыточности последних. Для плохой сходи- сходимости метода Лагранжа, наоборот, достаточно одной «лишней» функции, но не менее чем п — т + 1 «лишних» параметров. В этих случаях матрица А — прямоугольная, но ее также можно предста- представить в форме E.54). При этом матрицы поворота V и U имеют раз- разные порядки т и п, а матрица D — прямоугольная, с отличными от нуля, только диагональными элементами, имеющими одинако- одинаковые номера строки и столбца, т. е. dtj = О, если i Ф /. Эти элементы называются сингулярными числами матрицы А. Наличие «лиш- «лишних» параметров или функций приводит к тому, что соответствую- соответствующие сингулярные числа весьма малы по сравнению с остальными. При этом матрица А становится плохо обусловленной, поскольк/ степень обусловленности cond (А) определяется как отношение максимального и минимального сингулярных чисел, т. е. cond (A) = ^ш-> f mln При оптимизации оптических систем появление «лишних» параметров и функций отнюдь не редкость. Так, например, кон- конструктивные параметры близко или симметрично расположенных поверхностей и сред часто влияют почти пропорционально друг другу и одни из них являются «лишними». Аберрации близко рас- 229
положенных лучей являются линейно связанными между собой функциями, встречаются и слабо влияющие параметры. Поэтому ньютоновские методы в применении к оптическим системам об- обладают неудовлетворительной сходимостью, а также становится важным тщательный отбор параметров и функций при построении оптимизационной модели. Из сказанного ясны рекомендации увеличивать количество функций для улучшения сходимости МНК (доводя отношение т/п до 10) или количество параметров для улучшения метода Лаг- ранжа. Естественно, что при этом не поможет простое механиче- механическое увеличение т или п. Важно, чтобы добавляемые функции и параметры не были бы «лишними», т. е. отличались бы по своему характеру от прежних. Заметим, что вместо добавления функций или параметров гораздо полезнее уменьшить число параметров в МНК или функций в МЛ, исключив из них «лишние», приводя- приводящие к плохой сходимости (при этом методы сходятся гораздо бы- быстрее). Вспомним, что МБС инвариантен к наличию «лишних» параметров и функций и при их исключении, следовательно, его сходимость не меняется. Заканчивая анализ сходимости ньютоновских методов, необхо- необходимо сказать, что, несмотря на отмеченные серьезные недостатки, они оказались более эффективными, чем градиентные и достаточна широко применялись для оптимизации оптических систем. На их основании построены многочисленные программы, описанные в работах [7, 8, 19, 30, 38, 39, 45, 53]. Комбинация ньютоновских и градиентных методов* Мы видим, что свойства сходимости градиентных и ньютоновских методов противоположны и как бы дополняют друг друга, поэтому, объеди- объединяя эти методы, можно получить лучшую сходимость, чем при использовании их независимо. Простейший вариант заключается в том, что на каждом шаге реализуются независимо оба метода, после чего в качестве начальной точки следующего шага выби- выбирается наилучшая из полученных. Иногда один метод используют в качестве основного до тех пор, пока он сходится достаточно бы- быстро, а затем включается дополнительный метод. Такая стра- стратегия применена в программе ГОИ им. С. И. Вавилова, описан- описанной в работе [8]. В качестве основного используются один из нью- ньютоновских методов (МН при т = я, МНК при т > п и МЛ при т <п), а в качестве дополнительного — МБС. § 30. УСОВЕРШЕНСТВОВАННЫЕ НЬЮТОНОВСКИЕ МЕТОДЫ Ньютоновские методы могли бы стать близкими к идеальным, если бы удалось избавиться от их основного недостатка — боль- большого выноса точки решения из области линейности при наличии «лишних» параметров или функций, приводящего к резкому за- замедлению сходимости. Два способа решения этой задачи мы рас- рассмотрим в настоящем параграфе. 230
Выбор оптимального базиса. Мы уже говорили, что тщатель- тщательный отбор параметров и функций с целью устранения из них «лишних» способствует существенному повышению сходимости ньютоновских методов. Естественно, что нерационально возла- возлагать задачу такого отбора на конструктора, строящего оптимиза- оптимизационную модель. Во-первых, для этого у него нет достаточной информации и ему приходится опираться в основном на опытг а, во-вторых, параметры и функции, оптимальные на начальных шагах оптимизации, могут не остаться таковыми в дальнейшем. Необходимо, чтобы отбор производился автоматически в про- процессе оптимизации. Математически задача формулируется как поиск оптимального линейно-независимо го базиса в матрицах А или Н, что может быть сделано с помощью метода гауссовского исключения одновременно с решением системы линейных уравне- уравнений. Если поиск оптимального базиса ведется в матрице А, мы получаем метод Ньютона на оптимальном базисе (МНОБ), если в матрицеН = АТА — метод наименьших квадратов на оптималь- оптимальном базисе (МНКОБ). Рассмотрим эти методы несколько подробнее. Пусть мы имеем матрицу Якоби А = (-Ф-) при любом соотно- шении между количеством параметров п и функций т. Пользуясь методом гауссовского исключения с выбором ведущего элемента, описанным, например, в работе [32], найдем в этой матрице г8 строк и столько же столбцов, образующих квадратную подма- подматрицу Аг порядка ге, имеющую степень обусловленности не более е, т. е. найдем оптимальный в смысле заданного относительного допуска 8 базис матрицы А. Объединим параметры, соответствую- соответствующие столбцам базиса в вектор хг, а функции — в вектор fOf. Применим теперь метод Ньютона к найденному базису, т. е. со- составим систему уравнений f0 + АЛАхг = 0 и найдем ее решение для базисных параметров и функций в виде Дх, = — А^. E.55) Остальные параметры и функции, не вошедшие в базис, яв- являются «лишними» и в процессе оптимизации на данном шаге не участвуют. Подбирая е, можно всегда добиться оптимального решения^ т. е. такого, чтобы найденная в соответствии с E.55) точка находи- находилась на границе области линейности. В этом случае она будет наилучшей и метод будет близок к идеальному. Для оптических систем во многих случаях оказывается подходящей величина е порядка 10. Для решения описанной задачи можно воспользоваться гото- готовыми стандартными программами линейной алгебры, например, программой MFGR из сборника [28]. При этом одновременно с поиском оптимального базиса матрицы А нетрудно найти и ре- решение E.55) для базисных параметров и функций. Запишем сим- 231
волически поиск оптимального базиса матрицы А и нахождение для него решения в следующем виде Дх ¦=: — A*f0. E.56) Таким образом, траектория спуска в МНОБ будет выглядеть так х = х0 — рА%. E.57) Если вести поиск оптимального базиса в матрице Н = АТА, то мы приходим к МНКОБ, для которого решение символически запишем в виде Ax = -(ATA)*ATf0. E.58) а уравнение траектории спуска — в виде x-xo-p(ATA)*ATfc. E.59) В силу симметрии матрицы АТА номера базисных столбцов и строк будут одинаковыми. Ясно также, что относительный до- допуск в этом случае должен соответствовать квадрату допуска в МНОБ, т. е. составлять величину порядка 10~4. Приращения небазисных параметров в МНКОБ выбираются таким образом, чтобы получить в результате минимальную длину вектора Ах, улучшив тем самым сходимость. Для реализации символической записи E.58) можно воспользоваться стандартными программами MFSS и MLSS из сборника [28]. Благодаря поиску оптимального базиса оба метода становятся универсальными; они работают при любом соотношении тип. И, наконец, нецелесообразно на каждом шаге оптимизации заново определять полноразмерную матрицу А и искать в ней оптималь- оптимальный базис. Можно ожидать, что найденный базис останется опти- оптимальным на некоторое количество шагов, поэтому выгодно его сохранить и на некоторых последующих шагах убрать из оптими- оптимизационной модели «лишние» параметры и функции, уменьшив тем самым объем пробы и пробы производных. Методы обобщенной обратной матрицы. Результаты, близкие к рассмотренным методам оптимального базиса, могут быть полу- получены при помощи сингулярного разложения E.54) матрицы А. Подставляя его в формулы E.39), E.42) и E.51), запишем следую- следующие выражения для вектора направления спуска Ах в методах Ньютона, наименьших квадратов и Лагранжа (для случая й = I) соответственно: при т = щ при т>/г; Ах = -U I n ) VTf0 при 232 E.60)
где А = I • I — квадратная часть матрицы D сингулярных чисел в формуле E.54); du . . . , dL — сингулярные числа ма- матрицы А. Лишним параметрам или функциям, приводящим к плохой сходимости методов, соответствуют сингулярные числа, малые по •сравнению с остальными. При нахождении обратной матрицы А в формулах E.60) эти числа обращаются в результате чего полу- получаем большие значения обратных величин djl и, как следствие, большую длину вектора Ах. В рассматриваемых методах для того, чтобы избавиться от вредного влияния лишних параметров или функций при нахож- нахождении матрицы, обратной по отношению к А, малые сингулярные числа не обращаются в соответствии со следующей формулой t О Vo , ( dyl при ^>edm где dj = \ ( 0 при dt < edm Матрица Л+, определенная предыдущей формулой, называется обобщенной обратной по отношению к Л, а числа dt — обобщен- обобщенными обратными по отношению к dr С использованием понятия обобщенного обращения можно за- записать решения для всех ньютоновских методов в виде единой формулы Ах = — A+f0 = —UD+VTf0, E.61) где А+ и D+ — матрицы обобщенные обратные к матрицам А и D соответственно, причем А+ = UD+VT, где В+ = Л+ при т = п\ ' А+ ax. D=(A+O) при m>n; D+ = I при т<я. Методы, решение в которых находится по формуле E.61), называются методами обобщенной обратной матрицы. Для их практической реализации необходимо нахождение матриц U, V и D сингулярного разложения E.54) матрицы А. Для этого может <быть использована стандартная программа SVD, описанная в руководствах по алгоритмам матричной алгебры. Этот процесс, однако, требует большого количества вычислений, поэтому методы обобщенной обратной матрицы отличаются значительной трудоем- трудоемкостью. Ранее рассмотренные методы оптимального базиса, осно- основанные на процессе гауссовского исключения, значительно эко- 233
номичнее, хотя решение, найденное по формулам E.56) или E.58),. иногда может быть несколько хуже, чем по формуле E.61). Выбор оптимального значения относительного допуска е в методах оптимального базиса и обобщенной обратной матрицы может производиться на основе следующих рассуждений. При оптимальном значении г решение Ах, полученное по формулам E.56), E.58) или E.61), указывает на точку, наилучшую в области линейности. В этом слу- Таблица 5.1 МНКОБ Ход оптимизации при помощи b зависимости от г чае при спуске по най- найденному направлению в соответствии с формулой E.57) или E.59) мы оста- остановимся вблизи точки х = х0 + Ах, т. е. найден- найденная при спуске длина шага popt будет близка к единице. Полученное в результате спуска малое значение popt, например Popt < 0,3, указывает на то, что решение Ах из формул E.56), E.58), E.61) слишком велико и точка х = х0 + Ах лежит за пре- пределами области линей- линейности из-за того, что 8 < ?oPt- В этом случае е следует увеличить, напри- например, в два раза. Если же мы получим popt > 1, то решение Ах слишком ма- мало. Причиной этого яв- является большая величи- величина б и ее следует умень- уменьшить, например, в два раза. Для иллюстрации влияния выбора 8 на сходимость оптимиза- оптимизации приведем пример оптимизации шестилинзового фотообъектива типа «Эра», с угловым полем в пространстве предметов 2со = 46°, апертурой Л о = 0,278 (относительным отверстием 1 : 1,8), фо- фокусным расстоянием 52 мм. Исходная конструкция, взятая из работ [5, 35], имеет довольно большие аберрации, достигающие 0,5 мм. В качестве параметров оптимизации были взяты кривизны всех поверхностей, толщины всех линз, а также воздушный про- промежуток между второй и третьей линзами и положение апертурной диафрагмы. В табл. 5.1 показан ход оптимизации при использо- использовании МНКОБ при двух значениях 8, а именно при 8 = 10~& (при этом малом значении МНКОБ фактически переходит к обыч- 234 Номер шага О1 1 2 3 4 5 6 7 8 10 12 14 16 17 19 27 30 32 33 8=10 обычный МНК Y^Wfll 125,4 124,9 114,6 103,8 102,7 96,6 85,8 80,2 77,6 12,4 10,9 5,2 4,3 3,6 3,54 3,51 3,50 3,47 3,47 popt 0,003 0,181 0,123 0,025 0,251 0,123 0,120 0,031 1,028 0,002 0,832 0,256 0,250 0,125 0,008 0,069 0,007 0,001 1 Исходная система. 8 = 10 МНКОБ Y~v = II f II 125,4 11,9 6,8 6,7 6,1 5,1 3,5 3,5 Popt 1,000 1,045 0,147 0,508 0,656 1,012 0,002
ной МНК) и при е = 10 3. Из таблицы ясно видно, что сходимость МНК при е = 10~6 значительно хуже, чем МНКОБ при е — 10~3 Оптимальная длина шага popt в первом случае практически на всех шагах много меньше единицы, что свидетельствует о неудач* ном выборе направления и невозможности далеко продвинуться по нему в области линейности, т. е. решение Ах в этом случае далеко выходит за область линейности. Во втором случае popt достаточно близко к единице, что свидетельствует об удачном выборе е. В результате оптимизации удалось примерно в 38 раз улучшить оптимизируемые характеристики системы, но в обычном МНК потребовалось для этого почти в пять раз больше шагов. Демпфированный метод наименьших квадратов (ДМНК). Вто- Второе направление усовершенствования ньютоновских методов пред- представлено предложенным в 1949 г. и широко применяющимся в оп- оптике так называемым демпфированным методом наименьших квадратов (ДМНК). Идея этого метода основана на улучшении сходимости за счет ограничения длины вектора решения Ах в стан- стандартном методе наименьших квадратов, выраженном формулой E.42). Эта цель достигается добавлением к оценочной функции ср = = fTf = (ff еще одного члена /гДхтДх = р2\\ Axf — квадрата длины вектора Ах смещения от начальной точки, умноженного на некоторый коэффициент /?2, называемый демпфером. В соответствии с этой идеей вместо старой оценочной функции ф = fTf = || f |2 будем рассматривать новую фр = ф + р2 ДХТ Дх = fTf _|_ р2 ДХТ Дх и примем для ее минимизации обычный метод наименьших квадра- квадратов. Дифференцируя предыдущее выражение по х, найдем градиент и матрицу Гессе новой оценочной функции срр: gp = 4" ^Фр = 4 ^Ф + Р2 Ах = б + Р2 Лх' где I — единичная матрица. В области линейности, где <р есть квадратичная форма E.27)„ градиент g описывается линейной моделью E.29). Подставляя ее в предыдущую формулу, получим линейную модель градиен- градиента gp = go + Нр Ах. Приравнивая gPjL нулю, получим систему линейных уравнений, решение которой дает направление спуска в ДМНК: go + Н^Дх —о, или Дх = — H71go = — (H+ p2l)-~lg0. E.62) 23S
Сравнивая выражения E.62) и E.42), видим, что ДМНК отли- отличается от МНК тем, что вместо матрицы Н = АТА используется матрица Нр = Н + p2l, которая получается из Н прибавлением к элементам главной диагонали одного и того же положительного числа — демпфера. Эта операция иногда называется демпфиро- демпфированием матрицы Н. Итак, при помощи несложной операции демпфирования, мы от МНК переходим к ДМНК. Рассмотрим ос- основные свойства ДМНК. Во-первых, при любом отличном от нуля демпфере р2 решение по формуле E.62) всегда конечно, независимо от соотношения количества параметров и функций и наличия среди параметров «лишних», т. е. не влияющих или линейно связанных. Это утверж- утверждение легко доказывается при помощи сингулярного разложения E.54) матрицы А. Во-вторых, решение ДМНК, выраженное формулой E.62), дает наилучшую точку на фиксированном расстоянии от началь- начальной в пределах линейной модели. Другими словами, решение E.62) есть точка минимума оценочной функции, представленной квадратичной формой E.27), на сфере некоторого радиуса R, описанной вокруг начальной точки в пространстве параметров. Докажем это важное свойство метода. Для этого рассмотрим за- задачу нахождения минимума оценочной функции cpL, выраженной формулой E.27), при условии постоянства квадрата длины век- вектора Ах, т. е. задачу нахождения минимума cpL на сфере: cpL а ф0 -f- 2 AxTg0 + АхтН Ах == min; || Ах |р = Ахт Ах == R2 =* const. Эта задача об условном минимуме. Решаем ее методом неопреде- неопределенных множителей Лагранжа, для чего составляем лагранжеву функцию: г|) = Фо + 2 AxTg0 + АхтН Ах + (Ахт Ах - #2)т X, где *к — неопределенный множитель. Приравнивая производные этой функции по Ах и Я нулю, получаем: 2g0 + 2Н Ах + 2 Ахк = 0; Нетрудно увидеть, что решение первого матричного уравнения предыдущей системы совпадает с решением по ДМНК, данным формулой E.62), если р2 = X, что и требовалось доказать. Рассмотренное свойство делает ДМНК наиболее близким к эталонному методу, так как, подбирая величину демпфера р2, всегда можно найти наилучшую точку в области линейности QL. Если известны оценки со7 размеров области линейности QL, то рационально демпфировать сильнее те параметры, для которых (Of меньше, т. е. вместо /?2АхтАх в формуле для срр записать 236
/?2AxTQ 2Ax аналогично тому, как мы это делали в методе Лаг- ранжа. В этом случае направление спуска в ДМНК будет иметь следующий вид: Дх = — (Н + /Яй-2)-1 go = __ (АтА + /?2Q-2)-i ATf0, E.63) где Q —матрица размеров области линейности. При Q = I получаем выражение E.62). Траектория в ДМНК может строиться различными способами. Во-первых, можно взять некоторую величину демпфера р2 и, полу- получив направление спуска по формуле E.63), двигаться по нему„ как и в рассмотренных ранее методах. Траекто- Траектория спуска (рис. 5.13) при этом будет прямой линией: МНК ж Рис. 5.13. Траектории различных методов, спуска E.64) Здесь весьма важным яв- является выбор демпфера р2, определяющий сходимость метода. Для решения этой задачи можно воспользо- воспользоваться приемом, рассмот- рассмотренным на стр. 234 при определении е в методах оптимального базиса. Во-вторых, при движе- движении по траектории спуска можно менять демпфер и каждый раз заново находить решение по формуле E.63). При, этом траектория будет кривой линией Оптимальная величина демпфера здесь будет найдена автомати- автоматически при определении оптимальной длины шага popt. Очевидно, что при р = О мы получим решение, эквивалентное обычному МНК в соответствии с формулой E.42). При р -+- оо траектория, выра- выраженная формулой E.65), касается градиента g0 в исходной точке.. Следовательно, двигаясь по траектории посредством изменения демпфера р2 от оо до 0, мы переходим от направления МБС к мини- минимуму линейной модели xL min, определяемому по МНК, т. е. ДМНК сочетает в себе положительные свойства обоих методов: МБС и МНК. Очевидно также, что зависимость демпфера от длины шага должна быть такой, чтобы с увеличением р коэффициент р2 умень- уменьшался, например, р2 (р) = (ро/рJ, где р0 — начальное значение демпфера — малое число. Движение по кривой траектории в соответствии с формулой E.65) эффективнее в смысле сходимости, но более трудоемко, 237
поскольку для каждого значения р требуется решать систему ли- линейных уравнений. Кроме того, необходим дополнительный объем памяти ЭВМ. Это связано с тем, что при использовании стандарт- стандартных программ решения систем линейных уравнений матрица НР в процессе решения обычно разрушается, поэтому для обеспече- обеспечения возможности повторного решения с другим значением р2 надо хранить ее копию. § 31. ОПРЕДЕЛЕНИЕ ДЛИНЫ ШАГА ВДОЛЬ ТРАЕКТОРИИ СПУСКА Рассмотрим теперь второй этап локального спуска — нахожде- нахождение длины шага вдоль построенной траектории спуска х = х0 + + Ах (р), т. е. значения ре, соответствующего конечной точке хе = х0 + Ах (ре). Уравнение х = х0 + Ах (р) описывает наи- наиболее общий случай кривой траектории спуска; в большинстве методов мы имели дело с прямолинейным направлением, при этом х = х0 + рАх, т. е. Ах (р) = рАх. В первых вариантах программ оптимизации оптических си- систем, основанных на методах Ньютона и Лагранжа, описанных в работах [7, 30], выбор длины шага производился не из условия минимизации оценочной функции ср, которая вообще не вводилась в рассмотрение, а из условия возможно достижимого уменьшения абсолютных значений всех оптимизируемых функций f. Практика, однако, показала, что при этом сходимость методов получается недостаточной и в настоящее время все программы основаны на выборе ре9 преследующем уменьшение оценочной функции. Простой сходящийся выбор. Одним из простейших методов является выбор ре только из условия сходимости E.34) в соответ- соответствии со следующим алгоритмом, показанным на схеме 5.2. 1. Выбираем некоторое начальное значение р (обычно р = 1). 2. В точке с данным значением р, т. е. в точке х = х0 + Ах (р) производим пробу и находим значение оценочной функции ср. 3. Проверяем условие сходимости E.34), т. е. что ср < ср0, где ф0 — значение оценочной функции в начальной точке данного шага. Если оно выполняется, считаем полученную точку конечной и заканчиваем данный шаг, если условие E.34) не выполняется, то уменьшаем р в соответствии с формулой р = р/а и возвращаемся к пункту 2 настоящего алгоритма. Коэффициент уменьшения а выбирается в пределах а = = 2-r-lO. От его значения существенно зависит сходимость опти- оптимизации. Так как при р ->- 0 условие сходимости всегда выпол- выполняется в соответствии с формулой E.33), то описанный алгоритм всегда сходится, т. е. рано или поздно при уменьшении р мы выпол- выполним условие ф < ф0. Несмотря на свою крайнюю простоту, ме- метод обеспечивает удовлетворительную сходимость оптимизации. Этот метод применялся, в частности, в программе оптимизации оптических систем, разработанной в ГОИ им. С. И. Вавилова 238
~х0-исходная точка шага; Ах(р)-уравнение траектории спуска да (условие сходимости Выполнено) условие сходимости не выполнено на коней, данного шага и проверку ус- условия окончания оптимизации Н. В. Цено [5, 35]. В этой программе направление спуска определяется по ДМНК с движением по кривой в соответствии с формулой E.65) при а = I. Оптимальный выбор. При нахождении ре жела- желательно максимально ис- использовать построенную траекторию спуска и най- найти наилучшую точку на ней, т. е. такую точку, в которой ф (р) имеет ми- минимум. Задача, следова- следовательно, сводится к нахо- нахождению минимума оценоч- оценочной функции от одного параметра р. Для ее реше- решения можно применить из- известные методы однопара- метрической оптимизации: половинного деления, зо- золотого сечения, Фибоначчи и др. Одним из наиболее эффективных методов является метод пара- параболической аппроксимации, основанный на предположении, что на траектории имеется только один минимум ф и зависимость ф (р) подобна показанной на рис. 5.14. Сущность метода заключается в том, что сначала находят три точки рь р2, р3, удовлетворяющие условиям: Pi < Р2 < Рз и Ф1 > Ф2 < Ф3, где ф! = ф (pi); ф2 = ф (р2); ф3 = ф (Рз). Ясно, что искомый минимум лежит между крайними точками pj и р3. Для нахождения его вместо истинного графика ф (р) через эти три точки проводят параболу, описываемую квадратным трех- трехчленом ф (р) = ар2 + Ьр + с, коэффициенты которого а, Ъ и с .легко находятся из следующей системы линейных уравнений: ар\ + bpi + с = q>,, i = 1, 2, 3. E.66) Вершина параболы и принимается за искомый минимум pmin = = —Ы2а. Из формулы E.66) легко получить непосредственно фор- формулу для pmin в виде Схема 5.2. Алгоритм определения шага из условия сходимости длины 2 (ф! - ф2) Рз + (ф2 - Фз) Pi + (Фз - Ф1) Р2 " В полученной точке pm]n производят пробу. При необходимости можно уточнить минимум, отбросив из четырех точек рь р2, р3, 239
парадола Pmin ТУ> в которой значение ф наибольшее и через оставшиеся три снова провести параболу. Обычно ограничиваются одним и редко двумя уровнями параболической аппроксимации. Как получить три необходимые точки? Сначала мы имеем на- начальную точку р = 0, в которой ф = ф0. Выберем предваритель- предварительное значение р = 1 и проделаем в этой точке пробу. Если ф (р) < < Фо> то увеличиваем р до значения р = р + 1 и снова делаем пробу и так поступаем до тех пор, пока в очередной точке не полу- получим ф больше, чем в предыдущей. Через последние три точки и проводим параболу. Если в точ- точке р = 1 получаем ср > <р0, то умень- уменьшаем р до значения р = р/2 до тех пор, пока не получим ф < ф0. Через точку р = 0 и две последние про- проводим параболу. Алгоритм парабо- параболической аппроксимации по описан- описанному методу показан на схеме 5.3. Метод оптимального выбора р немного более трудоемок, чем пре- предыдущий. Он требует в зависимости от ситуации от двух до шести до- полнительных проб для получения минимума ф (р). Эти затраты, однако, обычно окупаются лучшей сходи- сходимостью. Окончание процесса оптимизации. Процесс оптимизации со- состоит из ряда итерационных шагов, таких, что конечная точка данного шага принимается за начальную следующего. Так как на каждом шаге удовлетворяется условие сходимости E.34), то рано или поздно мы придем к искомому минимуму. Причем оче- очевидно, что при приближении к минимуму пройденное на каждом шаге расстояние в пространстве параметров будет стремиться к нулю. Практически из-за ошибок округления, начиная с не- некоторого шага, процесс беспорядочно блуждает вокруг минимума, не приближаясь к нему. Естественно, что важно остановить оп- оптимизацию вовремя, с одной стороны, не допуская ненужных блужданий, на которые тратится много действий, и с другой сто- стороны, не заканчивая процесс преждевременно. Проще всего для принятия решения об окончании процесса следить за величиной относительно уменьшения оценочной функции на k-м шаге по срав- сравнению с предыдущим (k — 1)-м, т. е. п Рис. 5.14. Параболическая аппроксимация зависимости оце- ночной функции Ф от длины шага р ТЗ Фо E.68) Когда процесс сходится к минимуму, имеем lim ?W = О, поэтому при достижении малых значений Qk\ например, 0,001, оптимизацию можно прекратить. Для того чтобы застраховаться 240
движении I назад г 'проба 8 точке р на траектории, Включает В сеоя ¦ спуск на длину шага р по формуле х=х0+Ах(р), пробу функций и Вычисление оце- - ночной opyHKuuu_fp=fTf движение вперед Вычисление р по формуле (Wt] I проведение параболы и нахождение её Вершины Р-Рг ^наконец шагай проВерку услоВия окончания оптимизации точка р по (Ш)нелучГ ше?чемр2 J Схема 5.3. Алгоритм определения длины шага методом параболиче- параболической аппроксимации от возможности случайного уменьшения ?<fe) только на данном шаге с последующим ее увеличением, рекомендуется останавли- останавливать процесс, только если | имеет тенденцию уменьшаться на двух или трех последовательных шагах, т.е. если ?,№ < ^fe"!) < < ?<ft-2) < - = 0,001. В наиболее благоприятном, но редком случае, когда на k-u шаге достигается абсолютный минимум, т. е. q:(A:) = 0, процесс также следует прекратить, хотя величина ь(/г) в этом случае равна единице. § 32. ОПТИМИЗАЦИЯ С ОГРАНИЧЕНИЯМИ Оптимизация с ограничениями, или условная оптимизация, значительно более сложна и менее разработана, чем рассмотрен- рассмотренная в предыдущих параграфах безусловная оптимизация. Не имея 241
Рис. 5.15. Графики внутренних и внешних штрафных функций здесь возможности полностью изложить этот сложный вопрос, остановимся на некоторых методах, применяемых при оптимиза- оптимизации оптических систем. Методы штрафных функций. Эти методы откосятся к наибо- наиболее простым и универсальным, но для обеспечения точного кон- контроля ограничений требуют многократного повторения процесса оптимизации. Сущность методов состоит в том, что каждому ограничению ставится в соответствие некоторая штрафная функция, возрастаю- возрастающая при нарушении ограниче- ограничения. Штрафы включаются в об- общую систему оптимизируемых функций наравне с остальными, после чего оптимизация про- проводится уже как бы без огра- ограничений рассмотренными выше методахми. Штрафные функции для ограничений типа равенств имеют вид /р.(х) = гЧ-(х). E.69) Штрафные функции для ограничений типа неравенств могут быть двух видов: внутрен- внутренние штрафные, или барьерные, функции и внешние штрафные функции. Внутренние штрафные (барьерные) функции применяются для контроля математических ограничений, при нарушении ко- которых какие-либо из оптимизируемых функций не существуют. Они строятся таким образом, что их значения весьма малы внутри области QB, где математические ограничения не нарушены, но резко возрастают при приближении к границам (рис. 5.15). На- Например: fp,(x) = r(bi(x)r1 E.70) или fPt(x) = -rln(bt(x)). E.71) О выборе множителя г будет сказано чуть позже. Внешние штрафные функции, напротив, чаще применяются для контроля физических или конструктивных ограничений. Строятся эти функции таким образом, что они равны нулю или очень малы в той области, где ограничения не нарушены и резко возрастают при нарушении ограничений, т. е. за границами об- области QB (рис. 5.15). Эти функции могут иметь, например, следую- следующий вид: 0 при 6/(х)>0; ,(х)J при ^(х)<0. ( ^ 242
Строго говоря, методы штрафных функций требуют многократ- многократного повторения всего процесса безусловной оптимизации с изме- изменением коэффициентов г в формулах E.69)—E.72) таким образом, что г уменьшается на каждом 1-й цикле оптимизации. Например: rW^lO-', /==0, 1, 2 .... Повторение оптимизации с изменением г заканчивается, когда процесс сходится, т. е. два последовательно найденных мини- минимума с /*W и г^"*) достаточно близки друг к другу. Естественно, что при оптимизации оптических систем, где даже однократный процесс оптимизации занимает довольно много времени, много- многократное повторение процесса для контроля ограничений не- нереально, поэтому обычно ограничиваются одним циклом оптими- оптимизации при фиксированном г, но при этом некоторые ограничения могут быть нарушены. Контроль линейных равенств методами исключения параме- параметров и лагранжевых множителей. Наиболее простой случай пред- представляют собой линейные ограничения типа равенств, которые можно записать в виде е (х) = е0 + Q Ах = о, E.73) где е0 — вектор ограничений в исходной точке, имеющий раз- мерность sX 1; Q = -— матрица производных ограничений по параметрам, имеющая размерность sXn и постоянная для всех точек пространства. Для соблюдения s ограничений типа E.73) требуется s пара- параметров из общего числа п, поэтому проще всего выбрать какие- либо s параметров и использовать их для контроля ограничений, а оптимизацию производить оставшимися п — s параметрами. Пусть для контроля ограничений используются первые s параметров, которые мы назовем связанными, а остальные п — s параметров будут свободными для оптимизации. Выбор первых s параметров в качестве связанных объясняется только удобством записи дальнейших формул. На самом деле связанными пара- параметрами могут быть любые s из п. Для того чтобы приведенные ниже рассуждения оставались при этом справедливыми, переста- переставим параметры таким образом, чтобы связанные оказались на первом месте. Аналогичные перестановки применимы и к столбцам матриц А и Q в формулах E.23) и E.73). Итак, запишем вектор параметров х, а также матрицы А и Q в выражениях E.23) и E.73) в блочном виде, разбив их на две части, относящиеся к связанным и свободным параметрам: fL (х) = (АХА2) ( д^ ) + fо; е0 + (QA) ( ^ ) = 0. 243
Раскроем произведения, пользуясь правилами действия с блоч- блочными матрицами: f0 + Аг Ах1 + А2 Ах2; е0 + Qx Axj + Q2 Ax2 = о. E.74) Теперь выразим связанною параметры через свободные, поль- пользуясь вторым из уравнений E.74), ДХ1 = —Qrl (eo + Q2 Ax2) E.75) и подставим их в первое равенство E.74). Тогда получим tL (х) = f0 - AiQF1 (eo + Q2 Ax2) -f A2 Ax2 = = fo - AiQF^o + (A2 - A^Cb) Лх2. В результате мы приходим к выражению для линейной модели оптимизируемых функций, только в зависимости от свободных параметров их2)=!0 + АДх2, E.76) где _ __ !0 = f0 - AiQ7W, A - А2 - АЛГ^. E.77) Производя затем оптимизацию с моделью E.76) точно так же, как и с E.23), одним из рассмотренных выше методов безусловной оптимизации, мы получим точку минимума в пространстве свобод- свободных параметров Ах2. Затем найдем связанные параметры Ахх из формулы E.75), обеспечивающей соблюдение ограничений. Для работоспособности этого метода необходимо, как видно из выражения E.75), чтобы матрица Qi производных ограничений по связанным параметрам была бы как можно лучше обусловлен- обусловленной, т. е. чтобы среди связанных параметров не было бы линейно зависимых или невлияющих на функции ограничений. Рацио- Рационально не возлагать выбор связанных параметров на конструктора, а поручить его программе. Другими словами, надо воспользоваться уже упомянутой в § 30 стандартной программой MFGR из сбор- сборника [28] прикладных программ матричной алгебры для поиска среди матрицы Q наиболее линейно независимого базиса из s строк и столбцов. Номера столбцов этого базиса и есть номера ба- базисных параметров, которые мы должны выбрать в качестве свя- связанных. Эта программа использует стандартный метод гауссовского исключения и сама переставляет найденный базис на первое место, сохраняя информацию о перестановках. В ней номера базисных строк и столбцов сохраняются в векторах IROW и ICOL, базис- базисная часть Qi матрицы Q представляется в виде произведения ниж- нижней и верхней треугольных матриц, удобном для нахождения Q71, а также сразу же находится матрица Q^Ct- Естественно, если найденный размер базиса г, т. е. ранг ма- матрицы Q меньше s, то мы не можем никакими параметрами из п соблюсти все заданные ограничения и оставшиеся s — г ограни- ограничений необходимо исключить из контроля. 244
Тождественные результаты дает метод неопределенных множи- множителей Лагранжа. Воспользуемся им для нахождения минимума квадратичной формы E.27), т. е. оценочной функции линейной модели E.23) при соблюдении системы линейных равенств E.73). В общем случае с демпфированием мы должны искать минимум квадратичной формы с матрицей Нр. Составим лагранжеву функцию * = т (Фо + 2 AxTg0 + AxTH, Ax) - (е0 + Q Дх)т I E.78) и приравняем нулю ее производные по параметрам х и лагранже- вым множителям Я. В результате получим: Выражая Ах через 'к из первого уравнения и подставляя во второе, а затем решая его относительно % и подставляя результат обратно в первое, получим формулу для решения по ДМНК при наличии линейных равенств в виде i\x = — tip {go — ц л;, где л = - E.80) Можно также записать это решение в следующем виде: Ах = Дх^ — бх, E.81) где Ах, = —H^go — вектор решения по ДМНК без учета ограни- ограничений; бх = H^Q1 (QHp1QT)e — поправка на ограничения; е = е0 + QAx^ — вектор значений ограничений в точке х0 + + Дх^ решения, лолученного без учета ограничений. Если используется не ДМНК, а обычный МНК, то вместо Нр1 в предыдущие формулы нужно подставить Н, если используется МНКОБ —то Н*. Заметим, что выражение E.79) можно записать в виде одного матричного уравнения, используя блочные матрицы: \eo/ + \Q О ) \—М = \о) И \—Ь/= \ Q О/ Uo/ E.82) Практически, однако, решение уравнений E.82) вместо E.80) нерационально, поскольку порядок матриц в E.82) на s больше, чем в формуле E.80). Соответственно требуется в A + sinJ раз большая память и в A + slrif раз большее количество вычи- вычислений. Описанные в настоящем разделе методы обеспечивают точный контроль линейных равенств. Контроль линейных неравенств методами исключения пара* метров или лагранжевых множителей. Рассмотренные методы мо- могут с успехом применяться и для контроля линейных ограниче- 245
ний типа неравенств. При этом в процессе контроля по формуле E.76) и E.80) с ними оперируют, как с равенствами. Основная проблема заключается в том, какие ограничения — неравенства включать в так называемый активный набор для контроля как ра- равенства. Формирование активного набора производится постепенно при помощи операций включения в набор и вывода из него. Будем пола- полагать, что в начальной точке х0 данного шага ни одно из неравенств не нарушается, т. е. эта точка является допустимой. Методом безусловной оптимизации построим направление спуска из этой точки без учета ограничений. Если при движении по этому на- направлению ограничения не нарушаются, то контроль их не тре- требуется. Пусть, спускаясь по построенному направлению из х0, мы нарушили какое-либо неравенство. В этом случае остано- остановимся на его границе в точке хх и включим ограничение в актив- активный набор в виде равенства. Используя формулы E.80), от точки хх будем двигаться с учетом этого ограничения, т. е. вдоль его гра- границы. Если при этом движении нарушается еще одно неравенство, то останавливаемся на его границе в точке х2, включаем его в на- набор и двигаемся далее по пересечению границ двух неравенств. Таким образом, движемся, пополняя активный набор. Рассмотрим теперь вывод ограничения из активного набора. Пусть мы уже имеем некоторый активный набор и двигаемся по траектории вдоль пересечения всех ограничений активного на- набора. На каком-то шаге может оказаться, что это нерационально, т. е. искомый минимум лежит в той области, где какие-либо огра- ограничения из активного набора не нарушены. Нетрудно показать, что этим ограничениям соответствуют в выражении E.80) отрица- отрицательные лагранжевы множители, а действительно активным — положительные. Таким образом, найдя X по формуле E.80), мы должны вывести из активного набора то ограничение, которому соответствует отрицательный лагранжев множитель и пересчи- пересчитать % и Ах уже без этого ограничения по формулам E.80). Заме- Заметим, что если мы получили несколько отрицательных лагранже- вых множителей, то не следует выводить из набора сразу несколько ограничений (ограничения выводятся по одному). Здесь возникает важная проблема выбора выводимого ограничения. Можно вы- вывести ограничение, у которого лагранжев множитель наимень- наименьший (при условии, что все строки матрицы Q имеют одинаковую длину). Существуют и другие рекомендации, приведенные в ра- работах [1, 33]. Формируя активный набор, мы в конце концов придем в точку, находящуюся на границе всех активных ограничений, в которой остальные, неактивные ограничения соблюдаются, а лагранжевы множители активных ограничений положительны и кроме того вы- выполняется система равенств E.79). Эта точка и будет точкой услов- условного минимума квадратичной формы E.27) с матрицей Н или Нр при соблюдении всех ограничений. 246
При движений с формированием активного набора не нужно в граничных точках хь х2 и т. д. заново вычислять матрицу Гессе Н. Можно пользоваться матрицей, полученной в начальной точ- точке х0 данного шага оптимизации. Таким образом, все описанные действия относятся к одному шагу спуска и на следующем шаге повторяются. Контроль нелинейных ограничений. Такие ограничения могут контролироваться описанными методами исключения параметров или лагранжевогх множителей. Необходимо учитывать при этом, что из-за нелинейности ограничений матрица Q, содержащая про- производные ограничений по параметрам, не постоянна, поэтому необходимо перевычислять ее в каждой новой начальной точке при помощи пробы производных. Основная проблема заклю- заключается в том, что границы ограничений в этом случае криволинейны и поэтому рассмотренные выше методы, в отличие от случая ли- линейных ограничений, не гарантируют точного контроля. В про- процессе спуска те или иные ограничения могут нарушаться и тем сильнее, чем больше они отличаются от линейных. В силу этого конечная точка данного шага может оказаться недопустимой по ограничениям и перед тем как перейти к следующему шагу, который должен начинаться с допустимой точки, требуется вос- восстановление нарушенных ограничений. Так как обычно количество нарушенных ограничений, подлежащих восстановлению, не ве- велико и не превосходит количества параметров, для восстановле- восстановления подходит метод неопределенных множителей Лагранжа, рас- рассмотренный в § 29. Этот метод позволяет добиться восстановле- восстановления при минимальном изменении параметров. Применяя формулу E.51) для задачи восстановления, мы должны заменить матрицу А на матрицу Q, содержащую производные нарушенных ограниче- ограничений по параметрам, а вектор f0 — на вектор Ьо, содержащий зна- значения нарушенных ограничений в начальной точке х0. В резуль- результате получим Дх-—Q2QT(QQ2QT)-ibj Так как ограничения в общем случае нелинейны, то процесс восстановления является итерационным. Как следует из анализа, приведенного в § 29, для хорошей сходимости восстановления необходимо, чтобы среди восстанавли- восстанавливаемых ограничений не было бы линейно зависимых между собой или независящих ни от одного из параметроз. В противном случае матрица QQ2QT становится плохо обусловленной и сходимость замедляется. Для улучшения сходимости можно применить дем- демпфирование матрицы QfJ2QT, описанное на стр. 236, или воспользо- воспользоваться операцией обобщенного обращения, рассмотренной стр.233. § 33. МЕТОДЫ СИНТЕЗА ОПТИЧЕСКИХ СИСТЕМ В отличие от универсальных методов оптимизации, требующих от конструктора задания исходной системы, программы синтеза позволяют определить конструктивные параметры без начального 247
приближения. Поскольку методы синтеза являются объектно- ориентированными, их математический аппарат строится с учетом особенностей синтезируемого тина системы. Синтез простейших типов оптических систем. Одним из наи- наиболее простых и в то же время распространенных является двух- линзовый склеенный объектив (дублет), обладающий хорошими коррекционными возможностями и удовлетворительным каче- качеством изображения при размерах углового поля в пространстве предметов до 15° и относительных отверстиях до 1 : 4. До приме- применения ЭВМ расчет склеенного дублета выполнялся по методике Г. Г. Слюсарева [30] с помощью специальных таблиц и номограмм. Автоматизация синтеза дублета позволила значительно расши- расширить диапазон характеристик и получить более совершенные кон- конструкции. Рассмотрим некоторые варианты программ синтеза дуб- дублетов. Программа, разработанная в ГОИ им. С. И. Вавилова [30], основана на методике Г. Г. Слюсарева с автоматическим выбором комбинации стекол, обеспечивающих заданные значения основных параметров в теории аберраций третьего порядка. Выбор произво- производится из двух заранее составленных и хранящихся в памяти ЭВМ наборов комбинаций. Набор № 1 включает в себя 35 комбинаций из 22 марок стекол, а набор № 2 — 12 комбинаций флюорита с различными стеклами, близкими к нему по относительным част- частным дисперсиям. Синтез производится в области аберраций третьего порядка. Исходными данными являются требуемые значения основных па- параметров Р, W, С, а результатами — конструктивные параметры дублета. Программа, разработанная в ЛИТМО, осуществляет синтез дублета в области аберраций третьего и пятого порядков. Исход- Исходными данными являются размер поля в пространстве предметов, спектральный интервал, апертура и обобщенное увеличение, а также, в случае необходимости, аберрации другой части системы, которые должны компенсироваться аберрациями дублета. Выбор пары стекол производится перебором всех возможных комбинаций из заданного набора, содержащего N марок стекла. Всего переби- перебирается N (N — 1) пар, из которых выбирается наилучшая по сред- неквадратической волновой аберрации. Усреднение осуществ- осуществляется по зрачку, предмету и спектральному интервалу. Опреде- Определение конструктивных параметров для каждой нары стекол про- производится посредством решения уравнений в области аберраций третьего порядка (система из квадратного и линейных уравне- уравнений), а затем уточнения решения с учетом аберраций пятого по- порядка, исходя из минимизации оценочной функции (среднего ква- квадрата волновой аберрации) при помощи универсальных методов оптимизации. На этом этапе используется аналитическая проба производных, обеспечивающая минимальное количество вычисле- вычислений, и ДМНК для поиска минимума. Практика эксплуатации 248
-Ж,№ d 2,5 0,01 f-WQ,2u>'0;A Ao='0,58S};\г0,Ш Марка cmma K8 ТФ1 л У -06 t/ V рг у щ As[nm 0,1 oz,% программы показала, что полученная конструкция обычно уже не требует дальнейшего уточнения в области аберраций действи- действительных лучей. Благодаря использованию в качестве критерия глобальной полихроматической среднеквадратической волновой аберрации в описанном методе синтеза достигается оптимальная взаимная балансировка всех аберраций. На рис. 5.16 показаны конструк- конструктивные элементы и графи- а) ки аберраций двух дубле- дублетов с фокусным расстоя- расстоянием /' = 100 мм и отно- относительным отверстием 1 :5 (апертурой А'о = 0,1) син- синтезированных из набора, содержащего 23 марки стекла: ЛК1, КЗ, К8, БК8, БК12, ЛФ10, БФ24, БФ28, Ф1, Ф8, ТФ1, ТФ2, ТФ8, ТФ10, ТБФ4, КФ4, ОФ2, ТК1,СТКЗ, СТК9, СТК12, ТК8, ТФ7. Дублет, пока- показанный на рис. 5.16, а, синтезировался с нулевой величиной поля в про- пространстве предметов, по- поэтому неизопланатизм не щ включался в критерий -38,901 1Q? 49Q коррекции и, как видно mJ?ij из графиков, достигал зна- значительной величины, т. е. 0,25 %. Среднеквадрати- ческая волновая аберра- аберрация без учета неизоплана- тизма, на нулевом поле со- составляет 0,01 длины волны. Дублет, показанный на рис. 5.16, б, в отличие от предыдущего синтезировался с полем 2со = 10°, что привело к выбору другой пары стекол БК8 и Ф8 вместо К8 и ТФ1, а также резкому уменьше- уменьшению неизопланатизма (до —0,019 %). Среднеквадратическая вол- волновая аберрация на поле 10° составляет всего 0,013 длины волны. На рис. 5.17 показаны результаты синтеза дублета, работающего в инфракрасной области в интервале длин волн от 1,8 до 3,5 мкм (к0 = 2,6 мкм, ДА, = 0,85 мкм) с относительным отверстием 1 : 2 (апертурой Aq = 0,25) и угловым полем в пространстве предмета 2@ = 10°. Из набора материалов для инфракрасной области спек- спектра (CsJ, KRS-6, LiF, CaF2, SiO2, BaF2, AgCl, Иртран-2, As2S3) оказались наилучшей парой AgCl и As2S3. При этом, несмотря на высокую апертуру, среднеквадратическая волновая аберрация 249 Рис. 5.16. Примеры синтеза склеенных дуб- дублетов
f-100;2w-fO°;A0'B,25; 26Л28 Х не превышает 0,008 длин волн (для Хо = 2>6 мкм). Графики, по- показанные на рис. 5.16—5.17, демонстрируют, во-первых, оптималь- оптимальную форму коррекции монохроматических и хроматических абер- аберраций, а во-вторых, достаточную точность описания аберраций членами третьего и пятого порядков. В качестве примера укажем также разработанную в ГОИ им. С. И. Вавилова программу, приведенную^ работе [30], для автоматического синтеза в области аберраций третьего порядка двухкомпонентных оптиче- оптических систем, состоящих из двух элементов малой тол- толщины, разделенных малым воздушным промежутком. Синтез оптических систем набором из поверхностей с заданными свойствами. Весьма перспективной мето- методикой синтеза любых опти- оптических систем, особенно све- светосильных и широкоуголь- широкоугольных объективов, для которых другие методики практически отсутствуют, является пред- Рис. 5.17. Синтез склеенного дублега в ин- инфракрасной области спектра ложенный М. М. Русиновым в книге [27] набор из поверх- поверхностей и элементов с заданными свойствами. Эта методика выгодно отличается тем, что позволяет избежать введения в систему «лишних» параметров, а исследование свойств и коррекционных возможностей производить в области реальных лучей. В качестве поверхностей с заданными свойствами исполь- используются так называемые изопланатические поверхности, вносящие примерно одинаковые аберрации по всему полю предмета. Синте- Синтезируя оптическую систему на базе линз с изопланатическими по- поверхностями, можно, как показал опыт, получить исходную кон- конструкцию, обладающую удовлетворительной коррекцией аберра- аберраций, и главное, хорошими коррекционными возможностями для последующей оптимизации. Основным типом поверхности является апланатическая, кото- которая образует идеальное изображение одной сферы на другую. При совпадении поверхности предмета со сферой апланатическая поверхность будет строго свободна от аберраций по всему полю. Второй тип поверхности — концентрическая по отношению к зрачку. На эту поверхность главный луч падает под прямым уг- углом, поэтому она не вносит астигматизма и комы, а имеет только сферическую аберрацию и кривизну изображения. При проектировании микрообъективов широко применяются поверхности, концентричные осевой точке предмета. Для осевой зоны они обладают строгим апланатизмом, но при удалении точки предмета с оси аберрации быстро возрастают. 250
Набор из указанных поверхностей можно производить в пара- параксиальной (гауссовой) области, но при этом полученная система может иметь большие аберрации для внеосевых точек предмета и даже не обеспечить прохождения реальных лучей. Поэтому ра- рациональнее определять кривизны поверхностей апланатической и концентрической по отношению к зрачку по главному лучу, идущему от крайней точки предмета. Нетрудно получить следую- следующие формулы для определения значений кривизны поверхностей. Для поверхности, концентричной зрачку (тип КЗ), E.83) Для поверхности, концентричной предмету (тип КП), Для анапланатической поверхности (тип АП) Г Х + ^ J^l +«A —К2)!. E.85) где со -= (-^"J; h = VkHk-i + K-iYk\ lz = ak (Zk-i — 4-i) + hk_±Zk; rik+i В предыдущих формулах dk_i — расстояние до синтезируемой поверхности от предыдущей; yk_l9 zk_l9 Yk, Zk — линейные и уг- угловые координаты главного луча после преломления на предыду- предыдущей (k — 1)-й поверхности; %'к-\ — величина, обратная расстоя- расстоянию вдоль главного луча от предыдущей поверхности до фокуса бесконечно узкого пучка, преломленного на этой поверхности. Набор системы из поверхностей с применением формул E.83)— E.85) производится в процессе расчета главного луча и бесконечно узких пучков, т. е. дифференциалов лучей, проходящих через систему. Перед расчетом луча через какую-либо поверхность оп- определяется ее кривизна в зависимости от заданного типа по форму- формулам E.83)—E.85), а сам расчет луча и дифференциалов произво- производится по формулам, рассмотренным в гл. 3. Последовательность поверхностей различного типа, а также осевые расстояния и по- положение зрачка должны быть заданы конструктором. Нетрудно увидеть, что наиболее трудной задачей синтеза систем из поверхностей является именно определение таких зна- значений осевых расстояний, которые обеспечили бы требуемые зна- значения следующих характеристик: увеличения, заднего отрезка и тех аберраций, устранение которых не обеспечивается автомати- автоматически свойствами изопланатических поверхностей. Как показы- показывает исследование, все эти характеристики весьма сильно зависят от небольших изменений осевых расстояний, поэтому приближен- приближенное определение последних конструктором без помощи ЭВМ 251
шаг-1 весьма затруднительно. Следовательно, необходимым этапом синтеза является автоматическое определение значений осевых расстояний. В программе синтеза, разработанной в ЛИТМО, эта задача решается как задача оптимизации. При этом в качестве параметров оптимизации выбираются осевые расстояния и положение апер- турной диафрагмы или зрачка, а в качестве оптимизируемых функ- функций — отклонения от задан- заданных значений в форме E.4) таких характеристик как: увеличение, задний отрезок, положение зрачков, некон- неконтролируемые автоматически аберрации. В ограничения включены условия прохождения глав- главного и апертурного лучей на всех поверхностях и усло- вия конструктивной реализа- ддд ции системы. Проба состоит 4,96 г 13,0 8,0 16.W 12,503 -56,927 -15,081 17,216 12,759 -53,885 -18,386 31,118 -92,809 d 5,0 3,31 18,25 5,11 20,06 д'дд , -33,777 -20,686 157,05^ -71,477 23,323 15,2^8 -ЧЩЦ- -29,275 117,383 -105,375 20,75 23,0 10,89 9,59 7,51 16,7k 26№ 8,65 15,70 в наборе системы из поверх- поверхностей с теми значениями осевых расстояний, которые соответствуют значениям па- параметров оптимизации в дан- данной точке пространства пара- параметров, в расчете лучей и определении необходимых характеристик. Оптимизация производится при помощи ДМНК с контролем ограни- ограничений методом внешних штрафных функций. От кон- конструктора здесь требуется за- задание только начальных, весьма приближенных зна- значений осевых расстояний. Для примера рассмотрим в соответствии с описанной методикой синтез исходной конструкции светосильного широкоугольного фотообъектива с угловым полем в пространстве предметов 2со = = 80 °, апертурой Aq = 0,25 и фокусным расстоянием /' = = 50 + 2 мм. Последовательность поверхностей взята из книги М. М. Русинова [27]: КЗ—КЗ—А—КЗ—А—КЗ. Как видно из рис. 5.18, система состоит из трех линз, первая из которых кон- центрична, вторая и третья образованы из апланатическои и кон- концентричной зрачку поверхностей. Апертурная диафрагма распо- расположена после первой линзы. Марки стекла и начальные значения осевых расстояний показаны на рис. 5.18. На первом шаге про- 252 Рис. 5.18. Процесс синтеза объектива на- набором из поверхностей
цесса синтеза при наборе системы было нарушено условие прохож- прохождения апертурного луча на второй поверхности. На следующем шаге это явление было устранено, но оказались нарушенными ус- условия преломления без полного внутреннего отражения и про- прохождения апертурного луча не за пересечением поверхностей на четвертой поверхности. На третьем шаге процесса система была полностью построена без нарушения условий прохождения. Од- Однако фокусное расстояние сильно отличалось от заданного B1,65 мм вместо 50 мм), и толщина по краю у второй линзы ока- оказалась слишком малой. После четвертого шага было достигнуто, в пределах допуска, заданное значение фокусного расстояния D8,5 мм вместо 50 мм) и удовлетворены условия конструктивности. Так как изопланатические поверхности не вносят астигматизма, то для крайней точки предмета, для которой производился набор систем, астигматизм отсутствует, т. е. zm — гъ = 0. Однако си- система имеет значительную сферическую аберрацию для апертур- апертурного луча As' = —7,62 мм и кривизну изображения т 2 S| = = 0,77 мм. Для устранения этих аберраций потребовалось еще два шага. После этого оказался отрицательным задний отрезок. Для исправления этого нарушения потребовался еще один шаг. На рассмотренных примерах мы видим, что в процессе синтеза часто используется математический аппарат и методы оптимиза- оптимизации. С другой стороны, результат синтеза почти всегда требует последующей доводки универсальными программами оптимиза- оптимизации. Таким образом, процессы синтеза и оптимизации при проек- проектировании оптических систем весьма тесно связаны. Особенностями оптимизации в процессе синтеза являются: специфические пара- параметры оптимизации, связанные с типом синтеза; небольшое коли- количество оптимизируемых функций (две—пять аберраций), но зна- значительное количество ограничений (условий прохождения лучей, построения системы, конструктивных ограничений); аналитиче- аналитическая проба и проба производных, специфические для данного типа, как, например, при синтезе дублетов. Все это позволяет быстро просматривать множество вариантов, а также в широких пределах менять конструкцию для получения результата синтеза, удовлетворяющего небольшому количеству основных требований и пригодному для последующей оптимизации. Пример синтеза оптической системы с последующей оптими- оптимизацией и анализом структуры изображения. В качестве иллюстра- иллюстрации приведем некоторые этапы автоматизированного проектиро- проектирования широкоугольного гидрообъектива при помощи САПР оп- оптических систем в диалоговом режиме на ЭВМ ЕС-1040 с комплек- комплексом алфавитно-цифровых дисплеев ЕС-7906. Угловое поле в про- пространстве предметов (в воде) объектива равно 2 со = 90°, апертура Л о = 0,14 (относительное отверстие 1 : 3,6). Сначала была син- синтезирована половинка объектива с помощью набора из поверхно- поверхностей с заданными свойствами в следующей последовательности: 253
КП—КЗ—АП—АП—КЗ—КЗ—0 (рис. 5.19). Символ 0 означает плоскую поверхность. Задняя половинка получена оборачива- оборачиванием передней части. Из образовавшейся после их соединения сим- симметричной конструкции удалена последняя линза. Рис. 5.19. Исходная конструкция гидрообъектива, синтези- синтезированного набором из поверхностей -WHO) 0 0,2A0) z'm,z'S)MN '0,1 0 Рис. 5.20. Графики аберраций гидрообъектива: сплошные линии—результат оптимизации; пунктир — исходная конструкция На рис. 5.20 пунктиром изображены графики аберраций син- синтезированной конструкции, из которых видно, что мы получили лишь весьма грубое начальное приближение и требуется последую- последующая оптимизация. 254
Для оптимизации были выбраны в качестве параметров: зна- значения кривизны всех поверхностей, кроме первой плоскости, граничащей с водой; все осевые расстояния; положение апертур- ной диафрагмы и положение плоскости установки (всего 24 пара- параметра). В качестве оптимизируемых функций взяты церниковские коэффициенты аппроксимации аберраций в виде E.11). Для ап- аппроксимации использовалось небольшое количество лучей: два луча осевого пучка, по три луча в каждом из четырех внеосевых пучков для трех длин волн. Всего вместе с характеристиками 250 200 50 5 10 15 20 25 30 55 kO 50 55 60 Номер шага Рис. 5.21. Изменение оценочной функции в процессе оптимизации гидрообъектива в гауссовой и зейделевой областях получилось 38 оптимизируе- оптимизируемых функций. Как видно из рис. 5.20, дисторсия в объективе достигает больших значений — до 25 %, но такие значения допус- допускались по условиям работы, поэтому дисторсия в оптимизируемые функции включена не была. Заданное значение обобщенного уве- увеличения v0 = —50 ± 1 мм контролировалось как ограничение типа равенства. В ограничения типа неравенств были включены максимальные и минимальные значения толщин линз, воздушных промежутков и заднего отрезка, а также условия прохождения лучей. Производные оптимизируемых функций и ограничений вы- вычислялись при помощи внешней пробы производных с односторон- односторонними разностями. Для оптимизации использовался локальный спуск с выбором направления спуска по методу наименьших квадратов на оптимальном базисе (МНКОБ) и с нахождением оптимальной длины шага вдоль направления методом параболиче- параболической аппроксимации. Ограничения контролировались методом исключения параметров. В процессе оптимизации было проделано 60 шагов, на каждом из которых определялись производные, направление спуска и длина шага. В среднем выполнение одного шага занимало 20 с 255
машинного времени при скорости ЭВМ порядка 400 тыс. операций в секунду. В результате удалось улучшить оптимизируемые функ- функции в среднем в 45 раз. Перед началом оптимизации длина вектора оптимизируемых функций составляла ||f | = 220 единиц (оценоч- Рис. 5.22. Схема гидрообъектива, полученная после оптимизации , 50 7 лин/мм О 25 . 50" 0 25 Рис. 5.23. Графики модуляционных передаточных функций гидрообъектива ная функция ф-— || f f — S ft — 48 400), а по окончании оптими- i зации — 4,9 (оценочная функция ф = ||f ||2 = 24). Изменение оценочной функции по шагам показано на рис. 5.21. Конструкция результата оптимизации изображена на рис. 5.22, а графики аберраций приведены на рис. 5.20 сплошными линиями в масштабе, в десять раз более крупном, чем у исходной системы. Обратим 256
Рис. 5.24. Точечная диаграмма гидрообъектива для крайней точки предмета и основной длины волны 100 90 80 70 60 50 30 20 10 0 0,01 ОД 0,03 0№ 0,05 0,06 0,07 0,03 0,09 0,1 Рис. 5.25. Графики концентрации энергии в изобра- изображении, формируемом гидрообъективом: сплошные линии — с учетом дифракции: пунктир — в геоме- геометрическом приближении 257
внимание на то, что конструкция исходной системы и результат оптимизации отличаются не очень существенно, несмотря на 45- кратное улучшение характеристик. Такое явление вообще харак- характерно для оптимизации, которая обычно достигается сравнительно небольшим изменением конструктивных параметров. Очень часто схемы исходной и результирующей конструкции почти не отличаются. Напротив, применение аналогичных методов при синтезе, как показано на рис. 5.18, приводит обычно к существен- существенному изменению конструкции. На рис. 5.23—5.25 представлены результаты анализа характе- характеристик структуры изображения конструкции, полученной в ре- результате оптимизации. Изображенные на рис. 5.23 графики моду- модуляционных передаточных функций (частотно-контрастных ха- характеристик) получены методом эллиптической аппроксимации области интегрирования, рассмотренным в гл. 4. Точечные диа- диаграммы и концентрация энергии в геометрическом приближении получены методом элементарных площадок, описанным в § 24 (рис. 5.24 и 5.25); дифракционная ФРТ вычислена методом БПФ, рассмотренным в § 25, с количеством узлов 128x128; концентра- концентрация энергии в дифракционном приближении (рис. 5.25, сплошные линии) получена по этой ФРТ численными кубатурами Симпсона. Из приведенных результатов видно, что объектив относится несомненно к геометрически-ограниченным системам, так как ре- реальная МПФ в присутствии аберраций существенно отлична от нуля в интервале пространственных частот v' < 50 лин/мм, во много раз меньшем, чем предельная дифракционная частота v{im ^ ^ 500 лин/мм, до которой простирается безаберрационная МПФ, показанная на рис. 5.23 штриховыми линиями. Видно также, что графики концентрации энергии, полученные в геометрическом приближении, хорошо согласуются с графиками, рассчитанными с учетом дифракции.
Глава 6 РАСЧЕТ ДОПУСКОВ НА ПАРАМЕТРЫ ОПТИЧЕСКИХ СИСТЕМ Определение допустимых отклонений конструктивных пара- параметров оптических систем является необходимым этапом проекти- проектирования, без которого невозможны выпуск технической докумен- документации и последующее изготовление оптических деталей, а также сборка системы. Более того, часто полученные допуски оказыва- оказываются настолько жесткими, что не могут быть реализованы. В этом случае приходится возвращаться к начальным этапам проектиро- проектирования и либо менять тип оптической системы, обеспечивающий большую технологичность конструкции, либо даже пересматри- пересматривать техническое задание. В простых случаях при назначении допусков обходятся без ЭВМ, пользуясь приближенными формулами и рекомендациями для типовых оптических систем и деталей, приведенными, на- например, в работе [30]. Однако при проектировании современных высококачественных и сложных оптических систем, необходимо применение ЭВМ и соответствующего математического аппарата. § 34. СТАТИСТИЧЕСКОЕ ОПИСАНИЕ ОШИБОК ИЗГОТОВЛЕНИЯ И СБОРКИ ОПТИЧЕСКИХ СИСТЕМ В процессе изготовления и сборки конструктивные параметры оптической системы приобретают случайные отклонения от номи- номинальных значений, что вызывает, в свою очередь, случайные откло- отклонения ее характеристик. Математические модели, положенные в основу расчета до- допусков описывают в этом случае оптическую систему как объект изготовления и сборки. Они являются статистическими моделями и строятся на базе теории вероятности, а также математи- математической статистики [34]. В результате случайных неконтролируемых воздействий откло- ния 97 конструктивных есть случайные величины. Для полного описания случайной величины необходимо знать закон ее распределения, который, в свою очередь, характеризуется функцией плотности вероятности f @), показывающей вероят- 259
ность того, что значение случайной величины лежит в каком- либо интервале (9Ь 92), т. е. о2 о. F.1) Для точного определения законов распределения технологиче- технологических погрешностей, необходимо проводить серьезные и трудоем- трудоемкие статистические исследования оптического производства, но часто с хорошим приближением можно считать, что эти погреш- погрешности распределены по нормальному закону, т. е. ^W]. F.2) В этом случае нам достаточно двух параметров закона — мате- математического ожидания \х = МО (9) и дисперсии о^ = D (9) или среднеквадратического отклонения (СКО) а = у а2. Для боль- большинства технологических ошибок можно принять, что \ь = 0. Как следует из формул F.1) и F.2) с вероятностью ^0,95, величина 9 не выходит за пределы ±2а, поэтому удвоенное СКО можно с 5 % -ным риском принять за допуск 69 на данную ошибку, т. е. 69 = 2а. F.3) Объединим случайные ошибки всех параметров в случайный вектор 6: 6Т = (9Ь 92, . . ., 0Л). В этот вектор входят ошибки всех рассмотренных в гл. 1 конструктивных параметров, а именно: параметров оптических сред, параметров формы поверхностей и их взаимного расположения. Для каждой среды мы имеем столько параметров, сколько до- достаточно для описания погрешности ее показателя преломления в рабочем интервале длин волн. Обычно достаточно двух пара- параметров 8пХо И 6 (пК — AljJ. Для каждой сферической поверхности мы имеем ошибку в кривизне 6р0 и цилиндричности поверхности 6рц. При наличии последней ошибки сфера становится поверхностью двоякой кри- кривизны со следующими значениями кривизны: Р* = Ро — ~2 бРц' Ру = Ро + " 6Рц- Ошибки взаимного положения поверхностей в центрированных системах состоят из ошибки осевого расстояния Ыг и ошибок децентрировки, а именно: поперечных смещений Ых, Ыг или по- поворота поверхности вокруг осей х и у. При наличии указанных ошибок центрированная оптическая система, составленная из сферических поверхностей, становится нецентрированной и по- поверхности становятся несферическими (торическими или поверх- поверхностями двоякой кривизны) с уравнением B.94), поэтому для ана- анализа влияния ошибок в этом случае необходимо пользоваться ал- 260
горитмамй расчета хода лучей, учитывающими наличие децентри- ровок и несферических поверхностей. Кроме перечисленных, так называемых общих ошибок, на ха- характеристики оптических систем, в частности, на качество изобра- изображения, влияют и местные ошибки, к которым относятся местные неоднородности показателя преломления (свили, оптическая не- неоднородность) и местные дефекты формы поверхностей (местные «ямы» и «бугры», «заваленный» или «поднятый край» и др.)- Оп- Определение их влияния на качество изображения точными мето- методами весьма сложно и поэтому эти ошибки мы не включаем в об- общий вектор 9, а при необходимости влияние их исследуется от- отдельно. В соответствии с материалом гл. 3 и 4 по известным конструк- конструктивным параметрам мы можем определить необходимые характе- характеристики оптической системы, которые объединим, как и раньше, в вектор f: fT = (fl9 Д>, . . ., fm). Так как параметры — случай- случайные величины, то и характеристики f — тоже случайные вели- величины. При малых отклонениях параметров от номинала можно счи- считать, что все характеристики линейно зависят от ошибок 9, т. е. можно описать их зависимость линейной моделью в виде f (9) = f0 + АО = f0 + У, F.4) где у = f (9) — f0 = А9; f0 — вектор номинальных значений характеристик; А = (а/у-)=^ \~ш~) —матрица частных произ- производных всех характеристик по всем параметрам, входящим в век- вектор 9. Элементы этой матрицы могут быть получены методами, опи- описанными в § 19 гл. 3. Как следует из теории вероятности, элементы вектора у слу- случайных отклонений характеристик оптической системы от номи- номинальных значений также распределены по нормальному закону с нулевым математическим ожиданием и с дисперсиями с$. = = D (//,), равными <??& F.5) где а§. — дисперсии соответствующих ошибок 9У. § 35. РАСПРЕДЕЛЕНИЕ ДОПУСКОВ ПО РАЗЛИЧНЫМ ОШИБКАМ Важными моментами, определяющими решение задачи о до- допусках на технологические ошибки оптических систем, являются следующие: — выбор критерия допустимости отклонений характеристик от номинальных значений; 261
— выбор способа суммирования влияния ошибок различных параметров; — распределение допусков по различным параметрам. Рассмотрим сначала первые два момента. Обычно при опреде- определении допусков требуют, чтобы при любых отклонениях кон- конструктивных параметров в пределах их допусков б07- отклонения всех характеристик также оставались в пределах своих допусков, Ьу» т- е- \уЛ = а/А- yi при любых 9/ таких, что jO/1^68/. F.6) Так как | 1]а//9/| < Jj-I^v^j I» T0 требование F.6) заменяют следующим: п 2] | ац | 69/ < 6yt для i = 1, . . ., т. F.7) /=i Однако при таком законе сложения допусков по максимуму мы хотя и получаем гарантию выполнения условия F.6), но при этом допуски 69/ на параметры слишком жесткие. С вероятностью 95 % выполняется неравенство \yt\ <^2ay.i> поэтому в соответствии с формулой F.5) получаем другой, вероят- вероятностный закон сложения допусков 2 а%- F0,.J < фу{? для / = 1, . . ., т. F.8) Условия F.7) или F.8) должны выполняться для всех характе- характеристик. Если рассматривать их отдельно для каждой i-й характе- характеристики, мы получим, очевидно, свои допуски на ошибки параме- параметров 69 /. В качестве окончательных нужно принять наименьшие допуски, т. е. 69/ = min F9,7). Тогда все условия F.7) или F.8) будут автоматически соблюдаться. Такой критерий назначения допусков по допустимым отклоне- отклонениям всех характеристик обладает существенными недостатками: во-первых, трудно назначить обоснованные допуски на все ха- характеристики, особенно на аберрации различных лучей; во- вторых, при этом не учитывается возможная взаимная компенса- компенсация влияний изменения различных аберраций на качество изобра- изображения (балансировка аберраций) и поэтому полученные допуски на параметры получаются ужесточенными. Из сказанного выше следует, что рациональнее устанавливать допуски на ошибки изготовления исходя из допустимого изменения одной оценочной функции, объединяющей в себе все характе- характеристики fi оптической системы. К этой функции предъявляются те же сформулированные в § 26 гл. 5 требования, что и к оценоч- оценочной функции, введенной при оптимизации оптических систем. Будем считать поэтому, что эти две функции тождественны и оп- 262
ределяются выражением ф = iTf, т. е. представляют собой сумму квадратов надлежащим образом выбранных характеристик. Рассмотрим зависимость оценочной функции <р от технологи- технологических ошибок. Из формулы F.4) получим ф - foTfo + 29TAf0 + втАтА0 = ф0 + 26Tg0 + 6ТН9, F.9) где g0 = ATf0 = -у уф — градиент оценочной функции; Н ^= ^ [h:\ = -1Г ( ^ \ = АТА — ее матрица Гессе в пространстве технологических ошибок 0. Так как ошибки 6 — случайные величины, то и оценочная функция ер — тоже случайная величина. Найдем ее математиче- математическое ожидание. В соответствии с формулой F.9) можно запи- записать, что МО (ф) = МО (ф0) + 2МО FTg0) + МО (9тНв). Рассмотрим различные члены этой суммы. Очевидно, что МО (Фо) - Фо. Далее МО (8Tgo) - МО (S 0/g0/) - SgoyMO^-)- = 0, так как МО (fy) = О и, наконец, МО(етН0)- - МО ( 2 ? QjQkhJk) = Е 2 hjkMO (Щ). \ j к I Ik Поскольку мы считаем различные технологические ошибки статистически независимыми друг от друга случайными величи- величинами с нулевыми математическими ожиданиями, то математические ожидания членов, содержащих произведения различных ошибок, будут равны нулю, а произведения одинаковых ошибок — диспер- дисперсиям соответствующих ошибок, т. е. ( 0 при \фк\ А) = Ц при jsskm Итак, МО (ср) = ф0 + Дер, F.10) где Аф == 2 h}jol. > 0. Следовательно, математическое ожидание ф всегда больше ф0, т. е. технологические ошибки в среднем ухудшают качество си- системы на величину Аф. Пусть мы имеем допуск бф на ухудшение оценочной функции. Тогда из формулы F.10) получаем условия для назначения допусков на технологические ошибки 2 hnol. < бФ, или 2 Л// (б6;-J < ^-. F.11) / J / Как назначить допуск бф? Проще всего принять бф = аф0, где а — некоторый коэффициент. Например, если а = 0,2, то мы допускаем 20 %-ное ухудше- ухудшение из-за технологических погрешностей. При малых ф0, когда номинальная система близка к идеальной, мы не можем пользо- 263
ваться последней формулой, так как допуск бф получается очень жестким (в пределе равным нулю). В этом случае логично принять бф = бф0, где бф0 — абсолютный допуск на оценочную функцию в хорошо корригированных системах. Итак, 6ф = 1шп(аф0, 6ф0). F.12) Рассмотрим теперь вопрос распределения допусков по отдель- отдельным ошибкам. Выполнить условия F.7), F.8) или F.11) можно бесконечным числом способов, например, просто положив бЭу = 0. Нам необходимо выбрать наилучший способ, т. е. наилучшим образом распределить общий допуск по отдельным ошибкам. Для этого нужно наложить какое-либо дополнительное условие на допуски б0у. Очевидно, что если какие-либо комбинации допусков на ошибки одинаковы по отношению к условиям F.7), F.8) и F.11), то они не одинаковы в смысле трудоемкости, поэтому естественно второе условие — наименьшая трудоемкость реали- реализации назначенных допусков. Для математической формулировки высказанного требования необходимо связать трудоемкость с величиной допуска. Логично предположить, что чем меньше б9у, т. е. чем жестче допуск, тем больше трудоемкость выполнения его. В пределе при б07- -> 0 трудоемкость должна стремиться к бесконечности, поскольку абсолютно точно невозможно выдержать номинальное значение никакого параметра. С другой стороны, если допуск бесконечно широкий, т. е. ббу -> оо, то трудоемкость его реализации равна нулю. Таким образом, мы приходим к следующему виду зависи- зависимости трудоемкости реализации /-го параметра с допуском 60^ от величины допуска: ч;--щг> FЛЗ) где tj — допуск, соответствующий единичной трудоемкости. При допусках 607- = tj все конструктивные параметры имеют одинаковую трудоемкость. Величины tj должны определяться исследованием истинных затрат на каком-либо типичном произ- производстве. Суммарная трудоемкость Q выполнения допусков на все пара- параметры равна сумме трудоемкостей, соответствующих отдельным параметрам, т. е. «=2>-2-4г FЛ4) /=i /==1 Полученная формула и дает нам требуемое второе условие: нужно так распределить допуски между ошибками, чтобы общая трудоемкость, выражаемая формулой F.14), была бы минимальна, и выдержать при этом первые условия F.7), F.8) или F.11). За- Заметим, что наименьшая трудоемкость соответствует знаку равен- 264
ства в условиях F.7), F.8) или F.11), поэтому без потери общ- общности можно заменить неравенство < на равенство. Итак, система условий, из которой мы теперь можем однозначно определить до- допуски на ошибки, приобретает следующий вид [например, для ус- условия F.11)]: = min. /--i F.15) Легко увидеть здесь задачу нахождения условного минимума функции Q, для решения которой мы применим знакомый метод неопределенных множителей Лагранжа. Для упрощения записи обозначим х,- = 80?; с = —5-. 1 J 4 Тогда система условий примет следующий вид: F.16) Составим лагранжеву функцию где А, — неопределенный множитель. Приравняем нулю ее производные по и X: 5] + Щ1 = 0; / — С = 0. F.17) Решая систему уравнений F.17) относительно Xj, получаем в результате формулу для оптимального распределения допусков на технологические погрешности, обеспечивающую, в среднем, заданное ухудшение оценочной функции 8ф при минимальной трудоемкости п _—. . F.18) У Методы статистических испытаний. При выводе формулы F.18) мы исходили из условия F.11), требующего, чтобы математиче- 265
ское ожидание оценочной функции оставалось бы в заданных пре- пределах. Это, однако, часто оказывается недостаточным, потому что для отдельных комбинаций ошибок в пределах назначенных до- допусков оценочная функция может значительно превысить свое математическое ожидание и, следовательно, такие оптические си- системы пойдут в брак. Кроме того, при выводе формулы F.18) мы основывались на линейной модели F.4), поэтому при больших Qj на оценочную функцию могут влиять не учтенные нами члены высшего порядка. Поэтому для ответственных оптических систем после назначения допусков по формуле F.18) полезно произвести проверку этих допусков, воспользовавшись методом статисти- статистических испытаний, т. е. методом Монте-Карло [31]. Этот метод заключается применительно к нашей задаче в математическом мо- моделировании случайного процесса изготовления и сборки оптиче- оптической системы. Пусть мы имеем возможность обратиться к некоторой стандарт- стандартной программе, генерирующей псевдослучайные числа, распреде- распределенные по нормальному закону с единичной дисперсией и нулевым математическим ожиданием. Такие программы имеются в мате- математическом обеспечении большинства ЭВМ. Выберем п таких чи- чисел (посредством /г-кратного обращения к стандартной программе) и умножим каждое /-е число на -^-6ОУ- = сге.. При этом получим п чисел 97-, моделирующих какой-то случайный набор технологиче- технологических ошибок, распределенных по нормальному закону со средне- квадратическими отклонениями сг0. =-^-ббу. Другими словами, мы получим численную модель образца оптической системы, слу- случайно взятого из большой партии. Прибавим полученные зна- значения ошибок 9; к номинальным значениям конструктивных пара- параметров и определим необходимые характеристики и оценочную функцию получившейся оптической системы с помощью расчета хода лучей и прочих действий, описанных в гл. 3, т. е. проделаем процесс, который мы называли пробой. Выберем затем следующие п случайных чисел и повторим все действия. Проделав так N раз, мы статистически промоделируем изготовление N образцов оптической системы с полученными по формуле F.18) допусками. Можно легко найти процент брака из этой партии по формуле Ь = Nb/N, где Nb — количество систем у которых оценочная функция и другие характеристики выхо- выходят за допустимые пределы. Если b близко к заданной величине Ьо, то полученное по фор- формуле F.18) распределение допусков можно считать окончатель- окончательным. Если же нет, то необходимо изменить допуски в сторону уже- ужесточения при Ъ > Ьо и расширения при Ь <^Ь0 посредством умень- уменьшения или соответственно увеличения допуска 6q>, входящего в формулу F.18).
СПИСОК ЛИТЕРАТУРЫ 1. Аоки М. Введение в методы оптимизации. М.: Наука, 1977. 343 с. 2. Бахвалов Н. С. Численные методы. М.: Наука, 1973. 632 с. 3. Бегунов Б. Н., Заказнов Н. П. Теория оптических систем. М.: Машино- Машиностроение, 1973. 488 с. 4. Борн М., Вольф Э. Основы оптики. М.: Наука, 1970. 856 с. 5. Волосов Д. С. Фотографическая оптика. М.: Искусство, 1971. 671 с. 6. Герцбергер М. Современная геометрическая оптика. М.: Изд-во иностр. лит., 1962. 487 с. 7. Грамматин А. П. Автоматический расчет оптических систем с помощью усовершенствованного метода Ньютона. — ОМП, 1967, № 2, с. 21. 8. Грамматин А. П., Деген А. Б., Рыбаков И. Р. Универсальная программа для автоматизированного расчета оптических систем на ЭВМ БЭСМ-4. — Тр. ГОИ, 1970, т. 37, вып. 167, с. 5. 9. Грамматин А. П., Деген А. Б. Методика расчета оптических систем с использованием ЭВМ. — ОМП, 1974, № 2, с. 65—66. 10. Гудмен Дж. Введение в фурье-оптику. М.: Мир, 1970. 364 с. 11. Демидович В. П., Марон И. А. Основы вычислительной математики. М.: Наука, 1966. 664 с. 12. Джерард А., Бёрч Дж. М. Введение в матричную оптику. М.: Мир, 1978. 343 с. 13. Ильин В. А., Позняк Э. П. Линейная алгебра. М.: Наука, 1978. 304 с. 14. Королев Л. Н. Структуры ЭВМ и их математическое обеспечение. М.: Наука, 1978. 356 с. 15. Крылов В. И. Приближенное вычисление интегралов. М.: Наука, 1967. 500 с. 16. Кули Дж., Льюис П., Уэлч П. Исторические замечания относительно быстрого преобразования Фурье. — ТИИЭР, 1967, т. 55, с. 18. 17. Лебедев И. В. Формулы для просчета хода косых лучей. — ОМП, 1938, № 7, с. 1. 18. Ленский А. В. О вычислении ЧКХ по методу Гопкинса. — Оптика и спектроскопия, 1967, т. 23, вып. 2, с. 346. 19. Леонова В. Б. Автоматизация расчетов оптических систем. М.: Машино- Машиностроение, 1970. 288 с. 20. Мак-Кракен Д., Дорн У. Численные методы и программирование на ФОРТРАНе. М.: Мир, 1969. 582 с. 21. Марешаль А., Франсон М. Структура оптического изображения. М.: Мир, 1964. 295 с. 22. Мирошников М. М. Теоретические основы оптико-электронных прибо- приборов. Л.: Машиностроение, 1977. 600 с. 23. Норенков И. П. Введение в автоматизированное проектирование тех- технических устройств и систем, М.: Высшая школа, 1980. 312 с. 24. Пейсахсон И. В., Тарнакин И. Н. О расчете хода лучей в произвольной оптической системе. — ОМП, 1966, № 11, с. 15. 25. Расстригин Л. А. Статистические методы поиска. М.: Наука, 1968, с. 3—192. 267
26. Родионов С. А., Пржевалинский Л. И., Шехонин А. А. О вычислении волновой аберрации при расчете лучей через оптические системы. — Изв. вузов СССР. Приборостроение, 1974, № 8, с. 103. 27. Русинов М. М. Техническая оптика. Л.: Машиностроение, 1979. 488 с. 28. Сборник научных программ на ФОРТРАНе. Руководство для програм- программистов. Вып. 2. Матричная и линейная алгебра. М.: Статистика, 1974. 223 с. 29. Слюсарев Г. Г. К вопросу о вычислении волновых аберраций. — Тр. ГОИ, 1972, т. 41, вып. 173, с. 48. 30. Слюсарев Г. Г. Методы расчета оптических систем. Л.: Машиностроение, 1969. 670 с. 31. Соболь И. М. Метод Монте-Карло. М.: Наука, 1972. 64 с. 32. Форсайт Дж., Молер К. Численное решение систем линейных алгебраиче- алгебраических уравнений. М.: Мир, 1969. 177 с. 33. Химмельблау Д. прикладное нелинейное программирование. М.: Мир, 1975. 534 с. 34. Худсон Д. Статистика для физиков. М.: Мир, 1970. 296 с. 35. Цено Н. В. Автоматический метод расчета сложных оптических си- систем. — ОМП, 1966, № 9, с. 10. 36. Чуриловский В. Н. Теория оптических приборов. М.—Л.: Машинострое- Машиностроение, 1965. 564 с. 37. Ярославский Л. П., Мерзляков Н. С. Методы цифровой голографии. М.: Наука, 1977, с. 20—60, с. 175—188. 38. Brixner В. Faster LASL lens design program. — Applied optics, 1973, N 11, p. 2703—2708. 39. Feder D. P. Optical calculations with automatic computing machinery. — Journal of the Optical Society of America, 1951, N 9, p. 630—641. 40. Feder D. P. Calculation of an optical merit function and its derivatives with respect to the system parameters. — Journal of the Optical Society of Ame- America, 1957, N 10, p. 913—925. 41. Feder D. P. Automatic optical design. — Applied Optics, 1963, N 12, p. 1209—1226. 42. Feder D. P. Differentiation of ray—tracing equations with respect to con- construction parameters of rotationally symmetric optics.—Journal of the Optical Society of America, 1968, N 11, p. 1494—1505. 43. Girard A. Calcul automatique en optique geometrique. — Reveu d'Opti- que, 1958, N 8, p. 398—241. 44. Girard A. Calcul automatique en optique geometrique, p. II, — Reveu d'Optique, N 8, p. 397—424. 45. Glatzel E., Wilson R. Adaptiv automatic correction in optical design. — Applied Optics, 1968, N 2, p. 265—276. 46. Hopkins H. H. The use of diffraction—based criteria of image quality in automatic optical design. — Optica Acta, 1966, N 4, p. 343—369. 47. Hopkins H. H. The numerical evaluation of the frequensy response of opti- optical system. — Proceedings of the Physical Society, 1957, N 444B, p. 1002—1008. 48. Hopkins H. H., Yzuel M. J. The computation of diffraction patterns in the presence of aberrations. — Optica Acta, 1970, N 3, p. 157—182. 49. KJdger M. J., Wynne C. G. Experiments with lens optimization proce- procedures. — Optica Acta, 1967, N 3, p. 279—288. 50. Kjnj> W. B. Modulation—transfer—function—based merit function for auto- automatic lens design.—Journal of the Optical Society of America, 1972, N 2, p. 230—233. 51. Macdonald J. The calculation of the optical transfer function. — Optica Acta, 1971, N 4, p. 269—290. 52. Meiron J. Damped least—squares method for automatic lens design. — Journal of the Optical Society of America, 1965, N 9, p. 1105—1116. 53. Rosen S. Eldert G. Least—squares method for optical correction. — Journal of the Optical Society of America, 1954, N 3, p. 250—252. 54. Spenser G. H. A flexible automatic lens correction procedure. — Applied Optics, 1963, N 12, p. 1257—1264. 55. Wynne С G., Wormel J. H. Lens design by computer. — Applied Optics, 1963, N 12, p. 1233—1238.
ОГЛАВЛЕНИЕ Предисловие 3 Глава 1. Общие понятия об автоматизации проектирования оптиче- оптических систем 5 § 1. Исходные принципы автоматизации проектирования оптиче- оптических систем — § 2. Основные математические модели оптических систем и опе- операции над ними 7 § 3. Сведения о технической базе и программном обеспечении авто- автоматизации проектирования в оптике 12 Глава 2. Характеристики и параметры оптических систем 18 § 4. Внешняя функциональная модель оптической системы ... — § 5. Внешние характеристики оптических систем как изображаю- изображающих приборов 22 § 6. Внутренняя функциональная модель оптической системы 31 § 7. Выражение передаточных характеристик оптических систем через зрачковую функцию 41 § 8. Представление аберраций 48 § 9. Конструктивные параметры оптических систем. Параметры оптических сред 52 § 10. Описание оптических поверхностей 55 § 11. Описание взаимного расположения поверхностей и диафрагм 62 § 12. Представление конструктивных параметров 65 Глава 3. Расчет лучей и определение внутренних характеристик опти- оптической системы 70 § 13. Расчет нулевых лучей и определение характеристик оптиче- оптической системы в гауссовой области — § 14. Расчет хода действительных лучей через оптическую поверх- поверхность 81 § 15. Расчет бесконечно узких пучков и дифференциалов лучей через поверхность 92 § 16. Расчет действительных лучей и их дифференциалов через оптическую систему 98 § 17. Определение габаритов пучков 108 § 18. Аппроксимация аберраций 124 § 19. Определение влияния изменения параметров на характери- характеристики оптической системы 132 Глава 4. Анализ структуры изображения 144 § 20. Основные соотношения — § 21. Вычисление значений аберраций в узлах 148 § 22. Методы численного интегрирования 156 269
§ 23. Определение дифракционной структуры изображения мето- методами численного интегрирования 168 § 24. Анализ структуры изображения в геометрическом прибли- приближении 178 § 25. Применение быстрого преобразования Фурье для расчета дифракционной структуры изображения 183 Глава 5. Автоматическая коррекция и оптимизация оптических систем 196 § 26. Оптимизационная модель оптической системы и задача опти- оптимизации — § 27. Общие принципы оптимизации 210 § 28. Методы нулевого и первого порядков 219 § 29. Ньютоновские методы 223 § 30. Усовершенствованные ньютоновские методы 230 § 31. Определение длины шага вдоль траектории спуска 238 § 32. Оптимизация с ограничениями 241 § 33. Методы синтеза оптических систем 247 Глава 6. Расчет допусков на параметры оптических систем 259 § 34. Статистическое описание ошибок изготовления и сборки оптических систем — § 35. Распределение допусков по различным ошибкам 261 Список литературы 267
ИБ № 2178 Сергей Аронович РОДИОНОВ АВТОМАТИЗАЦИЯ ПРОЕКТИРОВАНИЯ ОПТИЧЕСКИХ СИСТЕМ Учебное пособие для вузов Редактор издательства М. Г. Оболдуева Технический редактор Т. П. Малашкина Переплет художника Н. И. Абрамова Корректор Т.Н. Гринчук Сдано в набор 12.01.82. Подписано в печать 30.07.82. М-41687. Формат 60X90Vie- Бумага типографская № 1. Гарнитура литературная. Печать высокая. Усл. печ. л. 17,0. Уч.-изд. л. 17,35. Тираж 3500 экз. Заказ 15. Цена 85 к. Ленинградское отделение ордена Трудового Красного 3 издательства «Машиностроение» 191065, Ленинград, ул. Дзержинского, 10 Ленинградская типография № 6 ордена Трудового Крас Ленинградского объединения «Техническая книга» им. Евге: Союзполиграфпрома при Государственном комитете по делам издательств, полиграфии и книжной торго: 193144, г. Ленинград, ул. Моисеенко, 10.